🤸 🕺🏾 👻 ¿Pueden los investigadores de inteligencia artificial confiarle una prueba de su trabajo? 🖐🏾 ☝️ ✴️

Un investigador de aprendizaje automático del Instituto de Tecnología de Virginia ha propuesto una forma de revisar artículos científicos utilizando IA, evaluando la aparición de texto y gráficos en un documento. ¿Serán suficientes sus métodos para evaluar la "integridad" del trabajo científico para acelerar el proceso de revisión por pares independientes?

En el campo del aprendizaje automático, hay una avalancha de investigación. El ingeniero de Google Cliff Young comparó esta situación con la ley de Moore , adaptada para publicaciones sobre el tema de IA: la cantidad de artículos académicos sobre este tema que aparecen en el sitio web de arXiv se duplica cada 18 meses.

Y esta situación crea problemas al revisar trabajos: los investigadores experimentados en el campo de la IA simplemente no son suficientes para leer cuidadosamente cada nuevo trabajo. ¿Pueden los científicos confiar a AI que acepte o rechace trabajos?

Esta interesante pregunta es planteada por un informe publicado recientemente en el sitio web arXiv; autor del trabajo, el investigador de aprendizaje automático Jia-Bin Huang lo llamó "Deep Work Gestalt".

Juan utilizó una red neuronal convolucional, una herramienta común de aprendizaje automático utilizada para el reconocimiento de imágenes, para examinar 5.000 obras publicadas desde 2013. Juan escribe que según una sola aparición del trabajo, una mezcla de texto e imágenes, su red neuronal puede distinguir el "buen" trabajo digno de inclusión en archivos científicos con una precisión del 92%.

Para los investigadores, esto significa que en la apariencia de su documento, un par de cosas juegan el papel más importante: imágenes brillantes en la portada del trabajo de investigación y llenar todas las páginas con texto, de modo que no haya un espacio vacío al final de la última página.

La red neuronal convolucional de Juan digiere miles de artículos científicos aprobados y no aprobados, creando un "mapa de calor" de fortalezas y debilidades. Los mayores errores de los trabajos que no pasaron la selección: la falta de imágenes en color y un espacio vacío al final de la última página.

Juan basa su trabajo en otro trabajo de 2010, escrito por Carven von Bearnensquash de la Universidad de Phoenix. El trabajo no utilizó el entrenamiento en profundidad, la tecnología tradicional de la visión por computadora, para encontrar una manera de "evaluar de un vistazo la apariencia general" del trabajo y concluir si vale la pena aprobar el trabajo.

Usando esta idea, Juan alimentó la computadora con 5618 trabajos, aceptada en dos conferencias importantes sobre visión por computadora, CVPR e ICCV en los últimos cinco años. Juan también recolectó trabajos presentados en talleres de conferencias, que desempeñaron el papel de trabajos rechazados, ya que no hay acceso a trabajos rechazados en conferencias.

Juan entrenó a la red para asociar el trabajo pasado y no el pasado con el resultado binario de "bueno" y "malo", para aislar los signos de "integridad" o gestalt de ellos. La Gestalt es un todo que excede el tamaño de la suma de sus partes. Esto es lo que el pionero del aprendizaje automático, Terry Seinowski, llamó "percepción organizada universal", algo más significativo que las colinas y barrancos del área muy cerca de usted.

La red entrenada se probó en un subconjunto de los trabajos que no había visto antes. La capacitación equilibró los falsos positivos (trabajo aceptado que valió la pena rechazar) con falsas negativas, trabajo rechazado que valió la pena aceptar.

Al limitar el número de trabajos "buenos", pero rechazados, 0.4%, es decir, solo 4 trabajos, la red pudo rechazar correctamente la mitad de los trabajos "malos", que debían ser rechazados.

El autor incluso pensó en alimentar su propio trabajo de su propia red neuronal. Como resultado, la red neuronal lo rechazó: “Aplicamos un clasificador entrenado a este trabajo. Nuestra red predijo sin piedad que con una probabilidad del 97% este trabajo debería ser rechazado sin una revisión independiente ".

Con respecto a estos requisitos cosméticos, bellas imágenes en el artículo, Juan no solo describe los resultados del trabajo. También ofrece código que le permite crear un trabajo atractivo. Alimenta el "buen" trabajo en la base de datos de capacitación de la red generativa-adversaria, que puede crear un nuevo plan al aprender de los ejemplos.

Juan también ofrece un tercer componente, "rehacer" el trabajo rechazado en uno aceptable, "aconsejar automáticamente sobre lo que debe cambiarse en el trabajo entrante", por ejemplo, "agregar una imagen para llamar la atención y una imagen en la última página".

Juan sugiere que dicho proceso de aprobación podría ser un "prefiltro" para aliviar la carga de los revisores, ya que puede ver miles de entradas en pocos segundos. Y, sin embargo, "es poco probable que dicho clasificador se use en una conferencia real", concluye el autor.

Una de las limitaciones del trabajo que puede afectar su uso es que incluso si la apariencia del trabajo, su gestalt visual, coincide con los resultados históricos, esto no garantiza la existencia de un valor real en el trabajo.

Según Juan, "ignorando el contenido del trabajo, podemos rechazar injustamente el trabajo con buen material y diseño visual deficiente, o aceptar un trabajo inútil que se ve bien".

¿Pueden los investigadores de inteligencia artificial confiarle una prueba de su trabajo?

More articles: