Cómo la inteligencia artificial está cambiando la ciencia

Los últimos algoritmos de inteligencia artificial comprenden la evolución de las galaxias, calculan las funciones de las ondas cuánticas, descubren nuevos compuestos químicos, etc. ¿Hay algo en el trabajo de los científicos que no pueda ser automatizado?




Ninguna persona o incluso un grupo de personas puede mantenerse al día con la información en cascada producida por una gran cantidad de experimentos en física y astronomía. Algunos de ellos dejan terabytes de datos diariamente, y este flujo solo está aumentando. El conjunto de antenas de matriz de kilómetros cuadrados, un radiotelescopio que planean encender a mediados de la década de 2020, producirá anualmente un volumen de datos comparable a toda Internet.

Esta avalancha de datos ha llevado a muchos científicos a recurrir a la inteligencia artificial (IA) en busca de ayuda. Con una participación humana mínima, los sistemas de inteligencia artificial como las redes neuronales, redes de neuronas simuladas por computadora que imitan la función cerebral, pueden atravesar montañas de datos, encontrar anomalías y reconocer secuencias que las personas nunca habrían notado.

Por supuesto, la ayuda de las computadoras en la investigación científica se ha utilizado durante aproximadamente 75 años, y el método de ordenar manualmente los datos en busca de secuencias significativas se inventó hace miles de años. Pero algunos académicos sostienen que la última tecnología en aprendizaje automático y IA representa una forma fundamentalmente nueva de hacer ciencia. Uno de estos enfoques, el modelado generativo (GM), puede ayudar a determinar la teoría más probable entre las explicaciones competitivas de los datos observados, basada solo en estos datos y sin ningún conocimiento preprogramado de qué procesos físicos pueden ocurrir en el sistema en estudio. . Los defensores de GM lo consideran lo suficientemente innovador como para ser visto como una "tercera vía" potencial para estudiar el universo.

Por lo general, adquirimos conocimiento de la naturaleza a través de la observación. Cómo Johannes Kepler estudió las tablas de la posición de los planetas de Tycho Brahe, tratando de encontrar el patrón subyacente (eventualmente se dio cuenta de que los planetas se mueven en órbitas elípticas). La ciencia también ha avanzado a través de simulaciones. Un astrónomo puede simular el movimiento de la Vía Láctea y la galaxia vecina, Andrómeda, y predecir que colisionarán en unos pocos miles de millones de años. Las observaciones y simulaciones ayudan a los científicos a crear hipótesis que pueden verificarse mediante futuras observaciones. GM es diferente de estos dos enfoques.

"Esencialmente, este es el tercer enfoque, entre la observación y la simulación", dijo Kevin Shavinsky , astrofísico y uno de los partidarios más pro-GM, que hasta hace poco trabajó en el Instituto Federal Suizo de Tecnología. "Esta es una forma diferente de atacar la tarea".

Algunos científicos consideran que GM y otras tecnologías son simplemente herramientas poderosas para practicar la ciencia tradicional. Pero la mayoría está de acuerdo en que la IA afectará significativamente este proceso, y su papel en la ciencia solo crecerá. Brian Nord , astrofísico del Laboratorio Nacional de Aceleradores de Fermi que utiliza redes neuronales artificiales para estudiar el espacio, es uno de los que temen que ninguna de las actividades del científico humano escape a la automatización. "El pensamiento es bastante aterrador", dijo.

Descubrimiento de la generación


Incluso en el instituto, Shavinsky comenzó a construir una reputación en la ciencia basada en datos. Mientras trabajaba en su doctorado, se encontró con la tarea de clasificar miles de galaxias en función de su apariencia. No había programas listos para esta tarea, por lo que decidió organizar el crowdsourcing para este propósito: así nació el proyecto del Zoológico Galáctico . Desde 2007, los usuarios comunes han podido ayudar a los astrónomos a hacer suposiciones sobre qué galaxia pertenece a qué categoría, y generalmente la mayoría de las voces clasificaron correctamente la galaxia. Sin embargo, el proyecto fue exitoso, como lo señala Shavinsky, la IA lo hizo inútil: "Hoy, un científico talentoso con experiencia en la región de Moscú y acceso a la computación en la nube puede hacer un proyecto de este tipo en medio día".

Shavinsky recurrió a la nueva y poderosa herramienta de GM en 2016. De hecho, el GM hace la pregunta: ¿qué tan probable es que bajo la condición X obtengamos el resultado Y? Este enfoque ha demostrado ser increíblemente efectivo y universal. Por ejemplo, supongamos que alimentaste a GM con un conjunto de imágenes de rostros humanos, y para cada persona se fija su edad. El programa peina estos datos de entrenamiento y comienza a encontrar una conexión entre los rostros viejos y la mayor probabilidad de arrugas en ellos. Como resultado, puede indicar la edad de cualquier persona, es decir, para predecir qué cambios físicos sufrirá una persona de cualquier edad.


Ninguno de estos individuos es real. La fila superior (A) y la columna izquierda (B) son creadas por una red generativa-adversaria (GSS) utilizando bloques de construcción derivados de elementos de personas reales. Luego, el GSS combinó las principales características faciales de la serie A, incluido el género, el crecimiento y la forma de la cara, con características faciales más pequeñas de la columna B, por ejemplo, el color del cabello y los ojos, y creó caras en el resto de la tabla.

De los sistemas GM, las redes de confrontación generativas (GSS) son las más conocidas. Después de procesar los datos de entrenamiento adecuados, el GSS puede restaurar imágenes con píxeles faltantes o dañados o dejar claras las fotos borrosas. Los GSS están capacitados para extraer la información que falta sobre la base de la competencia (de ahí la "confrontación"): una parte de la red, el generador, genera datos falsos, y el segundo, el discriminador, trata de distinguir los datos falsos de los reales. Mientras se ejecuta el programa, ambas partes funcionan gradualmente mejor. Es posible que haya visto algunas "caras" súper realistas creadas por el GSS: imágenes de "personas increíblemente realistas que no existen en la realidad", como escribieron en uno de los titulares.

En un caso más general, un GM toma un conjunto de datos (generalmente imágenes, pero no es necesario) y los divide en subconjuntos de los bloques de construcción abstractos básicos: los científicos los llaman el "espacio oculto" de los datos. El algoritmo manipula elementos del espacio oculto para ver cómo afectará esto a los datos iniciales, lo que ayuda a revelar los procesos físicos que aseguran la operación del sistema.

La idea del espacio oculto es abstracta y difícil de imaginar, pero como una analogía cruda, piense en lo que puede hacer su cerebro cuando intenta determinar el género de una persona por la cara. Quizás notes un peinado, una forma de nariz, etc., así como patrones que no son fáciles de describir con palabras. Un programa de computadora también busca signos ocultos en los datos: aunque no tiene idea de qué es un bigote o género, si fue entrenado en un conjunto de datos en el que algunas imágenes están etiquetadas como "hombre" o "mujer", y algunas tienen la etiqueta "bigote" ", Ella entenderá rápidamente la relación.


Kevin Shavinsky, astrofísico, jefe de la empresa de inteligencia artificial Modulos

En un artículo publicado en diciembre en la revista Astronomy & Astrophysics, Shavinsky y sus colegas, Denis Tharp y Che Zhen, usaron GM para estudiar los cambios físicos en las galaxias durante la evolución (el software que usan calcula el espacio oculto de manera un poco diferente del GSS, por lo que es técnicamente imposible llame a GSS, aunque está bastante cerca en propiedades). Su modelo creó conjuntos de datos artificiales para probar hipótesis sobre procesos físicos. Por ejemplo, preguntaron cómo la "atenuación" de la formación de estrellas, una fuerte disminución en la velocidad de su formación, se asocia con un aumento en la densidad de la galaxia.

Para Shavinsky, la pregunta clave es cuánta información sobre los procesos estelares y galácticos se puede extraer sobre la base de un solo dato. "Excluir todo lo que sabemos sobre astrofísica", dijo. "¿En qué medida podemos redescubrir este conocimiento utilizando solo datos?"

Primero, las imágenes de galaxias se redujeron al espacio oculto; entonces Shavinsky podría corregir un elemento de este espacio para que corresponda a un cierto cambio en el entorno de la galaxia, por ejemplo, la densidad de su entorno. Luego podría regenerar la galaxia y ver qué diferencias aparecerían esta vez. "Y ahora tengo una máquina para generar hipótesis", explicó. "Puedo tomar un montón de galaxias que originalmente estaban rodeadas de baja densidad y hacer que parezca que su densidad es alta". Shavinsky, Tarp y Zhen descubrieron que al pasar de una densidad del medio ambiente más baja a una más alta se vuelven más rojas y sus estrellas se concentran más densamente. Esto es consistente con las observaciones existentes de galaxias, dijo Shavinsky. La única pregunta es por qué.

El siguiente paso, dice Shavinsky, aún no se ha automatizado. "Yo, hombre, necesito intervenir y decir: Bueno, ¿qué tipo de física puede explicar este efecto?" Hay dos posibles explicaciones para este proceso: es posible que las galaxias se vuelvan más rojas en entornos más densos porque contienen más polvo o porque hay una disminución en la formación de estrellas (en otras palabras, sus estrellas suelen ser más viejas). Usando el modelo generativo, podemos probar ambas ideas. Cambiamos los elementos del espacio oculto asociados con el polvo y la velocidad de la formación de estrellas, y vemos cómo esto afecta el color de las galaxias. "Y la respuesta es clara", dijo Shavinsky. Las galaxias más rojas son aquellas "donde la velocidad de formación de estrellas ha disminuido, y no aquellas donde hay más polvo. Por lo tanto, estamos inclinados a favor de la primera explicación ".


La fila superior son galaxias reales en regiones de baja densidad.
Segunda fila: reconstrucción basada en espacio oculto.
Luego vienen las transformaciones hechas por la red, y debajo están las galaxias generadas en regiones de alta densidad.

El enfoque está asociado con las simulaciones tradicionales, pero tiene diferencias cardinales. La simulación, de hecho, "se basa en suposiciones", dijo Shavinsky. "Este es lo mismo que decir:" Creo que entendí qué fundamentos físicos subyacen a todo lo que observo en el sistema ". Tengo una receta para formar estrellas, para el comportamiento de la materia oscura, etc. Coloco todas mis hipótesis y comienzo la simulación. Y luego pregunto: ¿Se parece a la realidad? Y con el modelado generativo, esto, dijo, parece "en cierto sentido, exactamente lo opuesto a la simulación". No sabemos nada, no queremos asumir nada. Queremos que los datos nos digan qué puede suceder ".

El aparente éxito del modelado generativo en dicho estudio, obviamente, no significa que los astrónomos y estudiantes de posgrado se hayan vuelto innecesarios, pero parece demostrar un cambio en el grado en que la IA puede aprender algo sobre los objetos y procesos astrofísicos, teniendo casi solo una gran cantidad de datos. "Esta no es una ciencia totalmente automatizada, pero demuestra que somos capaces de crear herramientas que automatizan el progreso científico al menos parcialmente", dijo Shavinsky.

El modelado generativo es obviamente capaz de mucho, pero si realmente representa un nuevo enfoque de la ciencia, este es un punto discutible. Para David Hogg , cosmólogo de la Universidad de Nueva York y el Instituto Flatiron, esta tecnología, aunque impresionante, es de hecho una forma muy compleja de extraer secuencias de datos, y los astrónomos lo han estado haciendo durante siglos. En otras palabras, es un método avanzado de observación y análisis. El trabajo de Hogg, como Shavinsky, depende en gran medida de la IA; Él usa redes neuronales para clasificar estrellas por espectro y sacar conclusiones sobre otras propiedades físicas de las estrellas usando modelos basados ​​en datos. Pero él considera que su trabajo, y el trabajo de Shavinsky, es un método científico antiguo, amable y probado. "No creo que esta sea la tercera vía", dijo recientemente. “Solo creo que nosotros, como comunidad, estamos utilizando cada vez más nuestros datos. En particular, somos mucho mejores para comparar datos. Pero desde mi punto de vista, mi trabajo encaja perfectamente en el marco del régimen de observación ".

Asistentes celosos


Si la IA y las redes neuronales son herramientas conceptualmente nuevas o no, es obvio que comenzaron a desempeñar un papel fundamental en la astronomía moderna y la investigación física. En el Instituto de Investigación Teórica de Heidelberg, el físico Kai Polsterer dirige un grupo de astroinformática, un equipo de investigadores que trabaja con nuevos métodos en astrofísica basados ​​en el procesamiento de datos. Recientemente utilizaron un algoritmo con MO para extraer información de desplazamiento al rojo de los conjuntos de datos de galaxias, una tarea que solía ser debilitante.

Polsterer considera a estos nuevos sistemas basados ​​en IA como "asistentes entusiastas", capaces de peinar datos durante horas sin aburrirse y quejarse de las condiciones de trabajo. Estos sistemas pueden hacer todo el trabajo monótono y duro, dijo, dejándonos con una "ciencia genial e interesante".

Pero no son perfectos. En particular, advierte Polsterer, los algoritmos solo pueden hacer lo que han sido entrenados. El sistema es indiferente a la entrada. Dale una galaxia y ella podrá apreciar su desplazamiento al rojo y su edad. Pero dale una selfie o una foto de pescado podrido, ella apreciará su edad (naturalmente, mal). Al final, dijo, la supervisión de la gente sigue siendo necesaria. “Todo se cierra para nosotros, los investigadores. Somos responsables de la interpretación ".

Por su parte, Nord, de Fermilab, advierte que es importante que las redes neuronales produzcan no solo resultados, sino también errores de trabajo, como cualquier estudiante está acostumbrado. Es tan aceptado en la ciencia que si toma una medida pero no da un error, nadie tomará sus resultados en serio.

Al igual que muchos investigadores de IA, a Nord también le preocupa que los resultados de las redes neuronales sean difíciles de entender; la red neuronal da una respuesta sin proporcionar una forma clara de obtenerla.

Sin embargo, no todos creen que la falta de transparencia sea un problema. Lenka Zdeborova, investigadora del Instituto de Física Teórica en Francia, señala que la intuición humana también es a veces imposible de entender. Miras la foto y descubres que el gato está representado en ella, "pero no sabes cómo lo sabes", dice. "Tu cerebro, en cierto modo, también es una caja negra".

No solo los astrofísicos y cosmólogos migran al lado de la ciencia usando inteligencia artificial y procesamiento de datos. El especialista en física cuántica Roger Melko, del Instituto de Física Teórica del Perímetro y la Universidad de Waterloo, utilizó una red neuronal para resolver algunos de los problemas más complejos e importantes en esta área, por ejemplo, representando una función de onda que describe un sistema de muchas partículas. La IA es necesaria debido a lo que Melko llama la "maldición exponencial de la dimensión". Es decir, el número de formas posibles de la función de onda aumenta exponencialmente con un aumento en el número de partículas en el sistema descrito. La dificultad es similar a tratar de elegir el mejor movimiento en un juego como el ajedrez o ir: estás tratando de calcular el siguiente movimiento, imaginando cómo irá tu oponente y eligiendo la mejor respuesta, pero con cada movimiento aumenta el número de oportunidades.

Por supuesto, AI dominó ambos juegos, aprendió a jugar al ajedrez hace unas décadas y venció al mejor jugador de go en 2016, esto fue hecho por el sistema AlphaGo. Ella dice finamente que también están bien adaptados a los problemas de la física cuántica.

Mente mecánica


Si Shavinsky tiene razón al declarar que ha encontrado una "tercera forma" de involucrarse en la ciencia o, como dice Hogg, estas son solo observaciones tradicionales y análisis de datos "con esteroides", está claro que la IA cambia la esencia de un descubrimiento científico y claramente lo acelera. ¿Hasta dónde llegará la revolución de la IA en la ciencia?

Periódicamente se hacen declaraciones fuertes sobre los logros de los "robocientíficos". Hace diez años, el químico robot Adam examinó el genoma de la levadura y determinó qué genes son responsables de la producción de ciertos aminoácidos. Lo hizo observando cepas de levadura que carecían de ciertos genes y comparando los resultados de su comportamiento entre sí. La revista Wired escribió: "El robot realizó un descubrimiento científico por sí solo ".

Un poco más tarde, Lee Cronin, químico de la Universidad de Glazko, usó un robot para mezclar productos químicos al azar y descubrir si aparecerían nuevos compuestos. Al rastrear las reacciones en tiempo real utilizando un espectrómetro de masas, una máquina de resonancia magnética nuclear y un espectrómetro infrarrojo, el sistema finalmente aprendió a predecir las combinaciones más reactivas. Aunque esto no condujo a descubrimientos, dijo Cronin, un sistema robótico podría permitir a los químicos acelerar su investigación en un 90%.

El año pasado, otro equipo de científicos de Zurich utilizó redes neuronales para derivar leyes físicas basadas en conjuntos de datos. Su sistema, una especie de Kepler robótico, redescubrió el modelo heliocéntrico del sistema solar, basado en registros de la ubicación del Sol y Marte en el cielo visible desde la Tierra, y también dedujo la ley de conservación del momento a partir de observaciones de colisiones de bolas. Dado que las leyes físicas a menudo se pueden expresar de varias maneras, los investigadores están interesados ​​en saber si este sistema puede ofrecer formas nuevas y posiblemente más simples de trabajar con leyes conocidas.

Todos estos son ejemplos de cómo la IA acelera los descubrimientos científicos, aunque en cada caso se puede argumentar cuán revolucionario fue el nuevo enfoque.Quizás lo más controvertido será la cuestión de cuánta información se puede obtener solo de los datos, un tema importante en la era de las vastas montañas de datos en constante crecimiento. En The Book of Why, 2018, el especialista en informática Jadi Pearl y la popular escritora científica Dana Mackenzie sugieren que los datos son algo "increíblemente tonto". Las preguntas sobre la causalidad "nunca pueden responderse basándose únicamente en datos", escriben. "Cada vez que ve un trabajo o estudio que analiza datos sin tener en cuenta los modelos, puede estar seguro de que el resultado de este trabajo se resume y posiblemente se transforma, pero no interpreta los datos". Shavinsky simpatiza con la posición de Pearl, pero describe la idea de trabajar solo con datos como algo así como un "hombrecillo de guiones". Dijo que nunca había declarado la posibilidad de derivar causas y efectos de los datos."Acabo de decir que podemos hacer mucho más con los datos de lo que suele ser el caso".

Otro argumento común es que se necesita creatividad para la ciencia, y al menos por ahora, no tenemos idea de cómo programarla. Una simple enumeración de todas las posibilidades, como lo hizo el químico robot Cronin, no parece particularmente creativa. "Creo que para llegar a una teoría, construcciones lógicas, se requiere creatividad", dijo Polsterer. "Cada vez que necesitas creatividad, necesitas una persona". ¿Y de dónde viene la creatividad? Polsterer sospecha que está relacionado con el aburrimiento, el hecho de que, según él, el auto no fue sometido a prueba. “Para ser creativo, uno no debe amar el aburrimiento. Y no creo que la computadora se aburra nunca ". Por otro lado, palabras como "creatividad" e "inspiración" se utilizan a menudo para describir programas como Deep Blue y AlphaGo. Y los intentos inútiles de describirLo que sucede dentro de la mente de la máquina es muy similar a las dificultades que encontramos al estudiar nuestros propios procesos de pensamiento.

Shavinsky recientemente dejó la academia a favor del sector comercial; Ahora dirige la startup Modulos, donde trabajan muchos científicos del Instituto Técnico Suizo y, según su sitio web, "trabaja en el ojo de una tormenta de desarrollos en el campo de la IA y el aprendizaje automático". Cualesquiera que sean los obstáculos entre la inteligencia artificial moderna y la inteligencia artificial completa, él y otros expertos creen que las máquinas están destinadas a hacer más y más trabajo de los científicos. ¿Hay límites para esto? Solo tenemos que averiguarlo.

“¿Será posible en el futuro previsible crear una máquina capaz de hacer descubrimientos en física o matemática que las personas más inteligentes que usan equipos biológicos no sean capaces de hacer? - piensa Shavinsky. - ¿Se desarrollará la ciencia del futuro gracias a las máquinas que funcionan a un nivel inaccesible para nosotros? No lo se Esa es una buena pregunta.

Source: https://habr.com/ru/post/445806/


All Articles