Cómo la inteligencia artificial está cambiando la ciencia

Los √ļltimos algoritmos de inteligencia artificial comprenden la evoluci√≥n de las galaxias, calculan las funciones de las ondas cu√°nticas, descubren nuevos compuestos qu√≠micos, etc. ¬ŅHay algo en el trabajo de los cient√≠ficos que no pueda ser automatizado?




Ninguna persona o incluso un grupo de personas puede mantenerse al día con la información en cascada producida por una gran cantidad de experimentos en física y astronomía. Algunos de ellos dejan terabytes de datos diariamente, y este flujo solo está aumentando. El conjunto de antenas de matriz de kilómetros cuadrados, un radiotelescopio que planean encender a mediados de la década de 2020, producirá anualmente un volumen de datos comparable a toda Internet.

Esta avalancha de datos ha llevado a muchos cient√≠ficos a recurrir a la inteligencia artificial (IA) en busca de ayuda. Con una participaci√≥n humana m√≠nima, los sistemas de inteligencia artificial como las redes neuronales, redes de neuronas simuladas por computadora que imitan la funci√≥n cerebral, pueden atravesar monta√Īas de datos, encontrar anomal√≠as y reconocer secuencias que las personas nunca habr√≠an notado.

Por supuesto, la ayuda de las computadoras en la investigaci√≥n cient√≠fica se ha utilizado durante aproximadamente 75 a√Īos, y el m√©todo de ordenar manualmente los datos en busca de secuencias significativas se invent√≥ hace miles de a√Īos. Pero algunos acad√©micos sostienen que la √ļltima tecnolog√≠a en aprendizaje autom√°tico y IA representa una forma fundamentalmente nueva de hacer ciencia. Uno de estos enfoques, el modelado generativo (GM), puede ayudar a determinar la teor√≠a m√°s probable entre las explicaciones competitivas de los datos observados, basada solo en estos datos y sin ning√ļn conocimiento preprogramado de qu√© procesos f√≠sicos pueden ocurrir en el sistema en estudio. . Los defensores de GM lo consideran lo suficientemente innovador como para ser visto como una "tercera v√≠a" potencial para estudiar el universo.

Por lo general, adquirimos conocimiento de la naturaleza a trav√©s de la observaci√≥n. C√≥mo Johannes Kepler estudi√≥ las tablas de la posici√≥n de los planetas de Tycho Brahe, tratando de encontrar el patr√≥n subyacente (eventualmente se dio cuenta de que los planetas se mueven en √≥rbitas el√≠pticas). La ciencia tambi√©n ha avanzado a trav√©s de simulaciones. Un astr√≥nomo puede simular el movimiento de la V√≠a L√°ctea y la galaxia vecina, Andr√≥meda, y predecir que colisionar√°n en unos pocos miles de millones de a√Īos. Las observaciones y simulaciones ayudan a los cient√≠ficos a crear hip√≥tesis que pueden verificarse mediante futuras observaciones. GM es diferente de estos dos enfoques.

"Esencialmente, este es el tercer enfoque, entre la observación y la simulación", dijo Kevin Shavinsky , astrofísico y uno de los partidarios más pro-GM, que hasta hace poco trabajó en el Instituto Federal Suizo de Tecnología. "Esta es una forma diferente de atacar la tarea".

Algunos científicos consideran que GM y otras tecnologías son simplemente herramientas poderosas para practicar la ciencia tradicional. Pero la mayoría está de acuerdo en que la IA afectará significativamente este proceso, y su papel en la ciencia solo crecerá. Brian Nord , astrofísico del Laboratorio Nacional de Aceleradores de Fermi que utiliza redes neuronales artificiales para estudiar el espacio, es uno de los que temen que ninguna de las actividades del científico humano escape a la automatización. "El pensamiento es bastante aterrador", dijo.

Descubrimiento de la generación


Incluso en el instituto, Shavinsky comenz√≥ a construir una reputaci√≥n en la ciencia basada en datos. Mientras trabajaba en su doctorado, se encontr√≥ con la tarea de clasificar miles de galaxias en funci√≥n de su apariencia. No hab√≠a programas listos para esta tarea, por lo que decidi√≥ organizar el crowdsourcing para este prop√≥sito: as√≠ naci√≥ el proyecto del Zool√≥gico Gal√°ctico . Desde 2007, los usuarios comunes han podido ayudar a los astr√≥nomos a hacer suposiciones sobre qu√© galaxia pertenece a qu√© categor√≠a, y generalmente la mayor√≠a de las voces clasificaron correctamente la galaxia. Sin embargo, el proyecto fue exitoso, como lo se√Īala Shavinsky, la IA lo hizo in√ļtil: "Hoy, un cient√≠fico talentoso con experiencia en la regi√≥n de Mosc√ļ y acceso a la computaci√≥n en la nube puede hacer un proyecto de este tipo en medio d√≠a".

Shavinsky recurri√≥ a la nueva y poderosa herramienta de GM en 2016. De hecho, el GM hace la pregunta: ¬Ņqu√© tan probable es que bajo la condici√≥n X obtengamos el resultado Y? Este enfoque ha demostrado ser incre√≠blemente efectivo y universal. Por ejemplo, supongamos que alimentaste a GM con un conjunto de im√°genes de rostros humanos, y para cada persona se fija su edad. El programa peina estos datos de entrenamiento y comienza a encontrar una conexi√≥n entre los rostros viejos y la mayor probabilidad de arrugas en ellos. Como resultado, puede indicar la edad de cualquier persona, es decir, para predecir qu√© cambios f√≠sicos sufrir√° una persona de cualquier edad.


Ninguno de estos individuos es real. La fila superior (A) y la columna izquierda (B) son creadas por una red generativa-adversaria (GSS) utilizando bloques de construcci√≥n derivados de elementos de personas reales. Luego, el GSS combin√≥ las principales caracter√≠sticas faciales de la serie A, incluido el g√©nero, el crecimiento y la forma de la cara, con caracter√≠sticas faciales m√°s peque√Īas de la columna B, por ejemplo, el color del cabello y los ojos, y cre√≥ caras en el resto de la tabla.

De los sistemas GM, las redes de confrontaci√≥n generativas (GSS) son las m√°s conocidas. Despu√©s de procesar los datos de entrenamiento adecuados, el GSS puede restaurar im√°genes con p√≠xeles faltantes o da√Īados o dejar claras las fotos borrosas. Los GSS est√°n capacitados para extraer la informaci√≥n que falta sobre la base de la competencia (de ah√≠ la "confrontaci√≥n"): una parte de la red, el generador, genera datos falsos, y el segundo, el discriminador, trata de distinguir los datos falsos de los reales. Mientras se ejecuta el programa, ambas partes funcionan gradualmente mejor. Es posible que haya visto algunas "caras" s√ļper realistas creadas por el GSS: im√°genes de "personas incre√≠blemente realistas que no existen en la realidad", como escribieron en uno de los titulares.

En un caso más general, un GM toma un conjunto de datos (generalmente imágenes, pero no es necesario) y los divide en subconjuntos de los bloques de construcción abstractos básicos: los científicos los llaman el "espacio oculto" de los datos. El algoritmo manipula elementos del espacio oculto para ver cómo afectará esto a los datos iniciales, lo que ayuda a revelar los procesos físicos que aseguran la operación del sistema.

La idea del espacio oculto es abstracta y difícil de imaginar, pero como una analogía cruda, piense en lo que puede hacer su cerebro cuando intenta determinar el género de una persona por la cara. Quizás notes un peinado, una forma de nariz, etc., así como patrones que no son fáciles de describir con palabras. Un programa de computadora también busca signos ocultos en los datos: aunque no tiene idea de qué es un bigote o género, si fue entrenado en un conjunto de datos en el que algunas imágenes están etiquetadas como "hombre" o "mujer", y algunas tienen la etiqueta "bigote" ", Ella entenderá rápidamente la relación.


Kevin Shavinsky, astrofísico, jefe de la empresa de inteligencia artificial Modulos

En un artículo publicado en diciembre en la revista Astronomy & Astrophysics, Shavinsky y sus colegas, Denis Tharp y Che Zhen, usaron GM para estudiar los cambios físicos en las galaxias durante la evolución (el software que usan calcula el espacio oculto de manera un poco diferente del GSS, por lo que es técnicamente imposible llame a GSS, aunque está bastante cerca en propiedades). Su modelo creó conjuntos de datos artificiales para probar hipótesis sobre procesos físicos. Por ejemplo, preguntaron cómo la "atenuación" de la formación de estrellas, una fuerte disminución en la velocidad de su formación, se asocia con un aumento en la densidad de la galaxia.

Para Shavinsky, la pregunta clave es cu√°nta informaci√≥n sobre los procesos estelares y gal√°cticos se puede extraer sobre la base de un solo dato. "Excluir todo lo que sabemos sobre astrof√≠sica", dijo. "¬ŅEn qu√© medida podemos redescubrir este conocimiento utilizando solo datos?"

Primero, las im√°genes de galaxias se redujeron al espacio oculto; entonces Shavinsky podr√≠a corregir un elemento de este espacio para que corresponda a un cierto cambio en el entorno de la galaxia, por ejemplo, la densidad de su entorno. Luego podr√≠a regenerar la galaxia y ver qu√© diferencias aparecer√≠an esta vez. "Y ahora tengo una m√°quina para generar hip√≥tesis", explic√≥. "Puedo tomar un mont√≥n de galaxias que originalmente estaban rodeadas de baja densidad y hacer que parezca que su densidad es alta". Shavinsky, Tarp y Zhen descubrieron que al pasar de una densidad del medio ambiente m√°s baja a una m√°s alta se vuelven m√°s rojas y sus estrellas se concentran m√°s densamente. Esto es consistente con las observaciones existentes de galaxias, dijo Shavinsky. La √ļnica pregunta es por qu√©.

El siguiente paso, dice Shavinsky, a√ļn no se ha automatizado. "Yo, hombre, necesito intervenir y decir: Bueno, ¬Ņqu√© tipo de f√≠sica puede explicar este efecto?" Hay dos posibles explicaciones para este proceso: es posible que las galaxias se vuelvan m√°s rojas en entornos m√°s densos porque contienen m√°s polvo o porque hay una disminuci√≥n en la formaci√≥n de estrellas (en otras palabras, sus estrellas suelen ser m√°s viejas). Usando el modelo generativo, podemos probar ambas ideas. Cambiamos los elementos del espacio oculto asociados con el polvo y la velocidad de la formaci√≥n de estrellas, y vemos c√≥mo esto afecta el color de las galaxias. "Y la respuesta es clara", dijo Shavinsky. Las galaxias m√°s rojas son aquellas "donde la velocidad de formaci√≥n de estrellas ha disminuido, y no aquellas donde hay m√°s polvo. Por lo tanto, estamos inclinados a favor de la primera explicaci√≥n ".


La fila superior son galaxias reales en regiones de baja densidad.
Segunda fila: reconstrucción basada en espacio oculto.
Luego vienen las transformaciones hechas por la red, y debajo est√°n las galaxias generadas en regiones de alta densidad.

El enfoque est√° asociado con las simulaciones tradicionales, pero tiene diferencias cardinales. La simulaci√≥n, de hecho, "se basa en suposiciones", dijo Shavinsky. "Este es lo mismo que decir:" Creo que entend√≠ qu√© fundamentos f√≠sicos subyacen a todo lo que observo en el sistema ". Tengo una receta para formar estrellas, para el comportamiento de la materia oscura, etc. Coloco todas mis hip√≥tesis y comienzo la simulaci√≥n. Y luego pregunto: ¬ŅSe parece a la realidad? Y con el modelado generativo, esto, dijo, parece "en cierto sentido, exactamente lo opuesto a la simulaci√≥n". No sabemos nada, no queremos asumir nada. Queremos que los datos nos digan qu√© puede suceder ".

El aparente éxito del modelado generativo en dicho estudio, obviamente, no significa que los astrónomos y estudiantes de posgrado se hayan vuelto innecesarios, pero parece demostrar un cambio en el grado en que la IA puede aprender algo sobre los objetos y procesos astrofísicos, teniendo casi solo una gran cantidad de datos. "Esta no es una ciencia totalmente automatizada, pero demuestra que somos capaces de crear herramientas que automatizan el progreso científico al menos parcialmente", dijo Shavinsky.

El modelado generativo es obviamente capaz de mucho, pero si realmente representa un nuevo enfoque de la ciencia, este es un punto discutible. Para David Hogg , cosm√≥logo de la Universidad de Nueva York y el Instituto Flatiron, esta tecnolog√≠a, aunque impresionante, es de hecho una forma muy compleja de extraer secuencias de datos, y los astr√≥nomos lo han estado haciendo durante siglos. En otras palabras, es un m√©todo avanzado de observaci√≥n y an√°lisis. El trabajo de Hogg, como Shavinsky, depende en gran medida de la IA; √Čl usa redes neuronales para clasificar estrellas por espectro y sacar conclusiones sobre otras propiedades f√≠sicas de las estrellas usando modelos basados ‚Äč‚Äčen datos. Pero √©l considera que su trabajo, y el trabajo de Shavinsky, es un m√©todo cient√≠fico antiguo, amable y probado. "No creo que esta sea la tercera v√≠a", dijo recientemente. ‚ÄúSolo creo que nosotros, como comunidad, estamos utilizando cada vez m√°s nuestros datos. En particular, somos mucho mejores para comparar datos. Pero desde mi punto de vista, mi trabajo encaja perfectamente en el marco del r√©gimen de observaci√≥n ".

Asistentes celosos


Si la IA y las redes neuronales son herramientas conceptualmente nuevas o no, es obvio que comenzaron a desempe√Īar un papel fundamental en la astronom√≠a moderna y la investigaci√≥n f√≠sica. En el Instituto de Investigaci√≥n Te√≥rica de Heidelberg, el f√≠sico Kai Polsterer dirige un grupo de astroinform√°tica, un equipo de investigadores que trabaja con nuevos m√©todos en astrof√≠sica basados ‚Äč‚Äčen el procesamiento de datos. Recientemente utilizaron un algoritmo con MO para extraer informaci√≥n de desplazamiento al rojo de los conjuntos de datos de galaxias, una tarea que sol√≠a ser debilitante.

Polsterer considera a estos nuevos sistemas basados ‚Äč‚Äčen IA como "asistentes entusiastas", capaces de peinar datos durante horas sin aburrirse y quejarse de las condiciones de trabajo. Estos sistemas pueden hacer todo el trabajo mon√≥tono y duro, dijo, dej√°ndonos con una "ciencia genial e interesante".

Pero no son perfectos. En particular, advierte Polsterer, los algoritmos solo pueden hacer lo que han sido entrenados. El sistema es indiferente a la entrada. Dale una galaxia y ella podrá apreciar su desplazamiento al rojo y su edad. Pero dale una selfie o una foto de pescado podrido, ella apreciará su edad (naturalmente, mal). Al final, dijo, la supervisión de la gente sigue siendo necesaria. “Todo se cierra para nosotros, los investigadores. Somos responsables de la interpretación ".

Por su parte, Nord, de Fermilab, advierte que es importante que las redes neuronales produzcan no solo resultados, sino también errores de trabajo, como cualquier estudiante está acostumbrado. Es tan aceptado en la ciencia que si toma una medida pero no da un error, nadie tomará sus resultados en serio.

Al igual que muchos investigadores de IA, a Nord también le preocupa que los resultados de las redes neuronales sean difíciles de entender; la red neuronal da una respuesta sin proporcionar una forma clara de obtenerla.

Sin embargo, no todos creen que la falta de transparencia sea un problema. Lenka Zdeborova, investigadora del Instituto de F√≠sica Te√≥rica en Francia, se√Īala que la intuici√≥n humana tambi√©n es a veces imposible de entender. Miras la foto y descubres que el gato est√° representado en ella, "pero no sabes c√≥mo lo sabes", dice. "Tu cerebro, en cierto modo, tambi√©n es una caja negra".

No solo los astrof√≠sicos y cosm√≥logos migran al lado de la ciencia usando inteligencia artificial y procesamiento de datos. El especialista en f√≠sica cu√°ntica Roger Melko, del Instituto de F√≠sica Te√≥rica del Per√≠metro y la Universidad de Waterloo, utiliz√≥ una red neuronal para resolver algunos de los problemas m√°s complejos e importantes en esta √°rea, por ejemplo, representando una funci√≥n de onda que describe un sistema de muchas part√≠culas. La IA es necesaria debido a lo que Melko llama la "maldici√≥n exponencial de la dimensi√≥n". Es decir, el n√ļmero de formas posibles de la funci√≥n de onda aumenta exponencialmente con un aumento en el n√ļmero de part√≠culas en el sistema descrito. La dificultad es similar a tratar de elegir el mejor movimiento en un juego como el ajedrez o ir: est√°s tratando de calcular el siguiente movimiento, imaginando c√≥mo ir√° tu oponente y eligiendo la mejor respuesta, pero con cada movimiento aumenta el n√ļmero de oportunidades.

Por supuesto, AI dominó ambos juegos, aprendió a jugar al ajedrez hace unas décadas y venció al mejor jugador de go en 2016, esto fue hecho por el sistema AlphaGo. Ella dice finamente que también están bien adaptados a los problemas de la física cuántica.

Mente mec√°nica


Si Shavinsky tiene raz√≥n al declarar que ha encontrado una "tercera forma" de involucrarse en la ciencia o, como dice Hogg, estas son solo observaciones tradicionales y an√°lisis de datos "con esteroides", est√° claro que la IA cambia la esencia de un descubrimiento cient√≠fico y claramente lo acelera. ¬ŅHasta d√≥nde llegar√° la revoluci√≥n de la IA en la ciencia?

Peri√≥dicamente se hacen declaraciones fuertes sobre los logros de los "robocient√≠ficos". Hace diez a√Īos, el qu√≠mico robot Adam examin√≥ el genoma de la levadura y determin√≥ qu√© genes son responsables de la producci√≥n de ciertos amino√°cidos. Lo hizo observando cepas de levadura que carec√≠an de ciertos genes y comparando los resultados de su comportamiento entre s√≠. La revista Wired escribi√≥: "El robot realiz√≥ un descubrimiento cient√≠fico por s√≠ solo ".

Un poco más tarde, Lee Cronin, químico de la Universidad de Glazko, usó un robot para mezclar productos químicos al azar y descubrir si aparecerían nuevos compuestos. Al rastrear las reacciones en tiempo real utilizando un espectrómetro de masas, una máquina de resonancia magnética nuclear y un espectrómetro infrarrojo, el sistema finalmente aprendió a predecir las combinaciones más reactivas. Aunque esto no condujo a descubrimientos, dijo Cronin, un sistema robótico podría permitir a los químicos acelerar su investigación en un 90%.

El a√Īo pasado, otro equipo de cient√≠ficos de Zurich utiliz√≥ redes neuronales para derivar leyes f√≠sicas basadas en conjuntos de datos. Su sistema, una especie de Kepler rob√≥tico, redescubri√≥ el modelo helioc√©ntrico del sistema solar, basado en registros de la ubicaci√≥n del Sol y Marte en el cielo visible desde la Tierra, y tambi√©n dedujo la ley de conservaci√≥n del momento a partir de observaciones de colisiones de bolas. Dado que las leyes f√≠sicas a menudo se pueden expresar de varias maneras, los investigadores est√°n interesados ‚Äč‚Äčen saber si este sistema puede ofrecer formas nuevas y posiblemente m√°s simples de trabajar con leyes conocidas.

Todos estos son ejemplos de c√≥mo la IA acelera los descubrimientos cient√≠ficos, aunque en cada caso se puede argumentar cu√°n revolucionario fue el nuevo enfoque.Quiz√°s lo m√°s controvertido ser√° la cuesti√≥n de cu√°nta informaci√≥n se puede obtener solo de los datos, un tema importante en la era de las vastas monta√Īas de datos en constante crecimiento. En The Book of Why, 2018, el especialista en inform√°tica Jadi Pearl y la popular escritora cient√≠fica Dana Mackenzie sugieren que los datos son algo "incre√≠blemente tonto". Las preguntas sobre la causalidad "nunca pueden responderse bas√°ndose √ļnicamente en datos", escriben. "Cada vez que ve un trabajo o estudio que analiza datos sin tener en cuenta los modelos, puede estar seguro de que el resultado de este trabajo se resume y posiblemente se transforma, pero no interpreta los datos". Shavinsky simpatiza con la posici√≥n de Pearl, pero describe la idea de trabajar solo con datos como algo as√≠ como un "hombrecillo de guiones". Dijo que nunca hab√≠a declarado la posibilidad de derivar causas y efectos de los datos."Acabo de decir que podemos hacer mucho m√°s con los datos de lo que suele ser el caso".

Otro argumento com√ļn es que se necesita creatividad para la ciencia, y al menos por ahora, no tenemos idea de c√≥mo programarla. Una simple enumeraci√≥n de todas las posibilidades, como lo hizo el qu√≠mico robot Cronin, no parece particularmente creativa. "Creo que para llegar a una teor√≠a, construcciones l√≥gicas, se requiere creatividad", dijo Polsterer. "Cada vez que necesitas creatividad, necesitas una persona". ¬ŅY de d√≥nde viene la creatividad? Polsterer sospecha que est√° relacionado con el aburrimiento, el hecho de que, seg√ļn √©l, el auto no fue sometido a prueba. ‚ÄúPara ser creativo, uno no debe amar el aburrimiento. Y no creo que la computadora se aburra nunca ". Por otro lado, palabras como "creatividad" e "inspiraci√≥n" se utilizan a menudo para describir programas como Deep Blue y AlphaGo. Y los intentos in√ļtiles de describirLo que sucede dentro de la mente de la m√°quina es muy similar a las dificultades que encontramos al estudiar nuestros propios procesos de pensamiento.

Shavinsky recientemente dej√≥ la academia a favor del sector comercial; Ahora dirige la startup Modulos, donde trabajan muchos cient√≠ficos del Instituto T√©cnico Suizo y, seg√ļn su sitio web, "trabaja en el ojo de una tormenta de desarrollos en el campo de la IA y el aprendizaje autom√°tico". Cualesquiera que sean los obst√°culos entre la inteligencia artificial moderna y la inteligencia artificial completa, √©l y otros expertos creen que las m√°quinas est√°n destinadas a hacer m√°s y m√°s trabajo de los cient√≠ficos. ¬ŅHay l√≠mites para esto? Solo tenemos que averiguarlo.

‚Äú¬ŅSer√° posible en el futuro previsible crear una m√°quina capaz de hacer descubrimientos en f√≠sica o matem√°tica que las personas m√°s inteligentes que usan equipos biol√≥gicos no sean capaces de hacer? - piensa Shavinsky. - ¬ŅSe desarrollar√° la ciencia del futuro gracias a las m√°quinas que funcionan a un nivel inaccesible para nosotros? No lo se Esa es una buena pregunta.

Source: https://habr.com/ru/post/445806/


All Articles