DeepMind creó una computadora que aprende a usar su memoria
DeepMind ha desarrollado un nuevo tipo de IA que puede aprender a usar su propia memoria. El proyecto se llama " Computadora Neural Diferencial " (Computadora Neural Diferencial, o DNC).¿Cuáles son las consecuencias de un proyecto cuyo objetivo es "enseñar" a una computadora a usar su propia memoria? Lo principal es que una forma débil de IA se está volviendo más efectiva que nunca. Por ejemplo, dicho sistema puede ayudar a una persona a moverse en una ciudad completamente desconocida sin el más mínimo inconveniente.
Ilustración de arquitectura DNC. El controlador de red neuronal recibe información del exterior, utilizando los datos para trabajar con la memoria a través de operaciones específicas de lectura / escritura. Para ayudar al controlador a trabajar con la memoria, DNC mantiene enlaces temporales para rastrear los datos grabados, y también captura los niveles de uso actuales para cada ubicación de memoria.El principal logro de los empleados de DeepMind es que pudieron enseñar a su IA a realizar cada tarea posterior, sin olvidar cómo fueron las anteriores. En una situación normal, el sistema puede usar la misma área de memoria para registrar información sobre diversas tareas. Una vez completada la primera tarea, la máquina comienza a realizar la segunda. Y los datos sobre la implementación del primero para reemplazar los datos sobre la implementación del segundo.
DNC juega etiquetaEl DNC de DeepMind no lo hace. Los empleados de la empresa proporcionan a la red neuronal un trozo de memoria en un medio externo y le enseñan al sistema cómo usarlo. El proceso de aprendizaje en este caso es de naturaleza de prueba y error. Los representantes del proyecto declararon en su sitio web lo siguiente: “Cuando el DNC genera una respuesta, la comparamos con la respuesta correcta deseada. Con el tiempo, el sistema aprende a dar respuestas cada vez más cerca de la derecha ".El corazón de un DNC es una red neuronal llamada controlador. Los creadores del sistema dibujan una analogía aquí con el procesador en la computadora. El controlador es responsable de recibir datos, escribirlos en la memoria y leerlos desde la memoria. Además, el controlador analiza los datos y genera una respuesta en respuesta a una pregunta del sistema.El controlador realiza varios tipos de operaciones en la memoria. Cada momento decide si escribir algo en la memoria o no. Si la solución es sí, entonces el controlador puede elegir dos opciones de grabación: en un sector no utilizado o en un sector donde ya hay información que el controlador estaba buscando anteriormente. Esto permite actualizar la información registrada en algún sector fijo. Si se utilizan todos los sectores en la memoria, el controlador puede decidir liberar la memoria, de forma similar a cómo puede sobrescribir un sector en un disco duro ordinario que ya no es necesario.Como en el caso de la grabación, el controlador puede leer datos de varios sectores. El sistema puede buscar la información necesaria en cada sector o leer de inmediato los datos almacenados en el sector relacionados con los datos solicitados.Todo esto permite que el sistema resuelva de manera efectiva el problema del uso de la memoria, el almacenamiento y la recuperación de datos.Después de que la red neuronal recibió un mapa del metro de Londres, la computadora comenzó a dar respuestas complejas a preguntas complejas sobre cómo moverse por el metro. Estas respuestas se basaron en el principio de deducción. Aquí hay un ejemplo de una de las preguntas que DNC puede responder correctamente justo después de cargar un mapa del metro en la memoria del sistema: "Cuando subimos al vagón del metro y pasamos una parada a lo largo de la línea Central, hay cuatro paradas más a lo largo de la línea Koltsevaya y hay otra línea Dzhubili". dos paradas, ¿en qué parada saldremos? Para los asistentes digitales como Siri, esta pregunta es insoportable: simplemente no podrán encontrar la respuesta correcta, a pesar de toda la potencia informática de los centros de datos de Apple. Pero AI de DeepMind es bastante capaz de dar la respuesta correcta.
Fuente: Photofusion / GettyAdemás, este sistema puede dar consejos para acortar el camino entre diferentes paradas. Ella da la respuesta correcta en 9 de cada 10 casos.Según los desarrolladores, su sistema puede dar la respuesta correcta porque el principio de su trabajo es similar a los principios fundamentales del pensamiento humano. Por supuesto, el sistema de DeepMind todavía está lejos de ser una máquina análoga real de inteligencia humana, pero la versión actual funciona bien. El cerebro humano maneja aún más hábilmente los datos almacenados, incluido el proceso de publicación de nueva información.Los especialistas de DeepMind esperan que en el futuro puedan crear un sistema que, sin introducir programas especializados en su memoria, pueda usar la información disponible para resolver ciertos problemas. En este caso, ya podemos hablar sobre un sistema completo de autoaprendizaje que puede usar los datos disponibles para resolver problemas complejos.Todavía no está claro cuándo Alphabet podrá utilizar las ventajas del nuevo sistema en sus productos y servicios comerciales. Hasta ahora, el equipo de la unidad está llevando a cabo estudios en profundidad y no dice nada sobre cuándo comenzará el uso comercial del sistema desarrollado.Los expertos dicen que la compañía ha hecho grandes avances en la investigación de IA, Herbert Jaeger, de la Universidad Jacobs de Bremen., afirmó que el equipo de DeepMind "ha superado una de las etapas más importantes en el desarrollo evolutivo de los sistemas neuronales modernos". Este científico está seguro de que, de hecho, la compañía ha creado algo más significativo que lo descrito por sus representantes en un artículo en la revista Nature .Como todos los otros proyectos de DeepMind, este se basa en el aprendizaje profundo. Casi la misma tecnología que ayudó al sistema AlphaGo a ganar 4 juegos del 5º campeón mundial Lee Sedol.Ahora DeepMind junto con el Future of Humanity Institute está haciendo otro trabajo interesante. Un equipo integrado de especialistas crea un "botón rojo" para una forma de IA fuerte. Esta es una herramienta que desactivará la inteligencia artificial en caso de que se salga de control.El problema de crear dicho instrumento se muestra bien en la declaración de Nick Bostrom, director del Instituto para el Futuro de la Humanidad: “Si una explosión intelectual nos amenaza con la extinción, entonces debemos entender si podemos controlar el proceso de detonación. Hoy sería más razonable acelerar el trabajo para resolver el problema del control, en lugar de suspender la investigación en el campo de la inteligencia artificial. Pero hasta ahora, seis personas están resolviendo el problema de control, mientras que decenas, si no cientos de miles, están trabajando en la creación de inteligencia artificial ".Source: https://habr.com/ru/post/es398357/
All Articles