DeepMind brinda acceso gratuito a un entorno virtual de aprendizaje automático



Recientemente, representantes de la división DeepMind (ahora parte de la cartera Alphabet) anunciaron la provisión de acceso gratuito a los desarrolladores al código fuente de la plataforma DeepMind Lab. Este es un servicio de aprendizaje automático basado en Quake III diseñado para el entrenamiento de inteligencia artificial. A saber: aprender a resolver problemas en un espacio tridimensional sin intervención humana. El núcleo de la plataforma es el motor del juego Quake III Arena.

Dentro del mundo del juego, la IA adquiere la forma de una esfera y la capacidad de volar mientras explora el espacio circundante. El objetivo establecido por los desarrolladores es enseñar a la forma débil de IA a "comprender" lo que está sucediendo y responder a diversas situaciones que ocurren en el mundo virtual. Un "personaje" puede realizar una serie de acciones, moverse a través de un laberinto y estudiar el entorno inmediato.

"Estamos tratando de desarrollar varias formas de IA que puedan realizar una serie de tareas desde el estudio habitual del mundo del juego hasta tomar cualquier acción con un análisis de sus consecuencias", dice Shane Legge, investigador jefe de DeepMind.



Los especialistas esperan que la IA pueda aprender por prueba y error. Los juegos en este caso son casi una opción ideal. Por ejemplo, anteriormente en DeepMind usaban (y están usando ahora) la consola de juegos Atari para enseñar a la red neuronal a realizar las acciones secuenciales necesarias para el juego.

Pero un mundo tridimensional abierto que se puede cambiar representa un entorno mucho más prometedor para aprender IA que el mundo plano de los juguetes gráficamente simples para Atari. La IA en el mundo tridimensional tiene asignaciones claras que cambian secuencialmente de tal manera que la experiencia obtenida en la resolución de cada asignación anterior resulta útil para la IA en la resolución de la siguiente.

La ventaja de un entorno tridimensional es que puede usarse para entrenar sistemas informáticos para responder a varios problemas que un robot puede esperar en el mundo real. Usando este simulador, los robots industriales pueden ser entrenados sin problemas. Y trabajar con un entorno virtual no es un ejemplo más fácil en algunos casos que enseñar tales sistemas "manualmente".

Al mismo tiempo, la mayoría de las redes neuronales modernas se desarrollan para resolver un problema específico (procesamiento de imágenes, por ejemplo). Los desarrolladores de la nueva plataforma prometen que ayudará a crear una forma universal de IA que pueda resolver una gran cantidad de tareas. Por otra parte, la ayuda de las personas en este caso, el sistema informático no es necesario. La generación del entorno para la red neuronal ocurre cada vez en un orden aleatorio.


Según los desarrolladores de la plataforma, ayuda a aprender IA de la misma manera que los niños aprenden. "¿Cómo estudiamos el mundo tú o yo en la infancia?", Citó un ejemplo de uno de los empleados de DeepMind. “La comunidad de aprendizaje automático siempre ha sido muy abierta. Publicamos alrededor de 100 artículos al año, además, hemos abierto el código fuente para muchos de nuestros proyectos ".

Ahora Google DeepMind ha abierto el código fuente de DeepMind Lab, lo publicó en GitHub. Gracias a esto, cualquiera puede descargar el código de la plataforma y modificarlo para adaptarlo a sus necesidades. Los representantes del proyecto declaran que los especialistas conectados pueden crear nuevos niveles de juego ellos mismos cargando sus propios proyectos en GitHub. Esto puede ayudar a toda la comunidad a alcanzar sus objetivos de manera más rápida y eficiente.

Este proyecto no es el único para DeepMind. El mes pasado, sus representantes firmaron un acuerdo de cooperación con Activision Blizzard Inc. El objetivo es convertir el entorno de Starcraft 2 en un banco de pruebas de inteligencia artificial. Quizás en un futuro cercano otros desarrolladores de juegos se unan a este proyecto. Por cierto, la IA en el entorno de juego no obtiene ninguna ventaja sobre el enemigo, ya que solo utiliza información visual para la promoción.como un hombre

En la práctica, esto significa que Google AI necesitará predecir lo que el enemigo está haciendo en un momento dado para responder adecuadamente a las acciones del "enemigo". Además, será necesario responder rápidamente a lo que ha ido más allá del plan. Todo esto permitirá probar el siguiente nivel de capacidades de inteligencia artificial. "Al final, queremos usar estas habilidades para resolver problemas globales", dijo Demis Hassabis, fundador de Deepmind (fue comprado por Google en 2014, y la IA se está desarrollando en función de los logros de la empresa adquirida).

Los especialistas en IA aprueban con cautela el proyecto. "Lo bueno es que proporcionan una gran cantidad de tipos de entornos", dijo Ilya Sutskevar, cofundador de OpenAI. "Mientras más tipos de entornos encuentre un sistema, más rápido evolucionará", continuó. De hecho, el entorno de aprendizaje de IA tridimensional contiene más de 1000 niveles y tipos de entornos.

Zoubin Gahrahmani, profesor de Cambridge, cree que DeepMind Lab y otras plataformas para mejorar el desarrollo de la inteligencia artificial contribuyen al progreso, permitiendo a los investigadores acceder al entorno desarrollado. Además, proyectos como este son bastante transparentes. También se dio cuentaque una persona alcance cierto nivel del juego requiere mucho menos tiempo que una computadora. Por lo tanto, el profesor duda que la IA, su forma débil, sea difícil de llevar al menos al nivel de una persona en términos de velocidad de aprendizaje.

Source: https://habr.com/ru/post/es399853/


All Articles