La red neuronal AlphaStar venció a los profesionales StarCraft II con un puntaje de 10−1



DeepMind, una subsidiaria de Alphabet, que se dedica a la investigación en el campo de la inteligencia artificial, anunció un nuevo hito en esta gran búsqueda: por primera vez, AI derrotó a la persona en la estrategia de Starcraft II . En diciembre de 2018, una red neuronal convolucional llamada AlphaStar extendió los jugadores profesionales TLO (Dario Wünsch, Alemania) y MaNa (Grzegorz Kominz, Polonia), logrando diez victorias. La compañía anunció este evento ayer en una transmisión en vivo en YouTube y Twitch.

En ambos casos, tanto las personas como el programa jugaron como protoss. Aunque TLO no se especializa en esta carrera, MaNa resistió seriamente e incluso ganó un juego.

En la popular estrategia en tiempo real, los jugadores representan una de las tres razas que compiten por recursos, construyen estructuras y luchan en el mapa grande. Es importante tener en cuenta que la velocidad del programa y su visibilidad en el campo de batalla fueron limitadas para que AlphaStar no obtuviera una ventaja injusta sobre las personas (corrección: aparentemente, la visibilidad fue limitada solo en el último partido). De hecho, según las estadísticas, el programa incluso realizó menos acciones por minuto que las personas: un promedio de 277 para AlphaStar, 390 para MaNa, 678 para TLO.



El video muestra la vista del juego desde el punto de vista del agente de IA en el segundo partido contra MaNa. También se muestra la vista desde el lado humano, pero no estaba disponible para el programa.

AlphaStar fue entrenado para jugar para protoss en un entorno llamado AlphaStar League. Primero, la red neuronal pasó tres días mirando grabaciones de juegos, luego jugando consigo misma, usando una técnica conocida como entrenamiento de refuerzo, habilidades de perfeccionamiento.

En diciembre, organizaron por primera vez una sesión de juego contra TLO, en la que se probaron cinco versiones diferentes de AlphaStar. En esta ocasión, TLO se quejó de que no podía adaptarse al juego del oponente. El programa ganó con un puntaje de 5-0.

Después de optimizar la configuración de la red neuronal, se organizó un partido una semana después contra MaNa. El programa volvió a ganar cinco juegos, pero MaNa se vengó en el último juego contra la versión más reciente del algoritmo en vivo, por lo que tiene algo de qué enorgullecerse.


Evaluación del nivel de oponentes en los que se entrenó la red neuronal

Para comprender los principios de la planificación estratégica, AlphaStar tuvo que dominar el pensamiento especial. Los métodos desarrollados para este juego pueden ser potencialmente útiles en muchas situaciones prácticas cuando se requiere una estrategia compleja: por ejemplo, planificación comercial o militar.

Starcraft II no es solo un juego extremadamente desafiante. Este es también un juego con información incompleta, donde los jugadores no siempre pueden ver las acciones de su oponente. También carece de una estrategia óptima. Y lleva tiempo que los resultados de las acciones del jugador sean claros: esto también dificulta el aprendizaje. El equipo de DeepMind utilizó una arquitectura de red neuronal muy especializada para resolver estos problemas.

Aprendizaje limitado en juegos


DeepMind es conocido como un desarrollador de software que supera a los mejores profesionales del mundo del ajedrez. Antes de esto, la compañía desarrolló varios algoritmos que aprendieron a jugar juegos simples de Atari. Los videojuegos son una excelente manera de medir los avances en inteligencia artificial y comparar las computadoras con las personas. Sin embargo, esta es un área de prueba muy estrecha. Al igual que los programas anteriores, AlphaStar realiza solo una tarea, aunque increíblemente bien.

Podemos decir que una IA débil y de propósito estrecho dominó las habilidades de planificación estratégica y tácticas de las operaciones de combate. Teóricamente, estas habilidades pueden ser útiles en el mundo real. Pero en la práctica, este no es necesariamente el caso.

Algunos expertos creen que estas aplicaciones altamente especializadas de IA no tienen nada que ver con una IA fuerte: "Los programas que han aprendido a jugar magistralmente un videojuego o juego de mesa específico al nivel" sobrehumano "se pierden por completo con el más mínimo cambio en las condiciones (cambiando el fondo en la pantalla o cambiando la posición virtual "plataforma" para vencer a la "bola"), - dice el profesor de informática de la Universidad estatal de Portland, Melanie Mitchell en el artículo "artificial RAN inteligencia en una barrera ponima ciones " . - Estos son solo algunos ejemplos que demuestran la poca confiabilidad de los mejores programas de IA, si la situación es ligeramente diferente de aquellos en los que fueron entrenados. Los errores en estos sistemas van desde ridículos e inofensivos hasta potencialmente catastróficos ".

El profesor cree que la carrera de comercialización de IA ejerció una enorme presión sobre los investigadores para crear sistemas que funcionen "razonablemente bien" en tareas estrechas. Pero en última instancia, el desarrollo de IA confiable requiere un estudio más profundo de nuestras propias habilidades y una nueva comprensión de los mecanismos cognitivos que nosotros mismos utilizamos:

Nuestra propia comprensión de las situaciones a las que nos enfrentamos se basa en "conceptos de sentido común" amplios e intuitivos sobre cómo funciona el mundo y los objetivos, los motivos y el comportamiento probable de otros seres vivos, especialmente otras personas. Además, nuestra comprensión del mundo se basa en nuestras habilidades básicas para generalizar lo que sabemos, para formar conceptos abstractos y hacer analogías; en resumen, adaptar de manera flexible nuestros conceptos a nuevas situaciones. Durante décadas, los investigadores han experimentado con la enseñanza de la inteligencia artificial intuitiva, el sentido común y las habilidades humanas sostenibles para generalizar, pero se ha avanzado poco en este asunto tan difícil.

La red neuronal AlphaStar solo puede jugar para protoss hasta ahora. Los desarrolladores anunciaron planes para entrenarla en el futuro para jugar en otras carreras.

Source: https://habr.com/ru/post/437538/


All Articles