OpenAI bot derrota a tres profesionales superiores en Dota 2


Danil 'Dendi' Ishutin ataca la posición del bot OpenAI en el torneo internacional, 11 de agosto de 2017. Captura de pantalla del torneo en vivo

En el Campeonato Internacional Dota 2 en Seattle ayer, un bot creado por OpenAI derrotó a uno de los mejores jugadores de Dota 2 del mundo, Danil Ishutin , un conocido profesional bajo el apodo de Dendi ($ 735,449 en premios de carrera). El ucraniano de 27 años se rindió en medio del segundo juego.

De acuerdo con las reglas de un partido uno a uno, el ganador en cada juego fue el jugador que cometió dos asesinatos o destruyó la torre del enemigo. En el primer juego, OpenAI dominó y ganó en menos de 10 minutos, e Ishutin parecía sorprendido por las capacidades del bot. Al comienzo del segundo juego, el bot hizo una matanza, y Dendi pronto detuvo el juego, admitiendo la derrota. "Esto da miedo", dijo Dendi frente a una gran multitud de espectadores. Elon Musk se regocijó .

Por lo tanto, el bot OpenAI se mantuvo imbatible al enfrentar a los mejores jugadores del mundo en Dota 2. Anteriormente, celebró la victoria sobre Arthur 'Arteezy' Babaev (No. 1 en el ranking general) y Sayed 'Suma1L' Hassan (No. 1 en la clasificación 1v1).

Dendi vs OpenAI bot


Dota 2 es un juego complejo con información oculta, donde los jugadores tienen que planificar acciones, atacar, engañar y engañar al enemigo. No existe una correlación obvia entre las habilidades del jugador y la cantidad de acciones por minuto, aunque el bot tiene aproximadamente la misma cantidad de acciones por minuto que los humanos. Sin embargo, los jugadores notan que el bot obtuvo una ventaja debido a una reacción más rápida y movimientos excepcionalmente precisos, en comparación con una persona viva que hace clic con el mouse.


El miembro del personal de mantenimiento del Campeonato Internacional levantó la mano con una unidad flash USB en la que se graba el bot. Un profesional de Dendi está parado en el fondo, esperando que comience la pelea. Foto: OpenAI a través de YouTube

"Lo que hemos mostrado aquí se llama un sistema de aprendizaje común", explica Greg Brockman, cofundador y CTO de OpenAI. - Ella todavía tiene una serie de limitaciones, pero ya es capaz de derrotar a los mejores profesionales en Dota. Este es un paso hacia la construcción de sistemas más generales que puedan aprender las tareas más complejas, confusas e importantes del mundo real, como la profesión del cirujano ".

El bot OpenAI aprendió a jugar Dota 2, después de pasar una gran cantidad de sesiones de juego contra sí mismo. El entrenamiento tomó dos semanas. Durante este tiempo, el camino ha sido recorrido desde acciones aleatorias aleatorias en el juego hasta habilidades suficientes para derrotar a los mejores profesionales. Los desarrolladores no pusieron ninguna estrategia en el programa, no utilizaron la ayuda de expertos. El bot simplemente comenzó desde cero y jugó consigo mismo, haciendo pequeñas mejoras en el juego paso a paso hasta que alcanzó un nivel profesional.


Sin embargo, en el estado actual es poco probable que el bot pueda competir en un gran juego, donde generalmente juegan equipos de cinco jugadores. De todos modos, los combates uno a uno son una versión simplificada de Dota, pero en los juegos de equipo hay estrategias y técnicas específicas mucho más diferentes. En un blog oficial, OpenAI dijo que crear un grupo de bots para jugar contra un equipo de personas es el próximo objetivo.

Para OpenAI, este es un logro definitivo. Esta organización sin fines de lucro fue fundada en diciembre de 2015 por los conocidos empresarios Ilon Mask y Sam Altman, director ejecutivo de la incubadora de startups Y Combinator. Los patrocinadores incluyen varios líderes influyentes de Silicon Valley, incluidos los empresarios Peter Thiel y Jessica Livingston. La organización tiene como objetivo crear una inteligencia artificial segura (es decir, pública y abierta).

En diciembre de 2016, OpenAI introdujo el middleware Universe para entrenar y aprender una IA fuerte. Teóricamente, la capacitación puede llevarse a cabo sobre toda la información de la humanidad, accesible a través de Internet. Estos son juegos, sitios web y otras aplicaciones.

OpenAI cree que el aprendizaje por refuerzo es una forma importante de aprendizaje automático que mejorará en gran medida la inteligencia artificial. En el proceso de aprendizaje mediante este método, el sistema de prueba (agente) aprende interactuando con un determinado entorno. A diferencia de la enseñanza tradicional con un maestro, la respuesta a las decisiones de IA tomadas son señales de refuerzo, mientras que algunas reglas de refuerzo se forman dinámicamente y son difíciles de entender, es decir, en función de la actividad simultánea de las neuronas formales.

"Nuestro objetivo final es desarrollar un único agente inteligente que pueda aplicar de manera flexible la experiencia adquirida en Universe para resolver nuevos problemas y ganar rápidamente nueva experiencia, lo que será un paso importante en el camino hacia una IA fuerte", dijo la declaración de OpenAI.

Actualmente, AI está siendo desarrollada por corporaciones comerciales como Google, Facebook y Microsoft. Por supuesto, ponen su ganancia financiera por encima de los intereses de la humanidad. Las IA que crearon actuarán en consecuencia. OpenAI, una organización sin fines de lucro con una alternativa de código abierto a la IA, está tratando de contrarrestar a las corporaciones. Todos los estudios en el Instituto OpenAI se publican en el dominio público. El anuncio oficial de la fundación de la organización decía: “En relación con la historia impredecible de la IA, es difícil predecir cuándo puede aparecer una IA de nivel humano. Cuando esto suceda, será importante tener a disposición de la humanidad un instituto de investigación líder que pueda priorizar la ganancia para todos por encima de sus propios intereses ".

Source: https://habr.com/ru/post/es405939/


All Articles