Cho Chikun y Deep Zen Go: otro intento de superar al hombre en th



El 27 de enero de 2016, Google DeepMind por primera vez anunció públicamente el éxito de su nuevo desarrollo. La compañía británica de inteligencia artificial, que Google compró en 2014, trató de conquistar el antiguo juego asiático de go. A principios de este año, el estado de ir como un juego independiente de la computadora aún era inquebrantable. Los sistemas informáticos existían, pero jugaban a nivel aficionado. Los profesionales perdieron para ellos solo con una desventaja significativa.

DeepMind construye AlphaGo en una combinación de Monte Carlo y redes neuronales artificiales. Después de crear el sistema, ajustar sus parámetros y entrenar las redes neuronales, se probó contra otros programas informáticos y el campeón humano. AlphaGo derrotó al campeón europeo 2013, 2014 y 2015 Fan Hui.

Go es tradicionalmente más bajo en Europa que en casa en Asia. La fuerza del AlphaGo tiene dudas bien fundadas . Pero Google anunció de inmediato que la próxima pelea de AlphaGo se llevará a cabo con el propietario del noveno profesional, Dan Lee Sedoll, uno de los mejores jugadores de la última década. En marzo, tuvieron lugar una serie de cinco juegos ... y el hombre perdió nuevamente con un puntaje de 4: 1 . La conmoción de las comunidades de inteligencia artificial y de los jugadores fueron seguidos por un completo silencio sobre futuros partidos. No hay nuevos partidos programados contra AlphaGo .

El equipo del proyecto japonés Deep Zen Go, que hasta ahora está enseñando a su sistema a jugar contra las personas, intentará derrotar a AlphaGo. Los días 19, 20 y 23 de noviembre, se planean tres juegos contra Cho Tikun, el noveno maestro de dan de Japón. Un pronóstico interesante es el de Aya Huang, un empleado de DeepMind que, en marzo, como parte de un partido histórico, se sentó frente a Lee Sedol y colocó piedras en el tablero para AlphaGo. Huan cree que la nueva versión de Zen ganará con un puntaje de 3: 0 o 2: 1.

DeepMind ha resuelto una tarea realmente difícil. De acuerdo con las reglas del juego, dos oponentes colocan piedras blancas y negras en un tablero de cierto tamaño (en juegos profesionales - 19 × 19). Se pueden capturar piedras, algunas acciones están prohibidas, hay varias reglas más que varían según la versión del juego. Pero el objetivo siempre es uno: el que se defiende de un territorio más grande gana.

Para un sistema informático, una diversión de mesa aparentemente simple es muy difícil: las posibles posiciones de las piedras en el tablero de 19 × 19 son cien órdenes de magnitud más que las piezas de ajedrez en el tablero de 8 × 8. Las piedras no disminuyen, hay más, no se puede crear una base para el final de las fiestas. A partir de los movimientos iniciales, puede deducir rápidamente una nueva situación que es imposible de prever. Todo esto complica la creación de potentes sistemas informáticos.

Los primeros programas que jugaron fueron creados en los años 70. Desde principios de los años 80, se han celebrado campeonatos mundiales entre programas informáticos. Durante mucho tiempo, los automóviles perdieron para las personas con una discapacidad de 9 piedras o más. Hasta principios de este año, el logro en 4 piedras de la discapacidad se consideraba un logro .

La última tecnología es la búsqueda en madera o el método Monte Carlo, sistemas expertos con una base de datos de buenos movimientos. En DeepMind, se han agregado redes neuronales de política y valores al método de Monte Carlo. Fueron entrenados con la ayuda de 160 mil juegos del servidor de jugadores de KGS desde el sexto hasta el noveno dan. Luego el sistema estudió en lotes contra sí mismo. El resultado es la derrota del primer campeón europeo del 2º dan profesional, luego la derrota del campeón coreano del 9º dan profesional.

Google  — . . . .

. , : Siri, Google Assistant Google Now, Cortana. , -. , AlphaGo Google Google Pixel . en algún lugar entre las nuevas direcciones del sistema de traducción automática Inglés ← → Chino y algoritmos avanzados de reconocimiento de imagen y reconocimiento de voz.

La victoria de Google "sonó" lejos. El partido se celebró en la capital de Corea del Sur y se convirtió en la razón para crear un fondo de un billón de wones ($ 860 millones) para el desarrollo de sistemas de inteligencia artificial. Los desarrolladores de otros sistemas informáticos se familiarizaron con los informes de la investigación de DeepMind y AlphaGo y mejoraron sus sistemas. Pocas personas quieren soportar a un recién llegado tan fuerte a la escena establecida de los programas go.

Profundo zen ir


El 1 de marzo, incluso antes del comienzo del partido AlphaGo, Li Sedol, creador de Zen Yoji Ojima y la compañía japonesa Dwango, anunciaron una colaboración para crear una versión distribuida de Deep Zen Go. Para Ojima, Zen era un proyecto de aficionados en el que no podía gastar dinero en serio. La compañía estaba lista para proporcionar equipos y un especialista en aprendizaje automático. El equipo de desarrollo también contó con la asistencia de un equipo de aprendizaje profundo de la Universidad de Tokio y el desarrollador del programa Ponanza, el sistema shogi de computadora más exitoso del mundo que supera a las personas profesionales.



El objetivo final es derrotar a AlphaGo, el término para su logro es de seis meses a un año. Según los autores del programa, AlphaGo tiene una ventaja de 500 puntos de calificación Elo debido a un mejor reconocimiento de patrones. Los creadores de Zen pensaron que podrían obtener 400 puntos mejorando el reconocimiento de patrones y 200 de otras modificaciones. Sin embargo, estas estimaciones se dieron antes del partido con Li Sedol, solo de acuerdo con los juegos con Fan Hui.

El trabajo ha comenzado. El proyecto cuenta desde el 1 de marzo de este año desde la rama de la undécima versión del programa. En la duodécima versión, aparecen los primeros desarrollos en el aprendizaje automático. En la versión 12.2, se integró una red neuronal de valor. En septiembre, el aprendizaje automático aparece en la versión 12.4. Según los desarrolladores, su objetivo no era hacer una copia de AlphaGo, pero se tuvieron en cuenta los desarrollos del artículo en Nature.

El rendimiento real de Zen no es solo informes del equipo de desarrollo. El sistema se puede "tocar" en el servidor KGS para juegos en línea, donde diferentes versiones de Zen han estado jugando blitz durante 15 segundos durante algunos años. Desde marzo, ha habido un aumento gradual en la calificación de los bots Zen. Primero, Zen19 apareció entre los cientos de los mejores , la próxima versión de Zen19X se incluyó en los 50 mejores jugadores debido a sus redes neuronales, Zen19A rompió los veinte.

Zen19K y recibe el octavo dan en el servidor KGS: esta versión tiene una red neuronal de valor. Físicamente, este reproductor parece un servidor Kurisu con dos procesadores Intel Xeon de cuatro núcleos E5-2623 v3y cuatro aceleradores de video Nvidia GTX Titan X (Maxwell). Esta versión ya compite con profesionales. Por ejemplo, el 30 de agosto, el profesional ruso y campeón europeo múltiple Ilya Shikshin perdió ante el bot y 31 ganaron .

La última versión del bot Zen19K2 por primera vez alcanzó el noveno dan en el servidor y alcanzó la primera línea de la clasificación. Vale la pena señalar que este servidor es más popular en Europa y América, los profesionales asiáticos lo usan muy raramente.


Gráfico de crecimiento de calificación de bot Zen19K2 del 8 de septiembre al 15 de noviembre de 2016.

Duelo con el hombre


El zen muestra avances en partidos oficiales contra personas. A finales de marzo de 2016, Zen se convirtió en el ganador de la novena copa de computadoras celebrada por la Universidad Japonesa de Electrocomunicaciones. Esta competencia es considerada el campeonato mundial entre los programas de computadora para el juego de go. Jugaron todos los programas más fuertes, excepto AlphaGo, probablemente, Google decidió que no tenían nada que probar aquí. Como ganador del torneo, el programa Zen compitió en 3 piedras de handicap con el japonés Kobayashi Koichi (noveno dan profesional) y ganó.

27 de julio como parte del Campeonato de Europacelebrado este año en San Petersburgo, el sistema Zen con 2 piedras de handicap jugó contra Cho Heyang (9 dan profesionales), una de las profesionales más fuertes. El zen resultó ser más fuerte nuevamente. El programa llegó gradualmente al juego en igualdad de condiciones con las personas.

Para contarle al mundo sobre AlphaGo, DeepMind mantuvo un encuentro con la persona profesional más experimentada y titulada de las que estaban disponibles geográficamente. Aquí llega un momento similar: según los desarrolladores , el sistema ha alcanzado el nivel AlphaGo de un partido con Fan Hui. Hace unos días , se eligió un nuevo rival para Deep Zen Go .


De izquierda a derecha: uno de los desarrolladores de Zen es Kato Hideki y Cho Chikun.

Cho Tikun - El maestro del noveno profesional de 60 años es de Japón, uno de los más fuertes del mundo de los años 80 y 90. Durante su carrera, ha ganado más de cien torneos importantes. Tres juegos contra él se llevarán a cabo los días 19, 20 y 23 de noviembre. Estos serán tres juegos con puntos de compensación japoneses de 6.5 Komi para el juego blanco, con un estándar para una gran fiesta que dura dos horas y late 3 × 60 segundos.

Un servidor potente con disipación de calor en un par de caballos de fuerza actuará contra una persona: dos procesadores Intel Xeon E5-2699v4 de 22 núcleos , 4 Nvidia Titan X  (esta vez el último Pascal), 128 GB de RAM, unidades de estado sólido de 128 GB (sistema) y dos a 480 GB.

Curiosamente, Lee Sedola derrotó a AlphaGo, que se ejecutó en Google Cloud Platform en 1920 núcleos de procesador y 280 aceleradores de video. Según un artículo en Nature, una versión no asignada pierde una versión distribuida en el 77% de los casos. Pero según el informe de DeepMind, la versión regular y no asignada de AlphaGo tampoco es tan débil. El gráfico de la derecha compara el rendimiento de AlphaGo en una sola máquina y en una forma distribuida en un grupo de servidores múltiples.



Los juegos se transmitirán en línea con comentarios en japonés. No está claro si los comentarios oficiales estarán en inglés.

Sábado 19 de noviembre. Inicio de la transmisión: 06:30 hora de Moscú (12:30 en la zona horaria japonesa). Inicio del juego: 07:00 hora de Moscú (13:00 JST). El juego primero .
Domingo 20 de noviembre, a la misma hora.El segundo juego .
23 de noviembre, miércoles, a la misma hora. El tercer juego .

Como puede ver, los tres juegos tienen lugar el fin de semana oficial. 23 de noviembre en Japón, rico en días festivos, pero pobre en días festivos y días festivos, Japón - Día de Acción de Gracias .



En unos días, se determinará el resultado del partido con Tikun. La fuerza de un jugador humano se puede predecir y predecir. Pero poco se sabe sobre AlphaGo: no hemos visto un solo partido público desde marzo. No se sabe cuán profundamente comenzó a jugar el desarrollo de DeepMind durante este tiempo. Deep Zen Go continúa mejorando: los desarrolladores esperan que su programa alcance pronto el nivel AlphaGo de marzo de 2016.

Para un gigante tecnológico integral, no es permisible otorgar a los laureles la primacía de la IA en una sola dirección simbólica. Sin embargo, Google tiene más recursos. Pero no pierdas la esperanza de que el nuevo desarrollo asiático podrá vencer a AlphaGo en un partido oficial si las partes programan un duelo. Sin embargo, para empezar, el programa necesita aprender a derrotar a las personas.

El autor agradece al grupo go_secrets su ayuda para escribir este artículo .

Source: https://habr.com/ru/post/es399127/


All Articles