Bot de póker estratégico Libratus adaptado para simulaciones militares

En 2017, el robot de póker Libratus llegó a los titulares cuando venció a cuatro profesionales en hold'em ilimitado a una distancia de 120,000 manos. Ahora la tecnología ha sido adaptada para uso militar .

Los desarrolladores de sistemas de IA débiles a menudo comparan la efectividad de sus programas en la confrontación de juegos contra humanos. En los juegos con información completa en cualquier momento durante el juego, todos los jugadores tienen información completa sobre el estado del juego, es decir, sobre la posición y todos los movimientos posibles de cualquiera de los jugadores. A diferencia de tales situaciones deterministas, en juegos con información incompleta, parte de la información sobre el estado del juego está oculta para el jugador, por ejemplo, la tarjeta del oponente. No limit hold'em es solo uno de estos juegos. Además de las cartas cerradas del oponente, aquí se agrega un elemento de incertidumbre debido al tamaño arbitrario de cada apuesta. Con esto en mente, el número de posibles resultados se estima en 10161 . El desarrollo de una estrategia óptima frente a la incertidumbre, teniendo en cuenta las tácticas del oponente, es exactamente lo que necesitan los militares.

Libratus ("equilibrado" del idioma latino) fue creado por investigadores de la Universidad Carnegie Mellon para probar las ideas de la toma de decisiones automatizada basada en la teoría de juegos. A principios del año pasado, después de una victoria aplastante sobre los profesionales, el autor principal del programa, el profesor Tuomas Sandholm, fundó una startup llamada Strategy Robot para adaptar la tecnología de juego para que la use el gobierno. Por ejemplo, en juegos de guerra y simulaciones para estudiar la estrategia y planificación militar. A fines de agosto, según los registros públicos, la compañía celebró un contrato de dos años con el Ejército de los EE. UU. Por hasta $ 10 millones. La Unidad de Innovación de Defensa, que formó el Pentágono en 2015, financió la introducción de nuevos fondos tecnología


Estrategia de libratus en varias etapas de distribución. Según los resultados de la distribución, se especifica el modelo del juego contra un oponente específico.

Libratus se basa en la teoría de juegos algorítmica (computacional). En cara a cara con profesionales, el bot ganó más de 1.8 millones de dólares convencionales: durante el torneo desarrolló estrategias de apuestas poderosas e incluso demostró la posibilidad de farolear.

Sandholm confía en que este enfoque es aplicable a muchos otros juegos, así como a las simulaciones militares. Hoy en día, los ejercicios de juegos militares generalmente prueban solo un pequeño número de estrategias para oponentes imaginarios: "Esto abre muchas oportunidades para la explotación, porque un oponente real puede no jugar de acuerdo con sus suposiciones " , dice el profesor.

Sandholm se niega a discutir los detalles de los proyectos de Strategy Robot, aunque la empresa ha firmado al menos otro contrato gubernamental. Él dice que el programa ayuda en las tareas de simulación, que incluyen la toma de decisiones en un espacio físico simulado, por ejemplo, dónde colocar unidades militares.

La técnica de póker Libratus sugiere que el bot estratégico podría dar al ejército algunas recomendaciones sorprendentes. Los jugadores profesionales que se opusieron al bot, durante el torneo, se sorprendieron al descubrir que inesperadamente cambia de tácticas estrictas a hiperaggresivas, por lo que sus acciones son casi imposibles de predecir, pero todas las acciones del bot están estrictamente destinadas a ganar. "Esto es extraño porque no hay impresión de que juegue mejor que tú, pero luego miras el marcador y entiendes lo que sucedió", dice Sandholm.

Según los expertos, tales tecnologías pueden hacer que los juegos de guerra y las simulaciones sean más útiles, aunque los resultados seguirán siendo solo uno de los componentes de la planificación estratégica. El mundo real es mucho más complicado y confuso que los escenarios que son capaces de dominar incluso las mejores tecnologías de inteligencia artificial.

El bot estratégico Libratus no es el único intento del Pentágono de aplicar la teoría de juegos moderna y la IA débil en los asuntos militares. La agencia de investigación DARPA ha lanzado un programa especial llamado "Interacción consistente en juegos con información incompleta sobre la adopción de decisiones militares complejas (SI3-CMD)" . Michael Wellman, profesor de la Universidad de Michigan, dice que el ejemplo de Libratus muestra: la tecnología está casi madura para el uso en el mundo real: "El avance en el póker fue simplemente asombroso, y las cosas van rápido con otros juegos. Es hora de probarlo en más áreas de la vida real ”, dijo.

Además de Strategy Robot, el profesor Sandholm fundó otra startup estratégica de máquinas, donde adapta un bot estratégico para tareas comerciales como mercados de electricidad, deportes y juegos de computadora.

Las tecnologías de IA son de interés para los militares no solo en los Estados Unidos, sino también en Rusia y China , escribe Wired . El profesor Sandholm no comparte preocupaciones sobre esto. Él cree que la IA "hará que el mundo sea mucho más seguro".

Source: https://habr.com/ru/post/436958/


All Articles