
La inteligencia artificial (su forma débil), desarrollada por representantes de la Escuela de Informática de la Universidad Carnegie Mellon, superó a cuatro jugadores profesionales de póker. Este es un
torneo de Texas Hold'em en el Rivers Casino en Pittsburgh. Este es uno de los tipos de póker más populares. Durante el torneo, se jugaron unas 120 mil manos. AI tomó el banco en $ 1.7 millones.
Los autores del programa son Thomas Sandholm y Noam Brown. Según los desarrolladores, el póker es un juego cuyos participantes no saben qué cartas tienen los demás. Por esta razón, calcular algo es extremadamente difícil. Jimmy Chu, uno de los participantes en el torneo, se quejó de que él y sus colegas subestimaron las capacidades de Libratus: “El robot jugaba mejor todos los días. Parece ser una versión más hábil de la nuestra ".
El torneo en cuestión se llamó "
Cerebros vs. Inteligencia artificial: subiendo la apuesta ". Comenzó el 11 de enero. Hubo cinco participantes. Uno de ellos es el bot Libratus. Los otros cuatro son Jimmy Choo, Dong Kim, Jason Les y Daniel McAulay. La duración total del torneo fue de 20 días. Las cuatro personas son consideradas los mejores jugadores en este tipo de póker del mundo.
Según los desarrolladores, ganar su programa de póker es uno de los mayores logros en el campo de la inteligencia artificial.
Desafortunadamente, los autores del sistema Libratus no revelan las características de su trabajo. El principio de funcionamiento del algoritmo se conoce solo en términos generales. Sin embargo, en un futuro próximo, los detalles técnicos se divulgarán en una publicación en una revista científica revisada por pares.
Los desarrolladores afirman que Libratus consta de tres partes. Este es el núcleo principal, un sistema que rastrea los errores cometidos por los rivales y la parte que rastrea las debilidades de sí mismo. Durante el juego, la tercera parte ayudó a mejorar la capacidad del programa, así como a mejorar el trabajo de las dos primeras partes. Libratus ha aprendido a farolear y reconocer faroles de los oponentes. El tiempo total de cálculo fue de aproximadamente 15 millones de horas centrales.
Lo más interesante es que los algoritmos de Libratus no están "afilados" específicamente para el póker o cualquier otro juego. El programa debe, utilizando recursos internos, desarrollar su propio estilo de juego. Y este trabajo se basó en la información inicialmente proporcionada por los desarrolladores: las reglas del póker.
En cuanto al dinero del premio, los participantes del torneo
obtendrán $ 200,000 ; esta cantidad se dividirá entre todos los jugadores humanos de acuerdo con los resultados que recibieron. Los desarrolladores no traerán dinero a casa. Todo esto se acordó de antemano, y lo principal para los científicos que crearon el sistema es la prueba de su efectividad. Según el personal de
Carnegie Mellon , las capacidades de Libratus se pueden usar para la seguridad cibernética, en las negociaciones y con fines militares.

En general, cada año la inteligencia artificial supera a una persona en todos los juegos nuevos que antes se consideraban inaccesibles para una computadora. Inicialmente, eran damas, luego - ajedrez, videojuegos, go y ahora - póker. Además, es interesante que en todos los casos anteriores todos los participantes tengan información completa sobre el progreso del juego: el campo de juego y todas las fichas / figuras son visibles. En el último caso, la información no está completa, el póker a este respecto se distingue.
AI había jugado anteriormente al póker, pero lograron ganar solo en la versión más simple del juego, en limit hold'em con un paso limitado de aumento de las tasas. Pero en el póker ilimitado, todo es mucho más complicado. Aquí debes actuar tanto en base a la información sobre tus propias cartas como a los datos sobre las acciones del oponente. Además, los oponentes pueden farolear, lo que complica aún más la tarea.
En Hold'em ilimitado,
otra plataforma de software, DeepStack, también muestra excelentes resultados. Fue desarrollado en la Universidad de Alberta, y los empleados de la universidad, un grupo especial de investigación, han estado creando bots de póker desde los años 90 del siglo pasado. El primer bot creado aquí fue Loki en 1997. Luego estaban Poki (1999), PsOpti / Sparbot (2002), Vexbot (2003), Hyperborean (2006), Polaris (2007), Hyperborean No-Limit (2007), Hyperborean Ring (2009), Cepheus (2015), y finalmente , corona de la creación - DeepStack.
Se sabe bastante sobre las capacidades técnicas de este programa, ya que los desarrolladores
publicaron información al respecto a principios de enero de este año. DeepStack utiliza el equilibrio de Nash. Este es el nombre de un conjunto de estrategias diferentes, en el que ningún jugador puede aumentar sus ganancias en caso de un cambio en la estrategia, si otros participantes en el juego no cambian las estrategias. Además, DeepStack contrarresta los intentos de usar su propia estrategia por parte de otros jugadores.