
L'intelligence artificielle (sa forme faible), développée par des représentants de la Carnegie Mellon University School of Informatics, a surpassé quatre joueurs de poker professionnels. Il s'agit d'un
tournoi de Texas Hold'em au Rivers Casino de Pittsburgh. C'est l'un des types de poker les plus populaires. Pendant le tournoi, environ 120 000 mains ont été jouées. AI a pris la banque à 1,7 million de dollars.
Les auteurs du programme sont Thomas Sandholm et Noam Brown. Selon les développeurs, le poker est un jeu dont les participants ne savent pas quelles cartes tout le monde a. Pour cette raison, calculer quelque chose est extrêmement difficile. Jimmy Chu, l'un des participants au tournoi, s'est plaint que lui et ses collègues aient sous-estimé les capacités de Libratus: «Le bot jouait mieux chaque jour. Il semble être une version plus habile de la nôtre. »
Le tournoi en question s'appelait "
Cerveau contre intelligence artificielle: monter la barre ". Cela a commencé le 11 janvier. Il y avait cinq participants. L'un d'eux est le bot Libratus. Les quatre autres sont Jimmy Choo, Dong Kim, Jason Les et Daniel McAulay. La durée totale du tournoi était de 20 jours. Les quatre personnes sont considérées comme les meilleurs joueurs de ce type de poker au monde.
Selon les développeurs, gagner leur programme de poker est l'une des plus grandes réalisations dans le domaine de l'intelligence artificielle.
Malheureusement, les auteurs du système Libratus ne dévoilent pas les caractéristiques de son travail. Le principe de fonctionnement de l'algorithme n'est connu qu'en termes généraux. Néanmoins, dans un avenir proche, les détails techniques seront divulgués dans une publication dans une revue scientifique à comité de lecture.
Les développeurs affirment que Libratus se compose de trois parties. C'est le noyau principal, un système qui suit les erreurs commises par les rivaux et la partie qui suit les faiblesses de lui-même. Pendant le jeu, la troisième partie a contribué à améliorer la capacité du programme, ainsi qu'à améliorer le travail des deux premières parties. Libratus a appris à bluffer et à reconnaître les bluffs des adversaires. Le temps de calcul total était d'environ 15 millions d'heures de base.
La chose la plus intéressante est que les algorithmes Libratus ne sont pas "affûtés" spécifiquement pour le poker ou tout autre jeu. Le programme devrait, en utilisant des ressources internes, développer son propre style de jeu. Et ce travail était basé sur les informations initialement fournies par les développeurs - les règles du poker.
Quant au prix en argent, les participants au tournoi
recevront 200 000 $ - ce montant sera réparti entre tous les joueurs humains en fonction des résultats qu'ils ont reçus. Les développeurs ne rapporteront pas d'argent à la maison. Tout cela a été convenu à l'avance, et l'essentiel pour les scientifiques qui ont créé le système est la preuve de son efficacité. Selon le personnel de
Carnegie Mellon , les capacités de Libratus peuvent être utilisées pour la cybersécurité, dans les négociations et à des fins militaires.

En général, l'intelligence artificielle bat chaque année tous les nouveaux jeux qui étaient auparavant considérés comme inaccessibles à un ordinateur. Au départ, il s'agissait de dames, puis - d'échecs, de jeux vidéo, allez et maintenant - de poker. De plus, il est intéressant de noter que dans tous les cas précédents, tous les participants disposent d'informations complètes sur le déroulement du jeu - vous pouvez voir le terrain de jeu et tous les jetons / chiffres. Dans ce dernier cas, les informations ne sont pas complètes, le poker se démarque à cet égard.
AI avait auparavant joué au poker, mais ils n'ont réussi à gagner que dans la version la plus simple du jeu - en limit hold'em avec une étape limitée d'augmentation des taux. Mais dans le poker illimité, tout est beaucoup plus compliqué. Ici, vous devez agir à la fois en fonction des informations sur vos propres cartes et des données sur les actions de l'adversaire. De plus, les adversaires peuvent bluffer, ce qui complique encore la tâche.
En Hold'em illimité,
une autre plate-forme logicielle - DeepStack - affiche
également d' excellents résultats. Il a été développé à l'Université de l'Alberta et les employés de l'université, un groupe de recherche spécial, créent des robots de poker depuis les années 90 du siècle dernier. Le premier bot créé ici était Loki en 1997. Ensuite, il y avait Poki (1999), PsOpti / Sparbot (2002), Vexbot (2003), Hyperborean (2006), Polaris (2007), Hyperborean No-Limit (2007), Hyperborean Ring (2009), Cepheus (2015) et enfin , couronne de création - DeepStack.
On en sait beaucoup sur les capacités techniques de ce programme, car les développeurs ont
publié des informations à ce sujet au début de janvier de cette année. DeepStack utilise l'équilibre de Nash. C'est le nom d'un ensemble de stratégies différentes, dans lesquelles aucun joueur ne peut augmenter ses gains en cas de changement de stratégie si les autres participants au jeu ne changent pas de stratégie. De plus, DeepStack contrecarre les tentatives d'utilisation de sa propre stratégie par d'autres joueurs.