
En 2017, le bot de poker Libratus a défrayé la chronique en
battant quatre professionnels en Hold'em illimité à une distance de 120000 mains. Maintenant, la technologie a été
adaptée à un usage militaire .
Les développeurs de systèmes d'IA faibles comparent souvent l'efficacité de leurs programmes dans la confrontation du jeu contre les humains. Dans les jeux avec des informations complètes à tout moment pendant le jeu, tous les joueurs ont des informations complètes sur l'état du jeu, c'est-à-dire sur la position et tous les mouvements possibles de l'un des joueurs. Contrairement à de telles situations déterministes, dans les jeux avec des
informations incomplètes, une partie des informations sur l'état du jeu est cachée au joueur - par exemple, la carte de l'adversaire. No limit hold'em n'est qu'un de ces jeux. En plus des cartes fermées de l'adversaire, un élément d'incertitude est ajouté ici en raison de la taille arbitraire de chaque pari. Dans cette optique, le nombre de résultats possibles est estimé à 10
161 . L'élaboration d'une stratégie optimale face à l'incertitude, tenant compte des tactiques de l'adversaire, est exactement ce dont les militaires ont besoin.
Libratus ("équilibré" de la langue latine) a été créé par des chercheurs de l'Université Carnegie Mellon pour tester les idées de prise de décision automatisée basée sur la théorie des jeux. Au début de l'année dernière, après une victoire écrasante sur les professionnels, le principal auteur du programme, le professeur Tuomas Sandholm, a fondé une startup appelée Strategy Robot pour adapter la technologie de jeu à l'usage du gouvernement. Par exemple, dans des jeux de guerre et des simulations pour étudier la stratégie et la planification militaires. Fin août, selon les archives publiques, la société a conclu un contrat de deux ans avec l'armée américaine pour un montant pouvant atteindre 10 millions de dollars. Le financement a été fourni par la Defense Innovation Unit, que le Pentagone a créée en 2015 pour améliorer les contacts avec les entreprises de la Silicon Valley et introduire plus activement de nouveaux la technologie.
Stratégie de Libratus à différents stades de distribution. Sur la base des résultats de la distribution, le modèle du jeu contre un adversaire spécifique est spécifiéLibratus est construit sur la théorie des jeux algorithmique (informatique). En heads-up avec des professionnels, le bot a gagné plus de 1,8 million de dollars conventionnels: au cours du tournoi, il a développé de puissantes stratégies de paris et a même démontré la possibilité de bluffer.
Sandholm est convaincu que cette approche est applicable à de nombreux autres jeux, ainsi qu'aux simulations militaires. De nos jours, les exercices de jeu militaire ne testent généralement qu'un petit nombre de stratégies pour des adversaires imaginaires: «Cela ouvre de nombreuses possibilités d'exploitation, car un véritable adversaire peut ne pas jouer selon vos hypothèses
» ,
explique le professeur.
Sandholm refuse de discuter des détails des projets de Robot stratégique, bien que l'entreprise ait conclu au moins un autre contrat gouvernemental. Il dit que le programme aide aux tâches de simulation, qui comprennent la prise de décisions dans un espace physique simulé, par exemple, où placer les unités militaires.
La technique du poker Libratus suggère que le bot stratégique pourrait donner aux militaires des recommandations surprenantes. Les joueurs professionnels qui se sont opposés au bot, pendant le tournoi, ont été surpris de constater qu'il passe de manière inattendue de tactiques serrées à des tactiques hyperagressives, de sorte que ses actions sont presque impossibles à prévoir - mais toutes les actions du bot visent strictement à gagner. "C'est étrange car il n'y a aucune impression qu'il joue mieux que vous, mais ensuite vous regardez le score et vous comprenez ce qui s'est passé", explique Sandholm.
Selon les experts, ces technologies peuvent rendre les jeux de guerre et les simulations plus utiles, même si les résultats ne resteront qu'une des composantes de la planification stratégique. Le monde réel est beaucoup plus compliqué et déroutant que les scénarios capables de maîtriser même les meilleures technologies d'IA.
Le bot stratégique Libratus n'est pas la seule tentative du Pentagone pour appliquer la théorie du jeu moderne et l'IA faible dans les affaires militaires. L'agence de recherche DARPA a lancé un programme spécial
intitulé «Interaction cohérente dans les jeux avec des informations incomplètes concernant l'adoption de décisions militaires complexes (SI3-CMD)» . Michael Wellman, professeur à l'Université du Michigan, explique que l'exemple de Libratus le montre: la technologie est presque mûre pour une utilisation dans le monde réel: «La percée dans le poker était tout simplement stupéfiante, et les choses vont vite avec les autres jeux. Il est temps de l'essayer dans des domaines plus réels », a-t-il déclaré.
En plus de Strategy Robot, le professeur Sandholm a fondé une autre start-up de machine stratégique, où il adapte un bot stratégique pour des tâches commerciales telles que les marchés de l'électricité, les sports et les jeux informatiques.
Les technologies de l'IA intéressent l'armée non seulement aux États-Unis, mais aussi en
Russie et en
Chine , écrit
Wired . Le professeur Sandholm ne partage pas ces préoccupations. Il pense que l'IA «rendra le monde beaucoup plus sûr».