Intelligence artificielle Microsoft maîtrise le mahjong



Des scientifiques de Microsoft Research (MSR) Asia ont créé un système d'intelligence artificielle (IA) qui a appris les subtilités du mahjong. Mahjong est considéré comme l'un des jeux les plus difficiles en termes d'algorithmes de maîtrise, comme il y a un facteur aléatoire.

Super Phoenix (Suphx) a été le premier système d'intelligence artificielle à recevoir le 10e dan (rang) sur Tenhou , une plateforme de compétition de mahjong riichi en ligne avec plus de 300 000 participants du monde entier. Seulement 180 personnes ont de telles qualifications. C'est la décharge maximale de l'algorithme pour le moment, seuls quelques professionnels reconnus jouent à un niveau supérieur.

Pour créer le système, l'apprentissage par renforcement profond a été utilisé - un principe complet d'algorithmes d'apprentissage basés sur une combinaison d'apprentissage profond et d'apprentissage par renforcement. Suphx a maîtrisé les subtilités du mahjong en participant à 5 000 matchs en 4 mois. Le système a progressivement augmenté la qualité et la vitesse du jeu. Maintenant, l'algorithme a sa propre stratégie, qui comprend des mouvements délibérément faibles, ce qui vous permet finalement d'obtenir un plus grand avantage.

Contrairement aux échecs et au go, dans lesquels l'IA a déjà fait des progrès importants, le mahjong est un jeu aux informations incomplètes. Tous les facteurs ne sont pas connus des participants, par exemple, il est impossible de voir des images sur les phalanges de l'adversaire. Le processus de jeu ressemble au poker - les participants ont besoin d'une bonne mémoire, d'une bonne observation, d'une réflexion stratégique et de la capacité de bluffer.

Selon les scientifiques de MSR, la présence d'un facteur aléatoire dans le mahjong est un défi unique pour les systèmes d'IA, et l'expérience acquise dans l'enseignement d'algorithmes aux problèmes non linéaires peut trouver son application dans des situations réelles impliquant un ensemble de facteurs inconnus.
Microsoft Research et Maluuba ont précédemment formé l' intelligence artificielle chez Mme Pac-Man, sorti pour l'une des premières consoles de salon Atari 2600. L'algorithme a battu le record du monde avec 999 990 points, tandis que le meilleur résultat pour une personne était de 266 360 points.

Source: https://habr.com/ru/post/fr469071/


All Articles