Künstliche Intelligenz Microsoft beherrschte Mahjong



Wissenschaftler von Microsoft Research (MSR) Asia haben ein System für künstliche Intelligenz (KI) entwickelt, das die Feinheiten von Mahjong gelernt hat. Mahjong gilt als eines der schwierigsten Spiele in Bezug auf Mastering-Algorithmen Es gibt einen zufälligen Faktor.

Super Phoenix (Suphx) war das erste KI-System, das auf Tenhou , einer Online- Riichi- Mahjong-Wettbewerbsplattform mit über 300.000 Teilnehmern aus der ganzen Welt, den 10. Dan (Rang) erhielt. Nur 180 Personen haben solche Qualifikationen. Dies ist die maximale Entladung für den Algorithmus im Moment, nur wenige anerkannte Profis spielen auf einem höheren Level.

Zur Schaffung des Systems wurde das Deep-Reinforcement-Lernen verwendet - ein umfassendes Prinzip von Lernalgorithmen, das auf einer Kombination aus Deep-Learning und Reinforcement-Lernen basiert. Suphx hat die Feinheiten von Mahjong gemeistert, indem er in 4 Monaten an 5.000 Spielen teilgenommen hat. Das System erhöhte schrittweise die Qualität und Geschwindigkeit des Spiels. Jetzt hat der Algorithmus eine eigene Strategie, die bewusst schwache Bewegungen beinhaltet, um am Ende einen größeren Vorteil zu erzielen.

Im Gegensatz zu Schach und Los, bei dem die KI bereits erhebliche Fortschritte erzielt hat, ist Mahjong ein Spiel mit unvollständigen Informationen. Den Teilnehmern sind nicht alle Faktoren bekannt, zum Beispiel ist es unmöglich, Bilder auf den Knöcheln des Gegners zu sehen. Der Spielprozess ähnelt Poker - die Teilnehmer brauchen ein gutes Gedächtnis, Beobachtung, strategisches Denken und die Fähigkeit zu bluffen.

Laut Wissenschaftlern von MSR ist das Vorhandensein eines Zufallsfaktors in Mahjong eine einzigartige Herausforderung für KI-Systeme, und die Erfahrungen beim Unterrichten von Algorithmen für nichtlineare Probleme können in realen Situationen mit einer Reihe unbekannter Faktoren Anwendung finden.
Microsoft Research und Maluuba haben zuvor künstliche Intelligenz bei Frau Dr. Pac-Man, das für eine der ersten Atari 2600-Heimkonsolen veröffentlicht wurde. Der Algorithmus brach den Weltrekord mit 999.990 Punkten, während das beste Ergebnis für eine Person 266.360 Punkte betrug.

Source: https://habr.com/ru/post/de469071/


All Articles