Gewinnen und gewinnen: AI gewinnt das Pokerturnier gegen vier Profis



Die künstliche Intelligenz (ihre schwache Form), die von Vertretern der Carnegie Mellon University School of Informatics entwickelt wurde, übertraf vier professionelle Pokerspieler. Dies ist ein Texas Hold'em-Turnier im Rivers Casino in Pittsburgh. Dies ist eine der beliebtesten Arten von Poker. Während des Turniers wurden ungefähr 120.000 Hände gespielt. AI nahm die Bank mit 1,7 Millionen Dollar.

Die Autoren des Programms sind Thomas Sandholm und Noam Brown. Laut den Entwicklern ist Poker ein Spiel, dessen Teilnehmer nicht wissen, welche Karten alle anderen haben. Aus diesem Grund ist es äußerst schwierig, etwas zu berechnen. Jimmy Chu, einer der Teilnehmer des Turniers, beklagte sich darüber, dass er und seine Kollegen die Fähigkeiten von Libratus unterschätzt hätten: „Der Bot hat jeden Tag besser gespielt. Er scheint eine geschicktere Version von uns zu sein. “

Das fragliche Turnier hieß " Brains vs. Artificial Intelligence: Upping the Ante ". Es begann am 11. Januar. Es waren fünf Teilnehmer. Einer von ihnen ist der Libratus-Bot. Die anderen vier sind Jimmy Choo, Dong Kim, Jason Les und Daniel McAulay. Die Gesamtdauer des Turniers betrug 20 Tage. Alle vier Personen gelten als die besten Spieler dieser Art von Poker der Welt.

Laut den Entwicklern ist der Gewinn ihres Pokerprogramms eine der größten Errungenschaften auf dem Gebiet der künstlichen Intelligenz.


Leider legen die Autoren des Libratus-Systems die Merkmale seiner Arbeit nicht offen. Das Funktionsprinzip des Algorithmus ist nur allgemein bekannt. In naher Zukunft werden technische Details jedoch in einer Veröffentlichung in einer von Experten begutachteten wissenschaftlichen Zeitschrift veröffentlicht.

Die Entwickler behaupten, dass Libratus aus drei Teilen besteht. Dies ist der Hauptkern, ein System, das die Fehler der Rivalen verfolgt, und der Teil, der die Schwächen seiner selbst verfolgt. Während des Spiels trug der dritte Teil dazu bei, die Fähigkeiten des Programms sowie die Arbeit der ersten beiden Teile zu verbessern. Libratus hat gelernt, Bluffs von Gegnern zu bluffen und zu erkennen. Die Gesamtberechnungszeit betrug ungefähr 15 Millionen Kernstunden.

Das Interessanteste ist, dass die Libratus-Algorithmen nicht speziell für Poker oder andere Spiele "geschärft" werden. Das Programm sollte unter Verwendung interner Ressourcen einen eigenen Spielstil entwickeln. Und diese Arbeit basierte auf den Informationen, die ursprünglich von den Entwicklern bereitgestellt wurden - den Regeln des Pokers.

Für das Preisgeld erhalten die Turnierteilnehmer 200.000 US-Dollar - dieser Betrag wird gemäß den erhaltenen Ergebnissen auf alle menschlichen Spieler aufgeteilt. Entwickler werden kein Geld nach Hause bringen. All dies wurde im Voraus vereinbart, und die Hauptsache für die Wissenschaftler, die das System entwickelt haben, ist der Nachweis seiner Wirksamkeit. Laut Mitarbeitern von Carnegie Mellon können Libratus-Funktionen für die Cybersicherheit, in Verhandlungen und für militärische Zwecke eingesetzt werden.



Im Allgemeinen schlägt künstliche Intelligenz jedes Jahr eine Person alle neuen Spiele, die zuvor für einen Computer als unzugänglich angesehen wurden. Anfangs waren dies Dame, dann - Schach, Videospiele, Go and Now - Poker. Darüber hinaus ist es interessant, dass in allen vorherigen Fällen alle Teilnehmer vollständige Informationen über den Spielverlauf haben - Sie können das Spielfeld und alle Chips / Figuren sehen. Im letzteren Fall sind die Informationen nicht vollständig, Poker unterscheidet sich in dieser Hinsicht.

AI hatte zuvor Poker gespielt, aber es gelang ihnen, nur in der einfachsten Version des Spiels zu gewinnen - im Limit Hold'em mit einem begrenzten Schritt zur Erhöhung der Raten. Aber beim unbegrenzten Poker ist alles viel komplizierter. Hier müssen Sie sowohl anhand von Informationen zu Ihren eigenen Karten als auch anhand von Daten zu den Aktionen des Gegners handeln. Darüber hinaus können Gegner bluffen, was die Aufgabe weiter erschwert.

In Unlimited Hold'em zeigt eine andere Softwareplattform - DeepStack - ebenfalls hervorragende Ergebnisse. Es wurde an der University of Alberta entwickelt und Mitarbeiter der Universität, einer speziellen Forschungsgruppe, haben seit den 90er Jahren des letzten Jahrhunderts Poker-Bots erstellt. Der erste hier erstellte Bot war Loki im Jahr 1997. Dann gab es Poki (1999), PsOpti / Sparbot (2002), Vexbot (2003), Hyperborean (2006), Polaris (2007), Hyperborean No-Limit (2007), Hyperborean Ring (2009), Cepheus (2015) und schließlich , Krone der Schöpfung - DeepStack.

Über die technischen Möglichkeiten dieses Programms ist ziemlich viel bekannt, da die Entwickler Anfang Januar dieses Jahres Informationen darüber veröffentlicht haben . DeepStack verwendet das Nash-Gleichgewicht. Dies ist der Name einer Reihe verschiedener Strategien, bei denen kein Spieler im Falle einer Änderung der Strategie seinen Gewinn erhöhen kann, wenn andere Teilnehmer des Spiels ihre Strategien nicht ändern. Außerdem wirkt DeepStack Versuchen entgegen, seine eigene Strategie von anderen Spielern anzuwenden.

Source: https://habr.com/ru/post/de401137/


All Articles