AlphaGo gewinnt das dritte entscheidende Spiel von Lee Sedol

Der dritte Sieg der künstlichen Intelligenz in einer historischen Serie von fünf Spielen in th


Go ist ein ostasiatisches Logikspiel mit alter Geschichte und reichen kulturellen Traditionen. Es gibt verschiedene Regeln und Variationen, aber das Hauptziel ist dasselbe: Jeder der beiden Spieler muss das Gebiet der größtmöglichen Größe mit Steinen seiner eigenen Farbe umzäunen. Forscher der künstlichen Intelligenz sind von Komplexität angezogen. Es ist zu spät, um Schach zu erobern - Computer spielen seit einigen Jahren besser als Menschen. Aber in go ist die Anzahl der möglichen Positionen viel höher (10 100 ) als im Schach. Moderne Programme spielen gut, aber auf der Ebene der Go-Liebhaber. Bevor Sie ein System erstellen, das die besten Leute schlagen kann, bestenfalls ein Jahrzehnt.

So sagten Experten vor dem Aufkommen von AlphaGo. Die Entwicklung von DeepMind (2014 wurde das Unternehmen von Google gekauft) basiert auf der Monte-Carlo-Methode. Die besten modernen Computersysteme verwenden diese Technologie. Bei AlphaGo helfen Bewegungen aber auch bei der Auswahl neuronaler Netze aus Politik und Werten. Sie können als nahe Verwandte neuronaler Netze bezeichnet werden, die Bilder und Sprache erkennen. Dem System wurde erstmals beigebracht, 160.000 Spiele vom KGS-Server aus zu spielen. Dann trainierte AlphaGo in Spielen gegen sich.

Zum ersten Mal erregte diese KI-Probe im Januar Aufmerksamkeit. Dann veröffentlichte Google ein wissenschaftliches Papier über AlphaGo, in dem das Spiel im Oktober 2015 erwähnt wurde. Der dreifache Europameister Fan Hui verlor die neue Entwicklung in fünf von fünf Spielen.

Es wird angenommen, dass das europäische Go-Niveau in Asien niedriger ist als in der Heimat des Spiels. Die individuellen Bewegungen und Fehler von Hui warfen Fragen auf. Daher freuten sich Go-Spieler und KI-Enthusiasten auf das AlphaGo Seoul-Spiel gegen einen der besten Vertreter des Personenteams - den Besitzer des neunten Profis Dan Lee Sedol .

Bis März lautete die Frage wie folgt: Hat AlphaGo eine Chance gegen Lee Sedola ? Aber Sedol verlor sowohl den ersten als auch den zweitenParty. Wenn nach dem ersten Spiel Master neunten gegeben zeigte Optimismus nach dem zweiten er links in Unordnung. Sedoll gab an, dass er die Momente, in denen er das Spiel spielte, nicht gesehen habe.

Heute war die dritte Rate. Das Spiel wurde von dem ehemaligen Google-CEO Eric Schmidt, einem der wichtigsten Ingenieure des Unternehmens, Jeff Dean, und Sergey Brin besucht, die neulich in Seoul ankamen. Die Eroberung von go symbolisiert offensichtlich die Bedeutung von Technologien für maschinelles Lernen, die das Herz von Google bilden. Von links nach rechts: DeepMind-Gründer Demis Hassabis, neunter professioneller Dan-Besitzer Lee Sedol, Google-Mitbegründer Sergey Brin.




Wie im ersten Spiel wurde Sedol schwarz, das heißt im ersten. Auch die Bekanntschaft mit dem System könnte zu den guten Punkten gehören - DeepMind-Ingenieure haben kaum die Ressourcen, um in den Tagen des Spiels etwas zu ändern. Zumindest behauptet das Gerücht , dass Sedoll und ein Team von Go-Experten die Nacht damit verbracht haben, nach AlphaGo-Schwächen zu suchen. Die ersten Schritte von Schwarz waren aggressiv. Es scheint, dass Sedol versucht hat, das Spiel in eine andere Richtung zu lenken und Druck auf die Schwachstellen des Systems auszuüben.


Videoübertragung der dritten Folge des Spiels AlphaGo - Lee Sedol.

Während des Spiels demonstrierte die KI die Fähigkeit, mit schwierigen Momenten in Form von Ko-Positionen zu arbeiten. Es wird angenommen, dass Computer-Go-Systeme mit Ko schlecht umgehen. Am Ende des dritten Spiels hatte Schwarz keine Zeit mehr, so dass der Mann eine Minute über die Bewegungen nachdenken musste.

Nach 176 Zügen endete das Spiel mit dem Sieg des AlphaGo-Systems. AI hatte noch 8 Minuten und 31 Sekunden auf der Uhr.



Dies ist der dritte AlphaGo-Sieg in Folge in der Serie. Das Gesamtergebnis der historischen Serie von fünf Spielen wird ermittelt. Das Schicksal der finanziellen Belohnung wurde bestimmt - es ist offensichtlich, dass er jetzt für wohltätige Zwecke und zur Entwicklung von go gehen wird, wie es im Falle der Niederlage einer Person beabsichtigt war. Die letzten beiden Spiele am Sonntag und Dienstag werden die Tiefe der Demonstration der Vorteile von AlphaGo bestimmen - trotz des klaren Abschlusses der Serie wird es weiterhin gespielt.


Im März letzten Jahres schlug das System den zweiten professionellen Dan-Spieler, heute umgeht es etwa den neunten Dan. Vielleicht hat dies dazu beigetragen, dass das AlphaGo-System in den letzten fünf Monaten in Spielen gegen sich selbst trainiert hat. Laut dem Leiter von DeepMind Demis Hassabis verwendet die aktuelle Konfiguration ungefähr die gleiche Menge an Hardwareressourcen wie die Option, die Fan Hui übertrifft. Hassabis sagt , dass die wichtigsten Algorithmen, sondern als „Hardware“.

Das letzte, fünfte Spiel findet am Dienstag statt. Dann werden die Ergebnisse des Kampfes von Tausenden von Jahren menschlichen Spiels in der zweijährigen Entwicklung, der auf einem Cluster von mehreren Dutzend kommerziell erhältlichen Serverprozessoren von Grafikbeschleunigern gestartet wurde, zusammengefasst.

Nützliche Materialien zum Thema:

Source: https://habr.com/ru/post/de391513/


All Articles