Cho Chikun und Deep Zen Go: ein weiterer Versuch, den Menschen in th zu übertreffen



27. Januar 2016 Google Deepmind Division zum ersten Mal öffentlich erklärte über den Erfolg seiner neuen Entwicklung. Das britische Unternehmen für künstliche Intelligenz, das Google 2014 gekauft hat, hat versucht, das alte asiatische Go-Spiel zu erobern. Zu Beginn dieses Jahres war der Status von go als computerunabhängiges Spiel noch unerschütterlich. Computer-Go-Systeme existierten, wurden aber auf Amateurebene gespielt. Profis verloren nur mit einem erheblichen Handicap gegen sie.

DeepMind baut AlphaGo auf einer Kombination aus Monte Carlo und künstlichen neuronalen Netzen auf. Nachdem das System erstellt, seine Parameter angepasst und die neuronalen Netze trainiert worden waren, wurde es gegen andere Computerprogramme und den menschlichen Champion getestet. AlphaGo besiegte Europameister 2013, 2014 und 2015 Fan Hui.

Go ist in Europa traditionell niedriger als zu Hause in Asien. Die Stärke des AlphaGo hat begründete Zweifel . Google kündigte jedoch sofort an, dass der nächste AlphaGo-Kampf mit dem Besitzer des 9. Profis Dan Lee Sedoll stattfinden wird, einem der besten Spieler des letzten Jahrzehnts. Im März fand eine Serie von fünf Spielen statt ... und der Mann verlor erneut mit 4: 1 . Dem Schock der künstlichen Intelligenz und der Go-Spieler folgte völliges Schweigen über zukünftige Spiele. Neue Spiele gegen AlphaGo nicht geplant .

Ein Versuch, AlphaGo zu besiegen, wird vom Team des japanischen Projekts Deep Zen Go durchgeführt, das sein System bisher lehrt, gegen Menschen zu spielen. Am 19., 20. und 23. November sind drei Spiele gegen Cho Tikun, den 9. Dan-Meister aus Japan, geplant. Eine interessante Prognose stammt von Aya Huang, einer DeepMind-Mitarbeiterin, die im März im Rahmen eines historischen Spiels Lee Sedol gegenüber saß und Steine ​​für AlphaGo auf das Brett legte. Huan glaubt, dass die neue Version von Zen mit einer Punktzahl von 3: 0 oder 2: 1 gewinnen wird.

DeepMind hat eine wirklich schwierige Aufgabe gelöst. Gemäß den Spielregeln legen zwei Gegner schwarze und weiße Steine ​​auf ein Brett einer bestimmten Größe (in professionellen Spielen - 19 × 19). Steine ​​können gefangen werden, einige Aktionen sind verboten, es gibt mehrere weitere Regeln, die von der Version des Spiels abweichen. Aber das Ziel ist immer eines: Derjenige, der ein größeres Gebiet abwehrt, gewinnt.

Für ein Computersystem ist ein äußerlich einfacher Tischspaß sehr schwierig: Die möglichen Positionen von Steinen auf einem 19 × 19-Brett sind hundert Größenordnungen höher als die Schachfiguren auf einem 8 × 8-Brett. Steine ​​nehmen nicht ab, es gibt mehr davon - Sie können keine Basis für das Ende von Partys schaffen. Aus den ersten Schritten können Sie schnell eine neue Situation ableiten, die nicht vorhersehbar ist. All dies erschwert die Schaffung leistungsfähiger Computersysteme.

Die ersten Programme, die go spielen, wurden in den 70er Jahren erstellt. Seit Anfang der 80er Jahre finden Weltmeisterschaften unter Computerprogrammen statt. Lange Zeit verloren Autos an Menschen mit einem Handicap von 9 Steinen oder mehr. Bis Anfang dieses Jahres galt die Leistung auf 4 Steinen des Handicaps als Leistung .

Die neueste Technologie ist die Holzsuche oder die Monte-Carlo-Methode, Expertensysteme mit einer Datenbank guter Bewegungen. Bei DeepMind wurden der Monte-Carlo-Methode neuronale Netze aus Politik und Werten hinzugefügt. Sie wurden mit Hilfe von 160.000 Spielen vom Server der KGS-Spieler vom sechsten bis zum neunten Dan trainiert. Dann studierte das System in Losen gegen sich selbst. Das Ergebnis ist die Niederlage des ersten Europameisters des 2. professionellen Dan, dann die Niederlage des koreanischen Meisters des 9. professionellen Dan.

Für Google ist die Bedeutung von Entwicklung nicht nur eine Lösung für ein theoretisches Problem. Dies ist ein guter Grund, stolz zu sein. An den Spielen nahmen der Mitbegründer der Suche, Sergey Brin, und andere bemerkenswerte Mitarbeiter teil. Sie alle wollten den Moment des Triumphs der Firma sehen.

In jüngster Zeit gewinnen künstliche Intelligenzsysteme in denselben neuronalen Netzen an Dynamik. Heutzutage hat fast jeder in der Tasche einen intelligenten Sprachassistenten, der Fragen in menschlicher Sprache beantworten kann: Siri, Google Assistant oder Google Now, Cortana. Unternehmen möchten Sie daran erinnern, dass dies nur die Spitze des Eisbergs ihrer KI-Erfolge ist. Zum Beispiel den Sieg von AlphaGo gegen die Besten, den Google-CEO Sundar Pichai in seiner Eröffnungsrede bei der Präsentation von Google Pixel-Smartphones im vergangenen Monat erwähnte. Eine Erinnerung an ihre entwurmtIrgendwo zwischen den Anweisungen des neuen maschinellen Übersetzungssystems Englisch ← → Chinesisch und fortgeschrittenen Algorithmen zur Bilderkennung und Spracherkennung.

Der Sieg von Google "klingelte" weit. Das Spiel fand in der südkoreanischen Hauptstadt statt und war der Grund, einen Fonds von Billionen Won (860 Millionen US-Dollar) für die Entwicklung künstlicher Intelligenzsysteme zu schaffen. Entwickler anderer Computer-Go-Systeme haben Berichte aus der DeepMind- und AlphaGo-Forschung kennengelernt und ihre Systeme verbessert. Nur wenige Menschen wollen einen so scharfen Neuling in der etablierten Szene der Go-Programme ertragen.

Deep Zen gehen


Am 1. März, noch vor dem Start des AlphaGo-Spiels, kündigten Li Sedol, der Erfinder von Zen Yoji Ojima und das japanische Unternehmen Dwango , eine Zusammenarbeit an, um eine verteilte Version von Deep Zen Go zu erstellen. Für Ojima war Zen ein Amateurprojekt, für das er kein ernsthaftes Geld ausgeben konnte. Das Unternehmen war bereit, Geräte und einen Spezialisten für maschinelles Lernen bereitzustellen. Das Entwicklungsteam wurde auch von einem Deep-Learning-Team der Universität Tokio und dem Entwickler des Ponanza-Programms unterstützt, dem weltweit erfolgreichsten Computer- Shogi- System, das professionelle Menschen übertrifft .



Das ultimative Ziel ist es, AlphaGo zu besiegen. Die Laufzeit für seine Erreichung beträgt sechs Monate bis zu einem Jahr. Laut den Autoren des Programms hat AlphaGo aufgrund der besseren Mustererkennung einen Vorteil von 500 Elo-Bewertungspunkten. Die Entwickler von Zen dachten, dass sie 400 Punkte erhalten könnten, wenn sie die Mustererkennung verbessern würden, und 200 durch andere Modifikationen. Diese Schätzungen wurden jedoch vor dem Spiel mit Li Sedol nur gemäß den Spielen mit Fan Hui gegeben.

Die Arbeit hat begonnen. Das Projekt zählt ab dem 1. März dieses Jahres aus dem Zweig der elften Version des Programms. In der zwölften Version erscheinen die ersten Entwicklungen im maschinellen Lernen. In Version 12.2 wurde ein wertneurales Netzwerk integriert. Im September erscheint maschinelles Lernen in Version 12.4. Laut den Entwicklern bestand ihr Ziel nicht darin, eine Kopie von AlphaGo zu erstellen, sondern die Entwicklungen aus dem Artikel in Nature wurden berücksichtigt.

Die wahre Leistung von Zen sind nicht nur Berichte des Entwicklungsteams. Das System kann auf dem KGS-Server für Online-Spiele "unterwegs" "berührt" werden, wo verschiedene Versionen von Zen seit einigen Jahren seit 15 Sekunden Blitz spielen. Seit März hat sich die Bewertung von Zen-Bots allmählich erhöht. Zuerst unter Hunderten des besten erschien Zen19 , die nächste Version von Zen19X eingetragen in der Top 50 auf Kosten ihre neuronale Netze, Zen19A schlug zwanzig.

Zen19K und empfängt den 8. Dan auf dem KGS-Server - diese Version hat ein wertvolles neuronales Netzwerk. Physisch sieht dieser Player aus wie ein Kurisu- Server mit zwei Quad-Core- Intel Xeon-Prozessoren E5-2623 v3und vier Videobeschleuniger Nvidia GTX Titan X (Maxwell). Diese Version konkurriert bereits mit Profis. Zum Beispiel verlor der russische Go-Profi und mehrfache Europameister Ilya Shikshin am 30. August gegen den Bot und 31 gewann .

Die neueste Version des Zen19K2-Bots erreichte zum ersten Mal den 9. Dan auf dem Server und erreichte die erste Zeile der Bewertung. Es ist erwähnenswert, dass dieser Server in Europa und Amerika populärer ist, asiatische Profis verwenden ihn sehr selten.


Wachstumstabelle für Zen19K2-Bot-Ratings vom 8. September bis 15. November 2016.

Duell mit dem Menschen


Zen zeigt Fortschritte in offiziellen Spielen gegen Menschen. Ende März 2016 wurde Zen der Gewinner des neunten Computerpokals der japanischen Universität für Elektrokommunikation. Dieser Wettbewerb gilt als Weltmeisterschaft unter den Computerprogrammen für das Go-Spiel. Sie spielten alle stärksten Programme außer AlphaGo - wahrscheinlich entschied Google, dass sie hier nichts zu beweisen hatten. Als Sieger des Turniers trat das Zen-Programm mit dem Japaner Kobayashi Koichi (9. Profi-Dan) auf 3 Handicap-Steinen an und gewann.

27. Juli im Rahmen der EuropameisterschaftIn diesem Jahr fand in St. Petersburg das Zen-System mit 2 Handicap-Steinen gegen Cho Heyang (9 professionelle Dan) statt, eine der stärksten weiblichen Profis. Zen erwies sich wieder als stärker. Das Programm kam nach und nach gleichberechtigt mit den Menschen ins Spiel.

Um der Welt von AlphaGo zu erzählen, veranstaltete DeepMind ein Match mit der erfahrensten und betiteltesten professionellen Person aus der geografisch verfügbaren Person. Hier kommt ein ähnlicher Moment: Laut Entwicklern hat das System das AlphaGo-Niveau eines Matches mit Fan Hui erreicht. Vor einigen Tagen wurde ein neuer Rivale für Deep Zen Go ausgewählt .


Von links nach rechts: Einer der Entwickler von Zen ist Kato Hideki und Cho Chikun.

Cho Tikun - Der 60-jährige Meister des 9. Profis stammt aus Japan, einem der stärksten der Welt der 80er und 90er Jahre. Während seiner Karriere hat er mehr als hundert große Turniere gewonnen. Am 19., 20. und 23. November finden drei Spiele gegen ihn statt. Dies sind drei Spiele mit japanischen 6,5 Komi-Ausgleichspunkten für das Spiel Weiß, mit einem Standard für eine große Gruppe, die zwei Stunden dauert und 3 × 60 Sekunden schlägt.

Ein leistungsstarker Server mit einer Wärmeableitung von wenigen PS wirkt gegen eine Person: zwei Intel Xeon E5-2699v4-Prozessoren mit 22 Kernen , 4 Nvidia Titan X  (diesmal der neueste Pascal), 128 GB RAM, 128 GB Solid-State-Laufwerke (System) und zwei bei 480 GB.

Interessanterweise besiegte Lee Sedola AlphaGo, das in der Google Cloud Platform auf 1920 Prozessorkernen und 280 Videobeschleunigern lief. Laut einem Artikel in Nature verliert eine nicht zugewiesene Version in 77% der Fälle eine verteilte Version. Laut dem DeepMind-Bericht ist die reguläre, nicht zugewiesene Version von AlphaGo jedoch auch nicht so schwach. Die Grafik rechts vergleicht die Leistung von AlphaGo auf einem einzelnen Computer und in einer Form, die auf mehrere Cluster verteilt ist.



Die Spiele werden online mit Kommentaren auf Japanisch gestreamt. Es ist unklar, ob die offiziellen Kommentare auf Englisch sein werden.

Samstag, 19. November. Beginn der Sendung: 06:30 Uhr Moskauer Zeit (12:30 Uhr in der japanischen Zeitzone). Spielbeginn: 07:00 Uhr Moskauer Zeit (13:00 Uhr JST). Das erste Spiel .
Sonntag, 20. November, gleiche Zeit.Das zweite Spiel .
23. November, Mittwoch, zur gleichen Zeit. Das dritte Spiel .

Wie Sie sehen, finden alle drei Spiele am offiziellen Wochenende statt. 23. November in Japan, reich an Feiertagen, aber arm an Feiertagen und Feiertagen, Japan - Erntedankfest .



In wenigen Tagen wird das Ergebnis des Spiels mit Tikun festgelegt. Die Stärke eines menschlichen Spielers kann vorhergesagt und vorhergesagt werden. Über AlphaGo ist jedoch wenig bekannt: Wir haben seit März kein einziges öffentliches Spiel mehr gesehen. Es ist nicht bekannt, wie tief die Entwicklung von DeepMind in dieser Zeit begann. Deep Zen Go verbessert sich weiter: Entwickler hoffen, dass ihr Programm bald das AlphaGo-Niveau von März 2016 erreicht.

Für einen umfassenden Technologieriesen ist es nicht zulässig, die Lorbeeren des KI-Vorrangs auch nur in einer symbolischen Richtung anzugeben. Google verfügt jedoch über mehr Ressourcen. Aber verlieren Sie nicht die Hoffnung, dass die neue asiatische Entwicklung AlphaGo in einem offiziellen Spiel schlagen kann, wenn die Parteien ein Duell planen. Zunächst muss das Programm jedoch lernen, wie man Menschen besiegt.

Der Autor dankt der Gruppe go_secrets für die Hilfe beim Schreiben dieses Artikels .

Source: https://habr.com/ru/post/de399127/


All Articles