Ein großer Schritt für eine Schachmaschine

Der unglaubliche Erfolg von AlphaZero, einem detaillierten Lernalgorithmus, leitet eine neue Ära des Denkens ein, die sich für den Menschen als kurzlebig erweisen kann.




Anfang Dezember sprachen Forscher von DeepMind, einem Unternehmen für künstliche Intelligenz im Besitz von Alphabet Inc., einem Mutterunternehmen, dem auch Google gehört, darüber, was an der Spitze des Schachs passiert.

Ein Jahr zuvor, am 5. Dezember 2017, kam das Team mit der Ankündigung seines AlphaZero-Algorithmus für maschinelles Lernen (MO) auf die Schachwelt, der es schaffte, nicht nur reguläres Schach, sondern auch japanisches Shogi- Schach und das Go- Spiel zu beherrschen. Der Algorithmus begann ohne jegliches Konzept von Spielen zu arbeiten, mit Ausnahme der Grundregeln. Dann begann er mehrere Millionen Mal mit sich selbst zu spielen und aus seinen Fehlern zu lernen. In nur wenigen Stunden wurde der Algorithmus zum besten Player, sowohl unter Menschen als auch unter Computern, von allem, was die Welt sah.

Details zu den Errungenschaften von AlphaZero und seiner internen Struktur werden derzeit einer formellen Überprüfung unterzogen. Danach werden sie in der Zeitschrift Science veröffentlicht . Die neue Arbeit reagiert auf ernsthafte Kritik an den ursprünglichen Aussagen. Zum Beispiel war es schwer zu sagen, ob AlphaZero wirklich ehrlich mit seinem Gegner, dem Computermonster Stockfish, spielte. Aber all diese Zweifel wurden zerstreut. In den letzten 12 Monaten ist AlphaZero nicht stärker geworden, aber es ist ein überzeugenderer Beweis für seine Überlegenheit geworden. Er repräsentiert eindeutig eine Art Geist, der von Menschen, an die wir sehr lange denken müssen, beispiellos ist.

In den letzten 20 Jahren hat das Computerschach einen langen Weg zurückgelegt. 1997 gelang es IBMs Computerschachprogramm Deep Blue, den damaligen Weltmeister der Männer, Garry Kasparov, in einem Match mit sechs Spielen zu schlagen. Rückblickend können wir sagen, dass diese Leistung kein Geheimnis war. Deep Blue könnte 200 Millionen Positionen pro Sekunde schätzen. Sie wurde nie müde, machte nie einen Fehler und vergaß nie, woran sie kurz zuvor dachte.

Auf die eine oder andere Weise spielte sie brutal und materialistisch wie eine Maschine. Sie hätte besser denken können als Kasparov, aber nicht besser denken können als er. Im ersten Spiel ihres Spiels akzeptierte Deep Blue vorhersehbar den von Kasparov vorgeschlagenen Austausch des Turmes gegen den Bischof, verlor jedoch 16 Züge später. Die heutige Generation der stärksten Schachprogramme der Welt, zum Beispiel Stockfish und Komodo, spielt nicht menschlich. Sie nehmen gerne die Figuren anderer Leute. Sie bauen einen eisernen Schild. Aber obwohl sie stärker spielen als jede andere Person, haben diese Schachautomaten keine Ahnung von dem Spiel. Ihnen müssen die Grundprinzipien des Schachs beigebracht werden.

Diese Prinzipien, die durch jahrzehntelange Erfahrung des menschlichen Großmeisters verfeinert wurden, sind in Form komplexer Bewertungsfunktionen in die Maschine programmiert. Diese notieren, was in der Position erreicht werden muss und was zu vermeiden ist: Wie sehr müssen Sie die Sicherheit des Königs, die Aktivität der Figuren, die Platzierung der Bauern, die Kontrolle über die Mitte des Bretts usw. bewerten? und wie man Kompromisse zwischen diesen Dingen verwaltet. Die heutigen Schachmaschinen, denen all diese Prinzipien fremd sind, verhalten sich wie unhöfliche Tiere: Sie sind extrem schnell und stark, aber ihnen fehlt das Gehirn.

Aber all dies hat sich seit dem Aufkommen von MO geändert. AlphaZero selbst spielte mit sich selbst und aktualisierte seine neuronalen Netze, während er aus Erfahrungen lernte. Er entdeckte die Prinzipien des Schachs und wurde schnell zum besten Spieler. Sie konnte nicht nur die Meister unter den Menschen leicht schlagen, sondern auch Stockfish, den Schachmeister in Computern. In einem Match für hundert Spiele gegen eine beeindruckende Maschine gewann AlphaZero 28 Mal und 72 Mal reduzierte das Spiel auf ein Unentschieden, ohne ein einziges zu verlieren.

Und das Unangenehmste war, dass AlphaZero das Denken demonstrierte. Sie spielte wie kein anderer Computer intuitiv und wunderschön mit einem romantischen Angriffsstil. Sie spielte Schachzüge und ging Risiken ein. In einigen Spielen lähmte sie Stockfisch und spielte mit ihr. AlphaZero führte den Angriff im 10. Spiel durch und zog die Königin in ihre Ecke des Bretts zurück, weg vom König der Stockfische. Sie verhielt sich anders als der Angriff auf den König.

Dieser seltsame Rückzug erwies sich jedoch als giftig. Egal wie Stockfisch antwortete, sie war zum Scheitern verurteilt. Es war, als würde AlphaZero darauf warten, dass Stockfish herausfindet, wie hoffnungslos ihre Position nach Milliarden von versuchten Kombinationen war, sich zu entspannen und sich friedlich zu ergeben wie ein niedergeschlagener Bulle vor einem Matador. Großmeister haben so etwas noch nie gesehen. AlphaZero spielte mit der Anmut eines Virtuosen und der Kraft einer Maschine. Es war die erste flüchtige Bekanntschaft mit einer erstaunlichen neuen Art von Intelligenz.


Garry Kasparov (links) spielt im sechsten und letzten Spiel des Spiels, das im Mai 1997 in New York stattfand, gegen den IBM Deep Blue-Computer. Die Figuren hinter dem Computer wurden von Joseph Joan, einem IBM-Ingenieur, bewegt.

Als die Entwickler AlphaZero zum ersten Mal vorstellten, beschwerten sich einige Beobachter darüber, dass Stockfish der Zugang zu seinem Debütset entzogen worden war. Diesmal wurde sie sogar mit ihrer eigenen Ausrüstung besiegt. Und selbst als AlphaZero Stockfish einen Vorsprung in Form einer zehnfach verlängerten Rechenzeit verschaffte, besiegte sie sie dennoch.

Es ist beeindruckend, dass AlphaZero gewonnen hat, indem es nicht schneller, sondern besser gedacht hat. Sie studierte nur 60.000 Positionen pro Sekunde und nicht 60 Millionen wie Stockfish. Sie war schlauer und wusste, woran sie denken und was sie ignorieren sollte. Nachdem AlphaZero die Prinzipien des Schachs unabhängig entdeckt hatte, entwickelte er einen Spielstil, der „die Wahrheit“ des Spiels widerspiegelte und nicht „Prioritäten und Vorurteile der Programmierer“, schrieb Kasparov in einem begleitenden Kommentar zum Artikel in Science.

Die Frage ist nun, ob MO Menschen helfen kann, ähnliche Wahrheiten über Dinge zu entdecken, die wirklich wichtig sind: die großen ungelösten Probleme von Wissenschaft und Medizin, wie ein Heilmittel gegen Krebs oder Bewusstsein; Geheimnisse des Immunsystems, Geheimnisse des Genoms.

Die ersten Anzeichen sind inspirierend. Im August untersuchten zwei Artikel in der Zeitschrift Nature Medicine das Problem der Anwendung von MO auf medizinische Diagnosen. In einem Fall haben Forscher von DeepMind mit Ärzten des Murfield Eye Hospital in London zusammengearbeitet, um einen detaillierten Lernalgorithmus zu entwickeln, mit dem eine Vielzahl von Netzhautpathologien sowie menschliche Experten klassifiziert werden können. In der Augenheilkunde gibt es einen ernsthaften Mangel an Experten, die jährlich Millionen von diagnostischen Augenbildern interpretieren können. KI-Assistenten wären von unschätzbarem Wert.

Ein anderer Artikel untersuchte den MO-Algorithmus, der das Vorhandensein von Computertomographiebildern von Patienten mit einem Krankenwagen, Anzeichen eines Schlaganfalls, einer intrakraniellen Blutung oder anderen neurologischen Problemen erkennt. Jede Minute zählt für Schlaganfallopfer; Je länger die Behandlung verzögert ist, desto schlechter ist das Ergebnis. Neurologen haben sogar ein Sprichwort: "Zeit ist das Gehirn." Der neue Algorithmus markiert diese und andere kritische Ereignisse mit einer Genauigkeit, die mit menschlichen Experten vergleichbar ist, arbeitet jedoch 150-mal schneller. Mithilfe der Hochgeschwindigkeitsdiagnose können Sie die dringendsten Fälle vor der Warteschlange übersetzen. Danach können sie bereits von einem menschlichen Radiologen ausgewertet werden.

Ärgerlich in MO ist, dass Algorithmen ihre Gedanken nicht erklären können. Wir wissen nicht, warum sie funktionieren, daher wissen wir nicht, ob ihnen vertraut werden kann. AlphaZero zeigt alle Anzeichen für die Entdeckung der wichtigen Prinzipien des Schachspiels, kann dieses Verständnis jedoch nicht mit uns teilen. Zumindest noch nicht. Menschen brauchen mehr als Antworten. Wir brauchen Verständnis. Von nun an wird dieses Problem zu Spannungen in unserer Interaktion mit Computern führen.

In der Mathematik ist dies in der Tat schon lange geschehen. Betrachten Sie ein langjähriges mathematisches Problem, das als Vierfarbensatz bezeichnet wird . Sie behauptet, dass unter bestimmten vernünftigen Einschränkungen jede Karte der Kontaktländer mit vier Farben gemalt werden kann, so dass zwei beliebige Nachbarländer unterschiedliche Farben haben.

Obwohl der Satz 1977 mit einem Computer bewiesen wurde, kann nicht eine einzige Person alle Schritte des Beweises überprüfen. Seitdem wurde der Beweis bestätigt und vereinfacht, aber er enthält immer noch Teile, die Berechnungen mit umfassender Suche erfordern, wie sie beispielsweise von den Vorgängern von AlphaZero verwendet wurden, die Schach spielen. Dieser Zustand hat viele Mathematiker empört. Sie mussten nicht von der Richtigkeit des Satzes überzeugt sein; sie haben schon daran geglaubt. Sie wollten verstehen, warum es wahr ist, und ein solcher Beweis half nichts.

Stellen Sie sich jedoch vor, dass der Tag vielleicht sehr bald kommen wird, an dem AlphaZero zu einem allgemeineren Algorithmus wird. Nennen wir es AlphaInfinity. Wie sein Vorfahr wird er einen überlegenen Verstand haben: Er wird in der Lage sein, hervorragende Beweise zu liefern, so elegant wie die Spiele, die AlphaZero gegen Stockfish gespielt hat. Und jeder Beweis wird zeigen, warum der Satz wahr war; AlphaInfinity zwingt Sie nicht dazu, hässliche und komplexe Beweise zu akzeptieren.

Für Mathematiker und Wissenschaftler würde ein solcher Tag den Beginn einer neuen Ära des Denkens markieren. Aber es kann von kurzer Dauer sein. Je schneller Autos werden und Menschen überholen, deren Neuronen im Millisekundenbereich mit einer Schildkrötengeschwindigkeit arbeiten, desto schneller wird der Tag kommen, an dem wir nicht mit ihnen mithalten können. Der Beginn des menschlichen Denkens kann sich schnell in einen Sonnenuntergang verwandeln.

Angenommen, es gibt bestimmte Muster, die noch entdeckt werden müssen - bei der Regulation von Genen oder der Entwicklung von Krebs; in der Funktion des Immunsystems; im Tanz der subatomaren Teilchen. Angenommen, diese Muster können nur von einem Intellekt vorhergesagt werden, der unserem weit überlegen ist. Wenn AlphaInfinity sie definieren und verstehen könnte, wäre dies für uns ein Orakel.

Wir würden zu ihren Füßen sitzen und aufmerksam zuhören. Wir würden nicht verstehen, warum das Orakel immer Recht hat, aber wir könnten seine Berechnungen und Vorhersagen in Experimenten und Beobachtungen überprüfen und seine Enthüllungen bestätigen. In der Wissenschaft, einer symbolischen Beschäftigung von Menschen, würde unsere Rolle auf die Rolle von Beobachtern reduziert, die sich mit Erstaunen und Verwirrung befassen.

Vielleicht stört uns eines Tages unser Mangel an Denken nicht mehr. Schließlich könnte AlphaInfinity alle Krankheiten heilen, alle wissenschaftlichen Probleme lösen und alle anderen intelligenten Züge planmäßig fahren lassen. Wir haben in den ersten 300.000 Jahren unseres Bestehens als Homo sapiens gute Arbeit geleistet, ohne viel darüber nachzudenken. Wir werden keine Gedächtnisprobleme haben, wir werden stolz sein, an die goldene Ära des menschlichen Geistes zu erinnern, dieses herrliche Zwischenspiel, das mehrere Jahrtausende dauerte, zwischen einer unbegreiflichen Vergangenheit und einer unerklärlichen Zukunft.

Source: https://habr.com/ru/post/de436598/


All Articles