
Computerprogramme sind seit langem in der Lage, Schach zu spielen, und eine vor relativ kurzer Zeit spezialisierte Plattform von Deep Mind wurde sogar darauf trainiert
, professionell
zu spielen . So professionell, dass es unter Spielern, die einem Computer ebenbürtig sind, keine Spieler gibt und dies höchstwahrscheinlich auch nicht tun wird.
Neulich wurde bekannt, dass die Maschine selbständig lernte, ein anderes komplexes Rätsel zu lösen - den Zauberwürfel. Während des Trainings zeigten sie ihr nicht, wie man den Würfel richtig zusammensetzt. Die von Wissenschaftlern aus den USA entwickelte Softwareplattform lernte alles unabhängig voneinander. Einige Experten glauben, dass eine andere „Bastion, die als Besitz des Menschen angesehen wurde“, vor die Maschinen fiel.
Der Zauberwürfel bzw.
sein Assemblierungsalgorithmus ist insofern kompliziert, als jede Assemblierungsaktion bestimmte Konsequenzen hat, es jedoch ziemlich schwierig ist, ihre Auswirkungen auf den gesamten Montageprozess vorherzusagen. Auch für das Auto. Normalerweise lernen die Leute, wie man einen Würfel nach zuvor entwickelten Algorithmen zusammensetzt, die es ermöglichen, das Rätsel in kürzester Zeit zu lösen.
Einige der Studenten machen erstaunliche Erfolge auf diesem Gebiet. Im Mai dieses Jahres
wurde ein weiterer Rekord für die Montage des Zauberwürfels mit zwei Händen aufgestellt. Der Champion, ein 22-jähriger Australier namens Felix Zemdegs, konnte den Würfel in nur 4,22 Sekunden einsammeln. Ab dem 12. Lebensjahr begann er mit dem Training und sah sich die Versammlungsaufzeichnungen auf YouTube an.
Was das Auto betrifft, sammeln die Roboter den Würfel noch schneller. In diesem Jahr wurde der Rekord in 0,38 Sekunden aufgestellt. Es hätte schneller sein können, aber die Mechanik des Würfels selbst konnte es nicht aushalten. Um einen Rekord aufzustellen, mussten die Entwickler das Design des Würfels verstärken, da er sonst nur von zu schnellen Manipulationen der Maschine abfiel.
Bei der oben beschriebenen Plattform werden die Arbeiten gemäß den zuvor in den Systemspeicher eingegebenen Algorithmen ausgeführt. Wissenschaftler des MIT konnten jedoch ihr eigenes System trainieren, um den Würfel selbst zusammenzubauen.

Bei der Erstellung des Würfels selbst bestand seine interessanteste Aufgabe darin, einen Weg zu finden, um das Rätsel von jeder Position aus zu lösen. Ingenieur Rubik hat das in einem Monat geschafft. In Zukunft wurde der Assemblierungsalgorithmus wiederholt verbessert.
Vor kurzem haben KI-Experten begonnen, nach einer Möglichkeit zu suchen, der Maschine das Herstellen eines Würfels beizubringen. Deep Machine Learning wurde verwendet. Das System erhielt eine Aufgabe und die Regeln wurden erklärt. Als nächstes musste der Roboter alleine handeln. Im Falle eines Fortschritts erhielt die Maschine eine Belohnung - so etwas und lehrte schwache Formen der KI. Schließlich muss der Computer wissen, was sich in die richtige Richtung bewegt. Und sie ließen ihn dies durch das Belohnungssystem wissen. All dies hilft der Maschine zu lernen.
Beim Rubik's Cube ist dies etwas komplizierter als im Normalfall. Tatsache ist, dass bis zu einem bestimmten Moment nicht zu verstehen ist, ob das System ordnungsgemäß funktioniert oder nicht. Und es macht keinen Sinn, eine versehentliche Gesichtsumdrehung zu belohnen, die keine Ergebnisse bringt. Im Schach ist alles einfacher - schon ab dem zweiten oder dritten Zug können Sie verstehen, in welche Richtung sich das Spiel bewegt und ob die Maschine gut funktioniert oder nicht. Dementsprechend gibt es etwas zu belohnen.
Um einem Computer das Herstellen eines Zauberwürfels beizubringen, wurde eine spezielle Deep-Learning-Technologie verwendet, die als "autodidaktische Iteration" bezeichnet wurde. Mit dieser Technologie können Sie den bereits zusammengesetzten Würfel „drehen“, um eine Konfiguration zu erzielen, die der aktuellen ähnlich ist. Es stellt sich so etwas wie Reverse Engineering heraus, wenn dieser Begriff auf maschinelles Lernen anwendbar ist. Es wird ein spezieller „Entscheidungsbaum“ erstellt, anhand dessen die Maschine die Schritte für jede Konfiguration berechnet.
Das Ergebnis war beeindruckend. Laut den Entwicklern selbst kann der Algorithmus das Rätsel in etwa 30 Zügen lösen. Darüber hinaus sammelt die Maschine den Würfel in 100% der Fälle, unabhängig davon, auf welche Version des zerlegten Puzzles sie stößt. Im Allgemeinen benötigen Sie 19 bis 23 Schritte, um ein gut fragmentiertes Puzzle zusammenzusetzen. Einige Lösungen führen schneller zum gewünschten Ergebnis als andere. Der schnellste Build-Algorithmus besteht aus 21 Schritten.
Die von MIT-Ingenieuren entwickelte Plattform heißt DeepCube. „Unsere Plattform kann sich in komplexen Umgebungen selbst lernen und erhält nur eine Auszeichnung für den gesamten Arbeitsprozess“, heißt es in dem Bericht.
Jetzt arbeitet das gleiche Wissenschaftlerteam an der Implementierung seiner Lehrmethode zur Lösung anderer komplexer kombinatorischer Probleme. Unter anderem die Vorhersage der
Tertiärstruktur des Proteins .