MIT Robot lernt Jenga, der sich auf Vision und Berührung verlässt



Ein spezieller Ansatz für maschinelles Lernen kann Robotern helfen, das Zusammenbauen von Telefonen und das Arbeiten mit anderen kleinen Teilen am Fließband zu erlernen.

Im Keller des 3. MIT-Gebäudes reflektiert der Roboter sorgfältig seinen nächsten Schritt. Er stößt den Turm vorsichtig aus den Blöcken und sucht nach dem am besten geeigneten Block zum Strecken, um nicht den gesamten Turm zu zerstören. So geht sein einsames, langsames, aber überraschend dynamisches Spiel von Jenga.

Der von Ingenieuren des MIT entwickelte Roboter ist mit einem Griff mit einem weichen Stift, einem Armband mit Drucksensor und einer externen Kamera ausgestattet - und all dies nutzt, um sowohl den gesamten Turm als auch seine einzelnen Blöcke zu sehen und zu fühlen.

Während der Roboter sanft auf den Block drückt, nimmt der Computer visuelle und taktile Rückmeldungen von Kamera und Armband wahr und vergleicht die Messungen mit früheren Bewegungen. Er berechnet auch die möglichen Konsequenzen dieser Bewegungen - insbesondere, ob es möglich sein wird, einen bestimmten Block erfolgreich zu extrahieren, wenn die spezifische Konfiguration des Turms gegeben ist und eine Kraft einer bestimmten Größe angewendet wird. Dann „lernt“ der Roboter in Echtzeit, ob weiterhin Druck auf den Block ausgeübt werden muss oder ob auf einen neuen umgeschaltet werden muss, um ein Herunterfallen des Turms zu verhindern.

Eine detaillierte Beschreibung des Roboters, der "Jenga" spielt, wurde im Januar in der Zeitschrift Science Robotics veröffentlicht. Alberto Rodriguez, außerordentlicher Professor, Career Center Walter Henry Gale von der MIT-technischen Abteilung sagt, dass der Roboter etwas demonstriert, das bei der Entwicklung früherer Systeme schwer zu erreichen war: die Fähigkeit, schnell zu lernen, wie eine Aufgabe am besten erledigt werden kann, nicht nur anhand visueller Daten, die in der Robotik häufig verwendet werden, sondern auch anhand taktiler, physischer Daten Interaktion.

„Im Gegensatz zu logisch gefüllten Aufgaben oder Spielen, zum Beispiel Schach oder Go, müssen Sie über gute körperliche Fähigkeiten verfügen, um Jenga spielen zu können - um Blöcke zu untersuchen, zu ziehen, zu platzieren und auszurichten. Dies erfordert interaktive Wahrnehmung und Manipulation. Sie müssen den Turm berühren, um zu verstehen, wie und wann die Blöcke bewegt werden müssen, sagt Rodriguez. - Es ist sehr schwierig, eine solche Aufgabe zu simulieren, daher muss der Roboter in der realen Welt lernen und mit dem realen Jenga-Turm interagieren. Die Hauptschwierigkeit besteht darin, aus einer relativ kleinen Anzahl von Experimenten mit gesundem Menschenverstand zu lernen, wenn sie auf Objekte und Physik angewendet werden. “

Er sagt, dass das von ihnen entwickelte taktile Lernsystem für andere Aufgaben als Jenga verwendet werden kann, insbesondere für solche, die eine sorgfältige physische Interaktion erfordern, wie das Sortieren von recycelbarem Abfall oder das Zusammenstellen von Konsumgütern.

„Am Fließband für Telefone muss man bei fast jedem Schritt das Gefühl haben, dass das Teil vorhanden ist oder dass die Schraube festgezogen ist - all dies kommt von taktilen und Kraftempfindungen, nicht von visuellen“, sagt Rodriguez. "Bildungsmodelle solcher Aktionen sind heute das köstlichste Segment dieser Technologie."

Der Hauptautor der Arbeit ist MIT-Doktorandin Nima Faseli. Zum Team gehören außerdem: Mikel Oller, Jiajun Wu, Zheng Wu und Joshua Tenenbaum, Professor für Kognitionswissenschaften und Gehirnforschung am MIT.


Push Push


Im Spiel "Jenga", was auf Suaheli "bauen" bedeutet, werden 54 rechteckige Blöcke in 18 Schichten zu je 3 Blöcken platziert, so dass sich die Blöcke in benachbarten Schichten senkrecht zueinander befinden. Das Ziel des Spiels ist es, die Blöcke vorsichtig zu entfernen und auf den Turm zu legen, um ein neues Level zu schaffen, damit der Turm nicht fällt.

Um einen Roboter für das Spielen von Jenga zu programmieren, müssten bei herkömmlichen maschinellen Lernschemata (MO) alles beschrieben werden, was passieren kann, wenn ein Block, ein Roboter und ein Turm interagieren. Dies sind recht teure Berechnungen, bei denen Daten aus Tausenden oder sogar Zehntausenden von Versuchen verarbeitet werden müssen Block.

Stattdessen suchten Rodriguez und seine Kollegen nach einem Weg, der unter dem Gesichtspunkt der Verwendung von Daten effizienter ist, damit der Roboter lernen kann, wie man das Spiel „Jenga“ spielt, inspiriert von menschlichen kognitiven Fähigkeiten und wie wir uns diesem Spiel nähern können.

Das Team passte den ABB IRB 120-Robotergriffstandard für die Branche an die Aufgabe an und installierte dann den Jenga-Turm an einem zugänglichen Ort zur Erfassung. Die Einarbeitungszeit begann. Zuerst wählte der Roboter zufällige Blöcke und die Stelle auf dem Block, an der gedrückt werden musste. Dann bemühte er sich ein wenig, den Block aus dem Turm zu drücken.

Bei jedem Versuch zeichnete der Computer die damit verbundenen visuellen und taktilen Messungen auf und stellte fest, ob dies erfolgreich war.

Anstatt Zehntausende solcher Versuche durchzuführen (dann müsste der Turm so oft restauriert werden), trainierte der Roboter nur mit 300. Versuche zu ähnlichen Messungen und Ergebnissen wurden gruppiert, um bestimmte Aspekte des Verhaltens der Blöcke anzuzeigen. Beispielsweise könnte eine Datengruppe Versuche anzeigen, einen Block zu bewegen, der sich der Bewegung widersetzt, eine andere - mit einem Block arbeiten, der sich leicht bewegen lässt, und eine dritte - Versuche, die zum Fall des Turms führen. Für jede Datengruppe entwickelte der Roboter ein einfaches Modell, das das Verhalten eines Blocks anhand seiner aktuellen visuellen und taktilen Messungen vorhersagt.

Laut Fazeli erhöht eine solche Gruppierungstechnologie die Effizienz, mit der der Roboter dieses Spiel lernt, erheblich und wurde von der natürlichen Art und Weise inspiriert, wie Menschen ein ähnliches Verhalten von Objekten gruppieren. „Der Roboter erstellt Datencluster und lernt dann die Modelle für jeden dieser Cluster, anstatt das Modell zu lernen und alles zu beschreiben, was im Prinzip passieren kann.“

Stapel sammeln


Die Forscher testeten ihren Ansatz, indem sie ihn mit fortschrittlichen MO-Algorithmen in der Computersimulation eines Spiels unter Verwendung des MuJoCo-Simulators verglichen. Die in den Simulatoren erhaltenen Daten ermöglichen es Wissenschaftlern zu verstehen, wie ein Roboter in der realen Welt lernen würde.

„Wir stellen diesen Algorithmen dieselben Daten zur Verfügung, die unser System erhält, um zu sehen, wie sie lernen können, wie man Jenga auf einem ähnlichen Niveau spielt“, sagt Oller. "Im Vergleich zu unserem Ansatz mussten diese Algorithmen zur Beherrschung des Spiels mit der Anzahl der Türme spielen, die mehrere Größenordnungen höher waren als die, die wir hatten."

Das Team interessierte sich dafür, ob ihre Herangehensweise an die Region Moskau mit menschlichen Spielern konkurrieren könnte, und veranstaltete mehrere informelle Wettbewerbe mit Freiwilligen.

"Wir haben uns angesehen, wie viele Blöcke ein Mann aus dem Turm herausholen kann, bevor er fällt, und der Unterschied war nicht so groß", sagt Oller.

Es gibt jedoch eine Möglichkeit, den Roboter und die Menschen wirklich in die Knie zu zwingen, wenn Forscher dies möchten. Zusätzlich zur physischen Interaktion benötigen Sie zum Spielen von "Jenga" eine Strategie, bei der Sie einen geeigneten Block extrahieren, damit es Ihrem Gegner schwerer fällt, den nächsten Block herauszuziehen, ohne den Turm fallen zu lassen.

Bisher ist das Team nicht so sehr daran interessiert, einen Roboter zu entwickeln, der Jenga gewinnt, sondern es ist mehr damit beschäftigt, seine neuen Fähigkeiten in anderen Bereichen einzusetzen.

„Es gibt viele Aufgaben, die wir mit unseren Händen ausführen, bei denen das Gefühl, es richtig zu machen, in der Sprache der Stärke und der taktilen Aufforderungen ausgedrückt werden kann, sagt Rodriguez. "Ein ähnlicher Ansatz wie wir kann sich für solche Aufgaben als nützlich erweisen."

Source: https://habr.com/ru/post/de441422/


All Articles