Google bringt Robotern bei, neue Aufgaben im "Kindergarten" auszuführen.


Im Kindergarten lernen Roboter, Türen zu öffnen. Die

Lernfähigkeit ist eine der wichtigsten für Roboter. Wenn sie anfangen zu lernen und die benötigten Informationen im Laufe der Zeit sammeln, können sie verwendet werden, um komplexe Aufgaben auszuführen, die nicht vorprogrammiert wurden. Die Aufgaben können sehr unterschiedlich sein - von der Pflege älterer Menschen und Patienten in Krankenhäusern bis zur Reinigung der Räumlichkeiten. Wenn Sie jeden Roboter einzeln trainieren müssen, wird dies sehr viel Zeit in Anspruch nehmen. Aber was ist, wenn Roboter Roboter unterrichten? Und was ist, wenn Gruppen von Robotern gemeinsam lernen?

Dieses Problem ist alles andere als neu, es wurde mehr als einmal von Science-Fiction-Autoren beschrieben. Spezialisten für Robotik und künstliche Intelligenz versuchen ebenfalls, dieses Problem zu lösen. Google mehr als andereSie ist daran interessiert, von Robotern zu lernen. Wahrscheinlich ist eine der einfachsten Möglichkeiten, das zu erreichen, was Sie wollen, die Erstellung einer gemeinsamen Wissensdatenbank von Robotern, in der die von jeder Maschine gesammelten Informationen gesammelt werden.

Alle Roboter müssen an diese Basis angeschlossen sein. Wenn ein Roboter etwas lernt, erhält jeder andere sofort Wissen und Erfahrung. Google-Mitarbeiter haben diese Idee (auch nicht neu) in der Praxis getestet und gute Ergebnisse erzielt. Insbesondere die von einem der Roboter ausgeführten Aktionen gingen sofort in das Eigentum seiner "Kollegen" über.

Roboter können dieselbe Aktion auf sehr unterschiedliche Weise ausführen. Manchmal ist es besser, manchmal schlechter. Alle Informationen zu diesen Aktionen werden erfasst und an den Server gesendet, wo sie über ein neuronales Netzwerk verarbeitet werden. Das kognitive System wertet die Aktionen jeder Maschine aus und wählt nur Informationen über die positive Erfahrung aus. Dabei werden Daten zu erfolglosen Versuchen, die eine oder andere Aufgabe zu erledigen, verworfen. Roboter laden Daten, die von einem neuronalen Netzwerk verarbeitet werden, mit einer bestimmten Frequenz. Und mit jedem neuen Download werden sie effektiver. Im folgenden Video untersucht der Roboter den Vorgang des Öffnens einer Tür.


Nach mehreren Stunden Training überträgt das Gerät Informationen über seine Aktionen an ein gemeinsames Netzwerk. Während des Beherrschens des Öffnens einer Tür untersuchen Roboter die Details dieses Verfahrens und „verstehen“ nach und nach, welche Rolle der Türgriff spielt und was getan werden muss, um die Tür so schnell wie möglich zu öffnen.


Der Versuch und Irrtum Lernprozess ist gut, aber nicht perfekt. Menschen und Tiere können beispielsweise auch die Elemente der Umwelt analysieren und ihre möglichen Auswirkungen auf ihre Handlungen bewerten. Wenn Menschen und Tiere erwachsen werden, entsteht ein bestimmtes Bild der Welt. Es ist klar, dass es beim Menschen viel komplizierter ist als bei den meisten Tieren, aber in beiden Fällen gibt es ähnliche Elemente.

Aus diesem Grund haben die Google-Ingenieure beschlossen, Robotern zu zeigen , wie sich die Gesetze der Physik auf ihre Aktionen auswirken. In einem Experiment wurde der Roboter angewiesen, verschiedene Objekte zu untersuchen, die in jedem Haus oder Büro üblich sind. Dies sind Bleistifte, Kugelschreiber, Bücher und andere Gegenstände. Roboter lernten schnell und gaben die Informationen an ihre "Kollegen" weiter. Das gesamte Roboterteam erhielt in kurzer Zeit das Konzept der Konsequenzen ihres Handelns.



In einem neuen Experiment wiesen die Ingenieure den Roboter an, ein bestimmtes Objekt an einen bestimmten Punkt zu bewegen. Das System erhielt jedoch keine Anweisungen zur Art des Objekts. Objekte ändern sich ständig. Es könnte eine Wasserflasche, eine Dose Bier, ein Stift oder ein Buch sein. Wie sich herausstellte, haben die Roboter diese Aufgabe mit Daten aus früheren Erfahrungen zur Interaktion mit der realen Welt abgeschlossen. Sie konnten die Folgen einer Bewegung des Objekts auf der Oberfläche zum gewünschten Punkt berechnen.

Aber was ist mit dem Menschen?


Zwei frühere Experimente wurden nur unter Beteiligung von Robotern ohne menschliche Hilfe durchgeführt. Laut Google kann das Training von Robotersystemen viel schneller gehen, wenn eine Person der Maschine hilft. Schließlich kann eine Person schnell berechnen, was sich aus der Ausführung einiger Aktionen ergibt. In einem Experiment half beispielsweise eine Person verschiedenen Robotern, verschiedene Arten von Türen zu öffnen. Jedes System erhielt eine einzigartige Tür und ein Schloss.

Als Ergebnis wurde für alle Roboter eine gemeinsame Strategie entwickelt, die als "Politik" bezeichnet wurde. Alle Aktionen von Robotern wurden unter Verwendung eines tiefen neuronalen Netzwerks verarbeitet. Sie verarbeitete die Bilder von Kameras, die die Aktionen von Robotern aufzeichneten, und übertrug die bereits verarbeiteten Informationen bereits in Form einer Richtlinie an den zentralen Server.


Roboter haben ihre „Richtlinien“ durch Ausprobieren konsequent verbessert. Jeder Roboter versuchte, die Tür nach den neuesten Richtlinien zu öffnen. Roboteraktionen wurden weiterhin vom neuronalen Netzwerk verarbeitet und auf den Server hochgeladen. Im Laufe der Zeit begannen Roboter viel effizienter zu arbeiten als beim ersten Mal.


Nachdem die Roboter erfolgreich zu agieren begannen, änderte jeder der Ausbilder, die mit den Robotern arbeiteten, die Bedingungen der Aufgabe etwas. Die Änderungen waren stark (Position der Tür, Öffnungswinkel usw.), aber ausreichend, so dass die zuvor entwickelte Richtlinie nicht vollständig zur Lösung eines neuen Problems geeignet war. Die Roboter lernten nach und nach, mit neuen Bedingungen umzugehen, und lernten anschließend, die schwierigsten Aufgaben beim Öffnen verschiedener Türen und Schlösser auszuführen. Das letzte Experiment zeigte die Wirksamkeit dieser Art von Training: Roboter konnten die Tür und das Schloss öffnen, auf die sie noch nicht gestoßen sind.


Die Autoren des Projekts behaupten, dass die Interaktion der Roboter untereinander und mit dem zentralen Data Warehouse ihnen geholfen habe, schneller und effizienter zu lernen. Die Verwendung eines neuronalen Netzwerks verbesserte die vorläufigen Ergebnisse erheblich.

Leider ist die Liste der Aufgaben, die Roboter ausführen können, bislang äußerst begrenzt. Sie erhalten kaum die einfachsten Bewegungen und Aufgaben wie das Öffnen von Türen oder das Anheben verschiedener Gegenstände. Der Mensch ist immer noch gezwungen, dem Roboter zu sagen, was er tun und wie er handeln soll. Aber die Algorithmen verbessern sich allmählich und neuronale Netze sind nicht mehr überraschend. Daher besteht die Hoffnung, dass Roboter in naher Zukunft noch komplexe Aufgaben ausführen können. Vielleicht ist die Zukunft schon da.

Source: https://habr.com/ru/post/de398013/


All Articles