MIT-Roboter lernen, wie man trotz Unsicherheit gemeinsam Bier liefert


Roboter-Barkeeper und zwei Roboter-Kellner

Am Labor für Informatik und künstliche Intelligenz des Massachusetts Institute of Technology entwickelten sie eine grundlegende Methode zur Koordinierung der Aktionen mehrerer Roboter. Die Methode basiert auf einem Modell zur Planung gemeinsamer Aktivitäten im Kontext von Stochastizität, Unsicherheit und eingeschränkter Kommunikation ( wissenschaftliche Arbeit, pdf ).

Der gemeinsame Aktionsplanungsalgorithmus basiert auf dem allgemeinen MacDec-POMDP-Modell, verwendet jedoch Aktionsregeln, die in Form von Finite-State-Controllern dargestellt werden, anstatt wie üblich nach Regeln in einem vordefinierten Entscheidungsbaum zu suchen.



Das Video zeigt, wie Roboterkellner wie Kisten auf Rädern im Büro herumfahren und Menschen einen Drink anbieten. Diejenigen, die Bier bekommen wollen, drücken einen Knopf am Körper des Roboters. Der Kellner merkt sich den Ort des Betroffenen auf der Raumkarte und geht.



Der Kellner geht zum Barkeeper-Roboter - dies ist das Willow Garage PR2-Modell (erhältlich mit Open Source-Software). Er stellt ein Glas gekühltes Getränk in einen Behälter für den Transport auf den Koffer des Kellners - und der mobile Roboter kehrt gemäß den aufgezeichneten Koordinaten zurück. Gleichzeitig kann er eine Bestellung mitnehmen, die von einem anderen Roboterkellner im selben Raum angenommen wurde.

Die Autoren der wissenschaftlichen Arbeit glauben, dass die endgültigen Operatoren die Aktionen viel genauer und präziser beschreiben als der Entscheidungsbaum. Solche Beschreibungen sind leichter zu interpretieren und ermöglichen die Arbeit am „endlosen Horizont“ möglicher Aktionen. Der entwickelte Suchalgorithmus für die erforderlichen Aktionen erfordert einen viel einfacheren Simulator, der nur das Ergebnis eines bestimmten Motorsatzes modelliert. Somit kann der neue Algorithmus eine viel größere Anzahl von Problemen lösen als die vorhandenen MacDec-POMDP-Scheduler.

Eine Gruppe von Forschern des Massachusetts Institute of Technology hat den Markov-Entscheidungsprozess (MDP) verbessert . Es dient als mathematische Grundlage für die Modellierung der Entscheidungsfindung in Situationen, in denen die Ergebnisse teilweise zufällig sind.

Die Aktivitäten der Barkeeper- und Kellnerroboter sind ein Beweis dafür, dass die neue Methode zur Koordinierung von Aktionen und zum Treffen von Entscheidungen für den Einsatz in praktischen Aufgaben geeignet ist. In diesem Fall ändert sich die Umgebung ständig. Menschen können sich an verschiedenen Orten befinden und ihren Standort ändern, was die Funktionsweise des Roboter-Bierteams nicht beeinträchtigt.

Dieselben Prinzipien eignen sich zur Koordinierung der Aktionen anderer Robotergruppen. Zum Beispiel Rettungsteams, Feuerwehrleute, Pfleger oder Polizisten.

Source: https://habr.com/ru/post/de382961/


All Articles