
Une approche spéciale de l'apprentissage automatique peut aider les robots à assembler des téléphones et à travailler avec d'autres petites pièces sur la chaîne de montage.
Au sous-sol du 3e bâtiment du MIT, le robot réfléchit soigneusement à son prochain déménagement. Il pique doucement la tour des blocs, à la recherche du bloc le plus approprié pour l'étirement, afin de ne pas détruire la tour entière. Il en va de même de son jeu solitaire, lent mais étonnamment dynamique de Jenga.
Le robot, développé par les ingénieurs du MIT, est équipé d'une poignée avec une goupille molle, d'un bracelet avec un capteur de pression et d'une caméra externe - et ils utilisent tout cela pour voir et ressentir à la fois la tour entière et ses blocs individuels.
Pendant que le robot appuie doucement sur le bloc, l'ordinateur perçoit les commentaires visuels et tactiles de la caméra et du bracelet, comparant les mesures avec les mouvements précédents. Il calcule également les conséquences possibles de ces mouvements - en particulier, sera-t-il possible d'extraire avec succès un certain bloc, compte tenu de la configuration spécifique de la tour et avec l'application d'une force d'une certaine taille. Ensuite, en temps réel, le robot «apprend» s'il faut continuer à faire pression sur le bloc, ou s'il faut passer à un nouveau pour éviter que la tour ne tombe.
Une description détaillée du robot jouant "Jenga" a été publiée en janvier dans la revue Science Robotics. Alberto Rodriguez, professeur agrégé, Centre des carrières Walter Henry Gale du département d'ingénierie du MIT dit que le robot démontre quelque chose qui était difficile à réaliser lors du développement de systèmes précédents: la capacité d'apprendre rapidement la meilleure façon d'accomplir une tâche, non seulement à partir de données visuelles, dont l'approche est souvent utilisée en robotique, mais aussi tactile, physique interaction.
«Contrairement aux tâches ou aux jeux plus logiquement remplis, par exemple les échecs ou le go, pour jouer au Dzhenga, vous devez avoir de bonnes compétences physiques - pour sonder, tirer, placer et aligner des blocs. Cela nécessite une perception et une manipulation interactives, vous devez toucher la tour pour comprendre comment et quand déplacer les blocs, explique Rodriguez. - Il est très difficile de simuler une telle tâche, le robot doit donc apprendre dans le monde réel, en interagissant avec la vraie tour Jenga. La principale difficulté est la nécessité d'apprendre d'un nombre relativement restreint d'expériences, en utilisant le bon sens lorsqu'il est appliqué aux objets et à la physique. »
Il dit que le système d'apprentissage tactile qu'ils ont développé peut être utilisé pour des tâches autres que Jenga, en particulier celles qui nécessitent une interaction physique minutieuse, comme le tri des déchets recyclables ou l'assemblage de produits de consommation.
«Sur la chaîne de montage des téléphones, à presque chaque étape, vous avez besoin de sentir que la pièce est en place ou que la vis est serrée - tout cela provient de sensations tactiles et de puissance, pas visuelles», explique Rodriguez. "Les modèles éducatifs de telles actions sont le segment le plus délicieux de cette technologie aujourd'hui."
L'auteur principal de l'ouvrage est l'étudiante diplômée du MIT Nima Faseli. L'équipe comprend également: Mikel Oller, Jiajun Wu, Zheng Wu et Joshua Tenenbaum, professeur de sciences cognitives et de recherche sur le cerveau au MIT.
Push push
Dans le jeu "Jenga", qui en swahili signifie "construire", 54 blocs rectangulaires sont placés en 18 couches de 3 blocs chacune, de sorte que dans les couches adjacentes, les blocs sont situés perpendiculairement les uns aux autres. Le but du jeu est de retirer soigneusement les blocs et de les placer au sommet de la tour, en construisant un nouveau niveau pour que la tour ne tombe pas.
Pour programmer un robot pour jouer à Jenga, les schémas traditionnels d'apprentissage automatique (MO) nécessiteraient de décrire tout ce qui pourrait arriver lorsqu'un bloc, un robot et une tour interagissent - ce sont des calculs assez coûteux qui nécessitent le traitement de données provenant de milliers, voire de dizaines de milliers de tentatives pour obtenir bloquer.
Au lieu de cela, Rodriguez et ses collègues ont commencé à chercher un moyen, plus efficace du point de vue de l'utilisation des données, pour que le robot apprenne à jouer au jeu "Jenga", inspiré par les capacités cognitives humaines et comment nous pourrions nous-mêmes aborder ce jeu.
L'équipe a adapté la norme de poignée robotisée ABB IRB 120 pour l'industrie pour la tâche, puis a installé la tour Jenga dans un endroit accessible pour la capture, et la période de formation a commencé. Au début, le robot a sélectionné des blocs aléatoires et l'endroit sur le bloc où il fallait appuyer. Puis il a appliqué un petit effort, essayant de faire sortir le bloc de la tour.
Au cours de chaque tentative, l'ordinateur a enregistré les mesures visuelles et tactiles qui y étaient associées et a noté s'il avait réussi.
Au lieu de mener des dizaines de milliers de ces tentatives (alors la tour devrait être restaurée autant de fois), le robot n'a été formé que par 300. Les tentatives de mesures et de résultats similaires ont été regroupées, indiquant certains aspects du comportement des blocs. Par exemple, un groupe de données pourrait indiquer des tentatives de déplacer un bloc qui résiste au mouvement, un autre - travailler avec un bloc qui se déplace facilement et un troisième - des tentatives qui ont conduit à la chute de la tour. Pour chaque groupe de données, le robot a développé un modèle simple qui prédit le comportement d'un bloc en fonction de ses mesures visuelles et tactiles actuelles.
Fazeli dit qu'une telle technologie de regroupement augmente considérablement l'efficacité avec laquelle le robot apprend ce jeu et a été inspirée par la façon naturelle dont les gens regroupent un comportement similaire d'objets. «Le robot crée des clusters de données, puis apprend les modèles pour chacun de ces clusters, au lieu d'apprendre le modèle, décrivant tout ce qui peut arriver en principe.»
Collecte de pile
Les chercheurs ont testé leur approche en la comparant à des algorithmes MO avancés dans la simulation informatique d'un jeu à l'aide du simulateur MuJoCo. Les données obtenues dans les simulateurs permettent aux scientifiques de comprendre comment un robot apprendrait dans le monde réel.
«Nous fournissons à ces algorithmes les mêmes données que notre système reçoit afin de voir comment ils peuvent apprendre à jouer à Jenga à un niveau similaire», explique Oller. «Par rapport à notre approche, ces algorithmes de maîtrise du jeu devaient jouer avec le nombre de tours, plusieurs ordres de grandeur supérieur à ce que nous avions.»
L'équipe s'est intéressée à savoir si leur approche de la région de Moscou pouvait rivaliser avec les joueurs humains et a organisé plusieurs compétitions informelles avec des bénévoles.
«Nous avons examiné le nombre de blocs qu'un homme pouvait sortir de la tour avant sa chute, et la différence n'était pas si grande», explique Oller.
Cependant, il existe un moyen de véritablement opposer le robot et les humains, si les chercheurs le souhaitent. En plus de l'interaction physique, pour jouer à "Jenga", vous avez besoin d'une stratégie, extraire un bloc approprié de sorte qu'il est plus difficile pour votre adversaire de retirer le bloc suivant sans laisser tomber la tour.
Jusqu'à présent, l'équipe n'est pas tellement intéressée à créer un robot gagnant le "Jenga", elle est plus occupée à utiliser ses nouvelles compétences dans d'autres domaines.
«Il existe de nombreuses tâches que nous effectuons avec nos mains, où le sentiment de« bien faire les choses »peut être exprimé dans le langage de la force et des invites tactiles, explique Rodriguez. "Une approche similaire à la nôtre peut être utile pour de telles tâches."