El robot del MIT aprende que Jenga confía en la visión y el tacto



Un enfoque especial para el aprendizaje automático puede ayudar a los robots a aprender cómo ensamblar teléfonos y trabajar con otras piezas pequeñas en la línea de ensamblaje.

En el sótano del tercer edificio del MIT, el robot reflexiona cuidadosamente sobre su próximo movimiento. Golpea suavemente la torre de los bloques, buscando el bloque más adecuado para estirarse, para no destruir toda la torre. Así va su juego solitario, lento pero sorprendentemente dinámico "Jenga".

El robot, desarrollado por ingenieros del MIT, está equipado con una empuñadura con un pasador suave, un brazalete con un sensor de presión y una cámara externa, y utilizan todo esto para ver y sentir la torre completa y sus bloques individuales.

Mientras el robot presiona suavemente el bloque, la computadora percibe la retroalimentación visual y táctil de la cámara y el brazalete, comparando las mediciones con movimientos anteriores. También calcula las posibles consecuencias de estos movimientos, específicamente, ¿será posible extraer con éxito un determinado bloque, dada la configuración específica de la torre y con la aplicación de fuerza de cierto tamaño. Luego, en tiempo real, el robot "aprende" si es necesario continuar presionando el bloque o si es necesario cambiar a uno nuevo para evitar que la torre se caiga.

En enero se publicó una descripción detallada del robot que interpretaba a "Jenga" en la revista Science Robotics. Alberto Rodriguez, Profesor Asociado, Centro de Carrera Walter Henry Gale, del Departamento de Ingeniería del MIT, dice que el robot demuestra algo que era difícil de lograr al desarrollar sistemas anteriores: la capacidad de aprender rápidamente la mejor manera de llevar a cabo una tarea, no solo a partir de datos visuales, cuyo enfoque se usa a menudo en robótica, sino también desde la táctica física. interacción

“A diferencia de las tareas o juegos más llenos de lógica, por ejemplo, ajedrez o ir, para jugar Dzhenga necesitas tener buenas habilidades físicas: sondear, tirar, colocar y alinear bloques. Esto requiere percepción y manipulación interactivas, debe tocar la torre para comprender cómo y cuándo mover los bloques, dice Rodríguez. - Es muy difícil simular tal tarea, por lo que el robot tiene que aprender en el mundo real, interactuando con la verdadera torre Jenga. La principal dificultad es la necesidad de aprender de un número relativamente pequeño de experimentos, utilizando el sentido común cuando se aplica a objetos y física ".

Él dice que el sistema de aprendizaje táctil que desarrollaron se puede usar para tareas que no sean Jenga, especialmente aquellas que requieren una interacción física cuidadosa, como clasificar los desechos reciclables o ensamblar productos de consumo.

"En la línea de montaje para teléfonos, en casi cada paso se necesita la sensación de que la pieza está en su lugar, o que el tornillo está apretado; todo esto proviene de sensaciones táctiles y de poder, no visuales", dice Rodríguez. "Los modelos educativos de tales acciones son el segmento más delicioso de esta tecnología en la actualidad".

La autora principal del trabajo es la estudiante graduada del MIT Nima Faseli. El equipo también incluye: Mikel Oller, Jiajun Wu, Zheng Wu y Joshua Tenenbaum, profesor de ciencias cognitivas e investigación cerebral en el MIT.


Empujar empujar


En el juego "Jenga", que en swahili significa "construir", se colocan 54 bloques rectangulares en 18 capas de 3 bloques cada una, de modo que en las capas adyacentes los bloques se ubican perpendiculares entre sí. El objetivo del juego es eliminar cuidadosamente los bloques y colocarlos en la parte superior de la torre, construyendo un nuevo nivel para que la torre no se caiga.

Para programar un robot para jugar Jenga, los esquemas tradicionales de aprendizaje automático (MO) requerirían describir en general todo lo que puede suceder cuando un bloque, un robot y una torre interactúan: estos son cálculos bastante costosos que requieren procesar datos de miles o incluso decenas de miles de intentos para obtener bloque

En cambio, Rodríguez y sus colegas comenzaron a buscar una forma, más eficiente desde el punto de vista del uso de datos, para que el robot aprendiera a jugar el juego "Jenga", inspirado en las habilidades cognitivas humanas y en cómo nosotros mismos podríamos abordar este juego.

El equipo adaptó el estándar de agarre robótico ABB IRB 120 para la industria para la tarea, y luego instaló la torre Jenga en un lugar accesible para la captura, y comenzó el período de capacitación. Al principio, el robot seleccionó bloques aleatorios y el lugar en el bloque donde era necesario presionar. Luego aplicó un poco de esfuerzo, tratando de sacar el bloque de la torre.

Durante cada intento, la computadora registró las mediciones visuales y táctiles asociadas, y observó si fue exitosa.

En lugar de realizar decenas de miles de tales intentos (entonces la torre tendría que ser restaurada tantas veces), el robot entrenó solo por 300. Los intentos de mediciones y resultados similares se agruparon, lo que indica ciertos aspectos del comportamiento de los bloques. Por ejemplo, un grupo de datos podría indicar intentos de mover un bloque que se resistió al movimiento, otro, trabajar con un bloque que se movió fácilmente, y un tercero, intentos que llevaron a la caída de la torre. Para cada grupo de datos, el robot desarrolló un modelo simple que predice el comportamiento de un bloque en función de sus mediciones táctiles y visuales actuales.

Fazeli dice que dicha tecnología de agrupación aumenta seriamente la eficiencia con la que el robot aprende este juego, y se inspiró en la forma natural en que las personas agrupan comportamientos similares de los objetos. "El robot construye grupos de datos y luego aprende los modelos para cada uno de estos grupos, en lugar de aprender el modelo, describiendo todo lo que puede suceder en principio".

Pila de recogida


Los investigadores probaron su enfoque comparándolo con algoritmos MO avanzados en la simulación por computadora de un juego usando el simulador MuJoCo. Los datos obtenidos en los simuladores permiten a los científicos comprender cómo aprendería un robot en el mundo real.

"Proporcionamos estos algoritmos con los mismos datos que nuestro sistema recibe para ver cómo pueden aprender a jugar Jenga a un nivel similar", dice Oller. "En comparación con nuestro enfoque, estos algoritmos para dominar el juego tenían que jugar con el número de torres, varios órdenes de magnitud más altos que los que teníamos".

El equipo se interesó en si su enfoque de la región de Moscú podría competir con jugadores humanos, y realizó varias competiciones informales con voluntarios.

"Observamos cuántos bloques podía salir un hombre de la torre antes de que cayera, y la diferencia no fue tan grande", dice Oller.

Sin embargo, si los investigadores lo desean, hay una manera de enfrentar al robot y a los humanos. Además de la interacción física, para jugar "Jenga" necesitas una estrategia, extraer un bloque adecuado para que sea más difícil para tu oponente sacar el siguiente bloque sin dejar caer la torre.

Hasta ahora, el equipo no está tan interesado en crear un robot que gane el "Jenga", está más ocupado usando sus nuevas habilidades en otras áreas.

"Hay muchas tareas que realizamos con nuestras manos, donde la sensación de" hacerlo bien "se puede expresar en el lenguaje de la fuerza y ​​las indicaciones táctiles", dice Rodríguez. "Un enfoque similar al nuestro puede ser útil para tales tareas".

Source: https://habr.com/ru/post/441422/


All Articles