RobĂ´ do MIT aprende Jenga confiando na visĂŁo e no toque



Uma abordagem especial ao aprendizado de máquina pode ajudar os robôs a aprender como montar telefones e trabalhar com outras peças pequenas na linha de montagem.

No porão do terceiro prédio do MIT, o robô reflete cuidadosamente em seu próximo passo. Ele gentilmente cutuca a torre dos blocos, procurando o bloco mais adequado para o alongamento, para não destruir a torre inteira. O mesmo acontece com seu jogo solitário, lento, mas surpreendentemente dinâmico de Jenga.

O robô, desenvolvido por engenheiros do MIT, é equipado com uma alça com um pino macio, uma pulseira com um sensor de pressão e uma câmera externa - e eles usam tudo isso para ver e sentir a torre inteira e seus blocos individuais.

Enquanto o robô pressiona suavemente o bloco, o computador percebe feedback visual e tátil da câmera e da pulseira, comparando medidas com movimentos anteriores. Ele também calcula as possíveis conseqüências desses movimentos - especificamente, será possível extrair com êxito um determinado bloco, dada a configuração específica da torre e com a aplicação de força de um determinado tamanho. Então, em tempo real, o robô "aprende" se é necessário continuar pressionando o bloco ou se é necessário mudar para um novo para evitar que a torre caia.

Uma descrição detalhada do robô que jogava "Jenga" foi publicada em janeiro na revista Science Robotics. Alberto Rodriguez, Professor Associado, Career Center Walter Henry Gale, do Departamento de Engenharia do MIT, diz que o robô demonstra algo difícil de alcançar no desenvolvimento de sistemas anteriores: a capacidade de aprender rapidamente a melhor maneira de realizar uma tarefa, não apenas a partir de dados visuais, cuja abordagem é freqüentemente usada em robótica, mas também em técnicas táteis e físicas. interação.

“Ao contrário de tarefas ou jogos mais lógicos, por exemplo, xadrez ou ir, para jogar Jenga, você precisa ter boas habilidades físicas - para sondar, puxar, colocar e alinhar blocos. Isso requer percepção e manipulação interativas; é preciso tocar a torre para entender como e quando mover os blocos, diz Rodriguez. - É muito difícil simular essa tarefa, portanto o robô precisa aprender no mundo real, interagindo com a verdadeira torre Jenga. A principal dificuldade é a necessidade de aprender com um número relativamente pequeno de experimentos, usando o bom senso quando aplicado a objetos e à física. ”

Ele diz que o sistema de aprendizado tátil desenvolvido por eles pode ser usado para outras tarefas além da Jenga, especialmente aquelas que requerem interação física cuidadosa, como a classificação de resíduos recicláveis ​​ou a montagem de produtos de consumo.

“Na linha de montagem de telefones, em quase todas as etapas é necessário sentir que a peça está no lugar ou que o parafuso está apertado - tudo isso vem de sensações táteis e de potência, não visuais”, diz Rodriguez. "Os modelos educacionais de tais ações são o segmento mais delicioso dessa tecnologia hoje."

O principal autor do trabalho é a estudante de graduação do MIT Nima Faseli. A equipe também inclui: Mikel Oller, Jiajun Wu, Zheng Wu e Joshua Tenenbaum, professor de ciências cognitivas e pesquisa cerebral no MIT.


Push push


No jogo "Jenga", que em suaíli significa "construção", 54 blocos retangulares são colocados em 18 camadas de 3 blocos cada, de modo que nas camadas adjacentes os blocos estejam perpendiculares entre si. O objetivo do jogo é remover cuidadosamente os blocos e colocá-los no topo da torre, construindo um novo nível para que a torre não caia.

Para programar um robô para jogar Jenga, os esquemas tradicionais de aprendizado de máquina (MO) exigiriam descrever tudo o que poderia acontecer quando um bloco, um robô e uma torre interagem - esses são cálculos bastante caros que exigem o processamento de dados de milhares ou mesmo dezenas de milhares de tentativas para obter bloco.

Em vez disso, Rodriguez e colegas começaram a procurar uma maneira, mais eficiente, do ponto de vista do uso de dados, para o robô aprender a jogar o jogo "Jenga", inspirado nas habilidades cognitivas humanas e em como nós mesmos poderíamos abordar esse jogo.

A equipe adaptou o padrão de alça robótica ABB IRB 120 para o setor para a tarefa e instalou a torre Jenga em um local acessível para captura, e o período de treinamento começou. A princípio, o robô selecionou blocos aleatórios e o local no bloco em que era necessário pressionar. Então ele fez um pequeno esforço, tentando espremer o bloco da torre.

Durante cada tentativa, o computador registrou as medidas visuais e táteis associadas a ele e observou se foi bem-sucedido.

Em vez de realizar dezenas de milhares de tentativas desse tipo (a torre teria que ser restaurada tantas vezes), o robô treinou apenas 300. Tentativas de medidas e resultados semelhantes foram agrupados, indicando certos aspectos do comportamento dos blocos. Por exemplo, um grupo de dados pode indicar tentativas de mover um bloco que resistiu ao movimento, outro - trabalhar com um bloco que se moveu facilmente e um terceiro - tentativas que levaram à queda da torre. Para cada grupo de dados, o robô desenvolveu um modelo simples que prediz o comportamento de um bloco com base em suas atuais medidas visuais e táteis.

Fazeli diz que essa tecnologia de agrupamento aumenta seriamente a eficiência com a qual o robô aprende esse jogo e foi inspirada na maneira natural pela qual as pessoas agrupam comportamentos semelhantes de objetos. “O robô cria clusters de dados e aprende os modelos para cada um desses clusters, em vez de aprender o modelo, descrevendo tudo o que pode acontecer em princípio.”

Coletando pilha


Os pesquisadores testaram sua abordagem comparando-a com algoritmos avançados de MO na simulação por computador de um jogo usando o simulador MuJoCo. Os dados obtidos nos simuladores permitem que os cientistas entendam como um robô aprenderia no mundo real.

“Fornecemos a esses algoritmos os mesmos dados que nosso sistema recebe para ver como eles podem aprender a jogar Jenga em um nível semelhante”, diz Oller. "Comparado à nossa abordagem, esses algoritmos para dominar o jogo tiveram que jogar com o número de torres, várias ordens de magnitude maiores do que o que tínhamos".

A equipe ficou interessada em saber se sua abordagem à região de Moscou poderia competir com jogadores humanos e realizou várias competições informais com voluntários.

"Vimos quantos blocos um homem poderia sair da torre antes que ela caísse e a diferença não era tão grande", diz Oller.

No entanto, existe uma maneira de realmente pit o robô e os seres humanos, se os pesquisadores quiserem. Além da interação física, para jogar "Jenga" você precisa de uma estratégia, extraindo um bloco adequado para que seja mais difícil para o seu oponente puxar o próximo bloco sem derrubar a torre.

Até agora, a equipe não está tão interessada em criar um robô vencedor do "Jenga", mas está mais ocupada usando suas novas habilidades em outras áreas.

“Existem muitas tarefas que realizamos com as mãos, nas quais o sentimento de“ fazer o certo ”pode ser expresso na linguagem da força e das indicações táteis, diz Rodriguez. "Uma abordagem semelhante à nossa pode ser útil para essas tarefas."

Source: https://habr.com/ru/post/pt441422/


All Articles