
Uma abordagem especial ao aprendizado de máquina pode ajudar os robôs a aprender como montar telefones e trabalhar com outras peças pequenas na linha de montagem.
No porão do terceiro prédio do MIT, o robô reflete cuidadosamente em seu próximo passo. Ele gentilmente cutuca a torre dos blocos, procurando o bloco mais adequado para o alongamento, para não destruir a torre inteira. O mesmo acontece com seu jogo solitário, lento, mas surpreendentemente dinâmico de Jenga.
O robô, desenvolvido por engenheiros do MIT, é equipado com uma alça com um pino macio, uma pulseira com um sensor de pressão e uma câmera externa - e eles usam tudo isso para ver e sentir a torre inteira e seus blocos individuais.
Enquanto o robĂ´ pressiona suavemente o bloco, o computador percebe feedback visual e tátil da câmera e da pulseira, comparando medidas com movimentos anteriores. Ele tambĂ©m calcula as possĂveis conseqĂĽĂŞncias desses movimentos - especificamente, será possĂvel extrair com ĂŞxito um determinado bloco, dada a configuração especĂfica da torre e com a aplicação de força de um determinado tamanho. EntĂŁo, em tempo real, o robĂ´ "aprende" se Ă© necessário continuar pressionando o bloco ou se Ă© necessário mudar para um novo para evitar que a torre caia.
Uma descrição detalhada do robĂ´ que jogava "Jenga" foi publicada em janeiro na revista Science Robotics. Alberto Rodriguez, Professor Associado, Career Center Walter Henry Gale, do Departamento de Engenharia do MIT, diz que o robĂ´ demonstra algo difĂcil de alcançar no desenvolvimento de sistemas anteriores: a capacidade de aprender rapidamente a melhor maneira de realizar uma tarefa, nĂŁo apenas a partir de dados visuais, cuja abordagem Ă© freqĂĽentemente usada em robĂłtica, mas tambĂ©m em tĂ©cnicas táteis e fĂsicas. interação.
“Ao contrário de tarefas ou jogos mais lĂłgicos, por exemplo, xadrez ou ir, para jogar Jenga, vocĂŞ precisa ter boas habilidades fĂsicas - para sondar, puxar, colocar e alinhar blocos. Isso requer percepção e manipulação interativas; Ă© preciso tocar a torre para entender como e quando mover os blocos, diz Rodriguez. - É muito difĂcil simular essa tarefa, portanto o robĂ´ precisa aprender no mundo real, interagindo com a verdadeira torre Jenga. A principal dificuldade Ă© a necessidade de aprender com um nĂşmero relativamente pequeno de experimentos, usando o bom senso quando aplicado a objetos e Ă fĂsica. ”
Ele diz que o sistema de aprendizado tátil desenvolvido por eles pode ser usado para outras tarefas alĂ©m da Jenga, especialmente aquelas que requerem interação fĂsica cuidadosa, como a classificação de resĂduos recicláveis ​​ou a montagem de produtos de consumo.
“Na linha de montagem de telefones, em quase todas as etapas é necessário sentir que a peça está no lugar ou que o parafuso está apertado - tudo isso vem de sensações táteis e de potência, não visuais”, diz Rodriguez. "Os modelos educacionais de tais ações são o segmento mais delicioso dessa tecnologia hoje."
O principal autor do trabalho é a estudante de graduação do MIT Nima Faseli. A equipe também inclui: Mikel Oller, Jiajun Wu, Zheng Wu e Joshua Tenenbaum, professor de ciências cognitivas e pesquisa cerebral no MIT.
Push push
No jogo "Jenga", que em suaĂli significa "construção", 54 blocos retangulares sĂŁo colocados em 18 camadas de 3 blocos cada, de modo que nas camadas adjacentes os blocos estejam perpendiculares entre si. O objetivo do jogo Ă© remover cuidadosamente os blocos e colocá-los no topo da torre, construindo um novo nĂvel para que a torre nĂŁo caia.
Para programar um robô para jogar Jenga, os esquemas tradicionais de aprendizado de máquina (MO) exigiriam descrever tudo o que poderia acontecer quando um bloco, um robô e uma torre interagem - esses são cálculos bastante caros que exigem o processamento de dados de milhares ou mesmo dezenas de milhares de tentativas para obter bloco.
Em vez disso, Rodriguez e colegas começaram a procurar uma maneira, mais eficiente, do ponto de vista do uso de dados, para o robĂ´ aprender a jogar o jogo "Jenga", inspirado nas habilidades cognitivas humanas e em como nĂłs mesmos poderĂamos abordar esse jogo.
A equipe adaptou o padrĂŁo de alça robĂłtica ABB IRB 120 para o setor para a tarefa e instalou a torre Jenga em um local acessĂvel para captura, e o perĂodo de treinamento começou. A princĂpio, o robĂ´ selecionou blocos aleatĂłrios e o local no bloco em que era necessário pressionar. EntĂŁo ele fez um pequeno esforço, tentando espremer o bloco da torre.
Durante cada tentativa, o computador registrou as medidas visuais e táteis associadas a ele e observou se foi bem-sucedido.
Em vez de realizar dezenas de milhares de tentativas desse tipo (a torre teria que ser restaurada tantas vezes), o robô treinou apenas 300. Tentativas de medidas e resultados semelhantes foram agrupados, indicando certos aspectos do comportamento dos blocos. Por exemplo, um grupo de dados pode indicar tentativas de mover um bloco que resistiu ao movimento, outro - trabalhar com um bloco que se moveu facilmente e um terceiro - tentativas que levaram à queda da torre. Para cada grupo de dados, o robô desenvolveu um modelo simples que prediz o comportamento de um bloco com base em suas atuais medidas visuais e táteis.
Fazeli diz que essa tecnologia de agrupamento aumenta seriamente a eficiĂŞncia com a qual o robĂ´ aprende esse jogo e foi inspirada na maneira natural pela qual as pessoas agrupam comportamentos semelhantes de objetos. “O robĂ´ cria clusters de dados e aprende os modelos para cada um desses clusters, em vez de aprender o modelo, descrevendo tudo o que pode acontecer em princĂpio.”
Coletando pilha
Os pesquisadores testaram sua abordagem comparando-a com algoritmos avançados de MO na simulação por computador de um jogo usando o simulador MuJoCo. Os dados obtidos nos simuladores permitem que os cientistas entendam como um robô aprenderia no mundo real.
“Fornecemos a esses algoritmos os mesmos dados que nosso sistema recebe para ver como eles podem aprender a jogar Jenga em um nĂvel semelhante”, diz Oller. "Comparado Ă nossa abordagem, esses algoritmos para dominar o jogo tiveram que jogar com o nĂşmero de torres, várias ordens de magnitude maiores do que o que tĂnhamos".
A equipe ficou interessada em saber se sua abordagem à região de Moscou poderia competir com jogadores humanos e realizou várias competições informais com voluntários.
"Vimos quantos blocos um homem poderia sair da torre antes que ela caĂsse e a diferença nĂŁo era tĂŁo grande", diz Oller.
No entanto, existe uma maneira de realmente pit o robĂ´ e os seres humanos, se os pesquisadores quiserem. AlĂ©m da interação fĂsica, para jogar "Jenga" vocĂŞ precisa de uma estratĂ©gia, extraindo um bloco adequado para que seja mais difĂcil para o seu oponente puxar o prĂłximo bloco sem derrubar a torre.
Até agora, a equipe não está tão interessada em criar um robô vencedor do "Jenga", mas está mais ocupada usando suas novas habilidades em outras áreas.
“Existem muitas tarefas que realizamos com as mãos, nas quais o sentimento de“ fazer o certo ”pode ser expresso na linguagem da força e das indicações táteis, diz Rodriguez. "Uma abordagem semelhante à nossa pode ser útil para essas tarefas."