Robôs do MIT aprendem a distribuir cerveja juntos diante da incerteza


Barman robô e dois garçons robóticos

No Laboratório de Ciência da Computação e Inteligência Artificial do Instituto de Tecnologia de Massachusetts, eles desenvolveram um método fundamental para coordenar as ações de vários robôs. O método é baseado em um modelo para o planejamento de atividades conjuntas no contexto de estocástica, incerteza e comunicações limitadas ( trabalho científico, pdf ).

O algoritmo de planejamento de ação conjunta é baseado no modelo geral MacDec-POMDP, mas usa regras de ação apresentadas na forma de controladores de estado finito, em vez de procurar regras em uma árvore de decisão predefinida, como geralmente é o caso.



O vídeo mostra como caixas de robôs, como garçons, circulam pelo escritório e oferecem bebidas às pessoas. Aqueles que querem cerveja apertam um botão no corpo do robô. O garçom lembra a localização do doente no mapa da sala e sai.



O garçom vai para o robô barman - este é o modelo Willow Garage PR2 (disponível com software de código aberto). Ele coloca um pote de bebida gelada em um recipiente para transporte no estojo do garçom - e o robô móvel retorna de acordo com as coordenadas registradas. Ao mesmo tempo, ele pode levar consigo um pedido aceito por outro robô-garçom na mesma sala.

Os autores do trabalho científico acreditam que os operadores finais descrevem as ações com muito mais precisão e concisão do que a árvore de decisão. Tais descrições são mais fáceis de interpretar e permitem trabalhar no “horizonte infinito” de possíveis ações. O algoritmo de pesquisa desenvolvido para as ações necessárias requer um simulador muito mais simples que modela apenas o resultado de um determinado conjunto de motores. Assim, o novo algoritmo é capaz de resolver um conjunto muito maior de problemas do que os agendadores MacDec-POMDP existentes.

Um grupo de pesquisadores do Instituto de Tecnologia de Massachusetts melhorou o processo de tomada de decisão de Markov (MDP). Serve como base matemática para modelar a tomada de decisão em situações em que os resultados são parcialmente aleatórios.

As atividades dos robôs bartender e garçons são uma demonstração de que o novo método de coordenação de ações e tomada de decisões é adequado para uso em tarefas práticas. Nesse caso, o ambiente está mudando constantemente. As pessoas podem estar em lugares diferentes e mudar sua localização, o que não interfere no funcionamento da "equipe de cerveja" robótica.

Os mesmos princípios são adequados para coordenar as ações de outros grupos de robôs. Por exemplo, equipes de resgate, bombeiros, enfermeiros ou policiais.

Source: https://habr.com/ru/post/pt382961/


All Articles