麻省理工学院的机器人学习如何面对不确定性一起运送啤酒
机器人调酒师和两名机器人侍者在麻省理工学院计算机科学和人工智能实验室,他们开发了一种基本方法来协调多个机器人的动作。该方法基于在随机性,不确定性和有限交流的情况下计划联合活动的模型(科学工作,pdf)。联合行动计划算法基于通用的MacDec-POMDP模型,但通常使用作为有限状态控制器呈现的行动规则,而不是在预定义的决策树中查找规则。该视频显示了像服务员一样的机器人盒子如何绕着办公室开车并为人们提供饮料。想要喝啤酒的人按下机器人身体上的按钮。服务员在房间地图上记住患者的位置,然后离开。
服务员去了酒保机器人-这是Willow Garage PR2模型(与开源软件一起提供)。他将一瓶冰镇饮料放入容器中,以便在服务员的箱子上运输-移动机器人会根据记录的坐标返回。同时,他可以带着同一个房间中另一个机器人服务员接受的订单。科学工作的作者认为,最终决策者比决策树更加准确,简洁地描述了行动。这样的描述更易于解释,它们允许在可能采取的行动的“无尽视野”中开展工作。针对必要动作而开发的搜索算法需要更简单的模拟器,该模拟器仅对给定的一组电动机的结果进行建模。因此,与现有的MacDec-POMDP调度程序相比,新算法能够解决更多的问题。麻省理工学院的一组研究人员改进了马尔可夫决策过程(MDP)。它为在结果是部分随机的情况下进行决策建模提供了数学基础。酒保机器人和侍者机器人的活动表明,协调行动和决策的新方法适用于实际任务。在这种情况下,环境在不断变化。人们可以在不同的地方并更改他们的位置,这不会干扰机器人“啤酒团队”的功能。相同的原则适用于协调其他机器人组的动作。例如,救援队,消防员,秩序井然或警察。Source: https://habr.com/ru/post/zh-CN382961/
All Articles