麻省理工机器人学会依靠视觉和触觉学习积木



一种特殊的机器学习方法可以帮助机器人学习如何组装电话以及如何与组装线上的其他小零件一起工作。

在麻省理工学院3号楼的地下室,机器人仔细考虑了下一步行动。 他从砌块上轻轻刺出塔,寻找最合适的砌块进行拉伸,以免破坏整个塔。 他的孤独,缓慢但令人惊讶的充满活力的Jenga游戏也是如此。

该机器人由麻省理工学院的工程师开发,配备有带软销的手柄,带压力传感器的手镯和外部摄像头-他们使用所有这些功能可以看到并感觉到整个塔楼及其各个区块。

当机器人轻轻地按在块上时,计算机会从相机和手镯上感知视觉和触觉反馈,并将测量结果与之前的动作进行比较。 他还计算了这些举动可能带来的后果-具体来说,如果塔具有特定的配置并施加一定大小的力,则有可能成功地提取特定的块。 然后,机器人会实时“学习”是否有必要继续在砌块上施加压力,或者是否有必要切换到新的结构以防止塔楼掉落。

一月份在《科学机器人》杂志上发表了有关玩“积木”的机器人的详细说明。 职业中心副教授Alberto Rodriguez 麻省理工学院工程系的沃尔特·亨利·盖尔(Walter Henry Gale)表示,该机器人演示了开发以前的系统时难以实现的一些功能:快速学习完成任务的最佳方法的能力,不仅是从视觉数据(机器人技术中经常使用的方法),还是从触觉,物理方法互动。

“与象棋或围棋这样更具逻辑性的任务或游戏不同,要玩Dzhenga,您需要具有良好的身体技能-探测,拉动,放置和对齐方块。 Rodriguez说,这需要交互式的感知和操纵,您需要触摸塔以了解如何以及何时移动砖块。 -模拟这样的任务非常困难,因此机器人必须在现实世界中学习,并与真实的Jenga塔互动。 主要的困难是需要从相对较少的实验中学习,并在将其应用于物体和物理时使用常识。”

他说,他们开发的触觉学习系统可以用于除Jenga以外的任务,尤其是那些需要进行仔细物理交互的任务,例如分类可回收废物或组装消费品。

Rodriguez说:“在电话的装配线上,几乎每一个步骤,您都需要感觉到零件已安装到位,或者拧紧了螺丝-所有这些都来自触觉和动力感,而不是视觉感。” “这种行为的教育模型是当今这项技术最可口的部分。”

这项工作的主要作者是麻省理工学院的研究生尼玛·法塞利。 该团队还包括:麻省理工学院认知科学和脑研究教授Mikel Oller,吴佳俊,郑铮和Joshua Tenenbaum。


推推


在游戏“ Jenga”(在斯瓦希里语中意为“构建”)中,将54个矩形块放置在18个层中,每个块3个块,因此在相邻的层中,这些块彼此垂直放置。 游戏的目的是小心地移除障碍物,并将其放置在塔顶上,建立一个新的高度,以使塔不倒下。

为了对机器人进行积木编程,传统的机器学习(MO)方案通常需要描述当块,机器人和塔相互作用时可能发生的一切-这些运算非常昂贵,需要处理成千上万次尝试获得的数据块。

取而代之的是,Rodriguez及其同事开始寻找一种方法,从使用数据的角度出发,让机器人学习如何玩“ Jenga”游戏,这是受人类认知能力以及我们自己如何玩此游戏的启发。

团队针对该任务调整了适用于行业的ABB IRB 120机器人抓地力标准,然后将Jenga塔安装在易于获取的地方以进行抓捕,培训期开始了。 首先,机器人会选择随机的块并在块上选择需要按的位置。 然后,他花了点力气,试图将积木从塔中挤出。

在每次尝试期间,计算机都会记录与之相关的视觉和触觉测量,并记录是否成功。

机器人没有进行数万次这样的尝试(那样,塔就必须被修复很多次),而是只训练了300人。对相似的测量和结果的尝试进行了分组,表明了模块行为的某些方面。 例如,一组数据可以指示试图移动阻止移动的块,另一组数据可以指示移动容易阻止的块,而第三组数据则导致导致塔倒塌的尝试。 对于每个数据组,该机器人都开发了一个简单的模型,该模型可以根据其当前的视觉和触觉测量来预测其行为。

Fazeli说,这种分组技术极大地提高了机器人学习该游戏的效率,并且受到了人们对物体相似行为进行分组的自然方式的启发。 “机器人会构建数据集群,然后学习每个集群的模型,而不是学习模型,而是描述原则上可能发生的一切。”

收集栈


研究人员通过将其与使用MuJoCo模拟器进行游戏计算机模拟的高级MO算法进行比较,测试了他们的方法。 在模拟器中获得的数据使科学家能够了解机器人如何在现实世界中学习。

Oller说:“我们为这些算法提供了系统接收到的相同数据,以了解它们如何学习在类似水平上玩积木。” “与我们的方法相比,这些掌握游戏的算法必须与塔的数量一起玩,比我们的塔高几个数量级。”

该团队对他们在莫斯科地区的做法是否可以与人类运动员竞争感兴趣,并与志愿者举行了几次非正式比赛。

Oller说:“我们研究了一个人从塔上掉下来可以走出多少个障碍,而且差别并不大。”

但是,如果研究人员愿意的话,有一种方法可以使机器人和人类真正陷入困境。 除了身体上的互动,要玩“积木”,您还需要制定策略,提取一个合适的盖帽,这样对手很难在不丢下塔的情况下退出下一个盖帽。

到目前为止,该团队对创建赢得“ Jenga”机器人的兴趣不大,它在其他领域使用新技能更加忙碌。

罗德里格斯说:“我们用手执行许多任务,其中“做对了”的感觉可以用力量和触觉提示的语言来表达。 “对于此类任务,类似于我们的方法可能会派上用场。”

Source: https://habr.com/ru/post/zh-CN441422/


All Articles