未来的机器人将通过好奇心和自我决定的目标来学习



想象一下,一个朋友要您帮他打扫房间,里面装满了各种东西和家具。但也可以想象他不会帮您,而只是向您描述并展示照片,他希望自己的房间看起来如何。这项任务似乎很无聊,但我们每个人都可以应付。小时候,我们发现了新物体,学会了识别它们并发展了处理它们的技能。在好奇心的驱使下,我们逐渐发展了视觉,注意力和感觉运动知识,从而使我们成年人能够治疗自己选择的身体环境。

当今的机器人不适用于此类任务。想象一下,有人形机器人可以帮助整理房间。假设您向机器人展示了一个处于正常,清洁状态的房间,并且当房间里一片混乱时,您命令该机器人将其移至其原始状态。在这种情况下,教导机器人将注意力转移到何处以及如何管理每个对象以将其放在正确的位置,正确的位置,或者如何构建一系列的动作将是一件很累人的事情。

而且,尽管每年都会出现新的,复杂的机器人和先进的算法,但是执行复杂的任务并为不同的任务找到未知的解决方案需要对低级运动技能相关细节进行繁琐的编程。充其量,机器人可以学习一小组僵硬的动作。将AI与生物智能的当前成就进行比较,我们将看到AI在自主性和灵活性方面仍然存在局限性。

未来的机器人将需要能够学习,以自动了解周围的环境,即基于先前获得的知识和技能的获取,修改,归纳和重组,独立确定目标并有效地获得实现这些目标的技能。这将使他们经过一点额外的培训即可将其环境从当前状态更改为用户设定为目标的各种最终状态。问题是,我们如何创建可以应对此类任务的未来机器人?

目标机器人项目


为了寻找这个问题的答案,发起了一个对使用人工智能重要的项目-欧洲项目,由意大利国家研究机构认知科学技术研究所的意大利研究小组LOCEN负责,是计算性体现神经科学实验室的监督。委员会(ISTC-CNR)。

该项目“ 符合目标的机器人 -有针对性的自主机器人学开放系统” [目标基于开放式的自主学习机器人] 排在首位的是已经收到了800名人参加的会议中资金的11个项目清单欧盟FET-OPEN调用(Future Emergent Technologies),并且是Horizo​​n 2020 EU研究计划的一部分。 LOCEN及其学术顾问Gianluca Baldassarre将协调一个包括三个欧洲重要研究小组的财团:

1. 法国心理学与知觉实验室(LPP),由巴黎神经病学与认知科学学院的Kevin O'Regan领导名为笛卡尔的儿童将进行与儿童技能和目标的获得有关的实验。

2. 在约亨·特里什(Jochen Triesch)的领导下,德国法兰克福高级研究学院(FIAS)将专注于视觉系统和运动技能的发展,类似于生物学。

3。德国达姆施塔特工业大学(TUDa)的扬·彼得斯(Jan Peters)领导的机器人专家团队将为该项目演示机器人。

GOAL-Robots遵循了之前的欧洲项目IM-CLeVeR(“内部主动累积学习型通用机器人”),其中LOCEN和以前的合作伙伴研究了内在动力(VM)在诱导生物体和机器人自我学习中的作用。虚拟机的研究始于观察儿童如何出于好奇,如何与外界互动并进行互动,获得有关事物运作方式的知识,并获得了大量与他们互动的感觉运动技能。



如果好奇心和虚拟机是人类通用性和适应性的基础,那么具有架构和算法仿真虚拟机的AI可以帮助创建一个“动力引擎”,该引擎将指导机器人进行不需要持续编程和人工训练的自主开放学习过程。

目标机器人还为开放式机器人培训的发展增加了重要组成部分:目标。目标是一个人关于世界,身体或事件的状态或一组事件的内部表示,具有两个重要的属性。首先,即使没有对世界或事件的相应状态的感知,一个人也可能引起这个想法。其次,这一挑战具有激励作用,即可以影响人格和行为的选择,专注力,并导致其学习过程达到目标。随意创建动机目标的能力(尽管是抽象的)以及它们在选择行动和训练中的用途,是行为灵活性和训练生物个体能力的关键要素。项目参与者相信为机器人提供适合于形成和追求训练目标的机制,将从根本上增加其独立学习的潜力。



任务和想法


该项目的想法是与VM和激发动力目标相关的机制的组合。特别是,VM将刺激机器人独立发现由于自身行为而发生的新的有趣事件。机器人将在好奇心的影响下探索周围的环境,并独立设置越来越复杂的目标,并以开放的方式使用它们来获得各种技能。



一个开放的获取能力的过程需要复杂的机制和各种架构组件的集成。尤其是,机器人将需要掌握新技能而又不破坏先前掌握的技能,同时还要重用先前掌握的技能,以加快新技能的获取(知识转移)。此外,他们将需要学习如何结合预先获得的技能来创建更复杂的技能。这些是当今最重要的AI挑战。为了解决这些问题,该项目将使用高级算法来处理感官信息(例如,使用深度学习网络)以及组织和使用与运动技能相关的知识(例如,使用具有回声效果的动态运动原语和神经网络[echo状态神经网络])。

与学习过程的不同部分相关的所有机制都需要集成在一个控制体系结构中:高级目标形成过程将与激励层相结合,其中基于VM的机器人将形成并选择目标。目标将逐渐与较低级别的控制器相关联,以便机器人可以回忆起获得的技能来实现所需的目标,并基于先前的技能组合来构建更复杂的技能。考虑到消除相互干扰的需求等,将整合不同技能之间的知识转移。这些机制不仅对于独立学习阶段有用,而且对于用户使用获取的知识的可能性也很有用。



每年,该项目将展示一个“演示机器人”,复杂的机器人平台(例如iCub或Kuka)将由该项目中开发的体系结构来驱动,以解决日益复杂的问题。这些演示者不仅将展示项目的进度,还将成为比较独立机器人开发进度的标准。

最终的演示者将不得不面对本文开头提出的任务:机器人是否有可能展示与人类相似的通用性和适应性,并与现实世界互动?特别是,机器人将被赋予以下任务:a)研究与订单相对应的位于容器中和货架上的多个对象的位置,以及b)在用户移动并交换对象后重现此状态。

如果GOAL-Robots项目履行了诺言,您将不再需要为懒惰的朋友担心:当他们向您求助时,您只需要您的虚构朋友就可以帮助他们!

Source: https://habr.com/ru/post/zh-CN398815/


All Articles