Google DeepMind教会AI一眼识别物体



众所周知,人工智能需要成千上万的示例来学习如何识别新对象。在这种情况下,他的能力远不如一个人能够识别一位代表的一类物体。此外,训练神经网络的过程非常耗时。公司DeepMind,谷歌的单位处理在人工智能领域的发展,已经找到解决的办法。

DeepMind的研究人员对深度学习算法进行了几项更正,使该算法可以使用神经网络和外部存储器之间的连接从一个示例中识别图像或其他物体。这项技术称为一次性训练。开发团队在带有标签的大型图像数据库以及书面和语音演示中演示了该方法的工作。

最好的算法可以可靠地识别对象,但是为此,它们需要大量的数据和时间。该算法经过训练可以识别道路上的汽车,必须研究数千个示例,才能在具有自动驾驶功能的汽车中自信地工作。收集大量数据通常是不切实际的:可以帮助您在陌生区域中导航的机器人不必花费大量时间进行学习。

为了解决这个问题,DeepMind研究人员Oriol Vinyals向深度学习系统添加了一个内存组件,该组件是一种经过训练的神经网络,可以通过调整大量相互连接的层来识别事物,从而对它们进行了识别。他的工作类似于人脑中的神经元。为了使这样的网络有效地工作,它需要查看大量图像来微调虚拟神经元之间的连接。

DeepMind团队展示了基于ImageNet数据库的更新系统的功能,该数据库由斯坦福大学和普林斯顿大学的科学家开发。它根据英语WordNet的词汇数据库的层次结构进行组织是的,到目前为止,它仅适用于名词。使用新软件,人工智能仍然需要分析数百种图像,但是在此之后,它可以学习从单个图像识别新对象。该算法有效地确定了使其独特的对象特征。与竞争方法相比,ImageNet识别精度从87.6%提高到93.2%。 Vinyals


的神经网络


体系结构表示,它们的发展对于识别新词的含义特别有用。他认为,这对于Google至关重要,因为该算法可使系统快速检查新搜索条件的含义。

韩国先进技术研究所(KAIST)脑与机器智能实验室负责人Sang Wang Lee说:“我认为这是一种非常有趣的方法,它允许您一次在如此大量的数据中训练网络。”)但是,其他科学家并不急于赞扬DeepMind团队的成就。他们对它的有用性表示怀疑,因为提出的方法仍远未达到人类学习的速度。正如哈佛大学脑部副教授萨姆·格什曼(Sam Gershman)正确指出的那样,当人们学会从其组成部分“组装”图像时,他们是基于对世界或常识的了解而做的。也就是说,Segway的外观可能与自行车或摩托车截然不同,但可以由相同的零件组装而成。两位科学家都同意,机器智能需要很长时间才能达到人类的能力。

科学距离揭示“一次性”人脑训练的秘密还相差很远。但是,谷歌研究人员的成就为值得进一步研究的科学家设定了新的目标。

“一次性”训练的技术以前是已知的,但是它不适用于深度学习算法。去年的一个培训项目中,使用了包括该技术在内的概率编程技术。实际上,该程序使用虚拟笔的笔触为每个字符生成了独特的算法。该软件并没有模仿孩子学习写作和阅读的过程,但是它类似于成年人学习新语言时的学习方式。

如果我们添加记忆机制,则深入研究系统将变得更加强大。 Google DeepMind的另一个小组最近成立具有工作记忆的网络是可区分的神经计算机。他不仅可以执行复杂的任务,还可以决定将哪些信息保留在他的记忆中。因此,AI在研究了一些简单的网络图后学会了在伦敦地铁系统中导航。像普通计算机一样,这种网络使用其内存来管理复杂的数据结构。同时,可以基于数据(例如神经网络)来训练系统。科学家对可区分的神经计算机寄予厚望。这种计算机的改进版本将能够扫描Wikipedia并记住所有重要的名称,地点和日期,并以全新的方式使用此知识。

Source: https://habr.com/ru/post/zh-CN399015/


All Articles