迪士尼研究自学图像识别计划



迪士尼研究院匹兹堡分部的一组研究人员开发了一种计算机视觉系统,该系统使用了人类视觉的某些原理(pdf)。特别是,它包含用于自学习的算法,并且能够随着时间的推移改善对象识别。

像大多数其他计算机视觉系统一样,迪士尼研究中心的发展为每个对象(飞机或肥皂分配器)建立了一个概念模型。在这种情况下,将使用经过训练的算法来分析给定对象的许多照片。

迪士尼研究算法的一个显着特征是,它随后使用此模型识别视频中的对象,同时提取有关这些对象的信息并补充最初设置的模型。这使您可以识别更大范围的对象,即使它们看起来与先前遇到的样本不同。

插图(可单击)显示了模式识别的结果。上排是ImageNet数据库中的测试图像,这些图像用于训练原始模型。下一行是IDE-LME程序正确识别对象的示例。研究人员指出,照片中识别出的物体在外观上与用于训练系统的物体明显不同。迪斯尼研究中心首席研究员列昂尼德·西格尔 Leonid Sigal)说: “ [自学习]过程可能在识别系统的整个生命周期中无限期地持续下去。” “这是一个自学习系统,通过不受控制的经验获取不断发展,构成了一个日益完整和复杂的世界模型。”







随着系统遇到新信息,每个对象的概念模型正在逐步扩展和完善。从理论上讲,这种方法会导致这样的事实,即在没有监督的情况下,系统会将不常见的特征分配给对象,这将导致识别错误。但是该程序的作者说,这样的问题尚未引起注意。

除西格尔(Sigal)外,科学著作的作者包括Alina Kuznetsova,威廉·莱布尼兹大学(德国汉诺威)的Bodo Rosenhahn,以及迪士尼前雇员Sen Hwan Yu(现在国家科学研究院工作)和技术在蔚山(韩国)。

科学工作的介绍是在2015年6月7日至12日在波士顿举行的IEEE计算机视觉和模式识别会议上进行的。

Source: https://habr.com/ru/post/zh-CN380363/


All Articles