机器视觉系统可以识别人脸,甚至可以创建逼真的人造脸。 但是研究人员发现,这些系统无法识别光学错觉,因此会产生新的错觉。

人眼是一个了不起的设备。 尽管它已经在特定的环境中发展了数百万年,但它能够执行从未在早期视觉系统中遇到过的任务。 一个很好的例子是阅读或定义人造物体-汽车,飞机,交通标志等。
但是视觉系统有一系列众所周知的缺陷,我们将其视为错觉。 研究人员已经发现了许多选择,这些选择会导致人们错误地评估颜色,大小,相对位置和运动。
幻觉本身很有趣,因为它们可以使人了解视觉系统和感知的本质。 因此,提出一种寻找新幻觉的方法将非常有用,它将有助于研究该系统的局限性。
同心圆?在这里,我们应该进行方便的深入培训。 近年来,机器已经学会了识别图像中的对象和面部,然后创建相似的图像。 不难想象,机器视觉系统应该能够识别幻象并创建自己的幻象。
来自肯塔基州路易斯维尔大学的罗伯特·威廉姆斯(Robert Williams)和罗曼·扬波斯基(Roman Yampolsky)登台献艺。 这些家伙
试图推动这样的事情 ,但发现一切并非如此简单。 现有的机器学习系统无法传递自己的错觉-至少现在还没有。 为什么这样
首先,一般信息。 深度学习的最新进展基于两个突破。 首先是强大的神经网络的可用性以及一些使它们学习得很好的软件技巧。
第二个是在数量上创建巨大的标记数据库,并以此为基础来学习机器。 例如,要教机器识别脸部,它需要拍摄成千上万张包含清晰标记脸部的图像。 有了这些信息,神经网络就可以学会识别脸部的特征模式-两只眼睛,鼻子和嘴巴。 更令人印象深刻的是一对网络-所谓的
产生性竞争网络 (GSS)-能够互相教how如何创建真实,完全人工的面部图像。
威廉姆斯(Williams)和扬波斯基(Yampolsky)设想教给神经网络确定错觉。 计算能力足够,并且没有足够的合适的数据库。 因此,他们的首要任务是创建一个用于训练的错觉数据库。
事实证明这很难做到。 他们说:“只有数千种静态光学错觉,而且独特类型的错觉非常少-可能只有几十种。”
这是现代机器学习系统的严重障碍。 他们说:“创建一个可以从如此小的有限数据集中学习的模型,对于生成模型和对人类视觉的理解将是一个巨大的飞跃。”
因此,威廉姆斯(Williams)和扬波斯基(Yampolsky)收集了一个包含6,000多个光学幻觉图像的数据库,并训练了神经网络来识别它们。 然后,他们创建了GSS,该GSS应该独立创建光学错觉。
结果令他们失望。 研究人员说:“在Nvidia Tesla K80上进行了七个小时的培训之后,没有创造任何有价值的东西。”他打开了数据库供所有人使用。
但是,结果很有趣。 他们指出:“我们已知的唯一错觉是由进化(例如,蝴蝶翅膀上的眼图)或人类艺术家创造的。” 在这两种情况下,人们在提供反馈中都起着至关重要的作用-人们可以看到这种错觉。
机器视觉系统无法做到。 威廉姆斯和扬波尔斯基说:“如果不了解幻象的基本原理,GSS就不可能学会欺骗他们的视线。”
这可能具有挑战性,因为人机视觉与机器视觉系统之间存在重大差异。 许多研究人员创建的神经网络甚至更让人联想到人类的视觉系统。 这些系统有趣的检查之一可能是它们是否可以看到幻觉。
同时,威廉姆斯和扬波斯基并不乐观:“显然,带有幻觉的数据集可能不足以创造新的幻觉,”他们说。 因此,就目前而言,错觉仍然是人类感知的堡垒,不受机器的约束。