计算机和人们以不同的方式看待世界是否重要?

从某些参数来看,机器视觉优于人类。 根据其他人的说法,也许它永远不会赶上我们。




工程师最初决定教计算机看时,他们理所当然地认为计算机将像人们一样看到一切。 约克大学(York University)的IT专家约翰·托索斯John Tsotsos)说,从1960年代开始,有关计算机视觉的最初建议“显然是由人类视觉的特征所激发的”。

从那时起,情况发生了很大变化。

计算机视觉已经超出了空中城堡的舞台,变成了一个活跃的发展领域。 如今,在某些模式识别任务中,例如在图片分类(“狗还是狼?”)或医学照片中异常检测方面,计算机领先于人们。 并且,通过“神经网络”处理视觉数据的过程与人们使用的过程越来越不同。

电脑在我们自己的游戏中击败我们,并根据其他规则进行游戏。

基于计算机视觉的神经网络非常简单。 他们接收输入图像并分几个阶段对其进行处理。 首先,他们识别出像素,然后识别出脸部和轮廓,然后识别出整个物体,最后,他们对滑移的现象产生了预感。 这些系统称为直接分配神经网络,因为它们的操作类似于传送带。

我们对人类的视野了解不多,但是我们知道它并不是那样。 在我们最近的历史中,“ 数学模型揭示了视觉的秘密 ”,我们描述了一个新的数学模型,试图解释人类视觉的主要奥秘:大脑的视觉皮层如何根据从视网膜接收到的微薄信息来重现生动,准确的世界形象。

该模型假设视觉皮层能够正常工作,这要归功于一系列的神经反馈回路,这些回路可以处理来自外部世界的数据中的细微变化,变成在我们内在感知之前出现的各种图像。 此反馈过程与计算机视觉使用的直接传播方法有很大不同。

康奈尔大学的神经科学家乔纳森·维克多Jonathan Victor)说:“这项工作证明了视觉皮层与计算机视觉的复杂性,并且在某些方面有所不同。”

但是,在某些任务中,计算机视觉优于人类。 随之而来的问题是:是否甚至有必要建立基于人类的计算机视觉方案?

从某种意义上说,答案是肯定的。 到达视皮质的信息受到解剖结构的限制:相对较少的神经将视皮质连接到外界,这限制了视皮质必须处理的视觉数据量。 计算机没有这种带宽问题,因此没有理由让计算机在缺乏信息的情况下工作。

“如果我具有无限的计算能力和无限的内存,我是否需要限制信息流? 乔索斯说。 但是,他认为忽略人类的视力是不明智的。

他说,如今计算机成功分类的任务对于计算机视觉来说太简单了。 要成功解决这些问题,您只需要在海量数据集中找到相关性即可。 对于更复杂的任务,例如从不同的角度检查对象以识别它(大约是一个人如何熟悉雕像,如何从不同侧面规避它),这种关联可能是不够的。 为了正确执行,计算机可能必须向人学习。

去年, 人工智能的先驱Judah Pearl 接受我们的杂志采访时从更笼统的角度谈到了同一件事,认为相关训练不足以长期发展AI系统。

例如,人类视觉的关键特征是反应延迟。 我们处理视觉信息并得出关于所见事物的结论。 当此结论不适合我们时,我们会查看再次发生的事情,通常,第二个结果更准确地告诉我们正在发生的事情。 根据直接分配方案运行的计算机视觉系统没有这样的机会,因此,即使是最简单的模式识别任务,它们也常常会惨败。

人类视觉具有计算机视觉所缺少的另一个不那么明显但更重要的方面。

多年来,人类视觉系统一直在进步。 在Tsotsos与同事合写的2019年作品中 ,发现只有在17岁左右的人中,才能抑制场景中嘈杂的声音,这些场景充满了细节并专注于他们的需求。 其他研究人员发现,识别脸部的能力在长达20年的时间里不断提高。

计算机视觉系统通过消化大量数据来工作。 基础架构是固定的,不会随时间变化,因为它发生在大脑中。 如果基础学习机制如此不同,结果是否会有所不同? Tsotsos认为,最终的计算机视觉系统正在等待清算。

他说:“从这些深度学习方法中学习,离人类学习越远。” “因此,在我看来,死胡同正等待着他们。” 他们将达到发展的极限,超出极限,他们将无法继续前进。”

Source: https://habr.com/ru/post/zh-CN469945/


All Articles