智能汽车必须从新皮质学习什么

图片

电脑改变了工作和娱乐,交通和医药,游戏和体育活动。 尽管这些机器发挥了全部功能,但它们仍然无法执行儿童可以处理的最简单的任务-例如,在未知的房间中移动或使用铅笔。

最后,可以解决此问题。 它会出现在两个研究领域的交汇处:大脑的逆向发展和人工智能的繁茂开花区域。 在未来的20年中,这两个领域将合并并开启智能机器的新时代。

为什么我们需要了解大脑如何制造智能汽车? 尽管诸如深度神经网络之类的机器学习技术最近已显示出令人印象深刻的结果,但它们距离智能化还很远,无法以我们的方式理解和采取行动。 智力的唯一例子是学习,计划和执行计划的能力。 因此,我们必须了解人类智能的基本原理,并将其用于真正的智能机器的开发中。

我们的Numenta公司位于红木城。 在加利福尼亚,我们研究了新皮层 (新皮层),它是大脑最大的组成部分,也是负责智力的主要部分。 我们的目标是了解它的工作原理,并确定人类意识的基础。 近年来,我们通过定义生物学智能的几个属性,在我们的工作中取得了巨大成功,我们认为这些属性应被纳入未来的思维机器中。

要了解这些特性,您需要从生物学的基础开始。 人的大脑类似于爬行动物的大脑。 它们具有控制反射的脊髓。 控制自主行为(如呼吸和心律)的脑干; 中脑,控制情绪和简单行为。 但是人类和所有哺乳动物都拥有爬行动物所没有的东西:新皮层。

Neocortex是2毫米厚的折叠板。 如果可以拉伸,那将是大餐巾的大小。 在人类中,它占据了大脑的75%。 正是这部分使我们变得聪明。

在出生时,新皮层几乎一无所知;它是通过经验学习的。 我们了解世界的所有内容-驾驶汽车,在自动售货机中煮咖啡以及我们每天与之互动的数千种其他事物-都存储在新皮质中。 他了解这些对象是什么,它们在哪里以及它们的行为方式。 新大脑皮层生成用于运动的命令,因此当您烹饪食物或编写程序时,正是新大脑皮层控制这种行为。 新大脑皮层也创造并理解了一种语言。

像整个大脑和神经系统一样,新皮层由称为神经元的细胞组成。 因此,要了解大脑的工作原理,我们需要从神经元开始。 您的新皮层包含约300亿个神经元。 典型的神经元有一个像尾巴的轴突和几个像树突的树突 。 如果您想象神经元是特定的信号系统,那么轴突就是发射器,树突就是接收器。 在树突的分支上有5,000-10,000个突触,每个突触都连接到其他神经元的相同突触。 总共,大脑中有超过100万亿个突触连接。

您对外界的体验-您认识朋友的脸,欣赏音乐,用手中握着肥皂-是由于眼睛,耳朵和其他感觉的输入传递到您的新皮层以及强迫的神经元群而产生的锻炼。 当神经元激发时,其电化学爆发沿轴突行进,并通过突触到达其他神经元。 如果接收神经元接收到足够的输入脉冲,则它可以作为响应触发并激活其他神经元。 在新皮层中包含的300亿个神经元中,有1-2%的神经在任何时候工作,这意味着在任何给定的时间,数百万个神经元都处于活动状态。 当您移动并与世界互动时,活动神经元的集合会发生变化。 您的平静感(可以考虑合理的经验)取决于活动神经元模式的不断变化。

在这些新皮层中,由于形成了新的突触而将这些图形存储起来。 它们的存储空间使您可以在再次看到它们时识别其面孔和位置,并从内存中调用它们。 例如,当您想到朋友的脸时,新大脑皮层中就会出现触发的神经元模式,类似于您真正看到他的脸时所出现的模式。

令人惊讶的是,新皮层既简单又复杂。 它很复杂,因为它分为数十个站点,每个站点负责不同的意识功能。 在每个区域中,都有许多层神经元以及数十种类型的神经元,这些神经元连接成复杂的复合体。

Neocortex可以称为简单,因为每个位置的细节几乎相同。 在进化过程中,出现了一种适用于新皮层所做的所有事情的算法。 这种通用算法的存在是一个令人振奋的事实,因为如果我们可以解密它,那么我们就可以理解“智能”概念的实质,并将这种知识引入未来的机器中。

但这不是AI的作用吗? 并非所有基于“ 神经网络 ”的AI都类似于大脑中存在的AI? 不完全是 人工智能技术确实是指神经生物学,但是它们使用了过于简化的神经元模型,错过了真实神经元的主要方面,并且它们的连接方式与真实和复杂的大脑结构不同。 有很多差异,而且很重要。 这就是为什么当今的AI在图像标记或语音识别方面做得很好,但是却不能推理,计划和创新的原因。

在了解新大脑皮层如何工作方面的最新进展使我们推测如何布置未来的思维机器。 我将尝试描述生物情报的这些必要方面,但现代AI中却没有这些方面。 这些是重新组装训练,分布式表示以及与使用运动教授世界现实有关的实现。

通过重新布线进行学习:大脑表现出与学习相关的惊人特性。 首先,我们学习很快。 其次,培训是循序渐进的。 我们可以学习新的东西,而无需从头开始训练大脑,也不会忘记我们已经教过的东西。 第三,大脑在不断学习。 环游世界,计划并采取行动,我们不会停止学习。 快速,增量和持续的培训是使智能系统适应不断变化的世界必不可少的要素。 神经元负责学习,而真实神经元的复杂性使其成为强大的学习机。

近年来,神经科学家已经了解了一些有关树突的有趣事实。 它的每个分支都是一组模式识别。 事实证明,分支上的15-20个主动突触足以识别大量神经元中的活动模式。 因此,单个神经元可以识别数百种不同的模式。 其中一些使它起作用,而其他一些则改变了细胞的内部状态,并作为对未来行动的预测。

一次,神经科学家认为,学习仅通过修改现有突触的有效性来进行,因此,当传入信号到达时,神经元通过突触开启的可能性就会降低或增加。 但是现在我们已经知道,大多数训练是由于细胞之间新突触的培养-大脑的“重组”。 每天多达40%的神经元突触被新的突触取代。 新的突触导致神经元之间出现新的通信方案,并因此导致新的记忆。 由于树突的分支几乎是独立的,因此当神经元学会识别其中一个树突上的新模式时,它不会阻止神经元已经与其他树突一起学习。

这就是为什么我们可以在不打破旧记忆的情况下学习新事物的原因,并且每次学习新事物时都不需要从头开始训练大脑。 当今的神经网络没有这种功能。



智能机器不必模拟生物神经元的整个复杂性,但是必须通过树突获得机会并通过重新组装进行培训。 这些功能应该在未来的AI系统中。

分布式视图:大脑和计算机以不同方式呈现信息。 计算机内存中可能会出现零和一的任何组合,因此,如果更改一位,则可能会导致含义上的完全变化-就像在“ cat”一词中将字母“ o”替换为“ and”一样会产生与之无关的信息“鲸鱼”一词。 这种观点是不可靠的。

大脑使用所谓的 稀疏分布式表示 (SDR)。 之所以称它们为稀疏,是因为在任何给定时间,活动相对较少。 当您移动或思考时,神经元的活动不断变化,但它们所占的百分比始终很小。 如果我们想象每个神经元都是一个位,那么大脑会使用数千个位来表示信息(远远超过计算机中的8位或64位表示),但是在任何时刻只有一小部分位是1; 所有其他均为0。

假设您要介绍使用SDR的猫的概念。 您可以使用10,000个神经元,其中100个将处于活动状态,每个活动的神经元代表猫的某个方面,例如“宠物”,“蓬松”,“爪状”。 如果几个神经元死亡,或者几个新神经元死亡,那么新的SDR仍然是关于猫的好主意,因为在大多数情况下,活动神经元是相同的。 因此,代替了不可靠的表示,SDR具有抗错误和抗噪声的功能。 当我们构建大脑的硅版本时,它们将具有固有的容错能力。

我想提一下SDR的两个功能。 首先,重叠使比较两件事变得更容易,并使您了解它们之间的相似之处和不同之处。 假设一个SDR代表一只猫,另一只代表鸟。 在两个SDR中,相同的神经元组将处于活动状态,代表“宠物”和“爪状”,而不是“蓬松”。 这个例子被简化了,但是叠加特性很重要,因为有了它,大脑可以立即理解物体的相似性和差异性。 此属性使他能够概括计算机缺少的内容。

第二个属性,联想,使大脑可以同时代表几个想法。 想象一下,我看到一只动物在灌木丛中奔跑,但是我只能短暂地看到它,所以我不确定我看到了什么。 它可能是猫,狗或猴子。 由于SDR是分布式的,因此一组神经元可以同时激活所有三个SDR,而不会彼此混淆,因为SDR不会相互干扰。 神经元不断形成SDR池的能力使其成为处理不确定性的好工具。

这些SDR属性对于大脑的理解,思考和计划至关重要。 如果不使用SDR,我们将无法创建智能机。

实施例:新皮层接收来自感官的输入。 每当我们移动眼睛,四肢或躯干时,感官的输入就会改变。 这种不断变化的输入是大脑用于学习的主要机制。 想象给您一个您从未见过的物体。 让它成为订书机。 您将如何学习? 您可以通过从不同角度查看它来解决它。 您可以抬起,用手指握住,然后把手放进去。 您可以推拉以查看他的举止。 在此交互过程中,您将研究订书机的形状,对订书机的感觉,外观和行为。 您做出动作,感受到输入的变化,再做一次,再次感受到变化,依此类推。 通过运动学习是学习大脑的主要方式。 这将是任何真正智能系统的核心组成部分。

我不想说一台智能机器需要一个身体,只是它可以通过运动来改变感觉。 例如,虚拟AI可以通过链接和打开文件在网络上“移动”。 他可以通过虚拟运动来研究虚拟世界的结构,类似于我们在建筑物周围行走的方式。

这使我们想到了去年在Numenta取得的重要发现。 在新大脑皮层中,感觉数据由图的层次结构处理。 当数据从层次结构的一个层次传递到另一层次时,会从中抽取越来越复杂的特征,直到在某个时刻无法识别对象为止。 深度学习网络也使用层次结构,但是它们通常需要100个级别的处理才能进行图像识别,而要获得相同结果的新大脑皮层仅需花费4级。 深度学习网络还需要数百万个训练示例,并且新皮质可以通过一些动作和感觉就能学习新对象。 大脑所做的事情与典型的人工神经网络所做的事情根本不同-但是呢?

19世纪的德国物理学家德国亥姆霍兹是最早对此问题提供解答的人之一。 他看到,尽管我们的眼睛每秒移动三到四次,但我们的视觉感知仍然稳定。 他计算得出大脑会考虑到眼睛的运动,否则在我们看来,整个世界都在这里和那里跳跃。 同样,如果您触摸某物,那么如果您的大脑只处理触觉而又不知道手指在动,您就会感到困惑。 将运动与感觉变化结合起来的这一原理称为感觉运动整合 。 大脑中感觉运动整合的方式和位置是一个谜。

我们发现感觉运动整合发生在新皮层的所有部分。 这不是一个单独的步骤,而是感觉处理不可或缺的一部分。 感觉运动集成是新皮质“智能算法”的关键部分。 我们有一个关于神经元如何做到这一点的理论和模型,它与新皮层区域的复杂解剖结构很好地重叠。

此发现对机器智能有何意义? 考虑可以在计算机上找到的两种文件类型。 一个是相机拍摄的图像,另一个是在计算机上开发的设计,例如Autodesk文件。 图像是视觉细节的二维阵列。 CAD文件也是一组零件,但是每个零件都与三维空间中的布置相关联。 CAD文件模拟三维对象,而不是从特定角度看对象的外观。 使用CAD文件,您可以从任何角度预测对象的外观,并确定其与其他三维对象的交互方式。 您不能对图像执行此操作。 我们发现,新皮质的每个部分都以与CAD程序几乎相同的方式学习对象的三维模型。 每次您的身体移动时,新皮质都会感知当前的运动命令,将其转换为对象坐标系中的某个位置,并将该位置与从感官获得的数据结合起来,以构建世界的三维模型。

回想起来,这种观察是有意义的。 智能系统需要学习世界的多维模型。 感觉运动整合不会在大脑的多个部分发生-这是其操作的主要原理,是智能算法的一部分。 智能机器必须做到这一点。

新皮质的这三个主要方面-重新组装训练,分布式视图和感觉运动集成-将成为机器智能的基石。 未来的思维机器可能会忽略生物学的许多方面,但不会忽略这三个方面。 毫无疑问,神经生物学领域的其他发现正等待着我们,阐明了意识的其他特征,这些特征将来将需要包含在此类机器中,但是您可以从我们今天所知道的开始。

从AI的最早时代开始,批评家就放弃了试图模仿人脑的想法,通常认为“飞机不会拍打翅膀”。 实际上, 威尔伯(Wilbur)和奥维尔·赖特(Orville Wright)曾详细研究过鸟类。 为了产生升力,他们研究了鸟类翅膀的形状,并在风洞中对其进行了测试。 为了获得动力,他们转向了除航空以外的其他地区-螺旋桨和发动机。 为了控制飞行,他们看着小鸟扭曲翅膀以形成侧倾,并用尾巴保持高度。 那就是他们所做的。 到目前为止,飞机只使用这种方法,尽管我们只扭转机翼的一个边缘。 简而言之,赖特兄弟研究了鸟类,然后决定了飞行的哪些要素是人员飞行所必需的,而哪些要素可以忽略。 这正是我们将要创造的思维机。

, - , . , - . , . . , , , , , , , . , . . , , . , . . .

在1940年代,计算机时代的先驱们感到计算机将走得更远并且非常有用,并且它们有可能改变人类社会。但是他们无法准确预测计算机将如何改变我们的生活。以同样的方式,即使今天我们无法精确预测如何,我们也可以确保真正的智能机器将使我们的世界变得更好。20年后,我们回顾并意识到,在我们的时代,脑理论和机器学习的突破开始了真正的机器智能时代。

Source: https://habr.com/ru/post/zh-CN405373/


All Articles