大脑的某些算法

前一段时间,我想从程序员的角度研究神经生物学的现代材料。即,从它们中提取基本算法,并清除它们不必要的化学/生物学细节。

因此,如果有人喜欢人工神经网络并想自然地寻找灵感,那么这篇文章可能会出现。当然,不可能在一篇文章中涵盖所有内容-数据很多。

首先,简要描述生物神经元的操作,以便进一步理解。谁已经知道基础知识-随时跳过。

生物神经元:cat鱼,树突,突触,突触,EPSP,膜电位
: ( ), , . , , . . — . . . .

, , . , . “ ” ,“” “U”. , . . U.

, . , U . — . . , , . , , . “+” EPSP (). “-” IPSP ().

. EPSP- IPSP- , , , . , .



, , , . , . , . , , . . , EPSP , .

. , . “ ” . , . , , (. ).



— . — . EPSP — “”. , , , . EPSP ( ) , , .. , .

STDP


假定长期记忆的基础是如何在神经元突触上分配效率。一些突触被削弱,一些突触被增强。这称为延展性。但是,通过哪种算法决定了哪些突触以及它们如何改变权重?活神经网络中最著名的原理是依赖于尖峰时间的可塑性

从昆虫到人类都可以观察到,其配方如下:

如果此突触的输入尖峰趋向于恰好神经元本身生成尖峰之前,则突触被放大。
如果此突触的输入尖峰趋于在神经元自身产生尖峰之后立即出现,则突触会减弱。

那些导致峰值的输入在将来会变得更加优先,而没有贡献的输入会更少。该过程继续进行,直到剩下原始权重的某个子集为止,其余的权重将减小为零。我们将考虑这样一个事实,即神经元的许多输入在短时间内立即激活时会产生尖峰由此可以假设剩余的非零输入在时间上具有相关性。


突触权重的增加/减少与Δt蜂蜜输入(输出前)和输出(输出后)峰值的相关性

在许多实验中这种现象是众所周知的,并得到了证实,但应注意的是,通过执行不同的实验方案,您仍然可以实现失真/违反该定律,而不是违反了正式的要求,以提高后期发布的峰值[0]

后尖峰传播


锥体神经元(也许是最著名的皮质神经元类型)具有数以千计的突触,这些突触散布在其树突状树上(实际上,它有两棵树突状树)。如果我们选择几个突触-靠近the鱼,很远,很远-看看它们得到什么样的STDP图表,那么这些图表将有所不同。

对于靠近cat鱼的突触,时间表看起来很经典-作为Hebb培训主题的变体。也就是说,如上图所示。离the鱼越远,这种训练的幅度就越小。而且,如果您采取遥远的突触,那么您会看到非常奇怪的事情。例如,如果输入尖峰(到达突触)先于输出,则实验不会观察到放大,而是观察到该突触的衰减。 Antihebbovskoe培训,Karl!但是,如果在远处的树突上产生树突状粘附,则有可能使其返回Hebb通道。通常,通过对最接近cat鱼的突触进行训练,一切都非常清楚,但是对于遥远的ones鱼,使用不同的学习算法似乎就有些混乱[1]

让我们看看这一切的来历。因此,对于STDP的迭代,有必要在the鱼中产生尖峰。在此之后,突触应迅速了解他。为此,希望刺突从轴突结蔓延至它们。好消息是这实际上正在发生。神经元不仅向其他神经元发送尖峰,而且还向其树突发送尖峰。 “坏”消息是,随着反向传播,该尖峰消失。太快,无法到达远处的树突。现在很清楚为什么近端和远端突触的训练是不同的。有待弄清楚远处突触中正在发生什么。

在此重要的是要记住,树枝状晶体不是干扰的被动导体。他们自己知道在“考虑必要时”如何产生尖峰。如果由于某种原因树枝状晶体产生了尖峰,同时from鱼的腐烂尖峰进入了该区域,那么在形成了树枝状尖峰的情况下,它(可能)会像第二次风一样被并可以进一步扩散到该子树中。至少有这样一个假设。另一个假设是,通常可以在不使用向后传播的体细胞穗的情况下训练远处树突上的突触。有关此的更多信息。

树枝状晶体的有趣作用-树枝状尖刺足以产生可塑性


那么,您需要什么以使突触开始增加体重?必须在神经元的此位置打开相应的化学机械。为此,又有必要使膜上的电势因足够大的干扰而移动。如何创建?通常的平均EPSP值太小。但是EPSP和反向传播的躯体连合的总和可能已经合适。一段时间以来,人们认为这是引起可塑性的主要方法。

然后,在实验中,发现可以人工抑制神经元中的体细胞粘连,并且仍然可以响应于它们的刺激而使突触的重量增加(没有)。事实证明,当突触的刺激强度足以使树突连合出现在该位置时,就会发生可塑性。他们有足够的愤慨在这个地方引发可塑性。[2]是的,没有其他神经元的参与。也就是说,信息处理的“最小要素”甚至可以被认为不是神经元,而是单独的树突分支。

树突中有趣的效果-聚类


在海马神经元中,发现一个突触的LTP(长期体重增加)降低了邻近突触发生LTP的阈值。然后,对小鼠感觉皮层神经元进行了研究,其中神经元处理了晶须的数据。并且发现突触可塑性具有聚集的趋势。

采取特定的神经元,并选择15%的突触,最强烈地进行可塑性。它们在神经元中的分布不是偶然的:它的很大一部分是邻居-在161个中有50个。然后从小鼠的感觉皮层中取出了一个神经元,从该神经元切除了胡须(也就是说,该神经元缺少信息)。在这种神经元中没有聚集作用。但是他在全球范围内对输入信号更加敏感[3]

树突中有趣的效果-术语重新排列都会改变一切




因此,如上图所示,让两个EPSP进入我们的枝晶。它们对身体造成的干扰不仅取决于这些EPSP的大小,还取决于:

1)它们与身体
的距离2)彼此之间的距离,

让我们按顺序考虑。如果EPSP从突触到树突,则它将传播到the鱼并沿途衰减。也就是说,距离越远,其消失的程度就越大。而且,如果激活的抑制性突触进入其中,那么EPSP将立即消失。因此,如果我们彼此之间有两个相距较远的EPSP,那么它们将给身体带来两个小的干扰-然后,如果您很幸运。

但是,如果它们彼此相邻,则树枝状晶体会在该位置产生尖峰。这是这样的干扰,其中幅度大于EPSP的总和。树突状尖峰已经很可能流向the鱼,并且贡献将更大。[4]

链接功能同步


(同步编码关系,特征绑定)

从前面的段落可以看出,尖峰的相对时间对于突触的可塑性过程很重要。因此,不能绕过神经元的时间同步现象。这种现象无所不在,而且很根本,因为 在大脑的各个层面进食。考虑一个具体的例子。

将电极植入视觉皮层,然后向他显示各种视觉刺激。从电极上的记录中可以看出,某些神经元组参与了相位同步的振荡活动。这些神经元可以在不同的地方。如果神经元被图像中的轮廓所激活,它们往往会同步,这些轮廓要么是连续的,要么以相同的速度沿一个方向移动(共同命运的原理)。对于视觉皮层,同步的可能性与输入刺激满足格式塔标准的程度相关


这里的所有绿点都不是分开的,而是整体上的

可行的假设表明,皮层利用神经元中的放电同步来编码关于这些神经元所响应的那些信号部分的“整体”关系。此外,它们的答案将由更高级别的神经网络作为一个单元进行处理,因为正是这些尖峰会同时到达那里,这意味着我将在它们消失之前进行总结。

大脑皮层中的活动同步是导致该活动(例如,要看到的单词)的信号进入有意识感知区域的先决条件。在不知不觉中被处理的类似信号将仅引起本地同步[5]

神经元群体如何同步是研究的主题[6]

非突触可塑性


除了突触权重,神经元的其他特征在训练过程中也可能发生变化。它的总体兴奋性可能会发生变化(读取,峰值产生的阈值)。如果增加许多重量,则对于神经元降低其兴奋性是有意义的。相反,如果规模变化很小,那么增加就有意义。

另一个例子-轴突可以改变其向接收者突刺的时间。仍然-如果长时间低频刺激神经元,则会降低其兴奋性,这是长期的影响。

重播


在海马中,有神经元对空间中的特定位置作出反应。该位置的单元格被称为。也就是说,如果老鼠在迷宫的一个地方,则该地方的一个细胞反应最大,如果在另一个地方,则反应最大。当大鼠睡觉或休息时,在海马中,这些位置的细胞序列对应于这些路径开始以加速的速度运动之前实际经过的距离。对于其余的单元格,这是没有观察到的,也就是说,这些序列不是随机的。



在图片中:老鼠沿着一条笔直的轨道,该位置的“蓝色”笼子先被激活,然后是“红色”,然后是“绿色”。然后她得到加强,并以相反的顺序“蓝红绿”加速播放此序列。
另外,海马可以在老鼠实际拜访它们之前发挥作用(预演)。

同样有趣的是-梦中的重播过程也会影响大脑皮层。就是说,无论是在皮层还是在海马中,它都是复制的,与以前的清醒过程中经历的相同体验有关[7]。有一个假设,海马是快速记忆的模块,而皮质是缓慢的深度学习的模块。海马也许会按照事件的顺序记忆事件,然后以加快的速度将它们反复“丢失”到大脑皮层,以便从这些序列中绘制出隐藏的模式。这样就很清楚为什么偏远的海马体患者失去了建立新的长期记忆的能力,却没有丧失在手术前所做的记忆。

L-LTP(后期LTP


突触的权重变化的耐用性不仅取决于导致他们最初的刺激,也是对之前发生的事件之后它。实验表明,如果动物在刺激周围的特定时间范围内经历强烈事件,则刺激的短期记忆可以整合为更长的刺激。这是在单个神经元的水平上记录的。让一些刺激方案设法引起短期突触增强。如果强力刺激(通过手法)刺激在同一神经元上会聚的其他路径(当然,在正确的时间窗口内),则可以长期使用。

横向抑制


(横向抑制,周围抑制,周围抑制)

科学家从洞穴时代就知道了这种简单的原理。也许您看到了这样的错觉:



在神经科学的曙光中,人们认为神经元正在寻找其感受野中的刺激物,如果在那里找到了所需的刺激物,那么神经元就会强烈地产生尖峰。如果找不到它,但看起来还可能产生尖峰,但强度不高。然后事实证明,神经元的活性可以被其接受域之外的活动抑制

除了兴奋性网络(它也是主要的)之外,大脑中还有一个-抑制性中间神经元网络。 “主要”神经元在网络中提供激励,而中神经元通常会抑制它。 Interneurons具有局部作用。主要神经元多于中间神经元,但中间神经元更为多样。具体而言,所提及的视觉错觉被认为是由于兴奋性神经元与抑制性神经元的相互作用所致。这个过程的逻辑是这样的:神经元被激活得越多,它(在中间神经元的帮助下)就越抑制附近的活动。兴奋性神经元彼此竞争以争取对下一层神经元的信号做出最大贡献的权利。如果您非常活跃,那么您将大大减慢邻居的速度。如果邻居被弱激活,他们会稍微降低您的速度。结果,输入数据中的所有非线性都将更加“突出”,下一层将已经可以使用。

原理的清晰说明


- . , , .

预测误差检测器[8]


多巴胺神经元学会绑定输入信号中的某种“键”来获得奖励。他们使用以下算法:

(1)如果发生不可预测的报酬,则神经元会通过增加尖峰的频率来做出响应(我们有正误差)。
(2)经过培训,他们已经对“关键事件”做出了反应,而不是对奖项本身做出反应。在奖励的前身,他们会增加频率。对于奖励,如果按计划进行,则没有任何反应(我们没有错误)。
(3)如果受过训练的神经元预测了奖励,但没有发生,它将通过降低尖峰的频率做出响应(我们有一个负误差



据信,不仅有联想训练,而且建立了“因果”关系。举例来说,雷云与降雨相关,因为经常发生雷雨-您先看到云,然后再看到雨。一把雨伞也会发生同样的事情:在人中看到雨伞,然后又下雨。但是,如果至少在没有遮阳伞的情况下开始下雨,则已经很清楚,遮阳伞不是造成降雨的原因。

这些阅读的好处:在特定神经元上发生条件反射
, - . : , ( ) , . , . .

, — . , , . “ ”. . , , -. . ( ) :

1) 100 000 ( )
2) ( - inferior olive)

( , ), — . , , , :



, (), (). — , — (ISI) (CS) (US) , .

, , . , . . , , - .[9].
, (supervised learning), , (unsupervised learning), — (reinforcement).

结论


乍一看,相同的STDP似乎是针对尖峰神经元网络的完整学习算法。但是实际上,目前还没有有效学习人工峰值模型的方法。就是说,他们可以做些事情-例如,在MNIST基准测试中付出95%的努力 -但对他们而言更为琐碎的任务并不是很好。

近年来,在没有尖峰类的网络中,已经取得了更大的进步。那里的训练算法基于误差表面上的梯度下降,其中误差是突触权重的函数。时间方面的工作是通过拓扑结构中的反馈来实现的。注意和强化已成功引入这些网络。在这种背景下,尖峰模型仍然看起来“很差”。

结论是哪一个?很难肯定地说。尖峰网络的突破也许仍在等待着我们:大脑由尖峰神经元组成并非没有。也许当前的峰值模型根本不具备我们硬件的处理能力来“展示自己”。最后,峰值可能是生物铁的低级特征,在其上大脑会以某种形式错误地执行相同的梯度下降。但是,由于缺乏根据,这并未包括在当前的神经生物学工作假设中。

Source: https://habr.com/ru/post/zh-CN390385/


All Articles