训练有素的多层相位掩模(手写字符分类器)。 右边是在3D打印机上打印的D²NN光学神经网络的物理模型:8×8厘米的层,彼此之间的距离为3厘米来自加利福尼亚大学洛杉矶分校的一组研究人员开发了一种新型的神经网络,该网络使用光代替电来工作。 这本科学杂志发表
了一篇文章,描述了一个想法,一种工作装置,其性能和应用类型,据作者说,这对于新型神经网络的计算非常有用。
全光学衍射深度神经网络(D²NN),由各种反射或透明表面物理形成。 这些表面一起工作,执行任意功能,这些功能是通过训练获得的。 在获得结果并在物理网络中对预测进行完全光学组织的同时,在计算机上计算出具有反射面结构设计的训练部分。
因此,在物理模型中,D²NN由几个反射或透明层组成。 在这些层上,每个点都透射或反射入射波。 因此,这一点是一个人工神经元,它通过光学衍射连接到下一层的神经元。 D²NN的结构如图所示。
衍射深度神经网络(D²NN)。在插图A中,显示了几个透明/反射层的示意图,其中每个点都是具有复杂的透明度或反射系数的神经元。 这些系数是通过深度学习得出的。 在培训阶段之后,D²NN设计被固定-相应的印版被打印在3D打印机上,该3D打印机计算通过初步培训获得的功能。 与电子计算机网络不同,此处的计算
以光速进行 。
在实验过程中,科学家对几种D²NN进行了训练和实验测试。 图B显示了手写字符分类器,图C显示了成像镜头。
图示的下部比较了衍射光学神经网络(左)和电子神经网络(右)的操作。 基于相干波,D²NN具有复杂的输入值和乘法偏差。 D²NN中的权重基于自由空间衍射并确定二次波的相干干扰,这些二次波是前一层调制的相位和/或幅度。 符号“○”表示Hadamard乘积的运算,即相等长度的两个序列的对应成员的按位逻辑乘积。
研究人员解释说,光学神经网络的结构是根据
惠更斯原理组织的,根据
该原理 ,波阵面的每个元素都可以被视为产生二次扰动的二次球面波的中心,而空间中每个点的最终光场将取决于这些波的干扰。 因此,D²NN中的人工神经元通过次级波连接到下一层的其他神经元,该次级波的振幅和相位均由较早层创建的输入干涉图样和此时的局部透射/反射系数两者进行调制。
通过与标准深层神经网络的类比,我们可以将每个点/神经元的传输/反射系数视为乘性项“偏差”,在使用误差的反向传播方法训练衍射网络时会对其进行迭代校正。 经过数值训练后,D2NN设计被固定,并确定所有层神经元的透射/反射系数。 然后,您可以通过任何方法制作计算出的图层:3D打印,光刻等。
科学家强调,光学神经网络以光速执行功能,不需要能量。 因此,这是一种实现机器学习任务的有效而快速的方法。
为了验证这个想法,研究人员制作了一个神经网络,可以识别从零到九的数字,并报告结果。 在对55,000张数字图像进行训练之后,打印的七层神经网络显示出93.39%的准确性。

在识别服装和鞋子时,五层神经网络的准确性为81.13%,十层神经网络的准确性为86.60%。

根据研究人员的说法,光学类型的神经网络可用于需要高速运行的专用设备中,例如确定移动人群中的特定人员。
该科学文章于2018年7月26日
发表在《
科学 》杂志上(doi:10.1126 / science.aat8084,
pdf )。