最新的168核Eyeriss处理器-智能手机中的神经网络
欢迎来到iCover博客页面上的读者!在2月初在旧金山举行的国际固态电路会议(ISSCC-2016)上,麻省理工学院(麻省理工学院)的开发人员团队演示了新一代芯片Eyeriss的工作原型,该原型是作为概念性解决方案而创建的,可让您重现神经网络算法的功能。在各种低功耗设备中。
人工神经网络未能在我们的智能手机或平板电脑中正确开发的客观原因之一是缺乏紧凑的电源,该电源具有足够的功率。确实,所谓的类似于大脑,类似于大脑的人工智能系统,至少以现代技术所代表的形式,在其工作中依赖于强大的多核处理器,与我们的大脑相比,该处理器消耗大量的能量。无论如何,直到最近,都无法在用户级设备的级别上想象这样的解决方案。同时,人工智能“微型化”的想法在很长一段时间内都吸引了开发人员的注意力,事实证明,这种成果已经带来了相当明显的成果。从人工智能研究的第一天开始,神经网络就一直是科学家关注的焦点,但是在1970年代,它们却被人们遗忘了。在过去的十年中,正在“深度学习”程序级别研究与使用神经网络功能有关的技术。“深度学习有很多用途,例如对象,语音或面部识别,”麻省理工学院电气与计算机工程学院的助理教授Vivienne Sze和Emanuel E. Landsman说。新芯片。 “现在,神经网络非常复杂,并且主要在功能强大的芯片上工作。想象一下,您可以将此功能转移到手机或内置设备上,然后在不使用Wi-Fi连接的情况下处理大量信息。在智能手机上处理大量数据将使您避免因与网络交换数据而造成的延迟,从而使许多应用程序更有效地工作。还有提议的解决方案将确保提供新的机密信息保护质量。”通常,神经网络是在多核图形处理器(GPU)的基础上实现的。在旧金山举行的一次国际会议上,麻省理工学院的研究人员介绍了一种新的168核芯片,该芯片旨在实现基于神经网络的人工智能算法。与移动GPU(未显示)相比,该处理器的效率提高了10倍,这使您可以使用自定义移动设备在本地运行强大的人工智能算法,而无需发送数据进行云处理。麻省理工学院在2016年2月3日的新闻稿中反映了这一发展的重点。由Eyeriss开发人员命名的新芯片可广泛用于物联网,可穿戴电子设备,自动驾驶汽车,制造设备,甚至是农业,有助于解决和协调当前任务。使用板上的人工智能算法,移动设备将能够在本地一级做出决策,从而为用户提供现成的结果作为行动指南,而不是从Internet上获取原始数据集。而且,当然,本地神经网络的应用之一是它们在创建用于各种目的的自主机器人中的用途。分而治之
神经网络通常具有多层结构,并且每一层都包含大量处理节点。在处理的初始阶段,数据到达并在较低层的节点之间分配。在每个节点处理完接收到的数据之后,将结果发送给下一层的节点进行处理。在最后一层的输出处,形成了解决问题的结果。因此,为了使用所描述的算法解决大规模问题,将需要大量的计算资源。开发人员最初对芯片提出的要求将它们置于一个相当严格的框架中:一方面,该解决方案应具有能源效率,另一方面,应使用简单的信息块来运行。最后,考虑到当前的挑战,该芯片必须具有模拟各种类型的神经网络的能力。所有这些要求已在Eyeriss处理器中成功实现。麻省理工学院实验室开发的芯片是一个已经形成的神经网络,位于168核处理器级别,将来可以集成到移动设备中。Eyeriss效率的关键在于最大程度地减少内核与外部存储体之间的数据交换频率,这种操作与高功耗和时间成本有关。虽然传统GPU的内核绑定到一个公共内存库,但每个Eyeriss内核都有自己的内存。另外,数据在心轴到达相邻核心之前经历压缩过程。实现的算法的另一个优点是内核能够直接相互“通信”,而绕过了系统内存总线形式的“中间”。这是模拟卷积神经网络(CNN)的关键功能。模式和语音识别所需的所有计算工作均在Eyeriss中进行,无需访问网络资源,这使得即使在没有外部网络的情况下也可以确保设备的有效功能。最后,Eyeriss的另一个优势是在单个可解决问题的框架内,在核心之间“智能”分配各个计算任务的原理。在其本地内存中,内核不仅必须存储由节点处理的数据,而且还必须存储描述节点本身的数据。为了确保数据处理过程的最佳性能,并从主存储器中加载Eyeriss的最大数据量,这两种类型的数据分配算法均通过为此目的专门设计的实时芯片进行了优化,同时考虑了当前神经网络的特性。在旧金山举行的国际固态电路会议上,开发团队利用用户级Eyeriss芯片的功能,演示了模式识别算法在本地神经网络中的实现。在新闻稿中提到的类似任务早些时候就已实施,但在已创建的神经网络中最先进的国家项目级别实施。三星创新实验室移动处理器实验室高级副总裁Mike Polly表示:“这项工作非常重要,因为它展示了用于深度研究的嵌入式处理器如何能够有效提供所需的功能和优化性能,并将复杂的计算过程从云计算引入移动设备。”补充说:“除了创新的硬件解决方案系列之外,麻省理工学院的专家进行的一项研究清楚地表明了嵌入式内核如何对开发有用。处理应用程序使用标准的网络架构和AlexNet来自Caffe»。Eyeriss项目的融资始于创建一个基于MIT实验室的部门,部分资金由美国国防部DARPA资助。毫不奇怪,第一个以令人印象深刻的社论材料回应处理器公告的人是著名的军事分析师帕特里克·塔克(Patrick Tucker)。据他介绍,安装在美军移动设备上的新型Eyeriss处理器将能够解决与处理大量信息有关的最复杂的计算问题,而无需连接到公共网络。因此,目前,美国空军从悬停在阿富汗上空的无人机上接收长达1500小时的高清视频和高达1500张超高分辨率的照片。而且,所有这些无穷无尽的信息流必须由操作员以老式的方式进行可视化分析,因为现有的计算机软件无法区分使用向导导弹发射器的农民沿着山路徘徊的农民与恐怖分子的区别。为了解决这些问题,最初创建了基于代表性训练的机器学习方法。Eyeriss处理器非常适合安装在无人驾驶无人机上,因为它们可以使用“深度训练”技术直接在飞机上对图像和视频阵列进行智能处理。同时,筛选出的有用数据可以绕过中心直接发送给在指定区域内作战的作战单位,以分析作战信息。简要总结在实验过程中,Eyeriss芯片的能效水平是现代移动图形芯片的十倍。同时,在它的帮助下,从技术上来看,可以确保人工智能算法在紧凑型设备(从智能手机和平板电脑到可穿戴电子设备)上的运行。事实证明,在网络上为这种处理器进行的数据交换期间产生的延迟被最小化,因为大多数计算可以由芯片本地执行。在Eyeriss的基础上,不仅可以创建各种“智能设备”,而且可以创建在决策方面具有一定程度独立性的机器人。麻省理工学院的开发人员尚未指定具体的时间间隔,在此间隔内Eyeriss将能够转变为商业产品,并尽其所能在消费者层面展示其功能。参与NVIDIA领先专家开发的人员以及负责任的三星研究人员的浓厚兴趣激发了人们的乐观情绪。来源
亲爱的读者,我们很高兴在博客页面上见面并等待您。我们准备继续与您分享最新新闻,评论材料和其他出版物,并会尽力使与我们一起度过的时间对您有用。并且,当然,不要忘记订阅我们的部分。
我们的其他文章和事件
Source: https://habr.com/ru/post/zh-CN390627/
All Articles