
英国ARM公司改进了
ARM big.LITTLE的异构计算体系结构,所有基于Cortex-A7(2011)的领先ARM微处理器都基于该体系结构,并且昨天引入了新的异构体系结构
DynamIQ big.LITTLE 。 在微芯片上已经为机器学习应用的特殊硬件加速器分配了一个位置。 也许在将来,对神经网络的硬件支持将成为微处理器开发人员和新型智能手机固有质量的新趋势。
ARM big.LITTLE体系结构的体系结构特征是存在两种类型的处理器内核:相对较慢,高能效(LITTLE)以及相对强大而繁琐的处理器(big)。 通常,系统仅激活两种类型的核心之一:仅大型或小型。 显然,智能手机或其他设备上的后台任务很容易用消耗很少能量的小核解决。 如有必要,处理器可以激活强大的核心,这些核心可以在多线程模式下协同工作,表现出特别高的性能。 原则上,所有内核都可以访问共享内存,因此可以将任务设置为同时在两种类型的内核上执行。 也就是说,大大小小的都会即时切换。
这样的异构体系结构和从一种类型的内核到另一种类型的内核的动态切换任务被认为可以动态改变处理器的功耗和能耗。 ARM本身表示,在某些任务中,架构最多可节省75%的能源。
DynamIQ big.LITTLE是向前发展的一步。 新架构允许您使用以前无法实现的各种大小内核组合。 例如1 + 3、2 + 4或1 + 7,甚至2 + 4 + 2(三个不同功效的核心)。 未来的典型智能手机可能会在一个芯片上具有八核系统,该芯片具有两个强大的内核,四个中等和两个低性能内核作为背景。
借助对机器学习和AI的硬件支持,开发人员将可以访问新的特殊处理器指令(例如,精度有限的计算)。 ARM
承诺 ,在未来三到五年内,与当前基于Cortex-A73的系统相比,新架构上的Cortex-A处理器将在AI应用程序中提供多达50倍的性能提升,并且由于芯片上内置的加速器而进一步提高了性能。 CPU和加速器之间的专用低延迟访问端口具有10倍的性能。

这意味着训练有素的神经网络将在智能手机上更好地工作,包括计算图形和视频的计算机,计算机视觉应用程序以及处理大量数据流的其他系统。
每个群集最多可包含八个具有不同特性的核心。 与当前系统相比,这还可以用于加速AI应用程序。 此外,重新设计的内存子系统将提供对数据的更快访问并提高能源效率。 顺便说一下,不必要在核心群集中包括性能较差的LITTLE核心,通常在移动设备中使用它们来节省电池电量。 如果无论能耗如何都需要非常高的性能-没人会费心制作八个大型内核的集群,并将它们组合到功能特别强大的计算机系统中。 ARM相信,这将扩大ARM处理器的范围,超越智能手机。
DynamIQ集群几乎无限地具有共享内存-这是为了创建用于各种目的的强大计算系统而提供的一项功能。

动态调整功率/能耗的额外灵活性将通过在多个ARM处理器集群中分别更改单个处理器的时钟频率的功能来提供。 来自剑桥大学的开发人员认为,这对于虚拟现实头盔尤其重要,因为虚拟现实头盔长时间处于低功耗状态。 可以自动在硬件级别上更快地执行处理器到三种能量状态(ON,OFF,SLEEP)之一的转换。
最后,先进的DynamIQ架构使您能够构建功能重复的更可靠的系统,从而提高了需要响应故障的独立系统的安全级别。 例如,这些是无人驾驶车辆中的计算机视觉系统-高级驾驶员辅助系统(ADAS)。 当一个核心集群发生故障或加速器发生故障时,另一集群将自动接管其功能。

许多制造商(包括三星,高通,Nvidia,英特尔和苹果(iPhone,iPad))已在其芯片中许可使用ARM处理器体系结构。 在2013年至2017年期间,全球销售了超过500亿个基于ARM架构的微芯片,英国开发人员希望在未来四年内,这个数字将翻一番,超过1000亿个。
ARM处理器上的大多数设备不需要主动冷却。 该公司有信心,随着这些系统功能的增强以及向DynamIQ架构的过渡,一切都将保持不变。