橡树岭国家实验室启动了Summit世界上最快的超级计算机


超级计算机节点峰会。 照片:美国橡树岭国家实验室

最有可能的是,美国将重新获得TOP500超级计算机的领导地位。 2018年6月8日,宣布推出容量为200 petaflops的“世界上最强大的” Summit超级计算机。 如果中国没有表现出任何意外,那么在6月的TOP500峰会上将有一个领导者更替 。 在Linpack测试中,声称拥有200多个petaflops足以超过当前的Sunway TaihuLight冠军(93 PFLOPS)。


Summit超级计算机重340吨,占地860平方米。 每分钟泵送15吨水进行冷却。 照片:橡树岭国家实验室

Summit超级计算机由4,608个节点组成,每个节点具有两个22核IBM Power9处理器和六个Nvidia Tesla V100 GPU。 节点通过Mellanox双轨EDR InfiniBand网络连接,每台服务器的吞吐量为200 Gb / s。 对于IBM,这是Power9-GPU AC922服务器的演示,可以提供给其他客户。

在所有节点都配备齐全的情况下,仅GPU就能提供215个双精度petaflops的峰值性能。 此外,每个V100还会产生另一个精度达到混合精度的125 teraflops-这是张量核心V100的主要操作类型。 因此,在深度学习应用中,峰值性能可以约为125×27648 = 3.46 exaflops 。 专家说,如果是真实的,则在3.3 exaflops左右。

这些不只是理论上的计算。 据橡树岭国家实验室主任托马斯·扎卡里亚(Thomas Zacharia)称,甚至在系统完成之前,研究人员就对GPU的比较基因组的张量内核进行了计算,并记录了1.88 exaflops的性能。 该应用程序处理了基因组,以寻找符合特定条件的样品。 这是计算机技术史上的第一种情况,当时克服了1 exa的实际障碍,即每秒10 18个浮点运算。 这个怪物的服务器机房里有这么大的噪音,要是没有耳机( 视频 ),就不可能在那里工作。


节点峰会。 超级计算机的房间里铺设了约300公里的光缆。 照片:美国橡树岭国家实验室

当然,除了深度培训之外,Summit还支持美国能源部感兴趣的一组标准应用程序中的计算,包括与热核能,替代能源,材料科学,气候模型,计算化学和宇宙论有关的计算。 同时,Summit仍然是一个开放系统,因此客户可以在其上运行他们希望的所有类型的计算,甚至与能源完全无关。 Summit应该用于寻找新药等领域的医疗保健应用。 正如托马斯·扎卡里亚(Thomas Zachariah)在新闻发布会上说的那样,他们的研究中心应成为CERN,用于医学数据挖掘和分析。


超级计算机峰会。 照片:橡树岭国家实验室

2014年,当与IBM签订建造该超级计算机的合同时,GPU包含在其中。 当时,能源部对如何使用深度学习功能有很模糊的想法,但是Nvidia决定在V100中引入张量内核-结果,Summit突然变成了AI应用程序的怪物。 因此可以假定,除了其核心职责之外,该系统还将加载许多高级AI研究。 到目前为止,根据应用选择了Summit的项目,但在2019年,该系统将在理论和实验的创新和新型计算影响(INCITE)计划下变得更广泛可用。


中国超级计算机双威TaihuLight的多核微处理器。 直到2018年6月8日,这台超级计算机被认为是世界上功能最强大的计算机。

在Summit发射后,当局可能会决定退役其前身Titan超级计算机,该超级计算机在2012年发射之时被公认为是世界上功能最强大的,但仍然是美国最快的超级计算机。 但是现在支持它的工作几乎没有意义,因为它的速度比Summit差8倍,而能源效率则差5倍。

Titan配备了K20X GPU,其中用于机器学习的单精度计算的性能限制为每个设备只有4 teraflops。 此外,Titan的所有程序都易于移植到Summit。

Source: https://habr.com/ru/post/zh-CN413769/


All Articles