小型超级计算机:1000个Raspberry Pi集群


BitScope群集模块包含150个具有集成网络交换机的Raspberry Pi微型计算机。 照片:BitScope

程序员和科学家并非总是可以自由访问真正的高性能超级计算机来测试其程序。 而且,超级计算机通常每天24小时忙于其他软件。 很难找到一个窗口。 您需要事先编写一个应用程序并排队。 新程序将如何在实际的多处理器环境中工作,任务并行度如何?

为了帮助开发人员,在洛斯阿拉莫斯国家实验室的高性能计算部门的委托下,澳大利亚公司BitScope从150台Raspberry Pi微型计算机开发BitScope Cluster的 “测试”计算模块,可以对它们的程序进行集群和检查。

洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)是全球十大功能最强大的超级计算机之一- 三位一体


洛斯阿拉莫斯国家实验室的Trinity超级计算机

实验室管理人员的任务是找到一种方法,使开发人员可以访问高性能并行计算,而无需真正访问超级计算机本身,以便他们可以测试其程序。

Los Alamos的Gary Glider 说: “ Raspberry Pi模块使开发人员能够找出如何编写此类软件并使之可靠运行的方法,而不必拥有相同大小的测试台,其价值不超过10亿美元的四分之一,并且耗电25兆瓦。”国家实验室。

实际上,用于测试程序的25兆瓦电太高了(尚未考虑冷却能量成本,该成本是计算机系统本身功耗的几倍)。


为Trinity超级计算机安装水冷却系统,该系统可有效利用卫生污水回收系统

每个模块具有144个活动节点,六个备用节点和一个控制节点。 安装在数据中心的服务器机架中时,模块具有6U格式。 根据官方网站,一个拥有1000个节点的集群占用一个42U机架,每个节点的成本约为120-150美元。 与Raspberry Pi 3的标准价格(35美元)相比,这是一个相当大的幅度。

每个BitScope群集模块都包含构建块-所谓的“群集包”。 在一个单元的机架中的安装正是以这些“包装”的形式进行的。


集群包

一个节点(Raspberry Pi 3微型计算机)包含频率为1.2 GHz的64位四核ARMv8处理器。 因此,如果您设想一个由五个模块组成的集群,那么将有720个活动节点,即2880个活动处理器核心。 足以测试程序的并行化程度。


它看上去很接近Cluster Pack中的一排小型计算机

尽管这样的解决方案确实比超级计算机便宜得多,但是您也不能称其为预算。 只有大型研究组织才能以10万美元或15万美元的价格完全购买一个迷你集群用于测试程序。 实际上,此类模块可能是为这些超级组织(超级计算机所有者)设计的。 不过,微型超级计算机的创建者说,它是“世界上最具成本效益的可扩展解决方案:构建,管理和维护价格便宜。”

BitScope Cluster模块还可以节省大量能源。 您可以自己计算每个节点的能耗,每个节点计算5瓦。 如果我们认为备用节点具有最小的功耗,则144个模块保持活动状态,而一个控制节点。 只有145×5 = 725瓦。

BitScope计划在2018年初的某个时间免费发行这些模块。

据该公司称,除了软件开发外,这种集群还可以用作传感器网络的仿真器,用于研究高性能网络和物联网。

Source: https://habr.com/ru/post/zh-CN408695/


All Articles