具有被动冷却功能的单个服务器的历史记录

有时,在最初的阶段,如果没有适当的研究就可能产生想法,而这些想法由于其作者的信誉,对于所有团队成员而言都非常有希望。 因此,不久前,VIT和ComBox Technology公司集团提出了实现基于许多微型计算机的服务器的想法。 服务器的目的是在微型计算机的CPU和GPU上执行神经网络。 未来服务器的估计外形尺寸为1U机架安装版本。 一切都会好起来的,只有这个想法包括被动冷却,因为提议使用的微型计算机宣布的发热量为25W。 实际上,提议的用于实施的微型计算机是带有Intel Core i5处理器和集成Iris Plus 655 GPU的Intel NUC,25 W,1U,无源冷却,服务器-所有这些听起来令人鼓舞,但细微之处却不断涌现。

首先,假设8台计算机是服务器中的微型计算机。 也就是说,与功耗成比例的散热量已经等于25 * 8 = 200瓦。 在这个阶段已经不能说被动冷却了,但是实验仍在继续。 其中包括,出于进一步适应室外机柜执行技术的原因。 硬件的开发与OCD在使用必要软件的同时进行。 我们使用了一种复杂的设备来检测和识别车牌以及称为EDGE的VIT车辆的制造/模型。 事实证明,在100%负载下测量功耗时,英特尔NUC8i5BEK的功耗为46瓦,而不是声明的25瓦。采用这种方法,服务器的功耗和散热量已经变为46 * 8 = 368瓦。 而且这没有考虑到电源和其他组件。

作为散热器,我们使用经过打磨和特殊雕刻的铜板。 此外,铜板将热量散发到服务器顶部的铝热交换器。 由于计算错误,热交换器占据了顶盖的2/3,并且在服务器的左右两侧与4台微型计算机平行地位于两侧。 在中心区域,背面有550 W电源,正面有Mikrotik 1 Gbit路由器。

基于8台微机的服务器设计阶段
基于8台微机的服务器设计阶段

结果是:

NUC Server
带有被动冷却的NUC服务器

当然,该设计在中等负载下工作,但是在100%的温度下,它继续缓慢升温,并将大部分热量传递给环境。 即使在带有冷热通道的服务器机柜中,该设计也不可避免地会加热更高的“邻居”。 通过将微型计算机的数量减少到4个,即使在100%的负载下也可以稳定加热温度并避免节流,但是仍然存在“邻居”更高的问题。

技术解决方案堆栈在两个方向上有所分歧:

  • 外部使用时对Intel NUC8i5BEK进行被动冷却
  • 1U服务器机箱中的主动风冷

1U服务器,已安装8个Core i5处理器和8个GPU


是的,是的,很多,是的,有可能。 你怎么问? 通过路由器在网络级别将1U机箱内的多台微型计算机组合在一起。 具体来说,对于神经网络的实现和传入RTSP流的处理,此解决方案是最佳的。 另外,它允许您基于一堆Docker,Docker Swarm和Ansible构建可扩展的系统。

在开发过程中,我们必须设计几个不同的版本:

未来决策的原型


最初的想法保留了久经考验的铜散热器和铝散热器,但现在直接位于机箱内部的每个计算节点上。 此外,为了散热,使用了两个风扇,这些风扇安装在每个计算模块的前面,将冷空气中的热空气引导到热气(从服务器的前部)。 为了进行主动风扇控制,开发了特殊板,可以根据每台微型计算机上的温度传感器来更改其速度。 由于不需要PoE,路由器被剥夺了主动散热功能;它被切换为被动方式,散热量不超过10瓦。 第一个版本中的电源仍为500 W,但已安装在特殊的支架上,可以快速更换,但会出现断电的情况。 为了监视计算节点的状态,在前面板上添加了8个二极管的指示。

NUC Server  ComBox Technology, 8 CPU Core i5  8 GPU Iris Plus 655  - 1U
来自ComBox Technology的NUC Server原型,1U尺寸的8 CPU Core i5和8 GPU Iris Plus 655

英特尔NUC上服务器第一版的技术特点:

  • 英特尔NUC8i5BEK(无外壳,带有改进的冷却系统),8个。
  • AMD Radeon R7 Performance DDR4 SO-DIMM内存模块,8 GB,8个。
  • 附加内存模块DDR4 SO-DIMM Kingston,4 GB,8个。
  • SSD M.2驱动器WD Green,240Gb,8个。
  • 1U机箱(自己生产)
  • MikroTik RB4011iGS + RM路由器(无外壳,带有改进的冷却系统),1个。
  • 连接线(跳线),11条。
  • BP 94Y8187,550瓦

工作过程中的外观:


NUC服务器的生产版本


生产版本发生了重大变化。 服务器上出现了2个电源,而不是一个电源,可能会进行热插拔。 我们使用了Supermicro的紧凑型服务器电源600W。 对于计算模块,出现了特殊的占用空间以及在不关闭整个服务器电源的情况下进行热交换的可能性。 许多网络环路被固定在座椅上的固定母线取代。 添加了FriendlyARM的Nano Pi ARM体系结构微机来管理服务器,并编写并安装了软件,用于检查和监视计算节点的状态,必要时通过GPIO报告特定计​​算节点的故障和硬件重置。 生产版本的风扇以从冷通道到热通道的方向安装在前面板的后面,铝制热交换器的散热片现在朝下而不是朝上,这使得每个计算节点的内存和磁盘都可以访问。

英特尔NUC户外机箱


由于微型计算机本身不是工业计算机,因此室外使用不仅需要外壳,还需要适当的气候条件。 我们需要防尘和防潮IP66防护,以及-40至+50摄氏度的温度操作。

我们测试了两个有效散热的假设:热管和作为散热片的铜板。 尽管具有较大的面积和更昂贵的解决方案,但后者被证明更为有效。 作为热交换器,一切都使用具有计算出的肋尺寸的铝轨枕。

为了在低于零的温度下启动设备,我们使用了陶瓷进行加热。 为了便于在各个领域中操作和实施,安装了6-36 V.宽范围的电源。

产生的设备的主要目的是:在数据源附近执行资源密集型神经网络。 这些任务包括计算车辆(客车,火车)中的客运量,以及在工业运营中集中处理有关面部检测和识别的数据。

Intel NUC     , IP66
室外外壳中的Intel NUC,IP66,带气候模块

通用混合推理方案


通常,使用三种类型的设备进行推断:数据中心中的服务器,安装了用于检测和识别对象的软件的照相机以及室外安装的微型计算机(例如,通过开关将照相机连接到室外)。 此外,从多个设备(例如2台服务器,15台摄像机,30台微型计算机)中,需要对数据(事件)进行汇总和存储。

在我们的解决方案中,我们使用以下使用存储系统进行数据聚合和存储的方案:


混合推理的一般方案

Source: https://habr.com/ru/post/zh-CN477430/


All Articles