大功率浸没冷却

每年,现代电子元件的工作速度都更快。 速度增加,消耗和散热增加。 处理器和视频卡浸入式冷却的当前趋势正逐渐进入我们的生活。

市场上有许多浸没式冷却系统的产品,但是,乍一看,它们的根本区别并不容易确定。 我们根据经验对技术进行了比较,并确定了它们的优缺点。

设备过热是现代电子产品的祸害


众所周知,现代电子产品是由电力驱动的。 此类设备中有电池,或者需要插入电池。 并且所有这些都由另一个共同的特征结合在一起-它们会发热。 例如,现代手机在执行资源密集型任务(例如游戏,录制高质量视频等)时会主动产生热量,而游戏玩家知道,要让其强大的计算机流畅运行,就需要大型高效的散热器。

来自电源的电流通过微电路,该电路主要由复杂的半导体组成。 半导体是一种部分传导电流而部分不传导电流的材料。 它的电导率取决于电压,温度和其他条件。

如果采用几种不同的半导体并将它们分为三层,则可能会导致意外的结果。 如果在第一层和第三层上施加电压,则电流不会流过这种“三明治”。 但是,如果沿第二层启动的电流很小,那么在第一层和第三层之间的电流几乎不受阻碍地开始流动。

根据所示原理工作的器件称为晶体管。 现在,它的结构当然更复杂了,但是规则仍然是一样的-通过控制快门来控制电流。 这种效果可以与水龙头相提并论。
在晶体管的操作中要特别注意从闭合状态(电流不流动)到断开状态(电流不受阻碍)的过渡过程。 常识表明,从一种状态到另一种状态的过渡不能是瞬时的,尽管它花费的时间很短,但仍然是非零的时间长度。 正是在这些状态之间切换的时刻,电流才能通过,导致晶体管发热。

现代处理器的工作频率高达4 GHz,这意味着处理器中的晶体管每秒可进行40亿次开关操作! 每个这样的切换都会导致设备发热。

因此,在对处理器进行超频(超频)时,加热过程特别明显。

为了散发处理器表面的热量,使用了带风扇的散热器。 风扇用冷空气吹动散热片,并清除处理器产生的热量。 这种方法最容易使用,这就是为什么它很普遍的原因。

电子学的发展导致了这样一个事实,即处理器的速度和晶体管的数量每年都在迅速增加,并且处理器的尺寸始终保持在同一水平。 比较速度为33 MHz的Intel 486处理器和速度为3.8 GHz的现代Intel I7。 尺寸相同,速度要高得多,这意味着更高的功耗和散热量。

应该注意的是,为了使晶体管正常工作,其温度必须保持较低,否则,即使不需要晶体管,它也开始传导电流。 事实证明,处理器速度越快,它加热的速度就越大,并且内部晶体管无法正常工作的机会也越大。 例如,在超频期间会观察到这种影响,并以著名的“死亡蓝屏”的形式表示出来。 当处理器在其自身的操作中检测到​​故障时,操作系统将停止其操作,并向用户显示蓝屏,其中包含有关当前状态的信息。 如果继续以这种模式运行,极有可能至少有数十亿个晶体管损坏。 这将导致常规故障,并且将来无法使用这种处理器。

这就是为什么使用良好的冷却系统并在给定温度范围内操作电子设备如此重要的原因。 对速度的追求可能首先导致随机冻结,然后导致恒定冻结,这进一步损害了处理器。

该原理主要适用于现代CPU,尤其是GPU。 由于这两个计算设备的体系结构不同,GPU的加热功能更加强大-仅仅是因为内部几乎所有晶体管都在运行期间使用。 顶级CPU的平均功率为90瓦,GPU为200瓦。 因此,现代视频卡的散热器的尺寸要比中央处理器的散热器大得多。

当冷却大计算能力时,会出现其他困难。 位于一平方米上的服务器设备的功率极高,达数十千瓦。 另外,必须保持恒定的微气候,而温度和湿度没有波动。 仔细考虑“湿度”一词的定义:单位体积空气中水分子的浓度; 在某些情况下,水分会凝结并变成水,从而非常好地传导电流-这对于电子设备而言非常危险。 服务器机房还存在另一个敌人-灰尘,灰尘会堵塞散热器并显着降低冷却效率。

常规和替代冷却系统


尽管存在所有这些困难,现代服务器设备的制造商仍在继续使用空气来散热。 几乎所有现代服务器机房都是为风冷设计的,分为冷热走廊。 为了确保全年的气候条件,安装了强大的气候系统,其中包括空调。 这样的工厂本身会消耗大量电力,而且自相矛盾的是,它们本身会产生大量热量。 不幸的是,这种解决方案很普遍。

替代的空气冷却技术是自然冷却。 空气从外部进入并净化服务器机房,自由地向外移动。 通过这种方法,可以降低设备成本,但是这种解决方案不适用于炎热的国家。 另外,空气仍然是尘土飞扬的,其湿度与街道上的湿度相对应,并伴随着物体内部的湿度和温度的波动。

浸入式冷却系统


最近,浸入式冷却技术已经普及。 由于该技术本身不再是新技术,因此有关该主题的开发已经进行了很长时间,但是现在其需求正以惊人的速度增长。

“浸入”一词的意思是“潜水的”。 这意味着所有电子设备,所有服务器主板,处理器,视频卡,电源和硬盘驱动器都完全浸没在液体中。 自然地,这种流体是电介质并且不传导电流-否则电子设备的工作将是不可能的。 通过对提出的解决方案进行进一步分析,很明显,浸入冷却在有无相变的情况下是不同的。 这些类型的冷却不仅在物理原理上有所不同,而且在操作上也有很大的不同。

因此,矿物油已长期用于变电站中的电力变压器冷却。 该物质的特征在于没有导电性和足够的热容量。 您也可以注意到它的低成本。

与矿物油相反,用于矿物两相冷却的3M Novec液体相对较新。 它还不传导电流并且热容量低。 出乎意料的是,借助沸腾可以达到冷却效果。 要对此现象进行更详细的分析,我们需要回顾一下物理定律。
液体的加热是由于能量从较暖的物体转移到较冷的物体而发生的。 能量或热量的单位是焦耳。 一焦耳相当于用1 W的热量加热身体一秒钟。

因此,如果视频卡仅工作一秒钟,它将发出200 W * 1 s = 200 J的热量。 一分钟后,该卡将发出200 W * 60 s = 12 kJ的热量。 在这种情况下出现的第二个问题是温度。 这样的加热会使视频卡的温度变化多少? 温度变化将取决于我们正在加热的物体的热容量及其质量。 很明显,茶壶中的一杯水煮沸的速度比满满的茶壶要快得多。

想象一下,我们正在尝试用一张视频卡加热1升水。 1升水的重量约为1千克。 水的热容量约为3800 J / kg / K。 这意味着要加热每1摄氏度重1千克的水,将需要3800 J的能量。 将此与我们显卡的功能进行比较,即可得出12000/3800 = 3.15摄氏度。 只需一分钟! 通过简单的计算,可以确定10分钟后水将加热到31°C。 自然,这样的过程不会永远持续下去。 因此,如果我们忽略材料的导热性,水将加热到85-90度,此后视频卡将过热并冻结。

如果我们改进实验并在10分钟后用冷水替换热水,则加热过程将再次开始。 在这种情况下,卡不会过热。 当然,每隔10分钟换水是很不方便的,人们想到的是要拉长一些管道,冷水将流过这些管道,热水将流过。 存在这样的液体冷却系统并在许多计算机商店中出售。

让我们回到使用矿物油的浸入式冷却中。 为此,在我们的计算中,我们需要更改物质的热容和质量。 1升油的重量略小于一升水,重量为0.85千克。 热容量为1800 J / kg / K。 因此,要加热一公升的油,需要0.85 kg * 1C * 1800 J / kg / K = 1.5 kJ的能量。 这意味着视频卡在1分钟内将油加热到12000/1500 = 8°C。 这远高于3.15°C。 但是,此方法具有很大的优势-它不需要用于向每个视频卡供液的管道。 您只需将多个视频卡放在一个浴缸中,然后倒入矿物油即可。

在我们的案例中,油本身的过热问题也没有解决。 一旦机油加热到视频卡的温度,它将不再发热并且设备将过热。 同样,您必须以某种方式提供冷油并趁热食用。

可以使用一个简单的解决方案:大容量的冷油和用于存储已经加热的油的容器。 自然地,如此巨大的油箱的安装在经济上是不可行的,因此我们必须在封闭回路中启动油,并在浸没浴池外对其进行冷却。 这将需要在外部额外安装散热器,而较凉的空气会将散热器吹散。 净化街道空气是很自然的:街道上有很多冷空气(与油温相比),而热风则被风带走。

但是散热器在相同的8度下会冷却1 m3的空气多少? 毕竟,在进行了计算之后,我们发现要冷却一个视频卡,每分钟需要大约1升冷(冷却)油。 而油将有时间预热8度。 也就是说,散热器应该能够用冷空气将油冷却仅8度。

另一个不在我们计算范围内的重要元素是泵。 它的要求要简单得多-每分钟循环1升机油。 应特别注意机油的粘度。 显然,由于粘度较低,所以1升的水将通过管道和散热器,比1升的油要简单得多。 也就是说,我们需要强大的泵,或者大型管道和散热器。

现在,让我们想象一下,现在您没有一个,但至少有100个视频卡。 这已经是每分钟20千瓦的热量和12,000,000焦耳的能量。 然后,在相同条件下,泵应每分钟已经泵送100升油。 想象一下,当系统中有1000个视频卡时出现的困难...

我们转向使用Novec液体进行两相浸入式冷却。 您经常会听到它昂贵,易挥发,容易蒸发等现象。 当然是这样,因为其作用原理完全不同。 当该液体加热到61°C以上时,就会发生蒸发。 但是,加热和冷却均不会发生。 在启动后将全部液体加热到61°C时,温度根本不会升高。 但是,这似乎很荒谬。 蒸发(沸腾)过程本身非常耗能。 也许可以将此过程与夏季沐浴并离开水的人的感觉进行比较。 它在水中温暖,在风中变冷。 这种现象的原因是水从身体表面蒸发。

以类似的方式,Novec从芯片的热表面蒸发,并带走一些热量。 蒸发1 g Novec大约需要120焦耳,这意味着200 W的视频卡将在1秒内蒸发大约2 g的液体。 只需一分钟-仅120 g。由于沸腾而产生的热量去除效率极高,并且用于去除200 W热量的散热器尺寸可小至3-4 cm2。 实际上,实际上不需要散热器。
像矿物油一样,该系统需要流体冷却。 为此,您可以每分钟从一个巨大的水箱中添加120克液体。 另一方面,这种液体罐的成本约为每升100美元,因此它提供了一种非常非常昂贵的解决方案。 因此,走另一条路是很自然的-用外部冷却器组织一个封闭的循环。

液体蒸气冷凝


蒸发是物质从液态到气态的转变。 就是说,事实证明,沸腾后的Novec不会消失得无影无踪,而是会以雾的形式聚集在液体表面上方的气体。 如果这雾凉了怎么办? 我们在其中安装了几根管道,并在它们上放了冷水。 气体将开始在它们上凝结并形成液滴,这些液滴合并成液体流并回流。 因此,Novec不会走到任何地方,并且会保留在系统内部而不会造成任何损失。

冷凝过程与蒸发正好相反;所有事情都以相反的顺序发生。 至于能量,必须从与蒸发过程中完全相同的气体中获取能量。 自然,冷管会变热,并且加热功率将与煮沸时视频卡释放的功率完全相同。

为了使两相浸入式冷却系统有效运行,我们需要不断冷却管道。 最简单,最有效的解决方案是在水上流水,这些水将通过位于街道上的散热器进行冷却。 与矿物油相比,它看起来容易得多。 毕竟,水的热容量是原来的两倍,而每分钟的循环量却更少。 另外,水的粘度明显较低,这意味着该泵可以轻松地每单位时间泵出更大体积的水。 与相同的矿物油相比,这些因素将有可能在街道上使用更小的散热器,更细的管道和更弱的泵。

浸入式冷却系统的优点


两种冷却系统-既含矿物油又含Novec浸没液-均比空气冷却具有重要优势。 不需要耗电的昂贵空调。 此外,不存在像自然冷却系统那样的灰尘和湿气问题。

数据中心的重要参数之一是PUE系数(能源效率),它等于数据中心的总功耗与计算设备的功耗之比。 对于浸入式系统,该系数接近1,对于装有空调的空气系统-约为1.5。 差异非常大,尤其是当您考虑设备成本差异时。

Novec冷却技术优于矿物油的优势


在此阶段,两个系统的特性似乎相同。 但是在上述计算中,我们没有考虑到浸浴中的液体不会自行混合。 想象一下,我们将视频卡浸入矿物油中并将其打开。 视频卡散热器旁边的油层会变热,但是一定距离内的那些油量不会变热。 在这种情况下,视频卡区域将发生局部过热。 然后,很明显需要使用视频卡的风扇或以其他方式确保浴中的油有效混合。 这使设计复杂化,并需要特殊的技术解决方案。

在使用Novec液体的两相浸入式冷却系统中,没有此问题。它会不断沸腾并自行混合-特别是在发生热量的地方。气泡从散热器上脱落,并有新的液体进入。

油和Novec之间的第二个重要区别是可燃性。 Novec从不燃烧,它甚至用于灭火图书馆。油本质上很容易燃烧,而且不能用水熄灭。任何油品的技术规格中都标明了这一点。燃烧开始的温度约为200-400度。

我们进行了一系列实验以验证以下结论。当油温升至150°C时,它开始冒烟,之后出现火焰,每秒钟充满信心地扑灭。此外,由于燃烧,油的温度开始每秒升高2度,并且火焰变得越来越高。火焰已经很难降下来,同时温度继续上升。

与Novec进行的类似实验表明,该液体已被主动蒸发,但是无法将其加热到61°C以上。通过放火烧Novov烟,他们也未能实现燃烧。正如Novec规范中所写-材料不燃烧,不发光。

因此,可以使用矿物油及其类似物来有效地冷却电子设备吗?当然可以。鉴于设备成本极高,这会有风险吗?当然可以 发生火灾的原因有很多,大量矿物油的存在使消除这种火灾极为困难,后果是灾难性的。

Novec Fluid:弱点


Novec流体最严重的缺陷是什么?高昂的价格,对浸没浴液密封性要求的提高,Novec流体的高挥发性以及后者设计的复杂性。另外,可以注意到需要仔细监控冷却过程的参数以避免液体沸腾。另外,仅当使用具有高安装密度的专用图形卡时,Novec流体的使用才在经济上可行。

设计冷却系统时,必须考虑大约20种不同的特性。完整的计算必须考虑散热器和热界面的热阻,以及所用设备的热交换器和散热器的材料和表面特性。

进展不会停滞不前,很明显,该行业的未来在于有效的浸入式冷却,而不是空气中。仍然只能在复杂,安全的解决方案之间或更昂贵的解决方案之间进行选择,但是要冒险。

Source: https://habr.com/ru/post/zh-CN420183/


All Articles