假期后的怪兽:AMD Threadripper 2990WX 32核和2950X 16核(第5部分)

第1部分第2部分第3 部分第4部分→第5部分

热比较和XFR2:请记住从冷却器中取出塑料!



每台机器追求的目标都有不同的优先级:性能,消耗,噪声,热性能或成本。 很难一次接触到每个人,因此选择两个或三个目标是一个好主意。 如何在所有五个方向中迷失方向?..欢迎来到我的世界。 我第一次测试32核AMD Ryzen Threadripper 2990WX的世界是忘记了从液体冷却器中取出塑料。

长途飞行后请勿重新组装系统。

几乎所有新的冷却器,空气,液体和水单元都配有垫片,泡沫,螺丝,风扇和一组说明。 根据制造商和包装类型的不同,处理器冷却器的底部将通过两种方式进行准备:

  1. 预涂导热硅脂
  2. 小型自粘塑料胶带可保护运输过程中的抛光

在我们的评测中了解,由Cooler Master制造的大型Wraith Ripper空气冷却器,但被AMD推广为新型Threadripper 2处理器的基础冷却器,导热油脂被密集地涂抹在其整个基础上。 当我尝试拍照时,我搞砸了一切。



我们的评测中还包括带有导热膏管的Enermax Liqtech TR4液体冷却器。 与CPU接触的单元的下部覆盖有保护性的自粘塑料胶带。


TechTeamGB Twitter示例

所以,坦白的时候了。 我们的调查包比我早一天到达。 该行动是在我与英国在旧金山举行的闪存峰会和英特尔数据中心峰会期间进行的。 在手提箱中,我带了一个X399主板(华硕ROG Zenith),三个X399芯片(2990WX,2950X,1950X),一个X299主板(华擎X299 OC Formula),几个Skylake-X芯片,一个Corsair AX860i电源,RX 460,一个鼠标,键盘,电缆-组装两个系统并在旅馆房间中使用显示器进行测试的简单组件。 经过11小时的直接飞行,两个小时的护照检查以及乘坐Uber出租车超过一个小时到达我的酒店后,我组装了一个带有2990WX的系统。

我没有卸下Enermax冷却器上的塑料。 我没有注意到这一点。 我什至在处理器上涂了导热油脂,即使拧紧了螺丝,也没有任何怀疑。

我将系统调至最大支持的内存频率,安装了Windows,安装了安全更新,安装了测试,并在整个睡眠期间通宵启动了系统。 我什至没有怀疑塑料仍然附在上面。 早上,测试套件已经完成工作。 完成一些额外的测试(例如,测量基本频率的延迟)后,我去用2950X更换了处理器。 正是在这个时候,我表现出了富有表现力的facespalm。



当我看到导热油脂涂在处理器和塑料上时,我意识到必须重新启动所有装置。 除去塑料后,我插入了处理器,设置了系统,这次具有最佳的散热性能。

热性能很重要。


任何系统的目标都是将其维持在正确的“温度窗口”中,以确保稳定运行:大多数处理器的设计目的都是在高达105°C的温度下正常工作,然后关闭它们以避免损坏热损坏。 当处理器以链状方式驱动电子并执行各种必要的操作时,它会消耗能量。 该功率以热量的形式损失,从两个主要方向从芯片散发:插座和冷却器。



AMD Threadripper处理器在硅基体和散热器之间有热界面材料-铟锡焊接。 直接传热需要直接的金属-金属键。 现代的英特尔处理器使用硅树脂导热膏代替该层,导热性更差,但具有一个重要的优势-它能够承受更多的热循环。 随着金属的加热,它们会膨胀:两种具有不同热膨胀系数的金属结合在一起,经过许多次加热循环,会破裂并失去效率。 导热膏消除了这个问题。 另外,导热油脂更便宜。 因此,选择热接口是价格,耐用性和性能之间的折衷。

散热器上方有一个处理器冷却器,但它们之间还有另一个热接口,用户可以选择。 最便宜的选择是普通的硅酮导热硅脂,价格为每加仑美分,但性能爱好者可以选择银基导热硅脂或其他具有良好导热特性的混合物。 通常,糊剂在压力下分布的能力为正品质。 极速的支持者可以使用一层液态金属,类似于焊接方式,它几乎总是将处理器与冷却器联系在一起。

那么,如果您突然在散热器和处理器冷却器之间涂上几微米的热学无用的塑料怎么办?

首先,热传递将是可怕的。 这意味着热能保留在糊剂中,导致处理器吸收热量同时升高温度。 实际上,这与大型处理器使冷却器过载时的情况相同-处理器吸收热量成为一个实际问题。 这导致温度加速升高,直到温度梯度等于热能释放为止。 处理器温度过高,针对紧急热状况激活了紧急模式,从而将电压和频率降低到极低的水平。 性能下降到最低点。

用户在系统中看到什么? 假设您的处理器在渲染时以600 MHz运行,而不是良好的基本3125 MHz(请参见上一页)。 基本温度更高,负载温度更高,外壳温度更高。 但是您可以晾干湿衣服,以免热量消失。 轻微的过热不会损害处理器,但是大量加热会使它非常脆弱。
AMD XFR2

最终,这样的问题对AMD的危害超出您的想象。 AMD在新处理器中实现Turbo模式的方式不再是带有“已加载核心-> turbofrequency”列表的查找表。 它取决于给定芯片的功率,电流和热极限。 如果有增长的空间,AMD平台将增加频率和电压。 通过AMD所谓的XFR2或扩展频率范围2来完成这种热调节。

在AMD的Threadripper 2技术日上,我们展示了一些图表,这些图表显示了使用功能更强大的散热器对性能的影响:测试结果提高了约10%,而散热潜能却增加了。 在环境温度较低的房间中使用该系统,与排水系统相比,AMD的生产率将提高16%。



但是,反之亦然。 如果有一块塑料,可以很好地传递热量,则可以提高频率和电压,那么我们的性能就会大大降低。

塑性性能:


因此,尽管在空调良好的酒店房间中使用了这种多余的塑料,但在我们的大多数测试中仍具有决定性的作用。 这是他造成的损害:



















在所有多线程测试中,当CPU负载很重时,性能会大大降低。 搅拌机的产量降低了20%,POV-Ray降低了10%,而3DPM的损失为19%。 由于PCMark具有许多单线程测试,因此其结果并没有显着降低,并且在某些测试中,我们甚至看到了另一个方向的偏差,例如在WinRAR中,这取决于DRAM。 其他未列出的基准测试包括我们的编译测试,在该测试中,“塑化”系统的运行速度仅降低了1%,或者是“海豚”(Dolphin),其相差一秒。

我学到了什么?


别傻了。 用新的组件组装测试台会很累,会导致重复测试。

结论:并非所有核都生来相等


处理器设计通常是一个微调过程。 为了获得性能,架构师必须平衡计算与带宽之间的关系,并始终有足够的数据“喂食野兽” —加载处理器内核。 如果“野兽”处于闲置状态,它将消耗能量而不进行任何工作。 设置正确的资源组合是一项艰巨的任务,因此领先的处理器公司雇用了数千名工程师来使系统正常运行。 当主要设计准备就绪时,就会产生大量继承人。

有时,异国情调的产品不属于普通产品。 新一代AMD Ryzen Threadripper处理器具有异国情调。 似乎可以直接替换上一代组件,类似于它们,但是延迟更好,频率更高。 这些组件已经众所周知,我们可以通过通常的方式获得预期的增长。 而此时,2990WX中包含的其他芯片却无法直接访问内存,这将使扳手陷入既定机制中。


2950X(左)和2990WX(右)

当所有内核直接链接到内存(例如2950X)时,所有内核都被视为相等,并且工作负载平衡是一项相当简单的任务。 随着新处理器的发布,我们得到了右图所示的情况。 现在,只有一些核心直接与内存绑定,而其他则没有。 为了使数据从“远方”内核之一移至主内存,需要额外的“跳转”,这会增加延迟。 当所有内核都请求访问时,就会出现拥塞。

为了充分利用这种架构的功能,工作负载不应占用大量内存。 在诸如计算粒子运动,光线跟踪,场景渲染和解压缩之类的任务中,全部32个核的完全加载使处理器成为我们测试的明星,并创造了新的记录。

在双面Janus样式中,其他工作负载历来取决于内核数,例如物理,转码和压缩,因此,两个模块的结构会导致性能显着下降。 结果,这里显然没有平均结果-工作负载在新处理器上显示出优异的结果,或者在我们高质量测试包的尾部。

问题的一部分是这些超大型处理器的电源分配。 如第4页所示,游戏中的小芯片越多,或网格越多,则更多的能量将不提供给核心,而是提供给内部网络,例如非核心或Infinity Fabric。 将2950X中的一个IF链路与2990WX中的六个IF链路进行比较,我们发现IF现在在轻负载时消耗了总芯片功率的60-73%,在高负载时消耗了25-40%的功率。

实际上,在满载时,像2990WX这样的芯片仅将其功率预算的60%用于处理器频率。 在EPYC 7601中,由于增加了内存通道,内核在负载下仅消耗了50%的功率预算。 确保在AMD和Intel完成内核数量的争夺之后,他们名单上的下一个目标将是互连。

但是,该芯片不使用全部电源为内核供电,还具有双峰架构的事实的副作用是,某些工作负载将无法扩展,并且在某些情况下会出现回归。

大老板:AMD 32核河马


毫无疑问,当AMD Ryzen Threadripper 2990WX获得充分工作的机会时,他将乐在其中。 尽管AMD还支持Windows Precision Boost Overdrive,从而可以从芯片中挤出更多资源,但我们只需更改BIOS设置就可以在所有内核上将系统超频至4 GHz。 同时,以4.0 GHz的频率使用一半内核时的功耗会跃升至260瓦,而满载的CPU的功耗会高达450-500瓦,有时会超过600瓦。 用户将需要确保其主板和电源已准备就绪,可以执行此任务。



在这一刻,我终于说出我们是否建议购买新的AMD产品。 以较低的价格将2950X而不是1950X放入插槽的能力对我们来说似乎很有吸引力。 但是,2950X已经是高性能的利基产品-2990WX接过接力棒并将其带到远处,成为功能最强大的利基处理器。 老实说,并非在所有情况下它的生产率都像人们期望的那样高,并且它的应用对于狭窄的工作负载是有意义的,而事实证明这是无与伦比的。 尽管在我们的编译测试中它几乎超过了所有其他处理器,但是有一个处理器胜过它:2950X。

对于大多数用户来说,2950X就足够了。 对于少数几个人来说,2990WX将是世界上最好的处理器。

感谢您与我们在一起。 你喜欢我们的文章吗? 想看更多有趣的资料吗? 通过下订单或将其推荐给您的朋友来支持我们, 为我们为您发明的入门级服务器的独特模拟,为Habr用户提供30%的折扣: 关于VPS(KVM)E5-2650 v4(6核)的全部真相10GB DDR4 240GB SSD 1Gbps从$ 20还是如何划分服务器? (RAID1和RAID10提供选件,最多24个内核和最大40GB DDR4)。

购买六个月的新Dell R630 可免费获得3个-2个Intel Deca-Core Xeon E5-2630 v4 / 128GB DDR4 / 4x1TB HDD或2x240GB SSD / 1Gbps 10 TB-每月99.33美元起 ,仅直到8月底,订购可以在这里

戴尔R730xd便宜2倍?在荷兰和美国,我们有2台Intel Dodeca-Core Xeon E5-2650v4 128GB DDR4 6x480GB SSD 1Gbps 100电视(249美元起) 阅读有关如何构建基础架构大厦的信息。 使用价格为9000欧元的Dell R730xd E5-2650 v4服务器的上等课程?

Source: https://habr.com/ru/post/zh-CN422209/


All Articles