假期后的怪兽:AMD Threadripper 2990WX 32核和2950X 16核(第4部分)

第1部分第2部分第3 部分 4 部分第5部分

功耗,TDP和Prime95与POV-Ray


对于我们大多数人来说,笔记本电脑的处理器功率约为15瓦,台式机系统的处理器约为65-95瓦。 高性能台式机处理器一直以来都比较便宜,因此130 W和140 W的TDP是它们的正常指标。 当AMD在旧的Vishera平台上发布了220 W处理器,并将Bulldozer系列的核心超频到5.0 GHz时,人们开始怀疑AMD是否完全疯狂:许多主板都与AMD插槽兼容,但使用的是TDP 220 W及更高版本必须发布许多新主板。 如今,市场上功能最强大的英特尔处理器的官方TDP为205瓦,但AMD通过将标准提高到250瓦而走得更远。



两款新的WX处理器(32核2990WX和2970WX)的额定功率为250瓦。 在这两个处理器中,所有四个有机硅矩阵都处于活动状态;有六个活动的Infinity Fabric系列。 这些处理器旨在达到更高的性能水平,而AMD则在所有3.6 GHz内核上展示了具有Turbo频率的幻灯片。 取代X系列的两个处理器和第一代Threadripper处理器的功率均为180瓦。

但是,并非所有的TDP都是相等的。 多年来,英特尔和AMD测量TDP的方式已经发生了变化,现在与现实相去甚远。 让我解释一下。

TDP真是个笑话


TDP值或热设计功率不是能耗的指标。 从技术上讲,这是冷却器性能的指标,这意味着为了应付其工作,冷却器必须具有相同的TDP等级。 实际能耗应该略高-从处理器到插槽以及从插槽到主板的热量传递有助于散热,但在TDP指示灯中并未考虑在内。 通常,TDP的散热速率和处理器功耗被视为一个,因为它们之间的差异不大。

让我们从AMD处理器开始计算。 AMD TDP的计算基于一个简单的公式:

TDP =(工作温度,摄氏度-空闲温度,摄氏度)/冷却器的热功率

因此,当AMD确定其Ryzen 7 2700X处理器的TDP的负载温度约为62°C,空闲温度为42°C且冷却器的散热功率为每瓦0.189 C(Wraith Max)时,我们得到的值为约105W。

AMD公式同时存在两个问题:首先,可以使用冷却器或外部空气流来控制加载的处理器的温度,其次,结果会受到冷却器的热功率的强烈影响。 对于具有较高热功率(例如每瓦0.400 C)的大型液体冷却器,任何处理器的标称TDP都将更低:在Ryzen 7 2700X的情况下,其TDP仅为50瓦。 TDP额定值和功耗不相等,并且它们的比率可以在任何方向上变化,只有AMD应该选择其他散热器进行比较。

英特尔的TDP版本要复杂一些,但这有意义吗……英特尔仅针对基本频率确定其处理器的TDP,而忽略了Turbo频率。 结果,如果英特尔发布的处理器具有95 W TDP,3.2 GHz的基本频率,4.7 GHz的单核睿频和4.2 GHz的完整睿频,那么在3.2 GHz的基本频率下保证的95 W功耗将得到保证。 这意味着在任何使用Turbo的主板上(即通常在任何主板上使用),该处理器在任何负载下的功耗都将超过其官方TDP。

这很烦人。 英特尔的营销举措是宣传其单核Turbo处理器,而不是发布“全核” Turbo的较低价格。 我们被告知,这是“公司内部信息”,属于保密协议。 无论如何,每个具有高于基本频率的“全核” turbo频率的处理器将消耗高于指定的TDP的功耗。

一个很好的例子是Core i7-8700及其65 W TDP。 它具有3.2 GHz的基本频率,4.6 GHz的单核Turbo和4.3 GHz的完整Turbo。 如果我们加载更多的流量并将能量消耗限制为65 W,那么我们将得到以下结果:



认真对待TDP值是否值得? 幽默地对待他们。

耗电量


有几种测量处理器功耗的方法。 最简单的方法是使用测量设备,这将使您找出整个系统的功耗,包括主板电源系统中的损耗。 一种复杂的方法包括将必要的工具连接到板上,以通过12伏连接器测量电流,并使用某些主板上的超频设置来测量处理器电压。 第三种方法是使用适当的软件读取硬件寄存器。

阅读寄存器是一把双刃剑。 首先,您要依靠内部尺寸,内部尺寸通常会有相当大的误差范围。 其次,您依靠处理器制造商来报告有关处理器的真实数据。 这并不总是合理的(!)。 从正面看:可以从处理器获取更多信息,例如,分析每个内核的电源,DRAM电源,IO /互连电源,集成显卡电源,从而获得对电源分配的一般了解。

硬件寄存器-这是系统告诉自己有关工作的数据的方式:它使用多少能量,如何根据电流,功率或热性能调节电压/频率。 另一个积极方面是在测试脚本中易于使用此类数据。

能量测试通常是有争议的主题。 通常使用一种特殊的病毒,该病毒可以以最大的功率同时加载处理器的每个区域。 “功率病毒”用于检查加速的稳定性,但它有一个缺点:每天负载时,结果通常不能反映实际功率消耗。 这是真实测试和合成测试之间的细线,该测试旨在驱动每焦耳能量通过芯片。 诸如LINPACK之类的软件通常被用作有效的功率测试。 英特尔和AMD内部工具可以帮助更重地加载芯片。

Prime95是一种流行的工具,它几乎针对每个内核都进行了优化,它可以控制电源。 它的工作量是半合成的,基于计算质数,但是压力测试忽略了结果,仅关注能耗。 在本次审查中,我们对POV-Ray做了一些功率测试:它提供的功耗甚至比Prime95高,并且还使用了非常流行的光线跟踪负载。 为了给我写评论,这就是为什么我决定哪种工具最适合能耗测试。 Prime95在使用大量内核时会遇到问题(如果超过25个线程的限制,有时很难获得测试结果),并且为了使POV-Ray正常工作,我们必须调整其加载方法,因为它的目的更多是检查内核加载,而不是检查内核加载。流。 但是,我们希望根据线程数获得结果。 将会指出在每个测试阶段使用了什么软件(我们只能在审查过程中准备我们的POV-Ray版本,因此大部分数据是从Prime95接收的)。

总耗电量


作为第一组结果,我想展示处理器在各种情况下的总功耗。 闲置时:



然后,我们使用Prime95仅用两个线程加载一个内核。 如果处理器内核能够处理多个线程,我们的测试技术可使两个线程在同一内核上工作。 专注于单任务负载的用户将看到此范围内的能耗。 这也适用于Windows始终处于后台的系统。



第三个测试是使用Prime95加载了四个线程的系统。 这正是大多数人每天在系统上使用的负载范围:几个浏览器选项卡,几个窗口,几个工作软件包已打开,一个或多个游戏正在运行。



将处理器负载增加到十二个线程(使用Prime95),我们继续使用大型和多任务工作负载的用户。 这些是游戏玩家-流光者,或与其他任务并行工作时开始渲染的用户。



最终图形显示了总功耗。 在此测试中,我们运行最大线程数(Prime95),将来,我们计划在此测试中使用POV-Ray,因为它在高线程数下表现出更好的性能。 此测试的唯一缺点是超频的2990WX可以在不到20秒的时间内完成POV-Ray测试。



单个核心功耗


在创建POV-Ray功耗测试之前,我在“全线程”选项的Prime95测试中启动了两个新的Threadripper处理器,并在每个负载下获得了每个内核的功耗。



当加载第一个内核时,我们看到其功耗约为23瓦。 与Zeppelin内核相比,这很多。 当加载两个内核时,这也适用。 通过加载三个内核,我们观察到每个内核的功耗降低到18.8瓦。 假设该芯片具有四个CCX,则会出现一个问题,该结果是否与将流加载到同一CCX中(显然应该发生)有关,并且我们达到了CCX功率极限。 当加载四个内核时,每个内核的功耗约为17.4瓦。

将加载的内核数增加到五个,我们发现第五个内核工作在18.2瓦,其余四个工作在16.8瓦。 结果表明该第五个内核位于新的CCX上。 从八核到九核的过渡中,我们看到了相同的东西:第九核消耗17.5瓦功率,而其余八核约为14.3瓦。 最后,如果我们使用全部16个内核,则每个内核的功率分配将降至7-9瓦。

处理器的总功耗约为178 W,TDP约为180 W,内核功耗约为135 W,其余功耗位于Uncore(超内核硬件-Infinity Fabric,IO,IMC)上。

至于2990WX的测试结果,所得图片看起来非常非常奇怪。



在大多数情况下,多达15个内核的功耗数据与2950X大致相同。 然而,随着流量的增加,显然第一基质层显然是优选的。 当加载更多数据流并连接第二个矩阵时,其内核上的功率要低得多-每个内核高达2.4W。 满载状态下的第一齐柏林飞艇层每个核心消耗约6.6瓦特,而处理器核心的其余部分约为2.4瓦特。 发生了某些事情,因此与其他元素相比,第一元素在营养上具有优先权。 值得注意的是,芯片的功耗约为180瓦,而不是其TDP所示的250瓦。

大约在这个时候,我们完成了POV-Ray功率测试脚本的编写。 我在2990WX上进行了测试,并给出了结果。 现在,它们比预期的要高得多:



令人惊讶的是,随着线程数量的增加,负载变得非常均匀地分布。 我们甚至能够将所有250 W TDP完全使用在库存设置和良好的冷却器上。 完全加载过程后,我们看到核心消耗193瓦,其他组件消耗55瓦。 在任何情况下,我们都不会观察到3瓦以下的活动核“下陷”。 当所有内核装入时,每个内核消耗“舒适”的6瓦。 我们实现了240 -250 W的处理器功率,同时加载了大约40个线程。 随着流量的进一步增加,增加的核心导致功率的重新分配。

有两个想法。 第一个很容易验证:安装2950X后,BIOS是否卡在180 W? 我仔细检查了一下,在使用2990WX运行测试之前,我测试了之前测试过的1920X。 BIOS完全重置不会影响结果。 我可以说这不是BIOS的功耗限制。 第二个想法是检查频率。 仅检查了一个参考点(加载了40个流)后,我们发现传播范围很小,但仅在功率上。

在Prime95测试期间,第一个矩阵以每个内核7瓦的功率运行,频率为3575 MHz。 第二个硅晶体在3525 MHz的频率下每个内核的功率为3W。 其他(空闲)磁芯以1775 MHz或2000 MHz的频率运行,消耗毫瓦。

在POV-Ray测试期间,每个活动核心的每个核心消耗大约9.1瓦特,频率为3575 MHz。 所有空闲核心的频率为2000 MHz(还有3个核心频率为1775 MHz),每个核心消耗毫瓦。

除了有关核心消耗的数据外,这些芯片的频率通常也相同。 POV-Ray测试的结果略高,这意味着POV-Ray的总能耗更高。

最终,归结为以下事实:超过20个内核的阈值之后,或者在带有多个晶体的微电路上,Prime95功率测试无法按预期进行。 将来,我们将使用POV-Ray测试,该测试可以从现代多核处理器中挤出更多资源。

核心与非核心消费


回到我们讨论Infinity Fabric频率的那一刻,我们可以看到功耗比是2990WX的POV-Ray测试的一部分。



尽管我们发现与以前的结果有些偏差,但数据(除了峰值消耗外)通常对应于我们使用Prime95进行的Uncore功率测试。 Infinity Fabric仍显示55-60瓦的功率。 结果,无核消耗占总容量的百分比从具有两个线程的75%开始,到启动40个线程时达到22%。

超频:4.0 GHz for 500 W


谁说250 W处理器不应该超频? AMD为制造处理器而感到自豪,每个处理器都带有未锁定的乘法器,并且还使用焊接材料作为热接口。

现在该悔改了。 我们没有足够的时间进行超频。 该处理器的基本频率为3.0 GHz,turbo为4.2 GHz。 在使用500瓦Enermax Liqtech冷却器的空调房间中,将所有核心加载到POV-Ray下,每个核心的工作频率为3150 MHz,与涡轮频率相差很远。 我做的第一件事是将全核睿频设置为4.2 GHz,就像单核一样。 这增加了很多。

不过,超频实验的下一阶段让我感到惊讶。 我一直在所有内核中的4.0 GHz的BIOS中将CPU倍增器设置为40-x。 我没有调节电压,而是离开了自动模式,为此,我什至不得不放弃主板ASUS。 听着,处理器完美地完成了我们的4.0 GHz测试套件。 我很震惊

我为超频所做的只是将“自动”切换为“ 40”。 消耗更多功率的POV-Ray测试已经成功。 集合中的每个测试都有效。 尽管热性能很高(在最大负载下),但冷却器很容易应对。



在POV-Ray测试的满负载下,处理器的功耗为500瓦,而散热器的功耗为500瓦。 在某个时候,我们看到跃升至511 W,其中为内核分配了440 W(或每个内核13.8 W),为非内核(IF,IO,IMC)分配了63 W,相当于总功耗的12.5%能量。 如果您希望中冷器花费更少的电量,请加快百分比!

他们将频率设置为4.1 GHz,在我们完全加载系统之前,它似乎也可以工作。 如上所述,即使在电压增加的情况下,在4.2 GHz下也无法获得工作结果。 对于那些想超频的人来说,液体冷却可以是一个解决方案。

4.0 GHz时的性能


因此,如果所有内核的频率均为3125 MHz,则超频至4000 MHz应该会使性能提高28%,对吗? 这是我们包装中一些关键测试的结果。













加速2990WX的结果好坏参半。 它在某些测试中确实运行良好,但由于其双模块架构,在某些方面仍落后于2950X。

超频在这些测试中给出了非常好的结果:Blender的吞吐量提高了19%,POV-Ray的增长了19%,3DPM的增长了19%。 在其他测试中,它不及2950X(Photoscan),但仍落后于(应用程序加载,WinRAR)。

超频并不能解决2990WX上的所有性能问题,但是肯定会使处理器受益。

感谢您与我们在一起。 你喜欢我们的文章吗? 想看更多有趣的资料吗? 通过下订单或将其推荐给您的朋友来支持我们, 为我们为您发明的入门级服务器的独特模拟,为Habr用户提供30%的折扣: 关于VPS(KVM)E5-2650 v4(6核)的全部真相10GB DDR4 240GB SSD 1Gbps从$ 20还是如何划分服务器? (RAID1和RAID10提供选件,最多24个内核和最大40GB DDR4)。

购买六个月的新Dell R630 可免费获得3个-2个Intel Deca-Core Xeon E5-2630 v4 / 128GB DDR4 / 4x1TB HDD或2x240GB SSD / 1Gbps 10 TB-每月99.33美元起 ,仅直到8月底,订购可以在这里

戴尔R730xd便宜2倍?在荷兰和美国,我们有2台Intel Dodeca-Core Xeon E5-2650v4 128GB DDR4 6x480GB SSD 1Gbps 100电视(249美元起) 阅读有关如何构建基础架构大厦的信息。 使用价格为9000欧元的Dell R730xd E5-2650 v4服务器的上等课程?

Source: https://habr.com/ru/post/zh-CN422207/


All Articles