
在2000年初,发生了伟大的“频率战争”。 一家能够通过其处理器以每秒最大周期驱动的制造商比其竞争对手具有明显的优势。 这导致了一些非常热门的芯片的创建,其芯片的结构随着时间的流逝而被更合理的名称所遗忘。 10-15年过去了,我们周围正在掀起一场新战争:“核子之战”。 消费者处理器中可以放置多少个具有高速进程间通信的CPU内核? 最近的答案是10,AMD凭借新的16核Theadripper处理器进入了市场。 我们得到了1950倍和1920倍的分辨率,以重新评估的名义将它们彻底炸熟。
新世界秩序
2017年,AMD发布了新的微处理器架构-Zen。 该架构在新的Ryzen处理器系列中使用,其明显目标是从英特尔的高端台式PC解决方案中抢夺部分市场。 Ryzen 7家族的三个代表各自具有8个具有超线程技术的内核,并具有非常好的性能和价格比,有时还可以得到比昂贵的英特尔处理器高一倍的性能。 他们之后是四个Ryzen 5处理器,价格大致等于四核i5系列。 同样,AMD提供了具有十二个线程的处理器,这是Core i5的三倍。 最后,Ryzen 3的价格约为120美元,可直接与Core i3竞争,其内核数量是Intel产品的两倍。 现在我们可以看到AMD正式推出了AMD EPYC服务器处理器家族,该处理器家族可提供多达32个内核。 在接下来的几个月中,该产品将进入市场,而现在,OEM正在测试处理器并确定其性能。
AMD的Ryzen Threadripper系列或简称Threadripper除了列出的产品。 这些处理器的设计与服务器端AMD EPIC CPU相同,但适用于台式机。 前两个处理器分别是1950X和1920X,分别具有16和12个内核。 之后是8核1900X,该版本于8月31日发布,有望在1920年出现,但真相尚未公布。 所有这些芯片均安装在4094针TR4型LGA插座中。 该插槽与用于EPIC的SP3插槽相同(尽管这些插槽不可互换),并且优于用于Ryzen 7/5/3处理器的1331针AM4 PGA型插槽。

*根据我们的数据,来自AMD的最新信息
**尚未发布的产品,规格可能会有所更改。
如果Ryzen 7打算从Intel的高端台式机解决方案(HEDT)中抢占市场,那么Threadripper的诞生将为性能树立新的标杆。 此段可以称为“超高端台式机”(SHED)。 AMD以前在Threadripper处理器中引入的内核数量只能在英特尔服务器解决方案中看到;该公司提供了28个内核,总价值接近1万美元。通过提供具有大量内核,合理频率,功率和IPC的芯片,AMD消除了两者之间的界限。用户,半专业人士和公司客户。 为了竞争,英特尔宣布在未来几个月内发布具有12、14、16和18个内核的Skylake-X平台。
像最快的英特尔芯片一样,想要一次完成所有任务的人肯定会需求AMD处理器。 对于家用PC的用户,这可以使您将流(实时转码和上载)过程中的游戏过程与游戏服务器的托管以及一些其他任务的并行执行结合起来。 对于半专业领域,这意味着使用多个GPU / FPGA进行视频处理或计算。 这个想法的本质是,如果用户需要在计算机上做某事,他可以同时使用该系统执行其他任务,同时要有足够的CPU电源,PCI插槽,RAM和存储空间。 如前所述,Threadripper继承了服务器处理器的设计,并因此继承了近十年来确定服务器的高性能密度方面。
新插座,新主板
同样,与英特尔HEDT平台一样,AMD在Threadripper下启动X399平台,以为新处理器提供所有必要的工具。 大型TR4插槽及其所有引脚提供四通道内存,每通道带两个DIMM,以及多达60条PCIe线路,用于附加板卡(视频卡,网卡,SSD等)。 这些主板目前支持两个已经发布的Threadripper处理器,一个将在本月底发布的处理器,另一个尚未宣布的处理器,尽管已经收到有关其发布的内部信息(发布日期未知)。

新的插槽与以前的AMD插槽明显不同,显示了该技术的进步。 LGA TR4连接器具有三个Torx螺钉,而不是带有简单闩锁的PGA插槽,该闩锁用于可靠地将CPU可靠地固定在该插槽中,必须按一定顺序拧开三个Torx螺钉(如上图所示),然后简单地打开连接器闩锁。 下方是插入处理器的支架。 每个Threadripper处理器都有一个固定框架,以便于将CPU方便地放置在支架中。

由于连接器的设计和处理器的大小,用于安装CPU散热器的孔也有所不同。 由于所提供的每个Threadripper的额定功率均为180瓦,因此AMD建议至少使用液体冷却,并在售出的每个处理器中都提供Asetek处理器支架(还包括Torx螺丝刀)。

一方面,支架较窄,表示主板传统布局中的插槽“顶部”。

主板设计的本质归结为如何路由每个可用的I / O功能。 AMD的基本框图如下:

拟议的AMD配置提供了从CPU到PCIe插槽的48条线路用于4路SLI / CFX通信(16/16/8/8),从CPU到M.2插槽的12条线路用于3路x4 NVMe和4条芯片组。 在这种情况下,芯片组可以具有两个千兆以太网端口,一个PCIe x4插槽,一个PCIe x1插槽,用于Wi-Fi的PCIe x1,SATA,USB 3.1 Gen 1和USB 3.1 Gen 2端口以及USB 2.0端口。
据推测,根据功能的不同,X399主板的价格从249美元到599美元不等。 我们测试写这篇评论的主板是华硕X399 ROG Zenith Extreme,其厂商建议零售价(制造商建议零售价)为549美元。
竞争者
我们要求英特尔和AMD澄清他们认为谁是Threadripper处理器的主要竞争对手。 鉴于Threadripper是面向消费者的产品-有趣的是,实际上不是面向工作站的产品-AMD预计将宣布英特尔当前的Core i9-7900X(10核处理器)是最合适的竞争对手产品。 Xeon是一种企业产品,不会在Threadripper客户要求的现成系统中出售。
英特尔的报告与AMD完全相同,使我们感到惊讶。 他们说,Core i9-7900X是Threadripper处理器发布时的主要竞争对手。 可以预期会向公司提供某种更便宜的解决方案2P,但在听取了Intel的意见后,很清楚为什么没有做到这一点。 有两个明显的原因:首先,英特尔消费者和英特尔企业几乎是两家不同的公司,它们彼此重叠并且互相参与。 他们也没有与新闻界沟通的一般政策。 询问英特尔消费者-获得消费者团队回应。 询问企业团队,您会发现他们更加专注于EPYC,而不是Threadripper。 第二个原因是,在购买新处理器时,根本没有“便宜的2P系统”。 关于廉价英特尔2P系统的大多数在线讨论都涉及从灰色市场或代理商那里购买CPU。
因此,真正的竞争对手实质上是Skylake-X(和Broadwell-E的折扣)。 结果,AMD Threadripper 1950X(具有16核)和1920X(具有12核)与Core i9-7900X(具有10核)和Core i7-7820X(具有8核)相对。 考虑一下竞争对手-由于其架构,Broadwell的Core i7-6950X,AMD Ryzen 7 1800X,Ryzen7 1700被列入列表,以表现出良好的性能/价格比。

关键是Threadripper以相同的价格拥有更多的内核和更多的PCIe通道。 ADM为CPU提供了较低的Turbo,但具有较高的基本频率,并且为此类平台提供了更多的功率。 这将是一场有趣的战斗。
该评论中的文章:
- AMD锐龙Theadripper 1950x和1920x
- 提供野兽和关键处理器功能
- 芯片,总线和NUMA
- 创作者模式和游戏模式
- 测试台配置
- 测试套件2017
- 基准测试性能:CPU系统测试
- 基准测试性能:CPU渲染测试
- 基准测试性能:CPU Web测试
- 基准测试性能:CPU编码测试
- 基准测试性能:CPU Office测试
- 基准性能测试:CPU传统测试
- 游戏性能:文明6(1080p,4K,8K,16K)
- 游戏性能:奇异升级的灰烬(1080p,4K)
- 游戏性能:魔多阴影(1080p,4K)
- 游戏性能:古墓丽影:崛起(1080p,4K)
- 游戏表现:火箭联盟(1080p,4K)
- 游戏性能:侠盗猎车手V(1080p,4K)
- 能源消耗,能源效率
- 创建者模式和游戏模式分析
- 结论
附加说明
由于我们无法控制的原因,本次评测没有Skylake-X处理器测试。 在测试过程中出现了一些问题,这使该过程推迟到以后。 我们使用最新的BIOS和更严格的散热系统进行了一些测试,但是,在Threadripper处理器问世之后,SKL-X进行了整齐的包装,并且Threadripper取代了它成为实验对象。 现在,回顾SKL-X测试结果,很明显出现的问题与BIOS /固件有关。 计划在不久的将来努力寻找错误,为此目的,计划用新的X299主板替换X299主板。
2.提供野兽和关键处理器功能
当频率被认为是处理器最重要的特性时,主要问题是调节诸如效率,热特性和计算成本之类的特性:频率越高,所需的电压就越高,离最佳处理器模式越远,每单位工作的功耗就越大。 对于在产品线中排名第一的处理器,它是“性能冠军”,这些缺点似乎并不重要-直到工作温度达到90°C为止。
现在,随着核战争的爆发,其他问题也出现了。 当只有一个内核时,通过缓存和DRAM为内核提供数据是相对简单的任务。 具有6、8、10、12和16个内核的主要障碍是需要为每个内核提供一个连续运行的数据流,以避免内核无谓的停机时间。 这不是一件容易的事:每个处理器内核现在都需要一种快速的方法来相互之间以及与主存储器交换数据。 听起来像是“喂野兽”。
主要功能:60条PCIe通道vs 44条PCIe通道
经过多年的次要作用,配备新处理器的AMD将成为市场的领先地位之一。 Ryzen 7只有16条PCIe线路(车道),它们可以部分与28/44 PCIe线路的英特尔处理器竞争。 现在,Threadripper处理器将可以访问60条线路,以用于其他PCIe卡。 在某些情况下,这可以称为64行,但其中有4条保留用于X399芯片组。 Threadripper的价格分别为799美元和999美元,与Intel Core i9-7900X处理器上的44条PCIe通道竞争,价格为999美元。

这么多PCIe通道的原因是这些处理器针对的目标市场:高性能计算用户。 这些用户使用多个图形处理器,多个PCIe存储设备,需要高端网络,高端数据存储以及可与PCIe一起使用的其他硬件。 结果,我们很可能会看到主板上有32或48个用于PCIe插槽的通道(x16 / x16,x8 / x8 / x8 / x8,x16 / x16 / x16,x16 / x8 / x16 / x8),两个或三个用于U.2或M.2存储设备的PCIe 3.0 x4插槽,以及更快的以太网(5 Gbit,10 Gbit)。 AMD允许每个根PCIe x16系统将x1拆分为最多七个设备。 进入芯片组的四个PCIe通道还将支持用于SATA或USB控制器的多个PCIe 3.0和PCIe 2.0通道。
英特尔采用不同的策略,允许您在x16 / x16 / x8(40通道)或x16 / x8 / x16 / x8(40通道)或x16 / x16到x8 / x8 / x8 / x8(32通道)中实现44通道。 12条通道用于存储PCIe或更快的以太网或Thunderbolt 3控制器Skylake-X芯片组还有24条PCIe总线用于SATA,USB和千兆以太网控制器。
主要特点:DRAM和ECC
英特尔产品按细分市场细分,因此,如果客户希望拥有带有大量带ECC(纠错代码存储器)的内核的处理器,则必须购买至强处理器。 通常,Xeon支持固定的内存速度,具体取决于完整通道的数量(DDR4-2666上每个通道1个DIMM,DDR4-2400上每个通道2个DIMM)以及ECC和RDIMM技术。 但是,用于Broadwell-E和Skylake-X的HEDT消费者平台将不支持这些技术,而只会使用UDIMM Non-ECC。
AMD在其Threadripper处理器上支持ECC,为客户提供16个带有ECC的内核。 但是,它们只能是UDIMM(未注册的DRAM),但应支持超频RAM,以提高Infinity Fabric的速度(AMD Ryzen处理器使用内部的Infinity Fabric连接来代替HyperTransport总线,以在各个单元之间进行通信)。 AMD正式宣布Threadripper处理器最多可支持1 TB RAM,尽管它将需要128 GB UDIMM卡,目前最大容量为16 GB。 英特尔声称使用16 GB UDIMM时Skylake-X的最大容量为128 GB。
两种处理器均在DDR4-2666(1DPC-每通道DIMM)和DDR4-2400(2DPC)上支持四通道内存。
主要特点:缓存
AMD和Intel都对每个核心使用专用的L2缓存,然后在转移到主内存之前使用L3缓存(受害者L3缓存)。 受害者缓存是一种缓存,它接收从其下面的缓存中删除的数据,并且无法预取数据。 但是这些缓存的大小以及AMD和Intel与它们的交互方式是不同的。

AMD为每个核心使用512 KB L2高速缓存,对于四个核心的复合系统使用8 MB L3高速缓存。 在16核Threadripper中,有4个这样的4个核复合体,因此我们拥有32 MB的L3缓存,但是每个核只能访问在其本地L3中找到的数据。 要访问另一个综合大楼的L3,需要额外的时间,这会导致严重的延迟。
在Intel的Skylake-X中,每个内核获得1 MB的L2缓存,这意味着L2缓存命中的可能性更高,L3缓存降至每个内核1,375 MB。 L3已经不再包含在内,这意味着L2缓存的内容不会复制到L3缓存中,如果内核需要来自L2缓存中另一个内核的数据,则您将不得不执行相应的请求-该数据不再位于L3缓存中,因此,需要更多时间,并且发生延迟但是,该延迟在设计上有所简化。 这与Broadwell-E缓存结构明显不同,后者的每个核心为256 KB为L2,而2.5 MB为L3。 Broadwell-E高速缓存具有全面的体系结构解决方案。
3.芯片,总线和NUMA
在Ryzen系列中,AMD开发了8核硅芯片,称为Zeppelin芯片。 它由两个核心复合体(CCX)组成,每个核心复合体具有四个核心,每个CCX都可以访问8 MB的L3缓存。 Zeppelin芯片可以访问两个DRAM通道,并且最多可以有16个PCIe通道用于附加卡。 随着Threadripper的发布,AMD将这一矩阵增加了一倍。
如果拆开Threadripper处理器,您会看到四个硅芯片,类似于EPYC(多核模块设计MCM)处理器。 这些芯片中有两个正在硬化“垫片”,即空的硅,除了分配较轻的重量和冷却外,其别无用处。 其他两个芯片(位于对角,以提高热性能和布线)基本上与Ryzen中使用的Zeppelin相同,每个芯片包含八个内核并可以访问两个内存通道。 它们通过内部Infinity Fabric总线交换数据,AMD声称其带宽为102 GB / s(双向全双工),访问最近的内存(连接到同一芯片的DRAM)的延迟为78 ns,访问时的延迟为133 ns。远距离内存(另一芯片上的DRAM)。 我们检查并确认了DDR4-2400内存的这些编号。 使用DDR4-3200,访问速度分别达到65 ns和108 ns。
尽管该AMD幻灯片显示了两块芯片,但处理器中有四块。 由于其中只有两个处于活动状态,因此AMD简化了图表。相比之下,EPYC声称DDR4-2666芯片之间的数据传输速率高达42.6 GB / s。 这是由于在EPYC中存在与芯片的三个内部连接和一个外部(与另一个插座)的连接。 Threadripper中的芯片仅需要与另一个芯片交互,这提供了一定的灵活性。 似乎Threadripper以10.4 GT / s(每秒千兆交易)的速度使用了三个连接中的两个:
- 使用DDR4-2667时,用于EPYC的芯片对芯片限制为42.6 GB / s
- 使用DDR4-3200时,Threadripper的芯片对芯片限制为102.2 GB / s
- 42.6 GB /秒* 2个通道* 3200/2667 = 102.2 GB /秒
- 42.6 GB / s * 3个通道* 3200/2667 at 8.0 GT / s = 115.8 GB / s(太多)
- 42.6 GB / s * 3个通道* 3200/2667 at 6.4 GT / s = 92.6 GB / s(太小)
这种AMD配置正是所谓的NUMA配置:非统一内存访问。 这意味着代码不能依赖于从DRAM请求和接收消息之间的恒定(低延迟)延迟。 这对于高性能代码来说可能是个问题,因此某些程序设计为具有NUMA支持,从而使您可以将内存绑定到最近的DRAM控制器,从而减少潜在的吞吐量,但优先考虑延迟。
NUMA在x86体系结构中并不陌生。 在处理器开始在主板的北桥上提供片上内存控制器而不是片外控制器后,NUMA成为多处理器系统不可或缺的一部分。 在这方面,AMD从一开始就是领导者,在x86处理器芯片上控制器的开发方面,英特尔领先英特尔数年。 因此,AMD与NUMA已有多年合作,同样,NUMA在英特尔多处理器服务器系统上已有近十年的历史。
Threadripper的新功能是让NUMA永不触动消费者。 定制MSM处理器可能不胜枚举,我们必须回到Core 2 Quad系列中才能找到具有多芯片内核的处理器,该处理器先于Intel处理器的内存控制器。 因此,Threadripper是第一个引入NUMA用户的处理器。
但更重要的是,消费者软件也不是为NUMA准备的,因此几乎没有程序可以使用其功能。 好消息是,尽管NUMA改变了游戏规则,但它不会中断旧软件的运行。 启用NUMA的操作系统可帮助开箱即用的软件在单个NUMA主机上支持线程和内存操作,以提供标准性能。
这样做的缺点是,作为超级关心的父级,该操作系统可以防止不适当的软件使用其他NUMA节点,或者像Threadripper一样,禁止应用程序使用第二芯片及其8核。
在硬件级别,Threadripper由两个NUMA节点组成在理想的情况下,所有软件都将与NUMA兼容,从而可以解决此问题上的所有问题。 但是实际上,一切看起来都有些不同:软件的变化缓慢,并且在不久的将来NUMA风格的处理器将不太可能变得司空见惯。 此外,对于NUMA进行编程可能非常困难,尤其是在与“远程”内核和内存一起工作的工作负载或算法的情况下。 因此,NUMA的怪癖将永远不会完全消失,这就是AMD负责解决此问题的原因。
AMD在BIOS和应用程序中实现了开关,以支持和控制Threadripper中的NUMA。 默认情况下,Threadripper实际上隐藏其NUMA体系结构。 AMD而是在UMA配置中使用Threadripper:一种统一的内存访问系统,其中的内存被发送到任何DRAM,并且延迟是可变的(例如,平均78 ns至133 ns之间约为100 ns),但着重于高峰值吞吐量。 通过将用于操作系统的CPU作为一个整体设计引入,可以增加内存带宽,并且所有应用程序(兼容NUMA或不兼容NUMA)都将所有16个内核视为同一CPU的一部分。 因此,对于不支持NUMA的应用程序(因此,在NUMA模式下,操作系统会降低它们的性能)-这使您可以最大程度地利用它们可以使用的内核,线程和内存。
所有32个线程都作为一个整体CPU的一部分出现UMA模式的缺点是,由于它隐藏了Threadripper的工作方式,因此它不允许OS和应用程序做出完全明智的决定,因此会降低其性能。 如果应用程序使用连接到另一芯片的内核和内存,则对延迟敏感且未针对NUMA优化的应用程序可能会失去性能。 AMD Threadripper NUMA, NUMA . , . , .
, - . , -- , . AMD 400mm2+ , . , , , .

Intel Skylake-X: LCC , 10 HCC, 12 18 . (3x4 5x4 ), . Intel , , (, , , ). Skylake-X Intel (MODe-X) Intel, — . 2,4 . Skylake-X Intel , , .
, AMD Infinity Fabric, , Intel — MoDe-X.
4. Creator Mode Game Mode
- , AMD «», . Creator Mode ( ) Game Mode , .
:
- Legacy Compatibility Mode, on or off (off by default)
- Memory Mode: UMA vs NUMA (UMA by default)
, DRAM PCIe. LCM , , 16- 32 . LCM , , 8 16 . , (, DiRT) 20 . . - .
, , (UMA) (NUMA). , . , 20% , , .

NUMA - , NUMA, , . , . , , , , bandwidth . , . , — FPS 99- .
, AMD « » «» «». , SMT, «» , (NUMA), Distributed (UMA), Distributed .
- When Memory Access Mode is Local, NUMA is enabled (Latency)
- When Memory Access Mode is Distributed, UMA is enabled (Bandwidth, default)
, . AMD , . Creator . , FPS .

, .

BIOS, « » « ». , ASUS Local Distributed, NUMA UMA. Legacy Compatibility Zen, , . Ryzen Master .

Threadripper, AMD Ryzen Master , , , , . , Creator . AMD «». «Creator» «Game Mode», , ( «Legacy Compatibility Mode» «Memory Access Mode»), .
, Creator Game Mode . , , – . , Threadripper , , . SMT - , AMD Creator Game Mode.
16- Threadripper 1950X. , DRAM. ( 2 ), L1, L2, L3 . UMA, Creator, . Ryzen 5 1600X Zeppelin 6950X Broadwell . DDR4-2400, DIMM .

1950X , 8 , L3 CCX. , Game 79 , Creator — 108 . , Ryzen 5 1600X, , 8 (20 41 ), Creator Game 87 . , Creator , , Ryzen Game.
DRAM DDR4-3200 Threadripper 1950X, :

8 , L3 , . 8 DDR4-2400 41 18 DDR4-3200. , , : Creator DDR4-3200 Game DDR4-2400 (87 79 ), Game DDR4-3200 65 .
, Game mode, ( ). AMD?

:
- At DDR4-2400, 79 and 136 «» (108 )
- At DDR4-3200, 65 and 108 «» (87 )
— , Creator, , UMA + Creator ( ) .
5.
-, , , . , , JEDEC. , , , , JEDEC . , (XMP ), BIOS. JEDEC — , , , , .

, , : , .
我们必须感谢以下公司为我们的许多测试任务提供的设备。 其中一些硬件未在此测试设置中专门使用,但在其他测试中使用。
感谢
Sapphire提供了多个AMD GPU。 我们在Computex 2016上与Sapphire会面,并讨论了我们未来在AMD GPU上进行测试的平台,这些平台将用于未来几个项目的生产。 结果,他们能够为我们提供AMD可以提供的最新芯片。 排名第一的是一对基于第一代HBM技术和AMD斐济平台的Sapphire Nitro R9 Fury 4GB GPU。 作为第一个使用HDM的消费类GPU,R9 Fury是显卡历史上的关键时刻,这些超级卡配备了运行速度为1050 MHz的3584 SP和GPU,以及工作频率为1000 MHz的4 GB 4096位HBM内存。

继Fury之后,Sapphire还推出了一对最新的Nitro RX 480 8GB卡,以介绍当前的14nm AMD高性能处理器(截至2017年3月)。 切换到14nm导致AMD的功耗显着提高,再加上最新版本的GCN,使我们能够以200美元左右的价格创建支持VR的视频卡。 Sapphire Nitro RX 480 8GB OC图形卡被设计为RX 480系列的高级产品,该系列具有全套8 GB GDDR5内存,速度为6 Gb / s,以及2304 SP,时钟频率为1208/1342 MHz。

蓝宝石与R9 Fury和RX 480(用于游戏测试)一起通过了一对RX 460,将用于测试处理器。 可用的GPU电量会直接影响CPU的性能,尤其是如果处理器始终与视频卡交互时。 RX 460是用于此目的的出色卡,因为它结合了高性能和低功耗,而无需任何其他电源连接器。 Sapphire Nitro RX 460 2GB遵循Nitro理念-以低廉的价格提供出色的动力。 其896 SP的工作频率为1090/1216 MHz,配备2 GB GDDR5(有效7000 MHz)。

我们也必须感谢MSI为我们提供GTX 1080 Gaming X 8GB GPU。 尽管AnandTech规模庞大,但要为高端图形卡提供测试并非易事。 微星以最佳传统解决了这一问题,并为我们提供了一对高质量的图形卡。 MSI GTX 1080 Gaming X 8GB显卡是一款高级风冷产品,比Seahawk级别低,但超过了Aero和水冷装甲。 这是一张带有两个Torx风扇的大卡,采用独立的PCB设计,Zero-Frozr技术,改进的PWM和宽大的背面板以方便散热。 该卡在16nm TSMC工艺上使用GP104-400硅矩阵,包含2560个CUDA内核,并且在OC模式下可以以高达1847 MHz的频率运行(在静音模式下可以以1607-1733 MHz的频率运行)。 板上有一个8 GB GDDR5X,其工作频率为10,010 MHz。 长期以来,GTX 1080在视频卡中一直是公认的冠军。

感谢华硕提供GTX 1060 6GB Strix GPU。 为了完成AMD GPU和NVIDIA的高端/低端市场,我们研究了GTX 1060 6 GB卡,以平衡价格和性能,并有机会使用一张视频卡以高于1080p的分辨率测试游戏。
华硕在Strix GTX 1060上提供了帮助,该卡比带有三个风扇和LED的GTX 1080还要长。 STRIX是继ROG之后的低成本游戏品牌华硕,而Strix 1060则是1080显卡中的一半,它具有1280个CUDA内核,其基本频率为1506 MHz(在OC模式下最高为1746 MHz),以及6 GB GDDR5,其频率为192位内存接口上的8008 MHz。

感谢Crucial提供MX200 SSD。 关键是我们的测试列表随着新的基准测试和游戏名称的增长而增长,而1TB MX200无疑是一个很大的帮助。 它是基于Marvell 88S9189控制器构建的,由具有16nm 128Gb MLC的美光芯片供电,是一款7mm,2.5英寸设备,旨在实现100K随机读取IOPS和555/500 MB / s的读写速度。 我们在这里使用的1TB型号支持TCG Opal 2.0和IEEE-1667(eDrive)加密,并具有320 TB的标称耐用性和三年保修。

感谢Corsair提供AX1200i电源。 AX1200i是第一个通过Corsair Link系统提供数字控制和管理的电源。 它能够在50°C的温度下提供1200瓦的功率,并获得80 PLUS白金认证。 这样可在115 V时提供89-92%的效率,在230 V时提供90-94%的效率。AX1200i是完全模块化的,具有更大的200 mm设计,并带有一个双滚珠轴承140 mm风扇,以支持高性能运行。
AX1200i被设计为具有8个PCIe插槽并支持四路GPU的主力军。 AX1200i还具有零RPM风扇模式,如果电源在小于30%的负载下运行,您可以关闭风扇。

感谢G.Skill提供的内存。 多年来,G.Skill在测试CPU或主板时一直支持AnandTech。 我们已经写了关于它们的高性能和高频芯片的信息,每年Computex G.Skill都会在展厅举办世界液氮超频锦标赛。

6.测试套件2017
在本次审查中,我们介绍了一组新的处理器测试。 它使用了专门为此测试设计的新脚本。 这意味着在安装全新的操作系统之后,我们可以配置操作系统以实现最大兼容性,安装新测试,保存所需版本的操作系统,而无需随机更新,并在不到五分钟的时间内运行一系列测试。 之后,您只需单击一下按钮即可开始8-10小时的测试(具有高性能内核),并在下面针对处理器的测试中获得近100个相应的数据标记,然后进行我们的游戏测试,它们将在每个测试的测试中工作4-5小时GPU。 CPU测试涵盖了广泛的细分领域,其中许多都是您熟悉的。 一般而言,某些测试是基准测试的新功能,但对CA而言同样重要。
我们的新CPU测试涵盖六个核心领域。 我们涵盖了Web(具有不可升级版本的Chrome 56),常规系统测试(打开复杂的PDF,仿真,大脑模拟,AI,将2D图像转换为3D模型),渲染(光线追踪,建模),编码(压缩,AES,h264和HEVC),办公测试(PCMark和其他测试)以及我们之前的测试-生成错误代码产生的虚假行为,值得比较。
有关准备操作系统的说明。 由于我们使用Windows 10,因此系统突然更新的可能性很高,这将违反我们的测试。 针对这种威胁,我们采取了多种保护措施:禁止最大程度地更新,禁用Windows Defender,删除OneDrive,尽可能禁用Cortana。 此外,他们在电源设置中打开了高性能模式,并关闭了内部平台的时钟,如果基准频率发生变化(因此时序不准确),这可能会产生错误。
Chrome 56上的网络测试Sunspider 1.0.2
Mozilla海妖1.1
Google Octane 2.0
WebXPRT15
系统测试PDF打开
FCAT
3DPM v2.1
海豚v5.0
DigiCortex v1.20
Agisoft PhotoScan v1.0
渲染测试电晕1.3
搅拌器2.78
LuxMark v3.1 CPU C ++
LuxMark v3.1 CPU OpenCL
POV射线3.7.1b4
Cinebench R15 ST
Cinebench R15 MT
编码测试7拉链9.2
WinRAR 5.40
AES编码(TrueCrypt 7.2)
HandBrake v1.0.2 x264 LQ
HandBrake v1.0.2 x264-HQ
HandBrake v1.0.2 HEVC-4K
办公室/专业PCMark8
铬编译(v56)
SYSmark 2014 SE
旧版测试3DPM v1 ST / MT
x264 HD 3 Pass 1,Pass 2
Cinebench R11.5 ST / MT
Cinebench R10 ST / MT
CPU游戏测试
至于我们新的GPU测试套件,我们决定大胆考虑。 在选择处理器的过程中,生态系统中有许多用户将游戏放在首位。 而且,如果有机会在不牺牲性能的情况下在处理器上节省50美元并获得最好的显卡,那么这就是大多数游戏玩家都会选择的方式。 这是我们面临的严峻困难-游戏不仅具有不同的要求,而且以不同的方式加载系统,视频卡对游戏代码流的反应也不同。 此外,用户拥有非常广泛的判断和偏好,这些判断和偏好决定了什么是“规范”。 拥有如此多的自由度,尽管测试结果会在测试开始后的几个月内过时-当新游戏问世或新GPU出现在市场上时,测试仍可以延长到生命的尽头。 为了获得更高的准确性,让我们在DirectX 12中使用游戏,这可以简化游戏过程中更多处理器内核的使用。
由于Ubisoft游戏缺乏专业的定制水平,我们最初在2月份发布的9款游戏列表很快就变成了6款。 如果您想在AnandTech上查看《荣耀,陡峭或幽灵行动:荒地》测试,请告诉Ubisoft Annecy或Ubisoft Montreal在哪里找到我们。 尽管这些游戏具有值得应用的内部基准,但不幸的是,尽管它被用于准备用户最终看到的数据(因此,它通常被另一项隐藏),但它并不能为最终用户提供足够的逐帧粒度。层)。 相反,我宁愿通过输入来自动执行这些测试,但是加载时间极其不一致是一个主要障碍。
因此,我们的4/2脚本中包含的测试列表在运行一键式操作之前是自动化的,并在每个GPU四个小时后给出结果。 还列出了使用的权限和设置:
- 文明6(1080p Ultra,4K Ultra)
- 奇点灰烬:升级*(1080p至尊,4K至尊)
- 魔多之影(1080p Ultra,4K Ultra)
- 古墓丽影(#1)的崛起-GeoValley(1080p高,4K中)
- 古墓丽影#2-先知的崛起(1080p高,4K中)
- 古墓丽影(三)的崛起-山(1080p高,4K中)
- 火箭联盟(1080p Ultra,4K Ultra)
- 侠盗猎车手V(1080p很高,4K很高)
对于测试期间的每个GPU,列出的游戏(针对每个分辨率/设置组合)将执行四次,并且丢弃明显偏离的值。 将对平均帧速率,第99个百分位数和“ x帧以下时间”数据进行排序,并将原始数据存档。
我们为测试获得的四个GPU是:
- 微星GTX 1080 Gaming X 8G
- 华硕GTX 1060 Strix 6G
- 蓝宝石Nitro R9 Fury 4GB
- 蓝宝石Nitro RX 480 8GB
在测试脚本中,我们为GTX 1080保存了一些特殊的东西。还添加了以下测试:
尽管有一些限制,但可以启动该基准测试,尽管它超出了所用监视器的特性,可以在8K和16K上对GPU进行“未来”测试,并获得一些有趣的结果。 我们仅在GTX 1080上运行这些测试,因为多次观看幻灯片是没有意义的。
*如本评论的注释所述,我们没有有关Skylake-X处理器上游戏的数据。 在获得Threadripper之前,我们使用最新的更新和最新的BIOS进行了一系列测试。 但是,现在,在分析数据时,我们看到许多未解决的性能问题,应在结果发布之前解决这些问题。
7. CPU系统测试
我们的第一组测试是常规系统测试。 该测试套件旨在模拟人们通常在操作系统中执行的操作,例如打开大文件或处理小数据堆栈。 它与我们的使用行业标准的办公室测试有所不同,此处的某些测试相对较新且不寻常。
打开PDF文件
列表中的第一个是我们使用庞然大物的PDF文档编写的测试,在参加活动之前我们曾经收到过。 尽管该文档仅包含一页,但它包含了许多高质量的图层,以至于我平均每台笔记本电脑花了15秒钟来打开文件并让我控制系统。 该文档已成为我们测试“让我们一起打开的PDF文档”的最佳候选人。 在这里,我们使用了禁用了更新功能的Adobe Reader DC。 我们的基准测试将屏幕分辨率设置为1080p,以适合屏幕的方式打开PDF,并测量从发送打开文件的命令到在屏幕上扩展文件的时间之间的时间,并且用户再次可以控制该软件。 重复测试10次,然后计算平均时间。 结果以毫秒为单位显示。

该测试是单线程的,因此英特尔的高频芯片获得了明显的胜利。 此外,在此测试中,Threadripper芯片之间存在明显的特殊差异。
FCAT处理: 链接
在上个季度中,最有趣的负载之一就是FCAT,FCAT是我们用来测量和可视化分析由于帧丢失或损坏而导致的游戏延迟的工具。 FCAT过程要求在游戏中包括彩色叠加层,记录游戏过程,并使用适当的软件对视频文件进行后续分析。 但是,此软件通常是单线程的,因为视频主要为RAW格式,这意味着文件很大,并且需要传输大量数据。 对于我们的测试,我们记录了在1440p的GTX 980 Ti上运行的《古墓丽影:崛起》测试的90秒记录,大小约为21 GB,并使用视觉分析工具测量处理时间。

就像打开PDF一样,单线程性能也是最重要的。
海豚基准测试: 链接
许多仿真器通过单处理器处理器性能链接在一起,并且一般报告倾向于表明Haswell大大提高了仿真器性能。 该基准测试启动了Wii程序,该程序在光束中跟踪Dolphin Wii模拟器内部的复杂三维场景。 该测试的结果非常可靠地表明了Dolphin处理器仿真的速度,这是一项密集的单核任务,需要使用处理器的大多数方面。 结果以分钟为单位,Wii本身显示为17.53分钟。

尽管通过测试判断,Dolphin可以很好地展现出一个内核具有高性能的地方,但是仍然存在多线程并且涉及其他内核。
3D运动算法测试v2.1: 链接
这是我们3DPM基准测试的最新版本。 3DPM的目标是模拟直接从我的博士论文中获得的部分优化的科学算法。 2.1版与2.0版的不同之处在于,它通过引用而不是通过值来传递基本粒子结构,并减少了编译器执行double-> float-> double转换的次数。 与2.0版相比,这可提供25%的加速,这意味着新数据。

因此,在我们的第一个纯多线程测试中,具有32个线程的1950X获胜。 1920X在SMT-off模式下优于1950X,在16个流中有24个流。
DigiCortex v1.20: 链接
尽管已经过了几年,DigiCortex软件还是一个家庭项目,用于可视化大脑中神经元和突触的活动。 该软件带有各种基准测试,我们采用了一个小型基准测试,该模拟程序对32,000个神经元/ 18亿个突触进行了大脑模拟。 测试结果表明系统具有实时仿真的能力,这意味着高于1的任何结果都适合仿真。

DigiCortex需要兼具较高的处理器频率和DRAM性能才能获得良好的结果,因此任何具有四通道内存的设备都适用。 1950X在SMT-off模式下胜出,是因为它可以快速访问主内存,并具有16个访问它的线程。 Broadwell-E是最接近的竞争对手,甚至超过了Skylake-X,这很可能是由于Skylake中与网络(网状)相对的环形拓扑结构(ring)所致。 但是,在Creator模式下的1950X性能要比标准Ryzen芯片低得多,这表明使用单一内存体系结构可能会导致性能显着下降。 1920X由于未知原因未能通过此项测试。
Agisoft Photoscan 1.0: 链接
Photoscan仍保留在先前测试版本中的测试套件中,但现在我们可以在Windows 10中使用,因此最新处理器上的Speed Shift等功能将发挥作用。 Photoscan的概念是将多个2D图像转换为3D模型-因此,图像越细致,越多,模型越好。 该算法包括四个阶段:几个单线程和几个多线程,并且还对缓存和内存有一定的依赖性。 对于一些更多样化的多线程工作负载,诸如Speed Shift和XFR之类的选项可以利用CPU的等待或停机时间,从而大大提高了新的微体系结构的性能。

可变的单多线程Agisoft显示,在这样的过程中,决定性的要素是内核,IPC和频率的结合。 AMD处于领先地位,可能是由于其AVX实施。
8. CPU渲染测试
渲染测试是长期以来公认的评论和测试的最爱,因为渲染包所使用的代码通常经过优化以压缩每一点性能。 有时渲染程序也非常依赖于内存-当您有许多线程承载大量数据时,低延迟内存可能是一切的关键。 Windows 10, .
Corona 1.3: link
Corona — , , 3ds Max Maya, . – , . , , . , , « » ( , , « », ). Corona , .

.
Blender 2.78: link
-, Blender . Blender 5 , , . , , AMD, Intel , , , .

Blender .
LuxMark v3.1: link
, LuxMark , , , . OpenCL, C ++. , IPC, , C ++ OpenCL .


Blender, LuxMark . — . , 10- Core i9-7900X CPU (C ++), , , - IPC .
POV-Ray 3.7.1b4: link
suit — POV-Ray. . , AMD Ryzen, , . , , POV-Ray .

LuxMark, POV-Ray .
Cinebench R15: link
CineBench , , , . IPC ST, — MT.


Intel , 18- 3200 Cinebench R15. 6,7% Threadripper 1950X .
9. CPU Web Tests
- — . , « » , . , - Chrome 56 2017. , , .
SunSpider 1.0.2: link
- – SunSpider. JavaScript-, IPC , - , . 10 . 4 .

Mozilla Kraken 1.1: link
Kraken — Javascript, , SunSpider, , . , .

Google Octane 2.0: link
, Google Mozilla, , JS . , SunSpider JS, Kraken , Octane , , .

WebXPRT 2015: link
, , WebXPRT , . , , , , , .

, - . - — , Threadripper's . , — .
10. CPU Encoding Tests
. / , . / - « » — , . , . -, -. , 3D-, , , / .
7-Zip 9.2: link
, , 7-Zip. , . .



/ 7-zip. AMD .
WinRAR 5.40: link
2017 WinRAR . WinRAR , 7-Zip, . , 7-Zip, , (33 1,37 , 2834 370 150 ) . — , . - DRAM 10 , .

WinRAR — , . . Threadripper Creator.
AES Encoding
, AES-, . , --, AES . , . TrueCrypt - 1 DRAM. — GB / s .

HandBrake v1.0.2 H264 and HEVC: link
, ( , ) , . – , , . . Google, VP9, : H264, , 1080p, HEVC ( H265), , H264, ( ). HEVC , 4, .
Handbrake , .
/ H264: 2- 640x266 H264 Main profile High profile, very-fast .

/ H264: , 4K (3840x4320), 60 Main High, very-fast .

HEVC: HQ, 4K60 H264 4K60 HEVC.

HQ H264 AMD , SMT-off 1950X - SMT. HEVC, 1950X 7900X .
11. CPU Office Tests
, , — , , . — , , , , , , .
Chromium Compile (v56)
Windows 10 Pro, VS Community 2015.3 Win10 SDK Chromium. 2017 , . — — , .

, , 1920X Ryzen 7. , CCX , . 1950x «3---CCX» 1920x ( ). , , , , 2 1950X 8 12 16 Zen.
PCMark8: link
, PCMark 2008/2009 , Futuremark PCMark8, 2017 . PCMark , , « ». «» , C ++ OpenCL, . PCMark8 Home, Work Creative , , .


, Creative PCMark 8 . , .
SYSmark 2014 SE: link
SYSmark Bapco, . SYSmark , , Photoshop Onenote, , . (Office, Media, Data), . (Core i3-6100, 4 DDR3, 256 SSD, HD 530) 1000 .

12. CPU Legacy Tests
, - . , , 10 . Windows 10, , , .
3D Particle Movement v1
3DPM — , 3D-, Brownian Motion, . , IPC , «» . , , . - , , false sharing.


CineBench 11.5 and 10
Cinebench — , MAXON Cinema 4D. Cinebench . , , Cinebench, , . , , , , Cinebench, . 15, 11,5 10.




x264 HD 3.0
, x264 HD 3.0, , . 5.0.1, 1080p x264-. 3.0 720p, high-end , . , , 90 .


1950X: , , .
13. Civilization 6
, - — Civilization 6. Sid Meier , Civ . , - . , , , , . , , .

- — , , 5 . Civilization 6 Firaxis , . , Civilization , DirectX 12.
, , Civilization 20 , AI . Civilization «AI Benchmark», , . , .
1920x1080 4K . Civilization 6 MSAA, . , , 0 ( ) 5 (). Civ6- () 0 , MSAA — 2x.
, 8K 16K (Civ6 ) GTX 1080, 8K, 4K, 16K .
MSI GTX 1080 Gaming 8G Performance ASUS GTX 1060 Strix 6G Performance Sapphire Nitro R9 Fury 4G Performance Sapphire Nitro RX 480 8G Performance , Threadripper , Ryzen , Time Under Threadripper.
14. Shadow of Mordor
– - Middle Earth: Shadow of Mordor ( SoM). Monolith LithTech Jupiter EX . SoM . , Red Dead Redemption, SoM Zero Punctuation's Game of the Year 2014 .

2014 , SoM , . SoM , , , . , , , , 4K.
, , , , . , Graphical Quality, Lighting, Mesh, Motion Blur, Shadow Quality, Textures, Vegetation Range, Depth of Field, Transparency Tessellation. .
1080p 4K, 4K-, Ultra. FPS, 99 time under .
MSI GTX 1080 Gaming 8G Performance ASUS GTX 1060 Strix 6G Performance Sapphire Nitro R9 Fury 4G Performance Sapphire Nitro RX 480 8G Performance 16. Rise of the Tomb Raider (1080p, 4K)
Rise of the Tomb Raider (RoTR), Crystal Dynamics, Tomb Raider, . : RoTR .

Tomb Raider TressFX, RoTR . : , , , , , , DirectX 12.
, : (1-), (2-) (3-) — ( , — , ).
, , , 2-, , CPU , . - .
RoTR , , , , , , , , , , PureHair, TressFX.
-, 1920x1080 4K, 4K-. 1080p High, 4K Medium, - .
, RoTR , , INI-, TR . , , . FPS, 99 time under .
#1 Geothermal Valley Spine of the Mountain
MSI GTX 1080 Gaming 8G Performance ASUS GTX 1060 Strix 6G Performance Sapphire Nitro R9 Fury 4G Performance Sapphire Nitro RX 480 8G Performance #2 Prophet's Tomb
MSI GTX 1080 Gaming 8G Performance ASUS GTX 1060 Strix 6G Performance Sapphire Nitro R9 Fury 4G Performance Sapphire Nitro RX 480 8G Performance #3 Spine of the Mountain Geothermal Valley
MSI GTX 1080 Gaming 8G Performance ASUS GTX 1060 Strix 6G Performance Sapphire Nitro R9 Fury 4G Performance Sapphire Nitro RX 480 8G Performance , 1950X .
17. Rocket League
« – » . Katamari – , , . . , , Rocket League.
Rocket League pick-up-and-play, ( ), . Unreal Engine 3, , - , . 2015 5 , , , . , , , , . Rocket League , — .

, , , «» . , . , Unreal 3, Rocket League . .
, Rocket League , , . : Fraps , ( ), , 4v4, , , .
, , , , , . , , . (Aquadome, , , - / ) . 4 (, 5 DIRT: Rally benchmark), , 99- time under.

Rocket League : Low, Medium, High High FXAA. ; . 1920x1080 4K FPS.
MSI GTX 1080 Gaming 8G Performance ASUS GTX 1060 Strix 6G Performance Sapphire Nitro R9 Fury 4G Performance Sapphire Nitro RX 480 8G Performance Ryzen NVIDIA, . , , Ryzen Rocket League NVIDIA, Threadripper. , , Intel, , Rocket League , SMT-off 1950X. Time Under AMD, 1950X .
18. Grand Theft Auto
Grand Theft Auto 14 2015 , AMD, NVIDIA . GTA , , Advanced Game Engine Rockstar DirectX 11. , , , , , , .

. : , – 90 . , , — , , . , . , .
GTA , , . , / / / . MSAA, , -, . , , , , , ( , GPU , , R7 240 4 ).
, 1920x1080, Very High , 4K High . , , 99- time-under .
MSI GTX 1080 Gaming 8G Performance ASUS GTX 1060 Strix 6G Performance Sapphire Nitro R9 Fury 4G Performance Sapphire Nitro RX 480 8G Performance , Threadripper Ryzen, .
19. ,
具有以前设计的可在40-95 W范围内运行的AMD解决方案(或大多数处理器具有TDP的Intel平台)之后,带有处理器冷却系统的Threadripper设计可实现180 W TDP(散热设计功率)的散热。最高95瓦,高端140瓦。 尽管我们不要忘记AMD已经发布了具有220W TDP的处理器-FX-9590以5 GHz的频率运行,最初以整年作为OEM产品销售,以确保用户拥有足够的功率冷却。 最后,它作为带有液体冷却器和两个风扇的最终产品发布。
零售中的AMD 5 GHz Turbo CPU:FX-9590和华擎990FX Extreme9评测因此,对于AMD而言,180W TPD仍然不是一个新概念。 在本次评测中,我使用了FX-9590时获得的AMD液冷,因为它的设计功耗至少为220瓦。 (AMD还提供了Thermaltake 3x120散热器和Threadripper,但要在我们的测试台上安装要困难得多。)
为了测试电源,我们运行Prime95至少60秒钟,然后使用该软件对芯片上的内置电源传感器进行轮询以获取结果。 取决于CPU,我们可以在内核,DRAM,非内核或集成GPU上接收整个芯片的数据-重要的是我们的工具必须具有最新更新,因为必须知道用于接收此数据的寄存器。 通常,与更具侵入性的方法相比,这种读取能耗的方法可能不够准确,它对于脚本的管理是快速且负担得起的。 此外,正是这些数据确定了中央处理器何时达到功率极限并需要提高风扇速度。
首先,让我们看一下Threadripper的全部功耗。

通常,即使在空闲时,Threadripper也非常贪婪。 内存控制器和PCIe总线消耗了此处的大部分功率,以支持带有静态显示的图形处理器。 1950X DDR4-3200内存又从CPU汲取了13 W +的事实,说明了内存控制器如何影响总功耗。 对于所有芯片,我们记录的核心功率为2瓦。
当我们将处理器加载到一个线程中时,它会启动非核心/网格以及内存,并进入最大Turbo模式。 根据处理器的设计方式,它可以一次加载一个或多个内核-然后,尽管只有一个内核可以完成工作,但其余的仍然会增加能耗。

结果表明,不同的Threadripper处理器再次显示出大致相同的结果,消耗了更多的Ryzen处理器,分别对应于Broadwell-E和Haswell-E的10C / 8C CPU。 在DDR4-3200上运行的1950X仍然消耗额外的+ 13瓦,但有趣的是Skylake-X内核的能耗跃升至大约相同的值。 似乎Skylake-X中使用的MoDe-X连接也会消耗大量功率。
在下一个测试中,我们为处理器加载此芯片设计的最大线程数。 这种方法将在所有内核,内存控制器和互连上提供最大负载。

所有Threadripper处理器均达到177瓦,仅低于180瓦TDP,而Skylake-X处理器超过了其规定的140瓦TDP。 在游戏模式下的1950X似乎消耗的功率略少,这可能是由于NUMA中推出了DRAM。
对于某些芯片,我们只能看到内核的功耗。 在满负载下,我们得到了有趣的结果:

该图中的关键元素是运行在DDR4-3200上的1950X。 由于更快的DRAM需要内存控制器消耗更多的功率,因此它会为处理器内核留下更少的功率,这可能导致较低的Turbo频率。 因此,虽然更快的内存可以保证在依赖于内存的方案中具有更好的性能,但是内核频率可能会更低,从而导致更差的总体性能。 这是一个有趣的发现,因此我们在DDR4-2400和DDR4-3200上计算了1950X的核心功率。

在此图中,垂直轴上的核心数是测量功率的核心,水平轴上是加载的核心数,一次是两个线程。
最初,我们看到当两个线程加载相同的内核时,此单核设备消耗20.77瓦。 从芯片的一半内核被加载的那一刻起,指示器下降到19瓦,然后下降到17瓦,16瓦和11瓦。 正如我们所看到的,当加载8个内核时,内核本身消耗89瓦-如果加上DRAM控制器的消耗,结果肯定会比Ryzen处理器大。 但是,当我们加载10个以上的内核时,会发生一些奇怪的事情:内核的总功耗从120瓦降至116瓦,而在运行24个线程时降至102瓦。 这表明硅基质的第二层每核消耗更少的能量。 然后,随着满载芯片为每个内核提供约8.2瓦的功耗,功耗再次上升。
切换到DDR4-3200内存显示了类似的情况:

首先,一个核心接收多达21瓦的功率,然后在装入新核心时以大约4核心/ 8线程的速度进行消耗,我们观察到了更低的功耗-DDR4-3200上每个核心15瓦(与DDR4-2400上每个核心16瓦相比)。 继续,我们观察到24-26流量有轻微波动,因此,在满负载时,所有内核的功耗为114 W,比DDR4-2400少20W。
并非所有关于“游戏模式”的数据都是正确获取的,因此尽管有必要对此进行有趣的评论,但我们也不敢从结果中得出更深的结论。 在游戏模式下,当系统需要少量线程(例如2到8)时,由于SMT被禁用,因此这些线程必须在不同的CCX上运行。 在创建者模式下,这些流被分组在一个CCX上的1-4个内核中,消耗的功率更少。 对于DDR4-2400,这意味着8个线程(4个内核)在Creator模式下为65瓦,而8个活动内核在Game模式下为89瓦。
20.创建者模式和游戏模式分析
如本评论第3页所述,AMD提供了两种模式:创建者模式(所有内核均已打开并且具有统一内存访问(UMA)架构)和游戏模式(其中一种矩阵被禁用,并且该架构已调整为非统一内存架构(NUMA)) 。 这个想法是,在创建者模式下,您可以使用所有的流和带宽,而游戏模式则专注于与尚未准备好与那么多内核一起使用的游戏的兼容性,同时提高了向内存和从内核传输数据的速度并保持在同一硅层内的流动。
两种方法都有其正面和负面的一面。 尽管可以通过在Ryzen Master中按下按钮然后重新启动来进行切换,但是大多数对这些设置感兴趣的用户可能会选择一次所需的模式而忘了它(在这里,请注意,如果BIOS重置,那么设置也是如此。 ..)

21.结论
在这篇综述中,我们研究了有关具有大量内核的处理器的几个重要主题:功率,频率和“喂食野兽”。 启动处理器就像是逆向操作-您需要尽可能多地输入数据,以便至少在输出中获取某些内容并了解“隐藏在幕后”的内容。
AMD和英特尔采用不同的方法来实现这一目标。 我们看到了多矩阵解决方案与单块解决方案。 基于MoDe-X的内核复合体和Infinity Fabric与网格。 统一内存访问与不均匀内存访问。 他们俩都在争取高频和低功耗。 AMD支持ECC和更多PCIe通道,而英特尔为AVX-512提供了更完整的芯片组和特殊说明。 两家竞争者都在争夺高端生产者和工作站市场,这为高性能多任务处理做出了贡献,这是释放处理器潜力的关键。

我们在规格中看到的是:与Core i9-7900X相比,AMD Ryzen Threadripper 1950X具有6个以上的内核,另外还以相同的价格提供16条PCIe线路和ECC支持。 与即将推出的16核Core i9-7960X相比,Threadripper 1950X仍然具有优势-16条PCIe线路,ECC支持,比其竞争对手便宜得多。
与Core i7-7820X相比,1920X处理器为用户提供了更多的内核,ECC支持以及PCIe通道数量的两倍以上,相差100美元。 简而言之,如果有需要PCIe通道的硬件,AMD可以提供一些服务。

至于性能测试,有几个角度可以描述我们的结果。 在原始IPC方面,AMD仍然落后,但在频率方面显示出不错的成绩。 英特尔仍然在单线程任务中胜出,尤其是那些依赖DRAM延迟的任务。 当任务需要大量线程时,AMD挺身而出,通常,内存分配没有看起来那么麻烦。 如果用户具有可扩展的工作负载,则AMD将提供内核以使其能够尽可能扩展。

尽管Threadripper设计可能更适合于繁重的工作任务,但与Ryzen 7相比,它的高频率意味着游戏将成为“方程式”的一部分。 在其默认的Creative模式下,Threadripper的游戏性能最多处于中等水平:很少有游戏可以使用所有这些流,并且可变的DRAM延迟意味着内核有时大致会相互绊倒,试图“交谈”并预测何时工作将会完成。 为了解决此问题,AMD提供了一种游戏模式,该模式可以减少内核数量,并将内存分配集中在最靠近内核的DRAM中(这会损害最大DRAM带宽)。 这对最小帧速率具有最大的影响,而对平均FPS的影响最大,对1080p的影响大于4K,这可能与高档游戏玩家的预期相反。 游戏模式不会影响某些游戏,而在另一些游戏中则可能会开辟新的可能性。
如果我接受并说Threadripper处理器通常不是处理器,这会激怒技术读者。 正确的答案不是最佳的游戏处理器。 但是AMD从另一方面涵盖了所有这些方面:处理器允许用户同时播放,流式传输,观看和处理所有内容。
您将需要做很多事情,并立即填充最多16个内核,这意味着对于那些这样做的人,AMD是潜在的赢家。 对于那些需要硬核带宽的人,可以进行转码,解码; 诸如Blender,Cinema 4D或光线跟踪之类的渲染是一个出色的处理器。 对于拥有多个GPU的所有者或多存储的爱好者,或者想要将六个PCIe 3.0 x8 FPGA压缩到系统中的用户,AMD提供了一个很好的产品。

另一方面,无论消费者处理器中的16个内核看上去有多酷(从这个意义上讲,整个Threadripper看起来都很酷-就像90年代硬核的风格一样),Threadripper线程在消费者负载中都远非总是有用。 仅有一些知名的工作负载可以使芯片完全饱和:视频编码是最好的例子。 其余的根本不能使用多个线程。 这主要是由于在过去的8年中,英特尔的四核芯片是高性能消费类处理器的一个例子。 但是,Amdahl烦人的定律总是在附近,处理器中的内核数量也在不断增长。
这里有一个不可预测的因素-这是AMD领先的领域:内核分布不均。 到目前为止,NUMA从未面向客户,这就是为什么AMD面临我们审查中讨论的问题的原因。
几种模式的存在是一个非常明智的选择,尤其是因为那里有很多软件不“了解” NUMA,但是如果从等式中推导出NUMA且处理器被视为完全单片设备,则可以很好地加载CPU。 但是,令人不愉快的是切换模式需要重新启动。 通过切换模式可以获得不错的回报,但这需要额外的移动。 从长远来看,启用NUMA的代码将消除此问题,并自动以最小的延迟使用内存。 但是即使在这种情况下,AMD不仅创造了解决方案,而且创造了一个问题,因为即使在理想版本中,NUMA也会产生许多编程问题,而且将来每个程序不太可能都能正确使用它。
话虽如此,使用NUMA的处理器目前在消费者领域有些冗余。 它对于某些极端负载非常好,但不如Ryzen平衡。 丢弃多余的空间,这意味着与Ryzen相比,Threadripper并不总是能够显着提高性能。 而且这并不是AMD独有的功能-长期以来,英特尔HEDT产品要求在内核数量和单线程顶级性能之间进行选择,但是使用Threadripper来计算CPU性能变得更加困难。 将处理器扩展到尽可能多的内核存在困难,而Threadripper承担了这一负担。 因此,对于消费者(这是处理器所针对的市场)来说,考虑其计划的工作负载是前所未有的重要。 您需要更快的手刹编码或更流畅的游戏玩法吗? 您是否可以在Threadripper上扔足够多的内核以使野兽忙,还是仅偶尔需要比现有的8个Ryzen内核更多的内核?

AMD承诺该插槽至少可以使用两代,因此Threadripper 2000系列出现时应在更新BIOS后立即出现。 有趣的是,考虑到插槽的大小和矩阵配置,AMD可以轻松地将这两个“死”硅封装转变为“真实”硅封装并提供32个内核。 (尽管这些额外的核心是访问速度问题的瓶颈)。
这就是核战争。 我们正在接近第一个可以使Kessel运行不到12秒差距的芯片(指《星球大战》-大约翻译)。
作为广告。 在寒假的前夕,促销活动更加重要! 赶快利用新年优惠,在订购3个月或6个月时首次付款可获得25%的折扣!
这些不仅仅是虚拟服务器! 这些是带有专用驱动器的VPS(KVM),这不会比专用服务器差,并且在大多数情况下-更好!
我们在荷兰和美国制造了带有专用驱动器的 VPS(KVM)(来自VPS(KVM)的配置-E5-2650v4(6核)/ 10GB DDR4 / 240GB SSD或4TB HDD / 1Gbps 10TB,价格低廉-从$ 29 /月,提供RAID1和RAID10的选件) ,不要错过订购新型虚拟服务器的机会,在这种虚拟服务器上,所有资源都属于您,就像在专用虚拟服务器上一样,价格要低得多,而硬件要多得多!
如何建立建筑物的基础设施。 使用价格为9000欧元的Dell R730xd E5-2650 v4服务器的上等课程? 戴尔R730xd便宜2倍? 仅
在荷兰和美国,我们有
2台Intel Dodeca-Core Xeon E5-2650v4 128GB DDR4 6x480GB SSD 1Gbps 100电视(249美元起) !