那不勒斯到罗马:新型AMD EPYC CPU



8月7日,第二代AMD EPYC™产品线在全球推出。 新处理器基于Zen 2微架构,并基于7纳米工艺构建。

特色功能



民间智慧读到:“他们受到衣服的欢迎,受到心灵的陪伴。” 因此,我们将从新一代的“衣服”开始。 处理器的标记发生了细微的变化:表示代的第四位从1变为2 。 和前面一样,第一个数字表示序列,第二个和第三个数字表示模型。 AMD尚未放弃带有P索引的处理器,该索引不支持多插槽系统。

第二代继承了第一代的SP3插槽,而没有进行任何更改,从而允许在不更新主板的情况下使用新处理器,但这将无法充分发挥它们的潜力。 使用支持3200 MHz的DDR4内存的新主板可以实现完整的性能。

处理器的“填充”功能已超出了人们的认识范围:技术过程发生了变化,应用了新的Zen 2微体系结构,并出现了新的高速存储控制器。

性能表现


7纳米制程的过渡导致晶体的致密化,核心数量增加到64个 ,是第一代的两倍。 第二代处理器的基本频率在2.00至2.90 GHz的范围内。 为了进行比较,第一代的基数不超过2.30 GHz 。 内核数量和处理器基本频率的增加导致预算版本的散热量增加至120 ,顶级版本的散热量增加至225瓦

流程改进不是唯一的创新。 一种称为Zen 2的新微体系结构有助于改善处理器规格。 改进旨在与缓存交互:与L1的数据交换速度增加了一倍,提高了缓存之间的数据传输速度,增加了L3缓存的大小。

该表的详细规格列在表中。
型号TDP,瓦特核心数基本频率,GHz最大频率,GHzL3缓存大小,MB
7742225642.253.40256
7702 / 7702P200642.003.35256
7642225482.303.30256
7552200482.203.30192
7542225322.903.40128
7502 / 7502P180322.503.35128
7452155322.353.35128
7402 / 7402P180242.803.35128
7352155242.303.20128
7302 / 7302P155163.003.30128
7282120162.803.2064
7272120122.903.2064
726215583.203.40128
725212083.103.2064
7232P12083.103.2032
Rome在使用外部设备方面取得了进步:第一次,可以使用外部x2APIC中断控制器 ,并且还支持DDR4-3200128-PCIe通道 。 新一代处理器包括对虚拟IOMMU技术的支持,虚拟机可通过该技术直接访问物理外围设备。

容量的增加和虚拟化条件的改善导致同时运行的应用程序数量增加。 应用程序使用需要加强保护的机密数据。

安全性


在更新的处理器系列中,安全性问题不是最后的问题。 在系统内部,处理器安装在基于ARM®Cortex®A5的称为AMD安全处理器的芯片上,该芯片存储密钥并使用AES-128算法对RAM的内容进行加密。

AMD安全处理器提供两种类型的内存加密(这些方法需要操作系统支持):

  • SME (安全存储器加密);

    SME使用单个密钥加密内存,并防止物理攻击(例如冷启动攻击)。 使用这种类型的加密不需要更改用户应用程序:操作系统会标记需要加密的内存页面。
  • SEV (安全加密虚拟化)。

    SEV旨在在使用虚拟机(VM)时提供安全性。 系统管理程序和每个VM使用的内存使用其自己的密钥进行加密。 这种方法通过密码将虚拟机管理程序和VM相互隔离。

测试服务器


既然知道了新颖性的理论,我们将进行实际测试。 AMD EPYC™7452将成为第二代产品的代表,AMD EPYC™7551被选为第一代产品的对手,来自“蓝色”阵营的对手是英特尔®至强®金牌5218作为两路系统的一部分。 这些系统的选择因其技术特性的相似性而合理。
磐正7452磐正7551至强5218
核心数323216
线程数646432
基本频率,GHz2.352.002.30
最大频率,GHz3.703.003.90
TDP,瓦特155180125
RAM类型DDR4-3200DDR4-2666DDR4-2666
L1缓存,KB204830721024
L2缓存,KB163841638416384
三级缓存,MB1286422
在测试中,处理器处于平等地位:相同的内存,相同的驱动器和具有相同设置的相同操作系统。

为了获得最佳性能,必须启用处理器内存控制器的所有通道。 英特尔®处理器具有六个通道,而AMD处理器具有八个通道。 由于存在这种差异,很难创建相同的条件,因此找到了一个折衷方案:配备AMD处理器的系统具有8个每个16 GB的模块,而配备英特尔®至强®的双插槽系统具有12个8 GB的模块。 所有RAM模块的工作频率为2666 MHz

操作系统(OS)托管在SSD上,以减少磁盘子系统对测试的影响。 所有测试均在CentOS版本7上进行。
磐正7452磐正7551至强5218
处理器1个AMD EPYC 74521个AMD EPYC 75512个Intel Xeon 5218
内存8个16GB DDR4-26668个16GB DDR4-266612 x 8 GB DDR4-2666
磁碟1个Samsung SSD 850 EVO 250GB1个Intel SSD S4510 480 GB1个Intel SSD S4510 480 GB

测验


测试应该尽可能客观,尤其是因为我们正在谈论比较英特尔®处理器和AMD。 因此,我们不会使用优化的编译器来构建作为源代码提供的测试。

GeekBench 4


GeekBench是一种流行的跨平台处理器性能测试,带有其自己的在线结果数据库 。 测试以现成的可执行文件的形式提供,这就是为什么未提供针对特定处理器的优化的原因。

对于我们来说,GeekBench组的常规指标很重要:

  • 加密分数;
  • 整数分数;
  • 浮点分数;
  • 记忆分数。

指示的测试组以两种模式启动:在单个线程中以及在所有内核上同时执行时。 根据结果​​,GeekBench给出了最终评分: 单核成绩多核成绩


主要的挑战是AMD EPYC™7452和Intel®Xeon®Gold 5218之间的竞争,而第一代EPYC™在所有测试中均次于第二代。

考虑单线程测试。 在使用加密任务和内存时,Rome显示出极好的结果,但在执行整数计算时却失去了。 结果,第二代EPYC™获得了4893分,并成为单核提名的获胜者。 第二和第三名分别是第一代至强和EPYC,分别获得4695和3981分。


在多线程测试中,功率平衡发生了显着变化。 EPYC™7452在计算方面做得很好,但是在加密任务和内存使用方面却处于失地,这并不能阻止其在多核提名中以96009分的优势成为领导者。

SPEC CPU 2017


SPEC CPU 2017是处理器制造商认可的一组性能测试。 该测试集以源代码的形式分发,使您可以针对特定操作系统上的特定设备对其进行优化。

SPEC CPU包含四个测试套件:

  • int_rate;
  • int_speed;
  • fp_rate;
  • fp_speed。

测试名称的第一部分确定处理器上的计算类型:整数(int)或大于浮点数(fp)。 第二部分确定测试的类型:单核(速率)或多核(速度)。

我们进行了所有四个测试套件。 使用GNU 4.8.5编译器套件在第三级优化中编译测试。 多核测试以64个线程运行,单核测试以32个副本运行。


使用优化进行编译的测试显示与GeekBench不一致的结果。 在intspeed之外的所有测试中,第二代AMD EPYC™均优于采用Intel®处理器的双路系统,但利润率明显低于GeekBench。

Phoronix测试套件


Phoronix测试套件 (PTS)-使您能够从用户性能测试的大型数据库中运行测试的软件。 该解决方案使您可以在多个实验服务器上自动运行所需的测试,同时在主服务器上汇总结果。

我们已经开发出一套21种测试,包括:

  • 缓存带宽测试(CacheBench);
  • 测试RAM的带宽(RAMspeed,Stream,MBW);
  • 密码任务解决方案(Botan,OpenSSL,开膛手约翰)
  • 使用射线跟踪(C射线,POV射线,Smallpt)进行图像渲染;
  • 负载下的NGINX服务器的仿真;
  • 音频/视频转换。
磐正7452磐正75512个Xeon 5218
RAMspeed SMP-类型:添加-基准测试:整数32476.926531.4928942.2
RAMspeed SMP-类型:复制-基准测试:整数30325.7623419.8627165.75
RAMspeed SMP-类型:比例-基准:整数30429,7622011.0828629.12
RAMspeed SMP-类型:Triad-基准:整数31482.618208.5828299.14
RAMspeed SMP-类型:平均值-基准:整数31060.831745.7128432.31
RAMspeed SMP-类型:添加-基准测试:浮点32434.2637939.528445.26
RAMspeed SMP-类型:复制-基准测试:浮点30386.9935209.9727119.9
RAMspeed SMP-类型:比例-基准:浮点30,097.1130509.0526508.4
RAMspeed SMP-类型:Triad-基准:浮点32473.0438458.628385.89
RAMspeed SMP-类型:平均值-基准:浮点31295.534393.327,637.44
流-类型:复制107,192.8110,996.94126,257.4
流-类型:比例72,434.4287,300.88105633.7
流-类型:三合会77729,7297735.96115100.86
流-类型:添加77021.1697,204.36114907.6
MBW-测试:内存复制-阵列大小:8192 MiB16888.5212,402.324845.29
MBW-测试:内存复制,固定块大小-阵列大小:8192 MiB10752.127410.172982.56
CacheBench-测试:读取2312.412079.623286,28
CacheBench-测试:写入24357.420329.2127520.75
CacheBench-测试:读取/修改/写入24920.321,598.9828966.95
GNU MPC-多精度基准714358108950
NAMD-ATPase模拟-327,506原子0,800790.941190.77091
Botan-测试:KASUMI-加密69.6961.7478.69
Botan-测试:KASUMI-解密67.1658.5774.85
Botan-测试:AES-256-加密4575.944,173.763687.71
Botan-测试:AES-256-解密4552.924152.073704.3
Botan-测试:Twofish-加密279.59247.38325.1
Botan-测试:Twofish-解密281.87249.85333.97
Botan-测试:河豚-加密247.76217.14282.4
Botan-测试:河豚-解密249.19217.89283.61
Botan-测试:CAST-256-加密116,150101,470124,690
Botan-测试:CAST-256-解密116.68101.95125.75
约翰开膛手-测试:河豚498514056839555
7压缩压缩-压缩速度测试163202107009135458
C射线-总时间-4K,每像素16射线23.4126.6529.48
POV射线-跟踪时间18.6723.320.46
Smallpt-全局照明渲染器; 128个样本15.065.5258.97
dav1d-视频输入:Summer Nature 4K17.6728.3720.98
FLAC音频编码-WAV到FLAC12.2214.1711.43
FFmpeg-H.264 HD转NTSC DV9.1410.8511.46
Hackbench-计数:1-类型:螺纹3.95.823.35
Hackbench-计数:8-类型:螺纹10.918.118.73
Hackbench-计数:1-类型:处理3.785.433.15
Hackbench-计数:8-类型:处理9.6613.318.14
Hackbench-计数:32-类型:处理39.0232.2527.74
OpenSSL-RSA 4096位性能6825.94351.476809.23
ctx_clock-上下文切换时间211220160
NGINX基准测试-静态网页服务26991.7917497.0228274.97
Schbench-消息线程:2-每个消息线程的工人数:242204101
Schbench-消息线程:8-每个消息线程的工人数:8462447047009
Schbench-消息线程:32-每个消息线程的工人数:32156416157952167509
辐射基准-测试:串行807,01783.481102.24
辐射基准-测试:SMP并行260.47238.69333.32
在测试中,AMD EPYC™7551排名第一。 无论采用哪种处理器,AMD处理器都更擅长在内存,渲染和视频转码的单线程工作。 反过来,如早先在GeekBench测试中所揭示的,英特尔®处理器在加密任务和内存多线程工作方面表现更好。

结论


尽管测试多种多样,但第一代和第二代AMD EPYC™之间的选择是显而易见的: 在绝大多数测试中,罗马胜过其前身。 但是,第一代在处理内存和渲染方面并没有失落。

英特尔®处理器和AMD的比较-泰坦之战,需要详细考虑。 已安装的软件解决方案在第二代AMD EPYC™上平均表现更好。 特别是,罗马在多线程计算和单线程加密任务中显示了出色的结果。 当使用从源代码编译的软件时,首选的是新一代EPYC™处理器,该处理器在浮点测试中处于领先地位,而在多线程整数计算中仅稍稍落后。

反过来,英特尔®至强®黄金在多线程加密,音频转码和内存处理方面也显示出良好的效果。 在处理Web服务器请求时,带有Intel®Xeon®处理器的双路系统运行良好。

总结一下,应该注意的是,所执行的测试是综合性的,实际任务的结果可能会有所不同。 为了获得特定任务的准确结果,需要进行其他测试。 现在只谈几句话。 AMDEPYC®7452的建议价格为2025美元,英特尔®至强®金牌5218为1250美元,也就是组织双插槽系统的建议价格为2500美元。
新的AMD EPYC™7452即将在我们的Selectel Lab上市。

成为第一个知道的人!

第二代EPYC™只是AMD与Intel之间对抗的又一轮。 您可以在我们的博客中详细了解两家公司之间的竞争是如何开始的。
UPD 新的AMD EPYC™第二代处理器已经上市。

使用配置程序构建您自己 的基于AMD EPYC™Rome 7402P的服务器 ,或者在我们的Selectel LAB实验室中提出测试要求

以下配置可用于测试:

  • 1个AMD EPYC™7402P / 128 GB DDR4 / 2×1920 GB SSD + 2×8 TB硬盘
  • 1个AMD EPYC™7552/512 GB DDR4 / 2×1940 GB SSD + 2×8 TB硬盘

Source: https://habr.com/ru/post/zh-CN463401/


All Articles