
8月7日,第二代AMD EPYC™产品线在全球推出。 新处理器基于
Zen 2微架构,并基于7纳米工艺构建。
特色功能
民间智慧读到:“他们受到衣服的欢迎,受到心灵的陪伴。” 因此,我们将从新一代的“衣服”开始。 处理器的标记发生了细微的变化:表示代的第四位从
1变为
2 。 和前面一样,第一个数字表示序列,第二个和第三个数字表示模型。 AMD尚未放弃带有P索引的处理器,该索引不支持多插槽系统。
第二代继承了第一代的
SP3插槽,而没有进行任何更改,从而允许在不更新主板的情况下使用新处理器,但这将无法充分发挥它们的潜力。 使用支持3200 MHz的DDR4内存的新主板可以实现完整的性能。
处理器的“填充”功能已超出了人们的认识范围:技术过程发生了变化,应用了新的
Zen 2微体系结构,并出现了新的高速存储控制器。
性能表现
向
7纳米制程的过渡导致晶体的致密化,核心数量增加到
64个 ,是第一代的两倍。 第二代处理器的基本频率在
2.00至2.90 GHz的范围内。 为了进行比较,第一代的基数不超过
2.30 GHz 。 内核数量和处理器基本频率的增加导致预算版本的散热量增加至
120 瓦 ,顶级版本的散热量增加至
225瓦 。
流程改进不是唯一的创新。 一种称为
Zen 2的新微体系结构有助于改善处理器规格。 改进旨在与缓存交互:与L1的数据交换速度增加了一倍,提高了缓存之间的数据传输速度,增加了L3缓存的大小。
该表的详细规格列在表中。
Rome在使用外部设备方面取得了进步:第一次,可以使用外部
x2APIC中断
控制器 ,并且还支持
DDR4-3200和
128-PCIe通道 。 新一代处理器包括对
虚拟IOMMU技术的支持,虚拟机可通过该技术直接访问物理外围设备。
容量的增加和虚拟化条件的改善导致同时运行的应用程序数量增加。 应用程序使用需要加强保护的机密数据。
安全性
在更新的处理器系列中,安全性问题不是最后的问题。 在系统内部,处理器安装在基于
ARM®Cortex®A5的称为
AMD安全处理器的芯片上,该芯片存储密钥并使用
AES-128算法对RAM的内容进行加密。
AMD安全处理器提供两种类型的内存加密(这些方法需要操作系统支持):
- SME (安全存储器加密);
SME使用单个密钥加密内存,并防止物理攻击(例如冷启动攻击)。 使用这种类型的加密不需要更改用户应用程序:操作系统会标记需要加密的内存页面。
- SEV (安全加密虚拟化)。
SEV旨在在使用虚拟机(VM)时提供安全性。 系统管理程序和每个VM使用的内存使用其自己的密钥进行加密。 这种方法通过密码将虚拟机管理程序和VM相互隔离。
测试服务器
既然知道了新颖性的理论,我们将进行实际测试。 AMD EPYC™7452将成为第二代产品的代表,AMD EPYC™7551被选为第一代产品的对手,来自“蓝色”阵营的对手是英特尔®至强®金牌5218作为两路系统的一部分。 这些系统的选择因其技术特性的相似性而合理。
在测试中,处理器处于平等地位:相同的内存,相同的驱动器和具有相同设置的相同操作系统。
为了获得最佳性能,必须启用处理器内存控制器的所有通道。 英特尔®处理器具有六个通道,而AMD处理器具有八个通道。 由于存在这种差异,很难创建相同的条件,因此找到了一个折衷方案:配备AMD处理器的系统具有8个每个16 GB的模块,而配备英特尔®至强®的双插槽系统具有12个8 GB的模块。 所有RAM模块的工作频率为
2666 MHz 。
操作系统(OS)托管在SSD上,以减少磁盘子系统对测试的影响。 所有测试均在CentOS版本7上进行。
测验
测试应该尽可能客观,尤其是因为我们正在谈论比较英特尔®处理器和AMD。 因此,我们不会使用优化的编译器来构建作为源代码提供的测试。
GeekBench 4
GeekBench是一种流行的跨平台处理器性能测试,带有其自己的
在线结果
数据库 。 测试以现成的可执行文件的形式提供,这就是为什么未提供针对特定处理器的优化的原因。
对于我们来说,GeekBench组的常规指标很重要:
指示的测试组以两种模式启动:在单个线程中以及在所有内核上同时执行时。 根据结果,GeekBench给出了最终评分:
单核成绩和
多核成绩 。
主要的挑战是AMD EPYC™7452和Intel®Xeon®Gold 5218之间的竞争,而第一代EPYC™在所有测试中均次于第二代。
考虑单线程测试。
在使用加密任务和内存时,Rome显示出极好的结果,但在执行整数计算时却失去了。 结果,第二代EPYC™获得了4893分,并成为
单核提名的获胜者。 第二和第三名分别是第一代至强和EPYC,分别获得4695和3981分。
在多线程测试中,功率平衡发生了显着变化。
EPYC™7452在计算方面做得很好,但是在加密任务和内存使用方面却处于失地,这并不能阻止其在
多核提名中以96009分的优势成为领导者。
SPEC CPU 2017
SPEC CPU 2017是处理器制造商认可的一组性能测试。 该测试集以源代码的形式分发,使您可以针对特定操作系统上的特定设备对其进行优化。
SPEC CPU包含四个测试套件:
- int_rate;
- int_speed;
- fp_rate;
- fp_speed。
测试名称的第一部分确定处理器上的计算类型:整数(int)或大于浮点数(fp)。 第二部分确定测试的类型:单核(速率)或多核(速度)。
我们进行了所有四个测试套件。 使用
GNU 4.8.5编译器套件在第三级优化中编译测试。 多核测试以64个线程运行,单核测试以32个副本运行。
使用优化进行编译的测试显示与GeekBench不一致的结果。 在intspeed之外的所有测试中,第二代AMD EPYC™均优于采用Intel®处理器的双路系统,但利润率明显低于GeekBench。
Phoronix测试套件
Phoronix测试套件 (PTS)-使您能够从用户性能测试的大型数据库中运行测试的软件。 该解决方案使您可以在多个实验服务器上自动运行所需的测试,同时在主服务器上汇总结果。
我们已经开发出一套21种测试,包括:
- 缓存带宽测试(CacheBench);
- 测试RAM的带宽(RAMspeed,Stream,MBW);
- 密码任务解决方案(Botan,OpenSSL,开膛手约翰)
- 使用射线跟踪(C射线,POV射线,Smallpt)进行图像渲染;
- 负载下的NGINX服务器的仿真;
- 音频/视频转换。
| 磐正7452 | 磐正7551 | 2个Xeon 5218 |
RAMspeed SMP-类型:添加-基准测试:整数 | 32476.9 | 26531.49 | 28942.2 |
RAMspeed SMP-类型:复制-基准测试:整数 | 30325.76 | 23419.86 | 27165.75 |
RAMspeed SMP-类型:比例-基准:整数 | 30429,76 | 22011.08 | 28629.12 |
RAMspeed SMP-类型:Triad-基准:整数 | 31482.6 | 18208.58 | 28299.14 |
RAMspeed SMP-类型:平均值-基准:整数 | 31060.8 | 31745.71 | 28432.31 |
RAMspeed SMP-类型:添加-基准测试:浮点 | 32434.26 | 37939.5 | 28445.26 |
RAMspeed SMP-类型:复制-基准测试:浮点 | 30386.99 | 35209.97 | 27119.9 |
RAMspeed SMP-类型:比例-基准:浮点 | 30,097.11 | 30509.05 | 26508.4 |
RAMspeed SMP-类型:Triad-基准:浮点 | 32473.04 | 38458.6 | 28385.89 |
RAMspeed SMP-类型:平均值-基准:浮点 | 31295.5 | 34393.3 | 27,637.44 |
流-类型:复制 | 107,192.8 | 110,996.94 | 126,257.4 |
流-类型:比例 | 72,434.42 | 87,300.88 | 105633.7 |
流-类型:三合会 | 77729,72 | 97735.96 | 115100.86 |
流-类型:添加 | 77021.16 | 97,204.36 | 114907.6 |
MBW-测试:内存复制-阵列大小:8192 MiB | 16888.52 | 12,402.32 | 4845.29 |
MBW-测试:内存复制,固定块大小-阵列大小:8192 MiB | 10752.12 | 7410.17 | 2982.56 |
CacheBench-测试:读取 | 2312.41 | 2079.62 | 3286,28 |
CacheBench-测试:写入 | 24357.4 | 20329.21 | 27520.75 |
CacheBench-测试:读取/修改/写入 | 24920.3 | 21,598.98 | 28966.95 |
GNU MPC-多精度基准 | 7143 | 5810 | 8950 |
NAMD-ATPase模拟-327,506原子 | 0,80079 | 0.94119 | 0.77091 |
Botan-测试:KASUMI-加密 | 69.69 | 61.74 | 78.69 |
Botan-测试:KASUMI-解密 | 67.16 | 58.57 | 74.85 |
Botan-测试:AES-256-加密 | 4575.94 | 4,173.76 | 3687.71 |
Botan-测试:AES-256-解密 | 4552.92 | 4152.07 | 3704.3 |
Botan-测试:Twofish-加密 | 279.59 | 247.38 | 325.1 |
Botan-测试:Twofish-解密 | 281.87 | 249.85 | 333.97 |
Botan-测试:河豚-加密 | 247.76 | 217.14 | 282.4 |
Botan-测试:河豚-解密 | 249.19 | 217.89 | 283.61 |
Botan-测试:CAST-256-加密 | 116,150 | 101,470 | 124,690 |
Botan-测试:CAST-256-解密 | 116.68 | 101.95 | 125.75 |
约翰开膛手-测试:河豚 | 49851 | 40568 | 39555 |
7压缩压缩-压缩速度测试 | 163202 | 107009 | 135458 |
C射线-总时间-4K,每像素16射线 | 23.41 | 26.65 | 29.48 |
POV射线-跟踪时间 | 18.67 | 23.3 | 20.46 |
Smallpt-全局照明渲染器; 128个样本 | 15.06 | 5.52 | 58.97 |
dav1d-视频输入:Summer Nature 4K | 17.67 | 28.37 | 20.98 |
FLAC音频编码-WAV到FLAC | 12.22 | 14.17 | 11.43 |
FFmpeg-H.264 HD转NTSC DV | 9.14 | 10.85 | 11.46 |
Hackbench-计数:1-类型:螺纹 | 3.9 | 5.82 | 3.35 |
Hackbench-计数:8-类型:螺纹 | 10.9 | 18.11 | 8.73 |
Hackbench-计数:1-类型:处理 | 3.78 | 5.43 | 3.15 |
Hackbench-计数:8-类型:处理 | 9.66 | 13.31 | 8.14 |
Hackbench-计数:32-类型:处理 | 39.02 | 32.25 | 27.74 |
OpenSSL-RSA 4096位性能 | 6825.9 | 4351.47 | 6809.23 |
ctx_clock-上下文切换时间 | 211 | 220 | 160 |
NGINX基准测试-静态网页服务 | 26991.79 | 17497.02 | 28274.97 |
Schbench-消息线程:2-每个消息线程的工人数:2 | 42 | 204 | 101 |
Schbench-消息线程:8-每个消息线程的工人数:8 | 4624 | 4704 | 7009 |
Schbench-消息线程:32-每个消息线程的工人数:32 | 156416 | 157952 | 167509 |
辐射基准-测试:串行 | 807,01 | 783.48 | 1102.24 |
辐射基准-测试:SMP并行 | 260.47 | 238.69 | 333.32 |
在测试中,AMD EPYC™7551排名第一。
无论采用哪种处理器,AMD处理器都更擅长在内存,渲染和视频转码的单线程工作。 反过来,如早先在GeekBench测试中所揭示的,英特尔®处理器在加密任务和内存多线程工作方面表现更好。
结论
尽管测试多种多样,但第一代和第二代AMD EPYC™之间的选择是显而易见的:
在绝大多数测试中,罗马胜过其前身。 但是,第一代在处理内存和渲染方面并没有失落。
英特尔®处理器和AMD的比较-泰坦之战,需要详细考虑。 已安装的软件解决方案在第二代AMD EPYC™上平均表现更好。 特别是,罗马在多线程计算和单线程加密任务中显示了出色的结果。 当使用从源代码编译的软件时,首选的是新一代EPYC™处理器,该处理器在浮点测试中处于领先地位,而在多线程整数计算中仅稍稍落后。
反过来,英特尔®至强®黄金在多线程加密,音频转码和内存处理方面也显示出良好的效果。 在处理Web服务器请求时,带有Intel®Xeon®处理器的双路系统运行良好。
总结一下,应该注意的是,所执行的测试是综合性的,实际任务的结果可能会有所不同。 为了获得特定任务的准确结果,需要进行其他测试。 现在只谈几句话。 AMDEPYC®7452的建议价格为2025美元,英特尔®至强®金牌5218为1250美元,也就是组织双插槽系统的建议价格为2500美元。
新的AMD EPYC™7452即将在我们的Selectel Lab上市。成为第一个知道的人!
第二代EPYC™只是AMD与Intel之间对抗的又一轮。 您可以在我们的
博客中详细了解两家公司之间的竞争是如何开始的。
UPD 新的AMD EPYC™第二代处理器已经上市。
使用配置程序构建您自己 的基于AMD EPYC™Rome 7402P的服务器 ,或者在我们的Selectel LAB实验室中提出测试要求 。
以下配置可用于测试:
- 1个AMD EPYC™7402P / 128 GB DDR4 / 2×1920 GB SSD + 2×8 TB硬盘
- 1个AMD EPYC™7552/512 GB DDR4 / 2×1940 GB SSD + 2×8 TB硬盘