
宣布不到两年后,英特尔在新的Cascade Lake架构上推出了第二代Intel Xeon可扩展处理器。 正式-4月2日。 该公司本身称其为历史上最大规模的发布,对它而言在战略上非常重要。 好吧,让我们弄清楚这些新的可伸缩性有什么特别之处。
还剩下什么?
像他们的前辈Skylake一样,处理器Cascade Lake,或者更确切地说是Cascade Lake SP,仍然属于Purley平台,现在是第二代平台-Purley Refresh。 它们在连接器级别与Skylake,从第一代继承的芯片组和主板完全兼容。 但是有细微差别-例如,新的BIOS。
工艺技术没有改变。 但是,相同的14 nm进行了优化。
Platinum,Gold,Silver,Bronze系列的通用命名和命名方案保持不变。 的确,还有更多的“后缀”。 新的Y,N,V和S已添加到现有的L,M和T中。第二个位置的编号(数百个)已更改:现在从统一而不是统一-两个,即Gold 6240将是继任者,例如Gold 6140。
否则,基本特征和功能集将保持不变。 内核数量和缓存大小保持位置:每个内核最多28个和1 MB L2 +总共38.5 MB的L3。 PCI-E线的数量和类型与它们相同-版本3.0的48线。 可扩展性是相同的:每10.4 GT / s最多3条UPI线路,系统中最多8个(无缝)插座。
您添加了什么?
通常,有许多不同的微更新,但我会从或多或少的重要更新中挑选出来。
首先,Cascade Lake去年推出了针对耸人听闻的漏洞的硬件补丁 。 英特尔针对选项2(Spectre),3、3a和4(Spectre NG)和L1TF(Foreshadow)推出了软件和硬件解决方案。 对于Spectre Variant 1,仅提供软件补丁。 也就是说,Intel Core i9系列中已经存在的所有内容。 因此,它出现在新闻稿中:
- 选项1.通过OS和VMM(虚拟机监视器)执行保护
- 选项2。硬件分支预测强化(通过这种方法防止将来的攻击)+通过OS和VMM
- 选项3.硬件加固
- 选项3a。 硬体
- 选项4.硬件+ OS / VMM
- L1TF。 硬件加固选项3已关闭
其次,出现了对DDR4-2933内存的支持。 但是有保留:仅适用于金线和白金线(青铜和银线仍可用于DDR4-2400),并且每个通道只有一个DIMM-在每个通道具有两个DIMM的配置中,频率降低到2666 MT / s。
第三,Intel Optane DC永久存储器(DCPM)首次发布。 关于 Tiskoma获得的
最清楚的措词 ,所以我引用:
“ Intel Optane DC永久存储器(DCPM)是一类新技术,结合了称为“存储器和存储”的概念,供数据中心使用。”
您可能还记得英特尔先前为至强Skylake引入了英特尔内存驱动技术:系统管理程序(Xen)+ Optane NVMe模块。 我们甚至对此主题进行了测试,但结果并不鼓舞人心,因此我们决定等待一个更令人印象深刻的解决方案。 似乎已经等待=)
英特尔新解决方案的核心是外观类似于DIMM的DCPMM,并且在电气和机械方面都与它们兼容。 它们的运行速度为2666 MT / s,容量为128/256/512 GB。 在逻辑级别上,它们使用DDR4-T(事务)协议,根据Intel的说法,该协议已得到JEDEC的认可,但实际上,只有Cascade Lake内存控制器支持该协议。 也就是说,他们在DDR4 DIM4连接器上安装了使用3D XPoint技术制成的与能量无关的内存,在速度和使用寿命方面,它比英特尔广泛使用的NAND闪存性能高出三个数量级(1000倍)。
事实证明,该解决方案非常有趣并且非常模棱两可:当然,存在操作功能(并非没有功能),价格和应用程序。 但是,我们不会将重点放在这种处理器系列的杀手级功能上-有关它的更详细的故事远远超出了本文的讨论范围。 一旦可以使用该技术的所有可能操作模式下的测试都准备就绪,请立即推出longrid :-)
第四,英特尔资源总监技术(RDT),速度选择(SST)和英特尔DL Boost技术已被大量采用。我将从RDT开始。 它代表了对应用程序的执行和资源使用进行相当精细的监视和控制的机制。 这不是什么新鲜的东西,但是在这一方面,他们把手很好地进行了细化。 最重要的是,具有较高优先级的应用程序可以获取所需的一切。 当然,由于其他应用程序的“侵权”。
现在是SST。 此处是相同的,但是在原子核的级别上:它使您可以牢固地区分一组优先于其他原子核的原子核。 这次的外观不是初次登台,而是相当壮观。
对于甜点,英特尔DL Boost。 创新涉及一组新的指令,以前称为矢量神经网络指令(VNNI)。 Gizmo for AI,或更确切地说,用于深度学习网络的更灵活的培训。 实际上,AVX-512上的另一个附件。
最后,第五。 按照旧的传统,有更多的频率,更多的内核可用于Intel更新:-)基本频率和Boost中的频率都增加了200-300 MHz。 除某些例外,每个处理器添加了两个内核。 支持的RAM数量已增加。
另外,值得一提的是英特尔在优化缓存和RAM的使用方面所做的工作,可能是为了最大程度地减少补丁从Spectre和Meltdown系列漏洞中带来的负面影响。
有关Cascade Lake体系结构的更多详细信息,请
参见wikichip 。 我建议阅读。 现在-传统测试。
测试中
测试涉及八个英特尔至强可扩展处理器:
- 第一代-银4110,银4114,金6130,金6140
- 第二代-银4210,银4214,金6230和金6240。
平台的性能特征所有处理器都具有相同的基本配置。
- 平台:英特尔公司S2600WFT(BIOS SE5C620.86B.02.01.0008.031920191559)
- 内存:
- 16 GB三星DDR4-2933-12个单元(每个通道一个),用于Gold 6230和6240处理器
- 16 GB三星DDR4-2666-12个单元(每个通道一个),用于Gold 6130和6140处理器
- 16 GB三星DDR4-2400-两代银处理器的12个单位(每个通道一个)
- SSD:Intel DC S4500 480 GB-RAID1中有2件
- 双处理器配置
软件部分:CentOS Linux 7 x86_64(7.6.1810)
内核:3.10.0-957.12.2.el7.x86_64
引入了有关标准安装的优化:添加了内核启动选项lift = noop selinux = 0
使用将Spectre,Meltdown和Foreshadow攻击的所有修补程序反向移植到此内核都执行测试。
我们将执行的测试列表:- Geekbench
- Sysbench
- Phoronix测试套件
详细测试说明Geekbench测试在单线程和多线程模式下进行的一组测试。 结果是两种模式的性能指标。 在此测试中,我们将考虑两个主要指标:
度量单位:抽象“鹦鹉”。 鹦鹉越多越好。
Sysbench测试Sysbench-测试(或基准)程序包,用于评估各种计算机子系统的性能:处理器,RAM,数据存储。 对于所有内核,该测试都是多线程的。 在此测试中,我测量了一个指标:每秒CPU速度事件-每秒处理器执行的操作数。 值越高,系统的生产率越高。
Phoronix测试套件Phoronix测试套件是一个非常丰富的测试套件。 此处介绍的几乎所有测试都是多线程的。 其中只有两个例外:单线程测试Himeno和LAME MP3编码。
在这些测试中,分数越高越好。- 多线程开膛手约翰密码测试。 采取河豚加密算法。 测量每秒的操作数。
- Himeno Test是使用Jacobi点法的线性泊松压力求解器。
- 7压缩压缩-使用带有集成性能测试功能的p7zip进行7压缩测试。
- OpenSSL是一组用于实现SSL(安全套接字层)和TLS(传输层安全性)协议的工具。 测量RSA 4096位OpenSSL的性能。
- Apache Benchmark-该测试衡量给定系统每秒执行1,000,000个请求时可承受的请求数量,同时执行100个请求。
而且,如果数量较少,则更好-在所有测试中,测量所需的时间都可以测量出来。- C-Ray在浮点计算上测试CPU性能。 该测试是多线程的(每个核心16个线程),将从每个像素发出8束光线进行平滑处理,并生成1600x1200的图像。 测量完成测试所花费的时间。
- 并行BZIP2压缩-该测试测量使用BZIP2压缩压缩文件(Linux内核源代码的.tar软件包)所花费的时间。
- 编码音频数据。 LAME MP3编码测试在单个流中执行。 测量完成测试所花费的时间。
- 定时GCC编译。 显示构建GNU GCC编译器(版本8.2.0)所需的时间。 单位是秒。
在此测试中,我删除了ffmpeg测试,因为它无法充分通过现代金级双处理器配置中的内核总数。
测试结果


在单线程和多线程版本的Geekbench测试中,新的Expandable在所有方面都绕过了旧版本。 在从3%到6%的单线程测试中,在从6%到13%的多线程测试中,可口可乐-Silver 4210优于Silver 4110多达33%。

在Sysbench测试中,差异为22%至37%。 金6140和金6240之间的最小差距为7%,以支持新金。

在测试中,开膛手John Silver 4210超越Silver 4110 41%,而Silver 4214和Silver 4114之间的差额几乎是30%-自然是第一者。 现在是黄金。 金牌6230比金牌6130快16%。 金6140和金6240之间的最小差距为7.6%。

白银4210比白银4110高出29%,比白银4214高出23%。 两对黄金之间的差距分别为20%和8%。

在单线程Himeno测试中,您可以看到200-300 MHz的净增长-从2.2%增长到6%,以支持新一代。

compress-7zip测试几乎完全复制了John The Ripper:Blowfish测试的结果。 Silver 4110和Silver 4210:4210之间的漂亮差距比其前任快了35%。 银4214和金6230分别比4114和6130好18%和20%,金6140和金6240之间的最小差距:新的比以前提高了4.7%。

在compress-pbzip2测试中,图片类似于compress-7zip测试。 在显着差异中,金6130和金6230之间的差距有所缩小,为5.6%。

在单线程Encode-mp3测试中,我们再次看到200-300 MHz的差异。 从4%到7%-在此测试中,第二代可扩展性比第一代好得多。

在openssl测试中,Silver 4110和Silver 4210之间的最大差距是41%。 在4114和4214之间-29%。 黄金少了。 介于6130和6230之间-23%。 而在黄金对6140和6240中-4.6%。 我注意到,金6240仅比金6230高0.78%。

在Apache测试中,Silver 4210优于Silver 4110 40%,Silver 4214优于Silver 4114 36%,Gold 6230优于Gold 6130 21%,Gold 6240优于Gold 6140 29%。 我将特别关注银4210,银4214和金6230:金6230比银4210好3%,比银4214好1.5%。也就是说,两者之间的差距很小。 金6240比金6230高13%。

在GCC测试中,新一代分别比其前代产品高出约19%,16%,11%和9.5%。

结果如何
我们观察到Silver 4110和Silver 4210之间存在明显的差距-在多线程测试中,新一代比上一代更好,从大约20%到40%。 谢谢,频率和核心。
Silver 4114和Silver 4214之间的差异已经较小:测试最大值-在Apache测试中达到36%。
此外,差距正在缩小。 金6230在GCC测试中超过了金6130,在GCC测试中为11%,在OpenSSL测试中为23%。
最后,Gold 6140和Gold 6240之间的最小差距:根据大多数测试的结果,新的一对比上一个的间隔小3%-10%。 Apache测试是一个例外:差异为28%-内核更少,基本频率更高(Apache通常是一个非常有趣的测试)。
现在我们通过附加测试。 但首先,有一个简短的背景。
RAM测试
新的Gold 62xx Intel Xeon可扩展处理器现在支持新型DDR4-2933 RAM。 从逻辑上讲,我们问自己:RAM的频率会在多大程度上影响整个系统的性能。 总的来说,基于这样的假设:加到加总是给出积极的结果,因此相信与新内存搭配使用的新处理器将是很好的选择。 但是假设是一回事,而通过实验进行验证是另一回事。
为了进行测试,我们采用了双处理器配置的Gold 6240处理器。 平台和软件组件的性能特征未更改。 我们将测试以下内存:DDR4-2400,DDR4-2666和DDR4-2933。
当手头总是很高兴时,您需要检验假设的一切=)现在让我们来看一下其中的结果。
RAM测试结果
太好了,就已经不好了。 因此,我决定放弃绘制所有图形的想法,并将结果带到表中-更方便,更快捷,尽管不太清楚。 我认为图表也将是但仅是最有趣的。




“要么我们做错了,要么做两件事之一。”
试点兄弟的报价,尽管有些措辞不一,但在完成内存测试后,却非常有用...
与所有测试一样,我们进行了十次测量,并选择了平均值。 如您所见,证词的变化与电影《雪莉·米尔利》中的Krolikova市民的证词一样多。
在Phoronix 50至50的测试中,高结果表明RAM 2400和2933 MHz的配置。 Geekbench使用Memory Score_Single和Memory Score_Multi参数对2933内存进行了基准测试,但总体结果令人惊讶。
根据假设-较高频率对延迟的影响。 速度和响应时间之间达到平衡。 但是,老实说,我不确定...如果您对此有话要说-请在评论中提出。
上一次,我确信不使用处理器内存的所有通道会对测试结果产生更大的影响。 在下一个处理器测试中,我们一定会考虑这种影响,我将告诉您什么以及如何进行。
对人类而言是一小步,但对于人类而言却是一大步
就像Kamnoedov同志(我喜欢Strugatsky)所说的那样,“大约在这样的认可范围内”,英特尔正在定位至强可扩展处理器的新产品线。 在本文的开头,我说过,针对英特尔本身发布新的可扩展协议是重要的战略步骤。 现在我将解释。
一方面,新的可扩展性迎来了数据中心平台的全球升级。 在下半年已经有一些有趣的公告等待着我们。 另一方面,并非所有创新都是随机的-这是对当前行业需求的一种答案。 相当不错的答案。 内存不足? 这是Optane DC永久存储器。 是否需要对进程和核心进行硬件优先级排序? 请抽SST和RDT。 您是否梦想过对网络进行专业培训? :-)在这里签名,关于AI的一组新指令。 对于英特尔,您只能欢喜。
尽管就我个人而言,此版本似乎包含愿望清单,但英特尔上次未能实现。 而且,当然,必须在硬件漏洞上做些事情,寻找不同的专家已经成为一种娱乐。 英特尔凭借Spectrum-Meltowna孔从用户手中夺走了所有东西,他现在返回了,节省了价格。
此外,AMD来自四面八方,他们的决定受到Spectrum-Meltdowns影响的程度要小得多,而且最近在台式机领域,英特尔尤其显得“摇摇欲坠”(我希望在这样一个受人尊敬的时代拥有如此年轻的气息),并略微位于服务器细分中。 顺便说一下,就后者而言,看看新的AMD Epyc Rome将如何展示自己是一件很有趣的事情,因为当前这一代的Epyc个人并不令我冷漠。
但是回到可扩展。
对于没有AI和训练有素的网络负担的用户而言,底线是什么? 由于有更多的磁芯,更高的基本频率和涡轮增压中的频率,生产率无疑会明显提高。 如果对于不同世代的金牌处理器,这种增长最多达到23%-两者都很好,那么对于某些测试中的银牌,则达到40%。 考虑到几乎不变的值,虽然我总是想要更多=),但差异是相当令人满意的。
如果您依赖英特尔的声明,这仅仅是个开始,即使像我这样的怀疑论者也很想知道将来我们会感兴趣什么。
在测试中,我们使用了基于Intel Xeon可扩展处理器的服务器:Silver 4110,Silver 4114,
Silver 4210 ,
Silver 4214 ,Gold 6130,Gold 6140,
Gold 6230 ,
Gold 6240 。
在7月25日之前,可以
使用NEW_SCALABLE促销代码在
1dedic.ru网站上订购具有新Xeon可扩展服务器的服务器,并享有1个月25%的折扣。 促销代码将在2019年7月26日午夜燃烧。
对于任何专用服务器,当年付款时可享受10%的折扣。
由FirstDEDIC运营部门的高级系统管理员Trashwind为您测试和编写的