认识新的英特尔处理器



昨天,2019年4月2日,英特尔宣布了期待已久的2017年中期推出的英特尔®至强®可扩展处理器家族更新。 新处理器基于代号为Cascade Lake的微架构,并基于改进的14纳米工艺构建。

新处理器的功能




首先,看一下标签上的差异。 在上一篇有关Skylake-SP的文章中,我们已经提到所有处理器分为4个系列- 青铜金和 白金 。 数字的第一位表示处理器模型属于哪个系列:

  • 3-青铜器
  • 4-银,
  • 5、6-金,
  • 8-白金。

第二位数字表示处理器的生成。 对于代号为几代的英特尔®至强®可扩展处理器家族:

  • 1 -Skylake,
  • 2-喀斯喀特湖。

接下来的两位数字表示所谓的SKU(库存单位)。 实际上,这只是具有一组特定可用功能的CPU标识符。

另外,在型号之后,可能会有一个或两个字母表示的索引。 索引的第一个字母表示处理器本身的体系结构或优化的功能,第二个字母表示套接字上的内存容量。

例如,使用标有Intel®Xeon®6240的处理器 。 解密:

  • 6-黄金系列处理器,
  • 2-级联湖的产生,
  • 40 -SKU。

性能表现


新一代处理器旨在用于虚拟化,人工智能以及高性能计算领域。 第一个明显的变化是时钟频率的增加。 这是完全可以预期的,因为在许多服务器应用程序中,时钟速度比处理器内核的数量更为重要。 例如,金融产品1C,其系统要求明确指出处理器频率越高,最终用户获得结果的速度就越快。

在某些情况下,核心数量增加了。 为了清楚起见,我们汇总了第一代和第二代英特尔®至强®可扩展处理器家族的几种处理器的比较表:
英特尔®至强®银牌4114
(10核心)
英特尔®至强®银牌4214
(12核心)
时钟速度2.20 GHz2.20 GHz
在涡轮增压模式下3.00 GHz3.20 GHz
英特尔®至强®金牌5118
(12核心)
英特尔®至强®金牌5218
(16核心)
时钟速度2.30 GHz2.30 GHz
在涡轮增压模式下3.20 GHz3.90 GHz
英特尔®至强®金牌6140
(18核)
英特尔®至强®金牌6240
(18核)
时钟速度2.30 GHz2.60 GHz
在涡轮增压模式下3.70 GHz3.90 GHz
英特尔®至强®金牌6144
(8核心)
英特尔®至强®金牌6244
(8核心)
时钟速度3.50 GHz3.60 GHz
在涡轮增压模式下4.20 GHz4.40 GHz
时钟频率的增加不可避免地导致散热的增加。 对于Platinum系列的旗舰处理器,它可以达到205W ,对于传统的空气冷却系统来说,这是一个非常严格的测试。 可以假定,在可预见的将来,服务器平台将需要液体冷却。

与上一代Skylake SP一样,在LGA3647插槽(插槽P)中安装了处理器,这是由于使用了6通道内存控制器(每个通道最多2个内存模块)。 内存频率为2666 MT / s ,但是,当使用6000和8000系列处理器时,可以使用频率为2933 MT / s的内存(每个通道最多可以使用1个模块)。



在第一代Intel Xeon SP处理器中成功使用的Ultra-Path Interconnect总线仍在第二代中使用,为每个通道提供处理器之间的数据交换,速度为9.6 GT / s或10.4 GT / s。 这使您可以有效地将硬件平台扩展到8个物理处理器,从而优化带宽和能源效率。

测验


我们开始借助SPEC测试套件来测试新一代处理器,该套件基于最紧迫的寿命任务的解决方案来模拟负载。 这些测试既代表最简单的计算,又代表各种物理过程的计算,例如,解决分子物理学和流体力学问题。

当前,我们已经准备好一些SPEC测试的结果,以Intel®Xeon®Gold 6140和Intel®Xeon®Gold 6240处理器为例进行整数计算。

完整
测验英特尔®至强®金牌6140英特尔®至强®金牌6240
500.perlbench_r147157
第531章127139
541。125127
548.exchange2_r176203

内在
测验英特尔®至强®金牌6140英特尔®至强®金牌6240
600.perlbench_s5.676.33
602.gcc_s6.958.74
641。3.243.62
648.exchange2_s5.947.90

测试说明
  • perlbench_r是Perl语言的精简版本。 测试负载模仿了流行的SpamAssassin反垃圾邮件系统的工作;
  • deepsjeng_r-一个国际象棋的模拟。 服务器使用alpha-beta-clipping算法对游戏位置进行深入研究;
  • leela_r-进行中的游戏模拟。 在测试过程中,将对运动模式进行分析,并根据置信度上限对树进行选择性搜索。
  • exchange2_r-非平凡的数独谜题的生成器。 它使用Fortran 95编写,使用了大多数阵列处理功能。
  • gcc_s C语言编译器,该测试加载从IA-32微处理器体系结构的源代码“编译” GCC编译器。


根据测试结果,很明显,新一代处理器比上一代处理器执行整数计算的速度更快。 我们将在以下文章之一中分享其他测试的结果。

英特尔®傲腾™DC持久性内存支持


加快高负载的数据库和应用程序的工作量-这是所有客户对即将进行的更新的期望。 因此,一项关键的创新是对英特尔®傲腾™DC持久内存的支持,该代码以Apache Pass为名而广为人知。



当使用适量的DRAM在经济上不利并且仅旗舰SSD的速度特性还不够时,该内存旨在成为解决该问题的通用解决方案。

一个生动的例子是将数据库直接放置在英特尔®傲腾™DC永久内存中,从而消除了RAM与存储设备(传统系统固有的功能)之间不断进行数据交换的需求。

新型内存直接安装在DIMM插槽中,并且与之完全兼容。 具有以下卷的模块可用:

  • 128 GB
  • 256 GB
  • 512 GB

如此大量的模块将使您能够灵活地配置硬件平台,从而为高负载系统提供了非常大且非常快的磁盘空间。 英特尔®傲腾™DC永久存储器在包括机器学习在内的应用方面具有巨大的潜力。

更快的深度学习


除了支持新型内存,英特尔工程师还致力于加速深度学习的过程。 由于卷积神经网络通常需要8位和16位值的多次乘法,因此新处理器获得了对AVX-512 VNNI (矢量神经网络指令)指令的支持。 这将使您多次优化和加速计算。

通过执行以下说明,可以达到最佳效率:

  • VPDPBUSD (用于INT8计算),
  • VPDPWSSD (用于INT16计算)。

底线是减少每个周期处理的项目数。 VPDPWSSD指令结合了两个INT16指令,并且还使用INT32常量来替换两个当前指令PMADDWDVPADDDVPDPUSB指令通过替换三个现有指令VPMADDUSBWVPMADDWDVPADDD ,同样减少了元素数量。

因此,通过正确应用新的指令集,可以将每个周期处理的元素数量减少两到三倍,并提高数据处理的速度。 新指令的合适框架将成为流行的机器学习软件库的一部分,例如:


负载均衡优化


借助英特尔®速度选择技术(在索引为Y的处理器上),更容易统一加载计算资源。 最重要的是,每个操作都开始与所涉及的内核数和时钟速度相关联。 根据每个操作的选定配置文件,资源分配如下:

  • 更多内核,但时钟速度较低;
  • 内核更少,但时钟速度提高了。

这种方法使您可以充分利用资源,这在使用虚拟化环境时尤其重要。 通过优化虚拟主机上的负载,这将降低成本。

加速科学计算


处理科学数据,尤其是在粒子级对物理过程进行建模(例如,计算电磁相互作用)时,需要大量的并行计算。 可以使用CPU,GPU或FPGA解决此问题。

由于有大量的数据处理软件工具和库,因此多核CPU是通用的。 为此目的使用GPU也是非常有效的,因为您可以直接在硬件图形内核上运行数千个并行线程。 有方便的开发框架,例如OpenCL或CUDA,可让您使用GPU计算创建任何复杂的应用程序。

但是, 在前面的文章中我们已经讨论了另一种硬件工具-FPGA。 对此类设备进行编程以执行特定计算的能力使您可以加快数据处理速度,从而部分减轻CPU的负担。 可以在新的Cascade Lake处理器上与分立的Intel®Stratix®10 SX FPGA一起实现类似的情况。

尽管与传统CPU相比时钟速度较低,但FPGA的性能却高出十倍。 对于某些类型的任务,例如数字信号处理,英特尔®Stratix®10 SX最多可显示10 TFLOPS(每秒千位浮点运算)的结果。

平台扩展


实时开展业务不仅意味着稳定性,还意味着按需扩展的能力。 一个很好的例子是用于数据存储和处理的高性能SAP HANA平台。 该平台的物理部署需要非常强大的硬件资源。

英特尔®至强®可扩展处理器旨在将多插槽系统变成IT基础架构的核心元素,从而提供可扩展性以满足业务应用程序的需求。



它以对外部节点控制器的支持的形式实现,允许您创建比单个平台可以提供的更高级别的配置。 例如,您可以通过将多个多插槽平台的资源合并为一个整体来创建32个物理处理器的配置。

结论


工作频率和处理器内核的增加,生产率的提高以及对英特尔®傲腾™DC持久性内存的支持-所有这些改进显着提高了每个平台的计算能力,从而减少了所用设备的成本并提高了数据处理效率。 在体系结构级别制定的可伸缩性原则使您可以构建任何复杂性的IT基础架构,并实现高性能和高能效。

由于Selectel是英特尔白金合作伙伴,因此我们的客户现在可以在任意配置服务器中订购下一代英特尔®至强®可扩展处理器。

租用带有下一代处理器的服务器很容易! 只需转到配置器页面并选择必要的组件。 通过在控制面板中创建故障单 ,可以向我们的专家询问有关服务运营的任何问题。 提前几个月支付服务器费用,即可享受高达15%的折扣。

如果您有兴趣参与测试最新技术,请加入我们的Selectel Lab。

我们很高兴在评论中听到您的问题和建议。

Source: https://habr.com/ru/post/zh-CN446494/


All Articles