第1部分 >>
第2部分 >>
第3 部分 >>
第4部分CPU系统测试
我们的第一组测试是常规系统测试。 该测试套件主要用于模拟人们通常在计算机上执行的操作,例如打开大文件或处理小数据堆栈。 这与我们的使用行业标准测试的办公室测试略有不同。 这里的某些测试是相对较新且不寻常的。

FCAT处理: 链接
最近几个季度在我们的展位上使用的最有趣的负载之一是FCAT,我们可以使用它来衡量由于丢帧或丢帧而导致的游戏延迟。 FCAT过程要求在游戏中包括彩色叠加层,记录游戏过程,并使用适当的软件对视频文件进行后续分析。 这样的软件通常是单线程的,因为视频是原始的RAW格式,这意味着文件很大,并且需要移动大量数据。 对于我们的测试,我们记录了古墓丽影:崛起测试的90秒记录,该测试在1440p的GTX 980 Ti上运行,大小约为21 GB,并使用可视化分析工具测量处理时间。

FCAT是单线程测试,但是即使在该测试中,5.0 GHz处理器也不在顶部。
海豚基准测试: 链接
许多仿真器通过单处理器处理器性能连接,并且一般报告倾向于表明Haswell将大大提高仿真器性能。 该基准测试启动了Wii程序,该程序在光束中跟踪Dolphin Wii模拟器内部的复杂三维场景。 该测试的结果非常可靠地表明了Dolphin处理器仿真的速度,这是一项密集的单核任务,需要使用处理器的大多数方面。 结果以分钟为单位给出,Wii本身显示为17.53分钟(1052秒)。

在此测试中,吹嘘的5.0 GHz命中率很高,而8086K创造了海豚记录。
3D运动算法测试v2.1: 链接
这是我们3DPM基准测试的最新版本。 3DPM的目标是模拟直接从我的博士论文中获得的部分优化的科学算法。 2.1版与2.0版的不同之处在于,它通过引用而不是通过值来传递基本粒子结构,并减少了编译器执行double-> float-> double转换的次数。 与2.0版相比,这可提供25%的加速,这意味着新的数据。

在3DPM中,8086K可以与8700K媲美。
DigiCortex v1.20: 链接
尽管已经过了几年,DigiCortex软件还是一个家庭项目,用于可视化大脑中神经元和突触的活动。 该软件带有各种基准测试,我们采用了一个小型基准测试,该模拟程序对32,000个神经元/ 18亿个突触进行了大脑模拟。 测试结果表明系统具有实时仿真的能力,这意味着高于1的任何结果都适合仿真。 基准测试提供了“无神经元突触发射”模式,该模式从本质上显示了DRAM和总线的速度。 我们采用“发射”模式,该模式会为每次神经元发射增加CPU负载。

尽管单核频率更高,但这项受DRAM限制的测试似乎加载了另一个核,并阻止了8086K达到5.0 GHz。
Agisoft Photoscan 1.3.3: 链接
Photoscan从以前的测试版本保留在我们的测试套件中,但是现在我们可以在Windows 10中运行,因此最新处理器上的Speed Shift等功能开始发挥作用。 Photoscan的概念是将许多2D图像转换为3D模型-因此,图像越详细,越多,模型越好。 该算法包括四个阶段:几个单线程和几个多线程,并且还对缓存和内存有一定的依赖性。 对于一些更多样化的多线程工作负载,诸如Speed Shift和XFR之类的选项可以利用CPU的等待或停机时间,从而大大提高了新的微体系结构的性能。

Agisoft具有可变的多线程功能,但8086K仍略落后于8700K。
CPU渲染测试
渲染测试是长期以来公认的评论和测试的最爱,因为渲染包所使用的代码通常经过优化以压缩每一点性能。 有时渲染程序也非常依赖于内存-当您有许多线程承载大量数据时,低延迟内存可能是一切的关键。 在这里,我们采用Windows 10的一些常见渲染程序包,以及一些有趣的新测试。
Corona 1.3: 链接
Corona是一个独立的软件包,旨在支持3ds Max和Maya等软件,并使用光线跟踪实现逼真的图像。 很简单-引导光线,得到像素。 好的,稍微复杂一点,但是此基准测试可以将固定场景渲染六次,并根据时间和每秒的光线数量产生结果。 官方基准表按时间显示用户的结果,但我认为“每秒光束”是最好的指标(通常,“越多意味着越好”的结果就更容易解释)。 Corona喜欢堆积线程,因此结果在很大程度上取决于线程数。

Corona是一个完全多线程的测试,因此,令人惊讶的是看到8086K落后于8700K。 这可能是由于借用的测试系统不能完全满足我们的测试标准。
Blender 2.78: 链接
Blender是渲染测试领域的老头,仍然是一个非常受欢迎的工具。 我们能够在2月5日的Blender版本上启动标准工作负载,并测量渲染场景第一帧所需的时间。 Blender是最大的开放源代码工具之一,这意味着AMD和Intel都在积极致力于改善代码库,这既有利于又不利于其自身的微体系结构。

Blender也喜欢创建线程,并且8086K和以前一样落后于双胞胎。
LuxMark v3.1
作为综合测试,LuxMark作为可视化工具似乎有些不可靠,因为它主要用于测试GPU。 但是,它同时提供OpenCL和C ++标准模式。 在这种情况下,除了比较内核和IPC的每个版本的编码外,我们还可以看到C ++和OpenCL代码在同一处理器上显示出不同的性能。


POV射线3.7.1b4
大多数套件中的另一个常规基准是POV-Ray。 另一个具有悠久历史的光线追踪器。 通常,在AMD准备发布Ryzen的过程中,代码库开始得到积极更新,开发人员对代码进行了更改并发布了新的更新。 我们的测试版本是在此类事件开始之前进行的,但是随着时间的流逝,我们发现POV-Ray代码已根据新要求进行了调整。

在POV-Ray测试中,8086K和8700K的结果几乎相同。
Cinebench R15: 链接
CineBench的最新版本已成为到处使用的那些程序之一,特别是可以作为单线程性能的指标。 高IPC和高频率可提供单线程性能,同时具有良好的扩展性和许多内核是多线程成功的关键。


8086K在CineBench R15 ST的单线程测试中获得了新的冠军头衔,但在多线程测试中却稍稍落后于8700K。
CPU编码测试
现代处理器的有趣元素之一是编码性能。 这包括加密/解密,以及将视频从一种视频格式转换为另一种视频格式。 在加密/解密的情况下,性能仍然与“动态”加密敏感数据有关-现代设备通常通过此过程来提供软件安全性。 近来,使用视频代码转换来调整视频文件的质量,文件大小和分辨率正在经历真正的繁荣。 这对于将视频安装到消费类设备或希望从摄像机实时下载编码后的视频流的游戏流媒体来说是必要的。 随着我们进入实时3D视频,这一任务将变得更加重要,事实证明,某些算法的性能取决于内容的输入/输出功能。
7拉链9.2
评估处理器性能的免费软件存档器之一是7-Zip。 它在开源许可证下运行,是面向高级用户的快速,易于使用的工具。 我们通过命令行运行测试模式,执行四个周期并获得结果。



再次,8700K存在对抗,但是新的8086落后了一点。
WinRAR 5.40
对于2017年的测试套件,我们将在存档测试中使用最新版本的WinRAR。 WinRAR在某些方面比7-Zip更易于使用,因此我们决定将其包含在软件包中。 而不是像7-Zip那样使用基准测试模式,这里我们使用一组代表可压缩和不可压缩格式的公共堆栈(33个1.37 GB的视频文件,2834个较小的文件以及370个文件夹的每个150 MB文件夹)组成的文件集。 显示的结果是编码文件所花费的时间。 由于采用了DRAM缓存,因此我们运行了10次测试,并在基准处于稳定状态时获得了最后5次启动的平均值。

这是另一个测试,其中8086K劣于“无限” 8700K。
AES编码
作为一种普遍使用的加密工具,使用AES加密的算法已在世界范围内广泛分发。 但是,这是另一个针对CPU的测试,现代CPU扩展了AES指令系统以提高加密性能。 我们经常考虑使用此基准来在频率和内核上进行扩展。 我们使用最新版本的TrueCrypt,并在基准测试模式下以DRAM中1 GB数据运行它。 显示的结果是加密和解密的平均GB / s。

在对AES进行编码时,实际上得到了相同的结果。
HandBrake v1.0.2 H264和HEVC
如上所述,随着创建新内容的步伐不断提高,视频转码(编码和解码)在性能方面都是热门话题。 第一个假设是视频格式化标准的更改,无论质量有无损失都可能发生。 为了文件大小,还可能降低视频质量。 除了Google最喜欢的编解码器VP9外,还有两个经常使用的编解码器:老式的编解码器H264几乎无处不在,并针对1080p视频进行了优化; HEVC(或H265)旨在提供与H264相同的质量,但是较小的文件大小(或相同大小的文件,质量较高)。 HEVC很重要,因为它能够以4K质量传输流视频,这意味着对于相同质量的内容,传输的比特数更少。
Handbrake是首选的转码工具,因此我们的测试模式涵盖三个领域。
低质量/ H264分辨率:这里我们重新编码2小时的640x266 H264视频,并使用非常快速的预设将编码从“主要”配置文件更改为“高级”配置文件。

高质量/分辨率H264:一项类似的测试,但是这次我们拍摄了一个十分钟的双4K文件(3840x4320),其显示频率为60 Hz,并使用非常快速的预设从Main转换为High。

HEVC测试:在总部使用相同的视频,我们将原始视频的分辨率和编解码器从4K60更改为H264,再将其更改为4K60 HEVC。

CPU Office测试
我们用于基准测试的Office程序不是特定程序,而是行业标准测试,它们在专业环境中发挥着重要作用。 这些测试的目的是使用普通办公室用户可能会遇到的一组程序和方法,例如视频会议,文档编辑,体系结构建模等等。
铬编译(v56)
我们的新编译测试使用Windows 10 Pro,VS Community 2015.3和Win10 SDK编译Chromium每晚构建。 我们已准备好在2017年3月底进行组装的测试,并且在测试中我们将启动新的完整编译。 编译是具有可变多线程工作负载的典型示例-一些编译和绑定过程是线性的,而其他部分则是多线程的。

这是另一种情况,我认为我们的即兴测试台发挥了重要作用,我想稍后在我的标准展台上重复一下。 由于编译不仅给处理器带来了沉重的负担。
根据大众的需求,GeekBench 4现在已成为我们产品包的一部分。 GB4是综合测试,它使用高性能工作负载中经常发现的算法以及一系列面向内存的测试。 GB4的最大成就是以单一数字的形式得出了所有测试结果的结论,显然,它的支持者很喜欢,尽管这样的结果并不总是很容易用来比较真实条件下的性能。


与CineBench一样,Core i7-8086K优先于合成单线程测试。
PCMark8: 链接
尽管PCMark最初于2008/2009年出生,但Futuremark支持PCMark8。 在复杂任务的规模上,PCMark更加专注于低百分比的专业工作负载范围,这使其成为人们认为“办公室工作”的良好指示器。 我们以“传统”模式从命令行运行基准测试,即不使用OpenCL的C ++,以从等式中删除图形卡并仅专注于处理器。 PCMark8提供家庭,工作和创意工作负载,其中一些软件测试可以共享,而另一些软件测试对于每个测试套件都是唯一的。

在这里,8086K最终取代了其兄弟8700K,尽管幅度不大。
CPU旧版测试
我们过时的测试是基准,已经超越了他们的时间。 其中一些是行业中的综合标准,我们已经有了10年的数据。 Windows 10中已重新发布了此处的所有数据,我们计划返回几代组件,以了解性能如何发展。
3D粒子运动v1
3DPM是我们编写的一项测试,使用了布朗运动仿真及其速度测试中使用的基本3D运动算法。 高性能浮点,MHz和IPC计算将在单线程版本中显示,而多线程版本可与线程一起使用并喜欢许多内核。 这是原始版本,以典型的非计算机学生的风格编写,对理论问题的算法进行了编码。 它没有编译器尚未执行的任何显而易见的优化,例如错误共享。


CineBench 11.5和10
Cinebench是与MAXON Cinema 4D动画软件有关的著名性能评估工具。 Cinebench已经优化了十年,仅专注于处理器功能。 这意味着,如果带宽特征存在差异,则Cinebench很有可能会显示此差异。 也许其他软件并未使用所有可用的工具来处理处理器,因此该测试与现实世界的相关性可能纯粹是学术性的,但是鉴于我们拥有庞大的Cinebench数据库,因此很难忽略5分钟的小测试。 在此测试中,由于存储了数据,我们启动了现代版本15,以及旧版本11.5和10。




x264高清3.0
同样,我们在此处使用的x264 HD 3.0软件包也存储为历史回归数据。 最新版本是5.0.1,它将1080p视频编码为高质量的x264文件。 3.0版在720p文件中执行相同的测试,并且在大多数情况下,软件性能达到了高端处理器的极限,但在中级和初级级别上仍然运行良好。 此外,此版本只需要几分钟,而后者可能需要90多分钟。


感谢您与我们在一起。 你喜欢我们的文章吗? 想看更多有趣的资料吗? 通过下订单或将其推荐给您的朋友来支持我们,为我们为您开发
的入门级服务器的独特模拟,为Habr用户提供
30%的折扣: 关于VPS(KVM)E5-2650 v4(6核)的全部真相10GB DDR4 240GB SSD 1Gbps从$ 20还是如何划分服务器? (RAID1和RAID10提供选件,最多24个内核和最大40GB DDR4)。
戴尔R730xd便宜2倍? 仅
在荷兰和美国,我们有
2台Intel Dodeca-Core Xeon E5-2650v4 128GB DDR4 6x480GB SSD 1Gbps 100电视(249美元起) ! 阅读有关
如何构建基础架构大厦的信息。 使用价格为9000欧元的Dell R730xd E5-2650 v4服务器的上等课程?