更多咖啡,更少咖啡因:英特尔第9代(第2部分)

第1部分第2部分第3 部分第4部分

系统测试



“系统测试”部分着重于在消费者所面临的真实条件下进行测试,而吞吐量略有偏差。 在本节中,我们将使用易于访问和可定制的软件来考虑应用程序的加载时间,图像处理,简单的物理,仿真,神经建模,优化的计算以及三维模型的开发。 尽管某些测试更容易与大型软件包(例如PCMark)的功能重叠(我们在办公测试部分中发布了这些值),但值得考虑各种角度。 在所有测试中,我们将详细说明正在测试的内容以及测试的精确程度。

应用下载:GIMP 2.10.4


用户体验和工作流程中最重要的方面之一是系统的速度。 一个很好的测试是检查应用程序加载时间。 如今,大多数程序将它们存储在SSD上时,几乎可以立即下载,但是某些办公工具需要先预加载资产,然后才能使用。 大多数操作系统还使用缓存,因此,当频繁下载某些软件(Web浏览器,Office工具)时,可以更快地初始化它。

在先前的测试套件中,我们检查了将大型PDF加载到Adobe Acrobat需要多长时间。 不幸的是,该测试是编程方面的噩梦,并且拒绝了不费吹灰之力就升级到Win10 RS3的工作。 同时,我们发现了一个可以自动执行此测试的应用程序,因此决定使用GIMP,这是一种流行且免费的照片编辑应用程序。 这是一个开源编辑器,是Adobe Photoshop的主要替代产品。 我们将其配置为下载一个大小为50 MB的大型设计模板,执行了10次加载,两次加载之间的间隔为10秒。 由于缓存,前3-5个结果通常比其余结果慢,并且缓存时间可能不一致,因此我们取最后五个结果的平均值来显示缓存加载期间的CPU处理。



通常,应用程序加载仅限于单个线程,但是很明显,在某些时候它仅限于内核资源。 8C / 8T和6C / 6T处理器可以在每个流中访问更多资源(在没有HT的环境中),在我们的测试中领先于这两个5.0 GHz处理器。

FCAT:图像处理


当两块视频卡组合在一起构成一个场景时,FCAT软件旨在检测微棒,掉落的帧并运行图形测试。 由于游戏引擎和图形驱动程序的原因,并非所有GPU组合都能完美运行,因此该软件会为每个渲染帧捕获颜色,并使用视频捕获设备动态执行RAW数据记录。



FCAT软件接受录制的视频,在我们的案例中是90分钟的1440p游戏(古墓丽影:崛起),并将颜色数据转换为帧时间数据,因此系统可以显示“观察到的”帧速率,并与视频加速器的能耗相关。 由于测试完成的速度快,该测试是单线程的。 我们开始该过程并获得完成时间。



FCAT是另一种受单线程性能限制的方案,新的第9代处理器似乎在这里表现很好。 9700K和9900K给出的时间相差毫秒。

3D粒子运动v2.1:布朗运动


我们的3DPM测试是一个自定义基准测试,旨在模拟六种不同的算法来在三维空间中移动粒子。 该算法是作为我的博士学位论文的一部分开发的,最终在GPU上运行效果最佳,并且很好地了解了各种微体系结构如何解释命令流。

算法的关键部分是随机数的生成-我们使用相对较快的生成,它完成了代码中依赖链的实现。 与原始代码的原始版本相比,主要更新是缓存中的错误共享问题已解决,这是主要瓶颈。 我们也正在考虑将此测试的AVX2和AVX512版本应用于以后的审查。



在此测试中,我们使用六种不同的算法在20秒内运行一组粒子,并具有10秒的暂停,并以每秒数百万次操作(运动)报告总粒子速度。



基于非AVX代码,与R7 2700X相比,9900K的IPC和频率稍好一些,尽管这实际上并不是我们所期望的那样大的跳跃。 没有HT的处理器会在此测试中丢失。

但是,当我们使用AVX2 / AVX512时,Sk​​ylake-X处理器会发现自己在其元素中。 现在9900K显着优于R7 2700X,甚至比我们预期的还要强大,Core i7-9700K也领先。

Dolphin 5.0:控制台仿真


控制台仿真是我们程序包中最受欢迎的测试之一。 从过时的系统中选择游戏并运行它的能力非常吸引人,并且取决于仿真器的工作:需要一个功能更强大的x86系统才能准确地仿真x86以外的旧游戏机。 特别是如果此控制台的代码是考虑到一些物理缺陷和硬件错误而编写的。

对于我们的测试,我们使用流行的Dolphin仿真软件,通过它运行一个计算项目,以确定我们的处理器可以多么精确地仿真控制台。 在此测试中,Nintendo Wii仿真将持续约1050秒。



海豚是另一种受单线程性能限制的场景,这就是英特尔处理器历来处于领先地位的原因。 在这里,9900K绕过9700K仅一秒钟。

DigiCortex 1.20:为海的大脑建模


该基准最初旨在模拟和可视化大脑中神经元和突触的活动。 该软件具有各种预定义模式,我们选择了一个小型基准测试,该模拟程序模拟了32,000个神经元/ 18亿个突触的大脑,相当于海的大脑。



我们将测试结果报告为实时仿真数据的机会,因此,“单位”以上的任何结果均适用于实时操作。 在这两种模式中,DRAM很难使用“ no synapse start”模式,而加载处理器的“ synapse start”模式则选择后者。 尽管我们选择了该选项,但测试仍然受到DRAM速度的影响。



DigiCortex在很大程度上取决于处理器性能和内存带宽,但看起来6核Ryzen可以轻松与8核9900K竞争。 8700K / 8086K似乎在此测试中表现更好。

y-Cruncher v0.7.6:针对微体系结构优化的计算


我曾经听说过y-Cruncher作为可帮助您计算各种数学常数的工具。 但是,当我开始与NWU研究人员,现在是软件优化开发人员Alex Yee交谈之后,我意识到他以一种令人难以置信的方式对软件进行了优化,以获得更好的性能。 自然,任何花费20天以上的模拟都将得益于生产率提高1%! Alex在高中时就开始与y-Cruncher一起工作,但现在该项目是最新的,Alex一直在努力进行工作,以利用最新的指令集,甚至可以在硬件上使用它们之前。

对于我们的测试,我们通过二进制,单线程和多线程计算的所有可能优化变体运行y-Cruncher v0.7.6,包括针对AVX-512优化的二进制文件。 该测试将计算Pi数的2.5亿个字符,并且我们使用此测试的单线程和多线程版本。





由于y-cruncher充分利用了AVX2 / AVX512,我们看到Skylake-X处理器再次离开了他们的舒适世界。 在多线程模式下,9900K / 9700K需要8个核才能超过支持AVX512的6核处理器。

Agisoft Photoscan 1.3.3:将2D图像转换为3D模型


我们使用了多年的ISV之一就是Agisoft。 该活动正在开发名为PhotoScan的软件,该软件可以将一系列2D图像转换为3D模型。 这是模型开发和归档中的重要工具,它依赖于许多单线程和多线程算法来从计算的一侧转移到另一侧。



在我们的测试中,我们使用软件版本1.3.3的大数据集-照片84 x 18兆像素。 我们根据一组相当快速的算法运行测试,但比我们的2017年测试更加严格。 结果,我们报告了整个过程的完成时间。



Photoscan是一项充分利用高吞吐量和单线程性能的任务,在这种情况下,HT的存在是一个负担。

渲染测试


在专业环境中,渲染通常是处理器工作负载的主要考虑因素。 它以各种格式使用:从3D渲染到光栅化,在诸如游戏或光线跟踪之类的任务中使用,并使用软件的功能来管理网格,纹理,碰撞,别名和物理(动画)。 大多数渲染器为CPU提供代码,而某些渲染器使用GPU并选择使用FPGA或专用ASIC的环境。 但是,对于大型工作室,处理器仍然是主要硬件。

Corona 1.3:性能渲染


经过改进的渲染器,针对3ds Max和Cinema 4D等软件的性能进行了优化,Corona测试可渲染1.3版标准的生成场景。 通常,GUI基准测试的实现显示了构建场景的过程,并允许用户将结果视为“完成时间”。



我们联系了为我们提供测试命令行版本的开发人员。 它提供了结果的直接结论。 由于报告的完成动作与时间单位的比率在视觉上更容易理解,因此我们没有报告场景建立的时间,而是报告了六次运行中每秒的平均光线数量。



Corona是一个完全多线程的测试,因此没有HT的处理器会落后一些。 Core i9-9900K脱颖而出,以25%的优势超越AMD的8核组件,仅次于12核Threadripper。

Blender 2.79b:3D创作套件


Blender是一种高端渲染工具,是一种具有许多设置和配置的开源产品,并且被全世界许多高端动画工作室使用。 该组织最近发布了Blender测试套件,这是在我们决定减少在新软件包中使用Blender测试的几周之后的,但是新测试可能需要一个多小时。 为了获得结果,我们通过命令行运行此程序包中的子测试之一-“仅CPU”模式下的标准场景“ bmw27”,并测量渲染的完成时间。



从内存带宽到原始性能,混合器具有各种折衷的要求,但是,像在Corona中一样,没有HT的处理器也有些落后。 高频9900K将其提高到10C Skylake-X和AMD 2700X以上,但不高于1920X。

LuxMark v3.1:通过各种代码路径的LuxRender


如上所述,有多种处理渲染数据的方式:CPU,GPU,加速器等。 另外,根据使用软件的方式,您可以在其中编程许多框架和API。 LuxMark是使用LuxRender引擎开发的基准测试,提供了几种不同的场景和API。


取自Linux版本的LuxMark

在我们的测试中,我们使用C ++和OpenCL代码在CPU模式下运行一个简单的“ Ball”场景。 该场景以粗糙的渲染开始,并在两分钟的过程中逐渐提高了质量,最终的结果就是所谓的“平均每秒千公里”。





POV-Ray 3.7.1:射线追踪


光线追踪引擎“ Persistence of Vision”是另一种著名的基准测试工具,它进入了休眠状态一段时间,直到AMD发布其Zen处理器时,Intel和AMD突然突然开始将代码推入开源项目的主要分支。 对于我们的测试,我们对所有内核使用内置测试,从命令行调用。



办公测试


Office测试套件旨在专注于针对办公室工作流的更标准的行业基准。 这些是更多综合测试,但我们还将在本节中测试编译器性能。 对于需要整体评估设备的用户,这些通常是最重要的标准。

PCMark 10:行业标准


Futuremark(现在称为UL)已经开发了已经成为行业标准的测试已有20年了。 最后一组系统测试是PCMark 10,与PCMark 8相比,其中进行了一些测试,并且对OpenCL的关注度更高,尤其是在视频流等情况下。

PCMark将其成绩分为大约14个不同的领域,包括启动应用程序,网页,电子表格,照片编辑,渲染,视频会议和物理。 我们将所有这些数据发布到Bench数据库中,但总体得分是当前评论的关键指标。



在这里,进行了许多测试,新的英特尔处理器依次占据了前三名。 甚至i5-9600K都领先于i7-8086K。

Chromium编译:Windows VC ++编译Chrome 56


AnandTech的大量读者都是软件工程师,他们在观察硬件的工作原理。 尽管对于经常编译的审阅者来说,编译Linux内核是“标准”,但我们的测试却略有不同-我们使用Windows指令来编译Chrome,特别是2017年3月56日创建测试时的Chrome版本。 Google从存储库下载了400,000个文件后,给出了有关如何在Windows下进行编译的非常详细的说明。



在我们的测试中,按照Google的说明,我们使用MSVC编译器和ninja来控制编译。 如您所料,这是一个具有可变多线程和可变DRAM需求的测试,该需求得益于更快的缓存。 我们在测试中获得的结果是花费在编译上的时间,我们将其转换为每天的编译次数。

在我们的编译测试中,成熟涡轮的高频性能似乎表现良好。

3DMark Physics:游戏中的计算物理


除PCMark外,还有3DMark基准,即Futuremark(UL)-一组游戏测试。 每个游戏测试包含一个或两个场景(对于GPU来说很繁重)以及一个物理测试,具体取决于该测试的编写时间和目标平台。 难度越来越大的主要科目是“冰暴”,“云门”,“跳伞”,“大火”和“时间间谍”。

某些子测试还提供其他选项,例如Ice Storm Unlimited(为具有屏幕外渲染的移动平台设计)或Fire Strike Ultra(为具有许多附加功能的高性能4K系统设计)。 值得注意的是,Time Spy当前具有AVX-512模式(我们将来可以使用)。

对于我们的测试,我们将每个物理测试的结果发送到Bench,但是对于审查,我们坚持使用最苛刻的场景的结果:《冰暴无限》,《云门》,《跳伞者》,《 Fire Strike Ultra》和《时间间谍》。











较旧的Ice Storm测试并不真正喜欢新的Core i9-9900K,将其推向R7 1800X。 对于更现代的面向PC的测试,可以赢得9900K。 缺少HT会阻止该行中的其他两个处理器显示较高的结果。

GeekBench4:综合测试


GeekBench 4是在移动设备,PC和Mac上进行跨平台测试的常用工具,它是使用一系列要求最大带宽的算法对系统进行的完美综合测试。 测试包括加密,压缩,快速傅立叶变换,内存操作,n体物理,矩阵操作,直方图操作和HTML解析。





由于查询的普遍性,我将这个测试包括在内,尽管结果是非常综合的。 由于它是在不同平台上编译的(尽管使用了不同的编译器),因此许多用户经常非常重视它的结果。
我们在测试结果数据库中记录了主要子测试(加密,整数,浮点数,内存)的等级,但是为了进行审查,我们仅发布了常规的单线程和多线程结果。

编码测试


, , . , , , , , , . , , .

Handbrake 1.1.0:


, Handbrake — , , , . . , AVX-512 OpenCL . , , CPU, .

Handbrake , - Logitech C920 1080p60 ( , ). . :

  • 720p60 at 6000 kbps constant bit rate, fast setting, high profile
  • 1080p60 at 3500 kbps constant bit rate, faster setting, main profile
  • 1080p60 HEVC at 3500 kbps variable bit rate, fast setting, main profile







7-zip v1805:


/ 7-zip , . , . .







, : , . , , Windows Scheduler . , .

WinRAR 5.60b3:


, WinRAR. . , right-click Windows . , , 30 60- 2000 -, .



WinRAR , , 10 , , .

AES:


, , . Windows BitLocker . AES discontinued TrueCrypt , .

, , — AES / , . AES , AVX-512.



-


low-end , small form factor , -, , . - , , - . , ( ) . , - : -, , . - , , , .

, .

WebXPRT 3: - ,


, XPRT, Principled Technologies, -, , , «3». ( , ) : , , , , HTML5, , .



, . , .

WebXPRT 2015: HTML5 Javascript Web UX


WebXPRT — 2015 , - , . - , , - , . - . , , , . — , . « », .



WebXPRT3, , . , .

Speedometer 2: Javascript Frameworks


- — Speedometer 2, javascript, : , , . , , , -.

«rpm», . .



Google Octane 2.0: Core Web Compute


- , , — Octane Google. 2.0 , , , , , — .

, . .



Mozilla Kraken 1.1: Core Web Compute


, Octane, Kraken, Mozilla. , , . , Kraken , , .

, . , .



3DPM v1: 3DPM v2.1


«» — 3DPM. , , , ( ). , , ( 4 , ; 5 – ).
(-O2, -fp: fast): OpenMP . , false sharing . , , .





x264 HD 3.0:


, Anandtech Pentium 4 Athlon II. 720p , . , IPC — instructions-per-clock.





感谢您与我们在一起。 你喜欢我们的文章吗? 想看更多有趣的资料吗? 通过下订单或将其推荐给您的朋友来支持我们,为我们为您开发的入门级​​服务器的独特模拟,为Habr用户提供30%的折扣: 关于VPS(KVM)E5-2650 v4(6核)的全部真相10GB DDR4 240GB SSD 1Gbps从$ 20还是如何划分服务器? (RAID1和RAID10提供选件,最多24个内核和最大40GB DDR4)。

VPS(KVM)E5-2650 v4(6核)10GB DDR4 240GB SSD 1Gbps至1月1日免费,如果您支付六个月的费用,则可以在此处订购。

戴尔R730xd便宜2倍?在荷兰和美国,我们有2台Intel Dodeca-Core Xeon E5-2650v4 128GB DDR4 6x480GB SSD 1Gbps 100电视(249美元起) 阅读有关如何构建基础架构大厦的信息。 使用价格为9000欧元的Dell R730xd E5-2650 v4服务器的上等课程?

Source: https://habr.com/ru/post/zh-CN431158/


All Articles