Teil 1 →
Teil 2 →
Teil 3 →
Teil 4Systemtests
Der Abschnitt "Systemtests" konzentriert sich auf Tests unter realen Bedingungen, mit denen der Verbraucher konfrontiert ist, mit einer leichten Abweichung im Durchsatz. In diesem Abschnitt befassen wir uns mit der Ladezeit von Anwendungen, der Bildverarbeitung, der einfachen Physik, der Emulation, der neuronalen Modellierung, optimierten Berechnungen und der Entwicklung dreidimensionaler Modelle mit leicht zugänglicher und anpassbarer Software. Obwohl sich einige der Tests leichter mit den Funktionen großer Pakete wie PCMark überschneiden lassen (wir veröffentlichen diese Werte im Abschnitt "Office-Tests"), sollten verschiedene Perspektiven berücksichtigt werden. In allen Tests werden wir detailliert erklären, was getestet wird und wie genau wir testen.
Anwendungs-Download: GIMP 2.10.4
Einer der wichtigsten Aspekte der Benutzererfahrung und des Workflows ist die Geschwindigkeit des Systems. Ein guter Test besteht darin, die Ladezeiten der Anwendung zu überprüfen. Die meisten Programme werden heutzutage, wenn sie auf einer SSD gespeichert sind, fast sofort heruntergeladen. Einige Office-Tools erfordern jedoch das Vorladen von Assets, bevor sie einsatzbereit sind. Die meisten Betriebssysteme verwenden auch Caching. Wenn bestimmte Software häufig heruntergeladen wird (Webbrowser, Office-Tools), kann sie viel schneller initialisiert werden.
In der vorherigen Testsuite haben wir überprüft, wie lange es dauern würde, eine große PDF-Datei in Adobe Acrobat zu laden. Leider war dieser Test ein Programmier-Albtraum und weigerte sich, kampflos auf Win10 RS3 zu aktualisieren. In der Zwischenzeit haben wir eine Anwendung entdeckt, die diesen Test automatisieren kann. Es wurde beschlossen, GIMP zu verwenden, eine beliebte und kostenlose Fotobearbeitungsanwendung. Dies ist ein Open Source-Editor, die Hauptalternative zu Adobe Photoshop. Wir haben es so konfiguriert, dass eine große Entwurfsvorlage mit einer Größe von 50 MB heruntergeladen wird. Der Ladevorgang wurde 10 Mal im Abstand von 10 Sekunden durchgeführt. Aufgrund des Caching sind die ersten 3-5 Ergebnisse oft langsamer als die anderen, und die Caching-Zeit kann inkonsistent sein. Daher verwenden wir den Durchschnitt der letzten fünf Ergebnisse, um die CPU-Verarbeitung während des zwischengespeicherten Ladens anzuzeigen.

Das Laden von Anwendungen ist in der Regel auf einen einzelnen Thread beschränkt, aber es ist offensichtlich, dass es irgendwann auf Kernelressourcen beschränkt ist. Die Prozessoren 8C / 8T und 6C / 6T haben Zugriff auf mehr Ressourcen pro Stream (in einer Umgebung ohne HT) und liegen in unseren Tests vor beiden 5,0-GHz-Prozessoren.
FCAT: Bildverarbeitung
Die FCAT-Software wurde entwickelt, um Micro-Sticks zu erkennen, Frames fallen zu lassen und Grafiktests durchzuführen, wenn zwei Grafikkarten miteinander kombiniert werden, um eine Szene zu rendern. Aufgrund von Game-Engines und Grafiktreibern funktionierten nicht alle GPU-Kombinationen einwandfrei. Infolgedessen erfasste die Software Farben für jeden gerenderten Frame und führte dynamisch eine RAW-Datenaufzeichnung mit einem Videoaufnahmegerät durch.

Die FCAT-Software akzeptiert das aufgezeichnete Video, in unserem Fall 90 Sekunden 1440p des Spiels Rise of the Tomb Raider, und konvertiert die Farbdaten in Frame-Zeitdaten, sodass das System die „beobachtete“ Framerate anzeigen und mit dem Energieverbrauch der Videobeschleuniger korrelieren kann. Dieser Test ist aufgrund der Geschwindigkeit, mit der er abgeschlossen wurde, Single-Threaded. Wir starten den Prozess und erhalten dadurch die Fertigstellungszeit.

FCAT ist ein weiteres Szenario, das durch die Single-Thread-Leistung eingeschränkt ist, und es scheint, dass die neuen Prozessoren der 9. Generation hier sehr gut abschneiden. 9700K und 9900K gaben dieselbe Zeit mit einer Differenz von Millisekunden an.
3D-Partikelbewegung v2.1: Brownsche Bewegung
Unser 3DPM-Test ist ein benutzerdefinierter Benchmark, mit dem sechs verschiedene Algorithmen zum Bewegen von Partikeln im dreidimensionalen Raum modelliert werden können. Die Algorithmen wurden im Rahmen meiner Doktorarbeit entwickelt und funktionieren letztendlich am besten auf der GPU. Sie geben eine gute Vorstellung davon, wie Befehlsströme von verschiedenen Mikroarchitekturen interpretiert werden.
Der Schlüsselteil der Algorithmen ist die Erzeugung von Zufallszahlen - wir verwenden eine relativ schnelle Erzeugung, die die Implementierung von Abhängigkeitsketten im Code vervollständigt. Das Hauptupdate im Vergleich zur primitiven ersten Version dieses Codes besteht darin, dass das Problem der falschen Freigabe in Caches behoben wurde, was der Hauptengpass war. Wir erwägen auch, die Versionen AVX2 und AVX512 dieses Tests für zukünftige Überprüfungen anzuwenden.

Für diesen Test führen wir innerhalb von 20 Sekunden eine Bestandsmenge von Partikeln mit sechs verschiedenen Algorithmen mit 10-Sekunden-Pausen durch und geben die Gesamtpartikelgeschwindigkeit in Millionen von Operationen (Bewegungen) pro Sekunde an.

Basierend auf dem Nicht-AVX-Code zeigt der 9900K im Vergleich zum R7 2700X etwas bessere IPC- und Frequenzfrequenzen, obwohl dies eigentlich kein so großer prozentualer Sprung ist, wie wir es erwarten könnten. Prozessoren ohne HT verlieren in diesem Test.
Wenn wir jedoch AVX2 / AVX512 verwenden, befinden sich Skylake-X-Prozessoren in ihrem Element. Der 9900K ist dem R7 2700X jetzt deutlich überlegen, noch mehr als wir erwartet hatten, liegt auch der Core i7-9700K vorne.
Dolphin 5.0: Konsolenemulation
Einer der beliebtesten angeforderten Tests in unserem Paket ist die Konsolenemulation. Die Möglichkeit, ein Spiel aus einem veralteten System auszuwählen und auszuführen, ist sehr attraktiv und hängt von den Bemühungen des Emulators ab: Ein viel leistungsfähigeres x86-System ist erforderlich, um eine andere alte Konsole als x86 genau emulieren zu können. Insbesondere, wenn der Code für diese Konsole unter Berücksichtigung einiger physischer Fehler und Hardwarefehler erstellt wurde.
Für unseren Test verwenden wir die beliebte Dolphin-Emulationssoftware und führen ein Computerprojekt durch, um festzustellen, wie genau unsere Prozessoren die Konsole emulieren können. In diesem Test dauert die Nintendo Wii-Emulation etwa 1050 Sekunden.

Dolphin ist ein weiteres Szenario, das durch die Leistung eines einzelnen Threads eingeschränkt ist, weshalb Intel-Prozessoren in der Vergangenheit führend waren. Hier umgeht der 9900K den 9700K nur für eine Sekunde.
DigiCortex 1.20: Modellierung des Gehirns einer Meeresschnecke
Dieser Benchmark wurde ursprünglich entwickelt, um die Aktivität von Neuronen und Synapsen im Gehirn zu modellieren und zu visualisieren. Die Software verfügt über verschiedene vordefinierte Modi. Wir haben einen kleinen Benchmark gewählt, der ein Gehirn mit 32.000 Neuronen / 1,8 Milliarden Synapsen simuliert, was dem Gehirn einer Meeresschnecke entspricht.

Wir geben die Testergebnisse als Gelegenheit an, Daten in Echtzeit zu emulieren, sodass alle Ergebnisse über der „Einheit“ für den Echtzeitbetrieb geeignet sind. Von den beiden Modi, dem für DRAM schwierigen Modus „ohne Synapsenstart“ und dem Modus „mit Synapsenstart“, in dem der Prozessor geladen ist, wählen wir den letzteren aus. Trotz unserer Wahl wird der Test immer noch von der DRAM-Geschwindigkeit beeinflusst.

DigiCortex ist stark von der Prozessorleistung und der Speicherbandbreite abhängig, aber es sieht so aus, als ob der 6-Kern-Ryzen problemlos mit dem 8-Kern-9900K konkurrieren kann. Der 8700K / 8086K scheint mit diesem Test besser abzuschneiden.
y-Cruncher v0.7.6: Für die Mikroarchitektur optimierte Berechnungen
Ich habe einmal von y-Cruncher als Werkzeug gehört, mit dem Sie verschiedene mathematische Konstanten berechnen können. Aber nachdem ich mit seinem Entwickler Alex Yee, einem NWU-Forscher und jetzt einem Softwareoptimierungsentwickler, gesprochen hatte, stellte ich fest, dass er die Software auf unglaubliche Weise optimierte, um eine bessere Leistung zu erzielen. Natürlich profitiert jede Simulation, die mehr als 20 Tage dauert, von einer Produktivitätssteigerung von 1%! Alex begann mit y-Cruncher als Projekt in der High School zu arbeiten, aber jetzt ist das Projekt auf dem neuesten Stand. Alex arbeitet ständig daran, die neuesten Befehlssätze zu nutzen, noch bevor sie auf Hardware-Ebene verfügbar sind.
Für unseren Test führen wir y-Cruncher v0.7.6 durch alle möglichen optimierten Varianten von Binär-, Single-Threaded- und Multi-Threaded-Berechnungen, einschließlich für AVX-512 optimierter Binärdateien. Der Test besteht darin, 250 Millionen Zeichen der Pi-Zahl zu berechnen, und wir verwenden Single-Threaded- und Multi-Threaded-Versionen dieses Tests.


Da der y-Cruncher den AVX2 / AVX512 nutzt, sehen wir, dass Skylake-X-Prozessoren wieder in ihre gemütliche Welt aufbrechen. Im Multithread-Modus benötigt der 9900K / 9700K 8 Kerne, um den 6-Core-Prozessor zu überholen, der den AVX512 unterstützt.
Agisoft Photoscan 1.3.3: Konvertieren von 2D-Bildern in 3D-Modelle
Einer der ISVs, mit denen wir seit mehreren Jahren zusammenarbeiten, ist Agisoft. Die Kampagne entwickelt eine Software namens PhotoScan, die eine Reihe von 2D-Bildern in ein 3D-Modell konvertiert. Dies ist ein wichtiges Werkzeug bei der Entwicklung und Archivierung von Modellen und basiert auf einer Reihe von Single-Threaded- und Multi-Threaded-Algorithmen, um von einer Seite der Berechnung zur anderen zu gelangen.

In unserem Test nehmen wir die Softwareversion 1.3.3 mit einem großen Datensatz - Fotos 84 x 18 Megapixel. Wir führen den Test nach einem ziemlich schnellen Satz von Algorithmen durch, aber immer noch strenger als unser Test 2017. Als Ergebnis geben wir die gesamte Prozessabschlusszeit an.

Photoscan ist eine Aufgabe, die die Single-Threaded-Leistung mit hohem Durchsatz maximal nutzt. In diesem Fall ist das Vorhandensein von HT eine Belastung.
Rendering-Tests
In einem professionellen Umfeld ist das Rendern häufig ein Hauptanliegen für Prozessor-Workloads. Es wird in verschiedenen Formaten verwendet: vom 3D-Rendering bis zur Rasterung, bei Aufgaben wie Spielen oder Raytracing. Es nutzt die Fähigkeit von Software, Netze, Texturen, Kollisionen, Aliase und Physik (in Animationen) zu verwalten. Die meisten Renderer bieten Code für die CPU an, während einige GPUs verwenden und Umgebungen auswählen, die FPGAs oder spezialisierte ASICs verwenden. Bei großen Studios sind Prozessoren jedoch immer noch die Haupthardware.
Corona 1.3: Leistungswiedergabe
Der Corona-Test ist ein verbesserter Renderer, der für die Leistung von Software wie 3ds Max und Cinema 4D optimiert wurde. Er rendert eine generierte Szene mit dem Standard Version 1.3. Normalerweise zeigt die Implementierung des GUI-Benchmarks den Prozess der Erstellung der Szene und ermöglicht es dem Benutzer, das Ergebnis als "Zeit bis zur Fertigstellung" zu betrachten.

Wir haben den Entwickler kontaktiert, der uns die Befehlszeilenversion des Tests gegeben hat. Es liefert eine direkte Schlussfolgerung der Ergebnisse. Anstatt die Zeit zu melden, zu der die Szene erstellt wurde, geben wir die durchschnittliche Anzahl von Strahlen pro Sekunde über sechs Läufe an, da das Verhältnis von abgeschlossenen Aktionen zu Zeiteinheiten visuell leichter zu verstehen ist.

Corona ist ein Test mit mehreren Threads, sodass Prozessoren ohne HT etwas zurückliegen. Der Core i9-9900K hebt ab und überholt die 8-Core-Komponenten von AMD mit einer Marge von 25 Prozent und liegt nur an zweiter Stelle nach dem 12-Core-Threadripper.
Blender 2.79b: 3D Creation Suite
Als High-End-Rendering-Tool ist Blender ein Open-Source-Produkt mit vielen Einstellungen und Konfigurationen und wird von vielen High-End-Animationsstudios auf der ganzen Welt verwendet. Die Organisation hat kürzlich eine Blender-Testsuite veröffentlicht, einige Wochen nachdem wir beschlossen hatten, die Verwendung des Blender-Tests in unserem neuen Paket zu reduzieren. Ein neuer Test kann jedoch mehr als eine Stunde dauern. Um unsere Ergebnisse zu erhalten, führen wir einen der Untertests in diesem Paket über die Befehlszeile aus - die Standardszene "bmw27" im Modus "Nur CPU" - und messen die Abschlusszeit des Renderns.

Der Mixer hat eine vielseitige Mischung von Anforderungen, von der Speicherbandbreite bis zur Rohleistung, aber wie in Corona sind Prozessoren ohne HT etwas zurückgeblieben. Die Hochfrequenz 9900K erhöht sie über 10C Skylake-X und AMD 2700X, jedoch nicht höher als 1920X.
LuxMark v3.1: LuxRender über verschiedene Codepfade
Wie oben erwähnt, gibt es viele verschiedene Möglichkeiten, Rendering-Daten zu verarbeiten: CPU, GPU, Accelerator und andere. Darüber hinaus gibt es viele Frameworks und APIs, in denen Sie programmieren können, je nachdem, wie die Software verwendet wird. LuxMark, ein Benchmark, der mit der LuxRender-Engine entwickelt wurde, bietet verschiedene Szenen und APIs.
entnommen aus der Linux-Version von LuxMarkIn unserem Test führen wir eine einfache „Ball“ -Szene mit C ++ - und OpenCL-Code aus, jedoch im CPU-Modus. Diese Szene beginnt mit einem groben Rendering und verbessert langsam die Qualität innerhalb von zwei Minuten. Das Endergebnis ergibt das, was Sie als „durchschnittliches Kilo pro Sekunde“ bezeichnen können.


POV-Ray 3.7.1: Raytracing
Die Raytracing-Engine Persistence of Vision ist ein weiteres bekanntes Benchmarking-Tool, das einige Zeit in den Ruhezustand versetzt wurde, bis AMD seine Zen-Prozessoren veröffentlichte, als plötzlich sowohl Intel als auch AMD damit begannen, Code in den Hauptzweig eines Open-Source-Projekts zu verschieben. Für unseren Test verwenden wir den integrierten Test für alle Kerne, die über die Befehlszeile aufgerufen werden.

Office-Tests
Die Office-Testsuite konzentriert sich auf branchenüblichere Benchmarks, die sich auf Office-Workflows konzentrieren. Dies sind eher synthetische Tests, aber wir testen auch die Compilerleistung in diesem Abschnitt. Für Benutzer, die das Gerät als Ganzes bewerten müssen, sind dies normalerweise die wichtigsten Kriterien.
PCMark 10: Industriestandard
Futuremark, jetzt bekannt als UL, entwickelt seit zwei Jahrzehnten Tests, die zum Industriestandard geworden sind. Der letzte Satz von Systemtests ist PCMark 10, bei dem mehrere Tests im Vergleich zu PCMark 8 verbessert werden und OpenCL mehr Aufmerksamkeit geschenkt wird, insbesondere in Fällen wie Video-Streaming.
PCMark unterteilt seine Noten in rund 14 verschiedene Bereiche, darunter das Starten von Anwendungen, Webseiten, Tabellenkalkulationen, Fotobearbeitung, Rendering, Videokonferenzen und Physik. Wir veröffentlichen alle diese Daten in unserer Bench-Datenbank, aber die Gesamtpunktzahl ist ein Schlüsselindikator für die aktuelle Überprüfung.

Hier, wo viele Tests gemischt sind, belegen die neuen Intel-Prozessoren der Reihe nach die ersten drei Plätze. Sogar der i5-9600K geht dem i7-8086K voraus.
Chromium-Kompilierung: Windows VC ++ - Kompilieren von Chrome 56
Eine große Anzahl von AnandTech-Lesern sind Softwareentwickler, die beobachten, wie die Hardware funktioniert. Obwohl das Kompilieren des Linux-Kernels für Prüfer, die häufig kompilieren, „Standard“ ist, ist unser Test etwas vielfältiger. Wir verwenden Windows-Anweisungen, um Chrome zu kompilieren, insbesondere das Chrome-Build, das am 56. März 2017 erstellt wurde, als wir den Test erstellt haben. Google gibt recht detaillierte Anweisungen zum Kompilieren unter Windows, nachdem 400.000 Dateien aus dem Repository heruntergeladen wurden.

In unserem Test verwenden wir gemäß den Anweisungen von Google den MSVC-Compiler und Ninja, um die Kompilierung zu steuern. Wie zu erwarten, handelt es sich hierbei um einen Test mit variablem Multithreading und variablen DRAM-Anforderungen, die von schnelleren Caches profitieren. Die in unserem Test erzielten Ergebnisse sind die für die Kompilierung aufgewendete Zeit, die wir in die Anzahl der Kompilierungen pro Tag umrechnen.
Die Hochfrequenzleistung eines ausgewachsenen Turbos scheint in unserem Zusammenstellungstest gut abgeschnitten zu haben.
3DMark Physics: Computerphysik in Spielen
Neben PCMark gibt es einen 3DMark-Benchmark, Futuremark (UL) - eine Reihe von Spieletests. Jeder Spieltest besteht aus einer oder zwei Szenen, die für die GPU schwer sind, sowie einem physischen Test, je nachdem, wann der Test geschrieben wurde und auf welche Plattform er abzielt. Die Hauptthemen in zunehmendem Schwierigkeitsgrad sind Eissturm, Wolkentor, Himmels-Taucher, Feuerschlag und Zeitspion.
Einige der Untertests bieten andere Optionen, z. B. Ice Storm Unlimited (für mobile Plattformen mit Off-Screen-Rendering) oder Fire Strike Ultra (für Hochleistungs-4K-Systeme mit vielen zusätzlichen Funktionen). Es ist erwähnenswert, dass Time Spy derzeit über den AVX-512-Modus verfügt (den wir in Zukunft verwenden können).
Bei unseren Tests senden wir die Ergebnisse jedes physischen Tests an Bench. Bei der Überprüfung bleiben wir jedoch bei den Ergebnissen der anspruchsvollsten Szenen: Ice Storm Unlimited, Cloud Gate, Sky Diver, Fire Strike Ultra und Time Spy.





Der ältere Ice Storm-Test mochte den neuen Core i9-9900K nicht wirklich und schob ihn hinter den R7 1800X. Für modernere PC-orientierte Tests gewinnt 9900K. Das Fehlen von HT verhindert, dass zwei andere Prozessoren in der Leitung hohe Ergebnisse zeigen.
GeekBench4: Synthetischer Test
GeekBench 4 ist ein gängiges Tool für plattformübergreifende Tests auf Mobilgeräten, PCs und Macs und der perfekte synthetische Test eines Systems unter Verwendung einer Reihe von Algorithmen, die maximale Bandbreite erfordern. Die Tests umfassen Verschlüsselung, Komprimierung, schnelle Fourier-Transformation, Speicheroperationen, N-Körper-Physik, Matrixoperationen, Histogrammmanipulation und HTML-Analyse.


Ich schließe diesen Test wegen der Popularität der Abfrage ein, obwohl die Ergebnisse sehr synthetisch sind. Viele Benutzer legen oft großen Wert auf die Ergebnisse, da sie auf verschiedenen Plattformen kompiliert wurden (wenn auch mit verschiedenen Compilern).
Wir zeichnen die Bewertungen der wichtigsten Untertests (Krypto, Ganzzahl, Gleitkomma, Speicher) in unserer Datenbank mit Testergebnissen auf, veröffentlichen jedoch zur Überprüfung nur allgemeine Single-Threaded- und Multi-Threaded-Ergebnisse.
Codierungstests
, , . , , , , , , . , , .
Handbrake 1.1.0:
, Handbrake — , , , . . , AVX-512 OpenCL . , , CPU, .
Handbrake , - Logitech C920 1080p60 ( , ). . :
- 720p60 at 6000 kbps constant bit rate, fast setting, high profile
- 1080p60 at 3500 kbps constant bit rate, faster setting, main profile
- 1080p60 HEVC at 3500 kbps variable bit rate, fast setting, main profile



7-zip v1805:
/ 7-zip , . , . .



, : , . , , Windows Scheduler . , .
WinRAR 5.60b3:
, WinRAR. . , right-click Windows . , , 30 60- 2000 -, .

WinRAR , , 10 , , .
AES:
, , . Windows BitLocker . AES discontinued TrueCrypt , .
, , — AES / , . AES , AVX-512.

-
low-end , small form factor , -, , . - , , - . , ( ) . , - : -, , . - , , , .
, .
WebXPRT 3: - ,
, XPRT, Principled Technologies, -, , , «3». ( , ) : , , , , HTML5, , .

, . , .
WebXPRT 2015: HTML5 Javascript Web UX
WebXPRT — 2015 , - , . - , , - , . - . , , , . — , . « », .

WebXPRT3, , . , .
Speedometer 2: Javascript Frameworks
- — Speedometer 2, javascript, : , , . , , , -.
«rpm», . .

Google Octane 2.0: Core Web Compute
- , , — Octane Google. 2.0 , , , , , — .
, . .

Mozilla Kraken 1.1: Core Web Compute
, Octane, Kraken, Mozilla. , , . , Kraken , , .
, . , .

3DPM v1: 3DPM v2.1
«» — 3DPM. , , , ( ). , , ( 4 , ; 5 – ).
(-O2, -fp: fast): OpenMP . , false sharing . , , .


x264 HD 3.0:
, Anandtech Pentium 4 Athlon II. 720p , . , IPC — instructions-per-clock.


Vielen Dank für Ihren Aufenthalt bei uns. Gefällt dir unser Artikel? Möchten Sie weitere interessante Materialien sehen? Unterstützen Sie uns, indem Sie eine Bestellung
aufgeben oder Ihren Freunden empfehlen, einen
Rabatt von 30% für Habr-Benutzer auf ein einzigartiges Analogon von Einstiegsservern, das wir für Sie erfunden haben: Die ganze Wahrheit über VPS (KVM) E5-2650 v4 (6 Kerne) 10 GB DDR4 240 GB SSD 1 Gbit / s von $ 20 oder wie teilt man den Server? (Optionen sind mit RAID1 und RAID10, bis zu 24 Kernen und bis zu 40 GB DDR4 verfügbar).
VPS (KVM) E5-2650 v4 (6 Kerne) 10 GB DDR4 240 GB SSD 1 Gbit / s bis zum 1. Januar kostenlos, wenn Sie für einen Zeitraum von sechs Monaten bezahlen, können Sie
hier bestellen.
Dell R730xd 2 mal günstiger? Nur wir haben
2 x Intel Dodeca-Core Xeon E5-2650v4 128 GB DDR4 6 x 480 GB SSD 1 Gbit / s 100 TV von 249 US-Dollar in den Niederlanden und den USA! Lesen Sie mehr über
den Aufbau eines Infrastrukturgebäudes. Klasse mit Dell R730xd E5-2650 v4 Servern für 9.000 Euro für einen Cent?