Unzugänglicher Luxus von Intel: Core i9-9990XE mit 14 Kernen bei einer Frequenz von 5,0 GHz (1 Teil)Systemtests
Der Abschnitt "Systemtests" konzentriert sich auf Tests unter realen Bedingungen, mit denen der Verbraucher konfrontiert ist, wobei der Durchsatz leicht verzerrt ist. In diesem Abschnitt befassen wir uns mit der Ladezeit von Anwendungen, der Bildverarbeitung, der einfachen Physik, der Emulation, der neuronalen Modellierung, optimierten Berechnungen und der Entwicklung dreidimensionaler Modelle mit leicht zugänglicher und anpassbarer Software. Obwohl sich einige der Tests leichter mit den Funktionen großer Produkte wie PCMark überschneiden lassen (wir veröffentlichen diese Werte im Abschnitt Bürotests), ist es dennoch sinnvoll, das zu testende Objekt aus verschiedenen Blickwinkeln zu betrachten. In allen Tests erklären wir detailliert, was getestet wird und wie genau wir testen.
Anwendungs-Download: GIMP 2.10.4
Einer der wichtigsten Aspekte der Benutzererfahrung und des Workflows ist die Geschwindigkeit des Systems. Ein guter Test besteht darin, die Ladezeiten der Anwendung zu überprüfen. Die meisten Programme werden heutzutage, wenn sie auf einer SSD gespeichert sind, fast sofort heruntergeladen, aber für einige Office-Tools müssen Assets vorab geladen werden, bevor sie einsatzbereit sind. Die meisten Betriebssysteme verwenden auch die Zwischenspeicherung, sodass bestimmte Software, die häufig heruntergeladen wird (Webbrowser, Office-Tools), viel schneller initialisiert werden kann.
In der vorherigen Testsuite haben wir überprüft, wie lange das Laden einer großen PDF-Datei in Adobe Acrobat dauern würde. Leider war dieser Test ein Programmier-Albtraum und weigerte sich, kampflos auf Win10 RS3 zu aktualisieren. In der Zwischenzeit haben wir eine Anwendung entdeckt, mit der dieser Test automatisiert werden kann, und entschieden uns für GIMP, eine beliebte und kostenlose Fotobearbeitungsanwendung. Dies ist ein Open Source-Editor, die Hauptalternative zu Adobe Photoshop. Wir haben es so konfiguriert, dass eine große Entwurfsvorlage mit einer Größe von 50 MB geladen wird, und haben das Laden zehnmal mit einem Intervall von zehn Sekunden zwischen ihnen durchgeführt. Aufgrund der Zwischenspeicherung sind die ersten 3 bis 5 Ergebnisse häufig langsamer als die übrigen, und die Zwischenspeicherungszeit kann inkonsistent sein. Wir verwenden daher den Durchschnitt der letzten fünf Ergebnisse, um die CPU-Verarbeitung beim Laden im Cache anzuzeigen.

Das Herunterladen von Apps ist für den Core i9-9990XE wie ein Spaziergang durch den Park.
FCAT: Bildverarbeitung
Die FCAT-Software wurde entwickelt, um Mikrosticks und ausgelassene Bilder zu erkennen und Grafiktests durchzuführen, wenn zwei Grafikkarten zum Rendern einer Szene kombiniert werden. Aufgrund von Game-Engines und Grafiktreibern funktionierten nicht alle GPU-Kombinationen einwandfrei. Infolgedessen zeichnete die Software Farben für jedes gerenderte Einzelbild auf und führte die RAW-Datenaufzeichnung mithilfe eines Videoaufnahmegeräts dynamisch durch.

Die FCAT-Software akzeptiert das aufgezeichnete Video, in unserem Fall sind es 90 Sekunden 1440p des Spiels Rise of the Tomb Raider, und konvertiert die Farbdaten in Bildzeitdaten, sodass das System die beobachtete Bildrate anzeigen und mit dem Energieverbrauch der Videobeschleuniger korrelieren kann. Dieser Test ist aufgrund der Schnelligkeit, mit der er abgeschlossen wurde, ein Singlethread-Test. Wir starten den Prozess und erhalten dadurch die Fertigstellungszeit.

FCAT liefert für alle Prozessoren ziemlich gleiche Ergebnisse, und nur wenige Prozent teilen sich alle Intel-Komponenten.
3D-Partikelbewegung v2.1: Brownsche Bewegung
Bei unserem 3DPM-Test handelt es sich um einen benutzerdefinierten Benchmark, mit dem sechs verschiedene Algorithmen zum Bewegen von Partikeln im dreidimensionalen Raum modelliert werden. Die Algorithmen wurden im Rahmen meiner Doktorarbeit entwickelt und funktionieren letztendlich am besten auf der GPU. Sie geben eine gute Vorstellung davon, wie Befehlsströme von verschiedenen Mikroarchitekturen interpretiert werden.
Der Schlüsselteil der Algorithmen ist die Erzeugung von Zufallszahlen - wir verwenden eine relativ schnelle Erzeugung, die die Implementierung von Abhängigkeitsketten im Code vervollständigt. Das Hauptupdate im Vergleich zur primitiven ersten Version dieses Codes ist, dass das Problem der falschen Freigabe in Caches behoben wurde, was der Hauptengpass war. Wir erwägen auch, die Versionen AVX2 und AVX512 dieses Tests für zukünftige Überprüfungen anzuwenden.
Für diesen Test führen wir einen Partikelsatz mit sechs verschiedenen Algorithmen innerhalb von 20 Sekunden mit Pausen von 10 Sekunden aus und geben die gesamte Partikelgeschwindigkeit in Millionen von Operationen (Bewegungen) pro Sekunde an.

Wenn wir den 3DPM-Test im Standardmodus ausführen, zeigt der 9990XE erneut eine leichte Regression im Vergleich zum 7940X, was darauf hindeuten kann, dass für das Mesh zusätzliche MHz erforderlich sind.

Bei Verwendung der AVX512-Anweisungen öffnet unser 9990XE seine Flügel wie die anderen Intel HEDT-Prozessoren, kann sich aber trotz der gleichen Anzahl von Kernen nur auf den langsameren 7940X steigern. Der Test beschränkt sich hier mehr auf Kerne als auf Frequenzen, was darauf hinweist, dass dieser Test mehrere Pipeline-Stopps enthält.
Dolphin 5.0: Konsolenemulation
Einer der beliebtesten Tests in unserem Paket ist die Konsolenemulation. Die Möglichkeit, ein Spiel aus einem veralteten System auszuwählen und auszuführen, ist sehr attraktiv und hängt von den Bemühungen des Emulators ab: Ein viel leistungsfähigeres x86-System ist erforderlich, um eine andere alte Konsole als x86 akkurat emulieren zu können. Insbesondere, wenn der Code für diese Konsole unter Berücksichtigung einiger physikalischer Fehler und Hardware-Fehler erstellt wurde.
Für unseren Test verwenden wir die beliebte Dolphin-Emulationssoftware und führen ein Computerprojekt durch, um zu bestimmen, wie genau unsere Prozessoren die Konsole emulieren können. In diesem Test dauert die Nintendo Wii-Emulation etwa 1050 Sekunden.
Die neueste Version von Dolphin kann
heruntergeladen werden
Dolphin ist ein Single-Threaded-Test, daher sehen wir hier die Hochfrequenzprozessoren von Intel und AMD an der Spitze.
DigiCortex 1.20: Modellierung des Gehirns einer Meeresschnecke
Dieser Benchmark wurde ursprünglich entwickelt, um die Aktivität von Neuronen und Synapsen im Gehirn zu modellieren und zu visualisieren. Die Software wird mit verschiedenen vordefinierten Modi geliefert. Wir haben einen kleinen Benchmark ausgewählt, der ein Gehirn mit 32.000 Neuronen / 1,8 Milliarden Synapsen simuliert, was dem Gehirn einer Meeresschnecke entspricht.

Wir geben die Testergebnisse als Gelegenheit an, Daten in Echtzeit zu emulieren, sodass alle Ergebnisse über der „Einheit“ für den Echtzeitbetrieb geeignet sind. Von den beiden Modi, dem für DRAM schwierigen Modus "ohne Synapsenstart" und dem Modus "mit Synapsenstart", in dem der Prozessor geladen ist, wählen wir den letzteren aus. Trotz unserer Wahl wird der Test immer noch von der DRAM-Geschwindigkeit beeinflusst.
DigiCortex kann
heruntergeladen werden
DigiCortex liebt die Speicherfrequenz und die internen Geschwindigkeiten mehr als die reine Kernfrequenz, weshalb der 9990XE hier nicht besonders gut funktioniert.
y-Cruncher v0.7.6: Für die Mikroarchitektur optimierte Berechnungen
Ich habe einmal von y-Cruncher gehört, einem Tool, mit dem Sie verschiedene mathematische Konstanten berechnen können. Aber nachdem ich mit dem Entwickler, Alex Yee, einem NWU-Forscher und jetzt einem Softwareoptimierungsentwickler, gesprochen hatte, wurde mir klar, dass er die Software auf unglaubliche Weise optimiert hat, um eine bessere Leistung zu erzielen. Natürlich profitiert jede Simulation, die mehr als 20 Tage dauert, von einer Produktivitätssteigerung von 1%! Alex hat angefangen, mit y-Cruncher als Projekt in der High School zu arbeiten, und jetzt ist das Projekt auf dem neuesten Stand. Alex arbeitet ständig daran, die neuesten Anweisungen zu nutzen, noch bevor sie auf Hardware-Ebene verfügbar sind.
Für unseren Test führen wir y-Cruncher v0.7.6 durch alle möglichen optimierten Varianten von Binär-, Single-Thread- und Multi-Thread-Berechnungen, einschließlich Binärdateien, die für AVX-512 optimiert wurden. Der Test besteht darin, 250 Millionen Zeichen der Pi-Zahl zu berechnen, und wir verwenden Singlethread- und Multithread-Versionen dieses Tests.
Benutzer können y-cruncher
von der Alex-Website herunterladen

y-Cruncher ist ein Test, der mit dem AVX-512 beschleunigt wurde, und der neue Prozessor mit hoher Frequenz erzielt das beste Ergebnis in einem Single-Thread-Test.
Agisoft Photoscan 1.3.3: Konvertieren Sie 2D-Bilder in 3D-Modelle
Einer der ISVs, mit denen wir seit mehreren Jahren zusammenarbeiten, ist Agisoft. Die Kampagne entwickelt eine Software namens PhotoScan, die eine Reihe von 2D-Bildern in ein 3D-Modell umwandelt. Dies ist ein wichtiges Werkzeug für die Entwicklung und Archivierung von Modellen und basiert auf einer Reihe von Singlethread- und Multithread-Algorithmen, um von einer Seite der Berechnung zur anderen zu gelangen.

In unserem Test nehmen wir die Softwareversion 1.3.3 mit einem großen Datensatz - Fotos 84 x 18 Megapixel. Wir führen den Test nach einem relativ kurzen Satz von Algorithmen durch, aber immer noch strenger als unser Test von 2017. Infolgedessen geben wir die gesamte Prozessabschlusszeit an.
Die Website von Agisoft Photoscan finden Sie
hier.
Agisoft ist ein Multithreading-Test und es sieht so aus, als ob der Core i9-9990XE die beste Kombination aus Kernen und Threads aufweist.
Office-Tests
Die Office-Testsuite konzentriert sich auf Standard-Benchmarks der Branche, die sich auf Office-Workflows konzentrieren. Dies sind eher synthetische Tests, aber wir testen auch die Compilerleistung in diesem Abschnitt. Für Benutzer, die die gesamte Ausrüstung bewerten müssen, sind dies in der Regel die wichtigsten Kriterien, die berücksichtigt werden müssen.
3DMark Physics: Computerphysik in Spielen
Zusammen mit PCMark gibt es einen 3DMark-Benchmark, Futuremark (UL) - eine Reihe von Spieletests. Jeder Spieletest besteht aus einer oder zwei Szenen, die für die GPU schwer sind, sowie einem physischen Test, je nachdem, wann der Test geschrieben wurde und auf welche Plattform er abzielt. Die Hauptthemen in zunehmendem Schwierigkeitsgrad sind Ice Storm, Cloud Gate, Sky Diver, Fire Strike und Time Spy.
Einige der Untertests bieten andere Optionen, wie z. B. Ice Storm Unlimited, das für mobile Plattformen mit Off-Screen-Rendering entwickelt wurde, oder Fire Strike Ultra, das für leistungsstarke 4K-Systeme mit vielen zusätzlichen Funktionen entwickelt wurde. Es ist erwähnenswert, dass Time Spy derzeit über den AVX-512-Modus verfügt (den wir in Zukunft verwenden können).



In einfacheren Tests wie Ice Storm ist der 9990XE mit der höchsten Frequenz der beste Physikrechner, den wir haben.
GeekBench4: Synthetischer Test
GeekBench 4 ist ein gängiges Tool für plattformübergreifende Tests auf Mobilgeräten, PCs und Macs. Es ist der perfekte synthetische Test eines Systems mit einer Reihe von Algorithmen, die maximale Bandbreite erfordern. Die Tests umfassen Verschlüsselung, Komprimierung, schnelle Fourier-Transformation, Speicheroperationen, n-Body-Physik, Matrixoperationen, Histogramm-Manipulation und HTML-Analyse.
Ich schließe diesen Test wegen der Popularität der Abfrage ein, obwohl die Ergebnisse sehr synthetisch sind. Viele Benutzer messen ihren Ergebnissen oft große Bedeutung bei, da sie auf unterschiedlichen Plattformen (wenn auch mit unterschiedlichen Compilern) kompiliert wurden.
Wir zeichnen die Bewertungen der wichtigsten Untertests (Crypto, Integer, Floating Point, Memory) in unserer Datenbank mit Testergebnissen auf. Für die Überprüfung veröffentlichen wir jedoch nur allgemeine Single-Thread- und Multi-Thread-Ergebnisse.


Webtests und Legacy-Tests
Webtests sind aufgrund ihres Fokus auf Low-End-Systeme oder Systeme mit kleinem Formfaktor in der Regel schwer zu standardisieren. Moderne Webbrowser werden häufig aktualisiert, sodass es unmöglich ist, diese Aktualisierungen zu deaktivieren. Daher ist es schwierig, eine gemeinsame Plattform zu verwalten. Die rasante Entwicklung des Browsers führt dazu, dass sich Versionen (und Leistungsindikatoren) von Woche zu Woche ändern können. Trotzdem sind Webtests oft ein wichtiger Indikator für Benutzer: Viele der heutigen Büroarbeiten beziehen sich auf Webanwendungen, insbesondere elektronische und Büroanwendungen, sowie auf Schnittstellen und Entwicklungsumgebungen. Unsere Web-Testsuite umfasst mehrere branchenübliche Tests sowie einige beliebte, jedoch etwas veraltete Tests.
Wir haben auch unsere veralteten, aber immer noch beliebten Tests in diesen Abschnitt aufgenommen.
WebXPRT 3: Webaufgaben der modernen Welt, einschließlich KI
Das Unternehmen, das hinter der XPRT-Testsuite steht, Principled Technologies, hat kürzlich den neuesten Web-Test veröffentlicht. Statt dem Namen ein Jahr hinzuzufügen, wurde er einfach als „3“ bezeichnet. Dieser neueste (zumindest vorerst) Test wurde auf der Grundlage solcher Vorgänger entwickelt: Tests der Benutzerinteraktion, des Office-Computing, der grafischen Darstellung, der Sortierlisten, von HTML5, der Bildmanipulation und in einigen Fällen sogar von AI-Tests.
Für unseren Benchmark führen wir einen Standardtest durch, der die Checkliste sieben Mal ausarbeitet und das Endergebnis liefert. Wir führen einen solchen Test viermal durch und zeigen den Durchschnittswert an.
Benutzer können auf den WebXPRT-Test unter zugreifen

WebXPRT 2015: Testen von HTML5 und Javascript Web UX
Bei der älteren Version von WebXPRT handelt es sich um die Ausgabe 2015, die sich auf etwas andere Webtechnologien und Frameworks konzentriert, die jedoch heute verwendet werden. Dies ist immer noch ein relevanter Test, insbesondere für Benutzer, die nicht mit den neuesten Webanwendungen auf dem Markt interagieren, und es gibt viele solcher Benutzer. Die Entwicklung von Web-Frameworks ist sehr schnell und sehr flüssig. Die Frameworks werden schnell entwickelt, in Anwendungen integriert und verwendet, und die Entwickler wechseln dann zum nächsten. Die Anpassung der Anwendung an das neue Framework ist eine schwierige Aufgabe, insbesondere bei einer solchen Geschwindigkeit der Entwicklungszyklen. Aus diesem Grund bleiben viele Anwendungen "in der Zeit hängen" und bleiben für Benutzer über viele Jahre relevant.
Wie im Fall von WebXPRT3 erfüllt der Hauptbenchmark den Kontrollsatz siebenmal und zeigt das Endergebnis an. Wir wiederholen dies viermal, zeigen den Durchschnitt an und zeigen die Endergebnisse.

Tacho 2: Javascript Frameworks
Unser neuester Webtest ist Tacho 2, der eine Reihe von Javascript-Frameworks durchläuft, um nur drei einfache Dinge zu tun: Erstellen Sie eine Liste, fügen Sie jedes Element in die Liste ein und löschen Sie die Liste. Alle Frameworks implementieren die gleichen visuellen Signale, aber offensichtlich tun sie dies auf unterschiedliche Weise.
Unser Test besteht die gesamte Liste der Frameworks und gibt die endgültige Bewertung unter dem Namen "rpm", einem der internen Benchmark-Indikatoren. Wir zeigen diesen Indikator als Endergebnis an.

Google Octane 2.0: Core Web Compute
Octane von Google ist seit einigen Jahren ein beliebter Webtest, der jetzt jedoch nicht mehr aktualisiert wird. Version 2.0 führt einige Dutzend Aufgaben im Zusammenhang mit Berechnungen aus, z. B. reguläre Ausdrücke, Kryptographie, Raytracing, Emulation und die Berechnung der Navier-Stokes-Gleichungen.
Der Test bewertet jeden Untertest und gibt den geometrischen Mittelwert als Endergebnis zurück. Wir führen vier Mal einen vollständigen Benchmark durch und bewerten die Endergebnisse.

Mozilla Kraken 1.1: Kernwebcomputer
Noch älter als Octane ist hier Kraken, diesmal von Mozilla entwickelt. Dies ist ein alter Test, der eine relativ einheitliche Rechenmechanik wie z. B. Audioverarbeitung oder Bildfilterung ausführt. Es scheint, dass Kraken je nach Browserversion ein sehr instabiles Ergebnis liefert, da dieser Test stark optimiert ist.
Der Hauptbenchmark durchläuft jeden Untertest zehnmal und gibt die durchschnittliche Abschlusszeit für jeden Zyklus in Millisekunden zurück. Wir führen vier Mal den vollständigen Benchmark durch und messen das durchschnittliche Ergebnis.

3DPM v1: Naive Codevariante von 3DPM v2.1.
Der erste "geerbte" Test im Paket ist die erste Version unseres 3DPM-Tests. Dies ist die endgültige native Version des Codes, als ob sie von einem Wissenschaftler geschrieben worden wäre, der (wie am Anfang) nicht wusste, wie Computerhardware, Compiler oder Optimierung funktionieren. Der Test ist ein umfangreiches wissenschaftliches Modellieren in der freien Natur, bei dem das Erhalten einer Antwort wichtiger ist als die Geschwindigkeit des Rechnens (das Erhalten des Ergebnisses in 4 Tagen ist akzeptabel, wenn das Ergebnis korrekt ist; ein Jahr Lernen des Programmierens und Erhalten des Ergebnisses in 5 Minuten ist nicht akzeptabel).
In dieser Version bestand die einzige echte Optimierung in den Compiler-Flags (-O2, -fp: fast): Kompilieren im Release-Modus und Aktivieren von OpenMP in den Haupt-Computing-Zyklen. Die Größe der Schleifen wurde für Funktionen nicht festgelegt, und die schwerwiegendste Verlangsamung ist die falsche Freigabe im Cache. Der Code weist auch lange Abhängigkeitsketten auf, die auf der Erzeugung von Zufallszahlen basieren, was bei einigen Computer-Mikroarchitekturen zu Leistungseinbußen führt.
3DPM v1 sowie 3DPM v2 können hier heruntergeladen werden: 3DPMv2.1.rar (13.0 MB)


x264 HD 3.0: Legacy-Transcodierungstest
Dieser Transcodierungstest ist sehr alt und wurde von Anandtech zu Zeiten der Pentium 4- und Athlon II-Prozessoren verwendet. Darin wird standardisiertes 720p-Video mit doppelter Konvertierung codiert, und der Benchmark zeigt Bilder pro Sekunde für jeden Durchgang. Der Test ist Single-Threaded und in einigen Architekturen stoßen wir auf IPC-Einschränkungen - Anweisungen pro Takt.


Leistungsaufnahme, Frequenzen und Wärmespezifikationen
In mehreren Artikeln haben wir untersucht, warum die auf der Box angegebenen TDP-Nummern für die meisten Benutzer unbrauchbar sind: Die schwache TDP von Intel zeigt die Kühlung an, die erforderlich ist, um den Prozessor mit der Basisfrequenz zu betreiben. « » — , , (- ), .
Core i9-9990XE , , 14 4,0 , , 255 . ICC 5,0 «» . , 4,0 , 5,0 .
ICC , , - «Turbo», , . 1,2 , 1,29 , . : 266 , 24 ° C 20 ° C. , - , Intel . mesh , 900 .
, Cinebench R20, , 5,0 . , Speed Shift, Intel 5,0 . CB20, , 600 , , 5,0 334 — , - mesh, - . mesh 2,4 .
, 1U , . , , , . , 81C, 1.290 . 14- 5,0 .

: . ICC 1,75- -, 350–400 , , . , . 78 1 (30 ) . , - 1U, , - , . , , .
AVX-512. 3,8 , -12. , Intel, , AVX-512, , , , . 600 , — 82C.
- — , . , OEM- , , « MSRP, » — .
Intel Core i9-9990XE:
Intel Core i9-9990XE . CES , : 14- 5,0 OEM- . Intel , , , , , .

, ( ) , . , CaseKing , ( 1 ) -, 2999 ( — 2849 ), ( ) . Puget Systems, ICC, Intel, , . ICC 1U .

, . , 400 - 1,75 . : 78 , , . , 1U, , — . , tower, , 28- Xeon W-3175X, , .
, ICC . 32 DDR4, DDR4-3600 . SSD GPU, - . - Core i9-9990XE — . Intel Core , Xeon W-3175X, 28- , , Core i9-9990XE , . , — Core i9-9990XE . : mesh , - .
AMD, 5,0 , . AMD 32- Threadripper, : 14 5,0 32 ~ 3,4 , 2990WX «» , , AVX2 / AVX512, Core i9-9990XE .
, , . W-3175X $ 3000, i9-9990XE, ECC , . 2990WX — NUMA, . , i9-9990XE , 2990WX 30-40%.

8- Intel 5,0 , Core i9-9900KS. , 16 PCIe 3.0, $ 513 (30 ). , 5,0 (. . ), , , 9900KS , 9990XE, , , .
, Core i9-9990XE: Intel , , . , , , . , Intel ( - ). Intel , . , , , . , Core i9-9900KS , .
, Core i9-9990XE . , . Robot Wars () BattleBots (): - , , . -, , , , - .
:)
, . ? ? Unterstützen Sie uns, indem Sie eine Bestellung aufgeben oder Ihren Freunden empfehlen,
Cloud-VPS für Entwickler ab 4,99 US-Dollar , ein
30-prozentiger Rabatt für Habr-Benutzer auf ein einzigartiges Analogon von Einstiegsservern, das wir für Sie erfunden haben: Die ganze Wahrheit über VPS (KVM) E5-2650 v4 (6 Kerne) 10 GB DDR4 240 GB SSD 1 Gbit / s ab 20 US-Dollar oder wie man einen Server freigibt? ( RAID1 RAID10, 24 40GB DDR4).
Dell R730xd 2 mal günstiger? 2 Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 $199 ! Dell R420 — 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB — $99! . c Dell R730xd 5-2650 v4 9000 ?