Monster nach den Ferien: AMD Threadripper 2990WX 32-Core und 2950X 16-Core (Teil 3 - Tests)

Teil 1Teil 2Teil 3Teil 4Teil 5


HEDT-Tests: Systemtests


Der Abschnitt "Systemtests" konzentriert sich auf Tests unter realen Bedingungen, mit denen der Verbraucher konfrontiert ist. In diesem Abschnitt befassen wir uns mit Anwendungsladezeiten, Bildverarbeitung, einfacher Physik, Emulation, neuronaler Modellierung, optimiertem Rechnen und der Entwicklung dreidimensionaler Modelle unter Verwendung leicht zugänglicher und anpassbarer Software. Obwohl sich einige der Tests leichter mit den Funktionen großer Pakete wie PCMark überschneiden lassen (wir veröffentlichen diese Werte im Abschnitt "Office-Tests"), sollten verschiedene Perspektiven berücksichtigt werden. In allen Tests werden wir detailliert erklären, was genau getestet wird und wie wir Tests durchführen.

Anwendungs-Download: GIMP 2.10.4


Einer der wichtigsten Aspekte der Benutzererfahrung und des Workflows ist die Geschwindigkeit des Systems. Ein guter Test in diesem Fall ist die Überprüfung der Ladezeiten der Anwendung. Die meisten Programme werden heutzutage auf einer SSD gespeichert und fast sofort geladen, aber einige Office-Tools erfordern das Vorladen von Assets. Die meisten Betriebssysteme verwenden Caching. Wenn bestimmte Software häufig heruntergeladen wird (Webbrowser, Office-Tools), kann sie viel schneller initialisiert werden.

In der vorherigen Testsuite haben wir überprüft, wie lange es gedauert hat, ein großes PDF-Dokument in Adobe Acrobat zu laden. Leider war dieser Test ein Programmier-Albtraum und weigerte sich, kampflos auf Win10 RS3 umzusteigen. In der Zwischenzeit haben wir eine Anwendung entdeckt, die diesen Test automatisieren und GIMP steuern kann. GIMP ist eine beliebte und kostenlose Fotobearbeitungsanwendung, ein Open Source-Editor und die Hauptalternative zu Adobe Photoshop. Wir haben es so konfiguriert, dass eine große Entwurfsvorlage mit einer Größe von 50 MB heruntergeladen wird. Der Ladevorgang wurde 10 Mal im Abstand von 10 Sekunden durchgeführt. Aufgrund des Caching sind die ersten 3-5 Ergebnisse langsamer als die nachfolgenden, die Zeit für das Caching kann inkonsistent sein. Daher leiten wir den Durchschnittswert aus den letzten fünf Ergebnissen ab, um die CPU-Verarbeitung während des zwischengespeicherten Ladens anzuzeigen.



Dieser Benchmark teilte die Teilnehmer ordentlich in zwei Kategorien ein: Prozessoren mit einer kleinen Anzahl von Kernen auf der einen Seite und Top-Desktop-Prozessoren auf der anderen Seite. Der 1920X und der 2950X zeigten eine schnelle Leistung, während der 18-Kern Intel und der 32-Kern AMD langsamer waren. Dies ist wahrscheinlich auf die unterschiedliche Leistung eines Kerns zurückzuführen. Ich vermute jedoch, dass das Ergebnis durch die Speicherlatenz beeinflusst werden könnte.

FCAT: Bildverarbeitung


Die FCAT-Software wurde entwickelt, um Mikrosticks zu erkennen, Frames fallen zu lassen und Grafiktests durchzuführen, wenn zwei Grafikkarten kombiniert werden, um eine Szene zu rendern. Aufgrund von Game-Engines und Grafiktreibern funktionierten nicht alle GPU-Kombinationen einwandfrei. Infolgedessen erfasste die Software Farben für jeden gerenderten Frame und führte dynamisch eine RAW-Datenaufzeichnung mit einem Videoaufnahmegerät durch.



Die FCAT-Software akzeptiert das aufgezeichnete Video, in unserem Fall 90 Sekunden 1440p des Spiels Rise of the Tomb Raider, und konvertiert die Farbdaten in Frame-Zeitdaten, sodass das System die „beobachtete“ Framerate anzeigen und mit dem Energieverbrauch der Videobeschleuniger korrelieren kann. Dieser Test ist aufgrund der Geschwindigkeit, mit der er abgeschlossen wurde, Single-Threaded. Wir starten den Prozess und erhalten dadurch die Fertigstellungszeit.



Alle Testsysteme funktionieren ungefähr gleich, aber die schnellere Einzelprozessorleistung von Intel ist höher als bei anderen Prozessoren. EPYC 7601 steht aufgrund der geringen Frequenz eines einzelnen Kerns an letzter Stelle auf der Liste.

3D-Partikelbewegung v2.1: Brownsche Bewegung


Unser 3DPM-Test ist ein benutzerdefinierter Benchmark, mit dem sechs verschiedene Algorithmen zum Bewegen von Partikeln im dreidimensionalen Raum modelliert werden können. Die Algorithmen wurden im Rahmen meiner Doktorarbeit entwickelt und funktionieren letztendlich am besten auf der GPU. Sie geben eine gute Vorstellung davon, wie die Befehlsströme von verschiedenen Mikroarchitekturen interpretiert werden.

Der Schlüsselteil der Algorithmen ist die Erzeugung von Zufallszahlen - wir verwenden eine relativ schnelle Erzeugung, die die Implementierung von Abhängigkeitsketten im Code vervollständigt. Das Hauptupdate im Vergleich zur primitiven ersten Version dieses Codes - das Problem der falschen Freigabe in Caches wurde behoben, dies war der Hauptengpass. Wir erwägen, die Versionen AVX2 und AVX512 dieses Tests für zukünftige Überprüfungen anzuwenden.

Für diesen Test führen wir einen Bestandssatz von Partikeln mit sechs verschiedenen Algorithmen für 20 Sekunden mit 10-Sekunden-Pausen durch und geben die Gesamtpartikelgeschwindigkeit in Millionen von Operationen (Bewegungen) pro Sekunde an.



3DPM scheint Streams und Frequenzen zu lieben, weshalb AMD die ersten vier Plätze einnimmt. Selbst der neueste 16-Kern-Prozessor von AMD übertrifft in diesem Test den 18-Kern-Prozessor von Intel und verwendet andere Anweisungen als AVX. Es ist interessant, einen Vergleich zwischen 2990WX und EPYC 7601 zu sehen - die zusätzliche Frequenz des Consumer-Prozessors trägt dazu bei, die Produktivität um über 30% zu steigern.

Dolphin 5.0: Konsolenemulation


Einer der beliebtesten angeforderten Tests in unserem Paket ist die Konsolenemulation. Die Möglichkeit, ein Spiel aus einem veralteten System auszuwählen und auszuführen, ist sehr attraktiv und hängt von den Bemühungen des Emulators ab: Ein viel leistungsfähigeres x86-System ist erforderlich, um eine andere alte Konsole als x86 genau emulieren zu können. Insbesondere, wenn der Code für diese Konsole unter Berücksichtigung einiger physischer Fehler und Hardwarefehler erstellt wurde.

Für unseren Test verwenden wir die beliebte Dolphin-Emulationssoftware und führen ein Computerprojekt durch, um festzustellen, wie genau unsere Prozessoren die Konsole emulieren können. In diesem Test dauert die Nintendo Wii-Emulation etwa 1050 Sekunden.



Die Leistung von Dolphin hängt normalerweise von den Single-Threaded-Spezifikationen ab, sodass Intel erneut die Nase vorn hat, obwohl es seltsam ist, dass der R7 2700X den letzten Platz belegt hat. Um das fehlerhafte Ergebnis zu beseitigen, muss ich diesen Test erneut ausführen. Bei den TR-Teilen der zweiten Generation ermöglicht die höhere Taktfrequenz des 2950X jedoch, den 2990WX um 20 Sekunden zu überholen.

DigiCortex 1.20: Molluskenhirnmodellierung


Dieser Benchmark wurde ursprünglich entwickelt, um die Aktivität von Neuronen und Synapsen im Gehirn zu modellieren und zu visualisieren. Die Software wird mit verschiedenen vordefinierten Modi geliefert. Wir haben einen kleinen Benchmark gewählt, der ein Gehirn mit 32.000 Neuronen / 1,8 Milliarden Synapsen simuliert, was einem Muschelgehirn entspricht.



Alle Ergebnisse über "Einheiten" sind für den Echtzeitbetrieb geeignet. Von den beiden Modi, dem für DRAM schwierigen Modus „ohne Synapsenstart“ und dem Modus „mit Synapsenstart“, in dem der Prozessor geladen ist, wählen wir den letzteren aus. Trotz unserer Wahl wird der Test immer noch von der DRAM-Geschwindigkeit beeinflusst.



Vier-Matrix-Prozessoren mit einer großen Anzahl von Kernen liegen mit großem Vorsprung vorn, obwohl der niederfrequente EPYC 7601 ihn auf die Liste der Verlierer setzt. Es scheint, dass die zusätzliche Latenz der Zwei-Modul-Struktur in 2990WX die Ergebnisse nicht zu sehr beeinträchtigt hat. Es besteht der Verdacht, dass zusätzliche Leistung vorhanden ist.

y-Cruncher v0.7.6: Für die Mikroarchitektur optimierte Berechnungen


Ich habe einmal von y-Cruncher als Werkzeug zur Berechnung verschiedener mathematischer Konstanten gehört. Aber nachdem ich mit seinem Entwickler Alex Yee (einem NWU-Forscher und Entwickler für Softwareoptimierung) gesprochen hatte, stellte ich fest, dass er die Software auf unglaubliche Weise optimierte, um die beste Leistung zu erzielen. Jede Simulation, die mehr als 20 Tage dauert, profitiert von einer Produktivitätssteigerung von 1%! Alex begann mit y-Cruncher als Projekt in der High School zu arbeiten, aber jetzt ist das Projekt relevant.

Für unseren Test führen wir y-Cruncher v0.7.6 durch alle möglichen optimierten Varianten von Binär-, Single-Threaded- und Multi-Threaded-Berechnungen, einschließlich für AVX-512 optimierter Binärdateien. Der Test besteht darin, 250 Millionen Zeichen der Zahl Pi zu berechnen. Wir verwenden Single-Threaded- und Multi-Threaded-Versionen dieses Tests.





Die Intel-Software ist gut für AVX2- und AVX512-Anweisungen optimiert, und wir verwenden diesen Befehlssatz in einem Single-Threaded-Test. Wenn wir jedoch neue Kerne und Speicherkanäle laden, sehen beide AMD-Prozessoren mit 32 Kernen unter Berücksichtigung der Kosten als würdige Konkurrenten von Core i9 aus.

Agisoft Photoscan 1.3.3: Konvertieren von 2D-Bildern in 3D-Modelle


Einer der ISVs, mit denen wir seit mehreren Jahren zusammenarbeiten, ist Agisoft. Die Kampagne entwickelt eine Software namens PhotoScan, die eine Reihe von 2D-Bildern in ein 3D-Modell konvertiert. Dies ist ein wichtiges Werkzeug bei der Entwicklung und Archivierung von Modellen und basiert auf einer Reihe von Single-Threaded- und Multi-Threaded-Algorithmen, um von einer Seite der Berechnung zur anderen zu gelangen.



In unserem Test nehmen wir Version 1.3.3 der Software mit einem großen Datensatz - Fotos 84 x 18 Megapixel. Wir führen einen Test mit einem ziemlich schnellen Satz von Algorithmen durch. Der Test ist immer noch anspruchsvoller als sein Vorfahr von 2017. Als Ergebnis geben wir die gesamte Prozessabschlusszeit an.



Der 2990WX bleibt zurück, da er über Kerne verfügt, die nicht schnell genug auf den Speicher zugreifen können. Zum Vergleich: Der EPYC 7601 mit doppeltem Speicherkanal läuft fast 500 Sekunden (20% +) schneller. Wenn der 2990WX zusätzliche Speicherkanäle empfängt, kann er diese Liste anführen.

Interessanterweise umgeht der TR 1950X den TR 2950X, der in allen Szenarien eine bessere Cache-Latenz und eine höhere Frequenz aufweist. Warum so ist ein Rätsel.

HEDT-Benchmarks: Rendering-Tests


In einem professionellen Umfeld ist das Rendern häufig ein Hauptanliegen für Prozessor-Workloads. Es wird in verschiedenen Formaten verwendet: vom 3D-Rendering bis zur Rasterung, bei Aufgaben wie Spielen oder Raytracing. Es nutzt die Fähigkeit von Software, Netze, Texturen, Kollisionen, Aliase und Physik (in Animationen) zu verwalten. Die meisten Renderer bieten Code für die CPU an, während einige GPUs verwenden und Umgebungen auswählen, die FPGAs oder spezialisierte ASICs verwenden. Für große Studios sind Prozessoren immer noch die Haupthardware.

Corona 1.3: Leistungswiedergabe


Der Corona-Test ist ein verbesserter Renderer, der für die Leistung von Software wie 3ds Max und Cinema 4D optimiert ist. Er rendert eine generierte Szene mit dem Standard Version 1.3. Normalerweise zeigt die Implementierung des GUI-Benchmarks den Prozess des Erstellens der Szene und ermöglicht es dem Benutzer, das Ergebnis als "Zeit bis zur Fertigstellung" zu sehen.



Wir haben den Entwickler kontaktiert, er hat uns eine Befehlszeilenversion des Tests gegeben, die eine direkte Ausgabe der Ergebnisse liefert. Anstelle der Zeit, die zum Erstellen der Szene benötigt wurde, geben wir die durchschnittliche Anzahl von Strahlen pro Sekunde über sechs Läufe an, da das Verhältnis von abgeschlossenen Aktionen zu Zeiteinheiten visuell leichter zu verstehen ist.



Also hat AMD unsere Grafik-Engine zerrissen. Weil wir das Corona-Testergebnis in Strahlen pro Sekunde mit insgesamt 12 Millionen Strahlen anzeigen, die acht Stellen an unseren Motor übertragen, der dann versucht, es als exponentielle Darstellung der Zahl (1,2 x 10 ^ 7) zu interpretieren, die in der Grafik nicht angezeigt werden kann . Wir mussten diesen Graphen in Millionen von Strahlen pro Sekunde konvertieren, damit der Motor funktioniert.

2990WX liegt mit 32 Kernen aufgrund seiner hohen Frequenz weit vor dem EPYC-Prozessor. EPYC und Core i9 liegen nahe beieinander, aber der TR2950X ist halb so teuer.

Blender 2.79b: 3D Creation Suite


Als High-End-Rendering-Tool ist Blender ein Open-Source-Produkt mit vielen Einstellungen und Konfigurationen und wird von vielen High-End-Animationsstudios auf der ganzen Welt verwendet. Die Organisation hat kürzlich eine Blender-Testsuite veröffentlicht. Ein neuer Test kann mehr als eine Stunde dauern. Um die Ergebnisse zu erhalten, führen wir einen der Untertests in diesem Paket über die Befehlszeile aus - die Standardszene "bmw27" im Modus "Nur CPU", wir messen die Abschlusszeit des Renderns.



Zusätzliche Kerne ermöglichen es dem 2990WX, EPYC und Core i9 zu übertreffen. 2990WX + 58% zusätzlicher Durchsatz im Vergleich zum Core i9.

LuxMark v3.1: LuxRender über verschiedene Codepfade


Es gibt viele verschiedene Möglichkeiten, mit Rendering-Daten umzugehen: CPU, GPU, Accelerator und andere. Darüber hinaus gibt es viele Frameworks und APIs. LuxMark - eine Referenz, die mit der LuxRender-Engine entwickelt wurde, bietet verschiedene Szenen und APIs.


entnommen aus der Linux-Version von LuxMark

In unserem Test führen wir eine einfache „Ball“ -Szene mit C ++ - und OpenCL-Code aus, jedoch im CPU-Modus. Diese Szene beginnt mit einem groben Rendering und verbessert langsam ihre Qualität innerhalb von zwei Minuten. Aufgenommen wird die durchschnittliche Rate der Anzahl der Kilostrahlen pro Sekunde.





Aus irgendeinem Grund schlagen Intel Skylake-X-Prozessoren beim Testen von OpenCL fehl. Im C ++ - Test wurde es durch zusätzliche Speichercontroller auf dem EPYC-Prozessor über TR2 und Core i9 übertragen. 2990WX und Core i9 sind fast gleich.

POV-Ray 3.7.1: Raytracing


Die Persistence of Vision Ray Tracing Engine ist ein weiteres bekanntes Benchmarking-Tool, das sich seit einiger Zeit im Ruhezustand befindet, bis AMD seine Zen-Prozessoren herausbrachte. Plötzlich begannen sowohl Intel als auch AMD, Code in den Hauptzweig eines Open-Source-Projekts zu verschieben. Für unseren Test verwenden wir den integrierten Test für alle Kerne, die über die Befehlszeile aufgerufen werden.



Dies ist ein weiterer Test, der Kerne und Frequenz liebt, was 2990WX hat. Der 2990WX kann den Test in fast 20 Sekunden abschließen. Vielleicht ist es Zeit für einen größeren eingebauten Test.

HEDT-Benchmarks: Office-Tests


Office-Testsuite - Eine Reihe von branchenüblichen Benchmarks, die sich auf Office-Workflows konzentrieren. Dies sind synthetische Tests. + Wir überprüfen die Compilerleistung in diesem Abschnitt. Für die Bewertung des gesamten Geräts sind diese Kriterien für die Benutzer wichtig.

PCMark 10: Industriestandard


Futuremark, jetzt bekannt als UL, entwickelt seit über zwei Jahrzehnten Tests, die Industriestandards sind. Der letzte Satz von Systemtests ist PCMark 10. Hier werden im Vergleich zu PCMark 8 mehrere Tests verbessert, OpenCL wird mehr Aufmerksamkeit geschenkt, insbesondere in Fällen wie Video-Streaming.

PCMark unterteilt seine Noten in rund 14 verschiedene Bereiche, darunter das Starten von Anwendungen, Webseiten, Tabellenkalkulationen, Fotobearbeitung, Rendering, Videokonferenzen und Physik. Wir veröffentlichen alle diese Daten in unserer Bench-Datenbank. Ein Schlüsselindikator für die aktuelle Überprüfung ist die Gesamtpunktzahl.



Einer der Nachteile von PCMark besteht darin, dass es alle Ergebnisse zu sammeln scheint und einen Durchschnittswert in alle Richtungen erzeugt. Interessanterweise bleiben Intel-Prozessoren zurück, der 2950X und der 2700X liegen an der Spitze.

Chromium-Kompilierung: Windows VC ++ - Kompilieren von Chrome 56


Eine große Anzahl von AnandTech-Lesern sind Softwareentwickler, die beobachten, wie die Hardware funktioniert. Das Kompilieren des Linux-Kernels ist „Standard“ für Prüfer, die häufig kompilieren. Unser Test ist jedoch etwas vielfältiger: Wir verwenden Windows-Anweisungen, um Chrome zu kompilieren, insbesondere den Chrome-Build, der am 56. März 2017 erstellt wurde. Die Anweisungen von Google zum Kompilieren unter Windows nach dem Herunterladen von 400.000 Dateien aus dem Repository sind ziemlich detailliert.

In unserem Test verwenden wir gemäß den Anweisungen von Google den MSVC-Compiler und Ninja, um die Kompilierung zu steuern. Wie zu erwarten, handelt es sich hierbei um einen Test mit variablem Multithreading und variablen Anforderungen an DRAM, die von schnelleren Caches profitieren. Die Testergebnisse sind die Zeit, die für das Kompilieren aufgewendet wurde, die wir in die Anzahl der Kompilierungen pro Tag umrechnen.



Dieser Test ist eine so schöne Kombination aus ST-, MT-Streams und begrenztem Speicher, dass es wirklich interessant ist, das Endergebnis zu sehen. Leider wurden für unser neues Paket die Ausgabedateien nicht richtig konfiguriert, sodass wir trotz Abschluss des Tests nur wenige Ergebnisse erhalten haben. Aber auch dies zeigt eine interessante Metrik: Der 2950X liegt zusammen mit dem Core i9 vor dem 2990WX, aber das EPYC-System streift die hinteren aufgrund seiner niedrigen Frequenzen.

3DMark Physics: Computerphysik in Spielen


Neben PCMark gibt es einen 3DMark-Benchmark, Futuremark (UL) - eine Reihe von Spieletests. Jeder Spieltest besteht aus einer oder zwei Szenen, die für die GPU schwer sind, sowie einem physischen Test, je nachdem, wann der Test geschrieben wurde und auf welche Plattform er abzielt. Die Hauptthemen mit zunehmendem Schwierigkeitsgrad sind Eissturm, Wolkentor, Himmels-Taucher, Feuerschlag und Zeitspion.

Einige der Untertests bieten andere Optionen, z. B. Ice Storm Unlimited oder Fire Strike. Ice Storm Unlimited wurde für mobile Plattformen mit Off-Screen-Rendering entwickelt. Fire Strike Ultra wurde für leistungsstarke 4K-Systeme mit vielen zusätzlichen Funktionen entwickelt. Es ist erwähnenswert, dass Time Spy derzeit über den AVX-512-Modus verfügt (den wir in Zukunft verwenden können).

Für unsere Tests senden wir die Ergebnisse jedes physischen Tests an Bench, aber für die Überprüfung nehmen wir die Ergebnisse der anspruchsvollsten Szenen: Ice Storm Unlimited, Cloud Gate, Sky Diver, Fire Strike Ultra und Time Spy,











Bei Spieletests fällt nicht so auf, dass das Vorhandensein großer Prozessoren mit vielen Kernen die Leistung nicht besonders verbessert. Die Spielphysik bevorzugt eindeutig die Speicherbandbreite. Wir wissen, dass Time Spy nicht für die Skalierung um mehr als 10 Kerne ausgelegt ist, und wir sehen, dass der 10-Kern-Prozessor an erster Stelle steht. , , .

GeekBench4:


, Mac, GeekBench 4 — , . , , , , n-, , HTML.

, . - , ( ).
(Crypto, Integer, Floating Point, Memory) , .





HEDT Benchmarks: Encoding Tests


, , . , , , , , , , . , , .

Handbrake 1.1.0:


, Handbrake — , , , . . , AVX-512 OpenCL . , , CPU, .

Handbrake , - Logitech C920 1080p60 ( , ). . :

  • 720p60 at 6000 kbps constant bit rate, fast setting, high profile
  • 1080p60 at 3500 kbps constant bit rate, faster setting, main profile
  • 1080p60 HEVC at 3500 kbps variable bit rate, fast setting, main profile








, . Core i9, AVX2, . AMD, , , 1950X 2700X . , 2950X , , Core i9, , 1950X. 2990WX .

7-zip v1805:


/ 7-zip , . , . .

, : . , , Windows Scheduler . , .







, . , , 2990WX, , , AMD. Phoronix, Linux.

, . 32- AMD , 16- 18- .

, , . .

WinRAR 5.60b3:


, WinRAR. . , right-click Windows . , , 30 60- 2000 -, .

WinRAR , , 10 , .



, . R7 2700X AMD, — 10- Intel. , 8700K, , . AMD , 32- .

AES:


, , . Windows BitLocker Microsoft ( ). AES discontinued TrueCrypt , .

, — AES / , . AES, , AVX-512.



, . , , 2990WX . EPYC 7601 , 1950X. 2950X, , , 18- Core i9 Intel.

HEDT Benchmarks: -


low-end small form factor , -, , . - , , - . , ( ) . , - . - , , , .

, .

WebXPRT 3: - ,


, XPRT, Principled Technologies, -, , , «3». ( , ) : , , , , HTML5, , .

, . , .



WebXPRT 2015: HTML5 Javascript Web UX


WebXPRT — 2015 , - . - , , - . - . , , , . — , . « » .

WebXPRT3, , . , .



Speedometer 2: Javascript Frameworks


- — Speedometer 2, javascript, : , . , , , -.

«rpm», . .



Google Octane 2.0: Core Web Compute


- , — Octane Google. 2.0 , , , , , — .

. .



Mozilla Kraken 1.1: Core Web Compute


Noch älter als Octane, hier ist Kraken, diesmal von Mozilla entwickelt. Dies ist ein alter Test, der eine relativ einheitliche Rechenmechanik wie Audioverarbeitung oder Bildfilterung ausführt. Der Kraken-Test ist stark optimiert und führt je nach Version des Browsers zu einem sehr instabilen Ergebnis.

Der Hauptbenchmark durchläuft jeden der Untertests zehnmal und gibt die durchschnittliche Abschlusszeit für jeden Zyklus in Millisekunden zurück. Wir führen den vollständigen Benchmark viermal durch und messen das durchschnittliche Ergebnis.



3DPM v1: Eine Variante von 3DPM v2.1 mit nativem Code


Der erste "geerbte" Test im Paket ist die erste Version unseres 3DPM-Tests. Dies ist die endgültige native Version des Codes, als ob er von einem Wissenschaftler geschrieben worden wäre, ohne zu wissen, wie Computerhardware, Compiler oder Optimierung funktionieren (wie zu Beginn). Der Test stellt eine große Menge wissenschaftlicher Modellierung in freier Wildbahn dar, bei der das Erhalten einer Antwort wichtiger ist als die Geschwindigkeit des Rechnens.

In dieser Version bestand die einzige echte Optimierung in den Compiler-Flags (-O2, -fp: fast): Kompilierung im Release-Modus und Aktivierung von OpenMP in den Hauptrechnungszyklen. Schleifen wurden nicht für Funktionen dimensioniert, und die schwerwiegendste Verlangsamung ist die falsche Freigabe im Cache. Der Code weist lange Ketten von Abhängigkeiten auf, die auf der Erzeugung von Zufallszahlen basieren, was bei einigen Computer-Mikroarchitekturen zu einer Leistungsminderung führt.





x264 HD 3.0: Legacy-Transcodierungstest


Dieser Transcodierungstest ist sehr alt und wurde von Anandtech in den Tagen der Pentium 4- und Athlon II-Prozessoren verwendet. Darin wird standardisiertes 720p-Video mit doppelter Konvertierung codiert, und der Benchmark zeigt Bilder pro Sekunde jedes Durchgangs. Der Test ist Single-Threaded, und in einigen Architekturen stoßen wir auf IPC-Einschränkungen - Anweisungen pro Takt.





Vielen Dank für Ihren Aufenthalt bei uns. Gefällt dir unser Artikel? Möchten Sie weitere interessante Materialien sehen? Unterstützen Sie uns, indem Sie eine Bestellung aufgeben oder Ihren Freunden empfehlen, einen Rabatt von 30% für Habr-Benutzer auf ein einzigartiges Analogon von Einstiegsservern, das wir für Sie erfunden haben: Die ganze Wahrheit über VPS (KVM) E5-2650 v4 (6 Kerne) 10 GB DDR4 240 GB SSD 1 Gbit / s von $ 20 oder wie teilt man den Server? (Optionen sind mit RAID1 und RAID10, bis zu 24 Kernen und bis zu 40 GB DDR4 verfügbar).

3 Monate kostenlos bei Bezahlung eines neuen Dell R630 für einen Zeitraum von sechs Monaten - 2 x Intel Deca-Core Xeon E5-2630 v4 / 128 GB DDR4 / 4 x 1 TB Festplatte oder 2 x 240 GB SSD / 1 Gbit / s 10 TB - ab 99,33 USD pro Monat , nur bis Ende August, Bestellung kann hier sein .

Dell R730xd 2 mal günstiger? Nur wir haben 2 x Intel Dodeca-Core Xeon E5-2650v4 128 GB DDR4 6 x 480 GB SSD 1 Gbit / s 100 TV von 249 US-Dollar in den Niederlanden und den USA! Lesen Sie mehr über den Aufbau eines Infrastrukturgebäudes. Klasse mit Dell R730xd E5-2650 v4 Servern für 9.000 Euro für einen Cent?

Source: https://habr.com/ru/post/de421521/


All Articles