Monster nach den Ferien: AMD Threadripper 2990WX 32-Core und 2950X 16-Core (Teil 4)

Teil 1Teil 2Teil 3Teil 4 → Teil 5

Stromverbrauch, TDP und Prime95 gegen POV-Ray


Für die meisten von uns beträgt die Prozessorleistung auf Laptops etwa 15 Watt und auf Desktop-Systemen 65-95 Watt. Hochleistungs-Desktop-Prozessoren waren schon immer unersättlicher, und daher ist eine TDP von 130 W und 140 W ein normaler Indikator für sie. Als AMD einen 220-W-Prozessor auf der alten Vishera-Plattform herausbrachte, nachdem die Bulldozer-Kerne auf 5,0 GHz übertaktet worden waren, wurde darüber nachgedacht, ob AMD völlig verrückt war: Viele Motherboards waren mit AMD-Sockeln kompatibel, aber für die Verwendung von TDP 220 W und höher musste eine Reihe neuer Motherboards veröffentlichen. Heute hat der leistungsstärkste Intel-Prozessor auf dem Markt eine offizielle TDP von 205 Watt, aber AMD hat die Messlatte noch weiter auf 250 Watt angehoben.



Zwei neue WX-Prozessoren, der 32-Kern 2990WX und der 2970WX, haben eine Leistung von 250 Watt. In beiden Prozessoren sind alle vier Silikonmatrizen aktiv, es gibt sechs aktive Infinity Fabric-Linien. Diese Prozessoren sind so konzipiert, dass sie ein neues Leistungsniveau erreichen, während AMD Dias mit einer Turbofrequenz auf allen 3,6-GHz-Kernen demonstriert. Die beiden Prozessoren, die die X-Serie ersetzten, haben eine Leistung von 180 Watt sowie die Prozessoren des Threadrippers der ersten Generation.

Es sind jedoch nicht alle TDPs gleich. Die Art und Weise, wie Intel und AMD die TDP messen, hat sich im Laufe der Jahre geändert und ist jetzt weit von der Realität entfernt. Lass mich erklären.

TDP ist so ein Witz


Der TDP-Wert oder die thermische Auslegungsleistung ist kein Indikator für den Energieverbrauch. Technisch gesehen ist dies ein Indikator für die Leistung des Kühlers, was bedeutet, dass der Kühler den gleichen TDP-Wert haben muss, um seine Arbeit zu bewältigen. Der tatsächliche Energieverbrauch sollte etwas höher sein - die Wärmeübertragung vom Prozessor zum Sockel und vom Sockel zum Motherboard trägt zur Kühlung bei, wird jedoch in der TDP-Anzeige nicht berücksichtigt. Oft werden die TDP-Wärmeableitungsrate und der Prozessorstromverbrauch als eins wahrgenommen, da ihre Unterschiede unbedeutend sind.

Beginnen wir die Berechnung mit AMD-Prozessoren. Die AMD TDP-Berechnung basiert auf einer einfachen Formel:

TDP = (Betriebstemperatur in Celsius - Leerlauftemperatur in Celsius) / Wärmeleistung des Kühlers

Wenn AMD die TDP seines Ryzen 7 2700X-Prozessors mit einer Auslastungstemperatur von etwa 62 ° C, einer Leerlauftemperatur von 42 ° C und einem Kühler mit einer Wärmeleistung von 0,189 C pro Watt (Wraith Max) bestimmt, erhalten wir einen Wert von etwa 105 W.

Die AMD-Formel weist zwei Probleme gleichzeitig auf: Erstens kann die Temperatur des geladenen Prozessors mithilfe eines Kühlers oder eines externen Luftstroms gesteuert werden, und zweitens wird das Ergebnis stark von der Wärmeleistung des Kühlers beeinflusst. Mit einem großen Flüssigkeitskühler mit einer höheren Wärmeleistung, beispielsweise 0,400 C pro Watt, ist die Nenn-TDP eines Prozessors niedriger: Beim Ryzen 7 2700X beträgt die TDP nur 50 Watt. Die TDP-Bewertung und der Stromverbrauch sind nicht gleich und ihr Verhältnis kann sich in jede Richtung ändern. Nur AMD sollte für Vergleiche einen anderen Kühler wählen.

Die TDP-Version von Intel ist etwas komplizierter, aber macht dies Sinn ... Intel bestimmt die TDP seiner Prozessoren nur für die Grundfrequenz, wobei die Turbofrequenzen ignoriert werden. Wenn Intel einen Prozessor mit 95 W TDP, einer Grundfrequenz von 3,2 GHz, einem Single-Core-Turbo von 4,7 GHz und einem vollen Turbo von 4,2 GHz herausbringt, liegt der garantierte Stromverbrauch von 95 W bei einer Grundfrequenz von 3,2 GHz. Dies bedeutet, dass auf jedem Motherboard, das einen Turbo verwendet (dh im Allgemeinen auf jedem), der Prozessor unter jeder Last mehr Strom verbraucht als sein offizielles TDP.

Und das ist sehr nervig. Intels Marketing-Schritt besteht darin, für seine Single-Core-Turboprozessoren zu werben und keine niedrigeren Werte für den All-Core-Turbo zu veröffentlichen. Uns wird gesagt, dass dies „unternehmensinterne Informationen“ sind, die unter die Geheimhaltungsvereinbarung fallen. In jedem Fall verbraucht jeder Prozessor, dessen Turbofrequenz „All-Core“ über der Basisfrequenz liegt, über der angegebenen TDP.

Ein gutes Beispiel ist der Core i7-8700 und sein 65 W TDP. Es hat eine Grundfrequenz von 3,2 GHz, einen Single-Core-Turbo von 4,6 GHz und einen vollen Turbo von 4,3 GHz. Wenn wir mehr Ströme laden und den Energieverbrauch auf 65 W begrenzen, erhalten wir Folgendes:



Lohnt es sich, die TDP-Werte ernst zu nehmen? Behandle sie mit Humor.

Stromverbrauch


Es gibt verschiedene Möglichkeiten, den Stromverbrauch des Prozessors zu messen. Am einfachsten ist es, ein Messgerät zu verwenden, mit dem Sie den Stromverbrauch des gesamten Systems ermitteln können, einschließlich der Verluste im Stromversorgungssystem des Motherboards. Eine komplizierte Methode besteht darin, die erforderlichen Werkzeuge zum Messen des Stroms über einen 12-Volt-Anschluss an die Platine anzuschließen und die Prozessorspannung mithilfe der Übertaktungseinstellungen einiger Motherboards zu messen. Die dritte Möglichkeit besteht darin, Hardwareregister mit geeigneter Software zu lesen.

Das Lesen von Registern ist ein zweischneidiges Schwert. Erstens verlassen Sie sich auf interne Dimensionen, die häufig eine ziemlich große Fehlerquote aufweisen. Zweitens verlassen Sie sich darauf, dass der Prozessorhersteller echte Daten über Ihren Prozessor meldet. Dies ist nicht immer sinnvoll (!). Auf der positiven Seite: Es ist möglich, mehr Informationen vom Prozessor zu erhalten, z. B. die Analyse der Leistung für jeden Kern, die DRAM-Leistung, die E / A / Interconnect-Leistung und die integrierte Grafikleistung sowie ein allgemeines Verständnis der Energieverteilung.

Hardwareregister - Auf diese Weise teilt sich das System Daten über die Arbeit mit: Wie viel Energie verbraucht es, wie sollte es Spannung / Frequenz in Abhängigkeit von Strom, Leistung oder Wärmeleistung regeln. Eine weitere positive Seite ist die einfache Verwendung solcher Daten in Testskripten.

Energietests sind oft umstritten. In der Regel wird ein spezieller Virus verwendet, der gleichzeitig jeden Bereich des Prozessors mit maximaler Leistung laden kann. "Power Virus" wird verwendet, um die Stabilität der Beschleunigung zu überprüfen, hat jedoch einen Nachteil: Bei täglicher Belastung spiegeln die Ergebnisse in der Regel nicht den tatsächlichen Stromverbrauch wider. Dies ist die feine Linie zwischen einem echten Test und einem synthetischen Test, mit dem jedes Joule Energie durch einen Chip getrieben werden soll. Software wie LINPACK wird häufig als effektiver Leistungstest verwendet. Interne Tools von Intel und AMD können dazu beitragen, den Chip noch härter zu laden.

Prime95 ist ein beliebtes Tool, es ist perfekt für fast jeden Kern optimiert und steuert die Stromversorgung. Die Arbeitsbelastung ist halbsynthetisch und basiert auf der Berechnung von Primzahlen. Der Stresstest ignoriert jedoch die Ergebnisse und konzentriert sich nur auf den Energieverbrauch. Während dieses Tests haben wir ein wenig mit POV-Ray als Leistungstest gespielt: Es bietet einen noch höheren Stromverbrauch als Prime95 und verwendet auch eine sehr beliebte Raytracing-Last. Um eine Bewertung für mich zu schreiben, entscheide ich, welches Tool am besten für Energieverbrauchstests verwendet wird. Prime95 hat Probleme beim Arbeiten mit einer großen Anzahl von Kernen (manchmal ist es schwierig, ein Testergebnis zu erhalten, wenn das Limit von 25 Threads überschritten wird). Um POV-Ray zum Laufen zu bringen, müssen wir die Lademethoden anpassen, da es eher auf die Überprüfung der Kernel-Last als auf die Überprüfung abzielt Streams. Wir erwarten jedoch Ergebnisse in Abhängigkeit von der Anzahl der Threads. Es wird angezeigt, welche Software in jeder Testphase verwendet wurde (wir konnten unsere Version von POV-Ray erst in der Mitte des Tests vorbereiten, daher wurden die meisten Daten von Prime95 empfangen).

Gesamtstromverbrauch


Als erste Reihe von Ergebnissen möchte ich den Gesamtstromverbrauch des Prozessors darstellen, gemessen in verschiedenen Situationen. Im Leerlauf:



Dann laden wir mit Prime95 nur einen Kern mit zwei Threads. Unsere Testtechnik bewirkt, dass beide Threads auf demselben Kern arbeiten, falls die Prozessorkerne mehrere Threads verarbeiten können. Benutzer, die sich auf Single-Tasking-Lasten konzentrieren, werden den Energieverbrauch in diesem Bereich sehen. Dies gilt auch für Systeme, in denen Windows ständig im Hintergrund ist.



Der dritte Test ist ein System, das mit Prime95 mit vier Threads geladen wurde. Dies ist genau der Lastbereich, den die meisten Menschen täglich auf ihren Systemen verwenden: Mehrere Browser-Registerkarten, einige Fenster, mehrere funktionierende Softwarepakete sind geöffnet, ein oder mehrere Spiele werden ausgeführt.



Wenn Sie die Prozessorlast auf zwölf Threads (mit Prime95) erhöhen, wechseln wir zu Benutzern, die große Workloads mit mehreren Aufgaben verwenden. Dies sind Gamer - Streamer oder Benutzer, die mit dem Rendern beginnen, während sie parallel zu anderen Aufgaben arbeiten.



Die endgültige Grafik zeigt den Gesamtstromverbrauch. Für diesen Test führen wir die maximale Anzahl von Threads (Prime95) aus. In Zukunft planen wir, POV-Ray für diesen Test zu verwenden, da es sich bei einer hohen Anzahl von Threads viel besser zeigt. Der einzige Nachteil dieses Tests ist, dass der übertaktete 2990WX den POV-Ray-Test in weniger als 20 Sekunden abschließen kann.



Individueller Kernstromverbrauch


Bevor ich den POV-Ray-Stromverbrauchstest erstellte, startete ich beide neuen Threadripper-Prozessoren beim Prime95-Test in der Option All-Thread und erhielt den Stromverbrauch jedes Kerns bei jeder Last.



Beim Laden des ersten Kerns sehen wir, dass sein Stromverbrauch ~ 23 Watt beträgt. Dies ist viel im Vergleich zu Zeppelinkernen. Dies gilt auch, wenn zwei Kerne geladen sind. Beim Laden von drei Kernen beobachten wir einen Rückgang des Verbrauchs auf 18,8 Watt pro Kern. Angesichts der Tatsache, dass dieser Chip vier CCXs hat, stellt sich die Frage, ob dieses Ergebnis mit der Tatsache zusammenhängt, dass die Streams in dieselbe CCX geladen werden (was anscheinend passieren sollte) und wir die CCX-Leistungsgrenze erreichen. Beim Laden von vier Kernen beträgt der Verbrauch jedes Kerns etwa 17,4 Watt.

Wenn wir die Anzahl der geladenen Kerne auf fünf erhöhen, stellen wir fest, dass der fünfte Kern bei 18,2 Watt und die restlichen vier bei 16,8 Watt arbeitet. Das Ergebnis zeigt an, dass sich dieser fünfte Kern auf dem neuen CCX befindet. Beim Übergang von acht auf neun Kerne sehen wir dasselbe: Der neunte Kern verbraucht 17,5 Watt Leistung, während die restlichen acht ungefähr 14,3 Watt betragen. Am Ende sinkt die Stromverteilung auf 7-9 Watt pro Kern, wenn wir alle 16 Kerne verwenden.

Der Gesamtstromverbrauch des Prozessors beträgt ~ 178 W, ca. 180 W TDP bei einem Verbrauch von ~ 135 W auf den Kernen, und der Rest entfällt auf Uncore (Extra-Core-Hardware - Infinity Fabric, IO, IMC).

Was die Testergebnisse des 2990WX betrifft, sieht das resultierende Bild sehr, sehr seltsam aus.



Die Stromverbrauchsdaten für bis zu 15 Kerne entsprechen größtenteils in etwa denen des 2950X. Mit zunehmenden Flüssen wird jedoch deutlich, dass die erste Matrixschicht eindeutig vorzuziehen ist. Wenn zusätzliche Streams geladen und eine zweite Matrix angeschlossen werden, ist die Leistung der Kerne viel geringer - bis zu 2,4 W pro Kern. Die erste Zeppelinschicht bei Volllast verbraucht etwa 6,6 Watt pro Kern, der Rest des Prozessorkerns beträgt etwa 2,4 Watt. Es passiert etwas, wodurch die erste Matrix in der Ernährung Vorrang vor den anderen hat. Es ist erwähnenswert, dass der Stromverbrauch des Chips etwa 180 Watt und nicht 250 Watt beträgt, wie die TDP zeigt.

Um diese Zeit haben wir ein POV-Ray-Leistungstestskript fertiggestellt. Ich habe es auf 2990WX getestet, ich präsentiere die Ergebnisse. Und jetzt sind sie viel höher als erwartet:



Überraschenderweise wurde die Last mit zunehmender Anzahl von Fäden sehr gleichmäßig verteilt. Wir konnten sogar alle 250 W TDP mit Standardeinstellungen und einem guten Kühler voll ausnutzen. Nachdem wir die Prozesse vollständig geladen hatten, sahen wir den Verbrauch von 193 Watt durch Kerne, 55 Watt durch andere Komponenten. Unter keinen Umständen beobachteten wir ein "Absacken" der aktiven Kerne unter 3 Watt. Wenn alle Kerne geladen waren, verbrauchte jeder Kern seine „komfortablen“ 6 Watt. Wir haben eine Prozessorleistung von 240 bis 250 W erreicht, während wir ungefähr 40 Threads geladen haben. Mit einem weiteren Anstieg der Ströme verursachte der hinzugefügte Kern eine Umverteilung der Energie.

Zwei Ideen kamen mir in den Sinn. Der erste war leicht zu überprüfen: Vielleicht steckte das BIOS nach der Installation des 2950X bei 180 W fest? Ich habe es noch einmal überprüft und bevor ich die Tests mit 2990WX durchführte, habe ich das zuvor getestete 1920X getestet. Ein vollständiger BIOS-Reset hatte keine Auswirkungen auf die Ergebnisse. Ich kann argumentieren, dass dies keine BIOS-Leistungsbeschränkung ist. Die zweite Idee ist, die Frequenzen zu überprüfen. Nachdem wir nur einen Referenzpunkt (40 geladene Streams) überprüft hatten, fanden wir eine kleine Streuung, jedoch nur in Bezug auf die Leistung.

Während des Prime95-Tests lief die erste Matrix mit 7 Watt pro Kern mit einer Frequenz von 3575 MHz. Der zweite Siliziumkristall ergab ein Ergebnis von 3 W pro Kern bei einer Frequenz von 3525 MHz. Andere (Leerlauf-) Kerne arbeiteten mit einer Frequenz von 1775 MHz oder 2000 MHz und verbrauchten Milliwatt.

Während des POV-Ray-Tests verbrauchte jeder aktive Kern etwa 9,1 Watt pro Kern und hatte eine Frequenz von 3575 MHz. Alle Leerlaufkerne hatten eine Frequenz von 2000 MHz (drei weitere bei einer Frequenz von 1775 MHz) und verbrauchten Milliwatt pro Kern.

Zusätzlich zu den Daten zum Kernverbrauch sahen die Chips in der Häufigkeit im Allgemeinen gleich aus. Die Ergebnisse des POV-Ray-Tests sind etwas höher, was einen höheren Gesamtenergieverbrauch mit POV-Ray bedeutet.

Letztendlich kommt es darauf an, dass der Prime95-Leistungstest nach Überschreiten des Schwellenwerts von etwa 20 Kernen oder bei Mikroschaltungen mit mehreren Kristallen nicht wie erwartet funktioniert. In Zukunft werden wir unseren POV-Ray-Test verwenden, mit dem moderne Multi-Core-Prozessoren besser genutzt werden können.

Kern- und Nicht-Kernverbrauch


Zurück zu dem Moment, in dem wir über die Infinity Fabric-Frequenz gesprochen haben, können wir das Stromverbrauchsverhältnis als Teil des POV-Ray-Tests für 2990WX sehen.



Obwohl wir einige Abweichungen vom vorherigen Ergebnis beobachten, entsprechen die Daten (zusätzlich zum Spitzenverbrauch) im Allgemeinen unserem Uncore-Leistungstest mit Prime95. Infinity Fabric zeigt immer noch 55-60 Watt Leistung. Infolgedessen beginnt der nichtnukleare Verbrauch als Prozentsatz der Gesamtkapazität bei 75% mit zwei Threads und erreicht 22%, wenn 40 Threads gestartet werden.

Übertakten: 4,0 GHz für 500 W.


Wer hat gesagt, dass ein 250-W-Prozessor nicht übertaktet werden sollte? AMD ist stolz darauf, Prozessoren herzustellen, von denen jeder mit einem entsperrten Multiplikator verkauft wird, und verwendet auch gelötetes Material als thermische Schnittstelle.

Es ist Zeit zu bereuen. Wir hatten nicht genug Zeit zum Übertakten. Dieser Prozessor hat eine Grundfrequenz von 3,0 GHz, Turbo 4,2 GHz. In einem klimatisierten Raum mit einem 500-W-Enermax-Liqtech-Kühler, in dem alle Kerne unter POV-Ray geladen wurden, arbeitete jeder Kern mit einer Frequenz von 3150 MHz, was sehr weit von der Turbofrequenz entfernt ist. Das erste, was ich tat, war, einen Full-Core-Turbo auf 4,2 GHz einzustellen, genau wie einen Single-Core. Dies ergab eine gute Steigerung.

Trotzdem überraschte mich die nächste Stufe meiner Übertaktungsexperimente. Ich habe den CPU-Multiplikator im BIOS für 4,0 GHz auf allen Kernen ständig auf 40-x eingestellt. Ich habe die Spannung nicht reguliert und den Auto-Modus verlassen. Dazu musste ich sogar das Motherboard ASUS verlassen. Hören Sie, der Prozessor hat unsere 4,0-GHz-Testsuite fehlerfrei abgeschlossen. Ich war geschockt.

Alles, was ich für diese Übertaktung getan habe, war, von "Auto" auf "40" zu wechseln. POV-Ray-Tests, die mehr Strom verbrauchen, waren erfolgreich. Jeder Test aus dem Set hat funktioniert. Obwohl die Wärmeleistung hoch war (bei maximaler Belastung), konnte der Kühler dies problemlos bewältigen.



Bei Volllast im POV-Ray-Test zeigte der Prozessor einen Verbrauch von 500 Watt, der Kühler ist für 500 Watt ausgelegt. Irgendwann sahen wir einen Sprung auf 511 W, wobei 440 W für Kerne (oder 13,8 W pro Kern) und 63 W für Uncore (IF, IO, IMC) zugewiesen wurden, was 12,5% des Gesamtverbrauchs entspricht Energie. Wenn Sie möchten, dass der Ladeluftkühler weniger Strom verbraucht, beschleunigen Sie den Prozentsatz!

Sie stellten die Frequenz auf 4,1 GHz ein und es schien auch zu funktionieren, bis wir das System vollständig geladen hatten. Wie oben erwähnt, war es bei 4,2 GHz nicht möglich, selbst bei einem Spannungsanstieg ein Arbeitsergebnis zu erzielen. Für diejenigen, die sich mit Übertakten beschäftigen möchten, kann die Flüssigkeitskühlung eine Lösung sein.

Leistung bei 4,0 GHz


Wenn also die Frequenz aller Kerne 3125 MHz beträgt, sollte das Übertakten auf 4000 MHz zu einer Leistungssteigerung von 28 Prozent führen, oder? Hier sind die Ergebnisse einiger wichtiger Tests unseres Pakets.













Die Beschleunigung 2990WX ergab gemischte Ergebnisse. In einigen Tests hat es sehr gut funktioniert, in anderen liegt es aufgrund seiner Dual-Modul-Architektur immer noch hinter dem 2950X zurück.

Das Übertakten ergab in diesen Tests wirklich gute Ergebnisse: Blender zeigt eine Steigerung des Durchsatzes um 19%, POV-Ray - um 19%, 3DPM - um 19%. In anderen Tests ist es 2950X (Photoscan) unterlegen, immer noch dahinter (Anwendungsladen, WinRAR).

Durch Übertakten werden nicht alle Leistungsprobleme des 2990WX behoben, aber der Prozessor wird davon sicherlich profitieren.

Vielen Dank für Ihren Aufenthalt bei uns. Gefällt dir unser Artikel? Möchten Sie weitere interessante Materialien sehen? Unterstützen Sie uns, indem Sie eine Bestellung aufgeben oder Ihren Freunden empfehlen, einen Rabatt von 30% für Habr-Benutzer auf ein einzigartiges Analogon von Einstiegsservern, das wir für Sie erfunden haben: Die ganze Wahrheit über VPS (KVM) E5-2650 v4 (6 Kerne) 10 GB DDR4 240 GB SSD 1 Gbit / s von $ 20 oder wie teilt man den Server? (Optionen sind mit RAID1 und RAID10, bis zu 24 Kernen und bis zu 40 GB DDR4 verfügbar).

3 Monate kostenlos bei Bezahlung eines neuen Dell R630 für einen Zeitraum von sechs Monaten - 2 x Intel Deca-Core Xeon E5-2630 v4 / 128 GB DDR4 / 4 x 1 TB Festplatte oder 2 x 240 GB SSD / 1 Gbit / s 10 TB - ab 99,33 USD pro Monat , nur bis Ende August, Bestellung kann hier sein .

Dell R730xd 2 mal günstiger? Nur wir haben 2 x Intel Dodeca-Core Xeon E5-2650v4 128 GB DDR4 6 x 480 GB SSD 1 Gbit / s 100 TV von 249 US-Dollar in den Niederlanden und den USA! Lesen Sie mehr über den Aufbau eines Infrastrukturgebäudes. Klasse mit Dell R730xd E5-2650 v4 Servern für 9.000 Euro für einen Cent?

Source: https://habr.com/ru/post/de422207/


All Articles