Teil 1 →
Teil 2 →
Teil 3 →
Teil 4 → Teil 5
Thermische Vergleiche und XFR2: Denken Sie daran, den Kunststoff vom Kühler zu entfernen!
Jede Maschine verfolgt Ziele mit unterschiedlichen Prioritäten: Leistung, Verbrauch, Geräuschentwicklung, Wärmeleistung oder Kosten. Es ist sehr schwierig, alle gleichzeitig zu erreichen. Daher ist es eine gute Idee, zwei oder drei Ziele zu wählen. Wie in ALLEN FÜNF RICHTUNGEN zu verlieren? .. Willkommen in meiner Welt. Die Welt, in der ich den 32-Kern AMD Ryzen Threadripper 2990WX zum ersten Mal getestet habe und dabei vergessen habe, den Kunststoff von meinem Flüssigkeitskühler zu entfernen.
Bauen Sie das System nach einem langen Flug nicht wieder zusammen.Fast alle neuen Kühler, Luft-, Flüssigkeits- und Wassereinheiten werden mit Dichtungen, Schaum, Schrauben, Lüftern und einer Anleitung geliefert. Je nach Hersteller und Art der Verpackung wird der Boden des Prozessorkühlers auf zwei Arten vorbereitet:
- Vorab aufgetragenes Wärmeleitpaste
- Kleines selbstklebendes Plastikband zum Schutz des Polierens während des Transports
Treffen Sie in unserem Test den massiven Wraith Ripper-Luftkühler, der von Cooler Master hergestellt, aber von AMD als Basiskühler für die neuen Threadripper 2-Prozessoren beworben wird. Thermisches Fett wird dicht auf die gesamte Basis aufgetragen. Als ich versuchte, Fotos zu machen, habe ich alles durcheinander gebracht.

Ebenfalls in unserem Test enthalten ist der Enermax Liqtech TR4 Flüssigkeitskühler mit einem Wärmeleitpastenrohr. Der untere Teil der Einheit, der mit der CPU in Kontakt stand, wurde mit einem selbstklebenden Plastikschutzband abgedeckt.
TechTeamGB Twitter BeispielAlso die Zeit der Beichte. Unser Umfragekit kam einen Tag früher als ich an. Die Aktion fand während meiner Reise mit dem Vereinigten Königreich in San Francisco auf dem Flash Memory Summit und dem Intel Datacenter Summit statt. In meinen Koffern brachte ich ein X399-Motherboard (ASUS ROG Zenith), drei X399-Chips (2990WX, 2950X, 1950X), ein X299-Motherboard (ASRock X299 OC Formula), mehrere Skylake-X-Chips, ein Corsair AX860i-Netzteil, RX 460, eine Maus , Tastatur, Kabel - einfach Komponenten, um zwei Systeme zusammenzubauen und den Monitor in einem Hotelzimmer zum Testen zu verwenden. Nach einem 11-stündigen Direktflug, zwei Stunden Passkontrolle und mehr als einer Stunde mit einem Uber-Taxi zu meinem Hotel habe ich ein System mit 2990WX zusammengestellt.
Ich habe den Kunststoff am Enermax-Kühler nicht entfernt. Ich habe das nicht bemerkt. Ich habe sogar Thermofett auf den Prozessor aufgetragen und nichts vermutet, auch wenn ich die Schrauben festgezogen habe.
Ich habe das System auf die maximal unterstützte Speicherfrequenz eingestellt, Windows installiert, Sicherheitsupdates installiert, Tests installiert und das System die ganze Nacht im Schlaf gestartet. Ich ahnte nicht einmal, dass der Kunststoff befestigt blieb. Am Morgen hat die Testsuite die Arbeit bereits beendet. Nachdem ich einige zusätzliche Tests abgeschlossen hatte, z. B. das Messen der Latenz der Grundfrequenz, ersetzte ich den Prozessor durch den 2950X. Zu dieser Zeit führte ich einen ausdrucksstarken Facespalm durch.

Als ich sah, dass das Thermofett auf dem Prozessor und dem Kunststoff verschmiert war, wurde mir klar, dass ich alles neu starten musste. Nachdem ich den Kunststoff entfernt hatte, setzte ich den Prozessor ein und richtete das System ein, diesmal mit dem besten thermischen Profil.
Die Wärmeleistung ist wichtig.
Das Ziel eines jeden Systems ist es, es für einen stabilen Betrieb im richtigen „Temperaturfenster“ zu halten: Die meisten Prozessoren sind so ausgelegt, dass sie bei Temperaturen bis zu 105 ° C ordnungsgemäß funktionieren. Danach werden sie ausgeschaltet, um schädliche thermische Schäden zu vermeiden. Wenn ein Prozessor Elektronen in Ketten treibt und alle möglichen notwendigen Dinge tut, verbraucht er Energie. Diese Energie geht als Wärme verloren, die vom Chip in zwei Hauptrichtungen abgeleitet wird: Sockel und Kühler.

AMD Threadripper-Prozessoren haben ein thermisches Grenzflächenmaterial zwischen Siliziummatrizen und einem Kühlkörper - Indium-Zinn-Löten. Für die direkte Wärmeübertragung wird eine direkte Metall-Metall-Bindung benötigt. Moderne Intel-Prozessoren verwenden anstelle dieser Schicht Silikon-Wärmeleitpaste, die die Wärme schlechter überträgt, aber einen wichtigen Vorteil hat: Sie kann viel mehr Wärmezyklen überstehen. Wenn sich die Metalle erwärmen, dehnen sie sich aus: Zwei Metalle, die mit unterschiedlichen Wärmeausdehnungskoeffizienten miteinander verbunden sind und viele Heizzyklen durchlaufen, reißen und verlieren an Effizienz. Wärmeleitpaste beseitigt dieses Problem. Außerdem ist Wärmeleitpaste billiger. Die Wahl einer thermischen Schnittstelle ist also ein Kompromiss zwischen Preis, Haltbarkeit und Leistung.
Über dem Kühlkörper befindet sich ein Prozessorkühler, zwischen denen sich jedoch eine andere thermische Schnittstelle befindet, die der Benutzer auswählen kann. Die billigste Option ist normales Silikon-Thermofett zu einem Preis von einem Cent pro Gallone. Leistungsbegeisterte können sich jedoch für Thermofett auf Silberbasis oder eine andere Mischung mit guten thermischen Eigenschaften entscheiden. Typischerweise ist die Fähigkeit der Paste, sich unter Druck zu verteilen, eine positive Qualität. Unterstützer extremer Geschwindigkeiten können eine Schicht aus flüssigem Metall verwenden, ähnlich der Lötvariante, die den Prozessor fast immer mit dem Kühler verbindet.
Was passiert also, wenn Sie plötzlich ein paar Mikrometer thermisch nutzlosen Kunststoff zwischen Kühlkörper und Prozessorkühler auftragen?
Zuallererst wird die Wärmeübertragung schrecklich sein. Dies bedeutet, dass Wärmeenergie in der Paste verbleibt und der Prozessor Wärme absorbiert, während die Temperatur erhöht wird. Dies ist in der Tat der gleiche Fall, wenn der Kühler mit einem großen Prozessor überlastet ist - die Wärmeaufnahme durch den Prozessor wird zu einem echten Problem. Dies führt zu einem beschleunigten Temperaturanstieg, bis der Temperaturgradient der Freisetzung von Wärmeenergie entspricht. Der Prozessor wird zu heiß, der Notfallmodus wird für eine thermische Notsituation aktiviert und reduziert die Spannung und Frequenz auf extrem niedrige Werte. Die Leistung sinkt auf den Grund.
Was sieht der Benutzer im System? Stellen Sie sich vor, Ihr Prozessor läuft beim Rendern mit 600 MHz anstelle der guten Basis 3125 MHz (siehe vorherige Seite). Die Basistemperaturen sind höher, die Belastungstemperaturen sind höher, die Gehäusetemperaturen sind höher. Sie können aber nasse Kleidung trocknen, damit die Hitze nicht verschwindet. Eine leichte Überhitzung schadet dem Prozessor nicht, aber eine große Menge kann ihn sehr schwach machen.
AMD XFR2
Letztendlich schadet ein solches Problem AMD mehr, als Sie sich vorstellen können. Die Art und Weise, wie AMD seine Turbomodi in neuen Prozessoren implementiert, ist keine Nachschlagetabelle mehr mit einer Liste von „geladenen Kernen -> Turbofrequenz“. Dies hängt von den Leistungs-, Strom- und Wärmegrenzen eines bestimmten Chips ab. Wenn es Raum für Wachstum gibt, fügt die AMD-Plattform Frequenz und Spannung hinzu. Diese thermische Anpassung erfolgt durch das, was AMD XFR2 oder eXtended Frequency Range 2 nennt.
Beim Tech Day für Threadripper 2 von AMD wurden uns Diagramme präsentiert, die die Auswirkung der Verwendung leistungsstärkerer Kühler auf die Leistung zeigen: Verbesserung der Testergebnisse um etwa 10% bei Erhöhung des Wärmeableitungspotenzials. Verwenden Sie das System in einem Raum mit niedriger Umgebungstemperatur, und AMD erhöht die Produktivität im Vergleich zum Abflusssystem um 16%.

Das Gegenteil ist jedoch auch der Fall. Mit einem Stück Kunststoff, bei dem eine gute Wärmeübertragung die Frequenz und Spannung erhöhen sollte, wurde die Leistung erheblich verringert.
Kunststoffleistung:
Trotz der Verwendung in einem gut klimatisierten Hotelzimmer hat sich dieser zusätzliche Kunststoff in den meisten unserer Tests entscheidend ausgewirkt. Hier ist der Schaden, den er angerichtet hat:









Bei allen Multithread-Tests kommt es bei starker Auslastung der CPU zu einem deutlichen Leistungsabfall. Der Mixer zeigte eine 20% ige Reduzierung des Durchsatzes, POV-Ray fiel um 10%, für 3DPM betrug der Verlust 19%. PCMark-Ergebnisse werden nicht wesentlich reduziert, da es viele Single-Threaded-Tests gibt, und in einigen Tests haben wir sogar eine Abweichung in die andere Richtung festgestellt, beispielsweise in WinRAR, die vom DRAM abhängt. Andere nicht aufgeführte Benchmarks sind unser Kompilierungstest, bei dem das „plastifizierte“ System nur 1% langsamer war, oder Dolphin, der einen Unterschied von einer Sekunde aufwies.
Was habe ich gelernt
Sei kein Dummkopf. Die Montage eines Prüfstands mit neuen Komponenten, die sehr müde sind, kann zu wiederholten Tests führen.
Schlussfolgerungen: Nicht alle Kerne sind gleich geboren
Das Prozessordesign ist häufig ein Feinabstimmungsprozess. Um Leistung zu erzielen, muss der Architekt die Berechnungen mit der Bandbreite in Einklang bringen und immer über genügend Daten verfügen, um Prozessorkerne zu laden. Wenn das "Biest" im Leerlauf bleibt, verbraucht es Energie, ohne Arbeit zu leisten. Das Einstellen der richtigen Ressourcenkombination ist eine schwierige Aufgabe. Daher stellen führende Prozessorunternehmen Tausende von Ingenieuren ein, damit das System ordnungsgemäß funktioniert. Und wenn das Hauptdesign fertig ist, bringt es eine Reihe von Erben hervor.
Manchmal fallen exotische Produkte aus dem gemeinsamen Stapel. Die neue Generation der AMD Ryzen Threadripper-Prozessoren ist genauso exotisch. Es scheint, dass die Komponenten der vorherigen Generation direkt ersetzt wurden, ähnlich wie sie, jedoch mit besserer Verzögerung und höherer Frequenz. Diese Komponenten sind bereits bekannt, und wir erhalten den erwarteten Anstieg auf die übliche Weise. Und in diesem Moment wirft zusätzliches Silizium, das im 2990WX enthalten ist, ohne direkten Zugriff auf den Speicher, einen Schraubenschlüssel in einen etablierten Mechanismus.
2950X (links) und 2990WX (rechts)Wenn alle Kerne direkt mit dem Speicher verbunden sind, z. B. der 2950X, werden alle Kerne als gleich angesehen, und der Workload-Ausgleich ist eine recht einfache Aufgabe. Mit der Veröffentlichung neuer Prozessoren haben wir die in der Abbildung rechts gezeigte Situation erhalten. Jetzt sind nur einige Kerne direkt an den Speicher gebunden, der Rest nicht. Damit die Daten von einem der „entfernten“ Kerne in den Hauptspeicher verschoben werden können, ist ein zusätzlicher „Sprung“ erforderlich, der die Latenz erhöht. Und wenn alle Kernel Zugriff anfordern, liegt eine Überlastung vor.
Um die Funktionen einer solchen Architektur voll nutzen zu können, sollte die Arbeitslast nicht speicherintensiv sein. Bei Aufgaben wie der Berechnung der Partikelbewegung, der Strahlverfolgung, dem Rendern von Szenen und der Dekomprimierung kann der Prozessor durch das vollständige Laden aller 32 Kerne zum Star unserer Tests werden und neue Rekorde aufstellen.
Im zweiseitigen Janus-Stil führt eine Struktur mit zwei Modulen bei anderen Workloads, die historisch von der Anzahl der Kerne abhingen, wie z. B. Physik, Transcodierung und Komprimierung, zu einem erheblichen Leistungsverlust. Infolgedessen gibt es hier anscheinend keine durchschnittlichen Ergebnisse - entweder zeigt die Arbeitslast hervorragende Ergebnisse auf dem neuen Prozessor oder sie befindet sich im Ende unseres hochwertigen Testpakets.
Ein Teil des Problems ist die Stromverteilung dieser sehr großen Prozessoren. Wie auf Seite 4 gezeigt, wird je mehr Chiplets im Spiel oder je mehr Mesh vorhanden sind, desto mehr Energie wird nicht den Kernen, sondern internen Netzwerken wie Uncore oder Infinity Fabric zugeführt. Beim Vergleich einer IF-Verbindung in 2950X mit sechs in 2990WX haben wir festgestellt, dass IF jetzt 60-73% der gesamten Chipleistung bei geringer Last und 25-40% bei hoher Last verbraucht.
Tatsächlich verbraucht ein Chip wie der 2990WX bei Volllast nur 60% seines Strombudgets für die Prozessorfrequenz. In EPYC 7601 verbrauchten die Kerne aufgrund zusätzlicher Speicherkanäle unter Last nur 50% des Strombudgets. Stellen Sie sicher, dass das nächste Ziel auf ihrer Liste die Verbindung ist, nachdem AMD und Intel den Kampf um die Anzahl der Kerne beendet haben.
Der Nebeneffekt der Tatsache, dass der Chip nicht die gesamte Leistung zur Stromversorgung der Kerne verbraucht und auch eine bimodale Architektur aufweist, besteht darin, dass einige Workloads nicht skaliert werden und in einigen Fällen eine Regression auftritt.
Big Boss: AMD 32-Core-Nilpferd
Es besteht kein Zweifel, dass der AMD Ryzen Threadripper 2990WX, wenn er die Gelegenheit erhält, voll zu arbeiten, dies gerne tun wird. Wir konnten das System auf allen Kernen durch einfaches Ändern der BIOS-Einstellungen auf 4 GHz übertakten, obwohl AMD auch Windows Precision Boost Overdrive unterstützt, um mehr aus dem Chip herauszuholen. Gleichzeitig steigt der Stromverbrauch bei Verwendung der Hälfte der Kerne bei einer Frequenz von 4,0 GHz auf 260 Watt, und eine voll ausgelastete CPU nimmt bis zu 450-500 Watt ab und übersteigt manchmal 600 Watt. Benutzer müssen sicherstellen, dass ihr Motherboard und ihr Netzteil für eine solche Aufgabe bereit sind.

Dies ist der Moment, in dem ich endlich sage, ob wir den Kauf neuer AMD-Produkte empfehlen. Die Möglichkeit, 2950X anstelle von 1950X in Ihre Slots zu stecken, auch zu einem niedrigeren Preis, erscheint uns sehr attraktiv. Der 2950X ist jedoch bereits ein Nischenprodukt für hohe Leistung - und der 2990WX nimmt den Staffelstab auf und nimmt ihn in die Ferne, was ihn zum leistungsstärksten Nischenprozessor macht. Ehrlich gesagt ist seine Produktivität nicht in allen Fällen so hoch, wie man es erwarten würde, und seine Anwendung ist sinnvoll für eine enge Gruppe von Workloads, bei denen sich herausstellt, dass sie unvergleichlich ist. Und obwohl es in unserem Kompilierungstest fast alle anderen Prozessoren übertrifft, gibt es einen Prozessor, der es übertrifft: 2950X.
Für die meisten Benutzer reicht der 2950X aus. Für einige wenige wird der 2990WX der beste Prozessor der Welt sein.
Vielen Dank für Ihren Aufenthalt bei uns. Gefällt dir unser Artikel? Möchten Sie weitere interessante Materialien sehen? Unterstützen Sie uns, indem Sie eine Bestellung
aufgeben oder Ihren Freunden empfehlen, einen
Rabatt von 30% für Habr-Benutzer auf ein einzigartiges Analogon von Einstiegsservern, das wir für Sie erfunden haben: Die ganze Wahrheit über VPS (KVM) E5-2650 v4 (6 Kerne) 10 GB DDR4 240 GB SSD 1 Gbit / s von $ 20 oder wie teilt man den Server? (Optionen sind mit RAID1 und RAID10, bis zu 24 Kernen und bis zu 40 GB DDR4 verfügbar).
3 Monate kostenlos bei Bezahlung eines neuen Dell R630 für einen Zeitraum von sechs Monaten -
2 x Intel Deca-Core Xeon E5-2630 v4 / 128 GB DDR4 / 4 x 1 TB Festplatte oder 2 x 240 GB SSD / 1 Gbit / s 10 TB - ab 99,33 USD pro Monat , nur bis Ende August, Bestellung kann
hier sein .
Dell R730xd 2 mal günstiger? Nur wir haben
2 x Intel Dodeca-Core Xeon E5-2650v4 128 GB DDR4 6 x 480 GB SSD 1 Gbit / s 100 TV von 249 US-Dollar in den Niederlanden und den USA! Lesen Sie mehr über
den Aufbau eines Infrastrukturgebäudes. Klasse mit Dell R730xd E5-2650 v4 Servern für 9.000 Euro für einen Cent?