Monstres après les vacances: AMD Threadripper 2990WX 32-Core et 2950X 16-Core (partie 5)

Partie 1Partie 2Partie 3Partie 4 → Partie 5

Comparaisons thermiques et XFR2: n'oubliez pas de retirer le plastique du refroidisseur!



Chaque machine poursuit des objectifs avec différentes priorités: performance, consommation, bruit, performance thermique ou coût. Il est très difficile d'atteindre tout le monde à la fois, donc choisir deux ou trois objectifs est une bonne idée. Comment perdre dans LES CINQ DIRECTIONS? .. Bienvenue dans mon monde. Le monde dans lequel j'ai d'abord testé l'AMD Ryzen Threadripper 2990WX à 32 cœurs, en oubliant de retirer le plastique de mon refroidisseur de liquide.

Ne réassemblez pas le système après un long vol.

Presque tous les nouveaux refroidisseurs, unités d'air, de liquide et d'eau sont livrés avec des joints, de la mousse, des vis, des ventilateurs et un ensemble d'instructions. Selon le fabricant et le type d'emballage, le fond du refroidisseur du processeur sera préparé de deux manières:

  1. Graisse thermique pré-appliquée
  2. Petit ruban en plastique auto-adhésif pour protéger le polissage pendant le transport

Rencontrez dans notre revue le refroidisseur d'air Wraith Ripper massif, fabriqué par Cooler Master, mais promu par AMD comme refroidisseur de base pour les nouveaux processeurs Threadripper 2. La graisse thermique est densément appliquée sur toute sa base. Quand j'ai essayé de prendre des photos, j'ai tout gâché.



Également inclus dans notre examen est le refroidisseur de liquide Enermax Liqtech TR4 avec un tube de pâte thermique. La partie inférieure de l'unité en contact avec le CPU était recouverte d'une bande de plastique autocollante protectrice.


Exemple Twitter TechTeamGB

Alors, le temps de la confession. Notre trousse d'enquête est arrivée un jour plus tôt que moi. L'action a eu lieu lors de mon voyage avec le Royaume-Uni à San Francisco sur le Flash Memory Summit et le Intel Datacenter Summit. Dans mes valises j'ai apporté une carte mère X399 (ASUS ROG Zenith), trois puces X399 (2990WX, 2950X, 1950X), une carte mère X299 (ASRock X299 OC Formula), plusieurs puces Skylake-X, une alimentation Corsair AX860i, RX 460, une souris , clavier, câbles - simplement des composants pour assembler deux systèmes et utiliser le moniteur dans une chambre d'hôtel pour les tests. Après un vol direct de 11 heures, deux heures au contrôle des passeports et plus d'une heure en taxi Uber jusqu'à mon hôtel, j'ai mis en place un système avec 2990WX.

Je n'ai pas retiré le plastique du refroidisseur Enermax. Je ne l'ai pas remarqué. J'ai même appliqué de la graisse thermique sur le processeur et je n'ai rien suspecté, même lorsque j'ai serré les vis.

J'ai réglé le système sur la fréquence de mémoire maximale prise en charge, installé Windows, installé les mises à jour de sécurité, installé les tests et démarré le système toute la nuit pendant que je dormais. Je ne soupçonnais même pas que le plastique était resté attaché. Le matin, la suite de tests a déjà terminé ses travaux. Après avoir effectué des tests supplémentaires, tels que la mesure de la latence de la fréquence de base, je suis allé remplacer le processeur par le 2950X. C'est à cette époque que j'ai réalisé un facespalm expressif.



Quand j'ai vu la graisse thermique maculée sur le processeur et le plastique, j'ai réalisé que je devrais tout redémarrer. Après avoir retiré le plastique, j'ai inséré le processeur, mis en place le système, cette fois avec le meilleur profil thermique.

La performance thermique est importante.


L'objectif de tout système est de le maintenir dans la bonne «fenêtre de température» pour un fonctionnement stable: la plupart des processeurs sont conçus pour fonctionner correctement à des températures allant jusqu'à 105 ° C, après quoi ils sont éteints pour éviter d'endommager les dommages thermiques. Lorsqu'un processeur entraîne des électrons en chaînes et fait toutes sortes de choses nécessaires, il consomme de l'énergie. Cette puissance est perdue sous forme de chaleur, dissipée de la puce dans deux directions principales: prise et refroidisseur.



Les processeurs AMD Threadripper ont un matériau d'interface thermique entre les matrices de silicium et un dissipateur thermique - brasage à l'étain-indium. Une liaison directe métal-métal est nécessaire pour un transfert direct de chaleur. Les processeurs Intel modernes utilisent de la pâte thermique de silicone au lieu de cette couche, qui transfère la chaleur pire, mais a un avantage important - il est capable de survivre à bien plus de cycles thermiques. Au fur et à mesure que les métaux chauffent, ils se dilatent: deux métaux liés ensemble avec des coefficients de dilatation thermique différents, passant par de nombreux cycles de chauffage, se fissureront et perdront leur efficacité. La pâte thermique élimine ce problème. De plus, la graisse thermique est moins chère. Le choix d'une interface thermique est donc un compromis entre le prix, la durabilité et les performances.

Il y a un refroidisseur de processeur au-dessus du dissipateur de chaleur, mais il existe une autre interface thermique entre eux, son utilisateur peut choisir. L'option la moins chère est la graisse thermique silicone ordinaire au prix d'un cent par gallon, mais les amateurs de performance peuvent choisir une graisse thermique à base d'argent ou un autre mélange avec de bonnes caractéristiques thermiques. Typiquement, la capacité de la pâte à se distribuer sous pression est une qualité positive. Les supporteurs de vitesses extrêmes peuvent utiliser une couche de métal liquide, similaire à la variante de soudure, qui relie presque toujours le processeur au refroidisseur.

Alors, que se passe-t-il si vous appliquez soudainement quelques microns de plastique thermiquement inutile entre le dissipateur thermique et le refroidisseur du processeur?

Tout d'abord, le transfert de chaleur sera terrible. Cela signifie que l'énergie thermique reste dans la pâte, ce qui oblige le processeur à absorber la chaleur tout en augmentant la température. En fait, c'est le même cas lorsque le refroidisseur est surchargé par un grand processeur - l'absorption de chaleur par le processeur devient un vrai problème. Cela conduit à une augmentation accélérée de la température jusqu'à ce que le gradient de température soit égal à la libération d'énergie thermique. Le processeur devient trop chaud, le mode d'urgence est activé pour une situation thermique d'urgence, réduisant la tension et la fréquence à des niveaux extrêmement bas. La performance tombe au fond.

Que voit l'utilisateur dans le système? Imaginez que votre processeur tourne à 600 MHz lors du rendu, au lieu de la bonne base 3125 MHz (voir page précédente). Les températures de base sont plus élevées, les températures de charge sont plus élevées, les températures du boîtier sont plus élevées. Mais vous pouvez sécher les vêtements mouillés pour que la chaleur ne disparaisse pas. Une légère surchauffe n'endommage pas le processeur, mais une grande quantité peut le rendre très faible.
AMD XFR2

En fin de compte, un tel problème nuit plus à la DMLA que vous ne pouvez l'imaginer. La façon dont AMD implémente ses modes turbo dans les nouveaux processeurs n'est plus une table de recherche avec une liste de «cœurs chargés -> turbofréquence». Cela dépend de la puissance, du courant et des limites thermiques d'une puce donnée. S'il y a de la place pour la croissance, la plateforme AMD ajoutera fréquence et tension. Cet ajustement thermique est effectué par ce que AMD appelle XFR2, ou eXtended Frequency Range 2.

Lors de la Tech Day d'AMD pour Threadripper 2, nous avons reçu des graphiques montrant l'effet de l'utilisation de refroidisseurs plus puissants sur les performances: amélioration d'environ 10% des résultats des tests avec une augmentation du potentiel de dissipation thermique. Utilisez le système dans une pièce avec une température ambiante basse, et AMD donnera une augmentation de 16% de la productivité par rapport au système de drainage.



Cependant, l'inverse est également vrai. Avoir un morceau de plastique où un bon transfert de chaleur était censé augmenter la fréquence et la tension, nous avons obtenu une baisse significative des performances.

Performance plastique:


Ainsi, bien qu'il soit utilisé dans une chambre d'hôtel bien climatisée, ce plastique supplémentaire a eu un effet décisif dans la plupart de nos tests. Voici les dégâts qu'il a causés:



















Dans tous les tests multithreads, lorsque le processeur est lourdement chargé, il y a une baisse significative des performances. Le mélangeur a montré une réduction de 20% du débit, POV-Ray a chuté de 10%, pour 3DPM la perte était de 19%. Les résultats de PCMark ne sont pas réduits de manière significative, car il comporte de nombreux tests à un seul thread, et dans certains tests, nous avons même vu une déviation dans l'autre sens, par exemple, dans WinRAR, qui dépend de la DRAM. Parmi les autres références non répertoriées, citons notre test de compilation, où le système «plastifié» n'était que 1% plus lent, ou Dolphin, qui montrait une différence d'une seconde.

Qu'ai-je appris?


Ne sois pas idiot. L'assemblage d'un banc d'essai avec de nouveaux composants, étant très fatigué, peut conduire à des tests répétés.

Conclusions: tous les noyaux ne naissent pas égaux


La conception du processeur est souvent un processus de réglage fin. Afin d'obtenir des performances, l'architecte doit équilibrer les calculs avec la bande passante, et toujours avoir suffisamment de données «alimentant la bête» - chargeant les cœurs de processeur. Si la «bête» reste inactive, elle consomme de l'énergie sans faire aucun travail. Définir la bonne combinaison de ressources est une tâche difficile, et les principales entreprises de processeurs embauchent donc des milliers d'ingénieurs pour faire fonctionner le système correctement. Et lorsque la conception principale est prête, elle produit un certain nombre d'héritiers.

Parfois, les produits exotiques tombent de la pile commune. La nouvelle génération de processeurs AMD Ryzen Threadripper est la même exotique. Il semblerait que des remplacements directs aient été effectués pour les composants de la génération précédente, similaires à eux, mais avec un meilleur retard et une fréquence plus élevée. Ces composants sont déjà bien connus, et nous obtenons l'augmentation attendue de la manière habituelle. Et à ce moment, du silicium supplémentaire, inclus dans le 2990WX, sans accès direct à la mémoire, jette une clé dans un mécanisme établi.


2950X (gauche) et 2990WX (droite)

Lorsque tous les cœurs sont directement liés à la mémoire, comme le 2950X, tous les cœurs sont considérés comme égaux et l'équilibrage de la charge de travail est une tâche assez simple. Avec la sortie de nouveaux processeurs, nous avons obtenu la situation indiquée dans la figure de droite. Maintenant, seuls certains cœurs sont directement liés à la mémoire, tandis que les autres ne le sont pas. Pour que les données passent d'un des cœurs «distants» à la mémoire principale, un «saut» supplémentaire est nécessaire, ce qui ajoute de la latence. Et lorsque tous les noyaux demandent l'accès, il y a une congestion.

Pour utiliser pleinement les capacités d'une telle architecture, la charge de travail ne doit pas être gourmande en mémoire. Dans des tâches telles que le calcul du mouvement des particules, le lancer de rayons, le rendu de scène et la décompression, le chargement complet des 32 cœurs permet au processeur d'être la star de nos tests et d'établir de nouveaux records.

Dans le style Janus à deux faces, avec d'autres charges de travail qui ont historiquement dépendu du nombre de cœurs, tels que la physique, le transcodage et la compression, une structure à deux modules entraîne une perte de performances significative. En conséquence, ici, apparemment, il n'y a pas de résultats moyens - soit la charge de travail montre d'excellents résultats sur le nouveau processeur, soit c'est dans la queue de notre package de test de haute qualité.

Une partie du problème est la distribution de puissance de ces très gros processeurs. Comme indiqué à la page 4, plus il y a de chips dans le jeu, ou plus il y a de Mesh, plus l'énergie est fournie non pas aux cœurs, mais aux réseaux internes tels que Uncore ou Infinity Fabric. En comparant une liaison IF en 2950X avec six en 2990WX, nous avons constaté que IF consomme désormais 60 à 73% de la puissance totale de la puce à faible charge et 25 à 40% à puissance élevée.

En fait, à pleine charge, une puce comme le 2990WX n'utilise que 60% de son budget de puissance pour la fréquence du processeur. Dans EPYC 7601, en raison de canaux de mémoire supplémentaires, les cœurs ne consommaient que 50% du budget d'alimentation sous charge. Assurez-vous qu'après qu'AMD et Intel auront fini de se battre pour le nombre de cœurs, le prochain objectif de leur liste sera l'interconnexion.

Mais l'effet secondaire du fait que la puce n'utilise pas toute la puissance pour alimenter les cœurs, et a également une architecture bimodale, est que certaines charges de travail ne seront pas mises à l'échelle et, dans certains cas, il y a régression.

Big Boss: Hippo AMD à 32 cœurs


Il ne fait aucun doute que lorsque l'AMD Ryzen Threadripper 2990WX aura l'occasion de travailler pleinement, il le fera avec plaisir. Nous avons pu overclocker le système à 4 GHz sur tous les cœurs en changeant simplement les paramètres du BIOS, bien qu'AMD prenne également en charge Windows Precision Boost Overdrive pour mieux tirer parti de la puce. Dans le même temps, la consommation d'énergie lors de l'utilisation de la moitié des cœurs à une fréquence de 4,0 GHz grimpe jusqu'à 260 watts, et un processeur entièrement chargé décolle jusqu'à 450-500 watts et dépasse parfois 600 watts. Les utilisateurs devront s'assurer que leur carte mère et leur alimentation sont prêtes à effectuer une telle tâche.



C'est le moment où je dis enfin si nous recommandons l'achat de nouveaux produits AMD. La possibilité de mettre 2950X au lieu de 1950X dans vos slots, également à un prix inférieur, nous semble très intéressante. Cependant, le 2950X est déjà un produit de niche pour de hautes performances - et le 2990WX prend le relais et le prend à distance, ce qui en fait le processeur de niche le plus puissant. Honnêtement, sa productivité n'est pas dans tous les cas aussi grande qu'on pourrait s'y attendre, et son application a du sens pour un ensemble restreint de charges de travail, où elle se révèle incomparable. Et bien qu'il dépasse presque tous les autres processeurs dans notre test de compilation, il y a un processeur qui l'a battu: 2950X.

Pour la plupart des utilisateurs, le 2950X suffit. Pour quelques privilégiés, le 2990WX sera le meilleur processeur au monde.

Merci de rester avec nous. Aimez-vous nos articles? Vous voulez voir des matériaux plus intéressants? Soutenez-nous en passant une commande ou en le recommandant à vos amis, une réduction de 30% pour les utilisateurs Habr sur un analogue unique de serveurs d'entrée de gamme que nous avons inventés pour vous: Toute la vérité sur VPS (KVM) E5-2650 v4 (6 cœurs) 10 Go DDR4 240 Go SSD 1 Gbps à partir de 20 $ ou comment diviser le serveur? (les options sont disponibles avec RAID1 et RAID10, jusqu'à 24 cœurs et jusqu'à 40 Go de DDR4).

3 mois gratuits lors du paiement d'un nouveau Dell R630 pour une période de six mois - 2 x Intel Deca-Core Xeon E5-2630 v4 / 128GB DDR4 / 4x1TB HDD ou 2x240GB SSD / 1Gbps 10 TB - à partir de 99,33 $ par mois , uniquement jusqu'à fin août, commandez peut être ici .

Dell R730xd 2 fois moins cher? Nous avons seulement 2 x Intel Dodeca-Core Xeon E5-2650v4 128 Go DDR4 6x480 Go SSD 1 Gbps 100 TV à partir de 249 $ aux Pays-Bas et aux États-Unis! Pour en savoir plus sur la création d'un bâtiment d'infrastructure. classe utilisant des serveurs Dell R730xd E5-2650 v4 coûtant 9 000 euros pour un sou?

Source: https://habr.com/ru/post/fr422209/


All Articles