Monstres après les vacances: AMD Threadripper 2990WX 32-Core et 2950X 16-Core (partie 4)

Partie 1 → Partie 2 → Partie 3 → Partie 4 → Partie 5

Consommation d'énergie, TDP et Prime95 vs POV-Ray


Pour la plupart d'entre nous, la puissance du processeur est d'environ 15 watts sur les ordinateurs portables et de 65 à 95 watts sur les systèmes de bureau. Les processeurs de bureau hautes performances ont toujours été plus voraces, et donc un TDP de 130 W et 140 W est un indicateur normal pour eux. Quand AMD a sorti un processeur 220 W sur l'ancienne plate-forme Vishera, après avoir overclocké les cœurs Bulldozer à 5,0 GHz, l'idée s'est posée de savoir si AMD était complètement fou: de nombreuses cartes mères étaient compatibles avec le socket AMD, mais pour utiliser TDP 220 W et plus a dû sortir un certain nombre de nouvelles cartes mères. Aujourd'hui, le processeur Intel le plus puissant du marché a un TDP officiel de 205 watts, mais AMD est allé plus loin en élevant la barre à 250 watts.



Deux nouveaux processeurs WX, les 2990WX et 2970WX à 32 cœurs, ont une puissance nominale de 250 watts. Dans les deux processeurs, les quatre matrices en silicone sont actives; il existe six lignes Infinity Fabric actives. Ces processeurs sont conçus pour atteindre un nouveau niveau de performances, tandis qu'AMD présente des diapositives avec une fréquence turbo sur tous les cœurs de 3,6 GHz. Les deux processeurs qui sont venus remplacer la série X ont une puissance de 180 watts, ainsi que les processeurs de la première génération Threadripper.

Cependant, tous les TDP ne sont pas égaux. Les façons dont Intel et AMD mesurent le TDP ont changé au fil des ans et sont maintenant très loin de la réalité. Laisse-moi t'expliquer.

TDP est une telle blague


La valeur TDP, ou puissance de conception thermique, n'est pas un indicateur de la consommation d'énergie. Techniquement, c'est un indicateur des performances du refroidisseur, ce qui signifie que pour faire face à son travail, le refroidisseur doit avoir le même niveau TDP. La consommation d'énergie réelle devrait être légèrement plus élevée - le transfert de chaleur du processeur au socket et du socket à la carte mère contribue au refroidissement, mais n'est pas pris en compte dans l'indicateur TDP. Souvent, le taux de dissipation thermique TDP et la consommation d'énergie du processeur sont perçus comme un, car leurs différences sont insignifiantes.

Commençons le calcul avec les processeurs AMD. Le calcul AMD TDP est basé sur une formule simple:

TDP = (température de fonctionnement, en degrés Celsius - température de ralenti, en degrés Celsius) / puissance thermique du refroidisseur

Ainsi, lorsque AMD détermine le TDP de son processeur Ryzen 7 2700X avec une température de charge d'environ 62 ° C, une température de repos de 42 ° C et un refroidisseur d'une puissance thermique de 0,189 C par watt (Wraith Max), nous obtenons une valeur d'environ 105W.

La formule AMD présente deux problèmes à la fois: d'une part, la température du processeur chargé peut être contrôlée à l'aide d'un refroidisseur ou d'un flux d'air externe, et d'autre part, le résultat est fortement influencé par la puissance thermique du refroidisseur. Avec un grand refroidisseur de liquide qui a une puissance thermique plus élevée, par exemple 0,400 C par watt, le TDP nominal de tout processeur sera inférieur: dans le cas du Ryzen 7 2700X, son TDP ne sera que de 50 watts. La cote TDP et la consommation d'énergie ne sont pas égales, et leur rapport peut changer dans n'importe quelle direction, seul AMD devrait choisir un refroidisseur différent pour les comparaisons.

La version TDP d'Intel est un peu plus compliquée, mais est-ce logique ... Intel détermine le TDP de ses processeurs uniquement pour la fréquence de base, en ignorant les fréquences turbo. En conséquence, si Intel publie un processeur avec 95 W TDP, une fréquence de base de 3,2 GHz, un turbo monocœur de 4,7 GHz et un turbo complet de 4,2 GHz, la consommation électrique garantie de 95 W sera à une fréquence de base de 3,2 GHz. Cela signifie que sur toute carte mère qui utilise un turbo (c'est-à-dire généralement sur n'importe quel), le processeur consommera plus d'énergie sous n'importe quelle charge que son TDP officiel.

Et c'est très ennuyeux. La démarche marketing d'Intel consiste à faire la publicité de ses processeurs turbo monocœur et à ne pas publier de valeurs inférieures pour le turbo «tout cœur». On nous dit que ce sont des «informations internes à l'entreprise» qui relèvent de l'accord de non-divulgation. Dans tous les cas, chaque processeur qui a une fréquence turbo «tout cœur» au-dessus de la fréquence de base consommera au-dessus du TDP spécifié.

Un bon exemple est le Core i7-8700 et son TDP 65 W. Il a une fréquence de base de 3,2 GHz, un turbo monocœur de 4,6 GHz et un turbo complet de 4,3 GHz. Si nous chargeons plus de flux et limitons la consommation d'énergie à 65 W, alors nous obtenons ce qui suit:



Vaut-il la peine de prendre au sérieux les valeurs du TDP? Traitez-les avec humour.

Consommation d'énergie


Il existe plusieurs façons de mesurer la consommation d'énergie du processeur. Le moyen le plus simple est d'utiliser un appareil de mesure, qui vous permettra de connaître la consommation électrique de l'ensemble du système, y compris les pertes dans le système d'alimentation de la carte mère. Une méthode compliquée consiste à connecter les outils nécessaires à la carte pour mesurer le courant via un connecteur 12 volts, mesurer la tension du processeur en utilisant les paramètres d'overclocking de certaines cartes mères. La troisième méthode consiste à lire les registres matériels à l'aide du logiciel approprié.

La lecture des registres est une épée à double tranchant. Tout d'abord, vous comptez sur des dimensions internes, qui ont souvent une marge d'erreur assez large. Deuxièmement, vous comptez sur le fabricant du processeur pour signaler des données réelles sur votre processeur. Ce n'est pas toujours raisonnable (!). Sur le plan positif: il est possible d'obtenir plus d'informations du processeur, par exemple, l'analyse de la puissance pour chaque cœur, la puissance DRAM, la puissance IO / Interconnect, la puissance graphique intégrée, obtenir une compréhension générale de la distribution de l'alimentation.

Registres matériels - c'est la façon dont le système se communique des données sur le travail: combien d'énergie il utilise, comment il doit réguler la tension / fréquence en fonction du courant, de la puissance ou des performances thermiques. Un autre aspect positif est la facilité d'utilisation de ces données dans les scripts de test.

Les tests énergétiques font souvent l'objet de controverses. Un virus spécialisé est généralement utilisé qui peut charger simultanément chaque zone du processeur à la puissance maximale. «Power virus» est utilisé pour vérifier la stabilité de l'accélération, mais il a un inconvénient: avec une charge quotidienne, les résultats, en règle générale, ne reflètent pas la consommation d'énergie réelle. C'est la fine ligne entre un véritable test et un test synthétique conçu pour conduire chaque joule d'énergie à travers une puce. Un logiciel, tel que LINPACK, est souvent utilisé comme test de puissance efficace. Les outils internes Intel et AMD peuvent aider à charger encore plus la puce.

Prime95 est un outil populaire, il est parfaitement optimisé pour presque tous les cœurs, il contrôle l'alimentation. Sa charge de travail est semi-synthétique, basée sur le calcul des nombres premiers, mais le test de résistance ignore les résultats et se concentre uniquement sur la consommation d'énergie. Au cours de cette revue, nous avons joué un peu avec POV-Ray comme test de puissance: il fournit une consommation d'énergie encore plus élevée que Prime95, et utilise également une charge de lancer de rayons très populaire. Pour écrire un avis pour moi, c'est pourquoi je décide quel outil est le mieux utilisé pour les tests de consommation d'énergie. Prime95 a des problèmes pour travailler avec un grand nombre de cœurs (il est parfois difficile d'obtenir un résultat de test si la limite de 25 threads est dépassée), et pour que POV-Ray fonctionne, nous devons ajuster ses méthodes de chargement, car il vise davantage à vérifier la charge du noyau, plutôt que flux. Cependant, nous nous attendons à obtenir des résultats en fonction du nombre de threads. Il sera indiqué quel logiciel a été utilisé à chaque étape des tests (nous n'avons pu préparer notre version de POV-Ray qu'au milieu de la revue, donc la plupart des données ont été reçues de Prime95).

Consommation électrique totale


Comme premier ensemble de résultats, je veux présenter la consommation totale d'énergie du processeur, mesurée dans diverses situations. Au ralenti:



Ensuite, nous chargeons un seul noyau avec deux threads en utilisant Prime95. Notre technique de test fait fonctionner les deux threads sur le même noyau, au cas où les cœurs de processeur seraient capables de traiter plusieurs threads. Les utilisateurs concentrés sur les charges à tâche unique verront la consommation d'énergie dans cette plage. Cela s'applique également aux systèmes dans lesquels Windows est constamment en arrière-plan.



Le troisième test est un système chargé avec quatre threads utilisant Prime95. C'est exactement la plage de charge que la plupart des gens utilisent quotidiennement sur leurs systèmes: plusieurs onglets de navigateur, quelques fenêtres, plusieurs logiciels de travail sont ouverts, un ou plusieurs jeux sont en cours d'exécution.



En augmentant la charge du processeur à douze threads (avec Prime95), nous passons aux utilisateurs utilisant des charges de travail volumineuses et multitâches. Ce sont des joueurs - des streamers ou des utilisateurs qui commencent le rendu tout en travaillant en parallèle avec d'autres tâches.



Le graphique final montre la consommation totale d'énergie. Pour ce test, nous exécutons le nombre maximal de threads (Prime95), à l'avenir, nous prévoyons d'utiliser POV-Ray pour ce test, car il se montre beaucoup mieux avec un nombre élevé de threads. Le seul inconvénient de ce test est que le 2990WX overclocké peut terminer le test POV-Ray en moins de 20 secondes.



Consommation électrique individuelle du cœur


Avant de créer le test de consommation d'énergie POV-Ray, j'ai lancé les deux nouveaux processeurs Threadripper sur le test Prime95 dans l'option All-thread, reçu la consommation d'énergie de chaque cœur à chaque charge.



Lors du chargement du premier cœur, nous constatons que sa consommation électrique est de ~ 23 watts. C'est beaucoup par rapport aux cœurs Zeppelin. Cela s'applique également lorsque deux cœurs sont chargés. En chargeant trois cœurs, nous observons une diminution de la consommation à 18,8 watts par cœur. Étant donné que cette puce a quatre CCX, la question se pose de savoir si ce résultat est lié au fait que les flux sont chargés dans le même CCX (ce qui, apparemment, devrait se produire), et que nous atteignons la limite de puissance CCX. Lors du chargement de quatre cœurs, la consommation de chaque cœur est d'environ 17,4 watts.

En augmentant le nombre de cœurs chargés à cinq, nous constatons que le cinquième cœur fonctionne à 18,2 watts et les quatre autres à 16,8 watts. Le résultat indique que ce cinquième cœur est situé sur le nouveau CCX. Dans la transition de huit cœurs à neuf, nous voyons la même chose: le neuvième cœur consomme 17,5 watts de puissance, tandis que les huit autres sont d'environ 14,3 watts. Au final, la distribution de puissance tombe à 7-9 watts par cœur si nous utilisons les 16 cœurs.

La consommation totale d'énergie du processeur est de ~ 178 W, environ 180 W TDP avec une consommation de ~ 135 W sur les cœurs, et le reste est sur Uncore (matériel extra-core - Infinity Fabric, IO, IMC).

Quant aux résultats du test 2990WX, l'image résultante semble très, très étrange.



Pour la plupart, les données de consommation d'énergie pour un maximum de 15 cœurs sont à peu près les mêmes que celles du 2950X. Cependant, à mesure que les flux augmentent, il devient clair que la première couche de matrice est clairement préférable. Lors du chargement de flux supplémentaires et de la connexion d'une seconde matrice, la puissance de ses cœurs est beaucoup plus faible - jusqu'à 2,4 W par cœur. La première couche de zeppelin à pleine charge consomme environ 6,6 watts par cœur, mais le reste du cœur du processeur est d'environ 2,4 watts. Quelque chose se passe, à la suite de quoi la première matrice est prioritaire en nutrition par rapport au reste. Il convient de noter que la consommation d'énergie de la puce est d'environ 180 watts, pas 250 watts, comme le montre son TDP.

À cette époque, nous avons terminé d'écrire un script de test de puissance POV-Ray. Je l'ai testé sur 2990WX, je présente les résultats. Et maintenant, ils sont beaucoup plus élevés que prévu:



Étonnamment, au fur et à mesure que le nombre de fils augmentait, la charge devenait très uniformément répartie. Nous avons même pu utiliser pleinement tous les 250 W TDP avec des paramètres de stock et avec un bon refroidisseur. Après avoir complètement chargé les processus, nous avons vu la consommation de 193 watts par les noyaux, 55 watts par les autres composants. Nous n'avons en aucun cas observé de «fléchissement» des noyaux actifs en dessous de 3 watts. Lorsque tous les cœurs ont été chargés, chaque cœur a consommé ses «confortables» 6 watts. Nous avons atteint une puissance de processeur de 240 à 250 W lors du chargement d'environ 40 threads. Avec une nouvelle augmentation des flux, le noyau ajouté a provoqué une redistribution de la puissance.

Deux idées me sont venues à l'esprit. La première a été facile à vérifier: peut-être que le BIOS était bloqué à 180 W après l'installation du 2950X? J'ai revérifié et avant d'exécuter les tests avec 2990WX, j'ai testé le 1920X précédemment testé. Une réinitialisation complète du BIOS n'a pas affecté les résultats. Je peux affirmer que ce n'est pas une limitation de puissance du BIOS. La deuxième idée est de vérifier les fréquences. Après avoir vérifié un seul point de référence (40 flux chargés), nous avons trouvé un petit écart, mais uniquement en puissance.

Lors du test Prime95, la première matrice a fonctionné à 7 watts par cœur avec une fréquence de 3575 MHz. Le deuxième cristal de silicium a donné un résultat de 3 W par cœur à une fréquence de 3525 MHz. D'autres noyaux (inactifs) fonctionnaient à une fréquence de 1775 MHz ou 2000 MHz, consommant des milliwatts.

Pendant le test POV-Ray, chaque cœur actif consommait environ 9,1 watts par cœur et avait une fréquence de 3575 MHz. Tous les cœurs inactifs étaient à une fréquence de 2000 MHz (il y en avait trois autres à une fréquence de 1775 MHz), consommant des milliwatts par cœur.

En plus des données sur la consommation de cœur, les puces avaient généralement la même fréquence. Les résultats du test POV-Ray sont légèrement plus élevés, ce qui signifie une consommation d'énergie totale plus élevée avec POV-Ray.

En fin de compte, tout se résume au fait que le test de puissance Prime95 après avoir dépassé le seuil de 20 cœurs environ, ou sur des microcircuits à plusieurs cristaux, ne fonctionne pas comme prévu. À l'avenir, nous utiliserons notre test POV-Ray, qui est capable de tirer davantage parti des processeurs multicœurs modernes.

Consommation principale vs non principale


Revenant au moment où nous avons parlé de la fréquence Infinity Fabric, nous pouvons voir le rapport de consommation d'énergie dans le cadre du test POV-Ray pour 2990WX.



Bien que nous observions quelques écarts par rapport au résultat précédent, les données (en plus de la consommation de pointe) correspondent généralement à notre test de puissance Uncore avec Prime95. Infinity Fabric affiche toujours 55 à 60 watts de puissance. En conséquence, la consommation non nucléaire en pourcentage de la capacité totale commence à 75% avec deux fils, atteint 22% au moment du lancement de 40 fils.

Overclocking: 4,0 GHz pour 500 W


Qui a dit qu'un processeur de 250 W ne devait pas être overclocké? AMD est fier de fabriquer des processeurs, chacun étant vendu avec un multiplicateur déverrouillé, et utilise également du matériau soudé comme interface thermique.

Il est temps de se repentir. Nous n'avons pas eu assez de temps pour l'overclocking. Ce processeur a une fréquence de base de 3,0 GHz, turbo 4,2 GHz. Dans une pièce climatisée utilisant un refroidisseur Enermax Liqtech de 500 W, chargeant tous les cœurs sous POV-Ray, chaque cœur fonctionnait à une fréquence de 3150 MHz, ce qui est très loin de la fréquence turbo. La première chose que j'ai faite a été de définir un turbo à cœur complet à 4,2 GHz, tout comme un simple cœur. Cela a donné une bonne augmentation.

Néanmoins, la prochaine étape de mes expériences d'overclocking m'a surpris. J'ai mis le multiplicateur CPU à 40 x dans le BIOS pour 4,0 GHz sur tous les cœurs, tout le temps. Je n'ai pas régulé la tension, laissant le mode auto. Pour ce faire, j'ai même dû abandonner la carte mère ASUS. Écoutez, le processeur a parfaitement terminé notre suite de tests 4,0 GHz. J'étais choqué.

Tout ce que j'ai fait pour cet overclock était de passer de "auto" à "40". Les tests POV-Ray qui consomment plus d'énergie ont réussi. Chaque test de l'ensemble a fonctionné. Bien que les performances thermiques soient élevées (à charge maximale), le refroidisseur a facilement fait face à cela.



À pleine charge dans le test POV-Ray, le processeur a montré une consommation de 500 watts, le refroidisseur est conçu pour 500 watts. À un moment donné, nous avons vu un bond à 511 W, où 440 W ont été alloués pour les cœurs (ou 13,8 W par cœur) et 63 W pour uncore (IF, IO, IMC), ce qui correspond à 12,5% de la consommation totale l'énergie. Si vous voulez que le refroidisseur intermédiaire consomme moins d'énergie, accélérez le pourcentage!

Ils ont réglé la fréquence sur 4,1 GHz, et cela a semblé fonctionner aussi, jusqu'à ce que nous ayons complètement chargé le système. Comme mentionné ci-dessus, à 4,2 GHz, il n'a pas été possible d'obtenir un résultat de travail, même avec une augmentation de la tension. Pour ceux qui veulent se plonger dans l'overclocking, le refroidissement liquide peut être une solution.

Performance Ă  4,0 GHz


Donc, si la fréquence de tous les cœurs est de 3125 MHz, l'overclocking à 4000 MHz devrait donner une augmentation de 28% des performances, non? Voici les résultats de quelques tests clés de notre package.













L'accélération 2990WX a donné des résultats mitigés. Il a très bien fonctionné dans certains tests, reste à la traîne du 2950X dans d'autres en raison de son architecture à deux modules.

L'overclocking a donné de très bons résultats dans ces tests: Blender montre une augmentation du débit de 19%, POV-Ray - de 19%, 3DPM - de 19%. Dans d'autres tests, il est inférieur au 2950X (Photoscan), toujours derrière (chargement d'application, WinRAR).

L'overclocking ne résoudra pas tous les problèmes de performances du 2990WX, mais il bénéficiera certainement au processeur.

Merci de rester avec nous. Aimez-vous nos articles? Vous voulez voir des matériaux plus intéressants? Soutenez-nous en passant une commande ou en le recommandant à vos amis, une réduction de 30% pour les utilisateurs Habr sur un analogue unique de serveurs d'entrée de gamme que nous avons inventés pour vous: Toute la vérité sur VPS (KVM) E5-2650 v4 (6 cœurs) 10 Go DDR4 240 Go SSD 1 Gbps à partir de 20 $ ou comment diviser le serveur? (les options sont disponibles avec RAID1 et RAID10, jusqu'à 24 cœurs et jusqu'à 40 Go de DDR4).

3 mois gratuits lors du paiement d'un nouveau Dell R630 pour une période de six mois - 2 x Intel Deca-Core Xeon E5-2630 v4 / 128GB DDR4 / 4x1TB HDD ou 2x240GB SSD / 1Gbps 10 TB - à partir de 99,33 $ par mois , uniquement jusqu'à fin août, commandez peut être ici .

Dell R730xd 2 fois moins cher? Nous avons seulement 2 x Intel Dodeca-Core Xeon E5-2650v4 128 Go DDR4 6x480 Go SSD 1 Gbps 100 TV à partir de 249 $ aux Pays-Bas et aux États-Unis! Pour en savoir plus sur la création d'un bâtiment d'infrastructure. classe utilisant des serveurs Dell R730xd E5-2650 v4 coûtant 9 000 euros pour un sou?

Source: https://habr.com/ru/post/fr422207/


All Articles