Partie 1 →
Partie 2 →
Partie 3 →
Partie 4 →
Partie 5Tests HEDT: tests système
La section "Tests système" se concentre sur les tests en conditions réelles auxquelles le consommateur est confronté. Dans cette section, nous examinons les temps de chargement des applications, le traitement d'images, la physique simple, l'émulation, la modélisation neuronale, l'informatique optimisée et le développement de modèles tridimensionnels, à l'aide de logiciels facilement accessibles et personnalisables. Bien que certains des tests soient plus faciles à chevaucher avec les capacités de gros packages tels que PCMark (nous publions ces valeurs dans la section des tests bureautiques), cela vaut la peine d'envisager différentes perspectives. Dans tous les tests, nous expliquerons en détail ce qui est exactement testé et comment nous effectuons les tests.
Téléchargement d'application: GIMP 2.10.4
L'un des aspects les plus importants de l'expérience utilisateur et du flux de travail est la vitesse du système. Dans ce cas, un bon test consiste à vérifier les temps de chargement des applications. De nos jours, la plupart des programmes sont stockés sur un SSD et chargés presque instantanément, mais certains outils bureautiques nécessitent un préchargement des ressources. La plupart des systèmes d'exploitation utilisent la mise en cache, donc lorsque certains logiciels sont téléchargés fréquemment (navigateur Web, outils bureautiques), ils peuvent être initialisés beaucoup plus rapidement.
Dans la suite de tests précédente, nous avons vérifié le temps nécessaire pour charger un grand document PDF dans Adobe Acrobat. Malheureusement, ce test a été un cauchemar de programmation et a refusé de passer à Win10 RS3 sans se battre. En attendant, nous avons découvert une application qui peut automatiser ce test, les piloter GIMP. GIMP est une application de retouche photo populaire et gratuite, c'est un éditeur open source et la principale alternative à Adobe Photoshop. Nous l'avons configuré pour télécharger un grand modèle de conception de 50 Mo, effectué le chargement 10 fois avec un intervalle de 10 secondes entre eux. En raison de la mise en cache, les 3-5 premiers résultats sont plus lents que les suivants; le temps de mise en cache peut être incohérent. Par conséquent, nous dérivons la valeur moyenne des cinq derniers résultats pour montrer le traitement CPU pendant le chargement en cache.

Ce benchmark divisait parfaitement les candidats en deux catégories: les processeurs avec un petit nombre de cœurs d'un côté et les meilleurs processeurs de bureau de l'autre. Les 1920X et 2950X ont performé rapidement, tandis que les Intel 18 cœurs et AMD 32 cœurs sont plus lents. Cela est probablement dû à la différence de performances d'un cœur, mais je pense que le résultat pourrait être affecté par la latence de la mémoire.
FCAT: traitement d'image
Le logiciel FCAT a été conçu pour détecter les micro-sticks, les images perdues, exécuter des tests graphiques lorsque deux cartes vidéo sont combinées ensemble pour rendre une scène. En raison des moteurs de jeu et des pilotes graphiques, toutes les combinaisons de GPU ne fonctionnaient pas parfaitement, ce qui a permis au logiciel de capturer les couleurs pour chaque image rendue et d'enregistrer dynamiquement les données RAW à l'aide d'un périphérique de capture vidéo.

Le logiciel FCAT accepte la vidéo enregistrée, dans notre cas, il s'agit de 90 secondes 1440p du jeu Rise of the Tomb Raider, et convertit les données de couleur en données de temps de trame, afin que le système puisse afficher la fréquence de trame «observée» et corréler avec la consommation d'énergie des accélérateurs vidéo. Ce test, en raison de la rapidité avec laquelle il a été effectué, est monothread. Nous commençons le processus et, par conséquent, nous obtenons le temps d'achèvement.

Tous les systèmes de test fonctionnent à peu près de la même manière, mais les performances d'un seul processeur plus rapides d'Intel le placent plus haut que les autres processeurs. EPYC 7601 est le dernier sur la liste en raison de la faible fréquence d'un seul cœur.
Mouvement de particules 3D v2.1: mouvement brownien
Notre test 3DPM est une référence personnalisée conçue pour modéliser six algorithmes différents pour déplacer des particules dans un espace tridimensionnel. Les algorithmes ont été développés dans le cadre de ma thèse de doctorat et, en fin de compte, fonctionnent mieux sur le GPU, donnent une bonne idée de la façon dont les flux de commandes sont interprétés par différentes microarchitectures.
La partie clé des algorithmes est la génération de nombres aléatoires - nous utilisons une génération relativement rapide, qui complète la mise en œuvre de chaînes de dépendances dans le code. La mise à jour principale par rapport à la première version primitive de ce code - le problème de faux partage dans les caches a été résolu, c'était le principal goulot d'étranglement. Nous envisageons d'appliquer les versions AVX2 et AVX512 de ce test pour de futures révisions.
Pour ce test, nous exécutons un stock de particules en utilisant six algorithmes différents pendant 20 secondes avec des pauses de 10 secondes, et rapportons la vitesse totale des particules en millions d'opérations (mouvements) par seconde.

3DPM semble aimer les flux et la fréquence, c'est pourquoi AMD occupe les quatre premières places. Même le dernier processeur 16 cœurs d'AMD surpasse le processeur 18 cœurs d'Intel dans ce test, en utilisant des instructions autres que AVX. Il est intéressant de voir une comparaison entre 2990WX et EPYC 7601 - la fréquence supplémentaire sur le processeur grand public permet d'augmenter la productivité de 30% +.
Dolphin 5.0: émulation de console
L'un des tests les plus demandés dans notre package est l'émulation de console. La possibilité de sélectionner un jeu dans un système obsolète et de l'exécuter est très attrayante et dépend des efforts de l'émulateur: un système x86 beaucoup plus puissant est nécessaire pour pouvoir émuler avec précision une ancienne console autre que x86. Surtout si le code de cette console a été fait en tenant compte de quelques défauts physiques et bugs matériels.
Pour notre test, nous utilisons le logiciel d'émulation Dolphin populaire et exécutons un projet informatique à travers lui pour déterminer la précision avec laquelle nos processeurs peuvent émuler la console. Dans ce test, l'émulation Nintendo Wii durera environ 1050 secondes.

Les performances de Dolphin dépendent généralement de spécifications à fil unique, donc Intel est à nouveau en tête, bien qu'il soit étrange que le R7 2700X prenne la dernière place. Pour éliminer le résultat erroné, je dois recommencer ce test. Cependant, sur les pièces TR de deuxième génération, la fréquence d'horloge plus élevée du 2950X lui permet de dépasser le 2990WX de 20 secondes.
DigiCortex 1.20: Modélisation du cerveau des mollusques
Cette référence a été initialement conçue pour modéliser et visualiser l'activité des neurones et des synapses dans le cerveau. Le logiciel est livré avec différents modes prédéfinis, nous avons choisi une petite référence qui simule un cerveau de 32 000 neurones / 1,8 milliard de synapses, ce qui équivaut à un cerveau de palourde.

Tous les résultats supérieurs aux «unités» conviennent à un fonctionnement en temps réel. Parmi les deux modes, le mode «sans démarrage synapse», difficile pour la DRAM, et le mode «avec démarrage synapse», dans lequel le processeur est chargé, nous sélectionnons ce dernier. Malgré notre choix, le test est toujours affecté par la vitesse de la DRAM.

Les processeurs à quatre matrices avec un grand nombre de cœurs sont largement en avance, bien que l'EPYC 7601 à basse fréquence le place sur la liste des perdants. Il semble que la latence supplémentaire de la structure à deux modules du 2990WX n'ait pas trop nui aux résultats, on soupçonne des performances supplémentaires.
y-Cruncher v0.7.6: calculs optimisés pour la microarchitecture
J'ai entendu parler de y-Cruncher comme un outil pour aider à calculer diverses constantes mathématiques. Mais après avoir parlé avec son développeur Alex Yee (chercheur NWU et développeur d'optimisation de logiciels), j'ai réalisé qu'il avait optimisé le logiciel de manière incroyable pour obtenir les meilleures performances. Toute simulation qui prend plus de 20 jours bénéficiera d'une augmentation de 1% de la productivité! Alex a commencé à travailler avec y-Cruncher en tant que projet au lycée, mais maintenant le projet est pertinent.
Pour notre test, nous exécutons y-Cruncher v0.7.6 à travers toutes les variantes optimisées possibles de calculs binaires, à un seul thread et à plusieurs threads, y compris les fichiers binaires optimisés pour AVX-512. Le test consiste à calculer 250 millions de caractères du nombre Pi, nous utilisons des versions mono-thread et multi-thread de ce test.


Le logiciel Intel est bien optimisé pour les instructions AVX2 et AVX512, et nous utilisons ce jeu d'instructions dans un test monothread. Cependant, lorsque nous chargeons de nouveaux cœurs et canaux de mémoire, les deux processeurs AMD à 32 cœurs semblent dignes de concurrents du Core i9, compte tenu du coût.
Agisoft Photoscan 1.3.3: convertir une image 2D en modèle 3D
Agisoft est l'un des éditeurs de logiciels indépendants avec lesquels nous travaillons depuis plusieurs années. La campagne développe un logiciel appelé PhotoScan, qui convertit une série d'images 2D en modèle 3D. Il s'agit d'un outil important dans le développement et l'archivage de modèles, et s'appuie sur un certain nombre d'algorithmes monothread et multithread pour passer d'un côté du calcul à l'autre.

Dans notre test, nous prenons la version 1.3.3 du logiciel avec un grand ensemble de données - photos 84 x 18 mégapixels. Nous effectuons un test en utilisant un ensemble d'algorithmes assez rapide. Le test est encore plus exigeant que son ancêtre de 2017. En conséquence, nous rapportons le temps total d'achèvement du processus.

Le 2990WX est laissé de côté car il a des cœurs qui ne peuvent pas accéder à la mémoire assez rapidement. A titre de comparaison, l'EPYC 7601 avec deux fois le canal mémoire fonctionne presque 500 secondes (20% +) plus rapidement. Par conséquent, si le 2990WX reçoit des canaux de mémoire supplémentaires, il pourra être en tête de liste.
Fait intéressant, le TR 1950X contourne le TR 2950X, qui a une meilleure latence de cache et une fréquence plus élevée dans tous les scénarios. Pourquoi est-ce un mystère?
Benchmarks HEDT: tests de rendu
Dans un environnement professionnel, le rendu est souvent une préoccupation majeure pour les charges de travail du processeur. Il est utilisé dans différents formats: du rendu 3D à la pixellisation, dans des tâches telles que les jeux ou le lancer de rayons, il utilise la capacité d'un logiciel à gérer les maillages, les textures, les collisions, les alias et la physique (en animation). La plupart des moteurs de rendu proposent du code pour le processeur, tandis que certains utilisent des GPU et choisissent des environnements utilisant des FPGA ou des ASIC spécialisés. Pour les grands studios, les processeurs restent le matériel principal.
Corona 1.3: Performance Render
Un rendu amélioré optimisé pour les performances de logiciels tels que 3ds Max et Cinema 4D, le test Corona rend une scène générée de la version 1.3 standard. Habituellement, la mise en œuvre du benchmark GUI montre le processus de construction de la scène, permet à l'utilisateur de voir le résultat comme «le temps de terminer».

Nous avons contacté le développeur, il nous a donné une version en ligne de commande du test, qui fournit une sortie directe des résultats. Au lieu du temps nécessaire à la construction de la scène, nous rapportons le nombre moyen de rayons par seconde sur six cycles, car le rapport des actions terminées aux unités de temps est visuellement plus facile à comprendre.

AMD a donc déchiré notre moteur graphique. Parce que nous montrons le résultat du test Corona en faisceaux par seconde, ayant un total de 12 millions, qui transfère huit chiffres à notre moteur, qui essaie ensuite de l'interpréter comme une représentation exponentielle du nombre (1,2 x 10 ^ 7), qu'il ne peut pas afficher sur le graphique . Nous avons dû convertir ce graphique en millions de faisceaux par seconde afin de faire fonctionner le moteur.
2990WX est en avance avec 32 cœurs en raison de sa haute fréquence, il est bien en avance sur le processeur EPYC. EPYC et Core i9 sont proches, mais le TR2950X est la moitié du prix.
Blender 2.79b: Suite de création 3D
Un outil de rendu haut de gamme, Blender est un produit open source avec de nombreux paramètres et configurations et est utilisé par de nombreux studios d'animation haut de gamme à travers le monde. L'organisation a récemment publié une suite de tests Blender, un nouveau test peut prendre plus d'une heure. Pour obtenir les résultats, nous exécutons l'un des sous-tests de ce package via la ligne de commande - la scène standard "bmw27" en mode "CPU uniquement", nous mesurons le temps d'achèvement du rendu.

Des cœurs supplémentaires permettent au 2990WX de devancer EPYC et Core i9. 2990WX + 58% de débit supplémentaire par rapport au Core i9.
LuxMark v3.1: LuxRender via divers chemins de code
Il existe de nombreuses façons différentes de gérer les données de rendu: CPU, GPU, Accelerator et autres. De plus, il existe de nombreux frameworks et API. LuxMark - une référence développée à l'aide du moteur LuxRender, propose plusieurs scènes et API différentes.
extrait de la version Linux de LuxMarkDans notre test, nous exécutons une simple scène «Ball» en utilisant le code C ++ et OpenCL, mais en mode CPU. Cette scène commence par un rendu approximatif et améliore lentement sa qualité en deux minutes. Pris est le taux moyen du nombre de kilo-rayons par seconde.


Pour une raison quelconque, les processeurs Intel Skylake-X échouent dans nos tests d'OpenCL. Dans le test C ++, des contrôleurs de mémoire supplémentaires sur le processeur EPYC l'ont placé sur TR2 et Core i9. 2990WX et Core i9 sont presque égaux.
POV-Ray 3.7.1: lancer de rayons
Le moteur de traçage des rayons Persistance de la vision est un autre outil d'analyse comparative bien connu qui a été mis en veille prolongée pendant un certain temps jusqu'à ce qu'AMD libère ses processeurs Zen. Soudain, Intel et AMD ont commencé à insérer du code dans la branche principale d'un projet open source. Pour notre test, nous utilisons le test intégré pour tous les cœurs, appelé depuis la ligne de commande.

C'est un autre test qui aime les cœurs et la fréquence, c'est ce que possède le 2990WX. Le 2990WX peut terminer le test en près de 20 secondes. Il est peut-être temps pour un test intégré plus important.
Benchmarks HEDT: Tests Office
Suite de tests Office - Un ensemble de références standard de l'industrie qui se concentrent sur les flux de travail de bureau. Ce sont des tests synthétiques, + nous vérifions les performances du compilateur dans cette section. Pour évaluer l'équipement dans son ensemble, ces critères sont importants pour les utilisateurs.
PCMark 10: standard de l'industrie
Futuremark, maintenant connu sous le nom UL, a développé des tests qui sont les normes de l'industrie depuis plus de deux décennies. Le dernier ensemble de tests système est PCMark 10. Ici, par rapport à PCMark 8, plusieurs tests sont améliorés, plus d'attention est accordée à OpenCL, et en particulier dans des cas tels que le streaming vidéo.
PCMark divise ses notes en environ 14 domaines différents, y compris le lancement d'applications, les pages Web, les feuilles de calcul, l'édition de photos, le rendu, la vidéoconférence et la physique. Nous publions toutes ces données dans notre base de données Bench. Un indicateur clé de l'examen en cours est le score global.

L'un des inconvénients de PCMark est qu'il semble collecter tous les résultats, produisant une valeur moyenne dans toutes les directions. Fait intéressant, les processeurs Intel sont laissés pour compte, les 2950X et 2700X sont au sommet.
Compilation de chrome: Windows VC ++ Compilation de Chrome 56
Un grand nombre de lecteurs AnandTech sont des ingénieurs logiciels qui observent le fonctionnement du matériel. La compilation du noyau Linux est «standard» pour les réviseurs qui compilent souvent. Mais notre test est un peu plus diversifié - nous utilisons des instructions Windows pour compiler Chrome, en particulier la version Chrome du 56 mars 2017. Les instructions de Google sur la façon de compiler sous Windows après avoir téléchargé 400 000 fichiers à partir du référentiel sont assez détaillées.
Dans notre test, en suivant les instructions de Google, nous utilisons le compilateur MSVC et ninja pour contrôler la compilation. Comme vous pouvez vous y attendre, il s'agit d'un test avec multithreading variable, avec des exigences variables pour la DRAM, qui bénéficient de caches plus rapides. Les résultats des tests sont le temps passé à compiler, que nous convertissons en nombre de compilations par jour.

Ce test est une si belle combinaison de flux ST, MT et de mémoire limitée qu'il est vraiment intéressant de voir le résultat final. Malheureusement, pour notre nouveau package, les fichiers de sortie n'étaient pas configurés correctement, donc malgré l'achèvement du test, nous n'avons obtenu que quelques résultats. Mais même cela démontre une métrique intéressante: le 2950X se démarque du 2990WX avec le Core i9, mais le système EPYC effleure les arrière en raison de ses basses fréquences.
3DMark Physics: calcul physique dans les jeux
Avec PCMark, il existe un benchmark 3DMark, Futuremark (UL) - un ensemble de tests de jeu. Chaque test de jeu se compose d'une ou deux scènes lourdes pour le GPU, ainsi que d'un test physique, selon le moment où le test a été écrit et la plate-forme qu'il cible. Les principaux sujets de difficulté croissante sont Ice Storm, Cloud Gate, Sky Diver, Fire Strike et Time Spy.
Certains des sous-tests offrent d'autres options, comme Ice Storm Unlimited ou Fire Strike. Ice Storm Unlimited est conçu pour les plateformes mobiles avec un rendu hors écran. Fire Strike Ultra est conçu pour les systèmes 4K hautes performances avec de nombreuses fonctionnalités supplémentaires. Il convient de noter que Time Spy dispose actuellement du mode AVX-512 (que nous pourrons utiliser à l'avenir).
Quant à nos tests, nous envoyons les résultats de chaque test physique à Bench, mais pour la revue nous prenons les résultats des scènes les plus exigeantes: Ice Storm Unlimited, Cloud Gate, Sky Diver, Fire Strike Ultra et Time Spy,





Dans les tests de jeu, il n'est pas si évident que la présence de gros processeurs avec de nombreux cœurs ne profite pas particulièrement aux performances. La physique des jeux préfère clairement la bande passante mémoire. Nous savons que Time Spy n'est pas conçu pour évoluer avec plus de 10 cœurs, et nous voyons que le processeur à 10 cœurs est en premier lieu. , , .
GeekBench4:
, Mac, GeekBench 4 — , . , , , , n-, , HTML.
, . - , ( ).
(Crypto, Integer, Floating Point, Memory) , .


HEDT Benchmarks: Encoding Tests
, , . , , , , , , , . , , .
Handbrake 1.1.0:
, Handbrake — , , , . . , AVX-512 OpenCL . , , CPU, .
Handbrake , - Logitech C920 1080p60 ( , ). . :
- 720p60 at 6000 kbps constant bit rate, fast setting, high profile
- 1080p60 at 3500 kbps constant bit rate, faster setting, main profile
- 1080p60 HEVC at 3500 kbps variable bit rate, fast setting, main profile



, . Core i9, AVX2, . AMD, , , 1950X 2700X . , 2950X , , Core i9, , 1950X. 2990WX .
7-zip v1805:
/ 7-zip , . , . .
, : . , , Windows Scheduler . , .



, . , , 2990WX, , , AMD. Phoronix, Linux.
, . 32- AMD , 16- 18- .
, , . .
WinRAR 5.60b3:
, WinRAR. . , right-click Windows . , , 30 60- 2000 -, .
WinRAR , , 10 , .

, . R7 2700X AMD, — 10- Intel. , 8700K, , . AMD , 32- .
AES:
, , . Windows BitLocker Microsoft ( ). AES discontinued TrueCrypt , .
, — AES / , . AES, , AVX-512.

, . , , 2990WX . EPYC 7601 , 1950X. 2950X, , , 18- Core i9 Intel.
HEDT Benchmarks: -
low-end small form factor , -, , . - , , - . , ( ) . , - . - , , , .
, .
WebXPRT 3: - ,
, XPRT, Principled Technologies, -, , , «3». ( , ) : , , , , HTML5, , .
, . , .

WebXPRT 2015: HTML5 Javascript Web UX
WebXPRT — 2015 , - . - , , - . - . , , , . — , . « » .
WebXPRT3, , . , .

Speedometer 2: Javascript Frameworks
- — Speedometer 2, javascript, : , . , , , -.
«rpm», . .

Google Octane 2.0: Core Web Compute
- , — Octane Google. 2.0 , , , , , — .
. .

Mozilla Kraken 1.1: Core Web Compute
Encore plus ancien qu'Octane, voici Kraken, cette fois développé par Mozilla. Il s'agit d'un ancien test qui effectue des mécanismes de calcul relativement uniformes, tels que le traitement audio ou le filtrage d'image. Le test Kraken est hautement optimisé et produit un résultat très instable, selon la version du navigateur.
Le benchmark principal passe par chacun des sous-tests dix fois et renvoie le temps moyen d'achèvement de chaque cycle en millisecondes. Nous exécutons le benchmark complet quatre fois, mesurons le résultat moyen.

3DPM v1: une variante de 3DPM v2.1 avec du code natif
Le premier test «hérité» du package est la première version de notre test 3DPM. Il s'agit de la version native finale du code, comme s'il avait été écrit par un scientifique sans savoir comment fonctionne le matériel informatique, les compilateurs ou l'optimisation (comme c'était le cas au tout début). Le test représente une grande quantité de modélisation scientifique dans la nature, où obtenir une réponse est plus important que la vitesse de calcul.
Dans cette version, la seule véritable optimisation était dans les drapeaux du compilateur (-O2, -fp: fast): compilation en mode release et activation d'OpenMP dans les principaux cycles de calcul. Les boucles n'étaient pas dimensionnées pour les fonctions, et le ralentissement le plus grave est le faux partage dans le cache. Le code a de longues chaînes de dépendances basées sur la génération de nombres aléatoires, ce qui conduit à une diminution des performances sur certaines microarchitectures informatiques.


x264 HD 3.0: test de transcodage hérité
Ce test de transcodage est très ancien; Anandtech l'a utilisé à l'époque des processeurs Pentium 4 et Athlon II. Dans ce document, la vidéo 720p normalisée est codée avec une double conversion, et l'indice de référence affiche les images par seconde de chaque passage. Le test est monothread, et dans certaines architectures, nous rencontrons des restrictions IPC - instructions par horloge.


Merci de rester avec nous. Aimez-vous nos articles? Vous voulez voir des matériaux plus intéressants? Soutenez-nous en passant une commande ou en le recommandant à vos amis, une
réduction de 30% pour les utilisateurs Habr sur un analogue unique de serveurs d'entrée de gamme que nous avons inventés pour vous: Toute la vérité sur VPS (KVM) E5-2650 v4 (6 cœurs) 10 Go DDR4 240 Go SSD 1 Gbps à partir de 20 $ ou comment diviser le serveur? (les options sont disponibles avec RAID1 et RAID10, jusqu'à 24 cœurs et jusqu'à 40 Go de DDR4).
3 mois gratuits lors du paiement d'un nouveau Dell R630 pour une période de six mois -
2 x Intel Deca-Core Xeon E5-2630 v4 / 128GB DDR4 / 4x1TB HDD ou 2x240GB SSD / 1Gbps 10 TB - à partir de 99,33 $ par mois , uniquement jusqu'à fin août, commandez peut être
ici .
Dell R730xd 2 fois moins cher? Nous avons seulement
2 x Intel Dodeca-Core Xeon E5-2650v4 128 Go DDR4 6x480 Go SSD 1 Gbps 100 TV à partir de 249 $ aux Pays-Bas et aux États-Unis! Pour en savoir plus sur la
création d'un bâtiment d'infrastructure. classe utilisant des serveurs Dell R730xd E5-2650 v4 coûtant 9 000 euros pour un sou?