Luxe inaccessible d'Intel: Core i9-9990XE avec 14 cœurs à une fréquence de 5,0 GHz (1 partie)Tests système
La section "Tests système" se concentre sur les tests en conditions réelles auxquelles le consommateur est confronté, avec un léger biais de débit. Dans cette section, nous examinerons le temps de chargement des applications, le traitement d'images, la physique simple, l'émulation, la modélisation neuronale, les calculs optimisés et le développement de modèles tridimensionnels à l'aide de logiciels facilement accessibles et personnalisables. Bien que certains des tests soient plus faciles à chevaucher avec les capacités de grands produits, tels que PCMark, (nous publions ces valeurs dans la section des tests bureautiques), il vaut toujours la peine d'examiner l'objet testé sous différents angles. Dans tous les tests, nous expliquerons en détail ce qui est testé et comment exactement nous le testons.
Téléchargement d'application: GIMP 2.10.4
L'un des aspects les plus importants de l'expérience utilisateur et du flux de travail est la vitesse du système. Un bon test ici consiste à vérifier les temps de chargement des applications. De nos jours, la plupart des programmes, lorsqu'ils sont stockés sur un SSD, se téléchargent presque instantanément, mais certains outils bureautiques nécessitent un préchargement des ressources avant d'être prêts. La plupart des systèmes d'exploitation utilisent également la mise en cache, donc lorsque certains logiciels sont fréquemment téléchargés (navigateur Web, outils bureautiques), ils peuvent être initialisés beaucoup plus rapidement.
Dans la suite de tests précédente, nous avons vérifié combien de temps il faudrait pour charger un grand PDF dans Adobe Acrobat. Malheureusement, ce test était un cauchemar de programmation et a refusé de passer à Win10 RS3 sans se battre. Entre-temps, nous avons découvert une application capable d'automatiser ce test et décidé d'utiliser GIMP, une application de retouche photo populaire et gratuite. Il s'agit d'un éditeur open source, la principale alternative à Adobe Photoshop. Nous l'avons configuré pour charger un grand modèle de conception de 50 Mo, et avons effectué le chargement 10 fois avec un intervalle de 10 secondes entre eux. En raison de la mise en cache, les 3-5 premiers résultats sont souvent plus lents que les autres, et le temps de mise en cache peut être incohérent, nous prenons donc la moyenne des cinq derniers résultats pour afficher le traitement du processeur pendant le chargement mis en cache.

Le téléchargement d'applications est comme une promenade dans le parc pour le Core i9-9990XE.
FCAT: traitement d'image
Le logiciel FCAT a été conçu pour détecter les micro-sticks, les images perdues et exécuter des tests graphiques lorsque deux cartes vidéo sont combinées pour rendre une scène. En raison des moteurs de jeu et des pilotes graphiques, toutes les combinaisons de GPU ne fonctionnaient pas parfaitement, ce qui a permis au logiciel de capturer les couleurs pour chaque image rendue et d'enregistrer dynamiquement les données RAW à l'aide d'un périphérique de capture vidéo.

Le logiciel FCAT accepte la vidéo enregistrée, dans notre cas, il s'agit de 90 secondes 1440p du jeu Rise of the Tomb Raider, et convertit les données de couleur en données de temps de trame, afin que le système puisse afficher la fréquence de trame «observée» et corréler avec la consommation d'énergie des accélérateurs vidéo. Ce test, en raison de la rapidité avec laquelle il a été effectué, est monothread. Nous commençons le processus et obtenons le temps d'achèvement en conséquence.

FCAT donne des résultats assez égaux pour tous les processeurs, et seulement quelques pour cent partagent tous les composants Intel.
Mouvement de particules 3D v2.1: mouvement brownien
Notre test 3DPM est une référence personnalisée conçue pour modéliser six algorithmes différents pour déplacer des particules dans un espace tridimensionnel. Les algorithmes ont été développés dans le cadre de ma thèse de doctorat et, en fin de compte, fonctionnent mieux sur le GPU, et donnent une bonne idée de la façon dont les flux de commandes sont interprétés par diverses microarchitectures.
La partie clé des algorithmes est la génération de nombres aléatoires - nous utilisons une génération relativement rapide, qui complète la mise en œuvre de chaînes de dépendances dans le code. La principale mise à jour par rapport à la première version primitive de ce code est que le problème de faux partage dans les caches a été résolu, ce qui était le principal goulot d'étranglement. Nous envisageons également d'appliquer les versions AVX2 et AVX512 de ce test pour de futures révisions.
Pour ce test, nous exécutons un stock de particules en utilisant six algorithmes différents, en 20 secondes, avec des pauses de 10 secondes, et rapportons la vitesse totale des particules en millions d'opérations (mouvements) par seconde.

Lorsque nous exécutons le test 3DPM en mode standard, le 9990XE montre à nouveau une légère régression par rapport au 7940X, ce qui peut indiquer que des MHz supplémentaires sont nécessaires pour le maillage.

En utilisant les instructions AVX512, notre 9990XE ouvre ses ailes comme le reste des processeurs Intel HEDT, mais il ne peut monter que sur le 7940X plus lent, malgré le nombre égal de cœurs. Ici, le test limite plus par cœurs que par fréquence, ce qui indique qu'il y a plusieurs arrêts de pipeline dans ce test.
Dolphin 5.0: émulation de console
L'un des tests les plus demandés dans notre package est l'émulation de console. La possibilité de sélectionner un jeu dans un système obsolète et de l'exécuter est très attrayante et dépend des efforts de l'émulateur: un système x86 beaucoup plus puissant est nécessaire pour pouvoir émuler avec précision une ancienne console autre que x86. Surtout si le code de cette console a été fait en tenant compte de quelques défauts physiques et bugs matériels.
Pour notre test, nous utilisons le logiciel d'émulation Dolphin populaire et exécutons un projet informatique à travers lui pour déterminer la précision avec laquelle nos processeurs peuvent émuler la console. Dans ce test, l'émulation Nintendo Wii durera environ 1050 secondes.
La dernière version de Dolphin peut être
téléchargée
Dolphin est un test monothread, nous voyons donc ici les processeurs les plus fréquents d'Intel et d'AMD aux premières places.
DigiCortex 1.20: Modélisation du cerveau d'une limace marine
Cette référence a été initialement conçue pour modéliser et visualiser l'activité des neurones et des synapses dans le cerveau. Le logiciel est livré avec différents modes prédéfinis, et nous avons choisi une petite référence qui simule un cerveau de 32 000 neurones / 1,8 milliard de synapses, ce qui équivaut au cerveau d'une limace de mer.

Nous rapportons les résultats des tests comme une opportunité d'émuler des données en temps réel, donc tous les résultats au-dessus de l '«unité» conviennent pour un fonctionnement en temps réel. Parmi les deux modes, le mode «sans démarrage synapse», difficile pour la DRAM, et le mode «avec démarrage synapse», dans lequel le processeur est chargé, nous sélectionnons ce dernier. Malgré notre choix, le test est toujours affecté par la vitesse de la DRAM.
DigiCortex peut être
téléchargé
DigiCortex aime la fréquence de la mémoire et les vitesses internes plus que la fréquence du cœur pur, et donc le 9990XE ne fonctionne pas très bien ici.
y-Cruncher v0.7.6: calculs optimisés pour la microarchitecture
J'ai entendu parler de y-Cruncher comme un outil pour vous aider à calculer diverses constantes mathématiques. Mais après avoir commencé à parler avec son développeur, Alex Yee, un chercheur du NWU et maintenant un développeur d'optimisation de logiciels, j'ai réalisé qu'il optimisait le logiciel de manière incroyable pour obtenir de meilleures performances. Naturellement, toute simulation qui prend plus de 20 jours bénéficiera d'une augmentation de 1% de la productivité! Alex a commencé à travailler avec y-Cruncher en tant que projet au lycée, et maintenant le projet est à jour. Alex y travaille constamment pour tirer parti des dernières séries d'instructions, avant même qu'elles ne soient disponibles au niveau matériel.
Pour notre test, nous exécutons y-Cruncher v0.7.6 à travers toutes les variantes optimisées possibles de calculs binaires, à un seul thread et à plusieurs threads, y compris les fichiers binaires optimisés pour AVX-512. Le test consiste à calculer 250 millions de caractères du nombre Pi, et nous utilisons des versions monothread et multithread de ce test.
Les utilisateurs peuvent télécharger y-cruncher
sur le site Web d'Alex

y-Cruncher est un test accéléré en utilisant l'AVX-512, et le nouveau processeur à haute fréquence obtient le meilleur résultat dans un test à un seul thread.
Agisoft Photoscan 1.3.3: convertir une image 2D en modèle 3D
Agisoft est l'un des éditeurs de logiciels indépendants avec lesquels nous travaillons depuis plusieurs années. La campagne développe un logiciel appelé PhotoScan, qui convertit une série d'images 2D en modèle 3D. Il s'agit d'un outil important dans le développement et l'archivage de modèles, et s'appuie sur un certain nombre d'algorithmes monothread et multithread pour passer d'un côté du calcul à l'autre.

Dans notre test, nous prenons la version logicielle 1.3.3 avec un grand ensemble de données - photos 84 x 18 mégapixels. Nous exécutons le test selon un ensemble d'algorithmes assez rapide, mais toujours plus rigoureux que notre test de 2017. En conséquence, nous rapportons le temps total d'achèvement du processus.
Le site Web Agisoft Photoscan se trouve
ici.
Agisoft est un test multi-threading, et il semble que le Core i9-9990XE possède la meilleure combinaison de coeurs et de threads.
Tests de bureau
La suite de tests Office est conçue pour se concentrer sur des repères plus standard de l'industrie qui se concentrent sur les flux de travail de bureau. Ce sont des tests plus synthétiques, mais nous testons également les performances du compilateur dans cette section. Pour les utilisateurs qui ont besoin d'évaluer l'équipement dans son ensemble, ce sont généralement les critères les plus importants à considérer.
3DMark Physics: calcul physique dans les jeux
Avec PCMark, il existe un benchmark 3DMark, Futuremark (UL) - un ensemble de tests de jeu. Chaque test de jeu se compose d'une ou deux scènes lourdes pour le GPU, ainsi que d'un test physique, selon le moment où le test a été écrit et la plate-forme qu'il cible. Les principaux sujets de difficulté croissante sont Ice Storm, Cloud Gate, Sky Diver, Fire Strike et Time Spy.
Certains des sous-tests offrent d'autres options, comme Ice Storm Unlimited, qui est conçu pour les plates-formes mobiles avec un rendu hors écran, ou Fire Strike Ultra, qui est conçu pour les systèmes 4K hautes performances avec de nombreuses fonctionnalités supplémentaires. Il convient de noter que Time Spy dispose actuellement du mode AVX-512 (que nous pourrons utiliser à l'avenir).



Dans des tests plus simples comme Ice Storm, avoir la fréquence la plus élevée fait du 9990XE le meilleur calculateur physique que nous ayons.
GeekBench4: Test synthétique
Un outil commun pour les tests multiplateformes sur les appareils mobiles, PC et Mac, GeekBench 4 est le test synthétique parfait d'un système utilisant une gamme d'algorithmes qui nécessitent une bande passante maximale. Les tests incluent le chiffrement, la compression, la transformation de Fourier rapide, les opérations de mémoire, la physique des n-corps, les opérations matricielles, la manipulation de l'histogramme et l'analyse HTML.
J'inclus ce test en raison de la popularité de la requête, bien que les résultats soient très synthétiques. De nombreux utilisateurs attachent souvent une grande importance à ses résultats en raison du fait qu'il a été compilé sur différentes plates-formes (bien qu'avec différents compilateurs).
Nous enregistrons les notes des principaux sous-tests (Crypto, Integer, Floating Point, Memory) dans notre base de données de résultats de test, mais pour la revue, nous ne publions que des résultats généraux à un seul thread et à plusieurs threads.


Tests Web et tests hérités
En raison de leur concentration sur les systèmes bas de gamme ou les systèmes à petit facteur de forme, les tests Web sont généralement difficiles à standardiser. Les navigateurs Web modernes sont souvent mis à jour, ce qui rend impossible la désactivation de ces mises à jour, il est donc difficile de maintenir une sorte de plate-forme commune. Le rythme rapide du développement du navigateur signifie que les versions (et les indicateurs de performance) peuvent changer d'une semaine à l'autre. Malgré cela, les tests Web sont souvent un indicateur important pour les utilisateurs: une grande partie du travail de bureau actuel est liée aux applications Web, en particulier les applications électroniques et bureautiques, ainsi qu'aux interfaces et aux environnements de développement. Notre suite de tests Web comprend plusieurs tests standard de l'industrie, ainsi que plusieurs tests populaires mais quelque peu dépassés.
Nous avons également inclus nos tests obsolètes mais toujours populaires dans cette section.
WebXPRT 3: tâches Web du monde moderne, y compris l'IA
La société derrière la suite de tests XPRT, Principled Technologies, a récemment publié le dernier test Web, et au lieu d'ajouter un an au nom, ils l'ont simplement appelé «3». Ce dernier test (du moins pour l'instant) a été développé sur la base de ces prédécesseurs: tests d'interaction utilisateur, informatique de bureau, graphisme, listes de tri, HTML5, manipulation d'images et, dans certains cas, même tests d'IA.
Pour notre référence, nous effectuons un test standard, qui établira la liste de contrôle sept fois et donnera le résultat final. Nous effectuons un tel test quatre fois et affichons la valeur moyenne.
Les utilisateurs peuvent accéder au test WebXPRT
à
WebXPRT 2015: Test de HTML5 et Javascript Web UX
L'ancienne version de WebXPRT est l'édition 2015, qui se concentre sur un ensemble légèrement différent de technologies et de cadres Web, qui, cependant, sont utilisés aujourd'hui. Il s'agit toujours d'un test pertinent, en particulier pour les utilisateurs qui n'interagissent pas avec les dernières applications Web du marché, et il existe de nombreux utilisateurs de ce type. Le développement de frameworks web est très rapide et très fluide. Les frameworks sont rapidement développés, intégrés aux applications, utilisés, puis les développeurs passent à la suivante. L'adaptation de l'application au nouveau framework est une tâche difficile, surtout avec une telle rapidité des cycles de développement. Pour cette raison, de nombreuses applications sont «bloquées dans le temps» et restent pertinentes pour les utilisateurs pendant de nombreuses années.
Comme dans le cas de WebXPRT3, le benchmark principal remplit le contrôle défini sept fois, affichant le résultat final. Nous répétons cela quatre fois, affichons la moyenne et montrons les résultats finaux.

Compteur de vitesse 2: cadres Javascript
Notre plus récent test Web est Speedometer 2, qui parcourt un certain nombre de cadres javascript pour faire seulement trois choses simples: créer une liste, inclure chaque élément dans la liste et supprimer la liste. Tous les frameworks implémentent les mêmes signaux visuels, mais, évidemment, ils le font de différentes manières.
Notre test passe toute la liste des frameworks et donne la note finale sous le nom de "rpm", l'un des indicateurs de référence internes. Nous affichons cet indicateur comme résultat final.

Google Octane 2.0: Core Web Compute
Un test Web populaire depuis plusieurs années, mais qui n'est plus mis à jour, est Octane de Google. La version 2.0 effectue quelques dizaines de tâches liées aux calculs, telles que les expressions régulières, la cryptographie, le lancer de rayons, l'émulation et le calcul des équations de Navier-Stokes.
Le test donne une évaluation à chacun des sous-tests et renvoie la moyenne géométrique comme résultat final. Nous effectuons un benchmark complet quatre fois et évaluons les résultats finaux.

Mozilla Kraken 1.1: Core Web Compute
Encore plus ancien qu'Octane, voici Kraken, cette fois développé par Mozilla. Il s'agit d'un ancien test qui effectue des mécanismes de calcul relativement uniformes, tels que le traitement audio ou le filtrage d'image. Il semble que Kraken produise un résultat très instable, selon la version du navigateur, car ce test est hautement optimisé.
Le benchmark principal passe par chacun des sous-tests dix fois et renvoie le temps moyen d'achèvement de chaque cycle en millisecondes. Nous exécutons le benchmark complet quatre fois et mesurons le résultat moyen.

3DPM v1: Variante de code naïve de 3DPM v2.1.
Le premier test «hérité» du package est la première version de notre test 3DPM. Il s'agit de la version native finale du code, comme s'il avait été écrit par un scientifique sans savoir comment fonctionne le matériel informatique, les compilateurs ou l'optimisation (comme c'était le cas au tout début). Le test est une grande quantité de modélisation scientifique dans la nature, où la réponse est plus importante que la vitesse des calculs (obtenir le résultat en 4 jours est acceptable si le résultat est correct; une année d'apprentissage pour programmer et obtenir le résultat en 5 minutes n'est pas acceptable).
Dans cette version, la seule véritable optimisation était dans les drapeaux du compilateur (-O2, -fp: fast): compilation en mode release et activation d'OpenMP dans les principaux cycles de calcul. Les boucles n'étaient pas dimensionnées pour les fonctions, et le ralentissement le plus grave est le faux partage dans le cache. Le code a également de longues chaînes de dépendances basées sur la génération de nombres aléatoires, ce qui conduit à une dégradation des performances sur certaines microarchitectures informatiques.
3DPM v1 ainsi que 3DPM v2 peuvent être téléchargés ici: 3DPMv2.1.rar (13,0 Mo)


x264 HD 3.0: test de transcodage hérité
Ce test de transcodage est très ancien; Anandtech l'a utilisé à l'époque des processeurs Pentium 4 et Athlon II. Dans ce document, la vidéo 720p normalisée est codée avec une double conversion, et l'indice de référence affiche les images par seconde de chaque passage. Le test est monothread, et dans certaines architectures, nous rencontrons des restrictions IPC - instructions par horloge.


Consommation électrique, fréquences et spécifications thermiques
Nous avons consacré plusieurs articles à examiner pourquoi les nombres TDP indiqués sur la boîte sont inutiles pour la plupart des utilisateurs: le faible TDP d'Intel est qu'il montre le refroidissement nécessaire pour faire fonctionner le processeur à la fréquence de base. « » — , , (- ), .
Core i9-9990XE , , 14 4,0 , , 255 . ICC 5,0 «» . , 4,0 , 5,0 .
ICC , , - «Turbo», , . 1,2 , 1,29 , . : 266 , 24 ° C 20 ° C. , - , Intel . mesh , 900 .
, Cinebench R20, , 5,0 . , Speed Shift, Intel 5,0 . CB20, , 600 , , 5,0 334 — , - mesh, - . mesh 2,4 .
, 1U , . , , , . , 81C, 1.290 . 14- 5,0 .

: . ICC 1,75- -, 350–400 , , . , . 78 1 (30 ) . , - 1U, , - , . , , .
AVX-512. 3,8 , -12. , Intel, , AVX-512, , , , . 600 , — 82C.
- — , . , OEM- , , « MSRP, » — .
Intel Core i9-9990XE:
Intel Core i9-9990XE . CES , : 14- 5,0 OEM- . Intel , , , , , .

, ( ) , . , CaseKing , ( 1 ) -, 2999 ( — 2849 ), ( ) . Puget Systems, ICC, Intel, , . ICC 1U .

, . , 400 - 1,75 . : 78 , , . , 1U, , — . , tower, , 28- Xeon W-3175X, , .
, ICC . 32 DDR4, DDR4-3600 . SSD GPU, - . - Core i9-9990XE — . Intel Core , Xeon W-3175X, 28- , , Core i9-9990XE , . , — Core i9-9990XE . : mesh , - .
AMD, 5,0 , . AMD 32- Threadripper, : 14 5,0 32 ~ 3,4 , 2990WX «» , , AVX2 / AVX512, Core i9-9990XE .
, , . W-3175X $ 3000, i9-9990XE, ECC , . 2990WX — NUMA, . , i9-9990XE , 2990WX 30-40%.

8- Intel 5,0 , Core i9-9900KS. , 16 PCIe 3.0, $ 513 (30 ). , 5,0 (. . ), , , 9900KS , 9990XE, , , .
, Core i9-9990XE: Intel , , . , , , . , Intel ( - ). Intel , . , , , . , Core i9-9900KS , .
, Core i9-9990XE . , . Robot Wars () BattleBots (): - , , . -, , , , - .
:)
, . ? ? Soutenez-nous en passant une commande ou en le recommandant à vos amis,
cloud VPS pour les développeurs à partir de 4,99 $ , une
réduction de 30% pour les utilisateurs Habr sur un analogue unique de serveurs d'entrée de gamme que nous avons inventé pour vous: toute la vérité sur VPS (KVM) E5-2650 v4 (6 Cœurs) 10 Go DDR4 240 Go SSD 1 Gbps à partir de 20 $ ou comment partager un serveur? ( RAID1 RAID10, 24 40GB DDR4).
Dell R730xd 2 fois moins cher? 2 Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 $199 ! Dell R420 — 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB — $99! . c Dell R730xd 5-2650 v4 9000 ?