Plus de café, moins de caféine: Intel 9e génération (partie 2)

Partie 1 → Partie 2 → Partie 3 → Partie 4

Tests système



La section "Tests système" se concentre sur les tests en conditions réelles auxquelles le consommateur est confronté, avec un léger biais de débit. Dans cette section, nous examinerons le temps de chargement des applications, le traitement d'images, la physique simple, l'émulation, la modélisation neuronale, les calculs optimisés et le développement de modèles tridimensionnels à l'aide de logiciels facilement accessibles et personnalisables. Bien que certains des tests soient plus faciles à chevaucher avec les capacités de gros packages tels que PCMark (nous publions ces valeurs dans la section des tests bureautiques), cela vaut la peine d'envisager différentes perspectives. Dans tous les tests, nous expliquerons en détail ce qui est testé et comment exactement nous le testons.

Téléchargement d'application: GIMP 2.10.4


L'un des aspects les plus importants de l'expérience utilisateur et du flux de travail est la vitesse du système. Un bon test ici consiste à vérifier les temps de chargement des applications. De nos jours, la plupart des programmes, lorsqu'ils sont stockés sur un SSD, se téléchargent presque instantanément, mais certains outils bureautiques nécessitent un préchargement des ressources avant d'être prêts. La plupart des systèmes d'exploitation utilisent également la mise en cache, donc lorsque certains logiciels sont fréquemment téléchargés (navigateur Web, outils bureautiques), ils peuvent être initialisés beaucoup plus rapidement.

Dans la suite de tests précédente, nous avons vérifié combien de temps il faudrait pour charger un grand PDF dans Adobe Acrobat. Malheureusement, ce test était un cauchemar de programmation et a refusé de passer à Win10 RS3 sans se battre. En attendant, nous avons découvert une application capable d'automatiser ce test, il a été décidé d'utiliser GIMP, une application de retouche photo populaire et gratuite. Il s'agit d'un éditeur open source, la principale alternative à Adobe Photoshop. Nous l'avons configuré pour télécharger un grand modèle de conception de 50 Mo, effectué le chargement 10 fois avec un intervalle de 10 secondes entre eux. En raison de la mise en cache, les 3-5 premiers résultats sont souvent plus lents que les autres, et le temps de mise en cache peut être incohérent, nous prenons donc la moyenne des cinq derniers résultats pour afficher le traitement du processeur pendant le chargement en cache.



Le chargement d'application, en règle générale, est limité à un seul thread, mais il est évident qu'à un moment donné, il est limité aux ressources du noyau. Ayant accès à plus de ressources par flux (dans un environnement sans HT), les processeurs 8C / 8T et 6C / 6T sont en avance sur les deux processeurs 5,0 GHz dans nos tests.

FCAT: traitement d'image


Le logiciel FCAT a été conçu pour détecter les micro-sticks, les images perdues et exécuter des tests graphiques lorsque deux cartes vidéo sont combinées ensemble pour rendre une scène. En raison des moteurs de jeu et des pilotes graphiques, toutes les combinaisons de GPU ne fonctionnaient pas parfaitement, ce qui a permis au logiciel de capturer les couleurs pour chaque image rendue et d'enregistrer dynamiquement les données RAW à l'aide d'un périphérique de capture vidéo.



Le logiciel FCAT accepte la vidéo enregistrée, dans notre cas, il s'agit de 90 secondes 1440p du jeu Rise of the Tomb Raider, et convertit les données de couleur en données de temps de trame, afin que le système puisse afficher la fréquence de trame «observée» et corréler avec la consommation d'énergie des accélérateurs vidéo. Ce test, en raison de la rapidité avec laquelle il a été effectué, est monothread. Nous commençons le processus et obtenons le temps d'achèvement en conséquence.



FCAT est un autre scénario limité par les performances à un seul thread, et il semble que les nouveaux processeurs de 9e génération fonctionnent très bien ici. 9700K et 9900K ont donné le même temps avec une différence de millisecondes.

Mouvement de particules 3D v2.1: mouvement brownien


Notre test 3DPM est une référence personnalisée conçue pour modéliser six algorithmes différents pour déplacer des particules dans un espace tridimensionnel. Les algorithmes ont été développés dans le cadre de ma thèse de doctorat et, en fin de compte, fonctionnent mieux sur le GPU, et donnent une bonne idée de la façon dont les flux de commandes sont interprétés par diverses microarchitectures.

La partie clé des algorithmes est la génération de nombres aléatoires - nous utilisons une génération relativement rapide, qui complète la mise en œuvre de chaînes de dépendances dans le code. La principale mise à jour par rapport à la première version primitive de ce code est que le problème de faux partage dans les caches a été résolu, ce qui était le principal goulot d'étranglement. Nous envisageons également d'appliquer les versions AVX2 et AVX512 de ce test pour de futures révisions.



Pour ce test, nous exécutons un stock de particules en utilisant six algorithmes différents, pendant 20 secondes, avec des pauses de 10 secondes, et rapportons la vitesse totale des particules en millions d'opérations (mouvements) par seconde.



Basé sur le code non AVX, le 9900K affiche un IPC et des fréquences légèrement meilleurs par rapport au R7 2700X, bien que ce ne soit pas un saut en pourcentage aussi important que ce à quoi on pourrait s'attendre. Les processeurs sans HT perdent dans ce test.

Mais lorsque nous utilisons les AVX2 / AVX512, les processeurs Skylake-X se retrouvent dans leur élément. Le 9900K est désormais nettement supérieur au R7 2700X, encore plus que ce à quoi nous nous attendions, le Core i7-9700K est également en avance.

Dolphin 5.0: Ă©mulation de console


L'un des tests les plus demandés dans notre package est l'émulation de console. La possibilité de sélectionner un jeu dans un système obsolète et de l'exécuter est très attrayante et dépend des efforts de l'émulateur: un système x86 beaucoup plus puissant est nécessaire pour pouvoir émuler avec précision une ancienne console autre que x86. Surtout si le code de cette console a été fait en tenant compte de quelques défauts physiques et bugs matériels.

Pour notre test, nous utilisons le logiciel d'émulation Dolphin populaire, exécutons un projet informatique à travers lui pour déterminer la précision avec laquelle nos processeurs peuvent émuler la console. Dans ce test, l'émulation Nintendo Wii durera environ 1050 secondes.



Dolphin est un autre scénario limité par les performances d'un seul thread, c'est pourquoi les processeurs Intel ont toujours été en tête. Ici, le 9900K contourne le 9700K pendant une seconde.

DigiCortex 1.20: Modélisation du cerveau d'une limace marine


Cette référence a été initialement conçue pour modéliser et visualiser l'activité des neurones et des synapses dans le cerveau. Le logiciel est livré avec différents modes prédéfinis, nous avons choisi une petite référence qui simule un cerveau de 32 mille neurones / 1,8 milliard de synapses, ce qui équivaut au cerveau d'une limace de mer.



Nous rapportons les résultats des tests comme une opportunité d'émuler des données en temps réel, donc tous les résultats au-dessus de l '«unité» conviennent pour un fonctionnement en temps réel. Parmi les deux modes, le mode «sans démarrage synapse», difficile pour la DRAM, et le mode «avec démarrage synapse», dans lequel le processeur est chargé, nous sélectionnons ce dernier. Malgré notre choix, le test est toujours affecté par la vitesse de la DRAM.



DigiCortex dépend fortement des performances du processeur et de la bande passante de la mémoire, mais il semble que le Ryzen à 6 cœurs puisse facilement rivaliser avec le 9900K à 8 cœurs. Le 8700K / 8086K semble faire mieux avec ce test.

y-Cruncher v0.7.6: calculs optimisés pour la microarchitecture


J'ai entendu parler de y-Cruncher comme un outil pour vous aider à calculer diverses constantes mathématiques. Mais après avoir commencé à parler avec son développeur, Alex Yee, un chercheur du NWU et maintenant un développeur d'optimisation de logiciels, j'ai réalisé qu'il optimisait le logiciel de manière incroyable pour obtenir de meilleures performances. Naturellement, toute simulation qui prend plus de 20 jours bénéficiera d'une augmentation de 1% de la productivité! Alex a commencé à travailler avec y-Cruncher en tant que projet au lycée, mais maintenant que le projet est à jour, Alex y travaille constamment pour tirer parti des derniers ensembles d'instructions, avant même qu'ils ne soient disponibles au niveau matériel.

Pour notre test, nous exécutons y-Cruncher v0.7.6 à travers toutes les variantes optimisées possibles de calculs binaires, à un seul thread et à plusieurs threads, y compris les fichiers binaires optimisés pour AVX-512. Le test consiste à calculer 250 millions de caractères du nombre Pi, et nous utilisons des versions monothread et multithread de ce test.





Alors que le y-cruncher profite de l'AVX2 / AVX512, nous voyons que les processeurs Skylake-X partent à nouveau pour leur monde confortable. En mode multi-thread, le 9900K / 9700K nécessite 8 cœurs pour dépasser le processeur à 6 cœurs qui prend en charge l'AVX512.

Agisoft Photoscan 1.3.3: convertir une image 2D en modèle 3D


Agisoft est l'un des éditeurs de logiciels indépendants avec lesquels nous travaillons depuis plusieurs années. La campagne développe un logiciel appelé PhotoScan, qui convertit une série d'images 2D en modèle 3D. Il s'agit d'un outil important dans le développement et l'archivage de modèles, et s'appuie sur un certain nombre d'algorithmes monothread et multithread pour passer d'un côté du calcul à l'autre.



Dans notre test, nous prenons la version logicielle 1.3.3 avec un grand ensemble de données - photos 84 x 18 mégapixels. Nous exécutons le test selon un ensemble d'algorithmes assez rapide, mais toujours plus rigoureux que notre test de 2017. En conséquence, nous rapportons le temps total d'achèvement du processus.



Photoscan est une tâche qui tire le meilleur parti des performances à haut débit et à un seul thread, auquel cas la présence de HT est un fardeau.

Tests de rendu


Dans un environnement professionnel, le rendu est souvent une préoccupation majeure pour les charges de travail du processeur. Il est utilisé dans différents formats: du rendu 3D à la pixellisation, dans des tâches telles que les jeux ou le lancer de rayons, et utilise la capacité du logiciel à gérer les maillages, les textures, les collisions, les alias et la physique (en animation). La plupart des moteurs de rendu proposent du code pour le processeur, tandis que certains utilisent des GPU et choisissent des environnements utilisant des FPGA ou des ASIC spécialisés. Cependant, pour les grands studios, les processeurs restent le matériel principal.

Corona 1.3: Performance Render


Un rendu amélioré optimisé pour les performances de logiciels tels que 3ds Max et Cinema 4D, le test Corona rend une scène générée de la version 1.3 standard. Habituellement, l'implémentation du benchmark GUI montre le processus de construction de la scène et permet à l'utilisateur de voir le résultat comme «le temps de terminer».



Nous avons contacté le développeur qui nous a donné la version en ligne de commande du test. Il fournit une conclusion directe des résultats. Au lieu de rapporter l'heure de construction de la scène, nous rapportons le nombre moyen de rayons par seconde sur six exécutions, car le rapport des actions terminées aux unités de temps est visuellement plus facile à comprendre.



Corona est un test entièrement multi-thread, donc les processeurs sans HT sont un peu en retard. Le Core i9-9900K prend son envol, dépassant les composants à 8 cœurs d'AMD avec une marge de 25% et juste derrière le Threadripper à 12 cœurs.

Blender 2.79b: Suite de création 3D


Un outil de rendu haut de gamme, Blender est un produit open source avec de nombreux paramètres et configurations et est utilisé par de nombreux studios d'animation haut de gamme à travers le monde. L'organisation a récemment publié une suite de tests Blender, quelques semaines après que nous ayons décidé de réduire l'utilisation du test Blender dans notre nouveau package, mais un nouveau test peut prendre plus d'une heure. Pour obtenir nos résultats, nous exécutons l'un des sous-tests de ce package via la ligne de commande - la scène standard "bmw27" en mode "CPU uniquement", et mesurons le temps d'achèvement du rendu.



Le mélangeur a un mélange éclectique d'exigences, de la bande passante mémoire aux performances brutes, mais, comme à Corona, les processeurs sans HT sont un peu en retard. La haute fréquence 9900K le place au-dessus de 10C Skylake-X et AMD 2700X, mais pas au-dessus de 1920X.

LuxMark v3.1: LuxRender via divers chemins de code


Comme indiqué ci-dessus, il existe de nombreuses façons différentes de traiter les données de rendu: CPU, GPU, Accelerator et autres. De plus, il existe de nombreux frameworks et API dans lesquels vous pouvez programmer, selon la façon dont le logiciel sera utilisé. LuxMark, une référence développée à l'aide du moteur LuxRender, propose plusieurs scènes et API différentes.


extrait de la version Linux de LuxMark

Dans notre test, nous exécutons une simple scène «Ball» en utilisant le code C ++ et OpenCL, mais en mode CPU. Cette scène commence par un rendu approximatif et améliore lentement la qualité en deux minutes, donnant le résultat final dans ce que vous pouvez appeler le «kilo par seconde moyen».





POV-Ray 3.7.1: lancer de rayons


Le moteur de lancer de rayons Persistance de la vision est un autre outil d'analyse comparative bien connu qui est entré en veille prolongée pendant un certain temps jusqu'à ce qu'AMD libère ses processeurs Zen lorsque soudainement Intel et AMD ont commencé à insérer du code dans la branche principale d'un projet open source. Pour notre test, nous utilisons le test intégré pour tous les cœurs, appelé depuis la ligne de commande.



Tests de bureau


La suite de tests Office est conçue pour se concentrer sur des repères plus standard de l'industrie qui se concentrent sur les flux de travail de bureau. Ce sont des tests plus synthétiques, mais nous testons également les performances du compilateur dans cette section. Pour les utilisateurs qui ont besoin d'évaluer l'équipement dans son ensemble, ce sont généralement les critères les plus importants.

PCMark 10: norme de l'industrie


Futuremark, maintenant connu sous le nom UL, a développé des tests qui sont devenus des normes de l'industrie depuis deux décennies. Le dernier ensemble de tests système est PCMark 10, où plusieurs tests sont améliorés par rapport à PCMark 8, et plus d'attention est accordée à OpenCL, en particulier dans des cas tels que le streaming vidéo.

PCMark divise ses notes en environ 14 domaines différents, y compris le lancement d'applications, les pages Web, les feuilles de calcul, l'édition de photos, le rendu, la vidéoconférence et la physique. Nous publions toutes ces données dans notre base de données Bench, mais le score global est un indicateur clé pour la revue en cours.



Ici, où de nombreux tests sont mélangés, les nouveaux processeurs Intel occupent les trois premières positions, dans l'ordre. Même le i5-9600K devance le i7-8086K.

Compilation de chrome: Windows VC ++ Compilation de Chrome 56


Un grand nombre de lecteurs AnandTech sont des ingénieurs logiciels qui observent le fonctionnement du matériel. Bien que la compilation du noyau Linux soit «standard» pour les réviseurs qui compilent souvent, notre test est un peu plus diversifié - nous utilisons des instructions Windows pour compiler Chrome, en particulier la version Chrome du 56 mars 2017, comme c'était le cas lorsque nous avons créé le test. Google donne des instructions assez détaillées sur la façon de compiler sous Windows après avoir téléchargé 400 000 fichiers depuis le référentiel.



Dans notre test, en suivant les instructions de Google, nous utilisons le compilateur MSVC et ninja pour contrôler la compilation. Comme vous pouvez vous y attendre, il s'agit d'un test avec multithreading variable et avec des exigences DRAM variables qui bénéficient de caches plus rapides. Les résultats obtenus dans notre test sont le temps consacré à la compilation, que nous convertissons en nombre de compilations par jour.

Les performances à haute fréquence d'un turbo à part entière semblent avoir bien fonctionné dans notre test de compilation.

3DMark Physics: calcul physique dans les jeux


Avec PCMark, il existe un benchmark 3DMark, Futuremark (UL) - un ensemble de tests de jeu. Chaque test de jeu se compose d'une ou deux scènes lourdes pour le GPU, ainsi que d'un test physique, selon le moment où le test a été écrit et la plate-forme qu'il cible. Les sujets principaux, en difficulté croissante, sont la tempête de verglas, le Cloud Gate, le Sky Diver, le Fire Strike et le Time Spy.

Certains des sous-tests offrent d'autres options, comme Ice Storm Unlimited (conçu pour les plates-formes mobiles avec rendu hors écran) ou Fire Strike Ultra (conçu pour les systèmes 4K hautes performances avec de nombreuses fonctionnalités supplémentaires). Il convient de noter que Time Spy dispose actuellement du mode AVX-512 (que nous pourrons utiliser à l'avenir).

Quant à nos tests, nous envoyons les résultats de chaque test physique à Bench, mais pour la revue nous nous en tenons aux résultats des scènes les plus exigeantes: Ice Storm Unlimited, Cloud Gate, Sky Diver, Fire Strike Ultra et Time Spy.











L'ancien test Ice Storm n'aimait pas vraiment le nouveau Core i9-9900K, le poussant derrière le R7 1800X. Pour des tests orientés PC plus modernes, 9900K l'emporte. Le manque de HT empêche deux autres processeurs de la gamme d'afficher des résultats élevés.

GeekBench4: Test synthétique


Un outil commun pour les tests multiplateformes sur les appareils mobiles, PC et Mac, GeekBench 4 est le test synthétique parfait d'un système utilisant une gamme d'algorithmes qui nécessitent une bande passante maximale. Les tests incluent le chiffrement, la compression, la transformation de Fourier rapide, les opérations de mémoire, la physique des n-corps, les opérations matricielles, la manipulation de l'histogramme et l'analyse HTML.





J'inclus ce test en raison de la popularité de la requête, bien que les résultats soient très synthétiques. De nombreux utilisateurs attachent souvent une grande importance à ses résultats en raison du fait qu'il a été compilé sur différentes plates-formes (bien qu'avec différents compilateurs).
Nous enregistrons les notes des principaux sous-tests (Crypto, Integer, Floating Point, Memory) dans notre base de données de résultats de test, mais pour la revue, nous ne publions que des résultats généraux à un seul thread et à plusieurs threads.

Tests d'encodage


, , . , , , , , , . , , .

Handbrake 1.1.0:


, Handbrake — , , , . . , AVX-512 OpenCL . , , CPU, .

Handbrake , - Logitech C920 1080p60 ( , ). . :

  • 720p60 at 6000 kbps constant bit rate, fast setting, high profile
  • 1080p60 at 3500 kbps constant bit rate, faster setting, main profile
  • 1080p60 HEVC at 3500 kbps variable bit rate, fast setting, main profile







7-zip v1805:


/ 7-zip , . , . .







, : , . , , Windows Scheduler . , .

WinRAR 5.60b3:


, WinRAR. . , right-click Windows . , , 30 60- 2000 -, .



WinRAR , , 10 , , .

AES:


, , . Windows BitLocker . AES discontinued TrueCrypt , .

, , — AES / , . AES , AVX-512.



-


low-end , small form factor , -, , . - , , - . , ( ) . , - : -, , . - , , , .

, .

WebXPRT 3: - ,


, XPRT, Principled Technologies, -, , , «3». ( , ) : , , , , HTML5, , .



, . , .

WebXPRT 2015: HTML5 Javascript Web UX


WebXPRT — 2015 , - , . - , , - , . - . , , , . — , . « », .



WebXPRT3, , . , .

Speedometer 2: Javascript Frameworks


- — Speedometer 2, javascript, : , , . , , , -.

«rpm», . .



Google Octane 2.0: Core Web Compute


- , , — Octane Google. 2.0 , , , , , — .

, . .



Mozilla Kraken 1.1: Core Web Compute


, Octane, Kraken, Mozilla. , , . , Kraken , , .

, . , .



3DPM v1: 3DPM v2.1


«» — 3DPM. , , , ( ). , , ( 4 , ; 5 – ).
(-O2, -fp: fast): OpenMP . , false sharing . , , .





x264 HD 3.0:


, Anandtech Pentium 4 Athlon II. 720p , . , IPC — instructions-per-clock.





Merci de rester avec nous. Aimez-vous nos articles? Vous voulez voir des matériaux plus intéressants? Soutenez-nous en passant une commande ou en le recommandant à vos amis, une réduction de 30% pour les utilisateurs Habr sur un analogue unique de serveurs d'entrée de gamme que nous avons inventés pour vous: Toute la vérité sur VPS (KVM) E5-2650 v4 (6 cœurs) 10 Go DDR4 240 Go SSD 1 Gbps à partir de 20 $ ou comment diviser le serveur? (les options sont disponibles avec RAID1 et RAID10, jusqu'à 24 cœurs et jusqu'à 40 Go de DDR4).

VPS (KVM) E5-2650 v4 (6 cœurs) 10 Go DDR4 240 Go SSD 1 Gbit / s jusqu'au 1er janvier gratuitement si payé pour une période de six mois, vous pouvez commander ici .

Dell R730xd 2 fois moins cher? Nous avons seulement 2 x Intel Dodeca-Core Xeon E5-2650v4 128 Go DDR4 6x480 Go SSD 1 Gbps 100 TV à partir de 249 $ aux Pays-Bas et aux États-Unis! Pour en savoir plus sur la création d'un bâtiment d'infrastructure. classe utilisant des serveurs Dell R730xd E5-2650 v4 coûtant 9 000 euros pour un sou?

Source: https://habr.com/ru/post/fr431158/


All Articles