Découvrez les nouveaux processeurs Intel



Hier, 04/02/2019, Intel a annoncé la mise à jour tant attendue de la famille de processeurs évolutifs Intel® Xeon®, introduite mi-2017. Les nouveaux processeurs sont basés sur la microarchitecture, baptisée Cascade Lake et s'appuient sur un processus amélioré de 14 nm.

Caractéristiques des nouveaux processeurs




Jetez d'abord un œil aux différences d'étiquetage. Dans l'article précédent sur Skylake-SP, nous avons déjà mentionné que tous les processeurs sont divisés en 4 séries - Bronze , Silver , Gold et Platinum . Le premier chiffre du nombre indique à quelle série le modèle de processeur appartient:

  • 3 - Bronze,
  • 4 - Argent,
  • 5, 6 - Or,
  • 8 - Platine.

Le deuxième chiffre indique la génération du processeur. Pour la famille de processeurs évolutifs Intel® Xeon®, les générations nommées par code:

  • 1 - Skylake,
  • 2 - Cascade Lake.

Les deux chiffres suivants indiquent la soi-disant SKU (Stock Keeping Unit). En fait, il s'agit simplement d'un identifiant CPU avec un ensemble spécifique de fonctions disponibles.

De plus, après le numéro de modèle, il peut y avoir des indices indiqués par une ou deux lettres. La première lettre de l'index indique les caractéristiques de l'architecture ou de l'optimisation du processeur lui-même, et la seconde - la capacité de mémoire sur le socket.

Par exemple, prenez un processeur étiqueté Intel® Xeon® 6240 . Déchiffrer:

  • 6 - Processeur sĂ©rie Gold,
  • 2 - la gĂ©nĂ©ration de Cascade Lake,
  • 40 - SKU.

Performances


Les processeurs de nouvelle génération sont conçus pour être utilisés dans les domaines de la virtualisation, de l'intelligence artificielle et du calcul haute performance. Le premier changement notable a été l'augmentation de la fréquence d'horloge. Cela était assez attendu, car il existe un grand nombre d'applications serveur pour lesquelles la vitesse d'horloge est plus importante que le nombre de cœurs de processeur. Par exemple, le produit financier 1C, dont la configuration requise indique clairement que plus la fréquence du processeur est élevée, plus l'utilisateur final obtiendra rapidement le résultat.

Dans certains cas, le nombre de cœurs a augmenté. Pour plus de clarté, nous avons compilé des tableaux comparatifs de plusieurs processeurs de la famille de processeurs évolutifs Intel® Xeon® de première et deuxième générations:
Intel® Xeon® Silver 4114
(10 cœurs)
Intel® Xeon® Silver 4214
(12 cœurs)
Vitesse d'horloge2,20 GHz2,20 GHz
En mode turbo3,00 GHz3,20 GHz
Intel® Xeon® Gold 5118
(12 cœurs)
Intel® Xeon® Gold 5218
(16 cœurs)
Vitesse d'horloge2,30 GHz2,30 GHz
En mode turbo3,20 GHz3,90 GHz
Intel® Xeon® Gold 6140
(18 cœurs)
Intel® Xeon® Gold 6240
(18 cœurs)
Vitesse d'horloge2,30 GHz2,60 GHz
En mode turbo3,70 GHz3,90 GHz
Intel® Xeon® Gold 6144
(8 cœurs)
Intel® Xeon® Gold 6244
(8 cœurs)
Vitesse d'horloge3,50 GHz3,60 GHz
En mode turbo4,20 GHz4,40 GHz
Une augmentation de la fréquence d'horloge entraîne inévitablement une augmentation de la dissipation thermique. Pour les processeurs phares de la série Platinum, il peut atteindre 205W , ce qui est un test très sérieux pour un système de refroidissement à air traditionnel. On peut supposer que dans un avenir prévisible, les plates-formes de serveur nécessiteront un refroidissement liquide.

Comme dans la génération précédente de Skylake SP, les processeurs sont installés dans le socket LGA3647 (Socket P), ce qui est dû à l'utilisation d'un contrôleur de mémoire à 6 canaux (jusqu'à un maximum de 2 modules de mémoire par canal). La fréquence de la mémoire est de 2666 MT / s , cependant, lorsque vous utilisez des processeurs des séries 6000 et 8000, vous pouvez utiliser la mémoire avec une fréquence de 2933 MT / s (pas plus d'un module par canal).



Le bus Ultra-Path Interconnect , utilisé avec succès dans les processeurs Intel Xeon SP de première génération, est resté dans la deuxième génération, offrant un échange de données entre les processeurs à des vitesses de 9,6 GT / s ou 10,4 GT / s pour chaque canal. Cela vous permet d'adapter efficacement la plate-forme matérielle à 8 processeurs physiques, optimisant la bande passante et l'efficacité énergétique.

Les tests


Nous avons commencé à tester les processeurs de nouvelle génération à l'aide de la suite de tests SPEC , qui simule la charge en fonction de la solution des tâches de la vie les plus pressantes. Ces tests représentent à la fois les calculs les plus simples et le calcul de divers processus physiques, par exemple, la résolution de problèmes de physique moléculaire et d'hydrodynamique.

Actuellement, nous avons préparé les résultats de certains tests SPEC pour les calculs d'entiers en utilisant les processeurs Intel® Xeon® Gold 6140 et Intel® Xeon® Gold 6240 comme exemples.

Intrate
TestIntel® Xeon® Gold 6140Intel® Xeon® Gold 6240
500.perlbench_r147157
531.deepsjeng_r127139
541.leela_r125127
548.exchange2_r176203

Intsepeed
TestIntel® Xeon® Gold 6140Intel® Xeon® Gold 6240
600.perlbench_s5.676.33
602.gcc_s6,958.74
641.leela_s3.243,62
648.exchange2_s5,947,90

Description du test
  • perlbench_r est une version allĂ©gĂ©e du langage Perl. La charge de test imite le travail du cĂ©lèbre système anti-spam SpamAssassin;
  • deepsjeng_r - simulation d'une partie d'Ă©checs. Le serveur effectue une Ă©tude approfondie des positions de jeu en utilisant l'algorithme d'Ă©crĂŞtage alpha-bĂŞta;
  • leela_r - simulation d'un jeu en cours. Dans le processus de test, il y a une analyse des modèles de mouvement, ainsi qu'une recherche sĂ©lective dans l'arbre basĂ©e sur les limites de confiance supĂ©rieures;
  • exchange2_r - gĂ©nĂ©rateur de puzzles de sudoku non triviaux. Écrit en Fortran 95, il utilise la plupart des fonctions de traitement des tableaux;
  • compilateur de langage gcc_s C. La charge de test «compile» le compilateur GCC Ă  partir des codes source de l'architecture du microprocesseur IA-32.


D'après les résultats des tests, il devient clair que les processeurs de nouvelle génération effectuent des calculs entiers plus rapidement que la génération précédente. Nous partagerons les résultats d'autres tests dans l'un des articles suivants.

Prise en charge de la mémoire persistante Intel® Optane ™ DC


Accélérer la charge de travail des bases de données et des applications très chargées - c'est ce que tous les clients attendaient de la prochaine mise à jour. Par conséquent, une innovation clé a été la prise en charge de la mémoire persistante Intel® Optane ™ DC, mieux connue sous le nom de code Apache Pass.



Cette mémoire est conçue pour devenir une solution universelle au problème lorsque l'utilisation de la bonne quantité de DRAM est économiquement désavantageuse, et les caractéristiques de vitesse même des SSD phares ne sont pas suffisantes.

Un exemple frappant est le placement de bases de données directement dans la mémoire persistante Intel® Optane ™ DC, ce qui élimine le besoin d'échange constant de données entre la RAM et un périphérique de stockage (une caractéristique inhérente aux systèmes traditionnels).

Un nouveau type de mémoire est installé directement dans l'emplacement DIMM et est entièrement compatible avec celui-ci. Des modules avec le volume suivant sont disponibles:

  • 128 Go
  • 256 Go
  • 512 Go

Ces volumes importants de modules vous permettront de configurer de manière flexible la plate-forme matérielle, ayant reçu un espace disque très spacieux et très rapide pour les systèmes très chargés. La mémoire persistante Intel® Optane ™ DC a un énorme potentiel d'application, y compris l'apprentissage automatique.

Apprentissage en profondeur plus rapide


En plus de prendre en charge un nouveau type de mémoire, les ingénieurs d'Intel se sont occupés d'accélérer le processus d'apprentissage en profondeur. Étant donné que les réseaux de neurones convolutifs nécessitent souvent une multiplication multiple de valeurs de 8 et 16 bits, les nouveaux processeurs ont reçu la prise en charge des instructions AVX-512 VNNI (Vector Neural Network Instructions). Cela vous permettra d'optimiser et d'accélérer le calcul plusieurs fois.

La meilleure efficacité est obtenue en mettant en œuvre l'ensemble d'instructions suivant:

  • VPDPBUSD (pour les calculs INT8),
  • VPDPWSSD (pour les calculs INT16).

L'essentiel est de réduire le nombre d'articles traités par cycle. L'instruction VPDPWSSD combine les deux instructions INT16 et utilise également la constante INT32 pour remplacer les deux instructions actuelles PMADDWD et VPADDD . L'instruction VPDPUSB réduit également le nombre d'éléments en remplaçant les trois instructions existantes VPMADDUSBW , VPMADDWD et VPADDD .

Ainsi, avec l'application correcte du nouvel ensemble d'instructions, il est possible de réduire le nombre d'éléments traités par cycle de deux à trois fois et d'augmenter la vitesse de traitement des données. Un cadre approprié pour les nouvelles instructions fera partie des bibliothèques de logiciels d'apprentissage machine populaires telles que:


Optimisation de l'équilibrage de charge


Le chargement uniforme des ressources informatiques est devenu plus facile avec la technologie Intel® Speed ​​Select (sur les processeurs avec un indice Y). L'essentiel est que chaque opération commence à être associée au nombre de cœurs impliqués et à la vitesse d'horloge. En fonction du profil sélectionné de chaque opération, les ressources sont allouées comme suit:

  • plus de cĹ“urs, mais avec une vitesse d'horloge infĂ©rieure;
  • moins de cĹ“urs, mais avec une vitesse d'horloge accrue.

Cette approche vous permet d'utiliser pleinement les ressources, ce qui est particulièrement important lors de l'utilisation d'environnements virtualisés. Cela réduira les coûts en optimisant la charge sur les hôtes de virtualisation.

Accélération du calcul scientifique


Le traitement des données scientifiques, en particulier lors de la modélisation des processus physiques au niveau des particules (par exemple, le calcul des interactions électromagnétiques) nécessite une énorme quantité de calcul parallèle. Ce problème peut être résolu en utilisant un CPU, un GPU ou un FPGA.

Les processeurs multicœurs sont universels en raison du grand nombre d'outils logiciels et de bibliothèques pour le traitement des données. L'utilisation d'un GPU à ces fins est également très efficace, car vous pouvez exécuter des milliers de threads parallèles directement sur des cœurs graphiques matériels. Il existe des cadres de développement pratiques, tels que OpenCL ou CUDA, qui vous permettent de créer des applications de toute complexité à l'aide de l' informatique GPU .

Cependant, il existe un autre outil matériel dont nous avons déjà parlé dans les articles précédents - FPGA. La possibilité de programmer de tels appareils pour effectuer des calculs spécifiques vous permet d'accélérer le traitement des données, en déchargeant partiellement le CPU. Un scénario similaire peut être mis en œuvre sur de nouveaux processeurs Cascade Lake en conjonction avec des FPGA Intel® Stratix® 10 SX discrets.

Malgré la vitesse d'horloge inférieure à celle des processeurs conventionnels, le FPGA est capable de montrer des performances dix fois supérieures. Pour certains types de tâches, telles que le traitement numérique du signal, l'Intel® Stratix® 10 SX peut afficher des résultats jusqu'à 10 TFLOPS (tera opérations à virgule flottante par seconde).

Mise à l'échelle de la plateforme


Faire des affaires en temps réel implique non seulement la stabilité, mais également la capacité d'évoluer à la demande. Un bon exemple est la plate-forme SAP HANA hautes performances utilisée pour le stockage et le traitement des données. Le déploiement physique de cette plateforme nécessite des ressources matérielles très puissantes.

Les processeurs évolutifs Intel® Xeon® sont conçus pour transformer les systèmes multi-socket en éléments centraux de l'infrastructure informatique, offrant une évolutivité pour répondre aux demandes des applications métier.



Ceci est implémenté sous forme de prise en charge des contrôleurs de nœuds externes, ce qui vous permet de créer des configurations d'un niveau supérieur à celui d'une seule plate-forme. Par exemple, vous pouvez créer une configuration de 32 processeurs physiques en combinant les ressources de plusieurs plates-formes multi-socket en un seul ensemble.

Conclusion


Une augmentation des fréquences de fonctionnement et des cœurs de processeur, une augmentation de la productivité et la prise en charge de la mémoire persistante Intel® Optane ™ DC - toutes ces améliorations augmentent considérablement la puissance de calcul de chaque plate-forme, réduisant le coût de la quantité d'équipement utilisé et augmentant l'efficacité du traitement des données. Le principe d'évolutivité, posé au niveau de l'architecture, vous permet de construire une infrastructure informatique de toute complexité et d'atteindre des performances et une efficacité énergétique élevées.

Comme Selectel est un partenaire Intel Platinum, nos clients sont désormais disponibles pour commander des processeurs évolutifs Intel® Xeon® de nouvelle génération sur des serveurs de configuration arbitraires.

Louer un serveur avec des processeurs de nouvelle génération est facile! Accédez simplement à la page du configurateur et sélectionnez les composants nécessaires. Toute question concernant le fonctionnement des services peut être posée à nos spécialistes en créant un ticket dans le panneau de contrôle. En payant un serveur plusieurs mois à l'avance, vous bénéficiez d'une remise allant jusqu'à 15%.

Si vous souhaitez participer aux tests des dernières technologies, rejoignez notre Selectel Lab.

Nous serons heureux d'entendre vos questions et suggestions dans les commentaires.

Source: https://habr.com/ru/post/fr446494/


All Articles