Informatique haute performance X86 pour l'ère de la technologie de présence

Recherche, apprentissage automatique, analyse de données, création et diffusion de contenu, réalité augmentée et virtuelle, jeux informatiques - la liste des tâches gourmandes en ressources pour les systèmes informatiques s'allonge chaque jour. Lorsque nous parlons du côté technologique du problème, nous discutons de deux sujets.



Le premier est le besoin toujours croissant d'augmenter les performances informatiques. Quelle que soit l'industrie des semi-conducteurs, les utilisateurs finaux s'adaptent rapidement aux nouveaux produits et en redemandent encore.

Le deuxième est, bien sûr, les changements du marché. Je travaille dans ce domaine depuis plus de 30 ans et au cours des dernières années, un grand nombre de changements ont eu lieu. Prenons un seul exemple: l'avènement du World Wide Web et d'une interface utilisateur graphique ont transformé les PC d'un outil de traitement de texte en un véritable portail d'accès au monde entier, qui a radicalement changé la vie des gens. En conséquence, nous avons pu trouver et partager des informations avec une telle facilité qui semblait auparavant inaccessible. De plus, les appareils sont devenus portables et ont obtenu une connexion permanente au réseau - d'abord les ordinateurs portables, puis les smartphones et les tablettes. Bientôt, il y a eu une véritable explosion de la popularité des applications, et l'énorme quantité de données qui devaient être stockées, traitées et analysées a nécessité encore plus de performances de calcul.

Il y a quatre ans, AMD a commencé à rénover son architecture de base haute performance x86 pour répondre à ces besoins croissants. Notre précédente famille de processeurs a connu un succès significatif dans le domaine de l'efficacité énergétique, mais ces puces n'étaient pas prêtes à fournir le niveau nécessaire pour prendre en charge des applications de performance exigeantes. Sur la base de cette tâche, nous avons créé un code de conception de noyau nommé «Zen» à partir de zéro.



Lors de la conception du Zen, nous voulions développer un noyau nouveau et moderne à tous points de vue. L'architecture a été optimisée pour obtenir des performances, un débit et une efficacité énergétique supérieurs afin que les processeurs puissent faire face aux applications les plus exigeantes. En conséquence, Zen s'est avéré être une solution beaucoup plus productive, marquant le retour d'AMD sur le marché des systèmes haute performance, montrant l'exécution de 40% d'instructions supplémentaires par cycle sans augmenter la consommation d'énergie 1. Nous avons atteint cet objectif ambitieux en mettant l'accent sur la performance et la consommation d'énergie. La microarchitecture nouvellement développée comprend des changements importants dans le domaine du traitement des instructions, des schémas de fonctionnement des modules exécutifs et du sous-système de cache pour accélérer l'exécution des tâches et leur travail en parallèle. Comme nous l'avons montré à la Conférence Hot Chips de l'Université de Stanford 2016, Zen propose une meilleure prédiction des branches, le choix des bonnes instructions et fonctionne avec le cache micro-op pour mieux suivre ces instructions. De plus, la nouvelle architecture prend en charge une profondeur de planification 75% plus élevée, augmentant le nombre d'instructions, et exécute également plus d'instructions en parallèle, grâce à une augmentation de la largeur des instructions de 50% par rapport à la génération précédente de cœurs. Cette combinaison offre une énorme augmentation de la puissance de traitement par cycle.

Mais si vous avez un moteur puissant, vous devez le faire le plein. Nous appelons conditionnellement ce processus «nourrir la bête». Et dans notre cas, le carburant est constitué de données et d'instructions reçues de la mémoire. Nous avons repensé la hiérarchie du cache, fournissant à la puce un cache L3 de 8 Mo, un cache L2 partagé pour les instructions et les données, ainsi que des volumes de cache séparés avec une faible latence pour les commandes et les données. Un seul cœur peut désormais fonctionner avec le cache cinq fois plus rapidement que dans l'architecture précédente.



Le pré-récupérateur de noyau Zen joue un rôle essentiel dans la bande passante et incarne l'un des flux de travail les plus sophistiqués conçus pour les processeurs. Le pré-récupérateur suppose et détermine quelle instruction sera nécessaire dans la mesure suivante, en fonction des données sur la tâche en cours. La qualité de la mise en œuvre de votre plan et la rapidité avec laquelle vous pouvez corriger les erreurs relèvent non seulement de la science, mais aussi de l'art, et dans le cas du Zen, nous avons obtenu des résultats impressionnants à cet égard.

L'augmentation significative de la bande passante dans Zen par rapport à la génération précédente de processeurs est due à la transition vers l'architecture de multithreading parallèle (SMT). Cette approche permet au noyau de suivre les tâches au sein du programme, et lorsque la tâche est suspendue, en attendant qu'une autre commande s'exécute ou que des données soient reçues, une autre tâche est prise pour traitement, qui n'est pas en mode veille. Ainsi, du point de vue du logiciel, nous obtenons des ressources processeur supplémentaires lorsque le mode SMT est activé.

Enfin, sur l'amélioration de l'efficacité énergétique. Le processeur Zen a été conçu pour être utilisé dans une variété d'appareils, des ordinateurs portables à refroidissement passif aux superordinateurs, et tous nécessitent une efficacité énergétique élevée. Dans un monde où une augmentation de 10% de la productivité est considérée comme significative, notre objectif d'une augmentation de 40% de la productivité sans augmentation supplémentaire de la puissance semblait à première vue impossible. Cependant, les ingénieurs d'AMD se sont concentrés sur la tâche et ont trouvé de nouvelles façons de réduire la consommation d'énergie et d'optimiser la microarchitecture, et ont également appliqué un schéma de contrôle de fréquence d'horloge plus avancé.

Le désir d'améliorer l'efficacité énergétique a été intégré au produit dès le début: lors de la création d'une nouvelle conception, les ingénieurs ont essayé d'économiser chaque microwatt et chaque circuit a été optimisé en termes de puissance. Par conséquent, même si une petite partie du processeur n'est pas impliquée dans un travail actif, il est complètement éteint pour éviter une consommation d'énergie excessive, mais lorsque vous accélérez la fréquence d'horloge et augmentez la charge, le processeur affiche des performances par watt très élevées. De plus, Zen est fabriqué à l'aide de la nouvelle technologie de processus FinFET 14 nm. Les transistors FinFET sont plus petits, plus économiques et plus efficaces que leurs homologues de la génération précédente. Cette solution gagnante de notre partenaire industriel nous a permis d'obtenir un effet maximal dans la mise en œuvre de la nouvelle microarchitecture des cœurs informatiques.Et les possibilités de modifications des transistors FinFET vous permettent de créer une large gamme de solutions: de faible puissance à faible consommation, aux puces pour de grandes charges avec une fréquence et des performances plus élevées.

Les résultats que toutes ces innovations apporteront au final deviendront clairs l'année prochaine, lorsque les premiers produits avec des processeurs à base de noyaux Zen apparaîtront sur le marché, mais aujourd'hui, nous pouvons dire que les tests de laboratoire nous impressionnent. Nous avons récemment présenté le processeur de bureau Summit Ridge 8 cœurs / 16 threads et le processeur serveur Naples 32 cœurs / 64 threads. Ces deux processeurs dotés de cœurs Zen nous permettent d'être très optimistes quant à l'avenir. Il est également important de comprendre que le Zen n'est qu'une étape intermédiaire vers l'avenir de l'informatique haute performance AMD x86. Notre plan de développement comprend les générations de puces suivantes avec des améliorations supplémentaires, et nos équipes travaillent déjà sur de nouveaux projets aujourd'hui,car des changements constants et une tendance à la hausse de la productivité continuent d'accélérer le développement de l'industrie.

, - AMD


Zen x86 «Excavator» x86.

Source: https://habr.com/ru/post/fr399941/


All Articles