Partie 1 >>
Partie 2 >> Partie 3
En 2018, AMD Radeon Technologies Group s'est accordé un peu de répit. Après avoir lancé l'architecture Polaris en 2016 et l'architecture Vega en 2017, AMD a décidé de profiter de la première année complète sur l'architecture Vega. Au lieu de lancer une troisième architecture après 3 ans, la société se concentrera sur l'expansion de la famille en lançant des options pour les ordinateurs portables et les serveurs Vega. Malgré le fait que les efforts d'AMD dans le domaine des ordinateurs portables soient allés le mettre légèrement dans une direction étrange, le travail de création du serveur Radeon Instinct a conduit à un résultat positif. En conséquence, la société a annoncé le premier GPU 7 nm.

Après avoir mis à jour le produit de dernière génération en novembre, sous la forme de la Radeon RX 590, nous nous attendions à ce qu'AMD fasse attention au consommateur pendant un certain temps. Au lieu de cela, AMD a fait une annonce plutôt inattendue au CES 2019: la société lancera une nouvelle carte grand public haut de gamme, Radeon VII (Seven). Sur la base du GPU du serveur susmentionné, la carte vidéo se positionne comme le dernier produit phare. Conçu à la fois pour les joueurs et les créateurs de contenu, Radeon VII devrait être le pas décisif d'AMD envers les joueurs. C'est à notre tour de considérer la dernière carte AMD.
À première vue, dans Radeon VII, tout semble évident. La base en silicium de la carte est le GPU AMD Vega 20, un dérivé du Vega 10 d'origine, qui a été amélioré pour le calcul scientifique et l'apprentissage automatique, et construit sur la technologie de pointe 7 nm de TSMC pour augmenter la productivité. Il s'agit d'une étape importante pour AMD dans la création de GPU pour serveurs - ils ont sorti le premier GPU haut de gamme de classe serveur depuis le GPU d'Hawaï en 2013. AMD était impatient de faire la démonstration de Vega 20 à un stade avancé de son développement, car ce GPU est au cœur des nouveaux accélérateurs de serveur Radeon Instinct MI50 et MI60 d'AMD.

Vega 20, principalement conçu pour les serveurs, n'appartient pas à la classe des GPU qui pourraient facilement et à bon marché trouver leur chemin vers le consommateur. Mais quelque chose d'inattendu s'est produit: NVIDIA n'a presque pas changé l'indicateur de performance au dollar. Au lieu de cela, les nouvelles cartes GeForce RTX basées sur Turing se concentrent sur des options conçues pour proclamer un nouveau paradigme pour le rendu de jeu de rendu de rayons en temps réel et allouer plus de ressources GPU Turing à cet effet. Le résultat final a été les prix relativement élevés des cartes GeForce RTX 20, bien que l'augmentation de leurs performances dans les jeux soit bien inférieure à la normale lors du changement de génération de cartes vidéo.
Confronté à un environnement tarifaire moins hostile que prévu, AMD a finalement décidé de présenter Vega 20 aux consommateurs en combattant NVIDIA à l'un de ces niveaux de prix élevés. La Radeon VII va aux masses avec un prix de 699 $, et la GeForce GTX 2080 devient la nouvelle carte de jeu phare Radeon.

En regardant le tableau des spécifications, la Radeon VII est livrée avec une fréquence d'horloge de pointe de 1800 MHz, tandis que la fréquence de pointe officielle est de 1750 MHz. C'est une bonne progression par rapport au RX Vega 64, où la vitesse d'horloge n'était que de 1630 MHz, ce qui signifie qu'AMD a une augmentation de fréquence d'environ 10%. Et grâce à un refroidisseur ouvert et à une SMU révisée, la Radeon VII pourra augmenter et maintenir des vitesses d'horloge plus élevées encore plus rapidement. Ainsi, bien que la dernière carte AMD n'ajoute pas plus de ROP ou CU (en fait, il y a même une légère diminution par rapport au RX Vega 64), elle prend le débit à un nouveau niveau.
Cependant, le plus grand changement par rapport au RX Vega 64 est que AMD a doublé la quantité de mémoire et plus que doublé la bande passante mémoire. Cela est possible grâce à la technologie de traitement à 7 nm, grâce à laquelle le dernier processeur graphique AMD a une taille de matrice relativement modeste de 331 mm2. Un espace supplémentaire a permis l'interposeur AMD et deux autres piles de HBM2, ce qui a permis d'augmenter le nombre de VRAM et d'étendre le bus mémoire. AMD a également pu augmenter légèrement la fréquence de la mémoire: de 1,89 Gbps / pin sur le RX Vega 64 à un flat 2 Gbps / pin sur le Radeon VII.

Fait intéressant, sur la base des caractéristiques de base, la Radeon VII est essentiellement la Radeon Instinct MI50. Ainsi, AMD risque de "cannibaliser" les ventes d'Instinct si la Radeon VII haute performance intéresse les utilisateurs d'ordinateurs professionnels. En conséquence, AMD a réduit certaines fonctionnalités de la puce pour mieux différencier les produits. Nous en parlerons un peu plus tard, mais l'essentiel est que la carte fonctionne à une fréquence inférieure à FP64, perd le support complet des puces ECC et, naturellement pour un produit grand public, utilise les pilotes de jeu Radeon Software au lieu de la pile de pilotes Instinct professionnelle.
Bien sûr, chaque fois que vous parlez de connecter un GPU de serveur à une carte graphique grand public, vous parlez d'une carte puissante avec un grand potentiel, et cela s'applique certainement à Radeon VII. En un mot, l'avantage de la dernière carte phare AMD est sa haute performance, et le maximum dans sa catégorie est de 16 Go de mémoire HBM2. En tant que l'un des rares avantages évidents de la spécification AMD par rapport aux concurrents de NVIDIA, la quantité de VRAM est une partie importante du marketing AMD; ils accorderont une grande attention à la création de contenu et aux jeux gourmands en VRAM. Une nouveauté de cette carte est un refroidisseur à trois ventilateurs, qui a remplacé le refroidisseur à un seul ventilateur sur les cartes Radeon RX Vega 64/56.
En outre, un autre petit changement élégant: AMD entre sur le marché de détail en tant que fournisseur de cartes et vend directement une nouvelle carte à un prix fixe de 699 $. Étant donné qu'AIB publie également ses cartes de référence de marque aujourd'hui, c'est l'occasion d'éviter les prix de lancement trop chers .

Pendant ce temps, en regardant la situation concurrentielle, quelques questions se posent qui doivent être abordées. Une partie importante de la proposition est (comme cela est devenu habituel récemment) un ensemble de jeux. Le pack actuel Raise the Game entièrement chargé comprend gratuitement les cartes Devil May Cry 5, The Division 2 et Resident Evil 2 avec Radeon VII, RX Vega et RX 590. Pendant ce temps, les cartes RX 580 et RX 570 vous permettent de choisir deux jeux sur trois. Comme prévu, un ensemble de jeux sera simplement une valeur ajoutée par rapport à un concurrent direct - dans ce cas, le RTX 2080 - mais NVIDIA a son propre ensemble de duels de Game On avec Anthem et Battlefield V.Dans un scénario où Radeon VII devrait se battre pour consommateurs avec le RTX 2080, sans aucune chance de victoire finale, ces avantages supplémentaires deviennent de plus en plus importants.
Radeon VII marque le premier lancement de produit depuis le récent changement de l'environnement concurrentiel dû à la technologie des moniteurs à taux de rafraîchissement variable. Les moniteurs avec un taux de rafraîchissement variable sont déjà devenus un attribut obligatoire pour les joueurs, et depuis le lancement de cette technologie au début de cette décennie, il y a eu une nette séparation entre les cartes AMD et NVIDIA. Les cartes AMD prennent en charge VESA Adaptive Sync, mieux connue sous la marque AMD FreeSync, tandis que les cartes NVIDIA de bureau ne prennent en charge que leur G-Sync propriétaire. Mais le mois dernier, NVIDIA a annoncé de manière inattendue que leurs cartes prendraient en charge VESA Adaptive Sync sous le nom de marque «G-Sync Compatibility». Il y a peu d'informations détaillées sur le fonctionnement de ce programme, mais au final, la synchronisation adaptative peut être utilisée dans les pilotes NVIDIA, même si le panneau FreeSync n'est pas certifié G-Sync Compatible.
Le résultat final est que bien que les nouvelles de NVIDIA n'interfèrent pas avec AMD en termes de mise en œuvre des fonctionnalités, elles sapent l'avantage d'AMD dans FreeSync - tous les moniteurs VESA Adaptive Sync bon marché qui étaient auparavant utilisés uniquement sur les cartes AMD peuvent désormais être utilisés sur les cartes NVIDIA. AMD, bien sûr, était très heureux de souligner le FreeSync «gratuit», mais en tant qu'arme contre NVIDIA, ce mouvement marketing a perdu de sa force. La ligne officielle d'AMD est de considérer cela comme une victoire pour FreeSync.
La sortie de Radeon VII et son positionnement concurrentiel par rapport à la GeForce RTX 2080 signifie qu'AMD doit clairement définir sa position concernant l'écart actuel de capacités entre leurs cartes et la dernière NVIDIA Turing. Par conséquent, la position d’AMD est restée inchangée dans les technologies DirectX Raytracing (DXR) et les technologies de qualité d’image et de performance basées sur l’IA telles que DLSS. En bref, l'argument d'AMD est que, à leur avis, la différence de qualité d'image et de gain de performances ne vaut pas le prix de ces fonctionnalités. Pendant ce temps, AMD ne reste pas immobile, et avec les pilotes DXR de sauvegarde, ils travaillent sur la prise en charge WinML et DirectML pour leurs cartes. Risque AMD: Si les efforts de DXR ou de NVIDIA DLSS commencent à évoluer rapidement, un manque de fonctionnalités deviendra un problème beaucoup plus important.
Dans l'ensemble, la publication d'un GPU de jeu de 7 nm pour les consommateurs est actuellement une décision très agressive. Surtout à un stade précoce du cycle de vie de ce processus. Mais AMD n'a tout simplement pas le temps d'attendre et d'observer. Le seul obstacle sérieux à la promotion des produits sera la tarification: le coût doit être acceptable pour les consommateurs.
Cela nous amène au lancement d'aujourd'hui. Avec un prix de 699 $, NVIDIA a déjà abaissé la barre des prix, parlant d'équipement dédié pour accélérer le lancer de rayons et l'apprentissage automatique. Pour Radeon VII, les conditions tournent autour de 16 Go de HBM2 et des valeurs pour les semi-professionnels et les créateurs de contenu. Il ne reste que leurs performances de jeu.

Sous le capot du Vega 20: GCN 7 nm
Bien que nous connaissions déjà le Vega 20 en raison de la sortie des cartes graphiques de qualité serveur, les Radeon Instinct MI50 et MI60, l'entrée de cette puce sur le marché grand public signifie la première carte de jeu à 7 nm. Une transition rapide vers un nœud inférieur - cette fois de 14 nm LPP GlobalFoundries à 7 nm TSMC (CLN7FF) - était autrefois la marque de fabrique d'AMD / ATi, et encore une fois AMD est pressé par la sortie, apportant le produit aux consommateurs si tôt. Dans ce cas, tous les attributs de Vega 20 sont clairement destinés aux professionnels et aux serveurs, bien qu'ils présentent des avantages pour les jeux.
Dans l’histoire complexe de Radeon VII, le sort de Vega était particulièrement mystérieux. Pour commencer, le GPU Vega 20 7 nm, qui a fait son chemin jusqu'aux consommateurs si tôt, a été une surprise. Bien qu'AMD n'ait mentionné Vega 20 que par rapport aux produits Radeon Instinct - se référant à sa future architecture Navi en mentionnant les GPU 7 nm pour les joueurs - AMD prétend maintenant que Radeon VII est depuis longtemps prévu pour le marché grand public. On pourrait peut-être en dire autant de Vega à 14 nm + / 12LP et du GPU Vega 11 (à ne pas confondre avec 11 unités de calcul Ryzen 2400G Vega), bien que cela ne soit pas inhabituel compte tenu de la nature des développements dans le domaine des semi-conducteurs.
Honnêtement, AMD était quelque peu cool envers Vega depuis le lancement de RX Vega, qui n'a pas tout à fait atteint ses objectifs. Même si Radeon VII est en quelque sorte une «puce Schrödinger», cela soulève des questions intéressantes sur le 7 nm. Par exemple, AMD a déjà retardé le moment de l'échantillonnage et du lancement de Vega 20 plus tôt. Il s'avère que la date de lancement de Radeon VII est la première qui pourrait être pour le successeur de Radeon Instinct. De plus, avec une taille de matrice de 331 mm2, il ne s'agit pas de petits SoC mobiles que nous avons vus jusqu'à présent sur TSMC 7 nm. Conçu pour les améliorations informatiques / ML, centré sur 4 piles HBM2 et construit sur un nœud mature et de pointe de 7 nm, le GPU Vega 20 ne ressemble pas à une carte prête à créer une bonne offre aux prix à la consommation. Et pourtant, grâce à une heureuse coïncidence, cela s'est produit.

Le Vega 20 combine l'architecture GCN 5 mise à jour avec une technologie de processus à 7 nm, avec 13,2 V par 331 mm2 de transistors (contre 12,5 V par 496 mm2 pour le Vega 10). En règle générale, à mesure que l'espace est réduit, les économies d'espace sont réinvesties dans davantage de transistors. Pour une carte graphique de jeu, cela peut signifier tout, depuis plus d'unités centrales et de blocs fonctionnels, jusqu'à la refonte des dispositions et des canaux de données améliorés pour augmenter la tolérance de fréquence. Ce dernier, bien sûr, devrait fournir une fréquence d'horloge plus élevée, et un tel choix était un élément important de la conception du Vega 10, où un nombre important de transistors ont été utilisés pour obtenir les caractéristiques de fréquence requises. Combinée à l'efficacité énergétique d'une unité de traitement plus petite, la nouvelle puce peut recevoir ces fréquences d'horloge plus élevées sans consommer d'énergie supplémentaire.

Cependant, à Vega 20, la plupart de l'espace économisé est resté «tel quel»: la puce a plus d'espace libre. Il y a plusieurs raisons à cela, certaines évidentes et d'autres non. Pour commencer, pour un grand processeur graphique hautes performances sur un nœud avancé de 7 nm au début du cycle de vie, le développement et la production sont très coûteux. Et, probablement, avec une augmentation de la taille, le coût augmentera considérablement et la rentabilité du produit diminuera. Bien que le processus TSMC 7 nm n'ait jusqu'à présent été vu publiquement que dans les SoC mobiles, Vega 20 semble utiliser des bibliothèques orientées HPC 7,5T, au lieu d'utiliser des bibliothèques 6T conçues pour les SoC mobiles.

Mais plus important encore, l'espace économisé vous permet de placer deux piles HBM2 supplémentaires sur un périphérique intermédiaire de taille similaire. Pour les densités et capacités de génération actuelles de HBM2, la limite pour une puce à double pile est de 16 Go de mémoire lors de l'utilisation d'une paire de piles 8-Hi. Mais pour le GPU au niveau du serveur - en particulier pour l'apprentissage orienté machine - une configuration à quatre piles est nécessaire pour fournir 32 Go de mémoire et un bus 4096 bits plus large. AMD a choisi une telle configuration pour Vega 20 et, en outre, il publie des versions à puce de 32 Go (8-Hi) et 16 Go (4-Hi).
La Radeon VII, quant à elle, utilise l'une de ces puces de 16 Go. Il convient de noter que ce n'est pas la première carte Vega de 16 gigaoctets d'AMD - ils ont déjà publié une carte avec cette quantité de mémoire. C'était une édition spécialisée Vega Frontier, mais après sa retraite, il s'agit de la première version d'une carte vidéo de 16 Go de la gamme AMD Vega.
Équiper une carte grand public de 16 Go de mémoire est un pari de la part d'AMD. Et, je soupçonne, c'est l'une des raisons pour lesquelles AMD veut saisir une partie du marché de la visualisation professionnelle avec Radeon VII. Lorsqu'il s'agit d'utiliser une station de travail et des tâches de création de contenu, une grande quantité de VRAM est facile à vendre car il existe déjà des tâches qui peuvent utiliser toute cette VRAM et plus encore. Mais pour les jeux, ce n'est pas la proposition la plus raisonnable, car les jeux ont des exigences plus fixes pour la VRAM, et jusqu'à présent il n'y a pas eu de telles grandes cartes, et les développeurs n'ont pas encore commencé à utiliser la ressource de mémoire vidéo de 16 Go. Bien que d'un autre côté, l'affirmation bruyante "cette carte a plus que suffisamment de mémoire vidéo" peut avoir un impact sérieux sur les ventes, et en 2019, la carte vidéo phare pour les joueurs devrait avoir ce montant de toute façon.
En revenant à la conception du Vega 20, AMD a pris une autre mesure pour réduire la complexité de développement et le coût de 7 nm: adhérer à l'architecture déjà bien connue. AMD a ajouté des optimisations mineures par rapport à Vega 10, mais ils n'ont pas osé faire une refonte sérieuse. En substance, c'est la logique de l'étape de tic-tac de la stratégie bien connue de tic-tac d'Intel.
En fait, Vega 20 est un successeur si direct de Vega 10 que, en plus du nombre de contrôleurs de mémoire, le nombre d'autres blocs fonctionnels est le même. Le GPU combine 64 CU et 256 unités de texture, divisées en 4 Shader Engine, ainsi que 64 ROP et AMD GPU.
(Je dois ajouter que, conformément à mon plan, AMD évite également soigneusement le problème de mise à l'échelle du moteur de shader. La nature de la limitation du moteur de 4 shader au cours des dernières années est restée floue, mais avec Vega, il y avait des indices d'aller au-delà de ces limites avec un équilibrage de charge amélioré en utilisant «intelligent distributeurs de groupe de travail "(IWD). Quoi qu'il en soit, la mise en place et la refonte d'une configuration 4+ SE équilibrée est une tâche intimidante, et cela n'a aucun sens si AMD prévoit d'apporter des changements fondamentaux à GCN.)

Ainsi, au niveau architectural, Vega 20 est une conception purement évolutive. Mais compte tenu de ce qui précède, il y a un peu plus «d'évolution» que de simplement réduire l'unité technologique. La combinaison de ces améliorations signifie qu'en pratique, le Vega 20 devrait être légèrement plus rapide que le Vega 10 lorsqu'il fonctionne à la même vitesse d'horloge.
L'amélioration la plus notable ici est la bande passante mémoire supplémentaire; deux fois plus sur ROP, unité de texture et ALU que sur Vega 10. C'est particulièrement bon pour les ROP, qui ont traditionnellement besoin de beaucoup de bande passante. Sans s'arrêter là, AMD a également apporté quelques améliorations au Core Fabric, qui connecte la mémoire avec ROP (entre autres). Malheureusement, AMD ne veut pas divulguer ce que sont ces améliorations, ils ont seulement confirmé qu'il n'y avait aucun changement dans le cache parmi eux.

Une autre partie du puzzle est qu'AMD a ajouté de nouvelles instructions et de nouveaux types de données qui, dans certains cas, accéléreront l'apprentissage automatique. AMD ne nous a pas fourni toutes les informations, mais en général, nous savons qu'ils ont ajouté la prise en charge des types de données INT8 et INT4, qui sont utiles pour les scripts de sortie de faible précision. AMD a également ajouté le produit scalaire FP16, qui est enregistré à la suite de FP32. Il s'agit d'un scénario plutôt spécifique, utile pour certains algorithmes d'apprentissage automatique, car il donne une précision du résultat plus élevée que le produit scalaire FP16-in / FP16-out.
En parlant de types de données, AMD a également considérablement augmenté les performances de FP64 pour Vega 20. En tant qu'architecture de base, GCN vous permet de créer des GPU avec des vitesses de 1/2 à 1/16 de la vitesse de FP32. 1/16. , - , 1/4 1/2. Vega 20, , ½ FP64 AMD Hawaii 2013 . , , FP32 Vega 10 , FP64- : , 8x RX Vega 64 (). , , Radeon VII — 1/4 — .
, AMD . (DCE) 12.1, (UVD) 7.2, video coding engine (VCE) 4.1. Vega 10 . Display Core Next Raven Ridge Video Core Next 1.0, , ASIC .

— SMU, Linux. , 64 . , AMD . Vega 10 ( 'hotspot'), Vega 20 , . , 1-2%, AMD .

SMU, , : , GPU , SMU. , (, GPU-Z), , AMD , API AMD.
, Vega AMD Vega 10 2017 , , Vega. AMD , .
Vega 20, AMD, , . AMD . - , , Next Generation Geometry (NGG) Vega 20 ( , Intelligent Workgroup Distributor ).
, AMD Vegas 10 Draw Stream Binning Rasterizer (DSBR), ; . Rapid Packed Math ( FP16), : Far Cry 5 Wolfenstein II.
FP64 Radeon VII Radeon Instinct MI50
Radeon VII , AMD , . AMD Radeon Pro Radeon Instinct, GPU Vega 20 - AMD. , , Radeon VII , .
– , AMD . , , Radeon VII, . AMD Vega 20, Radeon Instinct MI50 . , , Radeon VII ( 699 ), , AMD.
FP64. Vega 20, FP64 Vega 20 : FP32, 6,9 TFLOPS. Vega 20, , Radeon VII CES, , Radeon VII. , Radeon VII (1/2) FP64, , 1/8. , , AMD : 1/4.
AMD :
Radeon VII , . , Radeon VII, FP64. , Radeon VII 0,88 TFLOPS (DP = 1/16 SP). , , , 3,52 3,46 TFLOPS (DP = 1 / 4SP).
FP64 , , , , VBIOS , , , . , , Radeon VII, [].
, , Radeon VII , MI60 / MI50, FP64, AMD , .
3,5 TLFLOPS FP64, Radeon VII . 2000 . NVIDIA GeForce AMD Radeon FP64. Radeon VII NVIDIA Titan V, 4 .
, , . , , Data Scientist, .

, , , AMD . , . ML, , , INT8 / INT4 Radeon VII. FP16.
full-chip ECC. HBM2 Vega ECC DRAM. Vega 20 ECC , Radeon VII .
, Radeon VII - Vega 20. AMD , Vega 20 GPU PCI-Express 4.0, Radeon Instinct. Radeon VII , PCIe 3.0 ( Zen 2 PCIe 4.0 ). Infinity Fabric , Radeon VII .
, AMD, Radeon VII . «» . Radeon Instinct, Radeon Pro Vega 20.
Radeon VII
- . AMD Radeon VII : . RX Vega 64 Limited Edition Liquid, , AIB .

NVIDIA GeForce RTX , AMD . RX Vega 64 Liquid, AIO CLC R9 Fury X . , Founders Edition, , . . OEM-, «», , - .
TDP, 300 TBP Radeon VII . , 5 RX Vega 64. , , HBM2, , . 300 TBP , . Radeon VII – RX Vega 64, .

Radeon VII, , , 8- PCIe, BIOS RX Vega, BIOS . «Radeon» , «R» .

, : 3x DisplayPort 1x HDMI.

TIM, . , , RX Vega molded unmolded, . , ASIC.
Merci de rester avec nous. Aimez-vous nos articles? Vous voulez voir des matériaux plus intéressants? Soutenez-nous en passant une commande ou en le recommandant à vos amis, une
réduction de 30% pour les utilisateurs Habr sur un analogue unique de serveurs d'entrée de gamme que nous avons inventés pour vous: Toute la vérité sur VPS (KVM) E5-2650 v4 (6 cœurs) 10 Go DDR4 240 Go SSD 1 Gbps à partir de 20 $ ou comment diviser le serveur? (les options sont disponibles avec RAID1 et RAID10, jusqu'à 24 cœurs et jusqu'à 40 Go de DDR4).
VPS (KVM) E5-2650 v4 (6 cœurs) 10 Go DDR4 240 Go SSD 1 Gbit / s jusqu'à l'été gratuitement lorsque vous payez pour une période de six mois, vous pouvez commander
ici .
Dell R730xd 2 fois moins cher? Nous avons seulement
2 x Intel Dodeca-Core Xeon E5-2650v4 128 Go DDR4 6x480 Go SSD 1 Gbps 100 TV à partir de 249 $ aux Pays-Bas et aux États-Unis! Pour en savoir plus sur la
création d'un bâtiment d'infrastructure. classe utilisant des serveurs Dell R730xd E5-2650 v4 coûtant 9 000 euros pour un sou?