Aujourd'hui, le 47e classement mondial des superordinateurs Top500 est publié conformément au test Linpack. Contrairement aux 6 versions précédentes de la note, le leader de la liste a changé, le supercalculateur chinois Sunway TaihuLight (神威 · 太湖 之 光) avec le résultat de 93 pétaflops au test Linpack (performance théorique 125,4 pétaflops) est arrivé en tête . Ses performances sont environ 3 fois supérieures à celles du précédent leader de la liste, le chinois Tianhe-2 .
Le nouveau supercalculateur a été développé par le Centre national de recherche en génie informatique et technologie parallèle de Chine (Centre national de recherche en génie informatique et technologie parallèle). Le système est situé au Centre national des superordinateurs de la province de WuxiJiangsu à l'est de la Chine.
Le superordinateur est basé sur les nouveaux processeurs chinois de la famille ShenWei - SW26010 avec l'architecture RISC 64 bits d'origine, vraisemblablement fabriqués à l'aide de la technologie 28 nm. Chaque processeur est équipé de 260 cœurs, fonctionne à une fréquence de 1,45 GHz et a une performance de 3,06 téraflops.Le processeur a été développé au Shanghai High Performance IC Design Center. Le processeur se compose de 4 blocs de base similaires, connectés par un réseau intégré sur une puce. Chaque unité possède un cœur de contrôle (Management Processing Element, MPE), un contrôleur de mémoire DDR3 (128 bits) et 64 cœurs de traitement (Computing Processing Elements, CPE) dans une matrice 8x8. Les deux types de cœurs ont une microarchitecture avec une exécution extraordinaire des commandes. Les noyaux de contrôle MPE prennent en charge l'exécution du système d'exploitation et du code utilisateur, utilisent des opérations vectorielles de 264 bits, contiennent 32 Ko de cache au premier niveau d'instructions et de données et 256 Ko de cache au deuxième niveau. Les cœurs de calcul CPE peuvent uniquement exécuter du code utilisateur avec des vecteurs de 264 bits; ils utilisent 16 Ko de cache d'instructions et 64 Ko de mémoire temporaire ( Scratch Pad Memory ). Chacun des 4 blocs de base a accès à 8 Go de RAM DDR3-2133, de sorte que le nœud dispose de 32 Go de RAM avec une bande passante totale allant jusqu'à 136,5 Go / s.Les performances de calcul SIMD sur les cœurs MPE sont de 16 opérations flottantes double précision (64 bits) par cycle, sur les cœurs CPE - 8 opérations par cycle. Les performances totales des cœurs MPE à 1,45 GHz peuvent atteindre 23,2 gigaflops, cœurs CPE - 11,6 gflops.Au total, le supercalculateur utilise plus de 10,6 millions de cœurs composés de 40 960 nœuds à processeur unique dans 40 racks informatiques. Chaque rack possède 4 super-nœuds; le super-nœud se compose de 32 modules de 8 nœuds chacun. Les modules sont refroidis par eau. Il y a peu de détails sur le réseau principal du supercalculateur, il est connu que chaque puce SW26010 a une connexion PCI Express 3 (16x) au réseau à trois niveaux "Sunway Network". Diamètre du réseau - 7, «bande passante de bissection» - 70 To / s. Dongarra dit que des adaptateurs de canal hôte et des commutateurs d'entreprise sont utilisésMellanox , avec une bande passante de canal d'environ 12 Go / s (100 Gb / s) et des retards de l'ordre de 1 μs.L'efficacité de calcul sur le test HPL (Linpack) était de 74% des performances théoriques. Dans le même temps, lors d'un test HPCG plus complexe , le système n'a montré que 0,3% du niveau de pointe (certains systèmes atteignent 1 à 3%), ce qui indique une mémoire relativement lente et une bande passante réseau insuffisante. Pour SW26010, le rapport des pics de crête à la bande passante mémoire est de 22,4 flops / octet (à titre de comparaison, Intel Knights Landing a 7,2 flops / octet). Dongarra a également noté que le système a relativement peu de RAM, seulement 1,3 PB (Tianhe-2 a 1,4 PB, l'American Titan, qui occupe déjà la 3e place du Top500 - 0,71 PB).La consommation électrique moyenne du supercalculateur lors du test HPL était de 15,3 MW (ce qui est légèrement inférieur à 17 MW à Tianhe-2), le maximum - un peu moins de 18 MW. Selon Dongarra, l'efficacité énergétique était de 6 gigaflops par watt (en tenant compte de la consommation du processeur, de la mémoire et du réseau). Le nouveau supercalculateur a pris la troisième place dans la notation green500.org ( RIKEN Shoubu avec 6,6 gflops / W et RIKEN Satsuki avec 6,2 gflops / W) sont les plus éconergétiques., Sunway Raise OS 2.0.5, Linux. C/C++, Fortran, , . Sunway OpenACC
OpenACC 2.0 .
— 1.8 , 270 .
: Jack Dongarra, Report on the Sunway TaihuLight System, June 2016,
http://www.netlib.org/utk/people/JackDongarra/PAPERS/sunway-report-2016.pdf; illustrations de l'article "Le superordinateur léger Sunway Taihu: système et applications", par Fu HH, Liao JF, Yang JZ, et al., acceptées pour publication dans Sci. China Inf. Sci., 2016, 59 (7): 072001, doi: 10.1007 / s11432-016-5588-7.Plusieurs diapositives de la remise des TOP500 & Green500 Awards à l' ISC 2016 ont également été publiées :