Peringkat superkomputer top500 yang diterbitkan pada Juni 2016, Cina memperkenalkan 100 superkomputer PFlops
Hari ini peringkat superkomputer dunia Top500 ke - 47 dirilis sesuai dengan uji Linpack. Berbeda dengan 6 versi sebelumnya dari peringkat, pemimpin daftar berubah, superkomputer Sunway TaihuLight Cina (神威 · 太湖 之 光) dengan hasil 93 petaflops pada tes Linpack (kinerja teoritis 125,4 petaflops) keluar di atas . Kinerjanya sekitar 3 kali lebih tinggi dari pemimpin sebelumnya dalam daftar, Tianhe-2 Cina .
Superkomputer baru dikembangkan oleh Pusat Penelitian Nasional Teknik dan Teknologi Komputer Paralel China (Pusat Riset Nasional Teknik & Teknologi Komputer Paralel). Sistem ini terletak di Pusat Nasional untuk Superkomputer di Provinsi WuxiJiangsu di timur Cina.
Superkomputer ini didasarkan pada prosesor Cina baru dari keluarga ShenWei - SW26010 dengan arsitektur RISC 64-bit asli, mungkin dibuat menggunakan teknologi 28 nm. Setiap prosesor dilengkapi dengan 260 core, beroperasi pada frekuensi 1,45 GHz dan memiliki kinerja 3,06 teraflops.Prosesor ini dikembangkan di Shanghai High Performance IC Design Center. Prosesor terdiri dari 4 blok inti yang serupa, dihubungkan oleh jaringan terintegrasi pada sebuah chip. Setiap unit memiliki satu inti kontrol (Elemen Pemrosesan Manajemen, MPE), pengontrol memori DDR3 (128 bit) dan 64 inti pemrosesan (Komponen Pemrosesan Komputasi, CPE) dalam array 8x8. Kedua jenis core memiliki mikroarsitektur dengan eksekusi perintah yang luar biasa. Kernel Control MPE mendukung eksekusi sistem operasi dan kode pengguna, menggunakan operasi vektor 264-bit, berisi 32 KB cache di level instruksi dan data pertama, dan cache 256 KB di level kedua. Komputasi CPE core hanya dapat mengeksekusi kode pengguna dengan vektor 264-bit, mereka menggunakan 16 KB cache instruksi dan 64 KB memori sementara ( Scratch Pad Memory ). Masing-masing dari 4 blok inti memiliki akses ke 8 GB RAM DDR3-2133, sehingga node memiliki 32 GB RAM dengan total bandwidth hingga 136,5 GB / s.Kinerja komputasi SIMD pada inti MPE adalah 16 operasi mengambang presisi ganda (64-bit) per siklus, pada core CPE - 8 operasi per siklus. Total kinerja inti MPE pada 1,45 GHz dapat mencapai 23,2 gigaflop, inti CPE - 11,6 gflop.Secara total, superkomputer menggunakan lebih dari 10,6 juta core yang terdiri dari 40.960 node prosesor tunggal dalam 40 rak komputasi. Setiap rak memiliki 4 node super, node super terdiri dari 32 modul masing-masing 8 node. Modul didinginkan dengan air. Ada beberapa detail tentang jaringan utama superkomputer, diketahui bahwa setiap chip SW26010 memiliki koneksi PCI Express 3 (16x) ke jaringan tiga tingkat "Sunway Network". Diameter jaringan - 7, “bandwidth dua bagian” - 70 TB / s. Dongarra mengatakan adapter saluran host dan sakelar perusahaan sedang digunakanMellanox , dengan bandwidth saluran sekitar 12 GB / s (100 Gb / s) dan keterlambatan urutan 1 μs.Efisiensi komputasi pada uji HPL (Linpack) adalah 74% dari kinerja teoritis. Pada saat yang sama, pada tes HPCG yang lebih kompleks , sistem hanya menunjukkan 0,3% dari level puncak (beberapa sistem mencapai 1-3%), yang menunjukkan memori yang relatif lambat dan bandwidth jaringan tidak mencukupi. Untuk SW26010, rasio jepit puncak ke bandwidth memori adalah 22,4 jepit / byte (untuk perbandingan, Intel Knights Landing memiliki 7,2 jepit / byte). Dongarra juga mencatat bahwa sistem ini memiliki RAM yang relatif kecil, hanya 1,3 PB (Tianhe-2 memiliki 1,4 PB, the American Titan, yang sudah mengambil tempat ke-3 di Top500 - 0,71 PB).Konsumsi daya rata-rata dari superkomputer selama tes HPL adalah 15,3 MW (yang sedikit kurang dari 17 MW di Tianhe-2), maksimum - sedikit kurang dari 18 MW. Menurut Dongarra, efisiensi energi adalah 6 gigaflops per watt (dengan mempertimbangkan prosesor, memori, dan konsumsi jaringan). Superkomputer baru ini menempati peringkat ketiga dalam peringkat green500.org (lebih hemat energi adalah RIKEN Shoubu dengan 6,6 GFlops / W dan RIKEN Satsuki dengan 6,2 GFlops / W).Sistem operasi superkomputer, Sunway Raise OS 2.0.5, berbasis Linux. Pengguna ditawarkan C / C ++, kompiler Fortran, utilitas vektorisasi otomatis, dan perpustakaan matematika. Utilitas Sunway OpenACC menawarkan dukungan untuk standar OpenACC 2.0 untuk menyederhanakan pemrograman prosesor multi-inti.Biaya pembuatan superkomputer adalah 1,8 miliar yuan, sekitar 270 juta dolar AS.Informasi yang paling rinci tersedia di pendiri peringkat artikel superkomputer Jack Dongarra : Jack Dongarra, Laporan Sunway TaihuLight Sistem Juni 2016, http://www.netlib.org/utk/people/JackDongarra/PAPERS/sunway-report-2016. pdf; ilustrasi dari artikel "Superkomputer Cahaya Sunway Taihu: Sistem dan Aplikasi", oleh Fu HH, Liao JF, Yang JZ, dkk., diterima untuk publikasi di Sci. Inf China Sci., 2016, 59 (7): 072001, doi: 10.1007 / s11432-016-5588-7.Beberapa slide dari presentasi Penghargaan TOP500 & Green500 di ISC 2016 juga telah diterbitkan :
Source: https://habr.com/ru/post/id395203/
All Articles