Clasificación de supercomputadora Top500 publicada en junio de 2016, China presentó 100 supercomputadoras PFlops
Hoy se publica la 47ª clasificación mundial de supercomputadoras Top500 de acuerdo con la prueba de Linpack. A diferencia de las 6 versiones anteriores de la calificación, el líder de la lista cambió, la supercomputadora china Sunway TaihuLight (神威 · 太湖 之 光) con el resultado de 93 petaflops en la prueba de Linpack (rendimiento teórico de 125.4 petaflops) quedó en primer lugar . Su rendimiento es aproximadamente 3 veces mayor que el del líder anterior de la lista, el chino Tianhe-2 .
El nuevo superordenador fue desarrollado por el Centro Nacional de Investigación de Ingeniería y Tecnología de Computación Paralela de China (Centro Nacional de Investigación de Ingeniería y Tecnología de Computación Paralela). El sistema está ubicado en el Centro Nacional de Supercomputadoras en la provincia de WuxiJiangsu en el este de China.
La supercomputadora se basa en los nuevos procesadores chinos de la familia ShenWei : SW26010 con la arquitectura RISC original de 64 bits, presumiblemente fabricada con tecnología de 28 nm. Cada procesador está equipado con 260 núcleos, funciona a una frecuencia de 1,45 GHz y tiene un rendimiento de 3,06 teraflops.El procesador fue desarrollado en el Centro de Diseño IC de Alto Rendimiento de Shanghai. El procesador consta de 4 bloques centrales similares, conectados por una red integrada en un chip. Cada unidad tiene un núcleo de control (Elemento de procesamiento de gestión, MPE), un controlador de memoria DDR3 (128 bits) y 64 núcleos de procesamiento (Elementos de procesamiento de computación, CPE) en una matriz de 8x8. Ambos tipos de núcleos tienen microarquitectura con ejecución extraordinaria de comandos. Los núcleos de control MPE admiten la ejecución tanto del sistema operativo como del código de usuario, utilizan operaciones de vector de 264 bits, contienen 32 KB de caché en el primer nivel de instrucciones y datos, y 256 KB de caché en el segundo nivel. Los núcleos de computación CPE solo pueden ejecutar código de usuario con vectores de 264 bits; usan 16 KB de caché de instrucciones y 64 KB de memoria temporal (memoria de bloc de notas ). Cada uno de los 4 bloques principales tiene acceso a 8 GB de RAM DDR3-2133, por lo que el nodo tiene 32 GB de RAM con un ancho de banda total de hasta 136.5 GB / s.El rendimiento informático SIMD en núcleos MPE es de 16 operaciones flotantes de doble precisión (64 bits) por ciclo, en núcleos CPE: 8 operaciones por ciclo. El rendimiento total de los núcleos MPE a 1,45 GHz puede alcanzar los 23,2 gigaflops, los núcleos CPE: 11,6 gflops.En total, la supercomputadora usa más de 10.6 millones de núcleos que consisten en 40,960 nodos de procesador único en 40 bastidores de computación. Cada rack tiene 4 supernodos; el supernodo consta de 32 módulos de 8 nodos cada uno. Los módulos están refrigerados por agua. Hay pocos detalles sobre la red principal de la supercomputadora, se sabe que cada chip SW26010 tiene una conexión PCI Express 3 (16x) a la red de tres niveles "Sunway Network". Diámetro de red - 7, "ancho de banda de bisección" - 70 TB / s. Dongarra dice que se están utilizando adaptadores de canal host y conmutadores de la compañíaMellanox , con un ancho de banda de canal de aproximadamente 12 GB / s (100 Gb / s) y retrasos del orden de 1 μs.La eficiencia computacional en la prueba de HPL (Linpack) fue del 74% del rendimiento teórico. Al mismo tiempo, en una prueba de HPCG más compleja , el sistema mostró solo 0.3% del nivel máximo (algunos sistemas alcanzan 1-3%), lo que indica una memoria relativamente lenta y un ancho de banda de red insuficiente. Para SW26010, la relación de flops máximos con respecto al ancho de banda de memoria es de 22.4 flops / byte (en comparación, Intel Knights Landing tiene 7.2 flops / byte). Dongarra también señaló que el sistema tiene relativamente poca RAM, solo 1.3 PB (Tianhe-2 tiene 1.4 PB, el Titán Americano, que ya ocupa el 3er lugar en Top500 - 0,71 PB).El consumo de energía promedio de la supercomputadora durante la prueba de HPL fue de 15.3 MW (que es un poco menos de 17 MW en Tianhe-2), el máximo, un poco menos de 18 MW. Según Dongarra, la eficiencia energética fue de 6 gigaflops por vatio (teniendo en cuenta el consumo de procesador, memoria y red). La nueva supercomputadora ocupó el tercer lugar en la clasificación green500.org (más eficientes energéticamente son RIKEN Shoubu con 6.6 gflops / W y RIKEN Satsuki con 6.2 gflops / W).El sistema operativo de la supercomputadora, Sunway Raise OS 2.0.5, está basado en Linux. Se ofrece a los usuarios C / C ++, compiladores Fortran, utilidades de vectorización automática y bibliotecas matemáticas. La utilidad Sunway OpenACC ofrece soporte para el estándar OpenACC 2.0 para simplificar la programación de procesadores multi-core.El costo de crear una supercomputadora es de 1.800 millones de yuanes, unos 270 millones de dólares estadounidenses.La información detallada está disponible en el fundador ranking de superordenadores artículo Jack Dongarra : Jack Dongarra, Informe sobre el Sunway Sistema TaihuLight, junio de 2016, http://www.netlib.org/utk/people/JackDongarra/PAPERS/sunway-report-2016. pdf; ilustraciones del artículo "The Sunway Taihu Light Supercomputer: System and Applications", de Fu HH, Liao JF, Yang JZ, et al., aceptadas para su publicación en Sci. China Inf. Sci., 2016, 59 (7): 072001, doi: 10.1007 / s11432-016-5588-7.También se han publicado varias diapositivas de la presentación de los Premios TOP500 y Green500 en ISC 2016 :
Source: https://habr.com/ru/post/es395203/
All Articles