El Laboratorio Nacional de Oak Ridge lanza la supercomputadora más rápida del mundo de Summit


Supercomputadora nodo Cumbre. Foto: Laboratorio Nacional Oak Ridge (EE. UU.)

Lo más probable es que Estados Unidos recupere el liderazgo en el ranking de las supercomputadoras TOP500 . El 8 de junio de 2018, se anunció el lanzamiento de la supercomputadora Summit "más poderosa del mundo" con una capacidad de 200 petaflops. Y si China no presenta ninguna sorpresa, entonces en junio TOP500 habrá un cambio de líder . Los más de 200 petaflops reclamados serán más que suficientes para superar al actual campeón Sunway TaihuLight (93 PFLOPS) en la prueba de Linpack.


La supercomputadora Summit pesa 340 toneladas y ocupa una sala de 860 m². Se bombean 15 toneladas de agua por minuto para enfriar. Foto: Laboratorio Nacional Oak Ridge

La supercomputadora Summit consta de 4.608 nodos, cada uno de los cuales tiene dos procesadores IBM Power9 de 22 núcleos y seis GPU Nvidia Tesla V100. Los nodos están conectados por una red Mellanox EDR InfiniBand de doble riel con un rendimiento de 200 Gb / s por servidor. Para IBM, esta es una presentación de los servidores Power9-GPU AC922, que se pueden ofrecer a otros clientes.

Con todos los nodos totalmente equipados, solo las GPU proporcionarán el máximo rendimiento de 215 petaflops de doble precisión. Además, cada V100 produce otros 125 teraflops con precisión mixta: este es el tipo principal de operación del núcleo tensor V100. Por lo tanto, en aplicaciones de aprendizaje profundo, el rendimiento máximo puede ser de alrededor de 125 × 27648 = 3.46 exaflops . Si es real, entonces en la región de 3.3 exaflops, dicen los expertos.

Estos no son solo cálculos teóricos. Según el director del Laboratorio Nacional de Oak Ridge, Thomas Zacharia, incluso antes de la finalización del sistema, los investigadores lanzaron cálculos sobre los núcleos tensoriales de los genomas comparados por GPU y registraron el rendimiento de 1,88 exaflops. La aplicación procesó los genomas en busca de muestras que coincidan con ciertas condiciones. Este es el primer caso en la historia de la tecnología informática cuando se superó la barrera de facto de 1 exaflops, es decir, 10 18 operaciones de punto flotante por segundo. Hay tanto ruido en la sala de servidores de este monstruo que es imposible trabajar allí sin auriculares ( video ).


Nodo Cumbre. Alrededor de 300 kilómetros de cable de fibra óptica se colocaron en la habitación para una supercomputadora. Foto: Laboratorio Nacional Oak Ridge (EE. UU.)

Por supuesto, además del entrenamiento profundo, Summit admite cálculos en un conjunto estándar de aplicaciones en las que está interesado el Departamento de Energía de EE. UU., Incluidos los cálculos relacionados con la energía termonuclear, la energía alternativa, la ciencia de los materiales, el modelado climático, la química computacional y la cosmología. Al mismo tiempo, Summit sigue siendo un sistema abierto, por lo que los clientes ejecutarán todos los tipos de cálculos que deseen, incluso sin relación alguna con la energía. Se supone que Summit debe usarse para aplicaciones de atención médica en áreas como la búsqueda de nuevos medicamentos. Como dijo Thomas Zachariah en una conferencia de prensa, su centro de investigación debería convertirse en algo así como el CERN para la minería y análisis de datos médicos.


Cumbre de la supercomputadora. Foto: Laboratorio Nacional Oak Ridge

Cuando en 2014 se firmó un contrato con IBM para la construcción de esta supercomputadora, se incluyó una GPU en su composición. En ese momento, el Departamento de Energía tenía ideas muy vagas sobre qué hacer con las capacidades de aprendizaje profundo, pero Nvidia decidió introducir núcleos tensoriales en el V100, y como resultado, Summit de repente se convirtió en un monstruo de aplicaciones de inteligencia artificial. Por lo tanto, se puede suponer que el sistema se cargará con muchas investigaciones avanzadas de IA, además de sus responsabilidades principales. Hasta ahora, los proyectos para la Cumbre se seleccionan por aplicación, pero en 2019 el sistema estará más ampliamente disponible bajo el innovador y novedoso impacto computacional sobre el programa de teoría y experimento (INCITE).


Microprocesador multinúcleo de la supercomputadora china Sunway TaihuLight. Hasta el 8 de junio de 2018, esta supercomputadora era considerada la más poderosa del mundo.

Después del lanzamiento de Summit, las autoridades probablemente decidirán desmantelar a su predecesora, la supercomputadora Titan, que en el momento de su lanzamiento en 2012 era reconocida como la más poderosa del mundo y sigue siendo la supercomputadora más rápida de los Estados Unidos. Pero ahora tiene poco sentido apoyar su trabajo, porque es 8 veces inferior en velocidad a Summit, mientras que es inferior en eficiencia energética en 5 veces.

Titan está equipado con GPU K20X, en las que el rendimiento en informática de precisión simple para el aprendizaje automático se limita a un modesto cuatro teraflops por dispositivo. Además, todos los programas para Titan son fáciles de transferir a Summit.

Source: https://habr.com/ru/post/es413769/


All Articles