La supercomputadora más rápida del mundo rompe el récord de IA


La supercomputadora Summit, desarrollada por IBM para el Laboratorio Nacional Oakridge, se convirtió en la más poderosa del mundo en 2018, tomando este título de los chinos por primera vez en cinco años.

En la costa oeste de EE. UU., Las empresas más valiosas del mundo compiten para hacer que la inteligencia artificial sea más inteligente. Google y Facebook presumieron de experimentos utilizando miles de millones de fotos y miles de procesadores potentes. Sin embargo, después de esto, el año pasado un proyecto del este de Tennessee superó silenciosamente la escala de cualquier IA corporativa. Y caminó bajo el liderazgo del gobierno de los Estados Unidos.

El proyecto récord involucró a la supercomputadora más poderosa del mundo, Summit , del Laboratorio Nacional de Oak Ridge. La computadora pudo capturar este título en junio pasado, llevándolo de regreso a los Estados Unidos después de cinco años de superioridad china. Como parte de un proyecto de estudio del clima, la computadora gigante cargó el experimento de aprendizaje automático, que fue lo más rápido que había sucedido antes.

Summit, que abarca un área igual a dos canchas de tenis, utilizó más de 27,000 GPU potentes en este proyecto. Dirigieron sus capacidades para trabajar con algoritmos de aprendizaje profundo, una tecnología que lidera las líneas del frente de la IA, capaz de procesar información a una velocidad de mil millones de billones de operaciones por segundo; esta velocidad en los círculos de la supercomputadora se conoce como exaop [el autor tuvo exaflops aquí, mezcló fracasos, operaciones de punto flotante, con operaciones, operaciones en general. El poder de procesamiento de Summit es de 122 petaflops, potencialmente el máximo es de 200 petaflops. Al mismo tiempo, se convirtió en la primera computadora en alcanzar la tasa exacta, o 10 18 operaciones por segundo. Durante el análisis de la información genética, se logró una velocidad de 1.88 exaop, y se espera que 3.3 exaop / aprox se logre durante los cálculos mixtos. transl.].

"Hasta ahora, la capacitación en profundidad no se ha expandido a tal escala", dice Prabhat, un grupo de investigación líder en el Centro Nacional de Ciencia para la Investigación de Energía en el Laboratorio Nacional Lawrence Berkeley. (Sí, él tiene un nombre). Su equipo colaboró ​​con investigadores en la base de operaciones de Summit, el Laboratorio Nacional de Oak Ridge.

Apropiadamente, la inteligencia artificial en una computadora poderosa se centró en uno de los mayores problemas del mundo: el cambio climático. Las compañías tecnológicas entrenan algoritmos para reconocer caras o señales de tráfico; los científicos estatales los entrenan para reconocer patrones climáticos, por ejemplo, ciclones, en abundantes conjuntos de datos obtenidos en simulaciones climáticas, pronósticos de tres horas de la atmósfera de la Tierra, que se extienden por un siglo. (No se sabe cuánta energía gastó este proyecto ni cuánto carbono emitió a la atmósfera).


Los bastidores con equipo Summit conectan 300 km de cable de fibra óptica, y 15,000 litros de agua circulan cada minuto junto a 37,000 procesadores, enfriándolos.

Las consecuencias del experimento de la Cumbre afectarán el futuro de la IA y la climatología. El proyecto demuestra el potencial científico de las posibilidades de aplicar GO a las supercomputadoras, que tradicionalmente se han dedicado a la simulación de procesos físicos y químicos, como explosiones nucleares, agujeros negros o nuevos materiales. También demuestra que un aumento en el poder de cómputo, si se recibe, proporciona beneficios para el MO, y esto es un buen augurio para futuros avances.

"Hasta que hicimos este proyecto, no sabíamos que podría escalar tanto", dice Rajat Monga, director de ingeniería de Google. Él y otros ayudantes de Google ayudaron al proyecto adaptando TensorFlow, el software MO, a la gran escala de Summit.

La mayor parte del trabajo sobre el escalado de GO tuvo lugar en los centros de datos de las empresas de Internet, donde los servidores trabajan juntos en tareas, dividiéndolas en partes, debido al hecho de que se combinan de forma relativamente libre y no están conectadas a una computadora gigante. Para las supercomputadoras como Summit, la arquitectura se ve diferente; tienen conexiones especiales de alta velocidad que combinan miles de procesadores en un solo sistema que puede funcionar como un todo. Hasta hace poco, pocas personas intentaban adaptar el MO para trabajar en un hardware similar.

Monga dice que trabajar para adaptar TensorFlow a Summit revitalizará los esfuerzos de Google para expandir sus propios sistemas de inteligencia artificial. Los ingenieros de Nvidia también ayudaron en este proyecto, asegurando la colaboración perfecta de decenas de miles de GPU Nvidia.

El hecho de que se descubra que los métodos proporcionan algoritmos GO con una potencia computacional creciente ha desempeñado un papel en el desarrollo activo de la tecnología que ha estado ocurriendo recientemente. La tecnología que Siri usa para reconocer su voz, y los autos robóticos Waymo para reconocer las señales de tránsito, se volvieron útiles en 2012, después de que los investigadores la adaptaron para trabajar en las GPU Nvidia.

En un artículo analítico publicado en mayo pasado, los investigadores de OpenAI, un instituto de investigación en San Francisco, uno de cuyos inversores era Elon Musk, calcularon que la cantidad de recursos informáticos en los proyectos más grandes relacionados con el MO son conocidos por el público desde 2012 se duplica aproximadamente cada 3.43 meses, o crece 11 veces al año. Tal progreso ha ayudado a los bots de Alphabet, la compañía matriz de Google, a derrotar a los campeones de los juegos de mesa y videojuegos complejos, y ha ayudado a dar un gran salto en la precisión de las traducciones del servicio de Google.

Ahora Google y otras compañías están creando nuevos tipos de chips diseñados específicamente para AI para continuar esta tendencia. Google dice que sus "pods", que integran estrechamente más de 1000 de sus chips para IA, los llaman procesadores tensoriales o TPU, pueden producir 100 petaflops de potencia informática, que es 10 veces [aparentemente, el doble de real / aprox. trans.] menos de lo que Summit logró en su experimento de IA.

La contribución de Summit a la climatología es demostrar cómo las grandes IA pueden mejorar nuestra comprensión de los patrones climáticos futuros. Cuando los investigadores emiten predicciones climáticas con cien años de anticipación, se hace bastante difícil leerlo. “Imagina que tienes un video de YouTube que dura 100 años. Manualmente no puedes encontrar todos los gatos y perros allí ", dice Prabhat. El software que se usa comúnmente para automatizar procesos, dijo, es imperfecto. Los resultados de la Cumbre mostraron que el Ministerio de Educación puede mejorar, y esto debería ayudar a predecir los efectos de tormentas como inundaciones y destrucción. Los resultados de Summit le valieron a los investigadores de Oakridge y Nvidia el Premio Gordon Bell a la Excelencia en Supercomputación.

Lanzar GO en supercomputadoras es una idea nueva que surgió en el momento adecuado para los climatólogos, dice Michael Pritchard, profesor de la Universidad de California en Irvine. La velocidad de desaceleración de las mejoras en los procesadores convencionales ha obligado a los ingenieros a cambiar a llenar supercomputadoras con un número cada vez mayor de chips gráficos, donde el rendimiento está creciendo de manera más confiable. "Ha llegado el momento en que ya no era posible aumentar la potencia informática de la manera habitual", dice Pritchard.

Estos cambios son obstáculos para las simulaciones habituales que deben adaptarse. También brindan la oportunidad de atraer todo el poder de GO, que naturalmente se adapta a los chips gráficos. Esto puede darnos una imagen más clara del futuro de nuestro clima. El año pasado, el grupo de Pritchard demostró que los GO pueden producir simulaciones de nubes más realistas en los pronósticos climáticos, lo que puede mejorar los pronósticos de cambios en los patrones de lluvia.

Source: https://habr.com/ru/post/440748/


All Articles