Conoce los nuevos procesadores Intel



Ayer, 02/04/2019, Intel anunció la tan esperada actualización para la familia de procesadores escalables Intel® Xeon®, presentada a mediados de 2017. Los nuevos procesadores se basan en microarquitectura, con nombre en código Cascade Lake y construido en un proceso mejorado de 14 nm.

Características de los nuevos procesadores.




Primero, eche un vistazo a las diferencias en el etiquetado. En el artículo anterior sobre Skylake-SP, ya mencionamos que todos los procesadores se dividen en 4 series: bronce , plata , oro y platino . El primer dígito del número indica a qué serie pertenece el modelo de procesador:

  • 3 - bronce,
  • 4 - plata,
  • 5, 6 - Oro,
  • 8 - Platino.

El segundo dígito indica la generación del procesador. Para la familia de procesadores escalables Intel® Xeon®, generaciones con nombre en código:

  • 1 - Skylake,
  • 2 - Lago Cascade.

Los siguientes dos dígitos indican la denominada SKU (Stock Keeping Unit). De hecho, esto es solo un identificador de CPU con un conjunto específico de funciones disponibles.

Además, después del número de modelo, puede haber índices denotados por una o dos letras. La primera letra del índice indica las características de la arquitectura u optimización del procesador, y la segunda, la capacidad de memoria en el zócalo.

Por ejemplo, tome un procesador con la etiqueta Intel® Xeon® 6240 . Descifrar:

  • 6 - procesador de la serie Gold,
  • 2 - la generación del lago Cascade,
  • 40 - SKU.

Rendimiento


Los procesadores de nueva generación están diseñados con la expectativa de uso en los campos de virtualización, inteligencia artificial y computación de alto rendimiento. El primer cambio notable fue el aumento en la frecuencia de reloj. Esto era bastante esperado, ya que hay una gran cantidad de aplicaciones de servidor para las cuales la velocidad del reloj es más importante que la cantidad de núcleos de procesador. Por ejemplo, el producto financiero 1C, cuyos requisitos del sistema dicen claramente que cuanto mayor sea la frecuencia del procesador, más rápido obtendrá el resultado el usuario final.

En algunos casos, se aumentó el número de núcleos. Para mayor claridad, hemos compilado tablas comparativas de varios procesadores de la familia de procesadores escalables Intel® Xeon® de la primera y segunda generación:
Intel® Xeon® Silver 4114
(10 núcleos)
Intel® Xeon® Silver 4214
(12 núcleos)
Velocidad del reloj2,20 GHz2,20 GHz
En modo turbo3.00 GHz3.20 GHz
Intel® Xeon® Gold 5118
(12 núcleos)
Intel® Xeon® Gold 5218
(16 núcleos)
Velocidad del reloj2,30 GHz2,30 GHz
En modo turbo3.20 GHz3.90 GHz
Intel® Xeon® Gold 6140
(18 núcleos)
Intel® Xeon® Gold 6240
(18 núcleos)
Velocidad del reloj2,30 GHz2,60 GHz
En modo turbo3.70 GHz3.90 GHz
Intel® Xeon® Gold 6144
(8 núcleos)
Intel® Xeon® Gold 6244
(8 núcleos)
Velocidad del reloj3.50 GHz3.60 GHz
En modo turbo4.20 GHz4.40 GHz
Un aumento en la frecuencia del reloj conduce inevitablemente a un aumento en la disipación de calor. Para los procesadores emblemáticos de la serie Platinum, puede llegar a 205W , que es una prueba muy seria para un sistema de enfriamiento de aire tradicional. Se puede suponer que en el futuro previsible, las plataformas de servidores requerirán refrigeración líquida.

Como en la generación anterior de Skylake SP, los procesadores se instalan en el zócalo LGA3647 (Socket P), que se debe al uso de un controlador de memoria de 6 canales (hasta un máximo de 2 módulos de memoria por canal). La frecuencia de la memoria es 2666 MT / s , sin embargo, cuando se usan procesadores de las series 6000 y 8000, puede usar la memoria con una frecuencia de 2933 MT / s (no más de 1 módulo por canal).



El bus de interconexión Ultra-Path , utilizado con éxito en los procesadores Intel Xeon SP de primera generación, permaneció en la segunda generación, proporcionando intercambio de datos entre procesadores a velocidades de 9.6 GT / so 10.4 GT / s para cada canal. Esto le permite escalar efectivamente la plataforma de hardware a 8 procesadores físicos, optimizando el ancho de banda y la eficiencia energética.

Pruebas


Comenzamos a probar los procesadores de nueva generación con la ayuda del conjunto de pruebas SPEC , que simulan la carga en función de la solución de las tareas de vida más urgentes. Estas pruebas representan los cálculos más simples y el cálculo de varios procesos físicos, por ejemplo, para resolver problemas de física molecular e hidrodinámica.

Actualmente, tenemos listos los resultados de algunas pruebas SPEC para cálculos enteros utilizando los procesadores Intel® Xeon® Gold 6140 e Intel® Xeon® Gold 6240 como ejemplos.

Intrate
PruebaIntel® Xeon® Gold 6140Intel® Xeon® Gold 6240
500.perlbench_r147157
531.deepsjeng_r127139
541.leela_r125127
548.exchange2_r176203

Intsepeed
PruebaIntel® Xeon® Gold 6140Intel® Xeon® Gold 6240
600.perlbench_s5,676.33
602.gcc_s6,958.74
641.leela_s3.243,62
648.exchange2_s5.947,90

Descripción de la prueba
  • perlbench_r es una versión simplificada del lenguaje Perl. La carga de prueba imita el trabajo del popular sistema antispam SpamAssassin;
  • deepsjeng_r - simulación de un juego de ajedrez. El servidor realiza un estudio en profundidad de las posiciones del juego utilizando el algoritmo de recorte alfa-beta;
  • leela_r - simulación de un juego en marcha . En el proceso de prueba, hay un análisis de patrones de movimiento, así como una búsqueda selectiva en el árbol basada en límites de confianza superiores;
  • exchange2_r - generador de rompecabezas sudoku no triviales. Escrito en Fortran 95, utiliza la mayoría de las funciones de procesamiento de matriz;
  • compilador del lenguaje gcc_s C. La carga de prueba "compila" el compilador GCC a partir de los códigos fuente para la arquitectura del microprocesador IA-32.


Según los resultados de las pruebas, queda claro que los procesadores de nueva generación realizan cálculos enteros más rápido que la generación anterior. Compartiremos los resultados de otras pruebas en uno de los siguientes artículos.

Intel® Optane ™ DC Soporte de memoria persistente


Acelerar la carga de trabajo de bases de datos y aplicaciones altamente cargadas: esto es lo que todos los clientes esperaban de la próxima actualización. Por lo tanto, una innovación clave fue el soporte para Intel® Optane ™ DC Persistent Memory, mejor conocido con el nombre en código Apache Pass.



Esta memoria está diseñada para convertirse en una solución universal al problema cuando el uso de la cantidad correcta de DRAM es económicamente desventajoso, y las características de velocidad de incluso los SSD insignia son insuficientes.

Un ejemplo vívido es la colocación de bases de datos directamente en la memoria persistente Intel® Optane ™ DC, que elimina la necesidad de un intercambio constante de datos entre RAM y un dispositivo de almacenamiento (una característica inherente a los sistemas tradicionales).

Se instala un nuevo tipo de memoria directamente en la ranura DIMM y es totalmente compatible con él. Los módulos con el siguiente volumen están disponibles:

  • 128 GB
  • 256 GB
  • 512 GB

Tales volúmenes significativos de módulos le permitirán configurar de manera flexible la plataforma de hardware, habiendo recibido un espacio en disco muy espacioso y muy rápido para sistemas altamente cargados. La memoria persistente Intel® Optane ™ DC tiene un potencial realmente enorme para la aplicación, incluido el aprendizaje automático.

Aprendizaje profundo más rápido


Además de admitir un nuevo tipo de memoria, los ingenieros de Intel se encargaron de acelerar el proceso de aprendizaje profundo. Dado que las redes neuronales convolucionales a menudo requieren una multiplicación múltiple de valores de 8 y 16 bits, los nuevos procesadores recibieron soporte para las instrucciones AVX-512 VNNI (Instrucciones de red neuronal vectorial). Esto le permitirá optimizar y acelerar el cálculo varias veces.

La mejor eficiencia se logra mediante la implementación del siguiente conjunto de instrucciones:

  • VPDPBUSD (para cálculos INT8),
  • VPDPWSSD (para cálculos INT16).

La conclusión es reducir la cantidad de artículos procesados ​​por ciclo. La instrucción VPDPWSSD combina las dos instrucciones INT16 y también usa la constante INT32 para reemplazar las dos instrucciones actuales PMADDWD y VPADDD . La instrucción VPDPUSB también reduce el número de elementos al reemplazar las tres instrucciones existentes VPMADDUSBW , VPMADDWD y VPADDD .

Por lo tanto, con la aplicación correcta del nuevo conjunto de instrucciones, es posible reducir el número de elementos procesados ​​por ciclo de dos a tres veces y aumentar la velocidad del procesamiento de datos. Un marco apropiado para nuevas instrucciones se convertirá en parte de bibliotecas de software de aprendizaje automático tan populares como:


Optimización del equilibrio de carga.


La carga uniforme de los recursos informáticos se hizo más fácil con la tecnología Intel® Speed ​​Select (en procesadores con un índice de Y). La conclusión es que cada operación comienza a asociarse con el número de núcleos involucrados y la velocidad del reloj. Dependiendo del perfil seleccionado de cada operación, los recursos se asignan de la siguiente manera:

  • más núcleos, pero con una velocidad de reloj más baja;
  • menos núcleos, pero con mayor velocidad de reloj.

Este enfoque le permite utilizar completamente los recursos, lo cual es especialmente importante cuando se utilizan entornos virtualizados. Esto reducirá los costos al optimizar la carga en los hosts de virtualización.

Aceleración de la computación científica


El procesamiento de datos científicos, especialmente al modelar procesos físicos a nivel de partículas (por ejemplo, calcular interacciones electromagnéticas) requiere una enorme cantidad de computación paralela. Este problema se puede resolver utilizando una CPU, GPU o FPGA.

Las CPU multinúcleo son universales debido a la gran cantidad de herramientas de software y bibliotecas para el procesamiento de datos. El uso de una GPU para estos fines también es muy efectivo, ya que puede ejecutar miles de subprocesos paralelos directamente en núcleos de gráficos de hardware. Existen marcos convenientes para el desarrollo, como OpenCL o CUDA, que le permiten crear aplicaciones de cualquier complejidad utilizando la informática GPU .

Sin embargo, hay otra herramienta de hardware de la que ya hablamos en artículos anteriores : FPGA. La capacidad de programar tales dispositivos para realizar cálculos específicos le permite acelerar el procesamiento de datos, descargando parcialmente la CPU. Se puede implementar un escenario similar en los nuevos procesadores Cascade Lake junto con discretos FPGA Intel® Stratix® 10 SX.

A pesar de la menor velocidad de reloj en comparación con las CPU convencionales, FPGA puede mostrar un rendimiento diez veces mayor. Para algunos tipos de tareas, como el procesamiento de señales digitales, el Intel® Stratix® 10 SX puede mostrar resultados de hasta 10 TFLOPS (operaciones de punto flotante por segundo).

Escalado de plataforma


Hacer negocios en tiempo real implica no solo estabilidad, sino también la capacidad de escalar a pedido. Un buen ejemplo es la plataforma SAP HANA de alto rendimiento utilizada para el almacenamiento y procesamiento de datos. La implementación física de esta plataforma requiere recursos de hardware muy potentes.

Los procesadores escalables Intel® Xeon® están diseñados para convertir sistemas de múltiples sockets en elementos centrales de la infraestructura de TI, proporcionando escalabilidad para satisfacer las demandas de las aplicaciones comerciales.



Esto se implementa en forma de soporte para controladores de nodo externos, lo que le permite crear configuraciones de un nivel superior al que puede proporcionar una sola plataforma. Por ejemplo, puede crear una configuración de 32 procesadores físicos combinando los recursos de varias plataformas multi-socket en un solo conjunto.

Conclusión


Un aumento en las frecuencias operativas y los núcleos del procesador, un aumento en la productividad y el soporte para la memoria persistente Intel® Optane ™ DC: todas estas mejoras aumentan significativamente la potencia informática de cada plataforma, reducen el costo de la cantidad de equipos utilizados y aumentan la eficiencia del procesamiento de datos. El principio de escalabilidad, establecido a nivel de arquitectura, le permite construir una infraestructura de TI de cualquier complejidad y lograr un alto rendimiento y eficiencia energética.

Dado que Selectel es un socio Intel Platinum, nuestros clientes ahora están listos para ordenar procesadores escalables Intel® Xeon® de próxima generación en servidores de configuración arbitraria.

¡Alquilar un servidor con procesadores de última generación es fácil! Simplemente vaya a la página del configurador y seleccione los componentes necesarios. Cualquier pregunta relacionada con la operación de los servicios puede hacerse a nuestros especialistas creando un ticket en el panel de control. Pagando un servidor con varios meses de anticipación, obtiene un descuento de hasta el 15%.

Si está interesado en participar en la prueba de las últimas tecnologías, únase a nuestro Laboratorio Selectel.

Estaremos encantados de escuchar sus preguntas y sugerencias en los comentarios.

Source: https://habr.com/ru/post/446494/


All Articles