
Menos de dos años después del anuncio, Intel presentó la segunda generación de procesadores escalables Intel Xeon en la nueva arquitectura de Cascade Lake. Oficialmente - 2 de abril. La propia empresa lo llama el lanzamiento más grande de su historia, estratégicamente muy importante para él. Bueno, descubramos qué tienen de especial estas nuevas Scalables.
Lo que quedaba?
Los procesadores Cascade Lake, o más bien Cascade Lake SP, como sus predecesores Skylake, todavía pertenecen a la plataforma Purley, ahora la segunda generación: Purley Refresh. Son totalmente compatibles con Skylake a nivel de conector, chipsets y placas base heredadas de la primera generación. Pero con matices, por ejemplo, la nueva biografía.
La tecnología del proceso no ha cambiado. Los mismos 14 nm, sin embargo, con optimizaciones.
El esquema general de nomenclatura y nomenclatura para las series Platinum, Gold, Silver, Bronze se ha mantenido igual. Es cierto que hay más "sufijos". Se agregaron nuevos Y, N, V y S a los existentes L, M y T. La numeración de la segunda posición (cientos) ha cambiado en la numeración: ahora en lugar de la unidad, dos, es decir, el Gold 6240 será el sucesor, por ejemplo, el Gold 6140.
De lo contrario, las características básicas y el conjunto de características no han cambiado. El número de núcleos y tamaños de caché ocupan posiciones: hasta 28 y 1 MB L2 por núcleo + hasta 38.5 MB en total L3. La cantidad y el tipo de líneas PCI-E son las mismas que eran: 48 líneas de la versión 3.0. La escalabilidad es la misma: hasta 3 líneas UPI por 10.4 GT / sy hasta 8 sockets (sin interrupciones) en el sistema.
¿Qué agregaste?
En general, hay muchas micro actualizaciones diferentes, pero las destacaría de las más o menos significativas.
Primero, Cascade Lake introdujo parches de hardware contra vulnerabilidades sensacionales el año pasado . Intel introdujo soluciones de software y hardware contra las opciones 2 (Specter), 3, 3a y 4 (Specter NG), L1TF (Foreshadow). Para Specter Variant 1, solo se ofrece el parche de software. Es decir, todo lo que ya está en la línea Intel Core i9. Y así se ve en un comunicado de prensa:
- Opción 1. La protección se lleva a cabo mediante OS y VMM (Virtual Machine Monitor)
- Opción 2. Fortalecimiento de la predicción de rama de hardware (prevención de futuros ataques con este método) + mediante OS y VMM
- Opción 3. Endurecimiento de hardware
- Opción 3a. Hardware
- Opción 4. Hardware + OS / VMM
- L1TF. Ya cerrado gracias a la opción de endurecimiento de hardware 3
En segundo lugar, apareció soporte para memoria DDR4-2933. Pero con reservas: solo para las líneas Gold y Platinum (Bronze y Silver todavía funcionan con DDR4-2400) y con solo un DIMM por canal, en una configuración con dos DIMM por canal, la frecuencia disminuye a 2666 MT / s.
En tercer lugar, se estrenó Intel Optane DC Persistent Memory (DCPM). Tiskoma obtuvo la
redacción más clara sobre lo que es , así que cito:
"Intel Optane DC Persistent Memory (DCPM) es una nueva clase de tecnología que combina los conceptos llamados" memoria y almacenamiento "para su uso en centros de datos".
Puede recordar que Intel introdujo previamente la tecnología Intel Memory Drive para Xeon Skylake: Hypervisor (Xen) + Optane NVMe Modules. Incluso hicimos pruebas sobre este tema, pero los resultados no fueron inspiradores, y decidimos esperar una solución más impresionante. Parece haber esperado =)
En el núcleo de la nueva solución de Intel están los DCPMM que son visualmente similares a los DIMM y son compatibles eléctrica y mecánicamente con ellos. Operan a una velocidad de 2666 MT / sy tienen una capacidad de 128/256/512 GB. A nivel lógico, utilizan el protocolo DDR4-T (Transacción), que, según Intel, está aprobado por JEDEC, pero en la práctica solo es compatible con los controladores de memoria de Cascade Lake. Es decir, instalaron una memoria independiente de la energía hecha con la tecnología 3D XPoint en el conector DDR4 DIM4, que nuevamente supera al ampliamente extendido NAND Flash en tres órdenes de magnitud (1000 veces) en términos de Intel, como la velocidad y la vida útil.
La solución resultó ser muy interesante y extremadamente ambigua: por supuesto, hay características operativas (no sin ella), precio y aplicaciones. Pero no nos enfocaremos en esta característica asesina para esta línea de procesadores; una historia más detallada al respecto va mucho más allá del alcance del artículo de hoy. Tan pronto como las pruebas en todos los modos operativos posibles de esta tecnología estén listas, despliegue inmediatamente el longrid :-)
En cuarto lugar, las tecnologías Intel Resource Director Technology (RDT), Speed Select (SST) e Intel DL Boost han sido impulsadas por las habilidades.Comenzaré con RDT. Representa mecanismos de supervisión y control bastante finos sobre la ejecución de aplicaciones y el uso de recursos. La pieza no es nueva, pero en esta línea le pusieron las manos bien y trabajaron en detalle. La conclusión es que una aplicación con mayor prioridad a tiempo obtiene todo lo que necesita. Naturalmente, debido a la "infracción de los derechos" de otras aplicaciones.
Ahora SST. Aquí es lo mismo, pero a nivel de núcleos: le permite distinguir firmemente un grupo de núcleos que tendrá una mayor prioridad sobre los demás. La aparición esta vez no es debut, sino bastante espectacular.
Y para el postre, Intel DL Boost. La innovación se refiere a un nuevo conjunto de instrucciones, anteriormente conocidas como Instrucciones de red neuronal vectorial (VNNI). Gizmo para IA, o mejor dicho, para una formación más flexible de redes de aprendizaje profundo. De hecho, otro complemento sobre el AVX-512.
Y finalmente, quinto. Según la antigua tradición, hay más frecuencias, más núcleos para actualizaciones de Intel :-) Tanto las frecuencias base como las frecuencias en el impulso han crecido en 200-300 MHz. Con algunas excepciones, se agregaron dos núcleos por procesador. La cantidad de RAM compatible ha aumentado.
Por separado, vale la pena señalar el trabajo de Intel para optimizar el uso de cachés y RAM, probablemente para minimizar el impacto negativo de los parches de las vulnerabilidades de la familia Spectre y Meltdown.
Puede encontrar más detalles sobre la arquitectura del lago Cascade
en wikichip . Recomiendo leerlo. Y ahora, pruebas tradicionales.
Prueba
La prueba incluyó ocho procesadores escalables Intel Xeon:
- primera generación: plata 4110, plata 4114, oro 6130, oro 6140
- segunda generación: Silver 4210, Silver 4214, Gold 6230 y Gold 6240.
Las características de rendimiento de las plataformas.Todos los procesadores tienen la misma configuración básica.
- Plataforma: Intel Corporation S2600WFT (BIOS SE5C620.86B.02.01.0008.031920191559)
- RAM:
- Samsung DDR4-2933 de 16 GB: 12 unidades (una para cada canal) para procesadores Gold 6230 y 6240
- Samsung DDR4-2666 de 16 GB - 12 unidades (una para cada canal) para procesadores Gold 6130 y 6140
- Samsung DDR4-2400 de 16 GB: 12 unidades (una para cada canal) para procesadores Silver de ambas generaciones
- SSD: Intel DC S4500 480 GB - 2 piezas en RAID1
- Configuración de procesador dual
Pieza de software: CentOS Linux 7 x86_64 (7.6.1810)
Kernel: 3.10.0-957.12.2.el7.x86_64
Se introdujeron optimizaciones con respecto a la instalación estándar: se agregaron opciones de lanzamiento del kernel elevator = noop selinux = 0
Las pruebas se realizan con todos los parches de los ataques Spectre, Meltdown y Foreshadow respaldados en este núcleo.
La lista de pruebas que realizaremos:- Geekbench
- Sysbench
- Phoronix Test Suite
Descripción detallada de la pruebaPrueba GeekbenchUn paquete de pruebas realizadas en modo de subproceso único y multihilo. El resultado es un índice de rendimiento para ambos modos. En esta prueba, consideraremos dos indicadores principales:
- Puntaje de un solo núcleo: pruebas de un solo subproceso.
- Multi-Core Score: pruebas de subprocesos múltiples.
Unidades de medida: "loros" abstractos. Cuantos más loros, mejor.
Prueba de SysbenchSysbench: un paquete de pruebas (o puntos de referencia) para evaluar el rendimiento de varios subsistemas informáticos: procesador, RAM, almacenamiento de datos. La prueba es multiproceso, para todos los núcleos. En esta prueba, medí un indicador: eventos de velocidad de CPU por segundo: la cantidad de operaciones realizadas por el procesador por segundo. Cuanto mayor sea el valor, más productivo será el sistema.
Phoronix Test SuitePhoronix Test Suite es un conjunto de pruebas muy rico. Casi todas las pruebas presentadas aquí son multiproceso. Solo dos de ellos son una excepción: las pruebas de un solo hilo Himeno y la codificación LAME MP3.
En estas pruebas, cuanto mayor sea el puntaje, mejor.- Prueba de contraseñas multiproceso de John the Ripper. Tome el algoritmo de cifrado Blowfish. Mide el número de operaciones por segundo.
- La prueba de Himeno es un solucionador de presión lineal de Poisson que utiliza el método del punto de Jacobi.
- Compresión 7-Zip: prueba 7-Zip con p7zip con función de prueba de rendimiento integrada.
- OpenSSL es un conjunto de herramientas que implementan los protocolos SSL (Secure Sockets Layer) y TLS (Transport Layer Security). Mide el rendimiento de RSA OpenSSL de 4096 bits.
- Punto de referencia de Apache: la prueba mide cuántas solicitudes por segundo puede soportar un sistema dado mientras ejecuta 1,000,000 de solicitudes, mientras que 100 solicitudes se ejecutan simultáneamente.
Y en estos, si es menos, es mejor: en todas las pruebas se mide el tiempo que lleva medir.- C-Ray prueba el rendimiento de la CPU en cálculos de coma flotante. Esta prueba es multihilo (16 hilos por núcleo), disparará 8 rayos de cada píxel para suavizar y generar una imagen de 1600x1200. Se mide el tiempo necesario para completar la prueba.
- Compresión paralela de BZIP2: la prueba mide el tiempo que lleva comprimir un archivo (paquete .tar del código fuente del kernel de Linux) utilizando la compresión BZIP2.
- Codificación de datos de audio. La prueba de codificación de MP3 LAME se realiza en una sola secuencia. Se mide el tiempo necesario para completar la prueba.
- Compilación cronometrada de GCC. Muestra cuánto tiempo lleva compilar el compilador GNU GCC (versión 8.2.0). Las unidades son segundos.
En esta prueba, eliminé la prueba ffmpeg porque dejó de pasar adecuadamente en el número total de núcleos que los oros modernos tienen en una configuración de doble procesador.
Resultados de la prueba


En la prueba Geekbench en versiones de subprocesos múltiples y subprocesos múltiples, la nueva escalable omite a las antiguas en todos los aspectos. En una prueba de subproceso único del 3% al 6%, en subprocesos múltiples del 6% al 13% y la apoteosis: Silver 4210 es mejor que Silver 4110 hasta un 33%.

En la prueba de Sysbench, la diferencia es del 22% al 37%. La brecha mínima entre Gold 6140 y Gold 6240 es del 7% a favor de la nueva.

En la prueba, John The Ripper Silver 4210 supera a Silver 4110 en un 41%, y entre Silver 4214 y Silver 4114 la diferencia es casi del 30%, naturalmente, a favor del primero. Ahora oro El Gold 6230 es un 16% más rápido que el Gold 6130. La brecha mínima entre Gold 6140 y Gold 6240 es 7.6%.

Silver 4210 supera a Silver 4110 en un 29%, y Silver 4214 predecesor en un 23%. La brecha entre los pares de oro es del 20% y 8%, respectivamente.

En la prueba de Himeno de un solo subproceso, puede ver un aumento neto de 200-300 MHz, del 2.2% al 6% a favor de la nueva generación.

La prueba de comprimir-7zip copia casi por completo el resultado de la prueba John The Ripper: Blowfish. Una hermosa brecha entre Silver 4110 y Silver 4210: 4210 es casi un 35% más rápida que su predecesora. Silver 4214 y Gold 6230 son 18% y 20% mejores que 4114 y 6130, respectivamente. La brecha mínima entre Gold 6140 y Gold 6240: el nuevo es 4.7% mejor que antes.

En la prueba compress-pbzip2, la imagen es similar a la prueba compress-7zip. De las diferencias significativas, la brecha entre Gold 6130 y Gold 6230 se ha reducido, aquí es 5.6%.

En la prueba Encode-mp3 de un solo subproceso, nuevamente vemos la diferencia de 200-300 MHz. Del 4% al 7%: la escalable de segunda generación es mucho mejor que la primera en esta prueba.

En la prueba openssl, la brecha más grande entre Silver 4110 y Silver 4210 es del 41%. Entre 4114 y 4214 - 29%. Los oros tienen menos. Entre oro 6130 y 6230 - 23%. Y en el par Oro 6140 y 6240 - 4.6%. Observo que el Gold 6240 es solo un 0,78% mejor que el Gold 6230.

En la prueba de Apache, Silver 4210 es mejor que Silver 4110 en un 40%, Silver 4214 supera a Silver 4114 en un 36%, Gold 6230 es mejor que Gold 6130 en un 21% y Gold 6240 supera esta prueba mejor que Gold 6140 en un 29%. Me enfocaré especialmente en Silver 4210, Silver 4214 y Gold 6230: Gold 6230 es 3% mejor que Silver 4210 y 1.5% mejor que Silver 4214. Es decir, la brecha es mínima. Gold 6240 es 13% mejor que Gold 6230.

En la prueba GCC, la nueva generación supera a sus predecesoras en aproximadamente un 19%, 16%, 11% y 9,5%, respectivamente.

Cual es el resultado.
Observamos una brecha significativa entre Silver 4110 y Silver 4210: la nueva generación es mejor que la anterior en pruebas multiproceso de aproximadamente 20% a 40%. Gracias, frecuencias y núcleos.
Ya hay menos diferencia entre Silver 4114 y Silver 4214: prueba máxima: en la prueba de Apache alcanza el 36%.
Además, la brecha se está reduciendo. Gold 6230 supera a Gold 6130 en el rango de 11% en la prueba GCC a 23% en la prueba OpenSSL.
Y finalmente, la brecha mínima entre el par Gold 6140 y Gold 6240: el nuevo está un 3% -10% por delante del anterior de acuerdo con el resultado de la mayoría de las pruebas. Una excepción es la prueba de Apache: la diferencia es del 28%: menos núcleos, más frecuencia base (Apache es generalmente una prueba muy interesante).
Y ahora pasamos a pruebas adicionales. Pero primero, un breve trasfondo.
Prueba de RAM
Los nuevos procesadores escalables Gold 62xx Intel Xeon ahora son compatibles con un nuevo tipo de RAM DDR4-2933. Lógicamente, nos preguntamos: ¿cuánto afectará la frecuencia de RAM al rendimiento general del sistema? En general, basándose en la suposición de que más a más siempre da algo positivo, se creía que un nuevo procesador emparejado con nueva memoria demostrará ser excelente. Pero una cosa es asumir y otra verificar experimentalmente.
Para la prueba, tomamos el procesador Gold 6240 en una configuración de doble procesador. Las características de rendimiento de la plataforma y el componente de software no han cambiado. Probaremos dicha memoria: DDR4-2400, DDR4-2666 y DDR4-2933.
Siempre feliz cuando tienes a mano todo lo que necesitas para probar hipótesis =) Y ahora vamos a ver qué sucedió.
Resultados de la prueba de RAM
Cuando es demasiado bueno, ya es malo. Por lo tanto, decidí abandonar la idea de dibujar todos los gráficos y llevar los resultados a las tablas, más conveniente y más rápido, aunque con menos claridad. Los gráficos también serán, pero solo los más interesantes, en mi opinión.




"O estamos haciendo algo mal, o una de dos cosas".
La cita de los hermanos Piloto, aunque un poco parafraseada, resultó ser muy útil después de completar la prueba de memoria ...
Como en todas las pruebas, tomamos diez mediciones y elegimos valores promedio para ellas. Como puede ver, los testimonios varían tanto como los testimonios del ciudadano Krolikova de la película Shirley-Myrli.
En las pruebas, Phoronix 50 a 50 resultados altos muestran configuraciones con RAM 2400 y 2933 MHz. Geekbench comparó la memoria 2933 con los parámetros Memory Score_Single y Memory Score_Multi, pero el resultado general es sorprendente.
De los supuestos: el efecto de una frecuencia más alta en la latencia. Y aquí viene el equilibrio entre velocidad y tiempo de respuesta. Pero, para ser sincero, no estoy seguro ... Si tiene algo que decir sobre esto, le pregunto en los comentarios.
La última vez me convencí de que la no utilización de todos los canales de la memoria del procesador ejerce una mayor influencia en los resultados de la prueba. En la próxima prueba del procesador, definitivamente consideraremos este efecto y le diré qué y cómo.
Un pequeño paso para el hombre, pero un gran paso para la humanidad.
Como diría el camarada Kamnoedov (me encanta el Strugatsky), "más o menos en tal aceptación" Intel está posicionando una nueva línea de procesadores escalables Xeon. Al comienzo del artículo, dije que el lanzamiento de la nueva escalable para Intel es un paso estratégico importante. Ahora te lo explicaré.
Por un lado, la nueva escalable marcó el comienzo de una actualización global de la plataforma del centro de datos. Y ya en la segunda mitad del año nos esperan un par de anuncios interesantes. Por otro lado, todas las innovaciones no son aleatorias: esta es una respuesta a las demandas actuales de la industria. Y una respuesta bastante decente. ¿No tienes suficiente memoria? Aquí está la memoria persistente Optane DC. ¿Desea la priorización de hardware de procesos y núcleos? Por favor, bombee SST y RDT. ¿Has soñado con la formación profesional de redes? :-) Aquí, firme, un nuevo conjunto de instrucciones para AI. Para Intel solo puedes alegrarte.
Aunque, personalmente, me parece que esta versión incluye Lista de deseos, que Intel no logró implementar la última vez. Y, por supuesto, algo tenía que hacerse con agujeros de hardware, la búsqueda de diferentes especialistas ya se había convertido en una especie de entretenimiento. Todo lo que Intel le quitó al usuario con los agujeros Spectrum-Meltowna, ahora lo devolvió, ahorrando el precio.
Además, AMD proviene de todas las direcciones, cuyas decisiones se han visto mucho menos afectadas por los Spectrum-Meltdowns, y que recientemente ha estado especialmente "sacudiendo" a Intel como en el escritorio (me gustaría tener tanta juventud en una edad tan respetable), y ligeramente en el segmento del servidor. Por cierto, en términos de este último, es muy interesante ver cómo se mostrará el nuevo AMD Epyc Rome, ya que la generación actual de Epyc personalmente no me dejó indiferente.
Pero volvamos a escalable.
¿Cuál es el resultado final para un usuario que no está agobiado por la inteligencia artificial y las redes capacitadas? Incremento inequívocamente obvio en la productividad debido a un mayor número de núcleos, frecuencias base más altas y frecuencias en el turbo boost. Y si para los procesadores Gold de diferentes generaciones este aumento alcanza un máximo del 23%, ambos son buenos, entonces para Silver en algunas pruebas alcanza el 40%. Dado el valor casi sin cambios, la diferencia es bastante agradable, aunque como siempre quiero más =)
Si confía en la declaración de Intel de que esto es solo el comienzo, incluso un escéptico como yo siente curiosidad por ver qué nos interesará en el futuro.
En las pruebas, utilizamos servidores basados en procesadores escalables Intel Xeon: Silver 4110, Silver 4114,
Silver 4210 ,
Silver 4214 , Gold 6130, Gold 6140,
Gold 6230 ,
Gold 6240 .
Hasta el 25 de julio, los servidores con el nuevo Xeon escalable pueden solicitarse en el
sitio web
1dedic.ru con un descuento del 25% durante 1 mes
utilizando el código promocional NEW_SCALABLE . El código promocional se grabará a la medianoche del 26 de julio de 2019.
Para cualquier servidor dedicado, un 10% de descuento al pagar el año.
Probado y escrito por Trashwind , administrador sénior del sistema del departamento de operaciones de FirstDEDIC