Qué esperar del nuevo Xeon E. Compare con E3 y saque conclusiones



Sigo probando procesadores. Esta vez, mi atención cambió por completo de Desktop Core al servidor Xeon. Eso, debo admitirlo, no es accidental. En primer lugar, me preguntaron calurosamente sobre esto en los comentarios al artículo anterior , y en segundo lugar, nuestra flota se reponía con Xeon E nuevo: decidimos actualizar la línea de servidores dedicados de un solo procesador y compramos E-2134 y E-2136 como una alternativa a E3-12XX.

Inicialmente, tenía planes napoleónicos. Como nuestra "colección" Xeon E3-12xyVz, donde "z" toma un valor de 2 a 6, cubre los procesadores desde Ivy Bridge hasta Kaby Lake, estaba interesado en compararlos entre sí y con el nuevo Xeon E.

Pero habiendo estimado la cantidad de trabajo por delante, decidí reducir el grado de ambición y dejar solo a las dos familias anteriores de los representantes de Xeon E3: Xeon E3-12xxV5 y Xeon E3-12xxV6. Junto con el nuevo Xeon E, las tres familias están construidas en la misma arquitectura, un proceso tecnológico y, gracias a Intel, un zócalo de procesador FCLGA1151.

Por otra parte! Los procesadores de las dos familias anteriores resultaron estar disponibles, intersectando en la frecuencia base y la frecuencia en el "impulso", lo cual, en mi opinión, es un gran éxito :) En los comentarios al artículo anterior, los lectores hicieron una solicitud para comparar diferentes familias en la misma frecuencia para ver una limpieza crecimiento de cambios microarquitectónicos. La idea me pareció interesante y tal vez algún día volveré a Core para darle vida. Mientras tanto, decidí adaptarme a lo que tenemos a mano y ver cómo se comporta Xeon con las mismas frecuencias.

Prueba

Ocho procesadores de tres familias participan en las pruebas:
Skylake - Intel E3-1230v5, E3-1240v5, E3-1270v5,
Kaby Lake - E3-1230v6, E3-1240v6, E3-1270v6,
Coffee Lake - E-2134 y E-2136.



Las características de rendimiento de las plataformas.

Los servidores con procesadores Intel E3-1230v5, E3-1240v5, E3-1270v5, E3-1230v6, E3-1240v6 y E3-1270v6 tienen la misma configuración básica:

  • Placa base: Supermicro X11SSE-F (2.2 BIOS).
  • RAM: 16 GB Micron Technology (DDR4-2666) ECC - 2 piezas.
  • SSD: Intel DC S4500 480 GB - 2 piezas en RAID1.

Los servidores con procesadores Intel E-2134 y E-2136 también funcionan en la misma plataforma:

  • Placa base: Supermicro X11SCE-F (BIOS 1.0a).
  • RAM: 16 GB Micron Technology (DDR4-2666) ECC - 2 piezas.
  • SSD: Intel DC S4500 480 GB - 2 piezas en RAID1.

Pieza de software: CentOS Linux 7 x86_64 (7.6.1810)
Kernel: 3.10.0-957.5.1.el7.x86_64
Se introdujeron optimizaciones con respecto a la instalación estándar: se agregaron opciones de inicio del kernel elevator = noop selinux = 0.
Las pruebas se realizan con todos los parches de las vulnerabilidades Spectre, Meltdown y Foreshadow respaldadas en este núcleo.

Pruebas utilizadas para la investigación:

  1. Sysbench
  2. Geekbench
  3. Phoronix Test Suite

Se puede encontrar una descripción más detallada de las pruebas en el artículo anterior . Tomó el mismo kit más Timed GCC Compilation, que agregó a pedido de los lectores. Mientras tanto, brevemente sobre qué y qué midió.

Prueba de Sysbench
La prueba es multiproceso, en todos los núcleos. Medí un indicador: eventos de velocidad de la CPU por segundo, lo que significa la cantidad de operaciones realizadas por el procesador por segundo: cuanto mayor es el valor, más eficiente es el sistema.

Prueba Geekbench
Medí dos indicadores principales en función de los resultados de varias pruebas: puntaje de un solo núcleo y puntaje de múltiples núcleos, - pruebas de uno o varios subprocesos. Las unidades de medida son "loros" abstractos. Cuantos más loros, mejor.

Phoronix Test Suite
Tomé solo 10 de un conjunto grande, lo mismo que la última vez, y a ellos, como dije anteriormente, agregué la compilación TCC GCC. El resultado fueron 8 pruebas de subprocesos múltiples y 2 de subprocesos simples (codificación MP3 Himeno y LAME).

En estas pruebas, cuanto mayor sea el puntaje, mejor

  1. Prueba de contraseñas de John the Ripper. Tome el algoritmo de cifrado Blowfish.
  2. La prueba de Himeno es un solucionador de presión lineal de Poisson que utiliza el método del punto de Jacobi.
  3. Compresión 7-Zip: prueba 7-Zip con p7zip con función de prueba de rendimiento integrada.
  4. OpenSSL es un conjunto de herramientas que implementan los protocolos SSL (Secure Sockets Layer) y TLS (Transport Layer Security). Mide el rendimiento de RSA OpenSSL de 4096 bits.
  5. Apache Benchmark: mide cuántas solicitudes por segundo puede soportar este sistema mientras ejecuta 1,000,000 de solicitudes, mientras que 100 solicitudes se ejecutan simultáneamente. Unidades: consultas por segundo.

Y en estos, si es menos, es mejor : en todas las pruebas se mide el tiempo que lleva medir.

  1. C-Ray prueba el rendimiento de la CPU en cálculos de coma flotante. Esta es una prueba de subprocesos múltiples (16 subprocesos por núcleo).
  2. Compresión paralela de BZIP2: mide el tiempo de compresión de archivos (paquete .tar del código fuente del kernel de Linux) utilizando la compresión BZIP2.
  3. La prueba de codificación de MP3 LAME se realiza en una sola secuencia.
  4. La prueba ffmpeg x264 es multiproceso.
  5. Compilación cronometrada de GCC. En mi primer artículo en los comentarios, los lectores me pidieron que agregara una prueba relacionada con la compilación de la fuente. Esta prueba es para usted :-) Muestra cuánto tiempo lleva construir el compilador GNU GCC (versión 8.2.0). Las unidades son segundos.

Entonces, reuní en un banco de pruebas a representantes de tres familias: Skylake, Kaby Lake y Coffee Lake. Todos los procesadores, excepto el nuevo E-2136, tienen cuatro núcleos y ocho hilos en HT, así como el mismo tamaño total de caché. Todos los procesadores tienen memoria de doble canal con soporte ECC y frecuencias base cercanas. Como en el artículo anterior, llamo la atención sobre el hecho de que los procesadores de tres familias diferentes se basan en la misma arquitectura. En consecuencia, "las frecuencias, núcleos e hilos deben gobernar la pelota".

Pero esta vez será aún más interesante: todas estas familias tienen diferentes frecuencias compatibles cuando trabajan con RAM: 2133, 2400 y 2666, respectivamente, así como también un paquete de calor diferente. Es interesante ver cómo esto afectará los resultados de la prueba y si afectará en absoluto. Por supuesto, supongo que cuanto mayor sea la frecuencia de trabajo con RAM, mejor pasará las pruebas el procesador.

De particular interés son los E3-1240v5 y E3-1230v6 con las mismas frecuencias: la base 3.50 GHz y 3.90 GHz en Turbobust. Supongo que deberían mostrar resultados idénticos o cercanos, ya que difieren solo en el paquete de calor y la frecuencia de la memoria.

En cuanto a mis predicciones con respecto a Xeon E, creo que los resultados de las pruebas de un solo subproceso de E-2134 y E-2136 también deberían ser iguales o muy similares en rendimiento, aunque la frecuencia base es diferente, pero las frecuencias en el "impulso" son las mismas. Y, por supuesto, los resultados de ambos Xeon Es, estoy seguro, serán mejores que sus predecesores: 4.5 GHz a velocidades máximas y 6 núcleos en el E-2136 definitivamente se mostrarán. Y ahora veremos que estoy en lo cierto.

Resultados de la prueba



En la prueba de Sysbench, el E3-1240v5 y E3-1270v5 están a la par. Con E3-1230v6, comienza el crecimiento, que termina con un despegue brusco del E-2136. E-2136 es 36% mejor en esta prueba que E3-1270v6, y 43% mejor que E3-1230v5. E-2134 está solo 4% por delante de E3-1270v6 y 14% E3-1230v5. La diferencia entre E3-1240v5 y E3-1230v6 es 2.4% a favor de E3-1230v6.




En la prueba de un solo hilo Geekbench, se observa crecimiento dentro de cada familia, con la excepción de la familia Xeon E: E-2134 supera a E-2136 en un 4.5%.

En la prueba de subprocesos múltiples, la tendencia de crecimiento persiste en las tres familias: E-2136 está 14.6% por delante de E-2134. En la prueba de subprocesos simples, E3-1240v5, E3-1270v5 y E3-1230v6 están a la par, y en la prueba de subprocesos múltiples E3-1230v6 supera a E3-1240v5 en un 2.5%

Enlaces a los resultados de la prueba Geekbench:

Xeon E3-1230v5
Xeon E3-1240v5
Xeon E3-1270v5
Xeon E3-1230v6
Xeon E3-1240v6
Xeon E3-1270v6
Xeon E-2134
Xeon E-2136



Los resultados multiproceso de John The Ripper son muy similares a los resultados de la prueba Sysbench: E3-1240v5, E3-1270v5 y E3-1230v6 ofrecen casi el mismo rendimiento y el E-2136 es un 33% más rápido que el E-2134. El crecimiento estable es claramente visible en términos de E3-1240v6, E3-1270v6 y la transición a la próxima generación: E-2134.



En la prueba de rayos C, el resultado más alto es E-2136, el más bajo es E3-1230v5, que es bastante lógico cronológicamente. Segundo puesto en el nuevo E-2134. Pero E3-1240v5, E3-1270v5 y E3-1230v6 están nuevamente a la par.



La prueba de Himeno de un solo hilo repite casi exactamente los resultados de la prueba de Geekbench de un solo hilo: hay crecimiento dentro de cada familia, con la excepción de Xeon E: E-2134 supera a E-2136 en un 2.4%. La diferencia entre E3-1240v5, E3-1270v5 y E3-1230v6 en el nivel de error.



En la prueba 7zip observamos una hermosa "escalera" y crecimiento en todas las familias. La diferencia entre E3-1240v5, E3-1270v5 en el nivel de error. E3-1230v6 es casi un 4% mejor en esta prueba que E3-1240v5. E-2134 está 21% por delante de E3-1230v5, 16% por delante de E3-1270v5 y 6.6% por delante de E3-1270v6. Y el E-2136 es el mejor :-)



Se observa una tendencia similar en la prueba pbzip2, solo E3-1230v6 se elimina.



Me gustaría decir que la prueba de mp3 muestra una "escalera descendente" uniforme, pero la diferencia incluso entre los extremos en los gráficos E3-1230v5 y E-2136 es solo del 9,5%, por lo que llamarla "escalera" no es muy correcta. Además, el E3-1230v6 hace sus propios ajustes, y el E3-1240v5 y E3-1270v5 solo agregan gráficos de planitud.



En la prueba multiproceso ffmpeg, la "escalera hacia abajo" ya no tiene explosiones y tiene un área casi plana en las áreas de E3-1240v5, E3-1270v5 y E3-1230v6. E-2136 en esta prueba es mejor que E-2134 en un 19%, E3-1230v5 en un 32%, E3-1270v5 en un 29% y E3-1270v6 en un 22%.



La prueba OpenSSL muestra una "escalera ascendente" con una plataforma en el E3-1240v5, E3-1270v5, E3-1230v6 y un margen notable en el E-2136. E-2134 es 14% mejor que E3-1230v5.
E-2136 está 43% por delante de E3-1230v5, 36% por delante de E3-1270v6 y 33% por delante de E-2134.



En la prueba de Apache, la diferencia entre los procesadores de la familia V5 es mínima. En la familia V6, la "escalera está arriba": E3-1270v6 es 8.8% mejor que E3-1230v6. La familia Xeon E continúa la tendencia de crecimiento y agrega "pasos": el E-2136 está un 3% por delante del E-2134, un 8% por delante del E3-1270v6 y un 22% por delante del E3-1270v5. La diferencia entre el primer representante de V5 y el nuevo E-2136 es del 24%. E3-1240v5 y E3-1270v5 en el nivel de error. Un salto notable en la transición de la familia V5 a V6: la diferencia entre E3-1230v6 y E3-1240v5 es del 7%.



En la prueba de tiempo de compilación GCC, E3-1230v5 ocupa el último lugar, el penúltimo lugar se divide entre E3-1240v5 y E3-1270v5. La victoria sigue siendo para el E-2136 de seis núcleos.



Si en el artículo anterior donde probé Core , escribí que no me sorprendieron los resultados, eran predecibles, entonces esta vez no me sorprendí :-)

Pero primero, un poco de historia.

Debo decir que tuve que rehacer todas las pruebas para E3-1230v6. Y todo porque la primera vez que cometí un error: un representante de la familia V6 aprobó un sitio de prueba con RAM en modo de un solo canal. Como resultado, el índice anidado en la prueba Geekbench - Memory Score, resultó ser más bajo que el de E3-1240v5, lo que influyó en gran medida en el resultado general de toda la prueba. E3-1240v5 en términos de rendimiento superó significativamente a E3-1230v6.

Se dibujó una imagen similar en todas las pruebas de subproceso único. Arrugó el cerebro durante mucho tiempo para dar al menos una explicación inteligible de la situación (¡e incluso la encontró!), Hasta que se frotó los ojos y rehizo todas las pruebas, pero con memoria de dos canales. Y ahora a las conclusiones.

Expectativas vs Realidad

Lo primero que esperaba ver era el mismo rendimiento para E3-1240v5 y E3-1230v6. Y lo vi. En todas las pruebas, excepto mp3 y pbzip2, E3-1230v6 es mejor o igual que E3-1240v5. Personalmente, no creo que este sea un aumento neto en la microarquitectura. Lo más probable es que este resultado se obtenga debido a la mayor velocidad de reloj de la RAM. Una cosa puedo decir con certeza: la memoria en un canal afecta significativamente los resultados en las pruebas, así que tenga cuidado :)

Mi segunda hipótesis se refería a dos representantes de la familia V5: E3-1240v5 y E3-1270v5. Honestamente, esperaba encontrar al menos una ligera diferencia entre ellos, pero como resultado de las pruebas, resultó no ser una palabra en absoluto. El efecto de 100 MHz adicionales debe observarse con un microscopio en la gran mayoría de las pruebas.

Al mismo tiempo, los mismos 100 MHz son bastante visibles a simple vista al comparar E3-1270v5 y E3-1240v6. Supongo, de nuevo, que las frecuencias de memoria se ven afectadas.

Pasamos al nuevo Xeon E. No estaba completamente preparado para el hecho de que en las pruebas de un solo subproceso el E-2136 sería inferior al E-2134. Aunque la frecuencia base del modelo anterior es más baja en 200 MHz, pero la frecuencia en el impulso es la misma. Repetí cada prueba varias veces con cada procesador para obtener el resultado que esperaba, pero no pude lograrlo :) Realmente no me gusta sacar conclusiones y conclusiones, por lo que me encantaría conocer las opiniones de queridos lectores: qué se puede asociar con tan inusual los resultados?

Aquí es donde las expectativas coincidieron con la realidad, por lo que al comparar la nueva familia Xeon E con sus predecesoras, hay predicciones de que la nueva E pasará por alto la buena E3 que acaba de confirmar las pruebas. Y si el E-2134 de cuatro núcleos hace esto debido a la mayor frecuencia en el impulso, entonces el E-2136 se rompe aún más debido a sus seis núcleos honestos.

En general, la imagen es la siguiente. El nuevo Xeon E realmente se puede ver como una buena alternativa a la familia E3. Además, cuestan casi tanto como el V6: mayor rendimiento por el mismo dinero. Si está buscando una opción más económica, puede elegir con seguridad entre los tres E3-1240v5 , E3-1270v5 y E3-1230v6 . Según los resultados de la prueba, resultaron ser completamente intercambiables.

En las pruebas, utilizamos servidores basados ​​en procesadores Intel Xeon E3-1230v5, E3-1240v5, E3-1270v5, E3-1230v6, E3-1240v6, E3-1270v6, E-2134 y E-2136 con 1dedic.ru .

Hasta el 1 de mayo, los servidores con el nuevo Xeon E se pueden pedir con un descuento del 25% durante 1 mes utilizando el código promocional XEONE_HABR . El código promocional se grabará a la medianoche del 30 de abril de 2019.

Para cualquier servidor dedicado, un 10% de descuento al pagar el año.

Probado y escrito por Trashwind , el administrador del sistema de FirstDEDIC.

Source: https://habr.com/ru/post/447660/


All Articles