¿Se acerca la era de los servidores ARM?


Placa base SynQuacer E-Series para un servidor ARM de 24 núcleos en un procesador ARM Cortex A53 con 32 GB de RAM, diciembre de 2018

Durante muchos años, los procesadores ARM con un conjunto de instrucciones reducido (RISC) han dominado el mercado de dispositivos móviles. Pero nunca lograron entrar en los centros de datos, donde Intel y AMD con el conjunto de instrucciones x86 aún dominan. Ocasionalmente, aparecen ciertas soluciones exóticas, como un servidor ARM de 24 núcleos basado en la plataforma Banana Pi , pero aún no hay ofertas serias. Más precisamente, no fue hasta esta semana.

Esta semana, AWS lanzó su propio procesador Graviton2 ARM de 64 núcleos en la nube, un sistema en chip con el núcleo ARM Neoverse N1. La compañía afirma que Graviton2 es mucho más rápido que los procesadores ARM de la generación anterior en las instancias EC2 A1, y aquí están las primeras pruebas independientes .

El negocio de infraestructura es una comparación de números. De hecho, a los clientes de un centro de datos o servicio en la nube no les importa la arquitectura que tengan los procesadores. Les importa la relación precio-rendimiento. Si trabajar en ARM es más barato que en x86, se elegirán.

Hasta hace poco, era imposible decir inequívocamente que los cálculos en ARM serían más rentables que en x86. Por ejemplo, el ARM Cortex A53 de 24 núcleos del lado del servidor es un modelo SocioNext SC2A11 que cuesta alrededor de $ 1000, lo que podría generar un servidor web en Ubuntu, pero fue muy inferior en rendimiento al procesador x86.

Sin embargo, la sorprendente eficiencia energética de los procesadores ARM te hace mirarlos una y otra vez. Por ejemplo, SocioNext SC2A11 consume solo 5 vatios. Pero la electricidad representa casi el 20% del costo de un centro de datos. Si estos chips muestran un rendimiento decente, entonces x86 no tendrá ninguna posibilidad.

Primera llegada de ARM: instancias EC2 A1


A finales de 2018, AWS introdujo instancias EC2 A1 en sus propios procesadores ARM. Ciertamente, esto fue una señal para la industria sobre los posibles cambios en el mercado, pero los resultados de referencia fueron decepcionantes.

La siguiente tabla muestra los resultados de las pruebas de esfuerzo de EC2 A1 (ARM) y EC2 M5d.metal (x86). Para las pruebas, se utilizó la utilidad stress-ng :

stress-ng --metrics-brief --cache 16 --icache 16 --matrix 16 --cpu 16 --memcpy 16 --qsort 16 --dentry 16 --timer 16 -t 1m

Como puede ver, A1 tuvo un desempeño peor en todas las pruebas, excepto en el caché. Para la mayoría de los otros indicadores, ARM rindió mucho. Esta diferencia en el rendimiento es mayor que la diferencia en el precio del 46% entre A1 y M5. En otras palabras, las instancias en procesadores x86 siguen siendo más rentables:
PruebaEC2 A1EC2 M5d.metalLa diferencia
caché1280311311,58%
icache1820934368-47,02%
matriz77932252190-69,10%
cpu933624077-61,22%
memcpy21085111877-81,15%
qsort522728-28,30%
dentry13896342770985-49,85%
temporizador497012515367075-67,66%

Por supuesto, los microbenchmarks no siempre muestran una imagen objetiva. La diferencia en el rendimiento real de la aplicación es importante. Pero aquí la imagen no era mejor. Los colegas de Scylla compararon las instancias a1.metal y m5.4xlarge con el mismo número de procesadores. En la prueba estándar para leer una base de datos NoSQL en una configuración de un solo nodo, la primera mostró 102,000 lecturas por segundo y la segunda 610,000. En ambos casos, todos los procesadores disponibles se utilizan al 100%. Esto corresponde a una disminución de la productividad de aproximadamente seis veces, que no se compensa con un precio más bajo.

Además, las instancias A1 solo se ejecutan en EBS sin soporte para dispositivos NVMe rápidos, como en otras instancias.

En general, A1 fue un paso en una nueva dirección, pero no estuvo a la altura de las expectativas de ARM.

Segunda Venida de ARM: Instancias EC2 M6




Todo cambió esta semana cuando AWS presentó una nueva clase de servidores ARM, así como varias instancias en los nuevos procesadores Graviton2 , incluidos M6g y M6gd .

Una comparación de estas instancias muestra una imagen completamente diferente. En algunas pruebas, ARM funciona mejor y, a veces, mucho mejor que x86.

Aquí están los resultados del mismo equipo de pruebas de estrés:
PruebaEC2 M6gEC2 M5d.metalLa diferencia
caché218311-29,90%
icache458873436833,52%
matriz45398225219080,02%
cpu1469424077-38,97%
memcpy13471111187720,53%
qsort94372829,53%
dentry3088242277098511,45%
temporizador5551566315367075261,26%

Este es un asunto completamente diferente: M6g es cinco veces más rápido que A1 cuando lee desde la base de datos Scylla NoSQL, y las instancias M6gd más nuevas ejecutan unidades NVMe rápidas.

Ofensiva ARM en todos los frentes


El procesador AWS Graviton2 es solo un ejemplo del uso de ARM en centros de datos. Pero las señales provienen de diferentes direcciones. Por ejemplo, el 15 de noviembre de 2019, la startup estadounidense Nuvia recaudó $ 53 millones en fondos de capital de riesgo .

La startup fue fundada por tres ingenieros líderes que participaron en la creación de procesadores en Apple y Google. Prometen desarrollar procesadores para centros de datos que competirán con Intel y AMD.

Según la información disponible , Nuvia diseñó desde cero un núcleo de procesador que se puede construir "sobre" la arquitectura ARM, pero sin obtener una licencia ARM.

Todo esto indica que los procesadores ARM están listos para conquistar el mercado de servidores. Después de todo, vivimos en la era posterior a la PC. Los envíos anuales X86 cayeron casi un 10% desde el pico de 2011, mientras que los chips RISC se dispararon a 20 mil millones. Hoy, el 99% de los procesadores de 32 y 64 bits en el mundo son RISC.

Los ganadores del Premio Turing, John Hennessey y David Patterson, publicaron un artículo titulado "La nueva edad de oro para la arquitectura de computadoras" en febrero de 2019. Aquí está lo que escriben:
El mercado resolvió la disputa entre RISC y CISC. Aunque CISC ganó las etapas posteriores de la era de la PC, RISC gana ahora que ha llegado la era posterior a la PC. No hay nuevas ISA en CISC durante décadas. Para nuestra sorpresa, el consenso general sobre los mejores principios ISA para los procesadores de propósito general de hoy continúa a favor de RISC, 35 años después de su invención ... En ecosistemas de código abierto, los chips diseñados hábilmente demostrarán convincentemente logros y por lo tanto acelerarán la implementación comercial. Es probable que la filosofía del procesador de propósito general en estos chips sea RISC, que ha resistido la prueba del tiempo. Espere la misma innovación acelerada que lo hizo durante la última edad de oro, pero esta vez en términos de costo, energía y seguridad, no solo rendimiento.

"En la próxima década, se producirá una explosión cámbrica de nuevas arquitecturas informáticas, lo que significa tiempos emocionantes para los arquitectos informáticos en la academia y la industria", concluyen al final del artículo.

Source: https://habr.com/ru/post/479074/


All Articles