Monstruos después de las vacaciones: AMD Threadripper 2990WX 32-Core y 2950X 16-Core (parte 5)

Parte 1Parte 2Parte 3Parte 4 → Parte 5

Comparaciones térmicas y XFR2: ¡Recuerde retirar el plástico del refrigerador!



Cada máquina persigue objetivos con diferentes prioridades: rendimiento, consumo, ruido, rendimiento térmico o costo. Es muy difícil llegar a todos a la vez, por lo que elegir dos o tres objetivos es una buena idea. ¿Cómo perder en TODAS LAS CINCO DIRECCIONES? .. Bienvenido a mi mundo. El mundo en el que probé por primera vez el AMD Ryzen Threadripper 2990WX de 32 núcleos, olvidando quitar el plástico de mi refrigerador líquido.

No vuelva a armar el sistema después de un largo vuelo.

Casi todos los refrigeradores nuevos, unidades de aire, líquido y agua, vienen completos con juntas, espuma, tornillos, ventiladores y un conjunto de instrucciones. Según el fabricante y el tipo de embalaje, la parte inferior del refrigerador del procesador se preparará de dos maneras:

  1. Grasa térmica preaplicada
  2. Pequeña cinta de plástico autoadhesiva para proteger el pulido durante el transporte

Conozca en nuestra revisión el enorme enfriador de aire Wraith Ripper, fabricado por Cooler Master, pero promovido por AMD como el enfriador base para los nuevos procesadores Threadripper 2. La grasa térmica se aplica densamente en toda su base. Cuando intenté tomar fotos, arruiné todo.



También se incluye en nuestra revisión el enfriador de líquidos Enermax Liqtech TR4 con un tubo de pasta térmica. La parte inferior de la unidad en contacto con la CPU se cubrió con una cinta protectora de plástico autoadhesiva.


Ejemplo de Twitter de TechTeamGB

Entonces, el tiempo de la confesión. Nuestro kit de encuestas llegó un día antes que yo. La acción tuvo lugar durante mi viaje con el Reino Unido en San Francisco en la Cumbre de Memoria Flash e Intel Datacenter Summit. En mis maletas traje una placa base X399 (ASUS ROG Zenith), tres chips X399 (2990WX, 2950X, 1950X), una placa base X299 (ASRock X299 OC Formula), varios chips Skylake-X, una fuente de alimentación Corsair AX860i, RX 460, un mouse , teclado, cables: simplemente componentes para ensamblar dos sistemas y usar el monitor en una habitación de hotel para realizar pruebas. Después de un vuelo directo de 11 horas, dos horas en el control de pasaportes y más de una hora en un taxi Uber a mi hotel, armé un sistema con 2990WX.

No quité el plástico del refrigerador Enermax. No me di cuenta de esto. Incluso apliqué grasa térmica al procesador y no sospeché nada, incluso cuando apreté los tornillos.

Ajusté el sistema a la frecuencia de memoria máxima admitida, instalé Windows, instalé actualizaciones de seguridad, instalé pruebas e inicié el sistema toda la noche mientras dormía. Ni siquiera sospeché que el plástico permaneciera adherido. Por la mañana, el conjunto de pruebas ya ha terminado el trabajo. Después de completar algunas pruebas adicionales, como medir la latencia de la frecuencia base, fui a reemplazar el procesador con el 2950X. Fue en este momento que realicé una palmada expresiva.



Cuando vi la grasa térmica untada en el procesador y el plástico, me di cuenta de que tendría que reiniciar todo. Después de quitar el plástico, inserté el procesador, configuré el sistema, esta vez con el mejor perfil térmico.

El rendimiento térmico es importante.


El objetivo de cualquier sistema es mantenerlo en la "ventana de temperatura" adecuada para un funcionamiento estable: la mayoría de los procesadores están diseñados para funcionar correctamente a temperaturas de hasta 105 ° C, después de lo cual se apagan para evitar daños térmicos. Cuando un procesador impulsa electrones en cadenas y hace todo tipo de cosas necesarias, consume energía. Esta potencia se pierde en forma de calor, se disipa del chip en dos direcciones principales: tomacorriente y enfriador.



Los procesadores AMD Threadripper tienen un material de interfaz térmica entre matrices de silicio y un disipador de calor: soldadura de estaño y indio. Se necesita una unión directa metal-metal para la transferencia directa de calor. Los procesadores Intel modernos usan pasta térmica de silicona en lugar de esta capa, que transfiere peor calor, pero tiene una ventaja importante: es capaz de sobrevivir a muchos más ciclos térmicos. A medida que los metales se calientan, se expanden: dos metales unidos entre sí con diferentes coeficientes de expansión térmica, que pasan por muchos ciclos de calentamiento, se agrietan y pierden eficiencia. La pasta térmica elimina este problema. Además, la grasa térmica es más barata. Por lo tanto, elegir una interfaz térmica es una compensación entre precio, durabilidad y rendimiento.

Hay un enfriador de procesador sobre el disipador de calor, pero hay otra interfaz térmica entre ellos, que el usuario puede elegir. La opción más barata es la grasa térmica de silicona regular a un precio de un centavo por galón, pero los entusiastas del rendimiento pueden elegir grasa térmica a base de plata u otra mezcla con buenas características térmicas. Típicamente, la capacidad de la pasta para distribuirse bajo presión es una cualidad positiva. Los partidarios de velocidades extremas pueden usar una capa de metal líquido, similar a la variante de soldadura, que casi siempre une el procesador al enfriador.

Entonces, ¿qué sucede si de repente aplica unas pocas micras de plástico térmicamente inútil entre el disipador de calor y el enfriador del procesador?

En primer lugar, la transferencia de calor será terrible. Esto significa que la energía térmica permanece en la pasta, haciendo que el procesador absorba calor mientras aumenta la temperatura. De hecho, este es el mismo caso cuando el refrigerador está sobrecargado con un procesador grande: la absorción de calor por parte del procesador se convierte en un problema real. Esto conduce a un aumento acelerado de la temperatura hasta que el gradiente de temperatura sea igual a la liberación de energía térmica. El procesador se calienta demasiado, el modo de emergencia se activa para una situación térmica de emergencia, reduciendo el voltaje y la frecuencia a niveles extremadamente bajos. El rendimiento cae al fondo.

¿Qué ve el usuario en el sistema? Imagine que su procesador funciona a 600 MHz cuando renderiza, en lugar de la buena base de 3125 MHz (vea la página anterior). Las temperaturas base son más altas, las temperaturas de carga son más altas, las temperaturas de la carcasa son más altas. Pero puede secar la ropa mojada para que el calor no desaparezca. Un ligero sobrecalentamiento no daña el procesador, pero una gran cantidad puede debilitarlo.
AMD XFR2

En última instancia, este problema perjudica a AMD más de lo que podrías imaginar. La forma en que AMD implementa sus modos turbo en los nuevos procesadores ya no es una tabla de búsqueda con una lista de "núcleos cargados -> turbofrecuencia". Depende de los límites de potencia, corriente y térmica de un chip dado. Si hay espacio para crecer, la plataforma AMD agregará frecuencia y voltaje. Este ajuste térmico se realiza mediante lo que AMD llama XFR2 o Rango de frecuencia extendido 2.

En el Día tecnológico de AMD para Threadripper 2, se nos presentaron gráficos que mostraban el efecto del uso de enfriadores más potentes en el rendimiento: aproximadamente un 10% de mejora en los resultados de las pruebas con un aumento en el potencial de disipación de calor. Use el sistema en una habitación con una temperatura ambiente baja, y AMD dará un aumento del 16% en la productividad en comparación con el sistema de drenaje.



Sin embargo, lo contrario también es cierto. Al tener una pieza de plástico donde se suponía que una buena transferencia de calor aumentaría la frecuencia y el voltaje, obtuvimos una disminución significativa en el rendimiento.

Rendimiento plástico:


Entonces, a pesar de ser utilizado en una habitación de hotel con aire acondicionado, este plástico extra ha tenido un efecto decisivo en la mayoría de nuestras pruebas. Aquí está el daño que causó:



















En todas las pruebas de subprocesos múltiples, cuando la CPU está muy cargada, hay una disminución significativa en el rendimiento. El mezclador mostró una reducción del 20% en el rendimiento, POV-Ray cayó en un 10%, para 3DPM la pérdida fue del 19%. Los resultados de PCMark no se reducen significativamente, ya que tiene muchas pruebas de subproceso único, y en algunas pruebas incluso vimos una desviación en la otra dirección, por ejemplo, en WinRAR, que depende de la DRAM. Otros puntos de referencia no mencionados incluyen nuestra prueba de compilación, donde el sistema "plastificado" fue solo un 1% más lento, o Dolphin, que mostró una diferencia de un segundo.

Que he aprendido


No seas tonto. Montar un banco de pruebas con componentes nuevos, estar muy cansado, puede conducir a pruebas repetidas.

Conclusiones: no todos los núcleos nacen iguales


El diseño del procesador es a menudo un proceso de ajuste fino. Para obtener rendimiento, el arquitecto debe equilibrar los cálculos con el ancho de banda, y siempre tener suficientes datos "alimentando a la bestia" - cargando núcleos de procesador. Si la "bestia" queda inactiva, consume energía sin hacer ningún trabajo. Establecer la combinación correcta de recursos es una tarea difícil y, por lo tanto, las principales compañías de procesadores contratan a miles de ingenieros para que el sistema funcione correctamente. Y cuando el diseño principal está listo, produce varios herederos.

A veces, los productos exóticos se caen de la pila común. La nueva generación de procesadores AMD Ryzen Threadripper es la misma exótica. Parece que se hicieron reemplazos directos para los componentes de la generación anterior, similares a ellos, pero con mejor retraso y mayor frecuencia. Estos componentes ya son bien conocidos, y obtenemos el aumento esperado de la forma habitual. Y en este momento, el silicio adicional, incluido en el 2990WX, sin acceso directo a la memoria, arroja una llave en un mecanismo establecido.


2950X (izquierda) y 2990WX (derecha)

Cuando todos los núcleos están directamente vinculados a la memoria, como el 2950X, todos los núcleos se consideran iguales, y el equilibrio de la carga de trabajo es una tarea bastante simple. Con el lanzamiento de nuevos procesadores, obtuvimos la situación que se muestra en la figura de la derecha. Ahora, solo algunos núcleos están directamente vinculados a la memoria, mientras que el resto no. Para que los datos se muevan de uno de los núcleos "distantes" a la memoria principal, se requiere un "salto" adicional, que agrega latencia. Y cuando todos los núcleos solicitan acceso, hay una congestión.

Para aprovechar al máximo las capacidades de dicha arquitectura, la carga de trabajo no debe consumir mucha memoria. En tareas como el cálculo del movimiento de partículas, el trazado de rayos, la representación de escenas y la descompresión, la carga completa de los 32 núcleos permite que el procesador sea la estrella de nuestras pruebas y establezca nuevos récords.

En el estilo Janus de dos caras, con otras cargas de trabajo que históricamente han dependido de la cantidad de núcleos, como física, transcodificación y compresión, una estructura de dos módulos conduce a una pérdida significativa de rendimiento. Como resultado, aquí, aparentemente, no hay resultados promedio: la carga de trabajo muestra excelentes resultados en el nuevo procesador o está en la cola de nuestro paquete de pruebas de alta calidad.

Parte del problema es la distribución de energía de estos procesadores muy grandes. Como se muestra en la página 4, cuantos más chiplets haya en el juego, o más Mesh, más energía se suministra no a los núcleos, sino a las redes internas como uncore o Infinity Fabric. Comparando un enlace IF en 2950X con seis en 2990WX, encontramos que IF ahora consume 60-73% de la potencia total del chip con cargas ligeras, y 25-40% en alto.

De hecho, a plena carga, un chip como el 2990WX usa solo el 60% de su presupuesto de energía para la frecuencia del procesador. En EPYC 7601, debido a canales de memoria adicionales, los núcleos consumieron solo el 50% del presupuesto de energía bajo carga. Asegúrese de que después de que AMD e Intel terminen la pelea por la cantidad de núcleos, el próximo objetivo en su lista será la interconexión.

Pero el efecto secundario del hecho de que el chip no usa toda la potencia para alimentar los núcleos, y también tiene una arquitectura bimodal, es que algunas cargas de trabajo no se escalarán, y en algunos casos hay regresión.

Big Boss: hipopótamo AMD de 32 núcleos


No hay duda de que cuando el AMD Ryzen Threadripper 2990WX tenga la oportunidad de trabajar al máximo, lo hará con placer. Pudimos overclockear el sistema a 4 GHz en todos los núcleos simplemente cambiando la configuración del BIOS, aunque AMD también admite Windows Precision Boost Overdrive para exprimir más el chip. Al mismo tiempo, el consumo de energía cuando se usa la mitad de los núcleos a una frecuencia de 4.0 GHz salta hasta 260 vatios, y una CPU completamente cargada despega hasta 450-500 vatios y algunas veces excede los 600 vatios. Los usuarios deberán asegurarse de que su placa base y fuente de alimentación estén listas para realizar dicha tarea.



Este es el momento en que finalmente digo si recomendamos comprar nuevos productos AMD. La capacidad de poner 2950X en lugar de 1950X en sus máquinas tragamonedas, también a un precio más bajo, nos parece muy atractiva. Sin embargo, el 2950X ya es un producto de nicho para un alto rendimiento, y el 2990WX recoge el testigo y lo lleva a la distancia, convirtiéndose en el procesador de nicho más potente. Honestamente, no en todos los casos su productividad es tan grande como cabría esperar, y su aplicación tiene sentido para un conjunto reducido de cargas de trabajo, donde resulta ser incomparable. Y aunque supera a casi todos los demás procesadores en nuestra prueba de compilación, hay un procesador que lo supera: 2950X.

Para la mayoría de los usuarios, el 2950X es suficiente. Para unos pocos seleccionados, el 2990WX será el mejor procesador del mundo.

Gracias por quedarte con nosotros. ¿Te gustan nuestros artículos? ¿Quieres ver más materiales interesantes? Apóyenos haciendo un pedido o recomendándolo a sus amigos, un descuento del 30% para los usuarios de Habr en un análogo único de servidores de nivel de entrada que inventamos para usted: toda la verdad sobre VPS (KVM) E5-2650 v4 (6 núcleos) 10GB DDR4 240GB SSD 1Gbps de $ 20 o cómo dividir el servidor? (las opciones están disponibles con RAID1 y RAID10, hasta 24 núcleos y hasta 40GB DDR4).

3 meses gratis al pagar un nuevo Dell R630 por un período de seis meses - 2 x Intel Deca-Core Xeon E5-2630 v4 / 128GB DDR4 / 4x1TB HDD o 2x240GB SSD / 1Gbps 10 TB - desde $ 99.33 al mes , solo hasta el final de agosto, ordene puede estar aquí

Dell R730xd 2 veces más barato? ¡Solo tenemos 2 x Intel Dodeca-Core Xeon E5-2650v4 128GB DDR4 6x480GB SSD 1Gbps 100 TV desde $ 249 en los Países Bajos y los Estados Unidos! Lea sobre Cómo construir un edificio de infraestructura. clase utilizando servidores Dell R730xd E5-2650 v4 que cuestan 9,000 euros por un centavo?

Source: https://habr.com/ru/post/es422209/


All Articles