Parte 1 →
Parte 2 →
Parte 3 →
Parte 4 →
Parte 5Consumo de energía, TDP y Prime95 vs POV-Ray
Para la mayoría de nosotros, la potencia del procesador es de aproximadamente 15 vatios en computadoras portátiles y 65-95 vatios en sistemas de escritorio. Los procesadores de escritorio de alto rendimiento siempre han sido más voraces y, por lo tanto, un TDP de 130 W y 140 W es un indicador normal para ellos. Cuando AMD lanzó un procesador de 220 W en la antigua plataforma Vishera, después de haber overclockeado los núcleos Bulldozer a 5.0 GHz, se pensó si AMD estaba completamente loco: muchas placas base eran compatibles con el socket AMD, pero para usar TDP 220 W y superior tuvo que lanzar una serie de nuevas placas base. Hoy, el procesador Intel más potente del mercado tiene un TDP oficial de 205 vatios, pero AMD ha ido más allá al elevar el listón a 250 vatios.

Dos nuevos procesadores WX, los 2990WX y 2970WX de 32 núcleos, tienen una potencia de 250 vatios. En ambos procesadores, las cuatro matrices de silicona están activas; hay seis líneas activas de Infinity Fabric. Estos procesadores están diseñados para alcanzar un nuevo nivel de rendimiento, mientras que AMD muestra diapositivas con una frecuencia turbo en todos los núcleos de 3.6 GHz. Los dos procesadores que reemplazaron a la serie X tienen una potencia de 180 vatios, así como los procesadores de Threadripper de primera generación.
Sin embargo, no todos los TDP son iguales. Las formas en que Intel y AMD miden TDP han cambiado con los años y ahora están muy lejos de la realidad. Déjame explicarte.
TDP es una broma
El valor de TDP, o potencia de diseño térmico, no es un indicador del consumo de energía. Técnicamente, este es un indicador del rendimiento del enfriador, lo que significa que para hacer frente a su trabajo, el enfriador debe tener el mismo nivel de TDP. El consumo de energía real debe ser ligeramente mayor: la transferencia de calor del procesador al zócalo y del zócalo a la placa base contribuye a la refrigeración, pero no se tiene en cuenta en el indicador TDP. A menudo, la tasa de disipación de calor TDP y el consumo de energía del procesador se perciben como uno, porque sus diferencias son insignificantes.
Comencemos el cálculo con procesadores AMD. El cálculo de AMD TDP se basa en una fórmula simple:
TDP = (Temperatura de funcionamiento, en grados Celsius - temperatura inactiva, en grados Celsius) / Potencia térmica del enfriadorPor lo tanto, cuando AMD determina el TDP de su procesador Ryzen 7 2700X con una temperatura de carga de aproximadamente 62 ° C, una temperatura inactiva de 42 ° C y un enfriador con una potencia térmica de 0.189 C por vatio (Wraith Max), obtenemos un valor de aproximadamente 105W.
La fórmula AMD tiene dos problemas a la vez: en primer lugar, la temperatura del procesador cargado puede controlarse utilizando un enfriador o un flujo de aire externo, y en segundo lugar, el resultado está fuertemente influenciado por la potencia térmica del enfriador. Con un enfriador de líquido grande que tiene una mayor potencia térmica, por ejemplo, 0.400 C por vatio, el TDP nominal de cualquier procesador será menor: en el caso del Ryzen 7 2700X, su TDP será de solo 50 vatios. La clasificación TDP y el consumo de energía no son iguales, y su relación puede cambiar en cualquier dirección, solo AMD debería elegir un enfriador diferente para las comparaciones.
La versión TDP de Intel es un poco más complicada, pero tiene sentido ... Intel determina el TDP de sus procesadores solo para la frecuencia base, ignorando las frecuencias turbo. Como resultado, si Intel lanza un procesador con 95 W TDP, una frecuencia base de 3.2 GHz, un turbo de un solo núcleo de 4.7 GHz y un turbo completo de 4.2 GHz, entonces el consumo de energía garantizado de 95 W estará a una frecuencia base de 3.2 GHz. Esto significa que en cualquier placa base que use un turbo (es decir, generalmente en cualquiera), el procesador consumirá más energía bajo cualquier carga que su TDP oficial.
Y esto es muy molesto. El movimiento de marketing de Intel es publicitar sus procesadores turbo de un solo núcleo y no publicar valores más bajos para el turbo "todo núcleo". Se nos dice que se trata de "información interna de la empresa" que se incluye en el acuerdo de confidencialidad. En cualquier caso, cada procesador que tenga una frecuencia turbo “total” por encima de la frecuencia base consumirá por encima del TDP especificado.
Un buen ejemplo es el Core i7-8700 y su TDP de 65 W. Tiene una frecuencia base de 3.2 GHz, un turbo de un solo núcleo de 4.6 GHz y un turbo completo de 4.3 GHz. Si cargamos más flujos y limitamos el consumo de energía a 65 W, obtenemos lo siguiente:

¿Vale la pena tomar en serio los valores de TDP? Trátelos con humor.
El consumo de energía
Hay varias formas de medir el consumo de energía del procesador. La forma más fácil es usar un dispositivo de medición, que le permitirá conocer el consumo de energía de todo el sistema, incluidas las pérdidas en el sistema de suministro de energía de la placa base. Un método complicado implica conectar las herramientas necesarias a la placa para medir la corriente a través de un conector de 12 voltios, midiendo el voltaje del procesador utilizando la configuración de overclocking en algunas placas base. La tercera forma es leer los registros de hardware utilizando el software apropiado.
La lectura de registros es una espada de doble filo. Primero, confía en las dimensiones internas, que a menudo tienen un margen de error bastante amplio. En segundo lugar, confía en el fabricante del procesador para informar datos verdaderos sobre su procesador. Esto no siempre es razonable (!). En el lado positivo: es posible obtener más información del procesador, por ejemplo, análisis de potencia para cada núcleo, potencia DRAM, potencia de E / S / interconexión, potencia de gráficos integrados, obtener una comprensión general de la distribución de potencia.
Registros de hardware: esta es la forma en que el sistema se informa a sí mismo sobre el trabajo: cuánta energía usa, cómo debe regular el voltaje / frecuencia dependiendo de la corriente, la potencia o el rendimiento térmico. Otro aspecto positivo es la facilidad de uso de dichos datos en los scripts de prueba.
Las pruebas de energía son a menudo objeto de controversia. Generalmente se usa un virus especializado que puede cargar simultáneamente cada área del procesador a la máxima potencia. El "virus de energía" se usa para verificar la estabilidad de la aceleración, pero tiene un inconveniente: con la carga diaria, los resultados, por regla general, no reflejan el consumo de energía real. Esta es la delgada línea entre una prueba real y una prueba sintética diseñada para impulsar cada julio de energía a través de un chip. El software, como LINPACK, a menudo se usa como una prueba de potencia efectiva. Las herramientas internas de Intel y AMD pueden ayudar a cargar el chip aún más duro.
Prime95 es una herramienta popular, está perfectamente optimizada para casi todos los núcleos, controla la fuente de alimentación. Su carga de trabajo es semisintética, basada en el cálculo de números primos, pero la prueba de esfuerzo ignora los resultados y se enfoca solo en el consumo de energía. Durante esta revisión, jugamos un poco con POV-Ray como prueba de potencia: proporciona un consumo de energía aún mayor que Prime95, y también utiliza una carga de trazado de rayos muy popular. Para escribir una reseña para mí, es por eso que decido qué herramienta se usa mejor para las pruebas de consumo de energía. Prime95 tiene problemas para trabajar con una gran cantidad de núcleos (a veces es difícil obtener un resultado de prueba si se excede el límite de 25 subprocesos), y para que POV-Ray funcione, tenemos que ajustar sus métodos de carga, ya que apunta más a verificar la carga del núcleo, en lugar de corrientes. Sin embargo, esperamos obtener resultados dependiendo de la cantidad de hilos. Se indicará qué software se usó en cada etapa de la prueba (pudimos preparar nuestra versión de POV-Ray solo en el medio de la revisión, por lo tanto, la mayoría de los datos se recibieron de Prime95).
Consumo de energía total
Como primer conjunto de resultados, quiero presentar el consumo total de energía del procesador, medido en varias situaciones. Al ralentí:

Luego cargamos solo un núcleo con dos hilos usando Prime95. Nuestra técnica de prueba hace que ambos hilos funcionen en el mismo núcleo, en caso de que los núcleos del procesador sean capaces de procesar varios hilos. Los usuarios centrados en cargas de una sola tarea verán el consumo de energía en este rango. Esto también se aplica a los sistemas en los que Windows está constantemente en segundo plano.

La tercera prueba es un sistema cargado con cuatro hilos usando Prime95. Este es exactamente el rango de carga que la mayoría de la gente usa todos los días en sus sistemas: varias pestañas del navegador, un par de ventanas, varios paquetes de software en funcionamiento están abiertos, uno o varios juegos están en ejecución.

Al aumentar la carga del procesador a doce subprocesos (con Prime95), pasamos a los usuarios que utilizan cargas de trabajo grandes y multitarea. Estos son jugadores: streamers o usuarios que comienzan a renderizar mientras trabajan en paralelo con otras tareas.

El gráfico final muestra el consumo total de energía. Para esta prueba, ejecutamos la cantidad máxima de subprocesos (Prime95), en el futuro planeamos usar POV-Ray para esta prueba, ya que se muestra mucho mejor con una gran cantidad de subprocesos. El único inconveniente de esta prueba es que el 2990WX overclockeado puede completar la prueba de POV-Ray en menos de 20 segundos.

Consumo individual de energía del núcleo
Antes de crear la prueba de consumo de energía POV-Ray, lancé los dos nuevos procesadores Threadripper en la prueba Prime95 en la opción All-thread, recibí el consumo de energía de cada núcleo en cada carga.

Al cargar el primer núcleo, vemos que su consumo de energía es de ~ 23 vatios. Esto es mucho en comparación con los núcleos de Zeppelin. Esto también se aplica cuando se cargan dos núcleos. Al cargar tres núcleos, observamos una disminución en el consumo a 18.8 vatios por núcleo. Dado que este chip tiene cuatro CCX, surge la pregunta de si este resultado está relacionado con el hecho de que las transmisiones se cargan en el mismo CCX (que, aparentemente, debería suceder), y alcanzamos el límite de potencia de CCX. Al cargar cuatro núcleos, el consumo de cada núcleo es de aproximadamente 17.4 vatios.
Al aumentar el número de núcleos cargados a cinco, encontramos que el quinto núcleo funciona a 18.2 vatios y los cuatro restantes, a 16.8 vatios. El resultado indica que este quinto núcleo está ubicado en el nuevo CCX. En la transición de ocho núcleos a nueve, vemos lo mismo: el noveno núcleo consume 17.5 vatios de potencia, mientras que los ocho restantes son aproximadamente 14.3 vatios. Al final, la distribución de energía cae a 7-9 vatios por núcleo si usamos los 16 núcleos.
El consumo total de energía del procesador es ~ 178 W, aproximadamente 180 W TDP con un consumo de ~ 135 W en los núcleos, y el resto está en Uncore (hardware extra-core - Infinity Fabric, IO, IMC).
En cuanto a los resultados de la prueba 2990WX, la imagen resultante se ve muy, muy extraña.

En su mayor parte, los datos de consumo de energía de hasta 15 núcleos son casi los mismos que los del 2950X. Sin embargo, a medida que aumentan los flujos, queda claro que la primera capa de matriz es claramente preferible. Al cargar flujos adicionales y conectar una segunda matriz, la potencia en sus núcleos es mucho menor, hasta 2.4 W por núcleo. La primera capa de zeppelin a plena carga consume aproximadamente 6.6 vatios por núcleo, pero el resto del núcleo del procesador es de aproximadamente 2.4 vatios. Algo sucede, como resultado de lo cual la primera matriz tiene prioridad en nutrición en comparación con el resto. Vale la pena señalar que el consumo de energía del chip es de aproximadamente 180 vatios, no 250 vatios, como muestra su TDP.
Alrededor de este tiempo, terminamos de escribir un script de prueba de potencia de POV-Ray. Lo probé en 2990WX, presento los resultados. Y ahora son mucho más altos de lo esperado:

Sorprendentemente, a medida que aumentaba el número de subprocesos, la carga se distribuía de manera muy uniforme. Incluso pudimos usar completamente todos los 250 W TDP con configuraciones de stock y con un buen enfriador. Después de cargar los procesos por completo, vimos el consumo de 193 vatios por núcleos, 55 vatios por otros componentes. Bajo ninguna circunstancia observamos "flacidez" de núcleos activos por debajo de 3 vatios. Cuando se cargaron todos los núcleos, cada núcleo consumió sus 6 vatios "cómodos". Logramos una potencia de procesador de 240-250 W mientras cargamos alrededor de 40 hilos. Con un aumento adicional en los flujos, el núcleo agregado causó una redistribución del poder.
Dos ideas me vinieron a la mente. El primero fue fácil de verificar: ¿quizás el BIOS se atascó a 180 W después de instalar el 2950X? Verifiqué dos veces, y antes de ejecutar las pruebas con 2990WX, probé el 1920X previamente probado. Un reinicio completo del BIOS no afectó los resultados. Puedo argumentar que esto no es una limitación de energía del BIOS. La segunda idea es verificar las frecuencias. Después de verificar solo un punto de referencia (40 transmisiones cargadas), encontramos una pequeña extensión, pero solo en potencia.
Durante la prueba Prime95, la primera matriz funcionó a 7 vatios por núcleo con una frecuencia de 3575 MHz. El segundo cristal de silicio dio un resultado de 3 W por núcleo a una frecuencia de 3525 MHz. Otros núcleos (inactivos) operaban a una frecuencia de 1775 MHz o 2000 MHz, consumiendo milivatios.
Durante la prueba de POV-Ray, cada núcleo activo consumió aproximadamente 9.1 vatios por núcleo y tenía una frecuencia de 3575 MHz. Todos los núcleos inactivos estaban a una frecuencia de 2000 MHz (había tres más a una frecuencia de 1775 MHz), consumiendo milivatios por núcleo.
Además de los datos sobre el consumo central, los chips se veían generalmente iguales en frecuencia. Los resultados de la prueba de POV-Ray son ligeramente más altos, lo que significa un mayor consumo total de energía con POV-Ray.
En última instancia, todo se reduce al hecho de que la prueba de potencia Prime95 después de exceder el umbral de 20 núcleos más o menos, o en microcircuitos con varios cristales, no funciona como se esperaba. En el futuro, utilizaremos nuestra prueba de POV-Ray, que es capaz de exprimir más de los procesadores modernos de múltiples núcleos.
Consumo básico vs no básico
Volviendo al momento en que hablamos sobre la frecuencia de Infinity Fabric, podemos ver la relación de consumo de energía como parte de la prueba POV-Ray para 2990WX.

Aunque observamos algunas desviaciones del resultado anterior, los datos (además del consumo máximo) generalmente corresponden a nuestra prueba de potencia Uncore con Prime95. Infinity Fabric todavía muestra 55-60 vatios de potencia. Como resultado, el consumo no nuclear como porcentaje de la capacidad total comienza desde el 75% con dos subprocesos, alcanza el 22% cuando se lanzan 40 subprocesos.
Overclocking: 4.0 GHz para 500 W
¿Quién dijo que un procesador de 250 W no debería ser overclockeado? AMD se enorgullece de fabricar procesadores, cada uno de los cuales se vende con un multiplicador desbloqueado, y también utiliza material soldado como interfaz térmica.
Es hora de arrepentirse. No tuvimos tiempo suficiente para el overclocking. Este procesador tiene una frecuencia base de 3.0 GHz, turbo 4.2 GHz. En una habitación con aire acondicionado que utiliza un enfriador Enermax Liqtech de 500 W, cargando todos los núcleos bajo POV-Ray, cada núcleo funcionaba a una frecuencia de 3150 MHz, que está muy lejos de la frecuencia turbo. Lo primero que hice fue configurar un turbo de núcleo completo a 4.2 GHz, al igual que un núcleo único. Esto dio un buen aumento.
Sin embargo, la siguiente etapa de mis experimentos de overclocking me sorprendió. Configuré el multiplicador de CPU en 40-x en el BIOS para 4.0 GHz en todos los núcleos, todo el tiempo. No regulé el voltaje, dejando el modo automático. Para hacer esto, incluso tuve que abandonar la placa base ASUS. Escucha, el procesador ha completado sin problemas nuestro conjunto de pruebas de 4.0 GHz. Estaba en shock
Todo lo que hice para este overclock fue cambiar de "auto" a "40". Las pruebas de POV-Ray que consumen más energía han tenido éxito. Cada prueba del conjunto funcionó. Aunque el rendimiento térmico fue alto (con la carga máxima), el enfriador se enfrentó fácilmente a esto.

A plena carga en la prueba POV-Ray, el procesador mostró un consumo de 500 vatios, el enfriador está diseñado para 500 vatios. En algún momento, vimos un salto a 511 W, donde se asignaron 440 W para núcleos (o 13.8 W por núcleo) y 63 W para núcleo (IF, IO, IMC), que corresponde al 12.5% del consumo total energía Si desea que el intercooler gaste menos energía, ¡acelere el porcentaje!
Establecieron la frecuencia a 4.1 GHz, y parecía funcionar también, hasta que cargamos el sistema por completo. Como se mencionó anteriormente, a 4.2 GHz no fue posible obtener un resultado de trabajo, incluso con un aumento en el voltaje. Para aquellos que desean profundizar en el overclocking, el enfriamiento líquido puede ser una solución.
Rendimiento a 4.0 GHz
Entonces, si la frecuencia de todos los núcleos es de 3125 MHz, el overclocking a 4000 MHz debería dar un aumento del rendimiento del 28 por ciento, ¿verdad? Aquí están los resultados de algunas pruebas clave de nuestro paquete.






La aceleración 2990WX dio resultados mixtos. Funcionó realmente bien en algunas pruebas, aún se queda atrás del 2950X en otras debido a su arquitectura de doble módulo.
El overclocking dio resultados realmente buenos en estas pruebas: Blender muestra un aumento en el rendimiento en un 19%, POV-Ray - en un 19%, 3DPM - en un 19%. En otras pruebas, es inferior a 2950X (Photoscan), todavía detrás (carga de aplicaciones, WinRAR).
El overclocking no solucionará todos los problemas de rendimiento en el 2990WX, pero ciertamente beneficiará al procesador.
Gracias por quedarte con nosotros. ¿Te gustan nuestros artículos? ¿Quieres ver más materiales interesantes?
Apóyenos haciendo un pedido o recomendándolo a sus amigos, un
descuento del 30% para los usuarios de Habr en un análogo único de servidores de nivel de entrada que inventamos para usted: toda la verdad sobre VPS (KVM) E5-2650 v4 (6 núcleos) 10GB DDR4 240GB SSD 1Gbps de $ 20 o cómo dividir el servidor? (las opciones están disponibles con RAID1 y RAID10, hasta 24 núcleos y hasta 40GB DDR4).
3 meses gratis al pagar un nuevo Dell R630 por un período de seis meses -
2 x Intel Deca-Core Xeon E5-2630 v4 / 128GB DDR4 / 4x1TB HDD o 2x240GB SSD / 1Gbps 10 TB - desde $ 99.33 al mes , solo hasta el final de agosto, ordene puede estar
aquíDell R730xd 2 veces más barato? ¡Solo tenemos
2 x Intel Dodeca-Core Xeon E5-2650v4 128GB DDR4 6x480GB SSD 1Gbps 100 TV desde $ 249 en los Países Bajos y los Estados Unidos! Lea sobre
Cómo construir un edificio de infraestructura. clase utilizando servidores Dell R730xd E5-2650 v4 que cuestan 9,000 euros por un centavo?