
A principios de 2000, se libró la gran "Guerra de Frecuencias". Un fabricante capaz de conducir ciclos máximos por segundo a través de su procesador tenía una ventaja obvia sobre sus competidores. Esto llevó a la creación de algunos chips muy populares, cuya arquitectura fue olvidada con el tiempo en nombre de algo más razonable. Han pasado 10-15 años, una nueva guerra está en auge a nuestro alrededor: "La guerra de los núcleos". ¿Cuántos núcleos de CPU con comunicación entre procesos de alta velocidad se pueden colocar en un procesador de consumidor? Más recientemente, la respuesta fue 10, y AMD está entrando en el mercado con los nuevos procesadores Theadripper de 16 núcleos. Tenemos ambos: 1950x y 1920x, para freírlos a fondo en nombre de una nueva revisión.
Nuevo orden mundial
En 2017, AMD lanzó una nueva arquitectura de microprocesador: Zen. La arquitectura se utilizó en la nueva serie de procesadores Ryzen con el objetivo obvio de separar parte del mercado de las soluciones de PC de escritorio de gama alta de Intel. Tres representantes de la familia Ryzen 7 tienen cada uno 8 núcleos con tecnología hyperthreading y muestran una muy buena relación de rendimiento y precio, a veces mostrando un resultado comparable a los procesadores Intel dos veces más caros. Les siguen cuatro procesadores Ryzen 5 con un precio aproximadamente igual al de la línea i5 de cuatro núcleos. Por el mismo dinero, AMD ofrece un procesador con doce hilos, que es tres veces más que el Core i5. Finalmente, Ryzen 3 tiene un precio de alrededor de $ 120, compitiendo directamente con el Core i3, con el doble de núcleos que el producto de Intel. Ahora estamos viendo que AMD presenta oficialmente la familia de procesadores de servidores AMD EPYC, que ofrece hasta 32 núcleos; En los próximos meses, el producto ingresará al mercado y, por ahora, los OEM están probando procesadores y determinando su rendimiento.
Lejos de los productos enumerados está la familia Ryzen Threadripper de AMD o simplemente Threadripper. Estos procesadores tienen el mismo diseño que las CPU AMD EPIC del lado del servidor, pero están adaptados para PC de escritorio. Los dos primeros procesadores son 1950X y 1920X, con 16 y 12 núcleos, respectivamente. Fueron seguidos por el 1900X de 8 núcleos, lanzado el 31 de agosto, que promete aparecer en 1920, que la verdad aún no se ha anunciado. Todos estos chips están instalados en un zócalo LGA tipo TR4 de 4094 pines. El zócalo es idéntico al zócalo SP3 utilizado para EPIC (aunque los zócalos no son intercambiables) y supera el zócalo tipo PGA AM4 de 1331 pines utilizado para los procesadores Ryzen 7/5/3.

* Última información de AMD, de acuerdo con nuestros datos
** Producto no anunciado, las especificaciones están sujetas a cambios.
Si Ryzen 7 tiene como objetivo formar parte del mercado de las soluciones de escritorio de alta gama de Intel (HEDT), entonces Threadripper se crea para establecer una nueva barra de rendimiento. Este segmento puede llamarse "escritorio de súper alta gama" (SHED). La cantidad de núcleos que AMD introdujo en los procesadores Threadripper anteriormente solo se podía ver en las soluciones de servidor Intel; la compañía ofreció 28 núcleos por una cantidad equivalente a casi $ 10 mil. Al ofrecer chips con una gran cantidad de núcleos, frecuencias razonables, potencia e IPC, AMD borra los límites entre usuarios, semiprofesionales y clientes corporativos. Para competir, Intel anunció el lanzamiento de la plataforma Skylake-X con 12, 14, 16 y 18 núcleos en los próximos meses.
Al igual que los chips Intel más rápidos, los procesadores AMD seguramente serán demandados por aquellos que quieran hacer todo a la vez. Para el usuario de una PC doméstica, esto puede permitirle combinar el proceso del juego durante la transmisión (transcodificación y carga en tiempo real) con el alojamiento del servidor del juego y la ejecución paralela de algunas tareas adicionales. Para el segmento semiprofesional, esto significa procesamiento de video o computación usando múltiples GPU / FPGA. La esencia de la idea es que si el usuario necesita hacer algo en la computadora, puede usar el sistema simultáneamente para otras tareas, teniendo un suministro suficiente de potencia de CPU, ranuras PCI, RAM y espacio de almacenamiento. Threadripper, como ya se mencionó, heredó el diseño del procesador del servidor y, en consecuencia, sus aspectos de rendimiento de alta densidad que han identificado al servidor en la última década.
Nuevo zócalo, nuevas placas base
Nuevamente, al igual que la plataforma Intel HEDT, AMD lanza la plataforma X399 bajo Threadripper para proporcionar todas las herramientas necesarias para el nuevo procesador. La gran ranura TR4 y todos sus pines proporcionan memoria de cuatro canales con dos DIMM por canal, así como hasta 60 líneas PCIe para placas adicionales (tarjetas de video, tarjetas de red, SSD, etc.). Estas placas base admiten actualmente dos procesadores Threadripper ya lanzados, más un procesador que se lanzará a finales de mes y otro procesador que no se ha anunciado, aunque se ha recibido información interna sobre su lanzamiento (fecha de lanzamiento desconocida).

El nuevo zócalo es notablemente diferente de los zócalos AMD anteriores, lo que muestra cuán lejos ha avanzado la tecnología. En lugar de un zócalo PGA con un pestillo simple para una fijación confiable de la CPU en el zócalo, el conector LGA TR4 tiene tres tornillos Torx, que deben desenroscarse en un cierto orden (como se ve en la figura anterior), después de lo cual el pestillo del conector simplemente se abre. Debajo hay un soporte en el que se inserta el procesador. Cada procesador Threadripper tiene un marco fijo para la colocación conveniente de la CPU en el soporte.

Debido al diseño del conector y al tamaño de los procesadores, los orificios para conectar el enfriador de la CPU también varían. Dado que cada Threadripper presentado tiene una potencia de 180 vatios, AMD recomienda utilizar al menos refrigeración líquida y suministra un soporte de procesador Asetek con cada procesador vendido (también se incluye un destornillador Torx).

El soporte es más estrecho, por un lado, lo que indica la "parte superior" del zócalo en el diseño tradicional de la placa base.

La esencia del diseño de la placa base se reduce a cómo se enruta cada una de las funciones de E / S disponibles. El diagrama de bloques básico de AMD es el siguiente:

La configuración AMD propuesta proporciona 48 líneas desde la CPU a las ranuras PCIe para comunicación SLI / CFX de 4 vías (16/16/8/8), 12 líneas desde la CPU a las ranuras M.2 para NVMe x4 de 3 vías y 4 líneas para el conjunto de chips . En este caso, el chipset puede tener dos puertos Gigabit Ethernet, una ranura PCIe x4, una ranura PCIe x1, PCIe x1 para Wi-Fi, SATA, puertos USB 3.1 Gen 1 y USB 3.1 Gen 2 y puertos USB 2.0.
Presumiblemente, los precios de las placas base X399 variarán de $ 249 a $ 599, según la funcionalidad. La placa base que probamos para escribir esta revisión fue la ASUS X399 ROG Zenith Extreme, cuyo MSRP (precio de venta recomendado por el fabricante) es de $ 549.
Competidores
Le pedimos a Intel y AMD que aclararan a quién ven como el principal competidor de los procesadores Threadripper. Dado que Threadripper es un producto orientado al consumidor, curiosamente, en realidad no orientado a las estaciones de trabajo, AMD anunció que el actual Core i9-7900X de Intel (procesador de 10 núcleos) es el producto de la competencia más adecuado . Xeon es un producto corporativo que no se venderá en los sistemas estándar que exigen los clientes de Threadripper.
Intel nos sorprendió al informar exactamente lo mismo que AMD. Dijeron que el Core i9-7900X es el principal competidor de Threadripper en el momento del lanzamiento del procesador. Se esperaba que a las compañías se les ofreciera algún tipo de solución 2P más barata, aunque, después de escuchar la opinión de Intel, quedó claro por qué esto no sucedió. Hay dos razones obvias: en primer lugar, Intel Consumer e Intel Enterprise son casi dos compañías diferentes que se superponen un poco y participan en los negocios del otro. Tampoco tienen una política general de comunicación con la prensa. Pregunte al consumidor de Intel: obtenga la respuesta del equipo del consumidor. Pregúntele al equipo de Enterprise y verá que están más enfocados en EPYC, no en Threadripper. La segunda razón es que el "sistema 2P barato" simplemente no existe cuando se trata de comprar nuevos procesadores. La mayoría de las discusiones en línea sobre sistemas Intel 2P baratos implican comprar CPU en el mercado gris o en revendedores.
Por lo tanto, el verdadero competidor es esencialmente Skylake-X (y Broadwell-E con un descuento). Como resultado, AMD Threadripper 1950X con 16 núcleos y 1920X con 12 núcleos se oponen a Core i9-7900X con 10 núcleos y Core i7-7820X con 8 núcleos. Considere rivales: el Core i7-6950X de Broadwell debido a su arquitectura, AMD Ryzen 7 1800X, Ryzen7 1700, que se incluyó en la lista como un ejemplo de una buena relación rendimiento / precio.

El punto clave aquí es que Threadripper tiene más núcleos y más carriles PCIe por el mismo precio. ADM ofrece CPU con un Turbo más bajo, pero con una frecuencia base más alta, con un poco más de potencia para dichas plataformas. Será una batalla interesante.
Artículos en esta revisión:
- AMD Ryzen Theadripper 1950x y 1920x
- Alimentar a la bestia y las características clave del procesador
- Chip, bus y NUMA
- Modo Creador y Modo Juego
- Configuración del banco de pruebas
- Test suite 2017
- Rendimiento de evaluación comparativa: pruebas del sistema de CPU
- Rendimiento de evaluación comparativa: pruebas de procesamiento de CPU
- Rendimiento de evaluación comparativa: pruebas web de CPU
- Rendimiento de evaluación comparativa: pruebas de codificación de CPU
- Rendimiento de evaluación comparativa: pruebas de CPU Office
- Rendimiento de evaluación comparativa: pruebas heredadas de CPU
- Rendimiento de juego: Civilization 6 (1080p, 4K, 8K, 16K)
- Rendimiento de juego: cenizas de la escalada de singularidad (1080p, 4K)
- Rendimiento de juego: Shadow of Mordor (1080p, 4K)
- Rendimiento de juego: Rise of the Tomb Raider (1080p, 4K)
- Rendimiento de juego: Rocket League (1080p, 4K)
- Rendimiento de juego: Grand Theft Auto V (1080p, 4K)
- Consumo de energía, eficiencia energética.
- Modo Creador y Análisis del Modo Juego
- Conclusión
Notas adicionales
Por razones que escapan a nuestro control, no hay pruebas de procesador Skylake-X en esta revisión. Hubo algunos problemas durante las pruebas, que pospusieron este proceso a una fecha posterior. Realizamos algunas pruebas más con el BIOS más reciente y con un sistema de enfriamiento más serio, pero, después de la llegada del procesador Threadripper, el SKL-X estaba perfectamente empaquetado y Threadripper tomó su lugar como sujeto experimental. Ahora, mirando los resultados de la prueba SKL-X, es obvio que los problemas que surgieron estaban relacionados con el BIOS / firmware. En un futuro cercano, se planea trabajar duro para encontrar un error, para este propósito se planea reemplazar la placa base X299 por una nueva.
2. Alimentando a la Bestia y las características del procesador clave
Cuando la frecuencia se consideraba la característica más importante de los procesadores, el problema principal era regular características tales como la eficiencia, las características térmicas y el costo de los cálculos: cuanto más elevaban las frecuencias, más voltaje se requería, cuanto más lejos del modo de procesador óptimo, mayor era el consumo de energía por unidad de trabajo. Para el procesador, que ocupó el primer lugar en la línea de productos, actuando como el "campeón del rendimiento", estas deficiencias no parecían importantes, hasta que la temperatura de funcionamiento alcanzó los 90 ° C.
Ahora, con el inicio de la Guerra Nuclear, han surgido otros problemas. Cuando solo había un núcleo, proporcionar datos para el núcleo a través de cachés y DRAM era una tarea relativamente simple. Con 6, 8, 10, 12 y 16 núcleos, el principal obstáculo era la necesidad de proporcionar a cada núcleo un flujo de datos para una operación continua a fin de evitar el tiempo de inactividad sin sentido de los núcleos. Esta no es una tarea fácil: cada núcleo del procesador ahora necesita una forma rápida de intercambiar datos entre sí y con la memoria principal. Suena como "alimentar a la bestia".
Características principales: 60 carriles PCIe frente a 44 carriles PCIe
Después de muchos años de desempeñar papeles secundarios, AMD con nuevos procesadores ocupará uno de los lugares líderes en el mercado. Ryzen 7 tenía solo 16 líneas PCIe (carril), y podían competir parcialmente con los procesadores Intel con 28/44 líneas PCIe. Ahora, el procesador Threadripper tendrá acceso a 60 líneas para tarjetas PCIe adicionales. En algunos casos, esto se puede llamar 64 líneas, pero cuatro de ellas están reservadas para el chipset X399. A $ 799 y $ 999, Threadripper compite con 44 carriles PCIe en el procesador Intel Core i9-7900X a un precio de $ 999.

La razón de tantos carriles PCIe es el mercado objetivo al que se dirigen estos procesadores: los consumidores de computación de alto rendimiento. Estos son usuarios que usan varios procesadores gráficos, varios dispositivos de almacenamiento PCIe, necesitan redes de alta gama, almacenamiento de datos de alta gama y otro hardware variado que se puede usar con PCIe. Como resultado, lo más probable es que veamos placas base que tengan 32 o 48 carriles para ranuras PCIe (x16 / x16, x8 / x8 / x8 / x8, x16 / x16 / x16, x16 / x8 / x16 / x8), dos o tres Ranuras PCIe 3.0 x4 para dispositivos de almacenamiento U.2 o M.2 y Ethernet más rápido (5 Gbit, 10 Gbit). AMD permite que cada uno de los sistemas raíz PCIe x16 se divida hasta x1 en un máximo de siete dispositivos. Los cuatro carriles de PCIe que van al chipset también admitirán múltiples carriles PCIe 3.0 y PCIe 2.0 para controladores SATA o USB.
Intel tiene una estrategia diferente, que le permite implementar 44 carriles en x16 / x16 / x8 (40 carriles) o x16 / x8 / x16 / x8 (40 carriles) o x16 / x16 a x8 / x8 / x8 / x8 (32 carriles) con 4- 12 carriles para almacenar controladores PCIe o Ethernet o Thunderbolt 3. El chipset Skylake-X tiene 24 buses PCIe más para controladores SATA, USB y Gigabit Ethernet.
Características principales: DRAM y ECC
Los productos de Intel están divididos por nicho, por lo que si un cliente quiere tener un procesador con una gran cantidad de núcleos con ECC (memoria de código de corrección de errores), debe comprar Xeon. Por lo general, Xeon admite una velocidad de memoria fija que depende del número de canales completos (1 DIMM por canal en DDR4-2666, 2 DIMM por canal en DDR4-2400), así como las tecnologías ECC y RDIMM. Sin embargo, las plataformas de consumo HEDT para Broadwell-E y Skylake-X no admitirán estas tecnologías y solo utilizarán UDIMM sin ECC.
AMD admite ECC en sus procesadores Threadripper, proporcionando a los clientes 16 núcleos con ECC. Sin embargo, deberían ser solo UDIMM (DRAM no registrada), pero con soporte para overclocking RAM, para aumentar la velocidad de Infinity Fabric (los procesadores AMD Ryzen usan la conexión interna Infinity Fabric, que reemplazó al bus HyperTransport, para comunicarse entre las unidades individuales). AMD ha anunciado oficialmente que los procesadores Threadripper pueden admitir hasta 1 TB de RAM, aunque requerirá tarjetas UDIMM de 128 GB, cuyo tamaño máximo es actualmente de 16 GB. Intel reclama un límite de 128 GB para Skylake-X cuando usa UDIMM de 16 GB.
Ambos procesadores admiten memoria de cuatro canales en DDR4-2666 (1DPC - DIMM por canal) y DDR4-2400 (2DPC).
Características principales: caché
Tanto AMD como Intel usan cachés L2 privados para cada núcleo, luego caché L3 (caché L3 víctima) antes de pasar a la memoria principal. El caché de la víctima es un caché que recibe datos eliminados del caché debajo y no puede capturar previamente datos. Pero el tamaño de estos cachés y la forma en que AMD e Intel interactúan con ellos son diferentes.

AMD utiliza 512 KB de caché L2 para cada núcleo, 8 MB de caché L3 por complejo de cuatro núcleos. En el Threadripper de 16 núcleos hay cuatro complejos de 4 núcleos, como resultado tenemos 32 MB de caché L3, sin embargo, cada núcleo solo puede acceder a los datos encontrados en su L3 local. Para acceder al L3 de otro complejo, se requiere tiempo adicional, lo que causa retrasos significativos.
En Intel Skylake-X, obtenemos 1 MB de caché L2 por núcleo, lo que significa una mayor probabilidad de acierto de caché L2, el caché L3 se redujo a 1.375 MB por núcleo. L3 ha dejado de ser inclusivo, lo que significa que el contenido del caché L2 no se copia en el caché L3, si el kernel requiere datos de otro kernel que está en el caché L2, deberá realizar la solicitud correspondiente; estos datos ya no están en el caché L3, por lo que toma más tiempo y latencia Sin embargo, el retraso es algo racionalizado por el diseño. Esto difiere notablemente de la estructura de caché Broadwell-E, donde 256 KB es L2 y 2.5 MB es L3 por núcleo. Cachés Broadwell-E con una solución arquitectónica inclusiva.
3. Chip, bus y NUMA
En la línea Ryzen, AMD ha desarrollado un chip de silicio de 8 núcleos, conocido como el chip Zeppelin. Consiste en dos complejos centrales (CCX) con cuatro núcleos cada uno, y cada CCX tiene acceso a 8 MB de caché L3. El chip Zeppelin tiene acceso a dos canales DRAM y un límite de 16 carriles PCIe para tarjetas adicionales. Con el lanzamiento de Threadripper, AMD duplicó esta matriz.
Si desarmara el procesador Threadripper, vería cuatro chips de silicio, similares a los del procesador EPYC (diseño de módulo de núcleo múltiple MCM). Dos de estos chips están endureciendo las "juntas", silicio vacío, que no sirve más que para la distribución del peso del enfriador y el enfriamiento. Los otros dos chips (en las esquinas opuestas, para mejorar el rendimiento térmico y el enrutamiento) son esencialmente el mismo Zeppelin utilizado en Ryzen, cada uno de los cuales contiene ocho núcleos y tiene acceso a dos canales de memoria. Intercambian datos a través del bus interno Infinity Fabric, para el cual AMD reclama un ancho de banda de 102 GB / s (dúplex completo bidireccional) y un retraso de 78 ns para acceder a la memoria más cercana (DRAM conectada al mismo chip) y 133 ns para acceder a memoria distante (DRAM en otro chip). Verificamos y podemos confirmar estos números para la memoria DDR4-2400. Usando DDR4-3200, se alcanzan velocidades de acceso de 65 ns y 108 ns, respectivamente.
A pesar de que esta diapositiva AMD muestra dos chips, hay cuatro en el procesador. Como solo dos de ellos están activos, AMD ha simplificado el gráfico.En comparación, EPYC afirma una velocidad de transferencia de datos entre chips de hasta 42,6 GB / s en DDR4-2666. Esto se debe al hecho de que en EPYC hay tres conexiones internas a los chips y una externa (a otro zócalo). Los chips en Threadripper necesitan interactuar con solo otro chip, lo que brinda cierta flexibilidad. Parece que Threadripper usa dos de las tres conexiones a una velocidad de 10.4 GT / s (gigatransaction por segundo):
- Chip-a-chip para EPYC está limitado a 42.6 GB / s cuando se usa DDR4-2667
- El chip a chip para Threadripper está limitado a 102.2 GB / s cuando se usa DDR4-3200
- 42.6 GB / s * 2 canales * 3200/2667 = 102.2 GB / s
- 42.6 GB / s * 3 canales * 3200/2667 a 8.0 GT / s = 115.8 GB / s (demasiado)
- 42.6 GB / s * 3 canales * 3200/2667 a 6.4 GT / s = 92.6 GB / s (demasiado pequeño)
Esta configuración de AMD es exactamente lo que se llama la configuración NUMA: acceso no uniforme a la memoria. Esto significa que el código no puede confiar en un retraso constante (y bajo) entre solicitar algo de DRAM y recibirlo. Esto puede ser un problema para el código de alto rendimiento, por lo que algunos programas están diseñados con soporte NUMA, lo que le permite vincular la memoria al controlador DRAM más cercano, reduciendo el rendimiento potencial, pero priorizando la latencia.
NUMA no es nuevo en la arquitectura x86. Después de que los procesadores comenzaron a distribuirse con controladores de memoria en chip, en lugar de controladores fuera del chip, en el puente norte de la placa base, NUMA se convirtió en una parte integral de los sistemas multiprocesador. En este sentido, AMD fue líder desde el principio, estaban años por delante de Intel en el desarrollo de controladores en un chip para procesadores x86. Por lo tanto, AMD ha estado trabajando con NUMA durante muchos años, y de manera similar, NUMA ha estado trabajando en sistemas de servidores multiprocesador Intel durante casi una década.
Nuevo en Threadripper es que tener NUMA nunca tocó a los consumidores. Los procesadores MSM personalizados podrían contarse con los dedos, y tendríamos que volver a la familia Core 2 Quad para encontrar un procesador con núcleos de múltiples chips, que precedió a los controladores de memoria para procesadores Intel. Por lo tanto, Threadripper fue el primer procesador en presentar a los usuarios de NUMA.
Pero lo más importante, el software de consumo tampoco estaba preparado para NUMA, por lo que casi ningún programa puede usar sus funciones. La buena noticia es que, aunque NUMA cambia las reglas del juego, no interrumpe el funcionamiento del software antiguo. Los sistemas operativos habilitados para NUMA ayudan a que el software listo para usar admita operaciones de subprocesamiento y memoria en un solo host NUMA para proporcionar características de rendimiento estándar.
La desventaja de esto es que, como padre extremadamente cuidadoso, el sistema operativo evita que el software inapropiado use otros nodos NUMA o, como en el caso de Threadripper, prohíbe que las aplicaciones usen el segundo chip y sus 8 núcleos.
A nivel de hardware, Threadripper consta de dos nodos NUMAEn un mundo ideal, todo el software sería compatible con NUMA, lo que solucionaría cualquier problema sobre este tema. Pero en la práctica, todo parece un poco diferente: el software está cambiando lentamente y es muy poco probable que en el futuro cercano los procesadores en el estilo NUMA se conviertan en algo común. Además, la programación para NUMA puede ser bastante difícil, especialmente en el caso de cargas de trabajo o algoritmos asociados con el trabajo con núcleos y memorias "distantes". Por lo tanto, las peculiaridades de NUMA nunca desaparecerán por completo, razón por la cual AMD ha asumido la responsabilidad de resolver este problema.
AMD implementó conmutadores, tanto en el BIOS como en la aplicación, para admitir y controlar NUMA en Threadripper. Por defecto, Threadripper en realidad oculta su arquitectura NUMA. En cambio, AMD usa Threadripper en una configuración UMA: un sistema de acceso a memoria unificado en el que la memoria se envía a cualquier DRAM y el retraso es variable (por ejemplo, ~ 100 ns en promedio entre 78 ns y 133 ns), pero se enfoca en un alto rendimiento pico . Al introducir la CPU para el sistema operativo como un diseño integral, el ancho de banda de la memoria aumenta y todas las aplicaciones (compatibles con NUMA y no) ven los 16 núcleos como parte de la misma CPU. Por lo tanto, para aplicaciones que no admiten NUMA (y, por lo tanto, su rendimiento se vería reducido por el sistema operativo en modo NUMA), esto le permite maximizar el número de núcleos, subprocesos y memoria que pueden usar.
Los 32 hilos se presentan como parte de una sola CPU monolíticaLa desventaja del modo UMA es que, dado que oculta cómo funciona Threadripper, no permite que el sistema operativo y las aplicaciones tomen decisiones totalmente informadas y, por lo tanto, su rendimiento se reduce. Las aplicaciones que son sensibles a la latencia y no están optimizadas para NUMA pueden perder rendimiento si usan núcleos y memoria conectados a otro chip. AMD Threadripper NUMA, NUMA . , . , .
, - . , -- , . AMD 400mm2+ , . , , , .

Intel Skylake-X: LCC , 10 HCC, 12 18 . (3x4 5x4 ), . Intel , , (, , , ). Skylake-X Intel (MODe-X) Intel, — . 2,4 . Skylake-X Intel , , .
, AMD Infinity Fabric, , Intel — MoDe-X.
4. Creator Mode Game Mode
- , AMD «», . Creator Mode ( ) Game Mode , .
:
- Legacy Compatibility Mode, on or off (off by default)
- Memory Mode: UMA vs NUMA (UMA by default)
, DRAM PCIe. LCM , , 16- 32 . LCM , , 8 16 . , (, DiRT) 20 . . - .
, , (UMA) (NUMA). , . , 20% , , .

NUMA - , NUMA, , . , . , , , , bandwidth . , . , — FPS 99- .
, AMD « » «» «». , SMT, «» , (NUMA), Distributed (UMA), Distributed .
- When Memory Access Mode is Local, NUMA is enabled (Latency)
- When Memory Access Mode is Distributed, UMA is enabled (Bandwidth, default)
, . AMD , . Creator . , FPS .

, .

BIOS, « » « ». , ASUS Local Distributed, NUMA UMA. Legacy Compatibility Zen, , . Ryzen Master .

Threadripper, AMD Ryzen Master , , , , . , Creator . AMD «». «Creator» «Game Mode», , ( «Legacy Compatibility Mode» «Memory Access Mode»), .
, Creator Game Mode . , , – . , Threadripper , , . SMT - , AMD Creator Game Mode.
16- Threadripper 1950X. , DRAM. ( 2 ), L1, L2, L3 . UMA, Creator, . Ryzen 5 1600X Zeppelin 6950X Broadwell . DDR4-2400, DIMM .

1950X , 8 , L3 CCX. , Game 79 , Creator — 108 . , Ryzen 5 1600X, , 8 (20 41 ), Creator Game 87 . , Creator , , Ryzen Game.
DRAM DDR4-3200 Threadripper 1950X, :

8 , L3 , . 8 DDR4-2400 41 18 DDR4-3200. , , : Creator DDR4-3200 Game DDR4-2400 (87 79 ), Game DDR4-3200 65 .
, Game mode, ( ). AMD?

:
- At DDR4-2400, 79 and 136 «» (108 )
- At DDR4-3200, 65 and 108 «» (87 )
— , Creator, , UMA + Creator ( ) .
5.
-, , , . , , JEDEC. , , , , JEDEC . , (XMP ), BIOS. JEDEC — , , , , .

, , : , .
Debemos agradecer a las siguientes empresas por su amable equipo para nuestras numerosas tareas de prueba. Algunos de estos hardware no se usan específicamente en esta configuración de prueba, pero se usan en otras pruebas.
Gracias a
Sapphire por proporcionar varias GPU AMD. Nos reunimos con Sapphire en Computex 2016 y discutimos la plataforma para nuestras futuras pruebas en GPU AMD para su producción para varios proyectos futuros. Como resultado, pudieron proporcionarnos el último chip que AMD puede ofrecer. En la parte superior de la lista había un par de GPU Sapphire Nitro R9 Fury de 4GB basadas en la primera generación de tecnología HBM y la plataforma AMD Fiji. Como la primera GPU de consumo con HDM, la R9 Fury es un momento clave en la historia de las tarjetas gráficas, y estas súper tarjetas vienen con 3584 SP funcionando a 1050 MHz y GPU con 4 gigabytes de memoria HBM de 4096 bits a 1000 MHz.

Después de Fury, Sapphire también presentó un par de sus últimas tarjetas Nitro RX 480 de 8GB para presentar el procesador actual de alto rendimiento AMD de 14nm (a partir de marzo de 2017). El cambio a 14 nm condujo a una mejora significativa en el consumo de energía en AMD, que, combinado con la última versión de GCN, nos permitió crear una tarjeta de video lista para VR por aproximadamente $ 200. La tarjeta gráfica Sapphire Nitro RX 480 8GB OC está diseñada para ser la clase premium de la familia RX 480, que tiene un conjunto completo de 8 GB de memoria GDDR5 a 6 Gb / sy 2304 SP que funcionan a frecuencias de reloj de 1208/1342 MHz.

Junto con el R9 Fury y el RX 480, diseñados para pruebas de juego, Sapphire aprobó un par de RX 460, que se utilizarán para probar el procesador. La cantidad de energía de GPU disponible puede afectar directamente el rendimiento de la CPU, especialmente si el procesador interactúa con la tarjeta de video todo el tiempo. La RX 460 es una tarjeta excelente para este propósito, ya que combina alto rendimiento y bajo consumo de energía sin requerir ningún conector de alimentación adicional. El Sapphire Nitro RX 460 2GB sigue la filosofía Nitro: proporciona buena potencia a un precio bajo. Su 896 SP opera a frecuencias de 1090/1216 MHz, está equipado con 2 GB GDDR5 con una efectiva 7000 MHz.

También debemos agradecer a MSI por proporcionarnos la GPU GTX 1080 Gaming X 8GB. A pesar de la escala de AnandTech, proporcionar tarjetas gráficas de alta gama con pruebas no es una tarea fácil. MSI resolvió el problema con la mejor tradición y nos apoyó con un par de tarjetas gráficas de alta calidad. La tarjeta gráfica MSI GTX 1080 Gaming X 8GB es un producto premium refrigerado por aire que es un nivel más bajo que Seahawk, pero supera el Aero y el blindaje refrigerado por agua. Esta es una tarjeta grande con dos ventiladores Torx, un diseño de PCB individual, tecnología Zero-Frozr, PWM mejorado y un panel posterior grande para facilitar el enfriamiento. La tarjeta utiliza una matriz de silicio GP104-400 en un proceso TSMC de 16 nm, contiene 2560 núcleos CUDA y puede operar a frecuencias de hasta 1847 MHz en modo OC (o 1607-1733 MHz en modo silencioso). A bordo hay un GDDR5X de 8 GB que funciona a una frecuencia de 10,010 MHz. Durante mucho tiempo, la GTX 1080 fue un campeón reconocido entre las tarjetas de video.

Gracias a ASUS por proporcionar la GPU Strix GTX 1060 de 6GB. Para completar el segmento alto / bajo para las GPU AMD y NVIDIA, analizamos las tarjetas GTX 1060 de 6 GB para equilibrar el precio y el rendimiento y tener la oportunidad de probar juegos a una resolución superior a 1080p con una tarjeta de video.
ASUS extendió una mano amiga con la variante Strix GTX 1060. Esta tarjeta es incluso más larga que la GTX 1080, con tres ventiladores y LED. STRIX es una marca de juegos de bajo costo ASUS que sigue a ROG, mientras que la Strix 1060 es la mitad de la tarjeta 1080 superior. Tiene 1280 núcleos CUDA que operan a una frecuencia base de 1506 MHz (hasta 1746 MHz en modo OC) y 6 GB GDDR5 con una frecuencia 8008 MHz en una interfaz de memoria de 192 bits.

Gracias a Crucial por proporcionar el SSD MX200. El punto crítico es que nuestra lista de pruebas está creciendo con nuevos puntos de referencia y nombres de juegos, y el 1TB MX200 es de gran ayuda. Construido sobre el controlador Marvell 88S9189 y usando un chip Micron con 16nm 128Gb MLC, es un dispositivo de 7 mm y 2.5 pulgadas diseñado para lecturas IOPS aleatorias de 100K y velocidades de lectura y escritura de 555/500 MB / s. Los modelos de 1 TB que utilizamos aquí son compatibles con el cifrado TCG Opal 2.0 e IEEE-1667 (eDrive) y tienen una resistencia nominal de 320 TB con una garantía de tres años.

Gracias a Corsair por proporcionar la fuente de alimentación AX1200i. El AX1200i fue la primera fuente de alimentación en ofrecer control y gestión digital a través del sistema Corsair Link. Es capaz de entregar 1200 vatios a 50 ° C y está certificado 80 PLUS Platinum. Esto proporciona 89-92% de eficiencia a 115 V y 90-94% a 230 V. El AX1200i es completamente modular, con un diseño más grande de 200 mm y con un ventilador doble de 140 mm con rodamiento de bolas para soportar una operación de alto rendimiento.
El AX1200i está diseñado como un caballo de batalla con 8 ranuras PCIe con soporte de GPU de cuatro vías. El AX1200i también tiene un modo de ventilador de cero RPM que le permite apagar el ventilador si la fuente de alimentación funciona con menos del 30% de carga.

Gracias G.Skill por la memoria proporcionada. A lo largo de los años, G.Skill ha estado apoyando a AnandTech al probar CPU o placas base. Ya escribimos sobre sus chips de alto rendimiento y alta frecuencia, y cada año el Computex G.Skill organiza el torneo mundial de overclocking de nitrógeno líquido en el piso de exhibición.

6. Test suite 2017
Para esta revisión, hemos introducido un nuevo conjunto de pruebas de procesador. Utiliza nuestros nuevos scripts diseñados específicamente para esta prueba. Esto significa que después de instalar un sistema operativo nuevo, podemos configurar el sistema operativo para una compatibilidad máxima, instalar nuevas pruebas, guardar la versión deseada del sistema operativo sin actualizaciones aleatorias y ejecutar una serie de pruebas en menos de cinco minutos. Después de eso, necesita un clic de un botón para comenzar una prueba de 8-10 horas (con un núcleo de alto rendimiento) con casi 100 marcas de datos correspondientes en las pruebas a continuación para los procesadores, seguidas de nuestras pruebas de juegos, trabajarán 4-5 horas en cada una de las pruebas. GPU Las pruebas de CPU cubren una amplia gama de segmentos, muchos de los cuales le serán familiares. Algunas de las pruebas son nuevas para la evaluación comparativa en general, pero no menos importantes para CA.
Nuestras nuevas pruebas de CPU cubren seis áreas principales. Cubrimos la Web (tenemos una versión no actualizable de Chrome 56), pruebas generales del sistema (apertura de PDF complejos, emulación, simulación cerebral, IA, conversión de imágenes 2D a modelos 3D), renderizado (trazado de rayos, modelado), codificación ( compresión, AES, h264 y HEVC), pruebas de oficina (PCMark y otras) y nuestras pruebas anteriores: atavismo de la generación de código incorrecto, interesante para comparar.
Una nota sobre la preparación del sistema operativo. Como utilizamos Windows 10, existe una alta probabilidad de una actualización repentina del sistema, lo que violará nuestras pruebas. En relación con esta amenaza, tomamos una amplia gama de medidas de protección: prohibimos las actualizaciones al máximo, deshabilité Windows Defender, borré OneDrive, deshabilité Cortana tanto como sea posible. Además, activaron el modo de alto rendimiento en la configuración de energía y apagaron el reloj de la plataforma interna, lo que puede dar un error si cambia la frecuencia base (y, por lo tanto, el tiempo será inexacto).
Pruebas web en Chrome 56Sunspider 1.0.2
Mozilla Kraken 1.1
Google Octane 2.0
WebXPRT15
Pruebas del sistemaApertura PDF
FCAT
3DPM v2.1
Dolphin v5.0
DigiCortex v1.20
Agisoft PhotoScan v1.0
Pruebas de renderizadoCorona 1.3
Licuadora 2.78
CPU LuxMark v3.1 C ++
LuxMark v3.1 CPU OpenCL
POV-Ray 3.7.1b4
Cinebench R15 ST
Cinebench R15 MT
Pruebas de codificación7 cremalleras 9.2
WinRAR 5.40
Codificación AES (TrueCrypt 7.2)
HandBrake v1.0.2 x264 LQ
HandBrake v1.0.2 x264-HQ
HandBrake v1.0.2 HEVC-4K
Oficina / profesionalPCMark8
Compilación de cromo (v56)
SYSmark 2014 SE
Pruebas heredadas3DPM v1 ST / MT
x264 HD 3 Pase 1, Pase 2
Cinebench R11.5 ST / MT
Cinebench R10 ST / MT
Pruebas de juegos de CPU
En cuanto a nuestro nuevo conjunto de pruebas de GPU, decidimos pensar en grande. Hay muchos usuarios en el ecosistema que ponen el juego en la parte superior de sus prioridades cuando se trata de elegir un procesador. Y si existe la posibilidad de ahorrar $ 50 en el procesador y obtener la mejor tarjeta gráfica sin sacrificar el rendimiento, esta es la forma en que la mayoría de los jugadores elegirán. Aquí es donde nos esperan serias dificultades: los juegos no solo con diferentes requisitos, sino que también cargan el sistema de diferentes maneras, y las tarjetas de video reaccionan de manera diferente al flujo de código del juego. Además, los usuarios tienen una amplia gama de juicios y preferencias que determinan cuál es exactamente la "norma". Con tantos grados de libertad, las pruebas pueden extenderse hasta el final de nuestras vidas, a pesar del hecho de que los resultados se volverán obsoletos unos meses después del inicio de las pruebas, cuando salga un nuevo juego o aparezca una nueva GPU en el mercado. Para una buena precisión, usemos juegos para DirectX 12, lo que simplifica el uso de más núcleos de procesador en el proceso del juego.
Nuestra lista inicial de nueve juegos que saldrán en febrero se convirtió rápidamente en seis debido a la falta de un nivel profesional de personalización en los juegos de Ubisoft. Si quieres ver las pruebas de For Honor, Steep o Ghost Recon: Wildlands en AnandTech, dile a Ubisoft Annecy o Ubisoft Montreal dónde encontrarnos. Aunque estos juegos tienen un punto de referencia interno digno de aplicación, desafortunadamente, no proporciona al usuario final suficiente granularidad cuadro por cuadro, a pesar del hecho de que se usa para preparar los datos que el usuario ve en última instancia (como resultado, generalmente está oculto por otro capa). En cambio, preferiría automatizar estas pruebas a través de la entrada, pero los tiempos de carga extremadamente inconsistentes son un obstáculo importante.
Entonces, la lista de pruebas incluidas en nuestro script 4/2, automatizada antes de una ejecución con un solo botón, y dando resultados cuatro horas después para cada GPU. Los permisos y la configuración utilizados también se enumeran:
- Civilization 6 (1080p Ultra, 4K Ultra)
- Ashes of the Singularity: Escalation * (1080p Extreme, 4K Extreme)
- Shadow of Mordor (1080p Ultra, 4K Ultra)
- Rise of the Tomb Raider # 1 - GeoValley (1080p High, 4K Medium)
- Rise of the Tomb Raider # 2 - Profetas (1080p alto, 4K medio)
- Rise of the Tomb Raider # 3 - Montaña (1080p alto, 4K medio)
- Rocket League (1080p Ultra, 4K Ultra)
- Grand Theft Auto V (1080p muy alto, 4K alto)
Para cada GPU durante la prueba, los juegos enumerados (para cada combinación de resolución / configuración) se ejecutan cuatro veces y se descartan los valores que se desvían bruscamente. La velocidad de fotogramas promedio, el percentil 99 y los datos de Tiempo bajo x FPS se ordenan y los datos originales se archivan.
Las cuatro GPU que obtuvimos para las pruebas son:
- MSI GTX 1080 Gaming X 8G
- ASUS GTX 1060 Strix 6G
- Zafiro Nitro R9 Fury 4GB
- Zafiro Nitro RX 480 8GB
En nuestro script de prueba, guardamos algo especial para la GTX 1080. También se agregan las siguientes pruebas:
- Civilization 6 (8K Ultra, 16K más bajo)
Este punto de referencia, con algunas limitaciones, se puede lanzar, aunque va más allá de las características del monitor utilizado, permitiendo pruebas "futuras" de GPU en 8K y 16K con algunos resultados interesantes. Solo ejecutamos estas pruebas en la GTX 1080 porque no tiene sentido ver una presentación de diapositivas más de una vez.
* Como se indica en la nota de esta revisión, no tenemos datos sobre juegos en el procesador Skylake-X. Realizamos una serie de pruebas antes de obtener Threadripper, utilizando las últimas actualizaciones y el último BIOS. Sin embargo, ahora, analizando los datos, vemos una serie de problemas de rendimiento no resueltos que deberían cerrarse antes de la publicación de los resultados.
7. Pruebas del sistema de CPU
Nuestro primer conjunto de pruebas son las pruebas generales del sistema. Este conjunto de pruebas está diseñado para emular lo que la gente suele hacer en el sistema operativo, como abrir archivos grandes o procesar pequeñas pilas de datos. Difiere un poco de nuestras pruebas de oficina, que utilizan los estándares de la industria, y algunas de las pruebas aquí son relativamente nuevas e inusuales.
Abrir archivos PDF
El primero en la lista es una prueba que escribimos usando un monstruoso documento PDF que una vez recibimos antes de asistir a un evento. Aunque el documento contiene solo una página, contiene tantas capas de alta calidad que a mi computadora portátil promedio le tomó 15 segundos abrir el archivo y devolverme el control del sistema. Este documento se ha convertido en el mejor candidato para nuestra prueba "vamos a abrir un documento PDF horrible". Aquí utilizamos Adobe Reader DC con la funcionalidad de actualización deshabilitada. Nuestro punto de referencia establece la resolución de pantalla en 1080p, abre el PDF en modo de ajuste a pantalla y mide el tiempo entre el envío del comando para abrir el archivo y el momento en que el archivo se expande en la pantalla, y el usuario nuevamente tiene control sobre el software. La prueba se repitió 10 veces, después de lo cual se calculó el tiempo promedio. Los resultados se muestran en milisegundos.

Esta prueba es de un solo subproceso, por lo que los chips de alta frecuencia de Intel obtienen una clara victoria. Además, en esta prueba, hay una diferencia imperceptiblemente especial entre los chips Threadripper.
Procesamiento FCAT: enlace
Una de las cargas más interesantes que cayó en nuestras manos en los últimos trimestres es FCAT, una herramienta que utilizamos para medir y analizar visualmente los retrasos en los juegos debido a cuadros caídos o corruptos. El proceso FCAT requiere la inclusión de una superposición de color en el juego, la grabación del proceso del juego y el posterior análisis del archivo de video utilizando el software apropiado. Sin embargo, este software generalmente tiene un solo subproceso, ya que el video está principalmente en formato RAW, lo que implica un gran tamaño de archivo y requiere la transferencia de una gran cantidad de datos. Para nuestra prueba, tomamos un registro de 90 segundos de la prueba Rise of the Tomb Raider, que se ejecuta en la GTX 980 Ti a 1440p, que tiene un tamaño de aproximadamente 21 GB y medimos el tiempo que lleva procesar usando la herramienta de análisis visual.

Al igual que abrir PDF, el rendimiento de subproceso único está en la parte superior.
Dolphin Benchmark: enlace
Muchos emuladores están vinculados por el rendimiento del procesador de un solo procesador, y los informes generales tienden a sugerir que Haswell mejoró significativamente el rendimiento del emulador. Este punto de referencia lanza el programa Wii, en el que el rayo sigue una escena tridimensional compleja dentro del emulador Dolphin Wii. Los resultados de esta prueba son un indicador muy confiable de la velocidad de la emulación del procesador Dolphin, que es una tarea intensiva de un solo núcleo que utiliza la mayoría de los aspectos del procesador. Los resultados se dan en minutos, donde la propia Wii mostró un resultado de 17.53 minutos.

Dolphin se muestra bien donde hay un alto rendimiento de un núcleo, aunque a juzgar por la prueba, el subprocesamiento múltiple todavía está presente y hay núcleos adicionales involucrados.
Prueba de algoritmo de movimiento 3D v2.1: enlace
Esta es la última versión de nuestro punto de referencia 3DPM. El objetivo de 3DPM es simular algoritmos científicos parcialmente optimizados tomados directamente de mi tesis doctoral. La versión 2.1 difiere de la 2.0 en que transfiere las estructuras de partículas básicas por referencia en lugar de por valor y reduce el número de conversiones dobles-> flotantes-> dobles realizadas por el compilador. Esto proporciona una aceleración del 25% en comparación con la versión 2.0, lo que significa nuevos datos.

Entonces, en nuestra primera prueba puramente multiproceso, gana 1950X con 32 hilos. El 1920X es superior al 1950X en modo SMT-off, con 24 transmisiones en 16 transmisiones.
DigiCortex v1.20: enlace
Aunque está desactualizado durante un par de años, el software DigiCortex es un proyecto hogareño para visualizar la actividad de las neuronas y las sinapsis en el cerebro. El software viene con varios puntos de referencia, y tomamos un pequeño punto de referencia que ejecuta una simulación cerebral de 32 mil neuronas / 1.8 mil millones de sinapsis. Los resultados de la prueba indican la capacidad del sistema para emular en tiempo real, lo que significa que cualquier resultado por encima de uno es adecuado para la emulación.

DigiCortex requiere una mezcla de alta frecuencia de procesador y rendimiento de DRAM para obtener un buen resultado, por lo que cualquier cosa con memoria de cuatro canales es adecuada. El 1950X en modo SMT-off gana aquí debido al acceso rápido a la memoria principal, combinado con la presencia de 16 hilos para acceder a él. Broadwell-E es el competidor más cercano y supera incluso a Skylake-X, probablemente debido a la topología de anillo (anillo) contra la red (malla) en Skylake. Sin embargo, el rendimiento de 1950X en modo Creator es mucho más bajo que el de los chips Ryzen estándar, lo que demuestra que con una sola arquitectura de memoria puede ocurrir una disminución significativa en el rendimiento. El 1920X falló esta prueba por una razón desconocida.
Agisoft Photoscan 1.0: enlace
Photoscan permanece en nuestro conjunto de pruebas de la versión anterior de las pruebas, pero ahora trabajamos en Windows 10, por lo que entran en juego características como Speed Shift en los últimos procesadores. El concepto de Photoscan es la conversión de múltiples imágenes 2D en un modelo 3D; por lo tanto, cuanto más detalladas sean las imágenes y cuanto más, mejor será el modelo. El algoritmo consta de cuatro etapas: varias de un solo subproceso y varias de múltiples subprocesos, y también tiene cierta dependencia del caché y la memoria. Para algunas cargas de trabajo multiproceso más diversas, las opciones como Speed Shift y XFR pueden aprovechar la espera o el tiempo de inactividad de la CPU, lo que aumenta significativamente el rendimiento de las nuevas microarquitecturas.

El cambiante Agisoft de un solo subproceso múltiple muestra que en ese proceso, el elemento decisivo de la victoria es la combinación de núcleos, IPC y frecuencia. AMD está a la cabeza, probablemente debido a su implementación AVX.
8. Pruebas de renderizado de CPU
Las pruebas de representación son las favoritas de las revisiones y pruebas, reconocidas desde hace mucho tiempo, porque el código utilizado por los paquetes de representación generalmente está optimizado para exprimir cada bit de rendimiento. A veces, los programas de representación también dependen mucho de la memoria: cuando tiene muchos subprocesos que transportan toneladas de datos, la memoria de baja latencia puede ser la clave de todo. Windows 10, .
Corona 1.3: link
Corona — , , 3ds Max Maya, . – , . , , . , , « » ( , , « », ). Corona , .

.
Blender 2.78: link
-, Blender . Blender 5 , , . , , AMD, Intel , , , .

Blender .
LuxMark v3.1: link
, LuxMark , , , . OpenCL, C ++. , IPC, , C ++ OpenCL .


Blender, LuxMark . — . , 10- Core i9-7900X CPU (C ++), , , - IPC .
POV-Ray 3.7.1b4: link
suit — POV-Ray. . , AMD Ryzen, , . , , POV-Ray .

LuxMark, POV-Ray .
Cinebench R15: link
CineBench , , , . IPC ST, — MT.


Intel , 18- 3200 Cinebench R15. 6,7% Threadripper 1950X .
9. CPU Web Tests
- — . , « » , . , - Chrome 56 2017. , , .
SunSpider 1.0.2: link
- – SunSpider. JavaScript-, IPC , - , . 10 . 4 .

Mozilla Kraken 1.1: link
Kraken — Javascript, , SunSpider, , . , .

Google Octane 2.0: link
, Google Mozilla, , JS . , SunSpider JS, Kraken , Octane , , .

WebXPRT 2015: link
, , WebXPRT , . , , , , , .

, - . - — , Threadripper's . , — .
10. CPU Encoding Tests
. / , . / - « » — , . , . -, -. , 3D-, , , / .
7-Zip 9.2: link
, , 7-Zip. , . .



/ 7-zip. AMD .
WinRAR 5.40: link
2017 WinRAR . WinRAR , 7-Zip, . , 7-Zip, , (33 1,37 , 2834 370 150 ) . — , . - DRAM 10 , .

WinRAR — , . . Threadripper Creator.
AES Encoding
, AES-, . , --, AES . , . TrueCrypt - 1 DRAM. — GB / s .

HandBrake v1.0.2 H264 and HEVC: link
, ( , ) , . – , , . . Google, VP9, : H264, , 1080p, HEVC ( H265), , H264, ( ). HEVC , 4, .
Handbrake , .
/ H264: 2- 640x266 H264 Main profile High profile, very-fast .

/ H264: , 4K (3840x4320), 60 Main High, very-fast .

HEVC: HQ, 4K60 H264 4K60 HEVC.

HQ H264 AMD , SMT-off 1950X - SMT. HEVC, 1950X 7900X .
11. CPU Office Tests
, , — , , . — , , , , , , .
Chromium Compile (v56)
Windows 10 Pro, VS Community 2015.3 Win10 SDK Chromium. 2017 , . — — , .

, , 1920X Ryzen 7. , CCX , . 1950x «3---CCX» 1920x ( ). , , , , 2 1950X 8 12 16 Zen.
PCMark8: link
, PCMark 2008/2009 , Futuremark PCMark8, 2017 . PCMark , , « ». «» , C ++ OpenCL, . PCMark8 Home, Work Creative , , .


, Creative PCMark 8 . , .
SYSmark 2014 SE: link
SYSmark Bapco, . SYSmark , , Photoshop Onenote, , . (Office, Media, Data), . (Core i3-6100, 4 DDR3, 256 SSD, HD 530) 1000 .

12. CPU Legacy Tests
, - . , , 10 . Windows 10, , , .
3D Particle Movement v1
3DPM — , 3D-, Brownian Motion, . , IPC , «» . , , . - , , false sharing.


CineBench 11.5 and 10
Cinebench — , MAXON Cinema 4D. Cinebench . , , Cinebench, , . , , , , Cinebench, . 15, 11,5 10.




x264 HD 3.0
, x264 HD 3.0, , . 5.0.1, 1080p x264-. 3.0 720p, high-end , . , , 90 .


1950X: , , .
13. Civilization 6
, - — Civilization 6. Sid Meier , Civ . , - . , , , , . , , .

- — , , 5 . Civilization 6 Firaxis , . , Civilization , DirectX 12.
, , Civilization 20 , AI . Civilization «AI Benchmark», , . , .
1920x1080 4K . Civilization 6 MSAA, . , , 0 ( ) 5 (). Civ6- () 0 , MSAA — 2x.
, 8K 16K (Civ6 ) GTX 1080, 8K, 4K, 16K .
MSI GTX 1080 Gaming 8G Performance ASUS GTX 1060 Strix 6G Performance Sapphire Nitro R9 Fury 4G Performance Sapphire Nitro RX 480 8G Performance , Threadripper , Ryzen , Time Under Threadripper.
14. Shadow of Mordor
– - Middle Earth: Shadow of Mordor ( SoM). Monolith LithTech Jupiter EX . SoM . , Red Dead Redemption, SoM Zero Punctuation's Game of the Year 2014 .

2014 , SoM , . SoM , , , . , , , , 4K.
, , , , . , Graphical Quality, Lighting, Mesh, Motion Blur, Shadow Quality, Textures, Vegetation Range, Depth of Field, Transparency Tessellation. .
1080p 4K, 4K-, Ultra. FPS, 99 time under .
MSI GTX 1080 Gaming 8G Performance ASUS GTX 1060 Strix 6G Performance Sapphire Nitro R9 Fury 4G Performance Sapphire Nitro RX 480 8G Performance 16. Rise of the Tomb Raider (1080p, 4K)
Rise of the Tomb Raider (RoTR), Crystal Dynamics, Tomb Raider, . : RoTR .

Tomb Raider TressFX, RoTR . : , , , , , , DirectX 12.
, : (1-), (2-) (3-) — ( , — , ).
, , , 2-, , CPU , . - .
RoTR , , , , , , , , , , PureHair, TressFX.
-, 1920x1080 4K, 4K-. 1080p High, 4K Medium, - .
, RoTR , , INI-, TR . , , . FPS, 99 time under .
#1 Geothermal Valley Spine of the Mountain
MSI GTX 1080 Gaming 8G Performance ASUS GTX 1060 Strix 6G Performance Sapphire Nitro R9 Fury 4G Performance Sapphire Nitro RX 480 8G Performance #2 Prophet's Tomb
MSI GTX 1080 Gaming 8G Performance ASUS GTX 1060 Strix 6G Performance Sapphire Nitro R9 Fury 4G Performance Sapphire Nitro RX 480 8G Performance #3 Spine of the Mountain Geothermal Valley
MSI GTX 1080 Gaming 8G Performance ASUS GTX 1060 Strix 6G Performance Sapphire Nitro R9 Fury 4G Performance Sapphire Nitro RX 480 8G Performance , 1950X .
17. Rocket League
« – » . Katamari – , , . . , , Rocket League.
Rocket League pick-up-and-play, ( ), . Unreal Engine 3, , - , . 2015 5 , , , . , , , , . Rocket League , — .

, , , «» . , . , Unreal 3, Rocket League . .
, Rocket League , , . : Fraps , ( ), , 4v4, , , .
, , , , , . , , . (Aquadome, , , - / ) . 4 (, 5 DIRT: Rally benchmark), , 99- time under.

Rocket League : Low, Medium, High High FXAA. ; . 1920x1080 4K FPS.
MSI GTX 1080 Gaming 8G Performance ASUS GTX 1060 Strix 6G Performance Sapphire Nitro R9 Fury 4G Performance Sapphire Nitro RX 480 8G Performance Ryzen NVIDIA, . , , Ryzen Rocket League NVIDIA, Threadripper. , , Intel, , Rocket League , SMT-off 1950X. Time Under AMD, 1950X .
18. Grand Theft Auto
Grand Theft Auto 14 2015 , AMD, NVIDIA . GTA , , Advanced Game Engine Rockstar DirectX 11. , , , , , , .

. : , – 90 . , , — , , . , . , .
GTA , , . , / / / . MSAA, , -, . , , , , , ( , GPU , , R7 240 4 ).
, 1920x1080, Very High , 4K High . , , 99- time-under .
MSI GTX 1080 Gaming 8G Performance ASUS GTX 1060 Strix 6G Performance Sapphire Nitro R9 Fury 4G Performance Sapphire Nitro RX 480 8G Performance , Threadripper Ryzen, .
19. ,
Un Threadripper con un sistema de enfriamiento del procesador diseñado para la disipación de calor de 180 W TDP (potencia de diseño térmico) es un gran salto adelante después de las soluciones AMD anteriores que funcionan en el rango de 40-95 W, o plataformas Intel, donde la mayoría de los procesadores tienen TDP hasta 95 vatios y 140 vatios de alta gama. Aunque no olvidemos que AMD ya ha lanzado un procesador con TDP de 220 W, el FX-9590 que funciona a 5 GHz, que originalmente se vendió durante un año como un producto exclusivo para OEM, para asegurarse de que los usuarios tengan suficiente energía enfriamiento Al final, se lanzó como producto final con un enfriador de líquido y dos ventiladores.
Turbo CPU de 5 GHz de AMD en venta minorista: revisión de FX-9590 y ASRock 990FX Extreme9Por lo tanto, el TPD de 180 W todavía no es un concepto nuevo para AMD. Para esta revisión, utilicé refrigeración líquida AMD, obtenida en ese momento con el FX-9590, porque estaba diseñado para funcionar al menos 220 vatios. (AMD también proporcionó el refrigerador Thermaltake 3x120 junto con Threadripper, pero fue mucho más difícil de instalar en nuestro banco de pruebas).
Para probar la potencia, ejecutamos Prime95 durante al menos 60 segundos, y luego usamos el software para sondear los sensores de potencia incorporados en el chip para obtener los resultados. Dependiendo de la CPU, podemos recibir datos para todo el chip, para el núcleo, DRAM, uncore o GPU integrada; es importante que nuestra herramienta tenga la última actualización, ya que los registros para recibir estos datos deben ser conocidos. Por lo general, esta forma de leer el consumo de energía puede no ser lo suficientemente precisa en comparación con los métodos más invasivos, es rápida y asequible para administrar scripts. Además, son estos datos los que determinan cuándo el procesador central alcanza los límites de potencia y necesita aumentar la velocidad del ventilador.
Para comenzar, veamos el consumo total de energía de Threadripper.

En general, Threadripper es muy voraz incluso en inactivo. La mayor parte de la energía aquí es consumida por el controlador de memoria y el bus PCIe para admitir el procesador de gráficos con una pantalla estática. El hecho de que la memoria 1950X DDR4-3200 extraiga otros 13 W + de la CPU muestra cómo el controlador de memoria afecta el consumo general de energía. Para todos los chips, registramos 2 vatios de potencia para los núcleos.
Cuando cargamos el procesador en un hilo, lanza uncore / mesh, así como memoria, y entra en modo turbo máximo. Dependiendo de cómo esté diseñado el procesador, esto puede cargar un núcleo o varios a la vez, y luego, aunque solo un núcleo hará el trabajo, el resto seguirá aumentando el consumo de energía.

Los resultados muestran que diferentes procesadores Threadripper muestran nuevamente aproximadamente el mismo resultado, consumiendo significativamente más procesadores Ryzen, y corresponden a las CPU 10C / 8C de Broadwell-E y Haswell-E, respectivamente. El 1950X que se ejecuta en el DDR4-3200 todavía consume + 13 vatios adicionales, pero es interesante que el consumo de energía de los núcleos Skylake-X se elevó aproximadamente al mismo valor. Parece que la conexión MoDe-X utilizada en Skylake-X también consume una potencia significativa.
En la próxima prueba, cargamos el procesador con el número máximo de subprocesos para este diseño de chip. Este enfoque proporcionará la carga máxima en todos los núcleos, un controlador de memoria e interconexión.

Todos los procesadores Threadripper alcanzaron 177 vatios, justo por debajo de 180 vatios TDP, y los procesadores Skylake-X excedieron sus 140 vatios TDP declarados. El 1950X en modo Juego parece consumir un poco menos de energía, lo que puede deberse al lanzamiento de DRAM en NUMA.
Para algunos chips, solo podemos ver el consumo de energía de los núcleos. Y a plena carga, obtuvimos resultados interesantes:

Un elemento clave en este gráfico es el 1950X que se ejecuta en el DDR4-3200. Debido a que la DRAM más rápida requiere que el controlador de memoria consuma más energía, deja menos energía para los núcleos del procesador, lo que puede conducir a una frecuencia turbo más baja. Por lo tanto, si bien la memoria más rápida puede garantizar un mejor rendimiento en escenarios dependientes de la memoria, la frecuencia del kernel puede ser más baja y producir un peor rendimiento general. Esta es una observación interesante, por lo que calculamos la potencia del núcleo en 1950X en el DDR4-2400 y DDR4-3200.

En este gráfico, el número de núcleo en el eje vertical es el núcleo donde se midió la potencia, y en la horizontal, el número de núcleos que se cargaron, dos hilos a la vez.
Inicialmente, vemos que cuando dos hilos cargan el mismo núcleo, este dispositivo de un solo núcleo consume 20.77 vatios. Desde el momento en que se cargan la mitad de los núcleos del chip, el indicador cae a 19 vatios, luego a 17 vatios, 16 vatios y hasta 11 vatios. Como vemos, al cargar 8 núcleos, los núcleos mismos consumen 89 vatios, y si sumamos el consumo del controlador DRAM, el resultado será ciertamente mayor que el del procesador Ryzen. Sin embargo, a medida que cargamos más de 10 núcleos, sucede algo extraño: el consumo de energía total de los núcleos cae de 120 vatios a 116 vatios y a 102 vatios cuando se están ejecutando 24 subprocesos. Esto indica que la segunda capa de la matriz de silicio consume menos energía por núcleo. Luego, el consumo aumenta nuevamente, con un chip completamente cargado que le da a cada núcleo unos 8,2 vatios.
Cambiar a la memoria DDR4-3200 muestra un escenario similar:

Primero, un núcleo recibe hasta 21 vatios, y luego, a medida que se cargan nuevos núcleos, en alrededor de 4 núcleos / 8 hilos, observamos menos consumo: 15 vatios por núcleo en DDR4-3200 (en comparación con 16 vatios por núcleo en DDR4-2400). Continuando, observamos una ligera fluctuación a 24-26 flujos, y como resultado, a plena carga, el consumo de 114 W en todos los núcleos, que es 20 W menos que en DDR4-2400.
No todos los datos para el Modo Juego se obtuvieron correctamente, por lo que no nos atreveremos a sacar conclusiones profundas de los resultados, aunque vale la pena hacer un comentario interesante. En el modo de juego, cuando el sistema requiere una pequeña cantidad de subprocesos, digamos, de 2 a 8, ya que SMT está deshabilitado, estos subprocesos deben ejecutarse en CCX diferentes. En el modo Creador, estas transmisiones se agrupan en 1-4 núcleos en un CCX y consumen menos energía. Para DDR4-2400, esto significa 65 vatios en modo Creador para 8 hilos (4 núcleos) en comparación con 89 vatios en modo Juego para 8 núcleos activos.
20. Análisis del modo creador y el modo juego
Como se indica en la página 3 de esta revisión, AMD ofrece dos modos: el modo Creador con todos los núcleos activados y la arquitectura de acceso uniforme a la memoria (UMA), y el modo Juego, donde una de las matrices está desactivada y la arquitectura se ajusta a la arquitectura de memoria no uniforme (NUMA) . La idea es que en el modo Creador tenga todas las transmisiones y el ancho de banda a su disposición, mientras que el Modo Juego se enfoca en la compatibilidad con juegos que no están listos para funcionar con tantos núcleos, al tiempo que aumenta la velocidad de transferencia de datos a la memoria y desde el núcleo al núcleo, y manteniendo flujos dentro de la misma capa de silicio.
Ambos métodos tienen sus lados positivo y negativo. Y aunque se pueden cambiar presionando un botón en Ryzen Master y luego reiniciando, la mayoría de los usuarios que estén interesados en esta configuración probablemente elegirán el modo deseado una vez y se olvidarán de él (y aquí, tenga en cuenta que si el BIOS se reinicia, entonces la configuración también. ..)

21. Conclusión
En esta revisión, examinamos varios temas importantes con respecto a los procesadores con una gran cantidad de núcleos: potencia, frecuencia y "alimentar a la bestia". Iniciar el procesador es como una dieta inversa: debe poner la mayor cantidad de datos posible para obtener al menos algo en la salida y comprender lo que está oculto "bajo el capó".
AMD e Intel adoptan diferentes enfoques para lograr el objetivo. Vemos una solución de matriz múltiple versus una solución monolítica. Complejos de kernel e Infinity Fabric vs. mesh basados en MoDe-X. Acceso unificado a la memoria versus acceso desigual a la memoria. Ambos luchan por la alta frecuencia y el bajo consumo de energía. AMD admite ECC y más carriles PCIe, mientras que Intel proporciona un conjunto de chips más completo e instrucciones especiales para el AVX-512. Ambos competidores están luchando por el mercado de prosumidores y estaciones de trabajo de alta gama, lo que contribuye a los escenarios de multitarea de alto rendimiento como clave para desbloquear el potencial de sus procesadores.

Esto es lo que vemos en las especificaciones: en comparación con el Core i9-7900X, el AMD Ryzen Threadripper 1950X tiene 6 núcleos más, más 16 líneas PCIe adicionales y soporte ECC por el mismo precio. En comparación con el próximo Core i9-7960X de 16 núcleos, Threadripper 1950X todavía tiene una ventaja: 16 líneas PCIe, soporte ECC, mucho más barato que su competidor.
El procesador 1920X ofrece al usuario más núcleos, soporte ECC y más del doble de la cantidad de carriles PCIe en comparación con el Core i7-7820X por una diferencia de $ 100. En pocas palabras, si hay hardware que requiere carriles PCIe, AMD tiene algo que ofrecer.

En cuanto a las pruebas de rendimiento, existen varios ángulos para describir nuestros resultados. AMD todavía está rezagado cuando se trata de IPC sin procesar, pero muestra resultados decentes en frecuencia. Intel aún gana en tareas de subproceso único, especialmente aquellas que dependen del retraso de DRAM. AMD aparece cuando la tarea requiere hilos serios, a menudo la asignación de memoria no es tan problemática como podría parecer. Si el usuario tiene una carga de trabajo escalable, AMD le dará al kernel para permitirle escalar lo más ancho posible.

Aunque el diseño Threadripper puede ser más adecuado para tareas de trabajo con mucha carga, su alta frecuencia en comparación con Ryzen 7 significa que los juegos se convertirán en parte de la "ecuación". En su modo creativo predeterminado, el rendimiento de juego de Threadripper está en el medio en el mejor de los casos: muy pocos juegos pueden usar todas estas transmisiones, y la demora DRAM variable significa que los núcleos a veces, en términos generales, tropiezan entre sí, tratando de "hablar" y predecir cuándo El trabajo estará hecho. Para resolver este problema, AMD ofrece un modo de juego que reduce la cantidad de núcleos y enfoca la asignación de memoria en DRAM más cercana al núcleo (en detrimento del ancho de banda máximo de DRAM). Esto tiene el mayor impacto en la velocidad de fotogramas mínima, y no en el FPS promedio y afecta 1080p más que 4K, lo que puede ser lo contrario de las expectativas de un jugador exclusivo. El modo de juego no afecta a algunos juegos, mientras que en otros puede abrir nuevas posibilidades.
Si tomara y dijera que los procesadores Threadripper no son, en general, procesadores, esto irritaría a la audiencia técnica. La respuesta más correcta no es el mejor procesador de juegos. Pero AMD cubre todo esto desde el otro lado: el procesador permite al usuario reproducir, transmitir, mirar y procesar todo al mismo tiempo.
Tendrá que hacer mucho e inmediatamente para llenar 16 núcleos al máximo, lo que significa que para aquellos que hacen esto, AMD es un posible ganador. Para aquellos que necesitan ancho de banda hardcore, transcodificación, decodificación; renderizar como Blender, Cinema 4D o ray tracing es un excelente procesador. Para los propietarios de varias GPU o fanáticos del almacenamiento múltiple, o para aquellos que desean exprimir seis FPGA PCIe 3.0 x8 en el sistema, AMD ofrece un buen producto.

Por otro lado, no importa cuán geniales se vean los 16 núcleos en un procesador de consumo (y en este sentido, todo Threadripper se ve genial, al estilo de los años 90), los hilos Threadripper están lejos de ser siempre útiles en cargas de consumo. Solo unas pocas cargas de trabajo conocidas pueden saturar completamente el chip: la codificación de video es el mejor ejemplo. El resto simplemente no puede usar más que unos pocos hilos. Este hecho se debe en gran parte al hecho de que en los últimos 8 años, los chips de cuatro núcleos de Intel fueron un ejemplo de procesadores de consumo de alto rendimiento. Sin embargo, la molesta ley de Amdahl siempre está cerca, y el número de núcleos en los procesadores continúa creciendo.
Aquí hay un factor impredecible: esta es el área donde AMD es pionera: la distribución desigual de los núcleos. NUMA nunca ha estado orientado al cliente hasta ahora, razón por la cual AMD se enfrenta a los problemas discutidos en nuestra revisión.
La presencia de varios modos es una opción muy inteligente, especialmente porque hay mucho software que no conoce NUMA, pero puede cargar bien la CPU si NUMA se deduce de la ecuación y el procesador se considera como un dispositivo completamente monolítico. Sin embargo, algo desagradable es el hecho de que los modos de cambio requieren un reinicio; Puede obtener un buen retorno cambiando de modo, pero esto requerirá un movimiento adicional. A la larga, el código habilitado para NUMA eliminará este problema y usará automáticamente la memoria con la menor latencia. Pero incluso en este caso, AMD creó no solo una solución, sino también un problema, ya que incluso en la versión ideal, NUMA creará una serie de problemas de programación, y es poco probable que cada programa pueda usarlo correctamente en el futuro.
Dicho esto, un procesador con NUMA es actualmente algo redundante en el espacio del consumidor. Es muy bueno para ciertas cargas extremas, pero no tan equilibrado como Ryzen. Desechando el exceso, esto significa que Threadripper no siempre da un aumento notable en el rendimiento en comparación con Ryzen. Y esta no es una característica exclusiva de AMD: durante mucho tiempo, los productos Intel HEDT requirieron elegir entre la cantidad de núcleos y el rendimiento de nivel superior de un solo subproceso, pero calcular el rendimiento de la CPU se volvió aún más difícil con Threadripper. Hay dificultades para escalar un procesador a tantos núcleos, y Threadripper lleva esta carga. Por lo tanto, para los consumidores (y este es el mercado al que apunta el procesador), es importante, como nunca antes, considerar sus cargas de trabajo planificadas. ¿Necesita una codificación de freno de mano más rápida o un juego más fluido? ¿Puedes lanzar suficientes núcleos a Threadripper para mantener a la bestia ocupada, o solo ocasionalmente necesitas más que los 8 núcleos Ryzen existentes?

AMD prometió que el socket vivirá durante al menos dos generaciones, por lo que la serie Threadripper 2000, cuando aparezca, debería aparecer inmediatamente después de actualizar el BIOS. Curiosamente, dado el tamaño del zócalo y la configuración de la matriz, AMD puede convertir fácilmente estos dos paquetes de silicio "muertos" en paquetes de silicio "reales" y ofrecer 32 núcleos. (Aunque estos núcleos adicionales son un cuello de botella en los problemas de velocidad de acceso).
Esta es la guerra de los núcleos. Nos acercamos al primer chip que puede hacer que Kessel ejecute menos de doce parsecs (refiriéndose a Star Wars - aprox. Transl.)
Como un anuncio publicitario. ¡En vísperas de las vacaciones de invierno, las promociones son aún más relevantes! ¡Date prisa para aprovechar la oferta de Año Nuevo y obtén un descuento del 25% en el primer pago al realizar el pedido por 3 o 6 meses!
¡Estos no son solo servidores virtuales! Estos son VPS (KVM) con unidades dedicadas, que no pueden ser peores que los servidores dedicados, y en la mayoría de los casos, ¡mejor!
Fabricamos VPS (KVM) con unidades dedicadas en los Países Bajos y los EE . UU. (Configuraciones de VPS (KVM) - E5-2650v4 (6 núcleos) / 10GB DDR4 / 240GB SSD o 4TB HDD / 1Gbps 10TB disponibles a un precio excepcionalmente bajo - desde $ 29 / mes , las opciones con RAID1 y RAID10 están disponibles) , ¡no pierda la oportunidad de hacer un pedido de un nuevo tipo de servidor virtual, donde todos los recursos le pertenecen, como en uno dedicado, y el precio es mucho más bajo, con un hardware mucho más productivo!
Cómo construir la infraestructura del edificio. clase utilizando servidores Dell R730xd E5-2650 v4 que cuestan 9,000 euros por un centavo? Dell R730xd 2 veces más barato? Solo tenemos
2 x Intel Dodeca-Core Xeon E5-2650v4 128GB DDR4 6x480GB SSD 1Gbps 100 TV desde $ 249 en los Países Bajos y los EE. UU.