Parte 1 →
Parte 2 →
Parte 3 →
Parte 4 →
Parte 5Pruebas HEDT: pruebas del sistema
La sección "Pruebas del sistema" se centra en las pruebas en condiciones reales a las que se enfrenta el consumidor. En esta sección, analizamos los tiempos de carga de aplicaciones, el procesamiento de imágenes, la física simple, la emulación, el modelado neuronal, la informática optimizada y el desarrollo de modelos tridimensionales, utilizando un software fácilmente accesible y personalizable. Aunque algunas de las pruebas son más fáciles de superponer con las capacidades de paquetes grandes como PCMark (publicamos estos valores en la sección de pruebas de la oficina), vale la pena considerar varias perspectivas. En todas las pruebas, explicaremos en detalle qué se está probando exactamente y cómo realizamos las pruebas.
Descarga de la aplicación: GIMP 2.10.4
Uno de los aspectos más importantes de la experiencia del usuario y el flujo de trabajo es la velocidad del sistema. Una buena prueba en este caso es verificar los tiempos de carga de la aplicación. La mayoría de los programas en estos días se almacenan en un SSD y se cargan casi al instante, pero algunas herramientas de oficina requieren la precarga de activos. La mayoría de los sistemas operativos utilizan el almacenamiento en caché, por lo que cuando cierto software se descarga con frecuencia (navegador web, herramientas de oficina), se puede inicializar mucho más rápido.
En el conjunto de pruebas anterior, verificamos cuánto tiempo llevó cargar un documento PDF grande en Adobe Acrobat. Desafortunadamente, esta prueba fue una pesadilla de programación, y se negó a cambiar a Win10 RS3 sin luchar. Mientras tanto, descubrimos una aplicación que puede automatizar esta prueba, conducirlos GIMP. GIMP es una aplicación de edición de fotos popular y gratuita, es un editor de código abierto y la principal alternativa a Adobe Photoshop. Lo configuramos para descargar una plantilla de diseño grande de 50 MB de tamaño, realizamos la carga 10 veces con un intervalo de 10 segundos entre ellas. Debido al almacenamiento en caché, los primeros 3-5 resultados son más lentos que los posteriores; el tiempo para el almacenamiento en caché puede ser inconsistente. Por lo tanto, derivamos el valor promedio de los últimos cinco resultados para mostrar el procesamiento de la CPU durante la carga en caché.

Este punto de referencia dividió a los concursantes en dos categorías: procesadores con un pequeño número de núcleos en un lado y procesadores de escritorio superiores en el otro. El 1920X y el 2950X funcionaron rápido, mientras que el Intel de 18 núcleos y el AMD de 32 núcleos fueron más lentos. Esto probablemente se deba a la diferencia en el rendimiento de un núcleo; sin embargo, sospecho que el resultado podría verse afectado por la latencia de la memoria.
FCAT: procesamiento de imágenes
El software FCAT fue diseñado para detectar micro-sticks, cuadros caídos, ejecutar pruebas gráficas cuando dos tarjetas de video se combinan para representar una escena. Debido a los motores de juego y los controladores de gráficos, no todas las combinaciones de GPU funcionaron perfectamente, como resultado de lo cual el software capturó colores para cada cuadro renderizado y realizó dinámicamente la grabación de datos RAW utilizando un dispositivo de captura de video.

El software FCAT acepta el video grabado, en nuestro caso son 90 segundos 1440p del juego Rise of the Tomb Raider, y convierte los datos de color en datos de tiempo de cuadro, por lo que el sistema puede mostrar la velocidad de cuadro "observada" y correlacionar con el consumo de energía de los aceleradores de video. Esta prueba, debido a la rapidez con que se completó, es de un solo subproceso. Comenzamos el proceso y, como resultado, obtenemos el tiempo de finalización.

Todos los sistemas de prueba funcionan aproximadamente de la misma manera, pero el rendimiento más rápido de un solo procesador de Intel lo hace más alto que otros procesadores. EPYC 7601 es el último en la lista debido a la baja frecuencia de un solo núcleo.
Movimiento de partículas 3D v2.1: movimiento browniano
Nuestra prueba 3DPM es un punto de referencia personalizado diseñado para modelar seis algoritmos diferentes para mover partículas en un espacio tridimensional. Los algoritmos se desarrollaron como parte de mi tesis de doctorado y, en última instancia, funcionan mejor en la GPU, dan una buena idea de cómo los flujos de comandos son interpretados por diferentes microarquitecturas.
La parte clave de los algoritmos es la generación de números aleatorios: utilizamos una generación relativamente rápida, que completa la implementación de cadenas de dependencias en el código. La actualización principal en comparación con la primera versión primitiva de este código: se resolvió el problema False Sharing en cachés, este era el principal cuello de botella. Estamos considerando aplicar las versiones AVX2 y AVX512 de esta prueba para futuras revisiones.
Para esta prueba, ejecutamos un conjunto de partículas utilizando seis algoritmos diferentes durante 20 segundos con pausas de 10 segundos, e informamos la velocidad total de partículas en millones de operaciones (movimientos) por segundo.

3DPM parece amar las transmisiones y la frecuencia, razón por la cual AMD ocupa los primeros cuatro lugares. Incluso el último procesador de 16 núcleos de AMD supera al procesador de 18 núcleos de Intel en esta prueba, utilizando instrucciones distintas a AVX. Es interesante ver una comparación entre 2990WX y EPYC 7601: la frecuencia adicional en el procesador del consumidor ayuda a aumentar la productividad en un 30% +.
Dolphin 5.0: emulación de consola
Una de las pruebas solicitadas populares en nuestro paquete es la emulación de consola. La capacidad de seleccionar un juego de un sistema desactualizado y ejecutarlo es muy atractivo y depende de los esfuerzos del emulador: se requiere un sistema x86 mucho más potente para poder emular con precisión una consola antigua que no sea x86. Especialmente si el código para esta consola se realizó teniendo en cuenta algunos defectos físicos y errores de hardware.
Para nuestra prueba, utilizamos el popular software de emulación Dolphin y ejecutamos un proyecto informático para determinar con qué precisión nuestros procesadores pueden emular la consola. En esta prueba, la emulación de Nintendo Wii durará unos 1050 segundos.

El rendimiento de Dolphin generalmente depende de las especificaciones de un solo subproceso, por lo que Intel está nuevamente por delante, aunque es extraño que el R7 2700X haya tomado el último lugar. Para eliminar el resultado erróneo, tengo que ejecutar esta prueba nuevamente. Sin embargo, en las partes TR de segunda generación, la frecuencia de reloj más alta de 2950X le permite superar a 2990WX en 20 segundos.
DigiCortex 1.20: modelado cerebral de moluscos
Este punto de referencia se diseñó originalmente para modelar y visualizar la actividad de las neuronas y las sinapsis en el cerebro. El software viene con varios modos predefinidos, elegimos un pequeño punto de referencia que simula un cerebro de 32 mil neuronas / 1.8 mil millones de sinapsis, que es equivalente a un cerebro de almeja.

Cualquier resultado por encima de "unidades" es adecuado para la operación en tiempo real. De los dos modos, el modo "sin inicio de sinapsis", que es difícil para DRAM, y el modo "con inicio de sinapsis", en el que se carga el procesador, seleccionamos el último. A pesar de nuestra elección, la prueba todavía se ve afectada por la velocidad DRAM.

Los procesadores de cuatro matrices con una gran cantidad de núcleos están adelante por un amplio margen, aunque el EPYC 7601 de baja frecuencia lo coloca en la lista de perdedores. Parece que la latencia adicional de la estructura de dos módulos en 2990WX no afectó demasiado los resultados, existe la sospecha de que hay un rendimiento adicional.
y-Cruncher v0.7.6: cálculos optimizados para microarquitectura
Una vez escuché sobre y-Cruncher como una herramienta para ayudar a calcular varias constantes matemáticas. Pero después de hablar con su desarrollador Alex Yee (investigador de NWU y desarrollador de optimización de software), me di cuenta de que optimizó el software de una manera increíble para obtener el mejor rendimiento. ¡Cualquier simulación que tarde más de 20 días se beneficiará de un aumento del 1% en la productividad! Alex comenzó a trabajar con y-Cruncher como un proyecto en la escuela secundaria, pero ahora el proyecto es relevante.
Para nuestra prueba, ejecutamos y-Cruncher v0.7.6 a través de todas las variantes optimizadas posibles de cálculos binarios, de un solo subproceso y de subprocesos múltiples, incluidos los archivos binarios optimizados para AVX-512. La prueba consiste en calcular 250 millones de caracteres del número Pi, utilizamos versiones de esta subproceso y subprocesos múltiples.


El software Intel está bien optimizado para las instrucciones AVX2 y AVX512, y utilizamos este conjunto de instrucciones en una prueba de subproceso único. Sin embargo, cuando cargamos nuevos núcleos y canales de memoria, ambos procesadores AMD de 32 núcleos parecen competidores dignos de Core i9, teniendo en cuenta el costo.
Agisoft Photoscan 1.3.3: Convertir imagen 2D a modelo 3D
Uno de los ISV con los que hemos estado trabajando durante varios años es Agisoft. La campaña está desarrollando un software llamado PhotoScan, que convierte una serie de imágenes 2D en un modelo 3D. Esta es una herramienta importante en el desarrollo y archivo de modelos, y se basa en una serie de algoritmos de subprocesos múltiples y múltiples subprocesos para moverse de un lado del cálculo al otro.

En nuestra prueba, tomamos la versión 1.3.3 del software con un gran conjunto de datos: fotos de 84 x 18 megapíxeles. Realizamos una prueba usando un conjunto bastante rápido de algoritmos. La prueba es aún más exigente que su antepasado de 2017. Como resultado, informamos el tiempo total de finalización del proceso.

El 2990WX se queda atrás porque tiene núcleos que no pueden acceder a la memoria lo suficientemente rápido. A modo de comparación, el EPYC 7601 con el doble del canal de memoria funciona casi 500 segundos (20% +) más rápido. Por lo tanto, si el 2990WX recibe canales de memoria adicionales, podrá encabezar esta lista.
Curiosamente, el TR 1950X evita el TR 2950X, que tiene una mejor latencia de caché y una mayor frecuencia en todos los escenarios. Por qué es así un misterio.
HEDT Benchmarks: Pruebas de renderizado
En un entorno profesional, la representación es a menudo una preocupación principal para las cargas de trabajo del procesador. Se utiliza en varios formatos: desde renderizado 3D hasta rasterización, en tareas como juegos o trazado de rayos, utiliza la capacidad del software para gestionar mallas, texturas, colisiones, alias y física (en animación). La mayoría de los procesadores ofrecen código para la CPU, mientras que algunos usan GPU y eligen entornos que usan FPGA o ASIC especializados. Para estudios grandes, los procesadores siguen siendo el hardware principal.
Corona 1.3: Renderizado de rendimiento
Un procesador mejorado optimizado para el rendimiento de software como 3ds Max y Cinema 4D, la prueba Corona representa una escena generada de la versión 1.3 estándar. Por lo general, la implementación del punto de referencia de la GUI muestra el proceso de construcción de la escena, permite al usuario ver el resultado como "tiempo para completar".

Nos pusimos en contacto con el desarrollador, nos dio una versión de la línea de comandos de la prueba, que proporciona resultados directos de los resultados. En lugar del tiempo que tomó construir la escena, informamos el número promedio de rayos por segundo durante seis carreras, porque la proporción de acciones completadas a unidades de tiempo es visualmente más fácil de entender.

Entonces, AMD rompió nuestro motor de gráficos. Porque mostramos el resultado de la prueba de Corona en haces por segundo, con un total de 12 millones, que transfiere ocho dígitos a nuestro motor, que luego trata de interpretarlo como una representación exponencial del número (1.2 x 10 ^ 7), que no puede mostrar en el gráfico . Tuvimos que convertir este gráfico a millones de haces por segundo para que el motor funcionara.
2990WX está por delante con 32 núcleos debido a su alta frecuencia, está muy por delante del procesador EPYC. EPYC y Core i9 están muy juntos, pero el TR2950X es la mitad del precio.
Blender 2.79b: Suite de creación 3D
Una herramienta de renderizado de alta gama, Blender es un producto de código abierto con muchos ajustes y configuraciones y es utilizado por muchos estudios de animación de alta gama en todo el mundo. La organización lanzó recientemente un conjunto de pruebas Blender, una nueva prueba puede tomar más de una hora. Para obtener los resultados, ejecutamos una de las subpruebas de este paquete a través de la línea de comandos: la escena estándar "bmw27" en el modo "CPU only", medimos el tiempo de finalización de la representación.

Los núcleos adicionales permiten que el 2990WX se adelante a EPYC y Core i9. 2990WX + 58% de rendimiento adicional en comparación con Core i9.
LuxMark v3.1: LuxRender a través de varias rutas de código
Hay muchas formas diferentes de manejar los datos de representación: CPU, GPU, Acelerador y otros. Además, hay muchos marcos y API. LuxMark: una referencia desarrollada con el motor LuxRender, ofrece varias escenas y API diferentes.
tomado de la versión de Linux de LuxMarkEn nuestra prueba, ejecutamos una simple escena "Ball" usando código C ++ y OpenCL, pero en modo CPU. Esta escena comienza con una representación aproximada y lentamente mejora su calidad en el transcurso de dos minutos. Tomado es la tasa promedio de la cantidad de kilo-rayos por segundo.


Por alguna razón, los procesadores Intel Skylake-X fallan en nuestras pruebas de OpenCL. En la prueba de C ++, los controladores de memoria adicionales en el procesador EPYC lo colocaron sobre TR2 y Core i9. 2990WX y Core i9 son casi iguales.
POV-Ray 3.7.1: trazado de rayos
El motor de trazado de rayos Persistence of Vision es otra herramienta de evaluación comparativa bien conocida que ha estado en hibernación durante algún tiempo hasta que AMD lanzó sus procesadores Zen. De repente, tanto Intel como AMD comenzaron a insertar código en la rama principal de un proyecto de código abierto. Para nuestra prueba, utilizamos la prueba integrada para todos los núcleos, llamada desde la línea de comandos.

Esta es otra prueba que ama los núcleos y la frecuencia, que es lo que tiene 2990WX. El 2990WX puede completar la prueba en casi 20 segundos. Tal vez es hora de una prueba incorporada más grande.
HEDT Benchmarks: Pruebas de Office
Conjunto de pruebas de Office: un conjunto de puntos de referencia estándar de la industria que se centran en los flujos de trabajo de oficina. Estas son pruebas sintéticas, + verificamos el rendimiento del compilador en esta sección. Para evaluar el equipo en su conjunto, estos criterios son importantes para los usuarios.
PCMark 10: estándar de la industria
Futuremark, ahora conocido como UL, ha estado desarrollando pruebas que han sido estándares de la industria durante más de dos décadas. El último conjunto de pruebas del sistema es PCMark 10. Aquí, en comparación con PCMark 8, se mejoran varias pruebas, se presta más atención a OpenCL, y en particular en casos como la transmisión de video.
PCMark divide sus calificaciones en aproximadamente 14 áreas diferentes, que incluyen el lanzamiento de aplicaciones, páginas web, hojas de cálculo, edición de fotos, renderizado, videoconferencia y física. Publicamos todos estos datos en nuestra base de datos de Bench. Un indicador clave para la revisión actual es el puntaje general.

Uno de los inconvenientes de PCMark es que parece recopilar todos los resultados, produciendo un valor promedio en todas las direcciones. Curiosamente, los procesadores Intel se quedan atrás, el 2950X y el 2700X están en la parte superior.
Compilación de cromo: Windows VC ++ compilando Chrome 56
Una gran cantidad de lectores AnandTech son ingenieros de software que observan cómo funciona el hardware. Compilar el kernel de Linux es "estándar" para los revisores que compilan con frecuencia. Pero nuestra prueba es un poco más diversa: utilizamos las instrucciones de Windows para compilar Chrome, en particular, la compilación de Chrome el 56 de marzo de 2017. Las instrucciones de Google sobre cómo compilar en Windows después de descargar 400,000 archivos del repositorio son bastante detalladas.
En nuestra prueba, siguiendo las instrucciones de Google, utilizamos el compilador MSVC y ninja para controlar la compilación. Como es de esperar, esta es una prueba con subprocesos múltiples variables, con requisitos variables para DRAM, que se benefician de cachés más rápidos. Los resultados de la prueba son el tiempo dedicado a la compilación, que convertimos a la cantidad de compilaciones por día.

Esta prueba es una combinación tan buena de secuencias ST, MT y memoria limitada que es realmente interesante ver el resultado final. Desafortunadamente, para nuestro nuevo paquete, los archivos de salida no se configuraron correctamente, por lo que a pesar de la finalización de la prueba, obtuvimos solo unos pocos resultados. Pero incluso esto demuestra una métrica interesante: el 2950X se adelanta con el 2990WX junto con el Core i9, pero el sistema EPYC roza los traseros debido a sus bajas frecuencias.
3DMark Physics: física informática en juegos
Junto con PCMark, hay un punto de referencia 3DMark, Futuremark (UL), un conjunto de pruebas de juego. Cada prueba de juego consta de una o dos escenas que son pesadas para la GPU, así como una prueba física, dependiendo de cuándo se escribió la prueba y a qué plataforma apunta. Los temas principales en dificultad creciente son Ice Storm, Cloud Gate, Sky Diver, Fire Strike y Time Spy.
Algunas de las subpruebas ofrecen otras opciones, como Ice Storm Unlimited o Fire Strike. Ice Storm Unlimited está diseñado para plataformas móviles con renderizado fuera de pantalla. Fire Strike Ultra está diseñado para sistemas 4K de alto rendimiento con muchas características adicionales. Vale la pena señalar que Time Spy actualmente tiene el modo AVX-512 (que podemos usar en el futuro).
En cuanto a nuestras pruebas, enviamos los resultados de cada prueba física a Bench, pero para la revisión tomamos los resultados de las escenas más exigentes: Ice Storm Unlimited, Cloud Gate, Sky Diver, Fire Strike Ultra y Time Spy,





En las pruebas de juegos, no es tan notable que la presencia de grandes procesadores con muchos núcleos no beneficie particularmente el rendimiento. La física del juego claramente prefiere el ancho de banda de la memoria. Sabemos que Time Spy no está diseñado para escalar en más de 10 núcleos, y vemos que el procesador de 10 núcleos está en primer lugar. , , .
GeekBench4:
, Mac, GeekBench 4 — , . , , , , n-, , HTML.
, . - , ( ).
(Crypto, Integer, Floating Point, Memory) , .


HEDT Benchmarks: Encoding Tests
, , . , , , , , , , . , , .
Handbrake 1.1.0:
, Handbrake — , , , . . , AVX-512 OpenCL . , , CPU, .
Handbrake , - Logitech C920 1080p60 ( , ). . :
- 720p60 at 6000 kbps constant bit rate, fast setting, high profile
- 1080p60 at 3500 kbps constant bit rate, faster setting, main profile
- 1080p60 HEVC at 3500 kbps variable bit rate, fast setting, main profile



, . Core i9, AVX2, . AMD, , , 1950X 2700X . , 2950X , , Core i9, , 1950X. 2990WX .
7-zip v1805:
/ 7-zip , . , . .
, : . , , Windows Scheduler . , .



, . , , 2990WX, , , AMD. Phoronix, Linux.
, . 32- AMD , 16- 18- .
, , . .
WinRAR 5.60b3:
, WinRAR. . , right-click Windows . , , 30 60- 2000 -, .
WinRAR , , 10 , .

, . R7 2700X AMD, — 10- Intel. , 8700K, , . AMD , 32- .
AES:
, , . Windows BitLocker Microsoft ( ). AES discontinued TrueCrypt , .
, — AES / , . AES, , AVX-512.

, . , , 2990WX . EPYC 7601 , 1950X. 2950X, , , 18- Core i9 Intel.
HEDT Benchmarks: -
low-end small form factor , -, , . - , , - . , ( ) . , - . - , , , .
, .
WebXPRT 3: - ,
, XPRT, Principled Technologies, -, , , «3». ( , ) : , , , , HTML5, , .
, . , .

WebXPRT 2015: HTML5 Javascript Web UX
WebXPRT — 2015 , - . - , , - . - . , , , . — , . « » .
WebXPRT3, , . , .

Speedometer 2: Javascript Frameworks
- — Speedometer 2, javascript, : , . , , , -.
«rpm», . .

Google Octane 2.0: Core Web Compute
Una prueba web popular durante varios años, pero ahora ya no se actualiza: Octane de Google. La versión 2.0 realiza un par de docenas de tareas relacionadas con la informática, como expresiones regulares, criptografía, trazado de rayos, emulación y el cálculo de las ecuaciones de Navier-Stokes.La prueba le da a cada una de las subpruebas una evaluación y devuelve la media geométrica como resultado final. Llevamos a cabo un punto de referencia completo cuatro veces y evaluamos los resultados finales.
Mozilla Kraken 1.1: Computación web central
Incluso más viejo que Octane, aquí está Kraken, esta vez desarrollado por Mozilla. Esta es una prueba antigua que realiza una mecánica computacional relativamente uniforme, como el procesamiento de audio o el filtrado de imágenes. La prueba de Kraken está altamente optimizada y produce un resultado muy inestable, dependiendo de la versión del navegador.
El punto de referencia principal pasa por cada una de las subpruebas diez veces y devuelve el tiempo promedio de finalización de cada ciclo en milisegundos. Ejecutamos el punto de referencia completo cuatro veces, medimos el resultado promedio.

3DPM v1: una variante de 3DPM v2.1 con código nativo
La primera prueba "heredada" en el paquete es la primera versión de nuestra prueba 3DPM. Esta es la versión nativa final del código, como si hubiera sido escrita por un científico sin conocimiento de cómo funciona el hardware, los compiladores o la optimización de la computadora (como era al principio). La prueba representa una gran cantidad de modelos científicos en la naturaleza, donde obtener una respuesta es más importante que la velocidad de la informática.
En esta versión, la única optimización real estaba en los indicadores del compilador (-O2, -fp: rápido): compilación en modo de lanzamiento y habilitación de OpenMP en los principales ciclos informáticos. Los bucles no se dimensionaron para las funciones, y la desaceleración más grave es el intercambio falso en el caché. El código tiene largas cadenas de dependencias basadas en la generación de números aleatorios, lo que conduce a una disminución del rendimiento en algunas microarquitecturas informáticas.


x264 HD 3.0: prueba de transcodificación heredada
Esta prueba de transcodificación es muy antigua; Anandtech la utilizó en los días de los procesadores Pentium 4 y Athlon II. En él, el video estandarizado de 720p está codificado con doble conversión, y el punto de referencia muestra fotogramas por segundo de cada pase. La prueba es de un solo subproceso, y en algunas arquitecturas nos topamos con la restricción de IPC: instrucciones por reloj.


Gracias por quedarte con nosotros. ¿Te gustan nuestros artículos? ¿Quieres ver más materiales interesantes?
Apóyenos haciendo un pedido o recomendándolo a sus amigos, un
descuento del 30% para los usuarios de Habr en un análogo único de servidores de nivel de entrada que inventamos para usted: toda la verdad sobre VPS (KVM) E5-2650 v4 (6 núcleos) 10GB DDR4 240GB SSD 1Gbps de $ 20 o cómo dividir el servidor? (las opciones están disponibles con RAID1 y RAID10, hasta 24 núcleos y hasta 40GB DDR4).
3 meses gratis al pagar un nuevo Dell R630 por un período de seis meses -
2 x Intel Deca-Core Xeon E5-2630 v4 / 128GB DDR4 / 4x1TB HDD o 2x240GB SSD / 1Gbps 10 TB - desde $ 99.33 al mes , solo hasta el final de agosto, ordene puede estar
aquíDell R730xd 2 veces más barato? ¡Solo tenemos
2 x Intel Dodeca-Core Xeon E5-2650v4 128GB DDR4 6x480GB SSD 1Gbps 100 TV desde $ 249 en los Países Bajos y los Estados Unidos! Lea sobre
Cómo construir un edificio de infraestructura. clase utilizando servidores Dell R730xd E5-2650 v4 que cuestan 9,000 euros por un centavo?