Más café, menos cafeína: Intel 9th ​​Gen (parte 2)

Parte 1Parte 2Parte 3Parte 4

Pruebas del sistema



La sección "Pruebas del sistema" se centra en las pruebas en condiciones reales a las que se enfrenta el consumidor, con un ligero sesgo en el rendimiento. En esta sección, veremos el tiempo de carga de la aplicación, el procesamiento de imágenes, la física simple, la emulación, el modelado neuronal, los cálculos optimizados y el desarrollo de modelos tridimensionales utilizando un software fácilmente accesible y personalizable. Aunque algunas de las pruebas son más fáciles de superponer con las capacidades de paquetes grandes como PCMark (publicamos estos valores en la sección de pruebas de la oficina), vale la pena considerar varias perspectivas. En todas las pruebas, explicaremos en detalle qué se está probando y cómo exactamente estamos probando.

Descarga de la aplicación: GIMP 2.10.4


Uno de los aspectos más importantes de la experiencia del usuario y el flujo de trabajo es la velocidad del sistema. Una buena prueba aquí es verificar los tiempos de carga de la aplicación. La mayoría de los programas en estos días, cuando se almacenan en un SSD, se descargan casi al instante, pero algunas herramientas de oficina requieren la carga previa de activos antes de que estén listas para funcionar. La mayoría de los sistemas operativos también usan el almacenamiento en caché, por lo que cuando cierto software se descarga con frecuencia (navegador web, herramientas de oficina), se puede inicializar mucho más rápido.

En el conjunto de pruebas anterior, verificamos cuánto tiempo tomaría cargar un PDF grande en Adobe Acrobat. Desafortunadamente, esta prueba fue una pesadilla de programación, y se negó a actualizar a Win10 RS3 sin luchar. Mientras tanto, descubrimos una aplicación que puede automatizar esta prueba, se decidió utilizar GIMP, una aplicación de edición de fotos popular y gratuita. Este es un editor de código abierto, la principal alternativa a Adobe Photoshop. Lo configuramos para descargar una plantilla de diseño grande de 50 MB de tamaño, realizamos la carga 10 veces con un intervalo de 10 segundos entre ellas. Debido al almacenamiento en caché, los primeros 3-5 resultados suelen ser más lentos que el resto, y el tiempo de almacenamiento en caché puede ser inconsistente, por lo que tomamos el promedio de los últimos cinco resultados para mostrar el procesamiento de la CPU durante la carga en caché.



La carga de aplicaciones, como regla, se limita a un solo hilo, pero es obvio que en algún momento se limita a los recursos del núcleo. Al tener acceso a más recursos por transmisión (en un entorno sin HT), los procesadores 8C / 8T y 6C / 6T están por delante de ambos procesadores de 5.0 GHz en nuestras pruebas.

FCAT: procesamiento de imágenes


El software FCAT fue diseñado para detectar micro-sticks, cuadros caídos y ejecutar pruebas gráficas cuando dos tarjetas de video se combinan para representar una escena. Debido a los motores de juego y los controladores de gráficos, no todas las combinaciones de GPU funcionaron perfectamente, como resultado de lo cual el software capturó colores para cada cuadro renderizado y realizó dinámicamente la grabación de datos RAW utilizando un dispositivo de captura de video.



El software FCAT acepta el video grabado, en nuestro caso son 90 segundos 1440p del juego Rise of the Tomb Raider, y convierte los datos de color en datos de tiempo de cuadro, por lo que el sistema puede mostrar la velocidad de cuadro "observada" y correlacionar con el consumo de energía de los aceleradores de video. Esta prueba, debido a la rapidez con que se completó, es de un solo subproceso. Comenzamos el proceso y, como resultado, obtenemos el tiempo de finalización.



FCAT es otro escenario limitado por el rendimiento de un solo subproceso, y parece que los nuevos procesadores de novena generación funcionan muy bien aquí. 9700K y 9900K dieron el mismo tiempo con una diferencia de milisegundos.

Movimiento de partículas 3D v2.1: movimiento browniano


Nuestra prueba 3DPM es un punto de referencia personalizado diseñado para modelar seis algoritmos diferentes para mover partículas en un espacio tridimensional. Los algoritmos se desarrollaron como parte de mi tesis de doctorado y, en última instancia, funcionan mejor en la GPU, y dan una buena idea de cómo las secuencias de comandos son interpretadas por varias microarquitecturas.

La parte clave de los algoritmos es la generación de números aleatorios: utilizamos una generación relativamente rápida, que completa la implementación de cadenas de dependencias en el código. La actualización principal en comparación con la primera versión primitiva de este código es que se resolvió el problema False Sharing en cachés, que era el principal cuello de botella. También estamos considerando aplicar las versiones AVX2 y AVX512 de esta prueba para futuras revisiones.



Para esta prueba, ejecutamos un conjunto de partículas de stock utilizando seis algoritmos diferentes, en 20 segundos, con pausas de 10 segundos, e informamos la velocidad total de partículas en millones de operaciones (movimientos) por segundo.



Basado en el código que no es AVX, el 9900K muestra un IPC y frecuencias ligeramente mejores en comparación con el R7 2700X, aunque en realidad este no es un salto porcentual tan grande como podríamos esperar. Los procesadores sin HT pierden en esta prueba.

Pero cuando usamos el AVX2 / AVX512, los procesadores Skylake-X se encuentran en su elemento. El 9900K ahora es significativamente superior al R7 2700X, incluso más de lo que esperábamos, el Core i7-9700K también está por delante.

Dolphin 5.0: emulación de consola


Una de las pruebas solicitadas populares en nuestro paquete es la emulación de consola. La capacidad de seleccionar un juego de un sistema desactualizado y ejecutarlo es muy atractivo y depende de los esfuerzos del emulador: se requiere un sistema x86 mucho más potente para poder emular con precisión una consola antigua que no sea x86. Especialmente si el código para esta consola se realizó teniendo en cuenta algunos defectos físicos y errores de hardware.

Para nuestra prueba, utilizamos el popular software de emulación Dolphin, ejecutamos un proyecto informático para determinar con qué precisión nuestros procesadores pueden emular la consola. En esta prueba, la emulación de Nintendo Wii durará unos 1050 segundos.



Dolphin es otro escenario limitado por el rendimiento de un solo hilo, razón por la cual los procesadores Intel han estado históricamente a la cabeza. Aquí, el 9900K sobrepasa al 9700K por solo un segundo.

DigiCortex 1.20: Modelando el cerebro de una babosa marina


Este punto de referencia se diseñó originalmente para modelar y visualizar la actividad de las neuronas y las sinapsis en el cerebro. El software viene con varios modos predefinidos, elegimos un pequeño punto de referencia que simula un cerebro de 32 mil neuronas / 1.8 mil millones de sinapsis, que es equivalente al cerebro de una babosa de mar.



Informamos los resultados de la prueba como una oportunidad para emular datos en tiempo real, por lo que cualquier resultado por encima de la "unidad" es adecuado para la operación en tiempo real. De los dos modos, el modo "sin inicio de sinapsis", que es difícil para DRAM, y el modo "con inicio de sinapsis", en el que se carga el procesador, seleccionamos el último. A pesar de nuestra elección, la prueba todavía se ve afectada por la velocidad DRAM.



DigiCortex depende en gran medida del rendimiento del procesador y del ancho de banda de la memoria, pero parece que el Ryzen de 6 núcleos puede competir fácilmente con el 9900K de 8 núcleos. El 8700K / 8086K parece funcionar mejor con esta prueba.

y-Cruncher v0.7.6: Cálculos optimizados para microarquitectura


Una vez escuché sobre y-Cruncher como una herramienta para ayudarte a calcular varias constantes matemáticas. Pero después de que comencé a hablar con su desarrollador, Alex Yee, un investigador de NWU y ahora un desarrollador de optimización de software, me di cuenta de que optimizó el software de una manera increíble para obtener un mejor rendimiento. ¡Naturalmente, cualquier simulación que tarde más de 20 días se beneficiará de un aumento del 1% en la productividad! Alex comenzó a trabajar con y-Cruncher como un proyecto en la escuela secundaria, pero ahora el proyecto está actualizado, Alex trabaja constantemente para aprovechar los últimos conjuntos de instrucciones, incluso antes de que estén disponibles a nivel de hardware.

Para nuestra prueba, ejecutamos y-Cruncher v0.7.6 a través de todas las variantes optimizadas posibles de cálculos binarios, de un solo subproceso y de subprocesos múltiples, incluidos los archivos binarios optimizados para AVX-512. La prueba consiste en calcular 250 millones de caracteres del número Pi, y usamos versiones de subprocesamiento único y multiproceso.





A medida que el y-cruncher aprovecha el AVX2 / AVX512, vemos que los procesadores Skylake-X se están yendo nuevamente a su acogedor mundo. En modo de subprocesos múltiples, el 9900K / 9700K requiere 8 núcleos para superar al procesador de 6 núcleos que admite el AVX512.

Agisoft Photoscan 1.3.3: Convertir imagen 2D a modelo 3D


Uno de los ISV con los que hemos estado trabajando durante varios años es Agisoft. La campaña está desarrollando un software llamado PhotoScan, que convierte una serie de imágenes 2D en un modelo 3D. Esta es una herramienta importante en el desarrollo y archivo de modelos, y se basa en una serie de algoritmos de subprocesos múltiples y múltiples subprocesos para moverse de un lado del cálculo al otro.



En nuestra prueba, tomamos la versión de software 1.3.3 con un gran conjunto de datos: fotos de 84 x 18 megapíxeles. Ejecutamos la prueba de acuerdo con un conjunto de algoritmos bastante rápido, pero aún más riguroso que nuestra prueba de 2017. Como resultado, informamos el tiempo total de finalización del proceso.



Photoscan es una tarea que aprovecha al máximo el alto rendimiento y el rendimiento de un solo subproceso, en cuyo caso la presencia de HT es una carga.

Pruebas de renderizado


En un entorno profesional, la representación es a menudo una preocupación principal para las cargas de trabajo del procesador. Se utiliza en varios formatos: desde renderizado 3D hasta rasterización, en tareas como juegos o trazado de rayos, y utiliza la capacidad del software para gestionar mallas, texturas, colisiones, alias y física (en animación). La mayoría de los procesadores ofrecen código para la CPU, mientras que algunos usan GPU y eligen entornos que usan FPGA o ASIC especializados. Sin embargo, para grandes estudios, los procesadores siguen siendo el hardware principal.

Corona 1.3: Renderizado de rendimiento


Un procesador mejorado optimizado para el rendimiento de software como 3ds Max y Cinema 4D, la prueba Corona representa una escena generada de la versión 1.3 estándar. Por lo general, la implementación del punto de referencia de la GUI muestra el proceso de construcción de la escena y permite al usuario ver el resultado como "tiempo para completar".



Contactamos al desarrollador que nos dio la versión de la línea de comando de la prueba. Proporciona una conclusión directa de los resultados. En lugar de informar el momento en que se construyó la escena, informamos el número promedio de rayos por segundo durante seis carreras, ya que la proporción de acciones completadas a unidades de tiempo es visualmente más fácil de entender.



Corona es una prueba totalmente multiproceso, por lo que los procesadores sin HT están un poco atrasados. El Core i9-9900K despega, superando a los componentes de 8 núcleos de AMD con un margen del 25 por ciento y solo superado por el Threadripper de 12 núcleos.

Blender 2.79b: Suite de creación 3D


Una herramienta de renderizado de alta gama, Blender es un producto de código abierto con muchos ajustes y configuraciones y es utilizado por muchos estudios de animación de alta gama en todo el mundo. La organización lanzó recientemente un conjunto de pruebas de Blender, un par de semanas después de que decidimos reducir el uso de la prueba de Blender en nuestro nuevo paquete, pero una nueva prueba puede tomar más de una hora. Para obtener nuestros resultados, ejecutamos una de las subpruebas de este paquete a través de la línea de comandos: la escena estándar "bmw27" en el modo "CPU only", y medimos el tiempo de finalización de la representación.



La licuadora tiene una mezcla ecléctica de requisitos, desde el ancho de banda de la memoria hasta el rendimiento sin procesar, pero, como en Corona, los procesadores sin HT están un poco atrasados. La alta frecuencia 9900K lo eleva por encima de 10C Skylake-X y AMD 2700X, pero no más de 1920X.

LuxMark v3.1: LuxRender a través de varias rutas de código


Como se indicó anteriormente, hay muchas formas diferentes de procesar los datos de representación: CPU, GPU, Acelerador y otros. Además, hay muchos marcos y API en los que puede programar, dependiendo de cómo se utilizará el software. LuxMark, un punto de referencia desarrollado utilizando el motor LuxRender, ofrece varias escenas y API diferentes.


tomado de la versión de Linux de LuxMark

En nuestra prueba, ejecutamos una simple escena "Ball" usando código C ++ y OpenCL, pero en modo CPU. Esta escena comienza con una representación aproximada y mejora lentamente la calidad en el transcurso de dos minutos, dando el resultado final en lo que se puede llamar "kilo por segundo promedio".





POV-Ray 3.7.1: trazado de rayos


El motor de trazado de rayos Persistence of Vision es otra herramienta de evaluación comparativa bien conocida que entró en hibernación durante un tiempo hasta que AMD lanzó sus procesadores Zen cuando de repente Intel y AMD comenzaron a introducir código en la rama principal de un proyecto de código abierto. Para nuestra prueba, utilizamos la prueba integrada para todos los núcleos, llamada desde la línea de comandos.



Pruebas de oficina


El conjunto de pruebas de Office está diseñado para enfocarse en más puntos de referencia estándar de la industria que se centran en los flujos de trabajo de la oficina. Estas son más pruebas sintéticas, pero también probamos el rendimiento del compilador en esta sección. Para los usuarios que necesitan evaluar el equipo en su conjunto, estos suelen ser los criterios más importantes.

PCMark 10: estándar de la industria


Futuremark, ahora conocido como UL, ha estado desarrollando pruebas que se han convertido en estándares de la industria durante dos décadas. El último conjunto de pruebas del sistema es PCMark 10, donde se mejoran varias pruebas en comparación con PCMark 8, y se presta más atención a OpenCL, específicamente en casos como la transmisión de video.

PCMark divide sus calificaciones en aproximadamente 14 áreas diferentes, que incluyen el lanzamiento de aplicaciones, páginas web, hojas de cálculo, edición de fotos, renderizado, videoconferencia y física. Publicamos todos estos datos en nuestra base de datos de Bench, pero el puntaje general es un indicador clave para la revisión actual.



Aquí, donde se mezclan muchas pruebas, los nuevos procesadores Intel ocupan las tres primeras posiciones, en orden. Incluso el i5-9600K va por delante del i7-8086K.

Compilación de cromo: Windows VC ++ compilando Chrome 56


Una gran cantidad de lectores AnandTech son ingenieros de software que observan cómo funciona el hardware. Aunque compilar el kernel de Linux es "estándar" para los revisores que a menudo compilan, nuestra prueba es un poco más diversa: utilizamos las instrucciones de Windows para compilar Chrome, en particular, la compilación de Chrome el 56 de marzo de 2017, como era cuando creamos la prueba. Google da instrucciones bastante detalladas sobre cómo compilar en Windows después de descargar 400,000 archivos del repositorio.



En nuestra prueba, siguiendo las instrucciones de Google, utilizamos el compilador MSVC y ninja para controlar la compilación. Como es de esperar, esta es una prueba con subprocesos múltiples variables y con requisitos de DRAM variables que se benefician de cachés más rápidos. Los resultados obtenidos en nuestra prueba son el tiempo dedicado a la compilación, que convertimos a la cantidad de compilaciones por día.

El rendimiento de alta frecuencia de un turbo completo parece haber funcionado bien en nuestra prueba de compilación.

3DMark Physics: física informática en juegos


Junto con PCMark, hay un punto de referencia 3DMark, Futuremark (UL), un conjunto de pruebas de juego. Cada prueba de juego consta de una o dos escenas que son pesadas para la GPU, así como una prueba física, dependiendo de cuándo se escribió la prueba y a qué plataforma apunta. Los temas principales, en dificultad creciente, son Ice Storm, Cloud Gate, Sky Diver, Fire Strike y Time Spy.

Algunas de las subpruebas ofrecen otras opciones, como Ice Storm Unlimited (diseñado para plataformas móviles con renderizado fuera de pantalla) o Fire Strike Ultra (diseñado para sistemas 4K de alto rendimiento con muchas características adicionales). Vale la pena señalar que Time Spy actualmente tiene el modo AVX-512 (que podemos usar en el futuro).

En cuanto a nuestras pruebas, enviamos los resultados de cada prueba física a Bench, pero para la revisión nos atenemos a los resultados de las escenas más exigentes: Ice Storm Unlimited, Cloud Gate, Sky Diver, Fire Strike Ultra y Time Spy.











La prueba anterior de Ice Storm no le gustó realmente el nuevo Core i9-9900K, empujándolo detrás del R7 1800X. Para pruebas más modernas orientadas a PC, gana 9900K. La falta de HT impide que otros dos procesadores en la línea muestren resultados altos.

GeekBench4: Prueba sintética


Una herramienta común para pruebas multiplataforma en dispositivos móviles, PC y Mac, GeekBench 4 es la prueba sintética perfecta de un sistema que utiliza una variedad de algoritmos que requieren un ancho de banda máximo. Las pruebas incluyen cifrado, compresión, transformación rápida de Fourier, operaciones de memoria, física del cuerpo n, operaciones matriciales, manipulación de histogramas y análisis HTML.





Incluyo esta prueba debido a la popularidad de la consulta, aunque los resultados son muy sintéticos. Muchos usuarios a menudo otorgan gran importancia a sus resultados debido al hecho de que se compiló en diferentes plataformas (aunque con diferentes compiladores).
Registramos las calificaciones de las principales subpruebas (Crypto, Integer, Floating Point, Memory) en nuestra base de datos de resultados de las pruebas, pero para la revisión publicamos solo resultados generales de subprocesos múltiples y subprocesos múltiples.

Pruebas de codificación


, , . , , , , , , . , , .

Handbrake 1.1.0:


, Handbrake — , , , . . , AVX-512 OpenCL . , , CPU, .

Handbrake , - Logitech C920 1080p60 ( , ). . :

  • 720p60 at 6000 kbps constant bit rate, fast setting, high profile
  • 1080p60 at 3500 kbps constant bit rate, faster setting, main profile
  • 1080p60 HEVC at 3500 kbps variable bit rate, fast setting, main profile







7-zip v1805:


/ 7-zip , . , . .







, : , . , , Windows Scheduler . , .

WinRAR 5.60b3:


, WinRAR. . , right-click Windows . , , 30 60- 2000 -, .



WinRAR , , 10 , , .

AES:


, , . Windows BitLocker . AES discontinued TrueCrypt , .

, , — AES / , . AES , AVX-512.



-


low-end , small form factor , -, , . - , , - . , ( ) . , - : -, , . - , , , .

, .

WebXPRT 3: - ,


, XPRT, Principled Technologies, -, , , «3». ( , ) : , , , , HTML5, , .



, . , .

WebXPRT 2015: HTML5 Javascript Web UX


WebXPRT — 2015 , - , . - , , - , . - . , , , . — , . « », .



WebXPRT3, , . , .

Speedometer 2: Javascript Frameworks


- — Speedometer 2, javascript, : , , . , , , -.

«rpm», . .



Google Octane 2.0: Core Web Compute


- , , — Octane Google. 2.0 , , , , , — .

, . .



Mozilla Kraken 1.1: Core Web Compute


, Octane, Kraken, Mozilla. , , . , Kraken , , .

, . , .



3DPM v1: 3DPM v2.1


«» — 3DPM. , , , ( ). , , ( 4 , ; 5 – ).
(-O2, -fp: fast): OpenMP . , false sharing . , , .





x264 HD 3.0:


Esta prueba de transcodificación es muy antigua; Anandtech la utilizó en los días de los procesadores Pentium 4 y Athlon II. En él, el video estandarizado de 720p está codificado con doble conversión, y el punto de referencia muestra fotogramas por segundo de cada pase. La prueba es de un solo subproceso, y en algunas arquitecturas nos topamos con la restricción de IPC: instrucciones por reloj.





Gracias por quedarte con nosotros. ¿Te gustan nuestros artículos? ¿Quieres ver más materiales interesantes? Apóyenos haciendo un pedido o recomendándolo a sus amigos, un descuento del 30% para los usuarios de Habr en un análogo único de servidores de nivel de entrada que inventamos para usted: toda la verdad sobre VPS (KVM) E5-2650 v4 (6 núcleos) 10GB DDR4 240GB SSD 1Gbps de $ 20 o cómo dividir el servidor? (las opciones están disponibles con RAID1 y RAID10, hasta 24 núcleos y hasta 40GB DDR4).

VPS (KVM) E5-2650 v4 (6 núcleos) 10GB DDR4 240GB SSD 1Gbps hasta el 1 de enero de forma gratuita si se paga por un período de seis meses, puede ordenar aquí .

Dell R730xd 2 veces más barato? Solo tenemos 2 x Intel Dodeca-Core Xeon E5-2650v4 128GB DDR4 6x480GB SSD 1Gbps 100 TV desde $ 249 en los Países Bajos y los EE. UU. Lea sobre Cómo construir un edificio de infraestructura. clase utilizando servidores Dell R730xd E5-2650 v4 que cuestan 9,000 euros por un centavo?

Source: https://habr.com/ru/post/es431158/


All Articles