🏇🏻 🧔🏻 ❎ El Intel Core i7-8086K (parte 2) 🍿 🎮 👨🏾‍🤝‍👨🏻

Parte 1 >> Parte 2 >> Parte 3 >> Parte 4

Pruebas del sistema de la CPU

Nuestro primer conjunto de pruebas son las pruebas generales del sistema. Este conjunto de pruebas está destinado a emular en su mayor parte lo que la gente suele hacer con la computadora, como abrir archivos grandes o procesar pequeñas pilas de datos. Esto es ligeramente diferente de nuestras pruebas de oficina, que utilizan pruebas estándar de la industria. Algunas de las pruebas aquí son relativamente nuevas e inusuales.

Procesamiento FCAT: enlace

Una de las cargas más interesantes que se ha utilizado en nuestro stand en los últimos trimestres es FCAT, una herramienta que utilizamos para medir los retrasos en los juegos debido a cuadros perdidos o perdidos. El proceso FCAT requiere la inclusión de una superposición de color en el juego, la grabación del proceso del juego y el posterior análisis del archivo de video utilizando el software apropiado. Tal software generalmente es de un solo subproceso, ya que el video está en un formato RAW primitivo, lo que implica un gran tamaño de archivo y requiere el movimiento de una gran cantidad de datos. Para nuestra prueba, tomamos un registro de 90 segundos de la prueba Rise of the Tomb Raider, que se ejecuta en la GTX 980 Ti a 1440p, que tiene un tamaño de aproximadamente 21 GB, y medimos el tiempo que lleva procesar usando la herramienta de análisis visual.

FCAT es una prueba de subproceso único, sin embargo, incluso en esta prueba, el procesador de 5.0 GHz no está en la parte superior.

Dolphin Benchmark: enlace

Muchos emuladores están conectados por el rendimiento del procesador de un solo procesador, y los informes generales tienden a sugerir que Haswell aumentará significativamente el rendimiento del emulador. Este punto de referencia lanza el programa Wii, en el que el rayo sigue una escena tridimensional compleja dentro del emulador Dolphin Wii. Los resultados de esta prueba son un indicador muy confiable de la velocidad de la emulación del procesador Dolphin, que es una tarea intensiva de un solo núcleo que utiliza la mayoría de los aspectos del procesador. Los resultados se dan en minutos, donde la propia Wii mostró un resultado de 17.53 minutos (1052 segundos).

En esta prueba, el aclamado golpe de 5.0 GHz, y el 8086K establece un récord para Dolphin.

Prueba de algoritmo de movimiento 3D v2.1: enlace

Esta es la última versión de nuestro punto de referencia 3DPM. El objetivo de 3DPM es simular algoritmos científicos parcialmente optimizados tomados directamente de mi tesis doctoral. La versión 2.1 difiere de la 2.0 en que transfiere las estructuras de partículas básicas por referencia en lugar de por valor, y reduce el número de conversiones dobles-> flotantes-> dobles realizadas por el compilador. Esto proporciona una aceleración del 25% en comparación con la versión 2.0, lo que significa nuevos datos.

En 3DPM, el 8086K se muestra a la par con el 8700K.

DigiCortex v1.20: enlace

Aunque está desactualizado durante un par de años, el software DigiCortex es un proyecto hogareño para visualizar la actividad de las neuronas y las sinapsis en el cerebro. El software viene con varios puntos de referencia, y tomamos un pequeño punto de referencia que ejecuta una simulación cerebral de 32 mil neuronas / 1.8 mil millones de sinapsis. Los resultados de la prueba indican la capacidad del sistema para emular en tiempo real, lo que significa que cualquier resultado por encima de uno es adecuado para la emulación. El punto de referencia ofrece un modo "sin emisión sináptica de neuronas", que esencialmente muestra la velocidad de DRAM y bus. Tomamos el modo de "disparo", que agrega carga de CPU a cada lanzamiento de neurona.

A pesar de la mayor frecuencia de un solo núcleo, esta prueba limitada por DRAM parece cargar otro núcleo y evitar que el 8086K alcance los 5.0 GHz.

Agisoft Photoscan 1.3.3: enlace

Photoscan permaneció en nuestro conjunto de pruebas de la versión anterior de las pruebas, pero ahora trabajamos en Windows 10, por lo que entran en juego características como Speed Shift en los últimos procesadores. El concepto de Photoscan es la conversión de muchas imágenes 2D en un modelo 3D; por lo tanto, cuanto más detalladas sean las imágenes, y cuanto más, mejor será el modelo. El algoritmo consta de cuatro etapas: varias de un solo subproceso y varias de múltiples subprocesos, y también tiene cierta dependencia del caché y la memoria. Para algunas cargas de trabajo multiproceso más diversas, las opciones como Speed Shift y XFR pueden aprovechar la espera o el tiempo de inactividad de la CPU, lo que aumenta significativamente el rendimiento de las nuevas microarquitecturas.

Agisoft tiene subprocesos múltiples variables, pero el 8086K todavía está ligeramente por detrás del 8700K.

Pruebas de renderizado de CPU

Las pruebas de representación son las favoritas de las revisiones y pruebas, reconocidas desde hace mucho tiempo, porque el código utilizado por los paquetes de representación generalmente está optimizado para exprimir cada bit de rendimiento. A veces, los programas de representación también dependen mucho de la memoria: cuando tiene muchos subprocesos que transportan toneladas de datos, la memoria de baja latencia puede ser la clave de todo. Aquí tomamos algunos paquetes de renderizado comunes para Windows 10, así como algunas pruebas nuevas e interesantes.

Corona 1.3: enlace

Corona es un paquete independiente diseñado para admitir software, como 3ds Max y Maya, con fotorrealismo mediante trazado de rayos. Es simple: diriges los rayos, obtienes los píxeles. De acuerdo, un poco más complicado, pero este punto de referencia representa una escena fija seis veces y produce resultados en términos de tiempo y la cantidad de rayos por segundo. Las tablas de referencia oficiales muestran los resultados de los usuarios en términos de tiempo, pero creo que "haces por segundo" es el mejor indicador (y, en general, los resultados donde "más significa mejor" son más fáciles de explicar). A Corona le encanta apilar hilos, por lo que los resultados dependen en gran medida del número de hilos.

Corona es una prueba completamente multiproceso y, por lo tanto, es sorprendente ver el retraso de 8086K detrás del 8700K. Esto probablemente se deba al hecho de que el sistema de prueba prestado no cumple perfectamente con nuestro estándar de prueba.

Blender 2.78: enlace

Un viejo en el mundo de las pruebas de renderizado, Blender sigue siendo una herramienta muy popular. Pudimos lanzar la carga de trabajo estándar en la versión Blender del 5 de febrero y medir el tiempo requerido para renderizar el primer fotograma de la escena. Blender es una de las herramientas de código abierto más grandes, lo que significa que tanto AMD como Intel están trabajando activamente para ayudar a mejorar la base del código, lo que puede beneficiar y dañar su propia microarquitectura.

A Blender también le encanta crear hilos, y el 8086K, como antes, va a la zaga del gemelo.

LuxMark v3.1

Como prueba sintética, LuxMark puede parecer poco confiable como herramienta de visualización, dado que se usa principalmente para probar GPU. Sin embargo, ofrece los modos estándar OpenCL y C ++. En este caso, además de comparar cada versión de la codificación de núcleos e IPC, podemos ver que los códigos C ++ y OpenCL muestran un rendimiento diferente en los mismos procesadores.

POV-Ray 3.7.1b4

Otro punto de referencia habitual en la mayoría de los kits es POV-Ray. Otro rastreador con una larga historia. Como suele suceder, durante la preparación de AMD para el lanzamiento de Ryzen, la base del código comenzó a actualizarse activamente, los desarrolladores hicieron cambios en el código y lanzaron nuevas actualizaciones. Nuestra versión para las pruebas se tomó justo antes del inicio de tales eventos, pero con el tiempo vemos que el código POV-Ray se ajusta de acuerdo con los nuevos requisitos.

Resultados casi idénticos para el 8086K y el 8700K en la prueba de POV-Ray.

Cinebench R15: enlace

La última versión de CineBench se ha convertido en uno de esos programas que se han utilizado en todas partes, en particular, como un indicador del rendimiento de un solo hilo. El alto IPC y la alta frecuencia brindan un rendimiento de subprocesamiento único, mientras que tener un buen escalado y muchos núcleos es la clave del éxito del subprocesamiento múltiple.

El 8086K recibe el título de nuevo campeón en pruebas de un solo subproceso en el CineBench R15 ST, pero está ligeramente por detrás del 8700K en las pruebas de subprocesos múltiples.

Pruebas de codificación de CPU

Uno de los elementos interesantes de los procesadores modernos es la codificación del rendimiento. Esto incluye cifrado / descifrado, así como la transcodificación de video de un formato de video a otro. En el caso del cifrado / descifrado, el rendimiento sigue siendo relevante para el cifrado de datos confidenciales "sobre la marcha", el proceso mediante el cual los dispositivos modernos suelen proporcionar seguridad de software. Recientemente, el uso de la transcodificación de video para ajustar la calidad, el tamaño del archivo y la resolución del archivo de video está experimentando un verdadero auge. Esto es necesario para ajustar el video al dispositivo del consumidor, o para transmisores de juegos que desean descargar el flujo de video codificado de la cámara en tiempo real. A medida que avanzamos hacia el video 3D en vivo, esta tarea será aún más prioritaria, y resulta que el rendimiento de ciertos algoritmos está determinado por la función de entrada / salida del contenido.

7 cremalleras 9.2

Uno de los archivadores gratuitos para evaluar el rendimiento del procesador es 7-Zip. Se ejecuta bajo una licencia de código abierto, es una herramienta rápida y fácil de usar para usuarios avanzados. Ejecutamos el modo de prueba a través de la línea de comando, realizamos cuatro ciclos y obtenemos el resultado.

Una vez más, hay una confrontación con 8700K, pero el nuevo 8086 está un poco atrasado.

WinRAR 5.40

Para el conjunto de pruebas 2017, utilizaremos la última versión de WinRAR en nuestra prueba de archivador. WinRAR en algunos aspectos es más fácil de usar que 7-Zip, por lo que decidimos incluirlo en el paquete. En lugar de utilizar el modo de referencia, como en el caso de 7-Zip, aquí tomamos un conjunto de archivos que representan una pila común (33 archivos de video de 1,37 GB, 2834 archivos más pequeños en 370 carpetas de 150 MB cada una) de formatos comprimibles e incompresibles. Los resultados que se muestran son el tiempo necesario para codificar el archivo. Debido al almacenamiento en caché de DRAM, ejecutamos la prueba 10 veces y obtenemos el valor promedio de los últimos cinco inicios cuando el punto de referencia está en un estado estable.

Y esta es otra prueba en la que el 8086K es inferior al 8700K "ilimitado".

Codificación AES

Los algoritmos que utilizan el cifrado AES se han distribuido ampliamente en todo el mundo como una herramienta de cifrado omnipresente. Sin embargo, esta es otra prueba para CPU, y las CPU modernas tienen una extensión del sistema de instrucciones AES para aumentar el rendimiento de cifrado. A menudo consideramos escalar tanto en frecuencia como en núcleos utilizando este punto de referencia. Utilizamos la última versión de TrueCrypt y la ejecutamos en modo de referencia con 1 GB de datos en DRAM. Los resultados que se muestran son el promedio de GB / s para el cifrado y descifrado.

Al codificar AES, obtuvimos literalmente los mismos resultados.

HandBrake v1.0.2 H264 y HEVC

Como se mencionó anteriormente, la transcodificación de video (codificación y decodificación) es un tema candente en términos de rendimiento, a medida que aumenta el ritmo de creación de contenido nuevo. El primer supuesto es un cambio en el estándar de formato de video, que puede ocurrir con o sin pérdida de calidad. También es posible reducir la calidad del video por el tamaño del archivo. Junto con el códec favorito de Google, VP9, hay otros dos que se usan con frecuencia: H264, el antiguo códec, está en casi todas partes y optimizado para video de 1080p, y HEVC (o H265), que tiene como objetivo proporcionar la misma calidad que H264, pero menor tamaño de archivo (o mayor calidad para el mismo tamaño). HEVC es importante porque es capaz de transmitir transmisión de video en calidad 4K, lo que significa transmitir menos bits para el mismo contenido de calidad.

El freno de mano es la herramienta de transcodificación preferida, por lo que nuestro modo de prueba cubre tres áreas.

Baja calidad / resolución de H264: aquí recodificamos un video de 640x266 H264 de 2 horas y cambiamos la codificación de Perfil principal a Perfil alto utilizando un preajuste muy rápido.

Alta calidad / resolución H264: una prueba similar, pero esta vez tomamos un archivo doble 4K de diez minutos (3840x4320) que se muestra a 60 Hz y se transcodifica de Principal a Alto utilizando un preajuste muy rápido.

Prueba HEVC: usando el mismo video en HQ, cambiamos la resolución y el códec del video original de 4K60 a H264 a 4K60 HEVC.

Pruebas de CPU Office

Los programas de oficina que utilizamos para la evaluación comparativa no son programas específicos, sino pruebas estándar de la industria, tienen peso en un entorno profesional. El propósito de estas pruebas es utilizar un conjunto de programas y métodos que un usuario de oficina común puede encontrar, como videoconferencias, edición de documentos, modelado arquitectónico, etc.

Compilación de cromo (v56)

Nuestra nueva prueba de compilación utiliza Windows 10 Pro, VS Community 2015.3 con Win10 SDK para compilar compilaciones nocturnas de Chromium. Preparamos la prueba para ensamblar a fines de marzo de 2017, y en nuestra prueba estamos lanzando una nueva compilación completa. La compilación es un ejemplo típico de una carga de trabajo con subprocesos múltiples variables: algunos procesos de compilación y enlace son lineales, mientras que otras partes son multiproceso.

Este es otro caso en el que creo que nuestro improvisado banco de pruebas jugó un papel importante, y me gustaría repetirlo más tarde en mi stand estándar. Dado que la compilación da una gran carga no solo en el procesador.

GeekBench4

Por demanda popular, GeekBench 4 ahora es parte de nuestro paquete. GB4 es una prueba sintética que utiliza algoritmos que a menudo se encuentran en cargas de trabajo de alto rendimiento, así como una serie de pruebas orientadas a la memoria. El mayor logro de GB4 es la conclusión del resultado de todas las pruebas en forma de una sola figura, que, aparentemente, gusta a sus fanáticos, aunque ese resultado no siempre es fácil de usar para comparar el rendimiento en condiciones reales.

Al igual que con CineBench, el Core i7-8086K tiene prioridad sobre la prueba sintética de subproceso único.

PCMark8: enlace

A pesar de que PCMark nació por primera vez en 2008/2009, Futuremark es compatible con PCMark8. En la escala de tareas complejas, PCMark se centra más en un bajo porcentaje de cargas de trabajo profesionales, lo que lo convierte en un buen indicador de lo que las personas consideran "trabajo de oficina". Ejecutamos el punto de referencia desde la línea de comandos en el modo "tradicional", es decir, C ++ sin OpenCL, para eliminar la tarjeta gráfica de la ecuación y centrarnos exclusivamente en el procesador. PCMark8 ofrece cargas de trabajo para el hogar, el trabajo y la creatividad, con algunas pruebas de software compartidas, mientras que otras son exclusivas de cada conjunto de pruebas.

Aquí, el 8086K finalmente supera a su hermano 8700K, aunque no por mucho.

Pruebas heredadas de CPU

Nuestras pruebas obsoletas son puntos de referencia que una vez se adelantaron a su tiempo. Algunos de ellos son estándares sintéticos en la industria, y tenemos datos de 10 años. Todos los datos aquí se han relanzado en Windows 10, y planeamos volver a varias generaciones de componentes para descubrir cómo ha evolucionado el rendimiento.

Movimiento de partículas 3D v1

3DPM es una prueba que escribimos que utiliza los algoritmos de movimiento 3D básicos utilizados en las simulaciones de movimiento brownianas y sus pruebas de velocidad. Los cálculos de punto flotante de alto rendimiento, MHz e IPC se mostrarán en la versión de subproceso único, mientras que la versión de subprocesos múltiples funciona con subprocesos y ama muchos núcleos. Esta es la versión original, escrita al estilo de un estudiante que no es informático, que codifica un algoritmo para un problema teórico. Viene sin optimizaciones no obvias que el compilador aún no realiza, como el intercambio falso.

CineBench 11.5 y 10

Cinebench es una conocida herramienta de medición de rendimiento relacionada con el software de animación MAXON Cinema 4D. Cinebench se ha optimizado durante una década y se centra solo en la potencia del procesador. Esto significa que si hay una discrepancia en las características de ancho de banda, lo más probable es que Cinebench muestre esta discrepancia. Quizás otro software no utiliza todas las herramientas disponibles para la carga del procesador, por lo que la relevancia de la prueba para el mundo real puede ser puramente académica, pero dada nuestra gran base de datos para Cinebench, es difícil ignorar una pequeña prueba de cinco minutos. En esta prueba, lanzamos la versión moderna 15, así como las antiguas 11.5 y 10 debido a nuestros datos almacenados.

x264 HD 3.0

Del mismo modo, el paquete x264 HD 3.0 que usamos aquí también se almacena para datos de regresión histórica. La última versión es 5.0.1, y codifica un video de 1080p en un archivo x264 de alta calidad. La versión 3.0 realiza la misma prueba en un archivo de 720p, y en la mayoría de los casos el rendimiento del software alcanza el límite para los procesadores de gama alta, pero aún funciona bien para el nivel medio y junior. Además, esta versión solo toma unos minutos, mientras que la última puede tomar más de 90 minutos.

Gracias por quedarte con nosotros. ¿Te gustan nuestros artículos? ¿Quieres ver más materiales interesantes? Apóyenos haciendo un pedido o recomendándolo a sus amigos, un descuento del 30% para los usuarios de Habr en un análogo único de servidores de nivel de entrada que inventamos para usted: toda la verdad sobre VPS (KVM) E5-2650 v4 (6 núcleos) 10GB DDR4 240GB SSD 1Gbps de $ 20 o cómo dividir el servidor? (las opciones están disponibles con RAID1 y RAID10, hasta 24 núcleos y hasta 40GB DDR4).

Dell R730xd 2 veces más barato? ¡Solo tenemos 2 x Intel Dodeca-Core Xeon E5-2650v4 128GB DDR4 6x480GB SSD 1Gbps 100 TV desde $ 249 en los Países Bajos y los Estados Unidos! Lea sobre Cómo construir un edificio de infraestructura. clase utilizando servidores Dell R730xd E5-2650 v4 que cuestan 9,000 euros por un centavo?

El Intel Core i7-8086K (parte 2)