Arquitectura de GPU Intel Gen11 y tarjeta gráfica discreta de Intel


Tarjeta gráfica discreta de nivel básico Intel Graphics Xe, el anuncio oficial tuvo lugar el 20 de marzo en la conferencia de juegos GDC 2019

Intel ha publicado documentación para las GPU Gen11 con una descripción de cómo diferirán de la generación anterior. Se espera que la arquitectura Intel Gen11 se convierta en la base para la futura arquitectura de la tarjeta de video Xe discreta, por lo que las tecnologías descritas aquí pueden considerarse como una vista previa de al menos algunas de las funciones que se implementan en estas tarjetas de video. Hasta el momento, Intel no ha dicho nada sobre las futuras tarjetas de video, solo mostró algunas fotos (o representaciones).


Arquitectura del procesador Intel Core, sistema en un chip (SoC) y sistema de anillo de conexiones internas (Ring Interconnect)

Históricamente, los procesadores gráficos Intel de rango medio GT2 para computadoras de escritorio y algunos chips móviles fueron inferiores en rendimiento a los chips AMD. En tales comparaciones, Intel ha ganado históricamente una ventaja con un procesador más potente en comparación con las APU derivadas de la microarquitectura AMD Bulldozer. Ahora la situación ha cambiado. Ryzen tiene un núcleo de procesador mucho más eficiente, y los procesadores móviles AMD Ryzen son mucho más competitivos con Intel. Por lo tanto, este último debe hacer algo, incluso resolver el problema con el rendimiento de la GPU.


Diagrama detallado de bloques Gen11

La documentación técnica hace que sea difícil juzgar el rendimiento de Gen11. Pero algunos expertos creen que Intel podrá competir con AMD de manera mucho más efectiva. Al menos más efectivo que nunca.

La nueva arquitectura Intel GT2 proporciona 64 unidades de ejecución de la UE, en comparación con 24 unidades en procesadores de clase Skylake. Esta expansión significativa de recursos en el chip debería mejorar el rendimiento general en comparación con la generación anterior. La siguiente tabla muestra las características comparativas de los subsistemas gráficos Gen9 y Gen11.


Métricas clave Gen9 y Gen11

Según las características técnicas, el rendimiento computacional en Gen11 aumentará aproximadamente 2,67 veces, así como el rendimiento de las texturas (muestreo de textura). El ancho de banda de las unidades de operaciones ráster (ROP) se ha duplicado, al igual que el número de pruebas de Z alta por reloj.

El caché L3 se ha cuadruplicado y el rendimiento de escritura de la GPU se ha duplicado a 64 bytes por reloj. El ancho de banda de la memoria mientras se usa DDR4 debe permanecer igual, pero el soporte LPDDR4 teóricamente permite velocidades de reloj más altas.

El último nivel de caché se comparte entre la GPU y la CPU para reducir el tráfico de datos. Los bloques del decodificador de video se mejoran para reducir la tasa de bits. Permiten la decodificación simultánea de múltiples transmisiones de 4K y 8K. Soporte agregado para sincronización adaptativa y decodificación mejorada de video HD.

La GPU ahora ha compartido memoria local, que no bloquea el acceso al caché L3 cuando lee. Intel afirma que esto reduce la latencia y mejora la eficiencia de las operaciones atómicas.


Jerarquía de memoria a nivel de chip SoC y su rendimiento teórico máximo

Intel afirma haber mejorado significativamente el ancho de banda de memoria general en Gen11.

La documentación describe dos nuevas tecnologías que Intel implementó en el acelerador de gráficos:

  • sombreado de píxeles gruesos (sombreado de píxeles gruesos, CPS);
  • sombreado por posición (Posición solo sombreado, POSH).

El sombreado de píxeles gruesos reduce la carga en la GPU, lo que reduce el número de muestras de color que se utilizan para representar la imagen. La captura de pantalla ilustra que CPS casi no tiene efecto en la calidad de representación.


Disparo desde el juego Citadel 1 en la resolución de 2560 × 1440 (tasa de píxeles 1 × 1 a la izquierda y 2 × 2 a la derecha). Aunque el sombreado de píxeles gruesos reduce la cantidad de llamadas de sombreador, prácticamente no hay diferencia notable en una pantalla de alta densidad de píxeles. A modo de comparación, también se muestra una imagen a escala sin suavizado, en una resolución de 1280 × 720

Reducir el número de llamadas al sombreador de píxeles ahorra energía y mejora el rendimiento, es decir, la velocidad de fotogramas, en un 20-40%.


En esta imagen, los objetos en marcos rojos se identifican como bastante distantes de la cámara y de poca importancia para la calidad general de la imagen, por lo que los detalles se pueden reducir sin un efecto notable en la calidad de la imagen con un aumento posterior en la velocidad de fotogramas

La tubería POSH ejecuta el sombreador de posición en paralelo con la aplicación principal, lo que generalmente le permite generar el resultado mucho más rápido, dice la documentación. Esto es parte del sistema de representación de representación basada en mosaico solo de posición (PTBR).



En general, Gen11 será una actualización significativa para los procesadores Intel. Las dos primeras generaciones de AMD Ryzen Mobile compitieron con los débiles gráficos de Skylake. La APU móvil Ryzen de tercera generación, cada vez que salga, tendrá que competir con un chip Intel mucho más potente, escribe ExtremeTech .

Source: https://habr.com/ru/post/444972/


All Articles