AMD Radeon VII: Chip de gama alta (Parte 1)

Parte 1 >> Parte 2 >> Parte 3

En 2018, AMD Radeon Technologies Group se permitió un pequeño respiro. Después de lanzar la arquitectura Polaris en 2016 y la arquitectura Vega en 2017, AMD decidió disfrutar del primer año completo en la arquitectura Vega. En lugar de lanzar una tercera arquitectura después de 3 años, la compañía se centrará en ampliar aún más la familia mediante el lanzamiento de opciones para computadoras portátiles y servidores Vega. A pesar del hecho de que los esfuerzos de AMD en el campo de las computadoras portátiles se dirigieron ligeramente hacia una dirección extraña, el trabajo para crear el servidor Radeon Instinct dio un resultado positivo. Como resultado, la compañía anunció la primera GPU de 7 nm.



Después de actualizar el producto de última generación en noviembre, en forma de Radeon RX 590, esperábamos que AMD prestara atención al consumidor por algún tiempo. En cambio, AMD hizo un anuncio bastante inesperado en CES 2019: la compañía lanzará una nueva tarjeta de consumidor de segmento de gama alta, Radeon VII (Seven). Basado en la GPU del servidor mencionada anteriormente, la tarjeta de video se posiciona como el último buque insignia. Diseñado tanto para jugadores como para creadores de contenido, Radeon VII debería ser el movimiento decisivo de AMD hacia los jugadores. Es nuestro turno de considerar la última tarjeta AMD.

A primera vista, en Radeon VII todo parece obvio. La base de silicio de la tarjeta es la GPU AMD Vega 20, un derivado del Vega 10 original, que se ha mejorado para la informática científica y el aprendizaje automático, y se basa en la tecnología de proceso de vanguardia de 7 nm de TSMC para aumentar la productividad. Este es un hito importante para AMD en la construcción de GPU de servidor: lanzaron la primera GPU de clase de servidor de gama alta desde la GPU de Hawai en 2013. AMD estaba ansioso por demostrar Vega 20 en una etapa tardía de su desarrollo, ya que esta GPU es el corazón de los nuevos aceleradores de servidor Radeon Instinct MI50 y MI60 de AMD.



Vega 20, diseñado principalmente para servidores, no pertenece a la clase de GPU que podrían llegar al consumidor de manera fácil y económica. Pero sucedió algo inesperado: NVIDIA casi no cambió el indicador de rendimiento al dólar. En cambio, las nuevas tarjetas GeForce RTX basadas en Turing se centran en opciones diseñadas para proclamar un nuevo paradigma para la representación en tiempo real de juegos de trazado de rayos y asignar más recursos de GPU de Turing para este propósito. El resultado final fueron los precios relativamente altos de las tarjetas de la serie GeForce RTX 20, aunque su aumento en el rendimiento en los juegos es mucho menor que el habitual al cambiar generaciones de tarjetas de video.

Ante un entorno de precios menos hostil de lo esperado originalmente, AMD finalmente decidió presentar Vega 20 a los consumidores luchando contra NVIDIA en uno de estos altos niveles de precios. La Radeon VII llega a las masas con un precio de $ 699, y la GeForce GTX 2080 se convierte en la nueva tarjeta de juego insignia de Radeon.



Mirando la tabla de especificaciones, el Radeon VII viene con una frecuencia de reloj pico de 1800 MHz, mientras que la frecuencia pico oficial es de 1750 MHz. Este es un buen progreso en comparación con el RX Vega 64, donde la velocidad del reloj era de solo 1630 MHz, lo que significa que AMD tiene un aumento del 10% en la frecuencia. Y gracias a un refrigerador abierto y una SMU revisada, Radeon VII podrá aumentar y mantener velocidades de reloj más altas aún más rápido. Entonces, aunque la última tarjeta AMD no agrega más ROP o CU (de hecho, incluso hay una ligera disminución en comparación con la RX Vega 64), lleva el rendimiento a un nuevo nivel.

Sin embargo, el cambio más grande en comparación con el RX Vega 64 es que AMD duplicó la cantidad de memoria y más que duplicó el ancho de banda de la memoria. Esto es posible gracias a la tecnología de proceso de 7 nm, debido a que el último procesador de gráficos AMD tiene un tamaño de matriz relativamente modesto de 331 mm2. El espacio adicional permitió el intercalador AMD y dos pilas más de HBM2, lo que permitió aumentar el número de VRAM y expandir el bus de memoria. AMD también pudo aumentar ligeramente la frecuencia de la memoria: de 1.89 Gbps / pin en el RX Vega 64 a un plano de 2 Gbps / pin en el Radeon VII.



Curiosamente, según las características básicas, el Radeon VII es esencialmente el Radeon Instinct MI50. Por lo tanto, AMD corre el riesgo de "canibalizar" las ventas de Instinct si el alto rendimiento de Radeon VII es de interés para los usuarios profesionales de computadoras. Como resultado, AMD ha reducido algunas características del chip para diferenciar mejor los productos. Hablaremos de esto un poco más tarde, pero lo principal es que la tarjeta funciona a una frecuencia más baja que FP64, pierde soporte completo para chips ECC y, naturalmente para un producto de consumo, usa controladores de juegos Radeon Software en lugar de la pila de controladores Instinct profesional.

Por supuesto, siempre que habla de conectar una GPU de servidor a una tarjeta gráfica de consumo, está hablando de una tarjeta potente con gran potencial, y esto ciertamente se aplica a Radeon VII. En pocas palabras, la ventaja de la última tarjeta insignia de AMD es su alto rendimiento, y el máximo en su clase es 16 GB de memoria HBM2. Como una de las pocas ventajas obvias de la especificación AMD sobre los competidores de NVIDIA, la cantidad de VRAM es una parte importante del marketing de AMD; prestarán gran atención a la creación de contenido y a los juegos intensivos en VRAM. Una novedad en esta tarjeta es un refrigerador con tres ventiladores, que reemplazó al refrigerador de un solo ventilador en las tarjetas Radeon RX Vega 64/56.

Además, otro pequeño cambio elegante: AMD ingresa al mercado minorista como proveedor de tableros y vende directamente una nueva tarjeta a un precio fijo de $ 699. Considerando que AIB también emite sus tarjetas de referencia de marca hoy, esta es una oportunidad para evitar precios de lanzamiento demasiado caros .



Mientras tanto, observando la situación competitiva, surgen un par de preguntas que deben abordarse. Una parte importante de la propuesta es (como ha sido habitual recientemente) un conjunto de juegos. El paquete actual de Raise the Game Fully Loaded incluye Devil May Cry 5, The Division 2 y Resident Evil 2 con las tarjetas Radeon VII, RX Vega y RX 590 de forma gratuita. Mientras tanto, las tarjetas RX 580 y RX 570 te permiten elegir dos de tres juegos. Como se esperaba, un conjunto de juegos simplemente tendrá un valor agregado en comparación con un competidor directo, en este caso, el RTX 2080, pero NVIDIA tiene su propio juego de duelo de Game On con Anthem y Battlefield V. En un escenario donde se espera que Radeon VII luche por Los consumidores con el RTX 2080, sin la posibilidad de una victoria final, estos beneficios adicionales son cada vez más importantes.

Radeon VII marca el primer lanzamiento del producto desde el reciente cambio en el entorno competitivo debido a la tecnología de los monitores con una frecuencia de actualización variable. Los monitores con una frecuencia de actualización variable ya se han convertido en un atributo obligatorio para los jugadores, y desde el lanzamiento de esta tecnología a principios de esta década, ha habido una clara separación entre las tarjetas AMD y NVIDIA. Las tarjetas AMD son compatibles con VESA Adaptive Sync, mejor conocida bajo la marca AMD FreeSync, mientras que las tarjetas NVIDIA de escritorio solo son compatibles con su propiedad G-Sync. Pero el mes pasado, NVIDIA anunció inesperadamente que sus tarjetas admitirán VESA Adaptive Sync bajo el nombre de marca 'Compatibilidad G-Sync'. Hay poca información detallada sobre cómo funciona este programa, pero al final, la sincronización adaptativa se puede usar en los controladores NVIDIA, incluso si el panel FreeSync no tiene certificación G-Sync Compatible.

El resultado final es que, aunque las noticias de NVIDIA no interfieren con AMD en términos de implementación de funciones, socavan la ventaja de AMD en FreeSync: todos los monitores VESA Adaptive Sync baratos que antes se usaban solo en tarjetas AMD ahora se pueden usar en tarjetas NVIDIA. AMD, por supuesto, estaba muy contento de enfatizar el FreeSync "gratuito", pero como arma contra NVIDIA, este movimiento de marketing perdió fuerza. La línea oficial de AMD es considerar esto como una victoria para FreeSync.

El lanzamiento de Radeon VII y su posicionamiento competitivo en comparación con la GeForce RTX 2080 significa que AMD necesita definir claramente su posición con respecto a la brecha actual en las capacidades entre sus tarjetas y el último NVIDIA Turing. Por lo tanto, la posición de AMD se ha mantenido sin cambios en las tecnologías DirectX Raytracing (DXR) y las tecnologías de calidad de imagen y rendimiento basadas en AI, como DLSS. En resumen, el argumento de AMD es que, en su opinión, la diferencia en la calidad de imagen y la ganancia de rendimiento no valen el precio de estas características. Mientras tanto, AMD no se detiene y, junto con los controladores DXR de respaldo, están trabajando en el soporte de WinML y DirectML para sus tarjetas. Riesgo de AMD: si los esfuerzos de DXR o DLSS de NVIDIA comienzan a evolucionar rápidamente, una brecha de características se convertirá en un problema mucho mayor.

En general, lanzar una GPU para juegos de 7 nm a los consumidores es actualmente un movimiento muy agresivo. Especialmente en una etapa temprana del ciclo de vida de este proceso. Pero AMD simplemente no tiene tiempo para esperar y observar. El único obstáculo serio para la promoción del producto será el precio: el costo debe ser aceptable para los consumidores.

Esto nos lleva al lanzamiento de hoy. Con un precio de $ 699, NVIDIA ya ha bajado la barra de precios, hablando de equipos dedicados para acelerar el trazado de rayos y el aprendizaje automático. Para Radeon VII, las condiciones giran en torno a 16 GB de HBM2 y valores para semiprofesionales y creadores de contenido. Todo lo que queda es su rendimiento de juego.



Bajo el capó de Vega 20: 7 nm GCN


Aunque ya estamos familiarizados con Vega 20 debido al lanzamiento de tarjetas gráficas de nivel de servidor, Radeon Instinct MI50 y MI60, la entrada de este chip en el mercado de consumo significa la primera tarjeta de juegos de 7 nm. Una transición rápida a un nodo inferior, esta vez de 14nm LPP GlobalFoundries a 7nm TSMC (CLN7FF), solía ser el sello distintivo de AMD / ATi, y nuevamente AMD tiene prisa con el lanzamiento, llevando el producto a los consumidores tan temprano. En este caso, todos los atributos de Vega 20 están claramente destinados a profesionales y servidores, aunque tienen ventajas para los juegos.

En la compleja historia de Radeon VII, el destino de Vega fue especialmente misterioso. Para empezar, la GPU Vega 20 7nm, que llegó a los consumidores tan temprano, fue una sorpresa. Aunque AMD mencionó Vega 20 solo en relación con los productos Radeon Instinct, refiriéndose a su futura arquitectura Navi al mencionar GPU de 7 nm para jugadores, AMD ahora afirma que Radeon VII ha sido planeado durante mucho tiempo para el mercado de consumo. Quizás lo mismo podría decirse de Vega a 14 nm + / 12LP y la GPU Vega 11 (que no debe confundirse con las unidades informáticas 11 Ryzen 2400G Vega), aunque esto no es inusual dada la naturaleza de los desarrollos en el campo de los semiconductores.

Honestamente, AMD fue algo genial con Vega desde el lanzamiento de RX Vega, que no logró sus objetivos. Aunque Radeon VII es en cierto sentido un "chip Schrödinger", plantea algunas preguntas interesantes sobre 7 nm. Por ejemplo, AMD ya ha retrasado el momento del muestreo y el lanzamiento de Vega 20 antes. Resulta que la fecha de lanzamiento de Radeon VII es la más temprana que podría ser para el sucesor de Radeon Instinct. Además, con un tamaño de matriz de 331 mm2, estos no son pequeños SoC móviles que hemos visto hasta ahora en TSMC 7 nm. Diseñada para mejoras informáticas / centradas en ML, equipada con 4 pilas HBM2 y construida en un nodo maduro y de vanguardia de 7 nm, la GPU Vega 20 no parece una tarjeta lista para crear una buena oferta a precios de consumo. Y sin embargo, gracias a una feliz coincidencia, esto sucedió.



Vega 20 combina la arquitectura GCN 5 actualizada con una tecnología de proceso de 7 nm, con 13,2 V por transistores de 331 mm2 (en comparación con 12,5 V por 496 mm2 para Vega 10). Como regla general, a medida que se reduce el espacio, los ahorros de espacio se reinvierten en más transistores. Para una tarjeta gráfica de juegos, esto puede significar cualquier cosa, desde más CU y bloques de funciones, hasta el rediseño de diseños y canales de datos mejorados para aumentar la tolerancia de frecuencia. Este último, por supuesto, debería proporcionar una frecuencia de reloj más alta, y tal elección fue una parte importante del diseño de Vega 10, donde se utilizó un número significativo de transistores para lograr las características de frecuencia requeridas. Combinado con la eficiencia energética de una unidad de proceso más pequeña, el nuevo chip puede recibir estas frecuencias de reloj más altas sin consumir energía adicional.



Sin embargo, en Vega 20, la mayor parte del espacio ahorrado se dejó "como está": el chip tiene más espacio libre. Hay varias razones para esto, algunas obvias y otras no. Para empezar, para un gran procesador de gráficos de alto rendimiento en un nodo avanzado de 7 nm al comienzo del ciclo de vida, el desarrollo y la producción son muy caros. Y, probablemente, con un aumento en el tamaño, el costo aumentará significativamente y la rentabilidad del producto disminuirá. Aunque el proceso de 7nm TSMC hasta ahora solo se ha visto públicamente en SoC móviles, Vega 20 parece usar bibliotecas orientadas a HPC 7.5T, en lugar de usar bibliotecas 6T diseñadas para SoCs móviles.



Pero lo más importante, el espacio guardado le permite colocar dos pilas más de HBM2 en un dispositivo intermedio de un tamaño similar. Para las densidades y capacidades de la generación actual de HBM2, el límite para un chip de doble pila es de 16 GB de memoria cuando se usa un par de pilas 8-Hi. Pero para la GPU a nivel de servidor, especialmente para el aprendizaje orientado a la máquina, se necesita una configuración de cuatro pilas para proporcionar 32 GB de memoria y un bus más amplio de 4096 bits. AMD eligió tal configuración para Vega 20 y, además, lanza versiones de chip de 32 GB (8-Hi) y 16 GB (4-Hi).

Radeon VII, a su vez, usa uno de estos chips de 16 GB. Cabe señalar que esta no es la primera tarjeta Vega de 16 gigabytes de AMD: ya han lanzado una tarjeta con esta cantidad de memoria. Era una edición especializada de Vega Frontier, pero después de su retiro, esta es la primera versión de una tarjeta de video de 16 GB en la línea AMD Vega.

Equipar una tarjeta de consumidor con 16 GB de memoria es una apuesta de AMD. Y, sospecho, esta es una de las razones por las que AMD quiere tomar parte del mercado de visualización profesional con Radeon VII. Cuando se trata de usar una estación de trabajo y tareas de creación de contenido, es fácil vender una gran cantidad de VRAM porque ya hay tareas que pueden usar toda esta VRAM y más. Pero para los juegos, esta no es la propuesta más razonable, ya que los juegos tienen requisitos más fijos para VRAM, y hasta ahora no había tarjetas tan grandes, y los desarrolladores aún no han comenzado a usar el recurso de memoria de video de 16 GB. Aunque, por otro lado, la fuerte declaración "esta tarjeta tiene más que suficiente memoria de video" puede tener un serio impacto en las ventas, y en 2019 la tarjeta de video insignia para los jugadores debería tener esta cantidad de todos modos.

Volviendo al diseño de Vega 20, otro paso que AMD ha tomado para reducir la complejidad del desarrollo y el costo de 7 nm es adherirse a la arquitectura ya conocida. AMD agregó optimizaciones menores en comparación con Vega 10, pero no se atrevieron a hacer un rediseño serio. En esencia, esta es la lógica del paso tick de la conocida estrategia tick-tack de Intel.
De hecho, Vega 20 es un sucesor tan directo de Vega 10 que, además de la cantidad de controladores de memoria, la cantidad de otros bloques funcionales es la misma. La GPU combina 64 CU y 256 unidades de textura, divididas en 4 Shader Engine, así como 64 GPU ROP y AMD.

(Debo agregar que, siguiendo mi plan, AMD también evita cuidadosamente el problema de escalar el motor de sombreado. La naturaleza de la limitación del motor de 4 sombreadores en los últimos años no ha sido clara, pero con Vega había indicios de ir más allá de estos límites con un equilibrio de carga mejorado usando "inteligente distribuidores de grupos de trabajo ”(IWD). Independientemente, establecer y rediseñar una configuración equilibrada de 4+ SE es una tarea desalentadora, y no tiene sentido si AMD planea hacer cambios fundamentales en GCN).



Por lo tanto, a nivel arquitectónico, Vega 20 es un diseño puramente evolutivo. Pero teniendo en cuenta lo anterior, hay un poco más de "evolución" que simplemente reducir la unidad tecnológica. La combinación de estas mejoras significa que, en la práctica, el Vega 20 debería ser un poco más rápido que el Vega 10 cuando se ejecuta a la misma velocidad de reloj.

La mejora más notable aquí es el ancho de banda de memoria adicional; el doble en ROP, unidad de textura y ALU que en Vega 10. Esto es especialmente bueno para ROP, que tradicionalmente necesitan mucho ancho de banda. Sin detenerse allí, AMD también realizó algunas mejoras en Core Fabric, que conecta la memoria con ROP (entre otras cosas). Desafortunadamente, AMD no quiere revelar cuáles son estas mejoras, solo confirmaron que no hay cambios en el caché entre ellas.



Otra parte del rompecabezas es que AMD ha agregado nuevas instrucciones y tipos de datos que en algunos casos acelerarán el aprendizaje automático. AMD no nos proporcionó la información completa, pero en general sabemos que han agregado soporte para los tipos de datos INT8 e INT4, que son útiles para secuencias de comandos de salida de baja precisión. AMD también agregó el producto escalar FP16, que se guarda como resultado de FP32. Este es un escenario bastante específico, que es útil para algunos algoritmos de aprendizaje automático, ya que proporciona una mayor precisión del resultado que el producto escalar FP16-in / FP16-out.

Hablando de tipos de datos, AMD también aumentó significativamente el rendimiento de FP64 para Vega 20. Como arquitectura básica, GCN le permite crear GPU con velocidades de 1/2 a 1/16 de la velocidad de FP32. 1/16. , - , 1/4 1/2. Vega 20, , ½ FP64 AMD Hawaii 2013 . , , FP32 Vega 10 , FP64- : , 8x RX Vega 64 (). , , Radeon VII — 1/4 — .

, AMD . (DCE) 12.1, (UVD) 7.2, video coding engine (VCE) 4.1. Vega 10 . Display Core Next Raven Ridge Video Core Next 1.0, , ASIC .



— SMU, Linux. , 64 . , AMD . Vega 10 ( 'hotspot'), Vega 20 , . , 1-2%, AMD .



SMU, , : , GPU , SMU. , (, GPU-Z), , AMD , API AMD.

, Vega AMD Vega 10 2017 , , Vega. AMD , .

Vega 20, AMD, , . AMD . - , , Next Generation Geometry (NGG) Vega 20 ( , Intelligent Workgroup Distributor ).

, AMD Vegas 10 Draw Stream Binning Rasterizer (DSBR), ; . Rapid Packed Math ( FP16), : Far Cry 5 Wolfenstein II.

FP64 Radeon VII Radeon Instinct MI50


Radeon VII , AMD , . AMD Radeon Pro Radeon Instinct, GPU Vega 20 - AMD. , , Radeon VII , .

– , AMD . , , Radeon VII, . AMD Vega 20, Radeon Instinct MI50 . , , Radeon VII ( 699 ), , AMD.

FP64. Vega 20, FP64 Vega 20 : FP32, 6,9 TFLOPS. Vega 20, , Radeon VII CES, , Radeon VII. , Radeon VII (1/2) FP64, , 1/8. , , AMD : 1/4.

AMD :

Radeon VII , . , Radeon VII, FP64. , Radeon VII 0,88 TFLOPS (DP = 1/16 SP). , , , 3,52 3,46 TFLOPS (DP = 1 / 4SP).

FP64 , , , , VBIOS , , , . , , Radeon VII, [].

, , Radeon VII , MI60 / MI50, FP64, AMD , .

3,5 TLFLOPS FP64, Radeon VII . 2000 . NVIDIA GeForce AMD Radeon FP64. Radeon VII NVIDIA Titan V, 4 .

, , . , , Data Scientist, .



, , , AMD . , . ML, , , INT8 / INT4 Radeon VII. FP16.

full-chip ECC. HBM2 Vega ECC DRAM. Vega 20 ECC , Radeon VII .

, Radeon VII - Vega 20. AMD , Vega 20 GPU PCI-Express 4.0, Radeon Instinct. Radeon VII , PCIe 3.0 ( Zen 2 PCIe 4.0 ). Infinity Fabric , Radeon VII .

, AMD, Radeon VII . «» . Radeon Instinct, Radeon Pro Vega 20.

Radeon VII


- . AMD Radeon VII : . RX Vega 64 Limited Edition Liquid, , AIB .



NVIDIA GeForce RTX , AMD . RX Vega 64 Liquid, AIO CLC R9 Fury X . , Founders Edition, , . . OEM-, «», , - .

TDP, 300 TBP Radeon VII . , 5 RX Vega 64. , , HBM2, , . 300 TBP , . Radeon VII – RX Vega 64, .



Radeon VII, , , 8- PCIe, BIOS RX Vega, BIOS . «Radeon» , «R» .



, : 3x DisplayPort 1x HDMI.



TIM, . , , RX Vega molded unmolded, . , ASIC.

Gracias por quedarte con nosotros. ¿Te gustan nuestros artículos? ¿Quieres ver más materiales interesantes? Apóyenos haciendo un pedido o recomendándolo a sus amigos, un descuento del 30% para los usuarios de Habr en un análogo único de servidores de nivel de entrada que inventamos para usted: toda la verdad sobre VPS (KVM) E5-2650 v4 (6 núcleos) 10GB DDR4 240GB SSD 1Gbps de $ 20 o cómo dividir el servidor? (las opciones están disponibles con RAID1 y RAID10, hasta 24 núcleos y hasta 40GB DDR4).

VPS (KVM) E5-2650 v4 (6 núcleos) 10GB DDR4 240GB SSD 1Gbps hasta el verano gratis al pagar por un período de seis meses, puede ordenar aquí .

Dell R730xd 2 veces más barato? ¡Solo tenemos 2 x Intel Dodeca-Core Xeon E5-2650v4 128GB DDR4 6x480GB SSD 1Gbps 100 TV desde $ 249 en los Países Bajos y los Estados Unidos! Lea sobre Cómo construir un edificio de infraestructura. clase utilizando servidores Dell R730xd E5-2650 v4 que cuestan 9,000 euros por un centavo?

Source: https://habr.com/ru/post/443724/


All Articles