Parte 1 >>
Parte 2 >> Parte 3
Em 2018, o AMD Radeon Technologies Group se permitiu um pouco de descanso. Depois de lançar a arquitetura Polaris em 2016 e a arquitetura Vega em 2017, a AMD decidiu aproveitar o primeiro ano inteiro na arquitetura Vega. Em vez de lançar uma terceira arquitetura após três anos, a empresa se concentrará em expandir ainda mais a família, lançando opções para laptops e servidores Vega. Apesar do fato de os esforços da AMD no campo dos laptops serem levados a uma direção estranha, o trabalho de criação do servidor Radeon Instinct levou a um resultado positivo. Como resultado, a empresa anunciou a primeira GPU de 7 nm.

Depois de atualizar o produto de última geração em novembro, na forma do Radeon RX 590, esperávamos que a AMD prestasse atenção ao consumidor por algum tempo. Em vez disso, a AMD fez um anúncio bastante inesperado na CES 2019: a empresa lançará um novo cartão de consumidor do segmento high-end, Radeon VII (Seven). Com base na GPU do servidor acima mencionada, a placa de vídeo está posicionada como o carro-chefe mais recente. Projetado para jogadores e criadores de conteúdo, o Radeon VII deve ser a decisão decisiva da AMD em relação aos jogadores. É a nossa vez de considerar a mais recente placa AMD.
À primeira vista, no Radeon VII tudo parece óbvio. A base de silício da placa é a GPU AMD Vega 20, um derivado da Vega 10 original, aprimorada para computação científica e aprendizado de máquina, e construída sobre a tecnologia de processo de 7 nm da TSMC para aumentar a produtividade. Este é um marco importante para a AMD na criação de GPUs para servidores - eles lançaram a primeira GPU de classe superior para servidores desde a GPU do Havaí em 2013. A AMD estava ansiosa para demonstrar o Vega 20 em um estágio final de seu desenvolvimento, pois esta GPU é o coração dos novos aceleradores de servidor Radeon Instinct MI50 e MI60 da AMD.

O Vega 20, projetado principalmente para servidores, não pertence à classe de GPUs que poderiam encontrar o caminho de forma barata e fácil para o consumidor. Mas algo inesperado aconteceu: a NVIDIA quase não mudou o indicador de desempenho para o dólar. Em vez disso, as novas placas GeForce RTX baseadas em Turing concentram-se em opções projetadas para proclamar um novo paradigma para a renderização em tempo real de jogos de rastreamento de raios e alocar mais recursos da GPU Turing para essa finalidade. O resultado final foram os preços relativamente altos das placas da série GeForce RTX 20, embora o aumento de desempenho nos jogos seja muito menor do que o normal ao mudar gerações de placas de vídeo.
Diante de um ambiente de preços menos hostil do que o esperado, a AMD finalmente decidiu apresentar o Vega 20 aos consumidores, enfrentando a NVIDIA em um desses altos níveis de preços. A Radeon VII chega às massas com um preço de US $ 699, e a GeForce GTX 2080 se torna o novo cartão de jogo Radeon.

Olhando para a tabela de especificações, a Radeon VII vem com uma frequência de pico de clock de 1800 MHz, enquanto a frequência de pico oficial é de 1750 MHz. Este é um bom progresso em comparação com o RX Vega 64, onde a velocidade do clock era de apenas 1630 MHz, o que significa que a AMD tem um aumento de 10% na frequência. E, graças a um cooler aberto e a uma SMU revisada, a Radeon VII poderá aumentar e manter velocidades de clock mais altas ainda mais rapidamente. Portanto, embora a mais recente placa AMD não adicione mais ROP ou CU (de fato, há até uma ligeira queda em comparação com o RX Vega 64), ela leva a taxa de transferência para um novo nível.
No entanto, a maior mudança em comparação com o RX Vega 64 é que a AMD dobrou a quantidade de memória e mais que dobrou a largura de banda da memória. Isso é possível graças à tecnologia de processo de 7 nm, devido à qual o mais recente processador gráfico da AMD possui um tamanho de matriz relativamente modesto de 331 mm2. Espaço adicional permitiu o AMD Interposer e mais duas pilhas de HBM2, o que permitiu aumentar o número de VRAM e expandir o barramento de memória. A AMD também foi capaz de aumentar levemente a frequência da memória: de 1,89 Gbps / pino no RX Vega 64 a 2 Gbps / pino plano no Radeon VII.

Curiosamente, com base nas características básicas, a Radeon VII é essencialmente o Radeon Instinct MI50. Portanto, a AMD corre o risco de "canibalizar" as vendas do Instinct se o Radeon VII de alto desempenho interessar aos usuários profissionais de computadores. Como resultado, a AMD reduziu alguns recursos do chip para diferenciar melhor os produtos. Falaremos sobre isso um pouco mais tarde, mas o principal é que o cartão funciona com uma frequência mais baixa que o FP64, perde suporte total para chips ECC e, naturalmente para um produto de consumo, usa drivers de jogos da Radeon Software em vez da pilha de drivers profissional Instinct.
Obviamente, sempre que você fala sobre conectar uma GPU de servidor a uma placa gráfica de consumidor, está falando de uma placa poderosa com grande potencial, e isso certamente se aplica ao Radeon VII. Em resumo, a vantagem da mais recente placa principal da AMD é seu alto desempenho, e o máximo de sua classe é 16 GB de memória HBM2. Como uma das poucas vantagens óbvias das especificações da AMD sobre os concorrentes da NVIDIA, a quantidade de VRAM é uma parte importante do marketing da AMD; eles prestarão muita atenção à criação de conteúdo e a jogos com uso intenso de VRAM. Uma novidade neste cartão é um cooler com três ventoinhas, que substituiu o cooler de ventilador único nos cartões Radeon RX Vega 64/56.
Além disso, outra pequena mudança elegante: a AMD entra no mercado de varejo como fornecedor de placas e vende diretamente um novo cartão a um preço definido de US $ 699. Considerando que a AIB também emite seus cartões de referência da marca hoje, esta é uma oportunidade para evitar preços de lançamento muito altos .

Enquanto isso, analisando a situação competitiva, surgem algumas questões que precisam ser abordadas. Uma parte importante da proposta é (como se tornou comum recentemente) um conjunto de jogos. O atual pacote Raise the Game Fully Loaded apresenta Devil May Cry 5, The Division 2 e Resident Evil 2 com as placas Radeon VII, RX Vega e RX 590 gratuitamente.Enquanto isso, as placas RX 580 e RX 570 permitem escolher dois jogos em três. Como esperado, um conjunto de jogos simplesmente agregará valor comparado a um concorrente direto - neste caso, o RTX 2080 -, mas a NVIDIA tem seu próprio conjunto de duelos de Game On com Anthem e Battlefield V. Em um cenário em que a Radeon VII deve lutar consumidores com o RTX 2080, sem chance de vitória final, esses benefícios adicionais estão se tornando cada vez mais importantes.
A Radeon VII marca o primeiro lançamento do produto desde a recente mudança no ambiente competitivo devido à tecnologia de monitores com uma taxa de atualização variável. Monitores com taxa de atualização variável já se tornaram um atributo obrigatório para os jogadores e, desde o lançamento dessa tecnologia no início desta década, houve uma clara separação entre placas AMD e NVIDIA. As placas AMD suportam VESA Adaptive Sync, mais conhecida sob a marca AMD FreeSync, enquanto as placas de desktop NVIDIA suportam apenas seu G-Sync proprietário. Mas, no mês passado, a NVIDIA anunciou inesperadamente que seus cartões ofereceriam suporte ao VESA Adaptive Sync sob o nome de marca 'G-Sync Compatibility'. Há poucas informações detalhadas sobre como esse programa funciona, mas, no final, a sincronização adaptativa pode ser usada nos drivers NVIDIA, mesmo se o painel FreeSync não for certificado como G-Sync Compatible.
O resultado final é que, embora as notícias da NVIDIA não interfiram com a AMD em termos de implementação de oportunidades, isso prejudica a vantagem da AMD no FreeSync - todos os monitores baratos VESA Adaptive Sync usados anteriormente anteriormente apenas em placas AMD agora podem ser usados em placas NVIDIA. A AMD, é claro, ficou muito satisfeita ao enfatizar o FreeSync "gratuito", mas como uma arma contra a NVIDIA, esse movimento de marketing perdeu força. A linha oficial da AMD é considerar isso uma vitória para o FreeSync.
O lançamento do Radeon VII e seu posicionamento competitivo em comparação com o GeForce RTX 2080 significa que a AMD precisa definir claramente sua posição em relação à atual lacuna de recursos entre seus cartões e o mais recente NVIDIA Turing. Portanto, a posição da AMD permaneceu inalterada nas tecnologias DirectX Raytracing (DXR) e nas tecnologias de qualidade de imagem e desempenho baseadas em IA, como DLSS. Em suma, o argumento da AMD é que, na opinião deles, a diferença na qualidade da imagem e no ganho de desempenho não vale o preço desses recursos. Enquanto isso, a AMD não fica parada e, juntamente com os drivers DXR de backup, eles estão trabalhando no suporte ao WinML e DirectML para seus cartões. Risco da AMD: se os esforços de DXR ou DLSS da NVIDIA começarem a evoluir rapidamente, uma lacuna de recursos se tornará um problema muito maior.
Em suma, liberar uma GPU de jogos de 7nm para os consumidores é atualmente uma jogada muito agressiva. Especialmente em um estágio inicial do ciclo de vida desse processo. Mas a AMD simplesmente não tem tempo para esperar e observar. O único obstáculo sério à promoção do produto será o preço: o custo deve ser aceitável para os consumidores.
Isso nos leva ao lançamento de hoje. Com um preço de US $ 699, a NVIDIA já baixou a barra de preços, falando sobre equipamentos dedicados para acelerar o rastreamento de raios e o aprendizado de máquina. Para a Radeon VII, as condições giram em torno de 16 GB de HBM2 e os valores para semi-profissionais e criadores de conteúdo. Tudo o que resta é o desempenho dos jogos.

Sob o capô do Vega 20: 7 nm GCN
Embora já estejamos familiarizados com o Vega 20 devido ao lançamento das placas gráficas para servidor Radeon Instinct MI50 e MI60, o lançamento deste chip no mercado consumidor significa o primeiro cartão de jogos de 7 nm. Uma transição rápida para um nó inferior - desta vez de 14nm LPP GlobalFoundries para 7nm TSMC (CLN7FF) - costumava ser uma marca registrada da AMD / ATi, e novamente a AMD está com pressa com o lançamento, trazendo o produto para os consumidores tão cedo. Nesse caso, todos os atributos do Vega 20 destinam-se claramente a profissionais e servidores, embora tenham vantagens para os jogos.
Na complexa história de Radeon VII, o destino de Vega foi especialmente misterioso. Para começar, a GPU Vega 20 de 7nm, que chegou aos consumidores tão cedo, foi uma surpresa. Embora a AMD tenha mencionado o Vega 20 apenas em relação aos produtos Radeon Instinct - referindo-se à sua futura arquitetura Navi ao mencionar GPUs de 7 nm para gamers - a AMD agora alega que o Radeon VII há muito tempo é planejado para o mercado consumidor. Talvez o mesmo possa ser dito sobre o Vega a 14 nm + / 12LP e a GPU Vega 11 (que não deve ser confundida com as 11 unidades de computação Ryzen 2400G Vega), embora isso não seja incomum, dada a natureza dos desenvolvimentos no campo de semicondutores.
Honestamente, a AMD foi um pouco legal com a Vega desde o lançamento do RX Vega, que não alcançou seus objetivos. Embora o Radeon VII seja, de certa forma, um "chip Schrödinger", ele levanta algumas questões interessantes sobre 7 nm. Por exemplo, a AMD já atrasou o tempo da amostragem e do lançamento do Vega 20 anteriormente. Acontece que a data de lançamento da Radeon VII é a mais antiga possível para o sucessor da Radeon Instinct. Além disso, com um tamanho de matriz de 331 mm2, esses não são pequenos SoCs móveis que vimos até agora no TSMC 7 nm. Projetada para melhorias centradas na computação / ML, equipada com 4 pilhas HBM2 e construída em um nó de 7nm maduro e de ponta, a GPU Vega 20 não parece uma placa pronta para criar uma boa oferta a preços ao consumidor. E, no entanto, graças a uma feliz coincidência, isso aconteceu.

O Vega 20 combina a arquitetura GCN 5 atualizada com uma tecnologia de processo de 7 nm, com 13,2 V por transistores de 331 mm2 (em comparação com 12,5 V por 496 mm2 no Vega 10). Como regra, à medida que o espaço é reduzido, a economia de espaço é reinvestida em mais transistores. Para uma placa gráfica de jogos, isso pode significar qualquer coisa, desde mais UCs e blocos funcionais, até redesenhar layouts e canais de dados aprimorados para aumentar a tolerância à frequência. O último, é claro, deve fornecer uma frequência de clock mais alta, e essa escolha foi uma parte importante do design do Vega 10, onde um número significativo de transistores foi usado para obter as características de frequência necessárias. Combinado com a eficiência energética de uma unidade de processo menor, o novo chip pode receber essas frequências de clock mais altas sem consumir energia adicional.

No entanto, na Vega 20, a maior parte do espaço economizado foi deixada "como está": o chip possui mais espaço livre. Existem várias razões para isso, algumas óbvias e outras não. Para começar, para um grande processador gráfico de alto desempenho em um nó avançado de 7 nm no início do ciclo de vida, o desenvolvimento e a produção são muito caros. E, provavelmente, com um aumento no tamanho, o custo aumentará significativamente e a lucratividade do produto diminuirá. Embora o processo TSMC de 7 nm tenha sido visto apenas publicamente em SoCs móveis, o Vega 20 parece usar bibliotecas orientadas a HPC de 7.5T, em vez de usar bibliotecas 6T projetadas para SoCs móveis.

Mais importante, porém, o espaço economizado permite colocar mais duas pilhas HBM2 em um dispositivo intermediário de tamanho semelhante. Para as densidades e capacidades atuais de geração do HBM2, o limite para um chip de pilha dupla é de 16 GB de memória ao usar um par de pilhas 8-Hi. Porém, para a GPU no nível do servidor - especialmente para aprendizado orientado à máquina - é necessária uma configuração de quatro pilhas para fornecer 32 GB de memória e um barramento de 4096 bits mais amplo. A AMD escolheu exatamente essa configuração para o Vega 20 e, além disso, lança versões de chips de 32 GB (8-Hi) e 16 GB (4-Hi).
A Radeon VII, por sua vez, usa um desses chips de 16 GB. Note-se que este não é o primeiro cartão Vega de 16 gigabytes da AMD - eles já lançaram um cartão com essa quantidade de memória. Era uma Vega Frontier Edition especializada, mas após sua aposentadoria, este é o primeiro lançamento de uma placa de vídeo de 16 GB na linha AMD Vega.
Equipar um cartão de consumidor com 16 GB de memória é uma aposta da AMD. E, suspeito, esse é um dos motivos pelos quais a AMD deseja conquistar parte do mercado de visualização profissional com a Radeon VII. Quando se trata de usar uma estação de trabalho e tarefas de criação de conteúdo, é fácil vender uma grande quantidade de VRAM, porque já existem tarefas que podem usar toda essa VRAM e muito mais. Mas para jogos, essa não é a proposta mais razoável, pois os jogos têm requisitos mais fixos para VRAM e, até o momento, não existem placas tão grandes, e os desenvolvedores ainda não começaram a usar o recurso de memória de vídeo de 16 GB. Embora, por outro lado, a afirmação alta “este cartão tenha memória de vídeo mais do que suficiente” possa ter um impacto sério nas vendas, e em 2019 a principal placa de vídeo para jogadores deve ter esse valor de qualquer maneira.
Voltando ao design do Vega 20, outro passo que a AMD tomou para reduzir a complexidade do desenvolvimento e o custo de 7 nm é aderir à arquitetura já conhecida. A AMD adicionou pequenas otimizações em comparação com o Vega 10, mas não se atreveu a fazer um redesenho sério. Em essência, essa é a lógica da etapa de tick da bem conhecida estratégia de tick-tack da Intel.
De fato, o Vega 20 é um sucessor tão direto do Vega 10 que, além do número de controladores de memória, o número de outros blocos funcionais é o mesmo. A GPU combina 64 CUs e 256 unidades de textura, divididas em 4 Shader Engine, além de 64 GPUs ROP e AMD.
(Devo acrescentar que, seguindo meu plano, a AMD também evita cuidadosamente a questão de dimensionar o mecanismo de sombreador. A natureza da limitação do 4 Shader Engine nos últimos anos permaneceu incerta, mas com a Vega havia dicas de ir além desses limites com o balanceamento de carga aprimorado usando “ distribuidores de grupos de trabalho "(IWD). Independentemente, a instalação e o redesenho de uma configuração balanceada de 4+ SE é uma tarefa assustadora e não faz sentido se a AMD planeja fazer alterações fundamentais na GCN.)

Assim, no nível arquitetônico, o Vega 20 é um projeto puramente evolutivo. Mas, considerando o exposto, há um pouco mais de "evolução" do que simplesmente reduzir a unidade tecnológica. A combinação dessas melhorias significa que, na prática, o Vega 20 deve ser um pouco mais rápido que o Vega 10 ao executar na mesma velocidade de clock.
A melhoria mais notável aqui é a largura de banda de memória adicional; duas vezes mais em ROP, unidade de textura e ALU do que em Vega 10. Isso é especialmente bom para ROPs, que tradicionalmente precisam de muita largura de banda. Sem parar por aí, a AMD também fez algumas melhorias no Core Fabric, que conecta a memória ao ROP (entre outras coisas). Infelizmente, a AMD não deseja divulgar quais são essas melhorias, elas apenas confirmaram que não há alterações no cache entre elas.

Outra parte do quebra-cabeça é que a AMD adicionou novas instruções e tipos de dados que, em alguns casos, acelerarão o aprendizado de máquina. A AMD não nos forneceu todas as informações, mas em geral sabemos que eles adicionaram suporte aos tipos de dados INT8 e INT4, que são úteis para scripts de saída de baixa precisão. A AMD também adicionou o produto escalar FP16, que é salvo como resultado do FP32. Esse é um cenário bastante específico, útil para alguns algoritmos de aprendizado de máquina, pois fornece maior precisão do resultado do que o produto escalar FP16-in / FP16-out.
Por falar em tipos de dados, a AMD também aumentou significativamente o desempenho do FP64 para o Vega 20. Como arquitetura básica, o GCN permite criar GPUs com velocidades de 1/2 a 1/16 da velocidade do FP32. 1/16. , - , 1/4 1/2. Vega 20, , ½ FP64 AMD Hawaii 2013 . , , FP32 Vega 10 , FP64- : , 8x RX Vega 64 (). , , Radeon VII — 1/4 — .
, AMD . (DCE) 12.1, (UVD) 7.2, video coding engine (VCE) 4.1. Vega 10 . Display Core Next Raven Ridge Video Core Next 1.0, , ASIC .

— SMU, Linux. , 64 . , AMD . Vega 10 ( 'hotspot'), Vega 20 , . , 1-2%, AMD .

SMU, , : , GPU , SMU. , (, GPU-Z), , AMD , API AMD.
, Vega AMD Vega 10 2017 , , Vega. AMD , .
Vega 20, AMD, , . AMD . - , , Next Generation Geometry (NGG) Vega 20 ( , Intelligent Workgroup Distributor ).
, AMD Vegas 10 Draw Stream Binning Rasterizer (DSBR), ; . Rapid Packed Math ( FP16), : Far Cry 5 Wolfenstein II.
FP64 Radeon VII Radeon Instinct MI50
Radeon VII , AMD , . AMD Radeon Pro Radeon Instinct, GPU Vega 20 - AMD. , , Radeon VII , .
– , AMD . , , Radeon VII, . AMD Vega 20, Radeon Instinct MI50 . , , Radeon VII ( 699 ), , AMD.
FP64. Vega 20, FP64 Vega 20 : FP32, 6,9 TFLOPS. Vega 20, , Radeon VII CES, , Radeon VII. , Radeon VII (1/2) FP64, , 1/8. , , AMD : 1/4.
AMD :
Radeon VII , . , Radeon VII, FP64. , Radeon VII 0,88 TFLOPS (DP = 1/16 SP). , , , 3,52 3,46 TFLOPS (DP = 1 / 4SP).
FP64 , , , , VBIOS , , , . , , Radeon VII, [].
, , Radeon VII , MI60 / MI50, FP64, AMD , .
3,5 TLFLOPS FP64, Radeon VII . 2000 . NVIDIA GeForce AMD Radeon FP64. Radeon VII NVIDIA Titan V, 4 .
, , . , , Data Scientist, .

, , , AMD . , . ML, , , INT8 / INT4 Radeon VII. FP16.
full-chip ECC. HBM2 Vega ECC DRAM. Vega 20 ECC , Radeon VII .
, Radeon VII - Vega 20. AMD , Vega 20 GPU PCI-Express 4.0, Radeon Instinct. Radeon VII , PCIe 3.0 ( Zen 2 PCIe 4.0 ). Infinity Fabric , Radeon VII .
, AMD, Radeon VII . «» . Radeon Instinct, Radeon Pro Vega 20.
Radeon VII
- . AMD Radeon VII : . RX Vega 64 Limited Edition Liquid, , AIB .

NVIDIA GeForce RTX , AMD . RX Vega 64 Liquid, AIO CLC R9 Fury X . , Founders Edition, , . . OEM-, «», , - .
TDP, 300 TBP Radeon VII . , 5 RX Vega 64. , , HBM2, , . 300 TBP , . Radeon VII – RX Vega 64, .

Radeon VII, , , 8- PCIe, BIOS RX Vega, BIOS . «Radeon» , «R» .

, : 3x DisplayPort 1x HDMI.

TIM, . , , RX Vega molded unmolded, . , ASIC.
Obrigado por ficar conosco. Você gosta dos nossos artigos? Deseja ver materiais mais interessantes? Ajude-nos fazendo um pedido ou recomendando a seus amigos, um
desconto de 30% para os usuários da Habr em um análogo exclusivo de servidores básicos que inventamos para você: Toda a verdade sobre o VPS (KVM) E5-2650 v4 (6 núcleos) 10GB DDR4 240GB SSD 1Gbps da US $ 20 ou como dividir o servidor? (as opções estão disponíveis com RAID1 e RAID10, até 24 núcleos e até 40GB DDR4).
VPS (KVM) E5-2650 v4 (6 núcleos) 10GB DDR4 240GB SSD de 1Gbps até o verão de graça quando pagar por um período de seis meses, você pode fazer o pedido
aqui .
Dell R730xd 2 vezes mais barato? Somente nós temos
2 TVs Intel Dodeca-Core Xeon E5-2650v4 128GB DDR4 6x480GB SSD 1Gbps 100 a partir de US $ 249 na Holanda e nos EUA! Leia sobre
Como criar um prédio de infraestrutura. classe usando servidores Dell R730xd E5-2650 v4 custando 9.000 euros por um centavo?