Qual será a próxima geração de placas de vídeo

Se um computador ou laptop de mesa estiver focado em videogames novos e exigentes, além de trabalhar com sistemas de design auxiliados por computador e outros aplicativos especializados, na maioria das vezes ele possui um acelerador de vídeo da Nvidia ou da AMD. A geração atual de aceleradores de vídeo é representada pelas novecentas séries da GeForce e trezentas séries dos chips Radeon. Ambos estão gradualmente sendo preenchidos com modelos de direções diferentes: a Nvidia começou a fazer isso no outono de 2014, AMD - em junho passado .

Uma nova linha aparecerá em 2016. Os fabricantes fornecem poucas informações sobre novos produtos. Talvez eles temam o efeito de Osborne: uma história sobre um seguidor mais perfeito envelhecerá o modelo atual na percepção do público, o que afetará negativamente as vendas deste último. E até os próprios desenvolvedores podem não saber como será o produto final no balcão. Mas há algumas informações agora.

A nova geração pode ser caracterizada pelo uso do HBM2 (High Bandwidth Memory 2) e uma diminuição no processo de fabricação. AMD e Nvidia estão mudando de 28 nm para 14 e 16 nm FinFET, respectivamente. Ambas as inovações são projetadas para aumentar o desempenho por watt em 2 vezes.

Memória de alta largura de banda ou HBM é uma tecnologia de memória que foi desenvolvidaAMD e Hynix. Antes da HBM, as placas de vídeo usavam memória GDDR5. Para obter largura de banda adicional, tive que adicionar chips e canais que consumiam espaço e energia na placa. A aceleração usual da frequência dos chips de memória diminuiu, pois aumentar a frequência significa um rápido aumento na dissipação de calor. A solução para o problema é tornar-se o que os fabricantes vêm fazendo nas últimas décadas para reduzir custos e consumo de energia e aumentar a produtividade: integração. Por exemplo, os processadores centrais incluíram muitos elementos, de coprocessadores matemáticos a controladores de memória. Em cada caso, houve vantagens.



O HBM envolve a convergência do chip acelerador de memória e vídeo em uma estrutura. Mas os processos de produção são muito diferentes para perceber isso em um único cristal. Portanto, é usada uma construção de três elementos: o chip principal (neste caso, a GPU, o acelerador de vídeo), as colunas de memória e o interposer. O Interposer é um chip de silício comum fabricado por um processo relativamente antigo. O papel do interpositor é completamente passivo. Não possui elementos ativos, pois sua principal tarefa é conectar eletricamente as trilhas entre a memória e o processador.



O chip principal e as colunas de memória estão no interposer. Por ser um chip de silício, pode conectar muito mais elementos do que uma placa comum. É o interposer que é o detalhe principal da memória de alta largura de banda. Existem outros elementos tradicionais sob o interposer, mas sua tarefa é trocar com o barramento PCI Express, enviar para monitores e outras interfaces. Toda a comunicação entre o processador de vídeo e a memória ocorre usando um interposer. A frequência da memória não é alta (1 GHz em vez de 6), mas isso é compensado por uma conexão muito ampla: 1024 bits de barramento para cada uma das quatro pilhas. O barramento de memória GDDR5 atinge 512 bits de largura, oito vezes menos que o HBM de 4096 bits. Como resultado, já na primeira geração do HBM, ele demonstra a vantagem da largura de banda (512 GB / s). Planos de produção Hynix HBM2.










A primeira geração da HBM já é usada em vários produtos da trezentosa série da Radeon. A segunda geração do HBM aparecerá nos produtos AMD e Nvidia. Algumas fontes acreditam que possuir o HBM dará à AMD acesso prioritário ao HBM2. Nele, a taxa de câmbio aumentará de 128 GB / s para 256 GB / s para cada uma das pilhas, e a quantidade de memória na camada aumentará quatro vezes. O primeiro HBM fornece 4 camadas de memória por pilha; no segundo, configurações com 4 e 8 camadas estarão disponíveis.

A seguinte microarquitetura da Nvidia é chamada Pascal. Seus principais recursos são a tecnologia de processo FinFET + de 16 nm do TSMC e até 16 GB de memória HBM2. Isso sugere que uma configuração com 4 camadas de HBM2 será usada. Também está disponível informação de que o desenvolvimento do próximo processador de vídeo Nvidia visa atingir uma velocidade de troca de dados de 1 TB / s com memória de vídeo. Isso é o dobro do que o atual Fury X pode oferecer. As placas baseadas em Pascal usarão o NVLink pela primeira vez, um barramento de alta velocidade entre a CPU e as GPUs ou entre as GPUs. A velocidade do NVLink é significativamente maior que o PCI Express.





Os produtos Pascal começarão a ser enviados em 2016. (Será interessante ver o marketing do modelo GTX 1080 e a explicação de que ele é ótimo para resoluções 4K.) Algo já existe. A Nvidia lançou recentemente o computador de carro Drive PX 2 , cujo núcleo são dois processadores Tegra e dois chips de microarquitetura Pascal. O Drive PX 2 é um poderoso moedor de números para testar a tecnologia robótica, e o nome Pascal é mencionado de passagem no anúncio.



A nova microarquitetura da AMD é chamada Polaris. Um monte de dados sobre ela apareceu em 4 de janeiro. O Polaris suporta HDMI 2.0a (saída até 4K 60 FPS), DisplayPort 1.3 (saída até 8K 60 FPS), codificação e decodificação 4K h.265 (HEVC). A AMD usará a tecnologia de processo FinFET de 14 nm. Em relação à tecnologia de processo de 28 nm, serão alcançadas melhores velocidades, menos correntes de vazamento, menor variação no desempenho dos elementos.



A AMD encontrará o ponto ideal para melhorar a eficiência energética, oferecendo ganhos de desempenho por meio de alterações arquiteturais. Como mostra o gráfico abaixo, a nova tecnologia de processo fornece uma boa redução no consumo de energia na mesma frequência, mas não um espaço tão grande para aumentar a produtividade. A AMD se concentra no desempenho por watt, não no desempenho em si. Isso permitirá que você atinja um nível de console de gráficos, mesmo em laptops compactos. No entanto, isso não significa que o Polaris não continue aumentando a produtividade. Apenas para alcançar novos indicadores, serão necessárias mudanças na arquitetura, em vez de um aumento estúpido nas frequências. A AMD não forneceu muita informação, mas decorre do que foi fornecido que muitos blocos de chips gráficos foram reciclados. Polaris é a quarta geração



Graphics Core Em seguida , a arquitetura herda os mesmos princípios. Cada unidade de computação contém 4 blocos SIMD, que por sua vez contêm blocos de computação vetorial. Não se sabe se os Verdes continuarão a usar GDDR5 em produtos de orçamento. A Micron fez vários anúncios sobre a tecnologia GDDR5X, que indica o dobro da velocidade do GDDR5. No entanto, GGDR5X é a tecnologia proprietária da Micron, e as entregas são possíveis mais perto do final de 2016. Por sua vez, os Reds já estão afirmando que o GDDR5 permanecerá em produtos focados no baixo consumo de energia ou no desempenho médio. Quais modelos específicos conterão o tipo "antigo" de memória, a AMD ainda não disse.







A AMD demonstrou um protótipo de um acelerador de vídeo de microarquitetura Polaris tão barato com memória GDDR5 em vez de HBM. Foi comparado com uma amostra sem nome GTX 950. O consumo de energia foi registrado no Star Wars Battlefront na resolução 1920 × 1080. É difícil tirar conclusões neste teste, onde a taxa de quadros foi limitada a 60 qps, mas a placa Polaris consumiu quase 40% menos energia: cerca de 85 watts versus 140.




No segundo minuto, as cabeças falantes são substituídas por uma demonstração desse teste.

Atualmente, a AMD aponta para meados de 2016 como a data de lançamento das placas de vídeo Polaris.
Baseado em ExtremeTech ( 1 , 2 , 3 , 4 ) e Ars Technica .

Source: https://habr.com/ru/post/pt388845/


All Articles