Arquitetura de GPU Intel Gen11 e placa gráfica discreta da Intel


Placa gráfica discreta de nível básico Intel Graphics Xe, o anúncio oficial ocorreu em 20 de março na conferência de jogos da GDC 2019

A Intel publicou documentação para as GPUs Gen11 com uma descrição de como elas diferem da geração anterior. Espera-se que a arquitetura Intel Gen11 se torne a base para a arquitetura futura da placa de vídeo Xe discreta, para que as tecnologias descritas aqui possam ser consideradas como uma prévia de pelo menos algumas das funções implementadas nessas placas de vídeo. Até agora, a Intel não disse nada sobre futuras placas de vídeo, apenas mostrou algumas fotos (ou renderizações).


Arquitetura do processador Intel Core, sistema em um chip (SoC) e sistema em anel de conexões internas (interconexão em anel)

Historicamente, os processadores gráficos Intel mid-range GT2 para computadores de mesa e alguns chips móveis tiveram desempenho inferior aos chips AMD. Nessas comparações, a Intel historicamente ganhou uma vantagem com um processador mais poderoso em comparação com APUs derivadas da microarquitetura AMD Bulldozer. Agora a situação mudou. A Ryzen possui um núcleo de processador muito mais eficiente, e os processadores móveis AMD Ryzen são muito mais competitivos com a Intel. Portanto, o último precisa fazer alguma coisa, incluindo resolver o problema com o desempenho da GPU.


Diagrama de bloco Gen11 detalhado

A documentação técnica dificulta o julgamento do desempenho do Gen11. Mas alguns especialistas acreditam que a Intel poderá competir com a AMD com muito mais eficiência. Pelo menos mais eficaz do que nunca.

A nova arquitetura Intel GT2 fornece 64 unidades de execução na UE, em comparação com 24 unidades nos processadores da classe Skylake. Essa expansão significativa de recursos no chip deve melhorar o desempenho geral em comparação com a geração anterior. A tabela abaixo mostra as características comparativas dos subsistemas gráficos Gen9 e Gen11.


Principais métricas Gen9 e Gen11

Com base nas características técnicas, o desempenho computacional no Gen11 aumentará cerca de 2,67 vezes, bem como o rendimento das texturas (amostragem de textura). A largura de banda das unidades de operações de varredura (ROPs) dobrou, assim como o número de testes com alto Z por relógio.

O cache L3 quadruplicou e a taxa de transferência de gravação da GPU dobrou para 64 bytes por relógio. A largura de banda da memória durante o uso de DDR4 deve permanecer a mesma, mas o suporte ao LPDDR4 teoricamente permite velocidades de clock mais altas.

O cache de último nível é compartilhado entre a GPU e a CPU para reduzir o tráfego de dados. Os blocos decodificadores de vídeo são aprimorados para reduzir a taxa de bits. Eles permitem a decodificação simultânea de vários fluxos de 4K e 8K. Adicionado suporte para sincronização adaptativa e decodificação aprimorada de vídeo em HD.

A GPU agora possui memória local compartilhada, que não bloqueia o acesso ao cache L3 durante a leitura. A Intel alega que isso reduz a latência e melhora a eficiência das operações atômicas.


Hierarquia de memória no nível do chip SoC e seu rendimento teórico máximo

A Intel afirma ter melhorado significativamente a largura de banda geral da memória no Gen11.

A documentação descreve duas novas tecnologias que a Intel implementou no acelerador gráfico:

  • sombreamento de pixel grosso (sombreamento de pixel grosso, CPS);
  • sombreamento por posição (Position Only SHading, POSH).

O sombreamento de pixel aproximado reduz a carga na GPU, reduzindo o número de amostras de cores usadas para renderizar a imagem. A captura de tela ilustra que o CPS quase não afeta a qualidade da renderização.


Foto do jogo Citadel 1 na resolução de 2560 × 1440 (taxa de pixels 1 × 1 à esquerda e 2 × 2 à direita). Embora o sombreamento grosseiro de pixels reduza o número de chamadas de sombreador, praticamente não há diferença perceptível em uma tela de alta densidade de pixels. Para comparação, também é mostrada uma imagem em escala sem suavização de serrilhado, em uma resolução de 1280 × 720

Reduzir o número de chamadas para o pixel shader economiza energia e melhora o desempenho, ou seja, a taxa de quadros, de 20 a 40%.


Nesta imagem, os objetos em quadros vermelhos são identificados como estando muito distantes da câmera e de pouca importância para a qualidade geral da imagem, de modo que os detalhes podem ser reduzidos sem efeito perceptível na qualidade da imagem, com um aumento subsequente na taxa de quadros

O pipeline POSH executa o shader de posição em paralelo com o aplicativo principal, o que geralmente permite gerar o resultado muito mais rapidamente, diz a documentação. Isso faz parte do sistema de renderização de posição somente renderização baseada em bloco (PTBR).



Em geral, o Gen11 será uma atualização significativa para os processadores Intel. As duas primeiras gerações do AMD Ryzen Mobile competiram com os gráficos fracos da Skylake. A terceira geração do Ryzen Mobile APU, sempre que for lançada, terá que competir com um chip Intel muito mais poderoso, afirma ExtremeTech .

Source: https://habr.com/ru/post/pt444972/


All Articles