👢 🚣🏽 🤾🏾 Intel Gen11 GPU架构和Intel独立显卡 👨🏿‍🔧 🔌 🔘

离散入门级显卡Intel Graphics Xe，正式发布于3月20日在GDC 2019游戏大会上

英特尔已经发布了Gen11 GPU的文档，其中描述了它们与上一代产品的不同之处。预计Intel Gen11架构将成为分立Xe显卡的未来架构的基础，因此，此处介绍的技术可以视为这些显卡中实现的至少某些功能的预览。到目前为止，英特尔还没有透露有关未来显卡的任何消息，只显示了几张照片（或渲染图）。

英特尔酷睿处理器的体系结构，片上系统（SoC）和内部连接的环形系统（环形互连）

从历史上看，用于台式机和某些移动芯片的英特尔中端图形处理器GT2在性能上不及AMD芯片。在这种比较中，与从AMD Bulldozer微架构派生的APU相比，英特尔历来凭借更强大的处理器获得了优势。现在情况已经改变。锐龙拥有更高效的处理器内核，而AMD锐龙移动处理器与英特尔的竞争则更为激烈。因此，后者需要做一些事情，包括解决GPU性能问题。

详细的Gen11框图

技术文档使很难判断Gen11的性能。但是一些专家认为，英特尔将能够更有效地与AMD竞争。至少比以往更有效。

新的Intel GT2架构提供了64个EU执行单元，而Skylake类处理器则为24个。与上一代产品相比，芯片上资源的显着扩展将改善整体性能。下表显示了图形子系统Gen9和Gen11的比较特性。

关键指标Gen9和Gen11

根据技术特征，Gen11的计算性能以及纹理（纹理采样）的吞吐量将提高约2.67倍。光栅运算单元（ROP）的带宽增加了一倍，每个时钟的高Z测试次数也增加了两倍。

L3缓存增加了三倍，GPU的写入吞吐量已翻倍至每个时钟64字节。使用DDR4时的内存带宽应保持不变，但从理论上讲，LPDDR4支持可提供更高的时钟速度。

最后一级缓存在GPU和CPU之间共享，以减少数据流量。改进了视频解码器块以降低比特率。它们允许同时解码4K和8K的多个流。增加了对自适应同步的支持，并改进了高清视频的解码。

GPU现在具有共享的本地内存，在读取时该内存不会阻止对L3缓存的访问。英特尔声称这可以减少延迟并提高原子操作的效率。

SoC芯片级的存储器层次结构及其最大理论吞吐量

英特尔声称已显着提高了Gen11的整体内存带宽。

该文档描述了英特尔在图形加速器中实现的两项新技术：

粗像素阴影（粗像素阴影，CPS）；
按位置着色（仅位置平移，POSH）。

粗像素阴影减少了GPU的负载，减少了用于渲染图像的颜色样本的数量。屏幕截图显示，CPS对渲染质量几乎没有影响。

从游戏城堡1拍摄，分辨率为2560×1440（左侧像素率为1×1，右侧像素为2×2）。 尽管粗略的像素着色减少了着色器调用的次数，但在高像素密度的显示器上几乎没有明显的区别。 为了进行比较，还显示了没有抗锯齿的缩放图像，分辨率为1280×720

减少调用像素着色器的次数，可以节省能量并提高性能（即帧频）20-40％。

在此图像中，红色边框中的物体被标识为距离相机很远，并且对于整体图像质量而言并不重要，因此可以减少细节，而不会对图像质量产生明显影响，而随后会提高帧速率

文档说，POSH管道与主应用程序并行运行位置着色器，这通常可使您更快地生成结果。这是“仅位置基于图块的渲染”（PTBR）渲染系统的一部分。

总的来说，Gen11对于英特尔处理器而言将是重要的更新。前两代AMD Ryzen Mobile与Skylake的劣质显卡竞争。 ExtremeTech 写道，第三代Ryzen Mobile APU只要问世，就必须与功能更强大的Intel芯片竞争。

Intel Gen11 GPU架构和Intel独立显卡

More articles: