Intel Gen11 GPU架构和Intel独立显卡


离散入门级显卡Intel Graphics Xe,正式发布于3月20日在GDC 2019游戏大会上

英特尔已经发布了Gen11 GPU的文档 ,其中描述了它们与上一代产品的不同之处。 预计Intel Gen11架构将成为分立Xe显卡的未来架构的基础,因此,此处介绍的技术可以视为这些显卡中实现的至少某些功能的预览。 到目前为止,英特尔还没有透露有关未来显卡的任何消息,只显示了几张照片(或渲染图)。


英特尔酷睿处理器的体系结构,片上系统(SoC)和内部连接的环形系统(环形互连)

从历史上看,用于台式机和某些移动芯片的英特尔中端图形处理器GT2在性能上不及AMD芯片。 在这种比较中,与从AMD Bulldozer微架构派生的APU相比,英特尔历来凭借更强大的处理器获得了优势。 现在情况已经改变。 锐龙拥有更高效的处理器内核,而AMD锐龙移动处理器与英特尔的竞争则更为激烈。 因此,后者需要做一些事情,包括解决GPU性能问题。


详细的Gen11框图

技术文档使很难判断Gen11的性能。 但是一些专家认为 ,英特尔将能够更有效地与AMD竞争。 至少比以往更有效。

新的Intel GT2架构提供了64个EU执行单元,而Skylake类处理器则为24个。 与上一代产品相比,芯片上资源的显着扩展将改善整体性能。 下表显示了图形子系统Gen9和Gen11的比较特性。


关键指标Gen9和Gen11

根据技术特征,Gen11的计算性能以及纹理(纹理采样)的吞吐量将提高约2.67倍。 光栅运算单元(ROP)的带宽增加了一倍,每个时钟的高Z测试次数也增加了两倍。

L3缓存增加了三倍,GPU的写入吞吐量已翻倍至每个时钟64字节。 使用DDR4时的内存带宽应保持不变,但从理论上讲,LPDDR4支持可提供更高的时钟速度。

最后一级缓存在GPU和CPU之间共享,以减少数据流量。 改进了视频解码器块以降低比特率。 它们允许同时解码4K和8K的多个流。 增加了对自适应同步的支持,并改进了高清视频的解码。

GPU现在具有共享的本地内存,在读取时该内存不会阻止对L3缓存的访问。 英特尔声称这可以减少延迟并提高原子操作的效率。


SoC芯片级的存储器层次结构及其最大理论吞吐量

英特尔声称已显着提高了Gen11的整体内存带宽。

该文档描述了英特尔在图形加速器中实现的两项新技术:

  • 粗像素阴影(粗像素阴影,CPS);
  • 按位置着色(仅位置平移,POSH)。

粗像素阴影减少了GPU的负载,减少了用于渲染图像的颜色样本的数量。 屏幕截图显示,CPS对渲染质量几乎没有影响。


从游戏城堡1拍摄,分辨率为2560×1440(左侧像素率为1×1,右侧像素为2×2)。 尽管粗略的像素着色减少了着色器调用的次数,但在高像素密度的显示器上几乎没有明显的区别。 为了进行比较,还显示了没有抗锯齿的缩放图像,分辨率为1280×720

减少调用像素着色器的次数,可以节省能量并提高性能(即帧频)20-40%。


在此图像中,红色边框中的物体被标识为距离相机很远,并且对于整体图像质量而言并不重要,因此可以减少细节,而不会对图像质量产生明显影响,而随后会提高帧速率

文档说,POSH管道与主应用程序并行运行位置着色器,这通常可使您更快地生成结果。 这是“仅位置基于图块的渲染”(PTBR)渲染系统的一部分。



总的来说,Gen11对于英特尔处理器而言将是重要的更新。 前两代AMD Ryzen Mobile与Skylake的劣质显卡竞争。 ExtremeTech 写道 ,第三代Ryzen Mobile APU只要问世,就必须与功能更强大的Intel芯片竞争。

Source: https://habr.com/ru/post/zh-CN444972/


All Articles