AMD Radeon VII:高端芯片(第1部分)

第1部分>> 第2部分>>第3部分

在2018年,AMD Radeon Technologies Group稍作喘息。 在2016年推出Polaris架构并在2017年推出Vega架构后,AMD决定享受Vega架构的第一个整年。 该公司将在三年后推出笔记本电脑和Vega服务器的选件,而不是着手于推出第三种体系结构。 尽管AMD在笔记本电脑领域的努力使它朝着一个奇怪的方向发展,但创建Radeon Instinct服务器的工作还是取得了积极的成果。 结果,该公司宣布了首款7纳米GPU。



在11月以Radeon RX 590的形式更新了最新一代产品之后,我们希望AMD在一段时间内关注消费者。 相反,AMD在CES 2019上发布了一个非常意外的公告:该公司将发布新的高端细分消费卡Radeon VII(七)。 基于上述服务器GPU,视频卡被定位为最新的旗舰产品。 Radeon VII专为游戏玩家和内容创作者而设计,应该是AMD迈向游戏玩家的决定性举措。 现在轮到我们考虑最新的AMD卡了。

乍一看,在Radeon VII中,一切似乎都是显而易见的。 该卡的硅基是AMD Vega 20 GPU,它是原始Vega 10的派生产品,已针对科学计算和机器学习进行了增强,并基于台积电的尖端7nm制程技术来提高生产率。 这是AMD构建服务器GPU的重要里程碑-自2013年夏威夷GPU以来,他们发布了首个高端服务器级GPU。 AMD渴望在其开发的后期阶段展示Vega 20,因为该GPU是AMD新型Radeon Instinct MI50和MI60服务器加速器的核心。



主要为服务器设计的Vega 20不属于GPU类别,后者可以廉价而轻松地找到通往消费者的道路。 但是出乎意料的事情发生了:NVIDIA几乎没有将性能指标改为美元。 相反,新的基于Turing的GeForce RTX卡专注于旨在为实时光线渲染游戏渲染宣告新范例并为此分配更多Turing GPU资源的新选项。 最终结果是GeForce RTX 20系列卡的价格相对较高,尽管在换代视频卡时,它们在游戏中的性能提升远不如平时。

面对比原先预期更少的敌意定价环境,AMD最终决定通过以这些高价位之一与NVIDIA对抗,向消费者推出Vega 20。 Radeon VII的售价为699美元,GeForce GTX 2080成为了新的旗舰游戏卡Radeon。



查看规格表,Radeon VII的峰值时钟频率为1800 MHz,而官方峰值频率为1750 MHz。 与RX Vega 64相比,这是一个不错的进步,后者的时钟速度仅为1630 MHz,这意味着AMD的频率提高了约10%。 多亏了开放式散热器和经过修订的SMU,Radeon VII将能够更快地增加并保持更高的时钟速度。 因此,尽管最新的AMD卡并没有增加更多的ROP或CU(实际上,与RX Vega 64相比,甚至略有减少),但吞吐量却达到了新的水平。

但是,与RX Vega 64相比,最大的变化是AMD的内存量增加了一倍,内存带宽增加了一倍以上。 这要归功于7纳米制程技术,由于该技术,最新的AMD图形处理器具有相对适中的331 mm2矩阵尺寸。 额外的空间允许AMD插入器和两个以上的HBM2堆栈,这可以增加VRAM的数量并扩展内存总线。 AMD还能够略微提高内存频率:从RX Vega 64上的1.89 Gbps /引脚到Radeon VII上的平坦2 Gbps /引脚。



有趣的是,基于基本特性,Radeon VII本质上是Radeon Instinct MI50。 因此,如果高性能Radeon VII对专业计算机用户感兴趣,则AMD有“蚕食”本能销售的风险。 结果,AMD减少了芯片的某些功能以更好地区分产品。 我们稍后再讨论,但主要的是该卡的工作频率低于FP64,失去了对ECC芯片的完全支持,并且自然而然地对于消费类产品,使用Radeon Software游戏驱动程序而不是专业的Instinct驱动程序堆栈。

当然,每当谈到将服务器GPU连接到消费类图形卡时,您都在谈论具有强大潜力的强大卡,这当然适用于Radeon VII。 简而言之,最新的AMD旗舰卡的优势在于其高性能,而同类产品中最大的优点是16 GB的HBM2内存。 作为AMD规格相对于NVIDIA竞争对手的为数不多的明显优势之一,VRAM的数量是AMD营销的重要组成部分。 他们将非常重视内容创建和VRAM密集型游戏。 该卡的新颖之处在于它具有三个风扇的散热器,取代了Radeon RX Vega 64/56卡上的单风扇散热器。

此外,另一个小小的优雅变化是:AMD以主板供应商的身份进入零售市场,并直接以699美元的定价出售新卡。考虑到AIB今天也发行了其品牌参考卡,这是避免定价过高的发行价的机会。



同时,从竞争形势来看,出现了一些需要解决的问题。 该提议的重要部分是(如最近所普遍使用的)一套游戏。 当前的Raise the Game Fully Load套装免费提供带有Radeon VII,RX Vega和RX 590卡的Devil May Cry 5,The Division 2和Resident Evil 2,而RX 580和RX 570卡可让您从三个游戏中选择两个。 正如预期的那样,与直接竞争对手(在本例中为RTX 2080)相比,一组游戏将简单地增加价值,但NVIDIA拥有自己的与Anthem和Battlefield V决斗的对决。在Radeon VII有望为之奋斗的情况下对于拥有RTX 2080的消费者,没有最终胜利的机会,这些额外的好处变得越来越重要。

Radeon VII标志着自从竞争环境最近发生变化以来的第一个产品发布,这归因于具有可变刷新率的显示器技术。 刷新率可变的显示器已经成为游戏玩家的必备属性,并且自从该技术在本世纪初问世以来,AMD和NVIDIA卡之间就已经有了明显的区别。 AMD卡支持VESA Adaptive Sync(以AMD FreeSync品牌更广为人知),而台式NVIDIA卡仅支持其专有的G-Sync。 但是上个月,NVIDIA意外地宣布他们的显卡将以“ G-Sync兼容性”品牌支持VESA Adaptive Sync。 关于该程序如何工作的详细信息很少,但是最后,即使FreeSync面板未经G-Sync兼容认证,也可以在NVIDIA驱动程序中使用自适应同步。

最终结果是,尽管NVIDIA的消息在功能实现方面不会干扰AMD,但这会破坏AMD在FreeSync中的优势-以前仅在AMD卡上使用的所有便宜VESA自适应同步显示器现在可以在NVIDIA卡上使​​用。 当然,AMD非常高兴强调“免费”的FreeSync,但是作为对抗NVIDIA的武器,这一营销举措失去了优势。 AMD的官方路线是认为这是FreeSync的胜利。

Radeon VII的发布及其与GeForce RTX 2080相比的竞争地位,意味着AMD需要明确界定其在卡与最新NVIDIA Turing之间的功能差距方面的立场。 因此,AMD在DirectX光线追踪(DXR)技术以及基于AI的图像质量和性能技术(例如DLSS)中的地位保持不变。 简而言之,AMD的观点是,在他们看来,图像质量和性能增益的差异不值得这些功能付出代价。 同时,AMD并没有停滞不前,他们与备用DXR驱动程序一起在为卡提供WinML和DirectML支持。 AMD的风险:如果DXR或NVIDIA的DLSS努力迅速发展,功能差距将成为更大的问题。

总而言之,向消费者发布7纳米游戏GPU是一项非常积极的举措。 特别是在此过程的生命周期的早期。 但是AMD根本没有时间等待观察。 产品促销的唯一严重障碍将是定价:成本应为消费者所接受。

这使我们进入了今天的发布会。 NVIDIA以699美元的价格降低了价格门槛,谈论加速射线追踪和机器学习的专用设备。 对于Radeon VII,条件围绕着16 GB的HBM2以及半专业人员和内容创建者的值而定。 剩下的就是他们的游戏性能。



在Vega 20的引擎盖下:7 nm GCN


尽管由于服务器级图形卡Radeon Instinct MI50和MI60的发布,我们已经对Vega 20很熟悉,但该芯片进入消费市场意味着它是第一款7纳米游戏卡。 快速过渡到较低节点-这次是从14nm LPP GlobalFoundries过渡到7nm TSMC(CLN7FF)-曾经是AMD / ATi的标志,AMD再次急于发布,将产品如此早地带给消费者。 在这种情况下,Vega 20的所有属性显然都面向专业人员和服务器,尽管它们在游戏方面具有优势。

在Radeon VII的复杂故事中,Vega的命运尤其神秘。 首先,这么早就进入消费者市场的Vega 20 7nm GPU令人惊讶。 尽管AMD仅针对Radeon Instinct产品提到了Vega 20(在提及面向游戏玩家的7nm GPU时指的是其未来的Navi架构),但AMD现在声称Radeon VII长期以来一直面向消费市场。 对于14 nm + / 12LP的Vega和Vega 11 GPU(不要与11个Ryzen 2400G Vega计算单元相混淆),也许可以说相同的话,尽管考虑到半导体领域的发展本质,这并非罕见。

老实说,自从推出RX Vega以来,AMD对Vega有点酷,但它并未完全实现其目标。 尽管Radeon VII在某种意义上是“Schrödinger芯片”,但它提出了一些有关7 nm的有趣问题。 例如,AMD已经提前推迟了采样和启动Vega 20的时间。 事实证明,Radeon VII的发布日期最早是Radeon Instinct的后继产品。 此外,矩阵尺寸为331 mm2,这是迄今为止我们在台积电7 nm上所见的不小的移动SoC。 Vega 20 GPU专为计算/以ML为中心的改进而设计,配备了4个HBM2堆栈,并建立在成熟且领先的7nm节点上,看起来并不像是准备以消费者价格提供良好报价的卡。 然而,由于巧合,这件事发生了。



Vega 20将更新的GCN 5架构与7纳米工艺技术相结合,每331 mm2晶体管具有13.2 V的电压(相比之下,Vega 10则为每496 mm2 12.5 V)。 通常,随着空间的减少,节省的空间将重新投资于更多的晶体管。 对于游戏图形卡,这可能意味着任何事情,从更多的CU和功能块,到重新设计布局和增强数据通道以提高频率容限。 当然,后者应提供更高的时钟频率,而这种选择是Vega 10设计的重要组成部分,在Vega 10设计中,使用了大量的晶体管来实现所需的频率特性。 结合较小处理单元的能源效率,新芯片可以接收这些较高的时钟频率,而无需消耗额外的功率。



但是,在Vega 20上,大部分节省的空间都“按原样”保留:该芯片具有更多的可用空间。 造成这种情况的原因有很多,有些显而易见,有些则没有。 首先,对于生命周期开始时位于高级7nm节点上的大型高性能图形处理器,开发和生产非常昂贵。 并且,随着尺寸的增加,成本可能会显着增加,并且产品的获利能力会下降。 尽管到目前为止,仅在移动SoC中才公开看到7nm TSMC工艺,但Vega 20似乎使用面向7.5T HPC的库,而不是使用为移动SoC设计的6T库。



但更重要的是,节省的空间使您可以在类似大小的中间设备上再放置两个HBM2堆栈。 对于当前的HBM2密度和功能,使用一对8-Hi堆栈时,双堆栈芯片的限制为16 GB内存。 但是对于服务器级GPU(尤其是面向机器的学习),需要四层配置来提供32 GB内存和更宽的4096位总线。 AMD为Vega 20选择了这样的配置,此外,它还发布了32 GB(8-Hi)和16 GB(4-Hi)的芯片版本。

反过来,Radeon VII使用这些16 GB芯片之一。 应当注意,这不是AMD推出的首张16 GB Vega卡-他们已经发布了具有这种内存量的卡。 它是专门的Vega Frontier Edition,但在退役后,这是AMD Vega系列中16 GB视频卡的第一个发行版。

为消费者卡配备16 GB内存是AMD的赌博。 而且,我怀疑,这就是AMD希望通过Radeon VII占领专业可视化市场的一部分的原因之一。 在使用工作站和内容创建任务时,很容易出售大量的VRAM,因为已经有可以使用所有这些VRAM的任务。 但是对于游戏来说,这不是最合理的建议,因为游戏对VRAM的要求更加固定,并且直到现在还没有这么大的卡,而且开发人员还没有开始使用16 GB的视频内存资源。 尽管另一方面,大声说“此卡具有足够的视频内存”可能会严重影响销售,并且在2019年,面向游戏玩家的旗舰视频卡无论如何都应该拥有这一数量。

回到Vega 20设计,AMD为降低开发复杂性和降低7 nm成本而采取的另一步骤是坚持使用已经众所周知的架构。 与Vega 10相比,AMD增加了一些小的优化,但是他们不敢进行认真的重新设计。 从本质上讲,这是英特尔著名的滴答作响策略中滴答作响的逻辑。
实际上,Vega 20是Vega 10的直接后继产品,除了内存控制器的数量外,其他功能块的数量也相同。 该GPU包含64个CU和256个纹理单元,分为4个着色器引擎以及64个ROP和AMD GPU。

(我必须补充说,按照我的计划,AMD还谨慎地避免了扩展着色器引擎的问题。近年来,对4 Shader Engine限制的性质仍然不清楚,但是对于Vega,有迹象表明,使用“智能”改善负载平衡会超出这些限制。无论如何,设置和重新设计平衡的4+ SE配置都是一项艰巨的任务,并且AMD是否计划对GCN进行根本性的改变是没有意义的。)



因此,在架构级别,Vega 20是纯粹的进化设计。 但是考虑到上述因素,其中的“进化”要比简单地减少技术单位要多。 这些改进的结合意味着,实际上,在以相同的时钟速度运行时,Vega 20应该比Vega 10快一点。

这里最显着的改进是额外的内存带宽; ROP,纹理单元和ALU的数量是Vega 10的两倍。这对于传统上需要大量带宽的ROP尤其有用。 不仅止步于此,AMD还对Core Fabric进行了一些改进,该Core Fabric将内存与ROP连接(以及其他功能)。 不幸的是,AMD不想透露这些改进是什么,他们只是确认其中的缓存没有变化。



难题的另一部分是,AMD增加了新的指令和数据类型,在某些情况下将加速机器学习。 AMD并未向我们提供完整的信息,但总的来说,我们知道它们已经添加了对INT8和INT4数据类型的支持,这对于低精度输出脚本很有用。 AMD FP16, FP32. , , , FP16-in / FP16-out.

, AMD FP64 Vega 20. , GCN GPU 1/2 1/16 FP32. 1/16. , - , 1/4 1/2. Vega 20, , ½ FP64 AMD Hawaii 2013 . , , FP32 Vega 10 , FP64- : , 8x RX Vega 64 (). , , Radeon VII — 1/4 — .

, AMD . (DCE) 12.1, (UVD) 7.2, video coding engine (VCE) 4.1. Vega 10 . Display Core Next Raven Ridge Video Core Next 1.0, , ASIC .



— SMU, Linux. , 64 . , AMD . Vega 10 ( 'hotspot'), Vega 20 , . , 1-2%, AMD .



SMU, , : , GPU , SMU. , (, GPU-Z), , AMD , API AMD.

, Vega AMD Vega 10 2017 , , Vega. AMD , .

Vega 20, AMD, , . AMD . - , , Next Generation Geometry (NGG) Vega 20 ( , Intelligent Workgroup Distributor ).

, AMD Vegas 10 Draw Stream Binning Rasterizer (DSBR), ; . Rapid Packed Math ( FP16), : Far Cry 5 Wolfenstein II.

FP64 Radeon VII Radeon Instinct MI50


Radeon VII , AMD , . AMD Radeon Pro Radeon Instinct, GPU Vega 20 - AMD. , , Radeon VII , .

– , AMD . , , Radeon VII, . AMD Vega 20, Radeon Instinct MI50 . , , Radeon VII ( 699 ), , AMD.

FP64. Vega 20, FP64 Vega 20 : FP32, 6,9 TFLOPS. Vega 20, , Radeon VII CES, , Radeon VII. , Radeon VII (1/2) FP64, , 1/8. , , AMD : 1/4.

AMD :

Radeon VII , . , Radeon VII, FP64. , Radeon VII 0,88 TFLOPS (DP = 1/16 SP). , , , 3,52 3,46 TFLOPS (DP = 1 / 4SP).

FP64 , , , , VBIOS , , , . , , Radeon VII, [].

, , Radeon VII , MI60 / MI50, FP64, AMD , .

3,5 TLFLOPS FP64, Radeon VII . 2000 . NVIDIA GeForce AMD Radeon FP64. Radeon VII NVIDIA Titan V, 4 .

, , . , , Data Scientist, .



, , , AMD . , . ML, , , INT8 / INT4 Radeon VII. FP16.

full-chip ECC. HBM2 Vega ECC DRAM. Vega 20 ECC , Radeon VII .

, Radeon VII - Vega 20. AMD , Vega 20 GPU PCI-Express 4.0, Radeon Instinct. Radeon VII , PCIe 3.0 ( Zen 2 PCIe 4.0 ). Infinity Fabric , Radeon VII .

, AMD, Radeon VII . «» . Radeon Instinct, Radeon Pro Vega 20.

Radeon VII


- . AMD Radeon VII : . RX Vega 64 Limited Edition Liquid, , AIB .



NVIDIA GeForce RTX , AMD . RX Vega 64 Liquid, AIO CLC R9 Fury X . , Founders Edition, , . . OEM-, «», , - .

TDP, 300 TBP Radeon VII . , 5 RX Vega 64. , , HBM2, , . 300 TBP , . Radeon VII – RX Vega 64, .



回到Radeon VII组件,该卡自然具有两个8针PCIe插槽,但没有像RX Vega这样的BIOS开关,可以将BIOS切换到更低的功耗。并使用普通的LED,侧面显示“ Radeon”字样,而在角落显示“ R”图标。



至于显示输出,这里没有什么奇怪的:3x DisplayPort和1x HDMI。



显卡的轻微拆卸表明,TIM的散热配置为扁平热管,而不是通常的粘贴。尽管传热性能不佳,但我们知道RX Vega卡最终以模压和非模压版本提供,这需要制造商的特别说明。也许这是一种防止ASIC高度差潜在问题的方法。

感谢您与我们在一起。 你喜欢我们的文章吗? 想看更多有趣的资料吗? 通过下订单或将其推荐给您的朋友来支持我们, 为我们为您发明的入门级服务器的独特模拟,为Habr用户提供30%的折扣: 关于VPS(KVM)E5-2650 v4(6核)的全部真相10GB DDR4 240GB SSD 1Gbps从$ 20还是如何划分服务器? (RAID1和RAID10提供选件,最多24个内核和最大40GB DDR4)。

VPS(KVM)E5-2650 v4(6核)10GB DDR4 240GB SSD 1Gbps直到夏天免费,在六个月内付款,您可以在此处订购。

戴尔R730xd便宜2倍?在荷兰和美国,我们有2台Intel Dodeca-Core Xeon E5-2650v4 128GB DDR4 6x480GB SSD 1Gbps 100电视(249美元起) 阅读有关如何构建基础架构大厦的信息。 使用价格为9000欧元的Dell R730xd E5-2650 v4服务器的上等课程?

Source: https://habr.com/ru/post/zh-CN443724/


All Articles