英伟达时代

图片

显然,GPU计算时代已经来临! 英特尔表现不佳。 如果您过去几年没有经常阅读我的博客,我会解释说,我[ Alex St. John ] 站在 1994年Microsoft 最初的DirectX团队的起源 ,并与其他第一批DirectX创作者(Craig Eisler和Eric Engstrom),并为其在视频游戏行业和图形芯片制造商之间的分销做出了贡献。 在我的博客中,您可以找到关于这个主题的很多故事,但是与我撰写的这篇文章直接相关的故事是我在2013年写的。
英伟达历史

我认为Nvidia未来游戏的版本是正确的,我真的很喜欢生活在一个可以使用如此出色的计算机功能的时代。 在我看来,我已经生活在一个时代,在这个时代中,我可以沿着Enterprise桥行走,并使用扭曲驱动器。 从字面上看,Nvidia将warp称为可以在GPU上运行的并行进程的最小单位。

那些遵循股票行情的人可能已经注意到,在经历了多年的缓慢攀升之后,英伟达的股票最近急剧上涨。 在我看来,这一突如其来的突破标志着计算机计算领域的革命性变革,代表了GPGPU开发多年进步的顶点。 时至今日,英特尔在工业市场上一直保持着对计算机的垄断地位,成功地抵制了竞争对手对工业计算机优势的攻击。 这种主导地位已经在今年结束,并且市场正在接近。 要了解正在发生的事情以及为什么发生这种情况,我将回到我在微软的早年时代。

在90年代,比尔·盖茨(Bill Gates)创造了“合作”(Cooperatition = Competition +合作)一词来描述与当时其他技术行业领导者之间的折磨竞争伙伴关系。 在谈论英特尔时,这个词经常出现。 尽管微软和英特尔的命运和成功越来越紧密地交织在一起,但两家公司仍在相互争夺统治地位。 两家公司都有专门“试图”获得超越竞争对手优势的人员团队。 微软当时的首席执行官保罗·马里茨(Paul Maritz)非常担心英特尔可能会虚拟化Windows,从而使许多其他竞争性OS进入市场并与Windows并行存在于台式PC上。 有趣的是,Paul Maritz后来成为VMWARE的首席执行官。 确实,英特尔积极投资于此类尝试。 他们的策略之一是尝试在软件级别上模拟所有公认的铁功能,OEM通常使用这些功能来提供PC-视频卡,调制解调器,声卡,网络设备等。 通过将所有外部计算转移到英特尔处理器,该公司可能破坏所有可能增长的替代计算平台的销售和增长,从而威胁英特尔的CPU。 具体而言,英特尔在1994年宣布3DR技术,促使微软创建DirectX。

我曾在Microsoft团队工作过,该团队根据市场中的竞争威胁,负责公司的战略定位,即“开发人员关系小组” [DRG]。 英特尔要求微软派一名代表在3DR演示文稿上发言。 作为Microsoft图形和3D专家,我被派去执行一项特殊任务,评估英特尔新计划可能带来的威胁,并制定有效的应对策略。 我认为英特尔真的在尝试虚拟化Windows,在软件级别上模拟所有可能的数据处理设备。 我写了一个名为“认真对待娱乐”的提案,提议阻止英特尔为缩小Windows尺寸以创建新硬件功能的竞争性消费者市场的尝试。 我想创建一组新的Windows驱动程序,以便在硬件市场上进行激烈的竞争,从而使新媒体的工作,包括音频,数据输入,视频,网络技术等。 在我们正在创造的PC游戏市场中,取决于我们自己的Windows驱动程序。 英特尔无法应对我们为生产消费铁的公司所创建的自由市场中的竞争,因此无法创建可以有效地虚拟化用户可能需要的所有功能的CPU。 这样DirectX就诞生了。

在此博客上,您可以找到许多有关DirectX创建事件的故事,但是总而言之,我们的“邪恶策略”是成功的。 微软意识到,为了占领消费市场并控制英特尔,有必要专注于视频游戏,随后出现了数十家3D芯片制造商。 20多年后,在少数幸存者中,英伟达(Nvidia)与ATI(后来被ATI并购)一起占领了消费类图形市场以及最近的工业计算市场。

这使我们回到了2017年的当年,GPU终于开始完全取代x86处理器,每个人都曾经敬畏地对待它。 为什么现在以及为什么使用GPU? x86霸权的秘密是Windows的成功以及直到1970年代与x86指令的向后兼容性。 英特尔可以保持并增强其在工业市场上的垄断地位,因为使用任何其他指令集将应用程序移植到CPU的成本太高,而这并不占用市场利基。 与x86平台绑定的Windows操作系统惊人的功能集增强了英特尔的市场地位。 当微软和英特尔无法在新兴的移动计算市场上取得主导地位时,终结才开始。 几十年来,x86 CPU市场首次出现裂缝,由ARM处理器填补。此后,苹果和谷歌推出了新的替代Windows操作系统,从而占领了一个新市场。 为什么微软和英特尔未能实现这一飞跃? 您可能会发现有一些有趣原因的汽车,但是在本文的框架中,我想强调一件事-x86向后兼容包。 能源效率对CPU成功的重要性首次超过了速度。 英特尔和微软在PC中嵌入的所有晶体管和用于x86的数百万行代码已成为提高能效的障碍。 英特尔和微软在市场霸权方面最重要的方面成为一个障碍。

图片

英特尔对速度不断提高的需求以及对向后兼容性的支持,迫使该公司花费越来越多的耗能晶体管,以使每一代x86处理器的速度不断下降。 向后兼容性也严重阻碍了英特尔并行化其芯片的能力。 第一个并行GPU出现在90年代,而第一个Intel双核CPU仅在2005年发布。 即使在今天,英特尔最强大的CPU也只能处理24个内核,尽管大多数现代图形卡的处理器都具有数千个内核。 最初是并行的GPU并没有向后兼容的负担,而且由于独立于体系结构的技术,Direct3D和OpenGL等API可以自由地进行创新和增加并行度,而不必牺牲兼容性或晶体管效率。 到2005年,GPU甚至已成为支持异构通用并行计算的通用计算平台。 所谓异构,是指尽管底层架构和指令集完全不同,但AMD和NVIDIA的芯片仍可以运行相同的编译程序。 在Intel芯片的性能峰值不断下降的时候,GPU每12个月将速度提高一倍,同时将功耗降低一半! 极高的并行度使得可以非常高效地使用晶体管,从而为添加到GPU中的每个后续晶体管都具有有效影响操作速度的能力,而数量越来越多的x86晶体管并不繁忙。

尽管GPU越来越多地入侵工业超级计算机,媒体和VDI,但市场的主要转折来自Google开始有效地使用GPU来训练具有非常有用功能的神经网络。 市场意识到,人工智能将成为大数据处理的未来,并开拓巨大的新自动化市场。 GPU非常适合神经网络的操作。 到目前为止,英特尔已经成功地采用了两种方法来抑制GPU对工业计算的日益增长的影响。

1.英特尔将PCI总线的速度保持在较低水平,并限制了其处理器支持的I / O路径的数量,从而确保GPU在处理负载时始终依赖于英特尔处理器,并且与其他各种有价值的实时高速计算应用程序保持分离由于延迟和PCI带宽限制。 尽管他们的CPU能够限制应用程序对GPU速度的访问,但Nvidia在PCI总线的那一端陷入困境,而无法访问许多实际有用的工业负载。
2.提供了一种廉价的GPU,在消费类处理器上具有最少的功能,可将Nvidia和AMD与高端游戏市场以及市场的普遍接受程度区分开。

英伟达(Nvidia)带来的威胁越来越大,英特尔(Intel)创建兼容x86的超级计算机加速器的失败尝试,迫使英特尔选择了另一种策略。 他们已经收购了Altera,并希望将可编程FPGA包含在英特尔的下一代处理器中。 与竞争对手有限的PCI总线硬件相比,这是确保Intel处理器支持更大的I / O功能的棘手方法,并且GPU不会获得任何优势。 对FPGA的支持使Intel可以朝着在其芯片上支持并行计算的方向发展,而不必参与使用GPU的应用程序不断增长的市场的大门。 它还允许工业计算机制造商创建高度专业的硬件,但仍依赖于x86。 对于英特尔而言,这是一个了不起的举动,因为它排除了GPU一次在多个方向进入工业市场的可能性。 辉煌,但很可能注定要失败。

连续五个新闻报道解释了我确定x86大会将于2017年结束的原因。

1. 软银的VisionFund基金从希望取代英特尔的公司获得930亿美元的投资
2. 软银以320亿美元收购ARM Holdings
3. 软银以40亿美元收购英伟达的股票
4. Nvidia启动Project Denver [Nvidia微体系结构的代号,它结合了简单的硬件解码器和带有动态重新编译功能的软件二进制翻译器的组合来实现ARMv8-A 64/32位指令集。 perev。]
5. NVIDIA宣布 Xavier Tegra SOC ,其Volta GPU具有70亿个晶体管,512个CUDA内核和8个ARM64 Custom内核-一种具有GPU加速ARM内核的移动ARM /混合芯片。

为什么这一系列事件很重要? 正是在这一年,第一代独立GPU进入了广泛访问市场,并能够以PCI形式无障碍启动自己的操作系统。 Nvidia不再需要x86处理器。 ARM具有大量可移植到它们的消费类和工业操作系统以及应用程序。 所有工业和云市场都已从ARM的芯片转换为控制器,以用于各种市场解决方案。 FPGA已经集成到ARM芯片中。 ARM芯片消耗的功率很少,性能也较差,但是GPU极其快速且高效,因此GPU可以提供处理器能力,而ARM内核可以处理不需要处理能力的繁琐的IO和UI操作。 越来越多的处理大数据,高性能计算,机器学习的应用程序不再需要Windows,并且它们无法在x86上运行。 2017年是Nvidia突破束缚并成为不适合基于x86解决方案的有价值的新市场中基于x86的工业计算真正可行的竞争替代品的一年。

如果ARM处理器的功能不足以满足您的需求,那么IBM将与Nvidia合作,生产新一代Power9 CPU,用于处理160条PCIe通道的大数据。



AMD还推出了新的Ryzen CPU ,与Intel不同,AMD在抑制PCI性能方面没有战略兴趣。 他们的消费芯片支持64个PCIe 3.0通道,专业芯片支持128个通道。AMD还推出了新的HIP交叉编译器,使CUDA应用程序与AMD GPU兼容。 尽管这两家公司相互竞争,但两家公司都将受益于英特尔在GPU市场上的替代方案,从而取代了GPU计算。

所有这些都意味着,在未来几年中,基于GPU的解决方案将以更快的速度捕获工业计算,并且桌面界面世界将越来越依赖于云可视化或在移动ARM处理器上工作,因为甚至Microsoft都宣布了对ARM的支持



综上所述,我预计在几年内,我们只会听说到GPU和FPGA之间在工业计算上的优势之战,而CPU的时代将逐渐结束。

Source: https://habr.com/ru/post/zh-CN405409/


All Articles