硅光子学跌落最后一米

我们已经将光学系统放置在房屋上,但是将其放置在处理器上仍然存在问题




如果您觉得今天我们正处于技术革命的边缘,请想象一下1980年代中期的情况。 硅芯片使用的晶体管的特征尺寸以微米为单位。 光纤系统已经以惊人的速度在全球移动了数万亿比特。 一切似乎都是可能的-您只需要结合数字硅逻辑,光电和通过光纤的数据传输即可。

工程师们想到了所有这些突破性技术将如何在光子学与电子融合并逐步取代它的时刻继续发展和融合。 光子学使您不仅可以在国家之间移动数据位,而且还可以在数据中心甚至计算机内部移动数据位。 光纤会在芯片之间传输数据-他们认为是这样。 甚至芯片本身也将是光子-许多人认为,难以置信的快速逻辑芯片总有一天会开始使用光子而不是电子。

自然地,这并不是事实。 公司和政府投入了数亿美元来开发新的光子组件和系统,这些组件和系统使用光纤将计算机服务器机架集成到数据中心中。 如今,此类光子设备已真正连接了许多数据中心的机架。 但这是光子停止的地方。 在机架内部,使用低成本铜线和高速电子设备将各个服务器相互连接。 当然,金属导体也一直放置在板上,一直到处理器。

尝试将技术推入服务器本身,将光纤直接馈送到处理器是基于经济基础的。 实际上,根据市场研究公司LightCounting的数据,以太网光收发器市场每年的规模将近40亿美元,到2020年将增长到45亿美元,组件数量将达到5000万。 但是光子学并没有通过最后几米,将数据中心的计算机机架和处理器分开。

但是,这项技术的巨大潜力继续支持着这一梦想。 到目前为止,技术问题仍然很重要。 但是,最后,有关数据中心方案的新想法终于为组织光子革命提供了可行的方法,从而有助于遏制大数据的涌入。




在光子模块内部

每次上网,观看数字电视或在当今的数字世界中几乎执行任何操作时,您都使用通过光收发器模块传递的数据。 任务是在光学和数字模式之间转换信号。 这些设备位于光纤的两端,该光纤在任何大型云服务或社交网络的数据中心内驱动数据。 设备插入位于服务器机架顶部的交换机,然后将光信号转换为电信号,以便它们随后到达该机架中的多台服务器。 收发器还将来自这些服务器的数据转换为光信号,以传输到其他机架或通过交换机网络传输到Internet。

每个光学模块包含三个主要组件:具有一个或多个光学调制器的发送器,具有一个或多个光电二极管的接收器以及对数据进行编码和解码的CMOS芯片。 普通硅的发光非常差,因此光子是由与芯片分离的激光产生的(尽管可以将其放置在与它们相同的外壳中)。 激光不能通过打开和关闭来表示位,而是始终打开,并且使用光学调制器将位编码在其光束中。

该调制器是发送器的心脏,可以具有不同的类型。 尤其成功且简单的方法称为Mach-Zehnder调制器。 在其中,狭窄的硅波导引导激光。 波导分成两部分,几毫米后又会聚。 在正常情况下,这种叉和连接不会对光输出产生影响,因为波导的两个臂的长度相同。 重新连接,光波保持彼此同相。 但是,如果在一个分支上施加电压,则会改变其折射率,从而减慢或加速光波。 结果,在遇到两个波之后,它们彼此相消地干扰,从而抑制了信号。 因此,通过改变分支处的电压,我们使用电信号来调制光。

接收器更简单:它只是一个光电二极管及其支持电路。 穿过光纤的光到达接收器的锗或硅锗光电二极管,后者会产生电流-通常每个光脉冲都会转换为电压。

调制器和接收器通过放大,数据包处理,纠错,缓冲以及其他需要满足千兆位以太网光纤标准的任务来服务。 在管理光子的同一芯片上或至少在同一外壳中执行多少任务取决于制造商,但大多数电子逻辑与光子分开。


光子学永远无法在硅芯片的不同部分之间传输数据。 光开关的圆形振荡器执行与单个晶体管相同的功能,但占用的面积是其10,000倍。

越来越多的硅集成电路中都有光学组件,这可能使您认为将光子集成到处理器中是不可避免的。 一段时间以来,人们一直这么认为。

但是,电子逻辑芯片尺寸的快速缩小与光子学无法跟上它们之间的差距越来越大,这一点被低估甚至忽略了。 如今,晶体管具有几纳米的特征尺寸。 借助7 nm CMOS技术,每个平方微米上可以放置一百多个通用逻辑晶体管。 而且我们仍然没有提及它们上方复杂的铜线的迷宫。 除了每个芯片上有数十亿个晶体管外,它还具有数十种金属化合物,这些化合物将这些晶体管连接到寄存器,乘法器,算术逻辑器件以及组成处理器核心和其他必要电路的更复杂的结构中。

问题在于,不能使典型的光学组件(例如调制器)明显小于其携带的光的波长-这将其最小宽度限制为1微米。 摩尔定律无法克服这一限制。 使用越来越多的先进光刻技术不是问题。 只是波长几纳米的电子是稀薄的,光子是厚的。

但是制造商是否可以简单地集成调制器并接受芯片上晶体管更少的事实呢? 毕竟,数十亿已经被放置在那里了? 他们不能。 由于硅电子芯片的每个平方微米可以执行的大量系统功能,用功能较差的光学组件替换甚少的晶体管将非常昂贵。

简单计数。 假设平均100个晶体管位于平方微米上。 然后,一个占地10微米乘10微米的光调制器取代了由10,000个晶体管组成的电路! 回想一下,传统的光调制器是唯一打开和关闭灯的开关。 但是每个晶体管本身都可以用作开关。 因此,大致来说,在电路中包含该基本功能的成本为10,000:1,因为每个光调制器都有10,000个电子开关,电路设计人员可以使用。 即使换取速度和效率的明显提高,也没有制造商会接受如此高的成本,这可以通过将调制器直接集成到处理器中来获得。

用光子学代替芯片上的电子器件的想法还有其他缺点。 例如,芯片执行关键任务,例如处理内存,而光学设备则没有能力。 光子与计算机芯片的基本功能根本不兼容。 而且如果不是这种情况,则在同一芯片上安排光学和电子组件之间的竞争是没有意义的。


数据中心方案。
如今(左),光子学通过多层网络传输数据。 Internet连接处于最高(主要)级别。 交换机将光纤数据传输到上层机架交换机。
明天(在右侧),光子学将能够改变数据中心的架构。 机架级架构可以通过将计算机与内存物理上分开并通过光网络链接这些资源来使数据中心更加灵活。

但这并不意味着光学器件将无法接近处理器,内存和其他关键芯片。 如今,数据中心的光通信市场围绕着机架顶交换机(TOR)展开,其中包括光模块。 在安装了服务器,内存和其他资源的两米长机架的顶部,光纤通过单独的交换机层将TOR连接在一起。 它们连接到另一组交换机,这些交换机构成了数据中心的Internet访问。

收发器卡在典型的TOR面板上,可以了解数据的移动情况。 每个TOR连接到一个收发器,然后依次连接到两根光缆(一根用于传输,另一根用于接收)。 在高度为45 mm的TOR中,可以插入32个模块,每个模块都可以在两个方向上以40 Gbit / s的速度传输数据,因此可以在两个机架之间以2.56 Tbit / s的速度传输数据。

但是,在机架和服务器内部,数据仍然通过铜线流动。 这很不好,因为它们成为创建更快,更节能的系统的障碍。 最后一个仪表(或几米)的光学解决方案-将光学系统连接到服务器,甚至直接连接到处理器-可能是为光学组件创造巨大市场的最佳机会。 但是直到那时,在价格领域和绩效领域都必须克服严重的障碍。

称为“光纤到处理器”的方案并不新鲜。 过去为我们提供了有关其成本,可靠性,能效和通道宽度的许多经验教训。 大约15年前,我参与了实验收发器的设计和构建,该收发器具有很高的带宽。 该演示将12条光芯电缆与处理器连接在一起。 每个内核传输带有垂直谐振器 (VCSEL)的四个表面发射激光器分别产生的数字信号。 这是一种从芯片表面发射光的激光二极管,并且该光的密度比常规激光二极管高。 四个VCSEL编码位通过打开和关闭灯来实现,并且每个位在相同的内核中以自己的频率工作,由于通道粗谱多路复用,其吞吐量增加了三倍。 因此,如果每个VCSEL产生25 Gbit / s的数据流,则系统的总吞吐量将达到1.2 Tbit / s。 如今,12线电缆中相邻线之间的距离的行业标准为0.25 mm,其吞吐密度为0.4 Tbps / mm。 换句话说,在100秒内,每毫米可以处理一个月内美国国会图书馆网络档案存储的数据量。

如今,需要更高的速度将数据从光学器件传输到处理器,但是开始的时候还不错。 为什么不接受这项技术? 部分原因是该系统不够可靠且不切实际。 当时,很难为发射器制造48个VCSEL,并确保其使用寿命内没有故障。 一个重要的教训是,一个带有许多调制器的激光器比48个激光器更可靠。

如今,VCSEL的可靠性已大大提高,以至于使用该技术的收发器可用于数据中心短距离的解决方案中。 可以用承载相同数据量的多芯光纤替换光芯,然后将它们重定向到主光纤内部的不同线程。 近来,实现数字数据传输的更复杂的标准(例如PAM4)变得可能,该标准不使用两个光功率值而是使用四个光功率值来提高数据传输速率。 正在进行研究以增加从光学器件到处理器的数据传输系统的带宽密度-例如,麻省理工学院的Shine程序使我们实现的密度比15年前高出17倍。

所有这些都是非常重大的突破,但是加在一起,它们将不足以使光子学朝处理器迈出下一步。 但是,我仍然认为这样的步骤是可能的-因为现在改变数据中心的系统架构的运动正在兴起。

如今,处理器,内存和存储系统被组装在所谓的 刀片服务器 ,其特殊机箱位于机架中。 但这不是必需的。 除了将内存放置在服务器中的芯片上之外,还可以将其单独放置-在同一块上,甚至在另一个机架上。 人们认为,这种机架规模的架构 (RSA)可以更有效地使用计算资源,尤其是对于Facebook这样的社交网络而言,解决问题所需的计算和内存量会随着时间的增长而增长。 它还简化了维修和更换设备的任务。

为什么此配置有助于光子学更深入地渗透? 由于配置更改和资源的动态分配非常简单,这要归功于新一代高效,廉价的光开关,它们每秒传输数个兆位。


将光学元件直接连接到处理器的技术已经存在了十多年

数据中心发生这种变化的主要障碍是组件成本及其生产。 硅光子学已经具有一个成本优势-它可以利用现有的生产设施,庞大的芯片制造基础设施及其可靠性。 但是,硅和光不能完美地结合在一起:除了干扰光发射效率低下外,硅组件还会遭受较大的光损耗。 典型的硅光收发器的光损耗为10 dB(90%)。 这种低效率对于TOR开关之间的短连接无关紧要,因为到目前为止,硅的潜在成本优势超过了其缺点。

硅光模块成本的重要部分是诸如光连接之类的适度但关键的细节。 这是光纤与接收器或发送器的物理连接,以及光纤之间的连接。 每年,必须以最高精度制造数亿个光学连接器。 要想像这种准确性,请注意,人发的直径通常仅略小于用于连接光缆的125微米石英玻璃纤维的单股直径。 在连接器中对准光纤的精度约为100 nm-人发厚度的千分之一-否则信号将褪色太多。 有必要开发创新的方法来制造两条电缆的连接器以及将电缆连接到收发器,以满足不断增长的客户对高精度和低成本的需求。 但是,很少有制造技术可以使制造变得相当便宜。

降低成本的一种方法是降低光学模块芯片的成本。 在这里,用于在整个基板水平上实施系统的技术( 晶圆级集成 ,WSI)可以提供帮助。 使用该技术,将光子学放置在一个硅基板上,将电子学放置在另一个硅基板上,然后连接基板(不是由硅制成的激光,而是由另一半导体制成的激光保持分离)。 这种方法节省了生产成本,因为它允许并行生产和组装。

降低成本的另一个因素当然是生产量。 假设整个光千兆以太网市场每年为5000万个收发器,每个光收发器芯片占用25平方毫米。 假设工厂使用直径为200毫米的基板进行生产,然后使用100%的制成品,则该市场需要42,000个基板。

这似乎是一个很大的数字,但是这个数字实际上仅描述了一家典型工厂中两个星期的工作。实际上,任何收发器制造商都可以在几天的生产中占领25%的市场。如果我们想真正降低成本,就必须有增加产量的方法。唯一的方法是了解如何使用TOR开关下方的光子学,一直到服务器中的处理器使用。

如果硅光子学曾经渗透到所有电子系统正常工作的地方,那么将不得不出现令人信服的技术和经济原因。组件将必须解决所有重要问题,并从整体上认真改善系统。它们必须小巧,节能且极其可靠,并且还必须非常快速地传输数据。

如今,不存在满足所有这些要求的解决方案,因此电子产品将在不与光学器件集成的情况下继续发展。没有严重的突破,厚的光子将无法到达稀薄电子占主导地位的那些系统。但是,如果能够以非常低的价格可靠地大批量生产光学组件,那么将光学器件连接到处理器及其相关架构的几十年的梦想就可以实现。

在过去的15年中,我们取得了重大进展。我们更精通光学技术以及它们在数据中心中可以使用和不能使用的地方。已经开发了强大的数十亿美元的光学组件商业市场。光学连接器已成为全球信息结构的关键部分。但是,将大量光学组件集成到电子系统的核心仍然不切实际。但是会保持这种方式吗?我认为不是。

Source: https://habr.com/ru/post/zh-CN423911/


All Articles