Die Siliziumphotonik stolpert über den letzten Meter

Wir haben die Optik bereits im Haus verlegt, aber die Verlegung im Prozessor ist immer noch problematisch




Wenn Sie den Eindruck haben, dass wir heute kurz vor einer technologischen Revolution stehen, stellen Sie sich vor, wie es Mitte der 1980er Jahre war. Siliziumchips verwendeten Transistoren mit einer charakteristischen Größe, gemessen in Mikrometern. Glasfasersysteme haben Billionen von Bits mit enormer Geschwindigkeit um die Welt bewegt. Alles schien möglich zu sein - Sie müssen nur digitale Siliziumlogik, Optoelektronik und Datenübertragung über Glasfaser kombinieren.

Die Ingenieure stellten sich vor, wie sich all diese bahnbrechenden Technologien an dem Punkt weiterentwickeln und konvergieren würden, an dem die Photonik mit der Elektronik verschmolz und diese schrittweise ersetzte. Mit Photonics können Sie Bits nicht nur zwischen Ländern, sondern auch innerhalb von Rechenzentren und sogar innerhalb von Computern verschieben. Glasfaser würde Daten von Chip zu Chip übertragen - das dachten sie. Und selbst die Chips selbst wären photonisch - viele glaubten, dass unglaublich schnelle Logikchips eines Tages Photonen anstelle von Elektronen verwenden würden.

Dazu kam es natürlich nicht. Unternehmen und Regierungen haben Hunderte Millionen Dollar in die Entwicklung neuer photonischer Komponenten und Systeme investiert, die Computerserver-Racks in Rechenzentren mithilfe von Glasfasern integrieren. Und heute verbinden solche photonischen Geräte die Racks in vielen Rechenzentren wirklich. Aber hier hören die Photonen auf. Innerhalb des Racks sind einzelne Server über kostengünstige Kupferdrähte und Hochgeschwindigkeitselektronik miteinander verbunden. Und natürlich werden Metallleiter auf den Platinen selbst bis zum Prozessor platziert.

Versuche, die Technologie in die Server selbst zu übertragen und die Glasfaser direkt den Prozessoren zuzuführen, basierten auf einer wirtschaftlichen Grundlage. Tatsächlich gibt es einen Markt für optische Transceiver für Ethernet mit einem Volumen von fast 4 Milliarden US-Dollar pro Jahr, der laut LightCounting, einem Marktforschungsunternehmen, bis 2020 auf 4,5 Milliarden US-Dollar und 50 Millionen Komponenten anwachsen soll . Die Photonik hat diese letzten Meter jedoch nicht überschritten und das Computer-Rack im Rechenzentrum vom Prozessor getrennt.

Das enorme Potenzial dieser Technologie unterstützte den Traum jedoch weiterhin. Bisher sind technische Probleme weiterhin von Bedeutung. Jetzt endlich bieten neue Ideen zu Rechenzentrumsschemata praktikable Möglichkeiten zur Organisation der Photonenrevolution, die dazu beitragen können, den Zustrom von Big Data einzudämmen.




Im Inneren des Photonenmoduls

Jedes Mal, wenn Sie online gehen, digitales Fernsehen schauen oder fast jede Aktion in der heutigen digitalen Welt ausführen, verwenden Sie die Daten, die durch die optischen Transceiver-Module geleitet wurden. Von der Aufgabe ist es, das Signal zwischen dem optischen und dem digitalen Modus umzuwandeln. Diese Geräte befinden sich an jedem Ende der Glasfaser, die Daten im Rechenzentrum eines großen Cloud-Dienstes oder sozialen Netzwerks steuert. Geräte werden an den Schalter oben am Server-Rack angeschlossen und wandeln die optischen Signale in elektrische Signale um, sodass sie dann mehrere Server in diesem Rack erreichen. Transceiver wandeln auch Daten von diesen Servern in optische Signale zur Übertragung an andere Racks oder über ein Netzwerk von Switches zum Internet um.

Jedes optische Modul enthält drei Hauptkomponenten: einen Sender mit einem oder mehreren optischen Modulatoren, einen Empfänger mit einer oder mehreren Fotodioden und CMOS-Chips, die Daten codieren und decodieren. Gewöhnliches Silizium emittiert Licht sehr schlecht, so dass Photonen von einem von den Chips getrennten Laser erzeugt werden (obwohl er im selben Gehäuse wie sie platziert werden kann). Der Laser repräsentiert keine Bits durch Ein- und Ausschalten - er wird ständig eingeschaltet und die Bits werden mit einem optischen Modulator im Lichtstrahl codiert.

Dieser Modulator, das Herzstück des Senders, kann von verschiedenen Typen sein. Besonders erfolgreich und einfach heißt der Mach-Zehnder-Modulator. Darin lenkt ein schmaler Siliziumwellenleiter das Laserlicht. Der Wellenleiter verzweigt sich in zwei Teile und konvergiert nach einigen Millimetern wieder. In einer normalen Situation hätten eine solche Gabel und Verbindung keine Auswirkung auf die Lichtleistung, da beide Arme des Wellenleiters die gleiche Länge haben. Beim Zurückschalten bleiben die Lichtwellen in Phase miteinander. Wenn jedoch eine elektrische Spannung an einen Zweig angelegt wird, ändert dies seinen Brechungsindex, wodurch die Lichtwelle verlangsamt oder beschleunigt wird. Infolgedessen interferieren sie nach dem Zusammentreffen zweier Wellen destruktiv miteinander und unterdrücken das Signal. Daher verwenden wir durch Variieren der Spannung am Zweig ein elektrisches Signal, um die optische zu modulieren.

Der Empfänger ist einfacher: Es ist nur eine Fotodiode und ihre unterstützenden Schaltkreise. Das Licht, das durch die optische Faser fällt, erreicht die Germanium- oder Silizium-Germanium-Fotodiode des Empfängers, die Strom erzeugt - normalerweise wird jeder Lichtimpuls in Spannung umgewandelt.

Der Modulator und der Empfänger werden durch Verstärkung, Paketverarbeitung, Fehlerkorrektur, Pufferung und andere Aufgaben bedient, die behandelt werden müssen, um den Gigabit-Ethernet-Standard für Glasfaser zu erfüllen. Wie viele Aufgaben auf demselben Chip oder zumindest in demselben Gehäuse ausgeführt werden, das die Photonik verwaltet, hängt vom Hersteller ab, aber der größte Teil der elektronischen Logik ist von der Photonik getrennt.


Photonik kann niemals Daten zwischen verschiedenen Teilen eines Siliziumchips übertragen. Der Kreisoszillator des optischen Schalters hat die gleiche Funktion wie ein einzelner Transistor, nimmt jedoch das 10.000-fache der Fläche ein.

Es gibt immer mehr integrierte Siliziumschaltungen, in denen sich optische Komponenten befinden, und dies könnte Sie glauben lassen, dass die Integration der Photonik in den Prozessor unvermeidlich war. Und für einige Zeit wurde es so gedacht.

Die wachsende Diskrepanz zwischen der schnellen Größenreduzierung elektronischer Logikchips und der Unfähigkeit der Photonik, mit ihnen Schritt zu halten, wurde jedoch unterschätzt oder sogar ignoriert. Transistoren haben heute charakteristische Abmessungen von mehreren Nanometern. Mit der 7-nm-CMOS-Technologie können mehr als hundert Allzweck-Logiktransistoren auf jedem Quadratmikrometer platziert werden. Und wir erwähnen immer noch nicht das Labyrinth komplexer Kupferdrähte über ihnen. Zusätzlich zum Vorhandensein von Milliarden von Transistoren auf jedem Chip verfügt es über ein Dutzend Ebenen von Metallverbindungen, die diese Transistoren mit Registern, Multiplikatoren, arithmetisch-logischen Vorrichtungen und komplexeren Strukturen verbinden, aus denen die Prozessorkerne und andere notwendige Schaltungen bestehen.

Das Problem ist, dass eine typische optische Komponente, beispielsweise ein Modulator, nicht wesentlich kleiner gemacht werden kann als die Wellenlänge des Lichts, das sie trägt - was ihre minimale Breite auf 1 Mikrometer begrenzt. Kein Moores Gesetz kann diese Einschränkung überwinden. Es geht nicht darum, immer fortschrittlichere Lithografietechnologien einzusetzen. Es ist nur so, dass die Elektronen - deren Wellenlänge einige Nanometer beträgt - mager und die Photonen dick sind.

Aber können Hersteller den Modulator einfach integrieren und sich damit abfinden, dass weniger Transistoren auf dem Chip sind? Immerhin werden bereits Milliarden von ihnen dort platziert? Sie können nicht. Aufgrund der großen Anzahl von Systemfunktionen, die jedes Quadratmikrometer eines elektronischen Siliziumchips ausführen kann, ist es sehr teuer, selbst einige wenige Transistoren durch schlechter funktionierende optische Komponenten zu ersetzen.

Einfaches Zählen. Angenommen, durchschnittlich 100 Transistoren befinden sich auf einem Quadratmikrometer. Dann ersetzt ein optischer Modulator, der eine Fläche von 10 Mikrometern mal 10 Mikrometern einnimmt, die Schaltung, die aus 10.000 Transistoren besteht! Denken Sie daran, dass ein herkömmlicher optischer Modulator als einziger Schalter die Lichter ein- und ausschaltet. Aber jeder Transistor selbst kann als Schalter arbeiten. Grob gesagt betragen die Kosten für die Aufnahme dieser primitiven Funktion in die Schaltung 10.000: 1, da für jeden optischen Modulator 10.000 elektronische Schalter vorhanden sind, die vom Schaltungsentwickler verwendet werden können. Kein Hersteller wird solch hohe Kosten akzeptieren, selbst im Austausch für eine spürbare Steigerung der Geschwindigkeit und Effizienz, die durch die Integration von Modulatoren direkt in den Prozessor erzielt werden könnte.

Die Idee, Elektronik auf Chips durch Photonik zu ersetzen, hat andere Nachteile. Beispielsweise führt der Chip wichtige Aufgaben aus, z. B. das Arbeiten mit Speicher, für die die Optik keine Funktionen besitzt. Photonen sind einfach nicht mit den Grundfunktionen eines Computerchips kompatibel. Und in Fällen, in denen dies nicht der Fall ist, ist es nicht sinnvoll, einen Wettbewerb zwischen optischen und elektronischen Komponenten auf demselben Chip zu arrangieren.


Das Schema des Rechenzentrums.
Heute (links) überträgt die Photonik Daten über ein mehrschichtiges Netzwerk. Die Internetverbindung befindet sich auf der obersten (Haupt-) Ebene. Der Switch überträgt Glasfaserdaten an die oberen Rack-Switches.
Morgen (rechts) kann die Photonik die Architektur von Rechenzentren ändern. Eine Rack-Architektur könnte Rechenzentren flexibler machen, indem Computer physisch vom Speicher getrennt und diese Ressourcen über ein optisches Netzwerk verbunden werden.

Dies bedeutet jedoch nicht, dass die Optik nicht in die Nähe von Prozessoren, Speicher und anderen Schlüsselchips gelangen kann. Heute dreht sich der Markt für optische Kommunikation in Rechenzentren um Top-of-Rack-Switches (TORs), zu denen auch optische Module gehören. Oben auf den Zwei-Meter-Racks, in denen Server, Speicher und andere Ressourcen installiert sind, verbindet die Glasfaser die TORs über eine separate Schicht von Switches miteinander. Und sie sind mit einem anderen Satz von Switches verbunden, die den Internetzugang des Rechenzentrums bilden.

Das typische TOR-Panel, in dem die Transceiver stecken bleiben, gibt eine Vorstellung von der Bewegung von Daten. Jeder TOR ist mit einem Transceiver verbunden, der wiederum mit zwei optischen Kabeln verbunden ist (eines zum Senden, das zweite zum Empfangen). In einem TOR mit einer Höhe von 45 mm können 32 Module eingesetzt werden, von denen jedes Daten mit einer Geschwindigkeit von 40 Gbit / s in beide Richtungen übertragen kann, wodurch Daten zwischen zwei Racks mit einer Geschwindigkeit von 2,56 Tbit / s übertragen werden können.

Innerhalb von Racks und Servern fließen die Daten jedoch weiterhin über Kupferdrähte. Und das ist schlecht, weil sie ein Hindernis für die Schaffung schnellerer und energieeffizienterer Systeme darstellen. Optische Lösungen des letzten Messgeräts (oder einiger Messgeräte) - die Verbindung der Optik mit dem Server oder sogar direkt mit dem Prozessor - sind wahrscheinlich die beste Gelegenheit, um einen riesigen Markt für optische Komponenten zu schaffen. Bis dahin müssen jedoch ernsthafte Hindernisse sowohl im Preisbereich als auch im Leistungsbereich überwunden werden.

Schemata, die als "Faser zum Prozessor" bezeichnet werden, sind nicht neu. Die Vergangenheit gibt uns viele Lektionen über ihre Kosten, Zuverlässigkeit, Energieeffizienz und Kanalbreite. Vor ungefähr 15 Jahren war ich am Entwurf und Bau eines experimentellen Transceivers beteiligt , der eine sehr hohe Bandbreite aufwies. Bei der Demonstration wurde ein Kabel mit 12 optischen Adern mit einem Prozessor verbunden. Jeder Kern übertrug digitale Signale, die separat von vier oberflächenemittierenden Lasern mit einem Vertikalresonator (VCSEL) erzeugt wurden. Dies ist eine Laserdiode, die Licht von der Oberfläche des Chips emittiert, und das Licht hat eine höhere Dichte als herkömmliche Laserdioden. Vier VCSEL-codierte Bits durch Ein- und Ausschalten des Lichts, und jedes von ihnen arbeitete mit seiner eigenen Frequenz im selben Kern, wodurch sich sein Durchsatz aufgrund des groben spektralen Multiplexens der Kanäle vervierfachte. Wenn daher jeder VCSEL einen Datenstrom von 25 Gbit / s erzeugte, erreichte der Gesamtdurchsatz des Systems 1,2 Tbit / s. Heute beträgt der Industriestandard für den Abstand zwischen benachbarten Drähten in einem 12-adrigen Kabel 0,25 mm, was eine Durchsatzdichte von 0,4 Tbit / s / mm ergibt. Mit anderen Worten, in 100 Sekunden kann jeder Millimeter in einem Monat so viele Daten verarbeiten, wie das Webarchiv der US Congress Library speichert.

Heutzutage sind noch höhere Geschwindigkeiten erforderlich, um Daten von der Optik zum Prozessor zu übertragen, aber der Anfang war nicht schlecht. Warum wird diese Technologie nicht akzeptiert? Zum Teil, weil dieses System nicht zuverlässig genug und unpraktisch war. Zu dieser Zeit war es sehr schwierig, 48 VCSELs für den Sender herzustellen und sicherzustellen, dass während seiner Lebensdauer keine Fehler auftraten. Eine wichtige Lehre war, dass ein Laser mit vielen Modulatoren viel zuverlässiger gemacht werden kann als 48 Laser.

Heutzutage hat die Zuverlässigkeit von VCSEL so stark zugenommen, dass Transceiver, die diese Technologie verwenden, in Lösungen für kurze Entfernungen in Rechenzentren verwendet werden können. Optische Kerne können durch Multicore-Optiken ersetzt werden, die dieselbe Datenmenge übertragen und diese auf verschiedene Threads innerhalb der Hauptfaser umleiten. In letzter Zeit ist es auch möglich geworden , komplexere Standards für die digitale Datenübertragung zu implementieren - zum Beispiel PAM4 , das die Datenübertragungsrate mit nicht zwei, sondern vier Lichtleistungswerten erhöht. Derzeit laufen Studien zur Erhöhung der Bandbreitendichte in Datenübertragungssystemen von der Optik zum Prozessor. Mit dem Shine-Programm des MIT können wir beispielsweise eine 17-mal höhere Dichte erreichen als vor 15 Jahren.

All dies sind bedeutende Durchbrüche, aber zusammengenommen werden sie nicht ausreichen, um der Photonik den nächsten Schritt in Richtung Prozessor zu ermöglichen. Ich denke jedoch immer noch, dass ein solcher Schritt möglich ist - seitdem gewinnt die Bewegung zur Änderung der Systemarchitektur von Rechenzentren an Dynamik.

Heute werden Prozessoren, Speicher- und Speichersysteme in den sogenannten zusammengebaut Blade-Server , deren spezielle Gehäuse sich in Racks befinden. Dies ist jedoch nicht erforderlich. Anstatt den Speicher auf den Chips im Server zu platzieren, kann er separat platziert werden - auf demselben oder sogar auf einem anderen Rack. Es wird angenommen, dass eine solche Rack-Scale-Architektur (RSA) Computerressourcen effizienter nutzen kann, insbesondere für soziale Netzwerke wie Facebook, in denen die zur Lösung von Problemen erforderliche Menge an Computer und Speicher mit der Zeit zunimmt. Dies vereinfacht auch die Wartung und den Austausch von Geräten.

Warum hilft diese Konfiguration der Photonik, tiefer einzudringen? Weil Konfigurationsänderungen und die dynamische Zuweisung von Ressourcen so einfach sind, dass Sie sich dank einer neuen Generation effizienter, kostengünstiger optischer Switches, die mehrere Terabit pro Sekunde übertragen, leisten können.


Die Technologie, Optik direkt an den Prozessor anzuschließen, besteht seit mehr als 10 Jahren

Das Haupthindernis für diese Änderung in Rechenzentren sind die Kosten für Komponenten und deren Herstellung. Die Siliziumphotonik hat bereits einen Kostenvorteil: Sie kann vorhandene Produktionsanlagen, eine riesige Infrastruktur für die Chipherstellung und ihre Zuverlässigkeit nutzen. Silizium und Licht verbinden sich jedoch unvollkommen: Zusätzlich zu störenden Ineffizienzen bei der Emission von Licht leiden Siliziumkomponenten unter großen Lichtverlusten. Ein typischer optischer Siliziumtransceiver zeigt einen optischen Verlust von 10 dB (90%). Diese Ineffizienz spielt bei kurzen Verbindungen zwischen TOR-Schaltern keine Rolle, da der potenzielle Kostenvorteil von Silizium bisher die Nachteile überwiegt.

Ein wichtiger Teil der Kosten eines optischen Siliziummoduls ist ein so bescheidenes, aber kritisches Detail wie eine optische Verbindung. Dies ist die physikalische Verbindung der optischen Faser und des Empfängers oder Senders und die Verbindung zwischen den Fasern. Jedes Jahr müssen Hunderte Millionen Optik-Optik-Steckverbinder mit höchster Präzision hergestellt werden. Um sich diese Genauigkeit vorzustellen, ist zu beachten, dass der Durchmesser eines menschlichen Haares normalerweise nur geringfügig kleiner ist als der Durchmesser eines einzelnen Strangs aus Quarzglasfasern von 125 Mikrometern, der zum Verbinden von optischen Kabeln verwendet wird. Die Genauigkeit, mit der die Faser im Verbinder ausgerichtet werden muss, liegt in der Größenordnung von 100 nm - einem Tausendstel der Dicke eines menschlichen Haares - oder das Signal wird zu stark verblassen. Es ist notwendig, innovative Methoden zur Herstellung von Steckverbindern für zwei Kabel und zum Anschließen eines Kabels an einen Transceiver zu entwickeln, um den wachsenden Kundenanforderungen nach hoher Genauigkeit und niedrigen Kosten gerecht zu werden. Es gibt jedoch nur sehr wenige Herstellungstechnologien, die die Herstellung relativ kostengünstig machen.

Eine Möglichkeit, die Kosten zu senken, besteht darin, die Kosten für die Chips des optischen Moduls zu senken. Hier kann die Technologie zur Implementierung von Systemen auf der Ebene des gesamten Substrats ( Wafer-Scale-Integration , WSI) helfen. Mit dieser Technologie wird die Photonik auf einem Siliziumsubstrat und die Elektronik auf einem anderen platziert und dann werden die Substrate verbunden (ein Laser, der nicht aus Silizium, sondern aus einem anderen Halbleiter besteht, bleibt getrennt). Dieser Ansatz spart Produktionskosten, da er eine parallele Produktion und Montage ermöglicht.

Ein weiterer Faktor zur Kostenreduzierung ist natürlich das Produktionsvolumen. Angenommen, der gesamte Markt für optisches Gigabit-Ethernet umfasst 50 Millionen Transceiver pro Jahr, und jeder optische Transceiver-Chip nimmt ein Quadrat von 25 mm ein. Unter der Annahme, dass die Fabrik für ihre Herstellung Substrate mit einem Durchmesser von 200 mm verwendet und dann 100% der hergestellten Produkte verwendet werden, werden für diesen Markt 42.000 Substrate benötigt.

Dies mag wie eine große Zahl erscheinen, aber diese Zahl beschreibt tatsächlich nur zwei Wochen Arbeit in einer typischen Fabrik. In der Realität kann jeder Hersteller von Transceivern in wenigen Produktionstagen 25% des Marktes erobern. Es muss eine Möglichkeit geben, das Volumen zu erhöhen, wenn wir die Kosten wirklich senken wollen. Die einzige Möglichkeit, dies zu tun, besteht darin, die Verwendung der Photonik unterhalb des TOR-Schalters bis hin zu den Prozessoren auf den Servern zu verstehen.

Wenn die Siliziumphotonik jemals dort eindringt, wo alle elektronischen Systeme funktionieren, müssen überzeugende technische und wirtschaftliche Gründe vorliegen. Die Komponenten müssen alle wichtigen Probleme lösen und das Gesamtsystem ernsthaft verbessern. Sie müssen klein, energieeffizient und äußerst zuverlässig sein und Daten extrem schnell übertragen.

Eine Lösung, die all diese Anforderungen erfüllt, gibt es heute nicht mehr. Daher wird sich die Elektronik ohne Integration in die Optik weiterentwickeln. Ohne ernsthafte Durchbrüche gelangen dicke Photonen nicht an die Stellen des Systems, an denen magere Elektronen dominieren. Wenn jedoch optische Komponenten in sehr großen Mengen zu einem sehr niedrigen Preis zuverlässig hergestellt werden können, kann der Traum von einigen Jahrzehnten, Optik an den Prozessor und die damit verbundenen Architekturen anzuschließen, Wirklichkeit werden.

In den letzten 15 Jahren haben wir erhebliche Fortschritte erzielt. Wir kennen uns besser mit optischen Technologien aus und wissen, wo sie in Rechenzentren eingesetzt werden können und wo nicht. Ein robuster kommerzieller Markt für optische Komponenten im Wert von mehreren Milliarden Dollar wurde entwickelt. Optische Steckverbinder sind zu einem wichtigen Bestandteil der globalen Informationsstruktur geworden. Die Integration einer großen Anzahl optischer Komponenten in das Herz elektronischer Systeme bleibt jedoch unpraktisch. Aber wird es so bleiben? Ich denke nicht.

Source: https://habr.com/ru/post/de423911/


All Articles