Multikristall: Von der Geschichte bis zur Spekulation über die Zukunft



MCM: Multi-Chip-Layout


Die Mikroelektronik ist berühmt für eine Vielzahl origineller, seltsamer und effektiver technischer Lösungen. Eine davon ist eine Multi-Chip-Anordnung, die auf die eine oder andere Weise fast überall zu finden ist - von Hochleistungs-Workstations bis zu ultraportablen Laptops, von Single-Board-Computern für 10 US-Dollar bis zu IBM-Mainframes.

Dieser Beitrag befasst sich mit der Geschichte seiner Verwendung in Bezug auf Allzweckprozessoren.

Ich warne Sie im Voraus: Ich gebe nicht vor, in meiner Präsentation absolut sachkundig und akademisch zu sein. Zum größten Teil spreche ich über das, was mir begegnet ist, was ich gearbeitet und in meinen Händen gehalten habe.
Verkehrswarnung! Unter dem Schnitt viele Bilder!

Was ist das?


MCM (Multi-Chip-Modul, Multi-Chip-Modul) oder MCP (Multi-Chip-Paket, Multi-Chip-Konfiguration) ist eine technische Lösung, um die Funktionalität eines Mikroschaltkreises in mehrere Chips in einem Gehäuse aufzuteilen. Es unterscheidet sich von Modulen dadurch, dass Mikroschaltungen normalerweise ohne Verbindung „blank“ sind und direkt durch Kristalle auf die Platine gelötet werden. Es wird verwendet, um die Ausbeute an geeigneten Chips zu erhöhen (die Größe eines Einkristalls zu verringern), eine kompakte Verbindung von Kristallen, die nach verschiedenen technologischen Verfahren und Technologien hergestellt wurden.

Nun, fangen wir an?


1995: Wenn der Cache nicht in ein Gate passt

(auch bekannt als Pentium Pro)


Cache - grunzen, dimensional und schnell. Von hier aus ergeben sich einige Probleme: Mit zunehmender Geschwindigkeit seiner Arbeit wird der Durchsatz seines Busses zu einem Engpass, und er beginnt sich zu wärmen. Wir müssen es irgendwie reparieren. Am logischsten ist es, L2 an den Prozessor zu übertragen, auf dem L1 schon lange weidet. Aber es gibt ein Problem und nicht eines: Mit zunehmender Größe des Kristalls nimmt der Prozentsatz der Chip-Ausschussmengen fast exponentiell zu. Was zu tun ist? Machen Sie den Cache natürlich zu einem separaten Chip, aber näher am Hauptchip. Infolgedessen können wir diesen Ziegelstein bewundern:



Die Lösung ist gut, aber die Verpackung anständig kompliziert.

1997: Jetzt Zugabe, wenn auch nicht gleich

(auch bekannt als Pentium II)


Ein großes Keramikgehäuse ist natürlich gut, aber teuer. Versuchen Sie es noch einmal? Und warum nicht. Die Aufgabe ist es, es billiger zu machen, und das ist alles. Das Zurückübertragen des Caches auf die Karte ist keine Option - es wäre ein Schritt zurück. Und die Breite des Cache-Busses ist ebenfalls gewachsen ... Kann alles mit Kühlung in einem Modul kombiniert werden? So wurde Pentium II geboren:



Sie können dieses MCM natürlich nicht in Betracht ziehen, aber da ich mich daran erinnere, wird es hier sein.

(Übrigens, ohne diesen ständigen und unsterblichen alten Mann hätte Ihr bescheidener Diener diesen Artikel nicht geschrieben - den PII-400, der seit vielen Jahren für mich als Gateway und WLAN-Router arbeitet und viele seiner Nachkommen überlebt hat)

2005: D - bedeutet Double Bottom

(auch bekannt als Pentium D)


Wenn der Plan lautet "Ein Kern, aber zu reduzieren!" Er fing an, aus allen Nähten deutlich zu knacken, und Konkurrenten, die kicherten, waren dabei, Dual-Core-Prozessoren auf einem Chip freizugeben, mussten etwas tun und zwar schnell. So trat dieser Atavismus auf, durch den sie ein Loch in den Markt steckten, während die Hauptkräfte auf die vielversprechendere Kernarchitektur geworfen wurden. Wahrscheinlich war der Hauptgrund für die Verwendung dieser Lösung genau die Verkürzung der Entwicklungszeit - die Größe der Kristalle war nicht so groß, dass eine Verdoppelung Probleme verursachte. Nun, hier ist es passiert:



Es gab ähnliche Xeon-Prozessoren für das Serversegment, aber ich kann wenig dazu sagen.

2007: Warum nicht?

(auch bekannt als Core 2 Quad)


Da wir 2006 Dual-Core-Kristalle beherrschten, warum dann spannen? Wir verwenden eine bewährte Lösung - kleben Sie zwei Kristalle in einen Fall und es gibt keine Probleme! Es gibt nichts zu reden, das Bild hat sich nicht viel geändert:



Xeon aus dieser Zeit waren es auch, mit Ausnahme des Sechs-Kern-Modells - es gibt einen großen Kristall.

2010: Vor der Ankunft von Sand

(auch bekannt als Core i3 / 5/7 der ersten Generation)


Bei den Dual-Core-Core-i-Prozessoren der ersten Generation entschieden sie sich für den 32-nm-Prozess, was ziemlich witzig war. Beim bewährten 45-nm-Prozess stellten sie einen integrierten Videokern und einen Speichercontroller her, und einige Kerne mit einem Cache wurden auf einem separaten 32-nm-Kristall platziert. Während ihre älteren Quad-Core-Kollegen den 45-nm-Prozess verwendeten! Die Größen der Kristalle sind auch amüsant:



(Allerdings ist der Videokern von Dual-Core-Prozessoren und jetzt oft mehr als beide Kerne zusammen)

2011: Ein Bulldozer ist gut und zwei sind besser

(auch bekannt als Opteron 6000)


Der Kristall ist schon so groß, die Technologie für ihre Herstellung ist angepasst, was sind eigentlich die Probleme? NUMA? Wir machen diese Prozessoren jedoch bereits für Server und Multi-Socket-Prozessoren. Da es keine Probleme gibt, sammeln wir zwei Kristalle unter einem Deckel:



(Ja, und dann haben die Leute Spaß - der Prozessor ist einer und die NUMA-Knoten sind zwei)

2013: Butterscotch aber ungenießbar

(auch bekannt als eDRAM L4 GPU / CPU Cache)


Aus der Haswell-Generation werden Prozessoren mit integrierter Iris Pro / Iris Plus-Grafik (und in der Skylake-Generation - solche mit normaler Iris) im selben Paket mit einem 64/128-MB-Speicherchip geliefert, der wie ein L4-Cache funktioniert und die Leistung der integrierten Grafik erheblich steigert. Und der Chip ist nicht klein (obwohl der Speicher immer viel Platz beansprucht):



2017: Jahr als Intel Scheiße brix

(alias Ryzen Threadripper & EPYC)


AMD-Ingenieure spielten mit Infinity Fabric, spielten ... Und dann - hoppla! Vier Kristalle unter einem Deckel, die jeweils durch IF miteinander verbunden sind (im Fall von serverseitigem EPYC) oder ein Paar voneinander (Threadripper mit zwei aktiven Kristallen). Alles ist in Ordnung, nur ein Problem ist NUMA (bis zu 4 Knoten pro Prozessor!), Aber es ist ein Problem ausschließlich für Software, die nicht daran angepasst ist. So kam es sehr gut heraus:



2018: Verdoppelung der Zahl - Verdoppelung des Spaßes

(auch bekannt als Zen 2 & Cascade Lake AP)


Also kamen wir zu den aktuellen Ereignissen. Am 5. November kündigte Intel schnell 48-Kern-Dual-Chip-Prozessoren an (sie hatten nicht einmal Zeit zum Fotografieren), und am 6. November zeigte AMD auf seiner Next Horizon-Veranstaltung neues EPYC. Tausend Wörter werden durch ein Bild ersetzt:



Neun Kristalle. Neun verdammt! Die Gründe für diese Entscheidung sind mir klar und sehr einfach: Um die Leistung ganzer Chips zu erhöhen, die Gesamtkosten des Prozessors zu senken und die Entwicklung zu beschleunigen. 7 nm ist immer noch ein roher Prozess. Intel, mit seinen 10 nm (+ - entspricht 7 nm TSMC-Prozess) bereits von diesem Rechen. So sehr, dass wir immer noch 10-nm-Prozessoren gesehen haben, die nur in Form eines Modells eines Notebook-Stubs i3 leben.

Der zentrale Kristall wird nach einem bewährten 14-nm-Verfahren hergestellt und fungiert als Speichercontroller und alle Ein- / Ausgänge mit Ausnahme von PCIe 4.0, von denen 16 Zeilen von jedem der Satellitenkristalle mit jeweils acht Kernen bereitgestellt werden.

Ein gemeinsamer Speichercontroller bietet die Hauptsache - den einheitlichen Zugriff auf den Speicher (UMA). Und er wird niemals überflüssig sein.

Spekulationszeit


Der zentrale Kristall ist über Infinity Fabric mit den Satelliten verbunden, was wiederum eine Vielzahl von Möglichkeiten bietet, Komponenten sowohl zusammen als auch getrennt zu verwenden. Benötigen Sie einen 16-Core-Desktop-Prozessor? Wir sägen einen Kristall mit einem Zweikanal-Speichercontroller, der unter einer Abdeckung mit zwei Kernkomplexen verbunden ist. Benötigen Sie einen Prozessor mit integrierter Grafik? Wir werfen einen Atomkomplex weg, stattdessen setzen wir den GPU-Chip ein. Die Kosten für die Erweiterung des Prozessorbereichs werden um eine Größenordnung sinken. Eine Verringerung der Größe einzelner Kristalle verringert den Prozentsatz der Ausschussprodukte, was sich wiederum positiv auf die Kosten auswirkt.

Moar Geek Porno


Etwas, über das ich nicht geschrieben habe, das aber erwähnenswert ist:

Über Nano QuadCore habe ich es komplett vergessen. Ich hatte nichts mit ihr zu tun, es gab nichts zu erzählen.


IBM CPU 9121/311


Ibm Kraft 5


Und noch mehr neue Power 7


GD32-Mikrocontroller, Flash-Speicherchip oben. Foto von Freund BarsMonster

Source: https://habr.com/ru/post/de429166/


All Articles