
MCM: tata letak multi-chip
Mikroelektronika terkenal dengan sejumlah besar solusi rekayasa asli, aneh dan efektif. Salah satunya adalah pengaturan multi-chip, yang satu atau lain cara ditemukan hampir di mana-mana - dari workstation berkinerja tinggi hingga laptop ultraportable, dari komputer papan tunggal seharga $ 10 hingga mainframe IBM.
Posting ini berbicara tentang sejarah penggunaannya dalam kaitannya dengan prosesor tujuan umum.
Saya
memperingatkan Anda sebelumnya: Saya tidak berpura-pura benar-benar berpengetahuan luas dan akademik dalam presentasi saya, sebagian besar saya berbicara tentang apa yang saya temui, bekerja dan pegang di tangan saya.
Peringatan Lalu Lintas! Di bawah potongan banyak gambar!Apa ini
MCM (modul multi-chip, modul multi-chip) atau MCP (paket multi-chip, konfigurasi multi-chip) adalah solusi rekayasa untuk membagi fungsionalitas rangkaian mikro menjadi beberapa chip yang digabungkan dalam satu rumahan. Ini berbeda dari modul di mana sirkuit mikro biasanya "telanjang", tanpa senyawa, dan disolder langsung oleh kristal ke papan. Ini digunakan untuk meningkatkan hasil chip yang cocok (mengurangi ukuran kristal tunggal), koneksi kompak kristal yang dibuat sesuai dengan berbagai proses teknologi dan teknologi.
Baiklah, mari kita mulai?
1995: Ketika cache tidak cocok dengan gerbang mana pun
(alias Pentium Pro)
Cache - kasar, dimensional dan cepat. Dari sini muncul beberapa masalah: dengan peningkatan kecepatan pekerjaannya, throughput busnya menjadi hambatan, dan dia mulai menghangatkan dirinya. Kita perlu memperbaikinya entah bagaimana. Cara paling logis adalah mentransfer L2 ke prosesor, di mana L1 telah merumput untuk waktu yang lama. Tetapi ada masalah, dan bukan satu: dengan peningkatan ukuran kristal,% dari chip menolak meningkat, dan hampir secara eksponensial. Apa yang harus dilakukan Tentu saja, buat cache menjadi chip yang terpisah, tetapi lebih dekat dengan yang utama. Sebagai hasilnya, kita dapat mengagumi bata ini:

Solusinya bagus, tapi pengemasannya cukup rumit.
1997: Sekarang encore, meskipun tidak sama
(alias Pentium II)
Kasing keramik besar, tentu saja, bagus, tapi mahal. Coba ulangi? Dan mengapa tidak. Tugasnya adalah membuatnya lebih murah, dan itu saja. Mentransfer cache kembali ke papan bukan merupakan opsi - itu akan menjadi langkah mundur. Dan lebar cache bus juga telah tumbuh ... Bisakah menggabungkan semuanya bersama dengan pendinginan menjadi satu modul? Jadi Pentium II lahir:

Anda dapat, tentu saja, tidak mempertimbangkan MCM ini, tetapi karena saya ingat ini, itu akan ada di sini.
(Omong-omong, tanpa orang tua yang permanen dan abadi ini, hamba yang rendah hati Anda tidak akan menulis artikel ini - PII-400, yang telah bekerja untuk saya sebagai gateway dan router WiFi selama bertahun-tahun, setelah melewati banyak keturunannya)
2005: D - artinya Double Bottom
(alias Pentium D)
Ketika rencananya adalah "Satu inti, tetapi untuk MENGURANGI!" dia mulai retak secara signifikan pada lapisan, dan para pesaing, tertawa kecil, akan merilis prosesor dual-core pada satu chip, harus melakukan sesuatu, dan dengan cepat. Jadi atavisme ini muncul, dimana mereka memasang lubang di pasar, sementara kekuatan utama dilemparkan ke arsitektur Core yang lebih menjanjikan. Mungkin alasan utama untuk menggunakan solusi ini adalah tepatnya pengurangan waktu pengembangan - ukuran kristal tidak begitu besar sehingga menggandakannya menyebabkan masalah. Nah, ini dia:

Ada prosesor Xeon serupa untuk segmen server, tetapi saya bisa mengatakan sedikit tentang mereka.
2007: Kenapa tidak?
(alias Core 2 Quad)
Karena kami menguasai kristal dual-core pada tahun 2006, lalu mengapa tegang? Kami menggunakan solusi yang telah teruji oleh waktu - tempelkan dua kristal dalam satu wadah dan tidak ada masalah! Tidak ada yang perlu dibicarakan, gambarnya tidak banyak berubah:

Xeon pada zaman itu juga demikian, kecuali untuk model enam-inti - ada satu kristal besar.
2010: Sebelum kedatangan pasir
(alias gen pertama Core i3 / 5/7)
Pada prosesor Core i dual-core generasi pertama, mereka memutuskan untuk menjalankan proses 32 nm, melakukan hal yang agak lucu - pada proses 45 nm yang telah teruji, mereka membuat inti video terintegrasi dan pengontrol memori, dan beberapa core dengan cache ditempatkan pada kristal 32 nm yang terpisah. Sementara rekan quad-core mereka yang lebih tua menggunakan proses 45nm! Ukuran kristal juga lucu:

(Namun, inti video dari prosesor dual-core dan sekarang sering lebih dari gabungan kedua core)
2011: Satu buldoser bagus, dan dua buldoser lebih baik
(alias Opteron 6000)
Kristal sudah begitu besar, teknologi untuk produksinya disesuaikan, apa, sebenarnya masalahnya? NUMA? Tapi kami sudah melakukan prosesor ini untuk server, dan yang multi-socket. Karena tidak ada masalah, kami mengumpulkan dua kristal di bawah satu tutup:

(Ya, lalu orang bersenang-senang - prosesornya satu, dan NUMA dua)
2013: Butterscotch tetapi tidak bisa dimakan
(alias cache EDRAM L4 GPU / CPU)
Dari generasi Haswell, prosesor yang dilengkapi dengan grafis terintegrasi Iris Pro / Iris Plus (dan pada generasi Skylake, yang dengan Iris biasa) hadir dalam paket yang sama dengan chip memori 64 / 128MB yang bekerja seperti cache L4 dan cukup serius meningkatkan kinerja grafis terintegrasi. Dan chipnya tidak kecil (meskipun memori selalu memakan banyak ruang):

2017: Tahun ketika Intel shit brix
(alias Ryzen Threadripper & EPYC)
Insinyur AMD bermain dengan Infinity Fabric, bermain ... Dan kemudian - oops! Empat kristal di bawah satu tutup yang dihubungkan oleh masing-masing IF untuk masing-masing (dalam kasus EPYC sisi-server) atau sepasang satu sama lain (Threadripper dengan dua kristal aktif). Semuanya baik-baik saja, hanya satu masalah adalah NUMA (sebanyak 4 node per prosesor!), Tapi itu adalah masalah khusus untuk perangkat lunak yang tidak disesuaikan dengannya. Jadi hasilnya sangat baik:

2018: menggandakan nomor - menggandakan kesenangan
(alias Zen 2 & Cascade Lake AP)
Jadi kami sampai ke acara terkini. Pada 5 November, Intel dengan cepat mengumumkan prosesor dual-chip 48-core (mereka bahkan tidak punya waktu untuk mengambil gambar), dan pada 6 November, AMD menunjukkan EPYC baru di acara Next Horizon-nya. Seribu kata akan diganti dengan gambar:

Sembilan kristal. Sialan! Alasan untuk keputusan ini jelas bagi saya, dan mereka sangat sederhana: demi meningkatkan output seluruh chip, menurunkan total biaya prosesor dan mempercepat pengembangan. 7 nm masih merupakan proses kasar. Intel, dengan 10 nm (+ - sama dengan proses TSMC 7 nm) sudah dari rake ini. Sedemikian rupa sehingga kita masih melihat prosesor 10 nm hanya hidup dalam bentuk satu model notebook rintisan i3.
Kristal pusat dibuat pada proses 14 nm yang telah terbukti dan beroperasi sebagai pengontrol memori dan semua input / output kecuali PCIe 4.0, 16 baris yang disediakan oleh masing-masing kristal satelit dengan masing-masing delapan core.
Satu pengontrol memori yang umum menyediakan hal utama - akses seragam ke memori (UMA). Dan dia tidak akan pernah berlebihan.
Waktu spekulasi
Kristal sentral terhubung ke satelit menggunakan Infinity Fabric, yang pada gilirannya memberikan sejumlah besar kemungkinan untuk menggunakan komponen secara bersamaan dan terpisah. Perlu prosesor desktop 16-inti? Kami menggergaji kristal dengan pengontrol memori dua saluran dan terhubung ke dua kompleks nuklir di bawah satu penutup. Perlu prosesor dengan grafik terintegrasi? Kami membuang satu kompleks nuklir, alih-alih kami meletakkan chip GPU. Biaya memperluas jangkauan prosesor akan berkurang dengan urutan besarnya. Pengurangan ukuran kristal individu mengurangi persentase penolakan, yang pada gilirannya memiliki efek positif pada biaya.
Moar geek porno
Sesuatu yang tidak saya tulis, tetapi layak disebutkan:
Melalui Nano QuadCore, saya benar-benar lupa. Saya tidak punya urusan dengannya, tidak ada yang perlu diceritakan.
IBM CPU 9121/311
Kekuatan ibm 5
Dan 7 Power baru
Mikrokontroler GD32, chip memori flash di atas. Foto dari teman BarsMonster