
MCM:多芯片布局
微电子学以大量原创,奇特而有效的工程解决方案而闻名。 其中之一是多芯片方案,几乎可以在任何地方找到一种或另一种方案-从高性能工作站到超便携式笔记本电脑,从10美元的单板计算机到IBM大型机。
这篇文章讨论了与通用处理器相关的使用历史。
我
提前警告:我并不假装没有绝对的知识和学术演讲,我大多会说说自己遇到的,工作的和掌握的东西。
交通警告! 下切了很多照片!这是什么
MCM(多芯片模块,多芯片模块)或MCP(多芯片封装,多芯片配置)-一种工程解决方案,用于将微电路的功能拆分为一个外壳中的多个芯片。 它与模块的不同之处在于,微电路通常是“裸露”的,没有化合物,并通过晶体直接焊接到板上。 它用于提高合适芯片的产量(减小单晶的尺寸),并根据各种工艺方法和技术紧密连接晶体。
好吧,让我们开始吧?
1995年:当缓存不适合任何门时
(又名Pentium Pro)
缓存-咕unt声,尺寸和速度都很高。 从这里开始出现了两个问题:随着工作速度的增加,公共汽车的吞吐量成为瓶颈,他开始为自己加温。 我们需要以某种方式修复它。 最合乎逻辑的方法是将L2传送到处理器,在那里L1已经放牧了很长时间。 但是有一个问题,而不是一个问题:随着晶体尺寸的增加,切屑废品的百分比几乎成倍增加。 怎么办 当然,可以将高速缓存作为单独的芯片,但要更靠近主芯片。 结果,我们可以欣赏这块砖:

该解决方案很好,但包装却相当复杂。
1997年:现在重演,尽管不一样
(又名奔腾II)
当然,大号的陶瓷表壳不错,但价格昂贵。 尝试重播? 为什么不呢。 我们的任务是使其更便宜,仅此而已。 不能将缓存转移回电路板,这是一个退后一步。 高速缓存总线的宽度也增加了...可以将所有内容与冷却功能结合到一个模块中吗? 因此奔腾II诞生了:

您当然可以不考虑此MCM,但是由于我记得这一点,因此它将在这里。
(顺便说一句,如果没有这个永生不朽的老人,您的谦卑的仆人将不会写这篇文章-PII-400,该文章已经为我充当网关和WiFi路由器很多年了,它的许多后代都活了下来)
2005:D-表示双底
(又名奔腾D)
当计划是“一个核心,但要减少!” 他开始明显地裂开缝隙,竞争者们咯咯笑了,他们即将在一个芯片上发布双核处理器,不得不快速地做些事情。 因此出现了这种荒谬的态度,由此他们在市场上填补了一个空白,而主要力量则投向了更有希望的Core架构。 使用该解决方案的主要原因可能恰恰是缩短了开发时间-晶体的尺寸并不大,以至于将其倍增会引起问题。 好吧,这发生了:

服务器部分也有类似的至强处理器,但是我只能说很少。
2007年:为什么不呢?
(又名Core 2 Quad)
既然我们在2006年掌握了双核晶体,那为什么还要应变呢? 我们使用经过时间考验的解决方案-将两种晶体粘在一种情况下,没有任何问题! 没什么可谈的,图片没有太大变化:

那个时代的至强也是如此,除了六核型号-有一个大水晶。
2010年:沙粒到来之前
(aka第一代Core i3 / 5/7)
在第一代双核Core i处理器上,他们决定运行32 nm工艺,这是一件很有趣的事情-在经过时间考验的45 nm工艺上,他们制造了集成的视频内核和内存控制器,并将几个带有缓存的内核放置在单独的32 nm晶体上。 而较早的四核处理器则使用45nm工艺! 晶体的尺寸也很有趣:

(但是,双核处理器的视频核心现在经常超过两个核心的总和)
2011年:一台推土机好,两台更好
(又名Opteron 6000)
晶体已经很大了,调整了生产技术,实际上有什么问题? NUMA? 但是我们已经为服务器和多路插座的服务器处理了这些处理器。 由于没有问题,我们在一个盖子下收集了两个晶体:

(是的,然后人们会很开心-处理器是一个,而NUMA节点是两个)
2013年:奶油糖果但不可食用
(又名eDRAM L4 GPU / CPU缓存)
从Haswell一代开始,配备Iris Pro / Iris Plus集成显卡的处理器(以及Skylake一代-具有常规Iris的处理器)与64 / 128MB内存芯片在同一封装中,该芯片的工作方式类似于L4高速缓存,并显着提高了集成显卡的性能。 而且芯片也不小(尽管内存总是占用很多空间):

2017年:英特尔sh废的年份
(又名Ryzen Threadripper和EPYC)
AMD工程师玩过Infinity Fabric,玩过...然后-糟糕! 一个盖子下的四个晶体通过IF彼此连接(在服务器端EPYC的情况下)或一对(带有两个活动晶体的Threadripper)彼此连接。 一切都很好,只有一个问题是NUMA(每个处理器多达4个节点!),但这只是不适合它的软件的问题。 这样就很好了:

2018年:数字翻倍-乐趣倍增
(又名Zen 2和Cascade Lake AP)
因此,我们了解了当前事件。 11月5日,英特尔迅速发布了48核双芯片处理器(它们甚至没有时间拍照)。11月6日,AMD在其Next Horizon活动中展示了新的EPYC。 一千个单词将替换为图片:

九个晶体。 九该死! 这个决定的原因对我来说很清楚,而且非常简单:为了增加整个芯片的产量,降低处理器的总成本并加快开发速度。 7 nm仍然是一个粗糙的过程。 英特尔已经从该耙中获得了10纳米(+-等于7纳米TSMC工艺)。 如此之多,以至于我们仍然看到10 nm处理器仅以笔记本电脑存根i3的一种模型形式存在。
中央晶体采用经过验证的14 nm工艺制成,并用作存储控制器,除PCIe 4.0以外的所有输入/输出,每个卫星晶体提供16条线,每个卫星晶体具有8个核。
一个通用的内存控制器提供了主要功能-统一访问内存(UMA)。 而且他永远不会是多余的。
投机时间
中央晶体使用Infinity Fabric连接到卫星,这反过来又提供了同时使用和单独使用组件的大量可能性。 需要16核台式机处理器吗? 我们看到了一个带有双通道存储控制器的晶体,并在一个掩盖下连接到两个核复合体。 需要带有集成显卡的处理器吗? 我们扔出一个核设施,而不是我们放了GPU芯片。 扩大处理器范围的成本将降低一个数量级。 减小单个晶体的尺寸会减少次品的百分比,进而对成本产生积极影响。
摩尔怪胎色情片
我没有写的东西,但值得一提:
通过Nano QuadCore,我完全忘记了它。 我和她没关系;没什么可说的。
IBM CPU 9121/311
IBM Power 5
还有更多新的Power 7
GD32微控制器,闪存芯片在顶部。 朋友BarsMonster的照片