
MCM: layout de vários chips
A microeletrônica é famosa por um grande número de soluções originais, estranhas e eficazes de engenharia. Um deles é um arranjo com vários chips, que de um jeito ou de outro é encontrado em quase toda parte - de estações de trabalho de alto desempenho a laptops ultraportáteis, de computadores de placa única por US $ 10 a mainframes da IBM.
Este post fala sobre a história de seu uso em relação aos processadores de uso geral.
Eu os
aviso com antecedência: não pretendo ser absolutamente instruído e acadêmico em minha apresentação, na maioria das vezes falo sobre o que encontrei, trabalhei e segurei em minhas mãos.
Aviso de trânsito! Sob o corte muitas fotos!O que é isso
MCM (módulo multi-chip, módulo multi-chip) ou MCP (pacote multi-chip, configuração multi-chip) - uma solução de engenharia para dividir a funcionalidade de um microcircuito em vários chips combinados em um único compartimento. Difere dos módulos, pois os microcircuitos geralmente são "vazios", sem composto, e são soldados diretamente por cristais à placa. É usado para aumentar o rendimento de cavacos adequados (reduzindo o tamanho de um único cristal), uma conexão compacta de cristais feitos de acordo com diferentes processos e tecnologias tecnológicas.
Bem, vamos começar?
1995: quando o cache não se encaixa em nenhuma porta
(também conhecido como Pentium Pro)
Cache - grunhido, dimensional e rápido. A partir daqui, surgem alguns problemas: com o aumento da velocidade de seu trabalho, o rendimento de seu ônibus se torna um gargalo e ele começa a se aquecer. Precisamos consertar de alguma forma. A maneira mais lógica é transferir L2 para o processador, onde L1 está pastando há muito tempo. Mas há um problema, e não um: com um aumento no tamanho do cristal, a% de chip rejeita aumentos e quase exponencialmente. O que fazer Obviamente, torne o cache um chip separado, mas mais próximo do principal. Como resultado, podemos admirar este tijolo:

A solução é boa, mas decentemente complicou a embalagem.
1997: Agora encore, embora não seja o mesmo
(também conhecido como Pentium II)
Uma grande caixa de cerâmica é, obviamente, boa, mas cara. Tentar reproduzir novamente? E porque não A tarefa é torná-lo mais barato, e isso é tudo. Transferir o cache de volta para o painel não é uma opção - seria um passo atrás. E a largura do barramento de cache também aumentou ... É possível combinar tudo junto com o resfriamento em um módulo? Assim nasceu o Pentium II:

É claro que você não pode considerar esse MCM, mas desde que me lembrei disso, ele estará aqui.
(a propósito, sem esse velho permanente e imortal, seu humilde servo não teria escrito este artigo - PII-400, que trabalha para mim como gateway e roteador WiFi há muitos anos, tendo sobrevivido a muitos de seus descendentes)
2005: D - significa fundo duplo
(tcp Pentium D)
Quando o plano é "Um núcleo, mas REDUZIR!" ele começou a rachar significativamente, e os concorrentes, rindo, estavam prestes a lançar processadores de núcleo duplo em um chip, tiveram que fazer alguma coisa e rapidamente. Então esse atavismo apareceu, pelo qual eles abriram um buraco no mercado, enquanto as principais forças foram lançadas na arquitetura Core mais promissora. Provavelmente, o principal motivo para usar esta solução foi precisamente a redução no tempo de desenvolvimento - o tamanho dos cristais não era tão grande que dobrar causava problemas. Bem, aqui aconteceu:

Havia processadores Xeon semelhantes para o segmento de servidores, mas posso dizer pouco sobre eles.
2007: por que não?
(também conhecido como Core 2 Quad)
Desde que dominamos os cristais de núcleo duplo em 2006, então por que forçar? Usamos uma solução testada pelo tempo - cole dois cristais em um caso e não há problemas! Não há nada para falar, a imagem não mudou muito:

Xeon daquela época também era assim, exceto pelo modelo de seis núcleos - há um grande cristal.
2010: Antes da chegada da areia
(também conhecido como Core i3 / 5/7 de primeira geração)
Nos processadores Core i de primeira geração, dual core, eles decidiram executar o processo de 32 nm, fazendo uma coisa bastante engraçada - no processo de 45 nm, testado pelo tempo, criaram um núcleo de vídeo e um controlador de memória integrados e, em um chip de 32 nm separado, um par de núcleos com cache foi colocado. Enquanto seus colegas mais antigos de quatro núcleos usavam o processo de 45 nm! Os tamanhos dos cristais também são divertidos:

(No entanto, o núcleo de vídeo dos processadores de núcleo duplo e agora muitas vezes mais do que os dois núcleos combinados)
2011: um trator é bom e dois é melhor
(tcp Opteron 6000)
O cristal já é tão grande, a tecnologia para sua produção é ajustada. Quais são, de fato, os problemas? NUMA? Mas já fabricamos esses processadores para servidores e multi-soquetes. Como não há problemas, coletamos dois cristais sob uma tampa:

(Sim, e as pessoas se divertem - o processador é um e os nós NUMA são dois)
2013: caramelo, mas não comestível
(também conhecido como cache de GPU / CPU eDRAM L4)
Da geração Haswell, os processadores equipados com gráficos integrados Iris Pro / Iris Plus (e na geração Skylake - aqueles com Iris comum) vêm no mesmo pacote com um chip de memória de 64 / 128MB que funciona como um cache L4 e aumenta bastante o desempenho dos gráficos integrados. E o chip não é pequeno (embora a memória sempre ocupe muito espaço):

2017: Ano em que a Intel cagou brix
(tcp Ryzen Threadripper & EPYC)
Os engenheiros da AMD jogaram com o Infinity Fabric, jogaram ... E então - oops! Quatro cristais sob uma tampa conectados por IF cada um (no caso de EPYC do servidor) ou um par um do outro (Threadripper com dois cristais ativos). Está tudo bem, apenas um problema é o NUMA (até 4 nós por processador!), Mas é um problema exclusivamente para software que não está adaptado a ele. Então saiu muito bem:

2018: dobrando o número - dobrando a diversão
(também conhecido como Zen 2 e Cascade Lake AP)
Então chegamos aos eventos atuais. Em 5 de novembro, a Intel anunciou rapidamente os processadores de chip duplo de 48 núcleos (eles nem tiveram tempo de tirar fotos) e, em 6 de novembro, a AMD apresentou o novo EPYC em seu evento Next Horizon. Mil palavras serão substituídas por uma figura:

Nove cristais. Nove, droga! Os motivos desta decisão são claros para mim e são muito simples: para aumentar a produção de chips inteiros, diminuindo o custo total do processador e acelerando o desenvolvimento. 7 nm ainda é um processo bruto. A Intel, com seus 10 nm (+ - igual a 7 nm do processo TSMC), já faz parte deste rake. Tanto é assim que ainda vimos processadores de 10 nm vivendo apenas na forma de um modelo de um esboço de notebook i3.
O cristal central é produzido em um processo comprovado de 14 nm e opera como um controlador de memória e todas as entradas / saídas, exceto o PCIe 4.0, 16 linhas das quais são fornecidas por cada um dos cristais de satélite com oito núcleos em cada um.
Um controlador de memória comum fornece o principal - acesso uniforme à memória (UMA). E ele nunca será supérfluo.
Tempo de especulação
O cristal central é conectado aos satélites usando o Infinity Fabric, que, por sua vez, oferece um grande número de possibilidades para o uso de componentes juntos e separadamente. Precisa de um processador de desktop de 16 núcleos? Estamos vendo um cristal com um controlador de memória de dois canais e conectado a dois complexos nucleares sob uma cobertura. Precisa de um processador com gráficos integrados? Nós jogamos fora um complexo nuclear, em vez disso, colocamos o chip GPU. O custo da expansão da gama de processadores diminuirá em uma ordem de magnitude. Uma redução no tamanho de cristais individuais reduz a porcentagem de rejeitos, o que, por sua vez, tem um efeito positivo no custo.
Moar geek pornô
Algo sobre o qual não escrevi, mas vale a pena mencionar:
Via Nano QuadCore, eu esqueci completamente. Eu não tinha negócios com ela, não havia nada para contar.
IBM CPU 9121/311
Poder ibm 5
E mais novo Power 7
Microcontrolador GD32, chip de memória flash na parte superior. Foto de amigo BarsMonster