
MCM: diseño de múltiples chips
Microelectronics es famoso por una gran cantidad de soluciones de ingeniería originales, extrañas y efectivas. Uno de ellos es un arreglo de múltiples chips, que de una forma u otra se encuentra en casi todas partes, desde estaciones de trabajo de alto rendimiento hasta computadoras portátiles ultraportátiles, desde computadoras de una sola placa por $ 10 hasta mainframes de IBM.
Esta publicación habla sobre la historia de su uso en relación con los procesadores de propósito general.
Te
advierto de antemano: no pretendo ser absolutamente conocedor y académico en mi presentación, en su mayor parte hablo de lo que encontré, trabajé y sostuve en mis manos.
Advertencia de tráfico! Debajo del corte muchas fotos!Que es esto
MCM (módulo de múltiples chips, módulo de múltiples chips) o MCP (paquete de múltiples chips, configuración de múltiples chips) es una solución de ingeniería para dividir la funcionalidad de un microcircuito en varios chips combinados en una carcasa. Se diferencia de los módulos en que los microcircuitos suelen estar "desnudos", sin un compuesto, y se sueldan directamente mediante cristales a la placa. Se utiliza para aumentar el rendimiento de chips adecuados (reduciendo el tamaño de un solo cristal), una conexión compacta de cristales fabricados de acuerdo con diferentes procesos y tecnologías tecnológicas.
Bueno, empecemos?
1995: cuando el caché no cabe en ninguna puerta
(también conocido como Pentium Pro)
Caché: gruñido, dimensional y rápido. A partir de aquí surgen un par de problemas: con un aumento en la velocidad de su trabajo, el rendimiento de su autobús se convierte en un cuello de botella y comienza a calentarse. Necesitamos arreglarlo de alguna manera. La forma más lógica es transferir L2 al procesador, donde L1 ha estado pastando durante mucho tiempo. Pero hay un problema, y no uno: con un aumento en el tamaño del cristal, aumenta el% de rechazos de chips, y casi exponencialmente. Que hacer Por supuesto, haga que el caché sea un chip separado, pero más cercano al principal. Como resultado, podemos admirar este ladrillo:

La solución es buena, pero decentemente complica el empaque.
1997: ahora bis, aunque no es lo mismo
(también conocido como Pentium II)
Una caja de cerámica grande es, por supuesto, buena, pero cara. Intenta reproducir? Y porque no. La tarea es hacerlo más barato, y eso es todo. Transferir el caché de vuelta al tablero no es una opción, sería un paso atrás. Y el ancho del bus de caché también ha crecido ... ¿Puede combinar todo junto con la refrigeración en un módulo? Entonces nació Pentium II:

Puede, por supuesto, no considerar este MCM, pero como recordé esto, estará aquí.
(por cierto, sin este anciano permanente e inmortal, su humilde servidor no habría escrito este artículo: el PII-400, que ha estado trabajando para mí como puerta de enlace y enrutador WiFi durante muchos años, habiendo sobrevivido a muchos de sus descendientes)
2005: D - significa doble fondo
(también conocido como Pentium D)
Cuando el plan es "¡Un núcleo, pero REDUCIR!" comenzó a romper significativamente las costuras, y los competidores, riéndose, estaban a punto de lanzar procesadores de doble núcleo en un chip, tuvieron que hacer algo y rápidamente. Entonces apareció este atavismo, por el cual taponaron un agujero en el mercado, mientras que las fuerzas principales se lanzaron a la arquitectura Core más prometedora. Probablemente, la razón principal para usar esta solución fue precisamente la reducción en el tiempo de desarrollo: el tamaño de los cristales no era tan grande que duplicarlo causara problemas. Bueno, aquí sucedió:

Había procesadores Xeon similares para el segmento de servidores, pero puedo decir poco sobre ellos.
2007: ¿por qué no?
(también conocido como Core 2 Quad)
Desde que dominamos los cristales de doble núcleo en 2006, ¿por qué cepa? Utilizamos una solución probada en el tiempo: ¡pegue dos cristales en un caso y no hay problemas! No hay nada de qué hablar, la imagen no ha cambiado mucho:

Xeon de esa época también era así, excepto por el modelo de seis núcleos: hay un gran cristal.
2010: antes de la llegada de la arena
(también conocido como primera generación Core i3 / 5/7)
En los procesadores Core i de doble núcleo de primera generación, decidieron ejecutar el proceso de 32 nm, haciendo algo bastante divertido: en el proceso de 45 nm probado con el tiempo, hicieron un núcleo de video integrado y un controlador de memoria, y se colocaron un par de núcleos con un caché en un cristal de 32 nm separado. ¡Mientras que sus homólogos de cuatro núcleos más antiguos usaban el proceso de 45 nm! Los tamaños de los cristales también son divertidos:

(Sin embargo, el núcleo de video de los procesadores de doble núcleo y ahora a menudo más que ambos núcleos combinados)
2011: una excavadora es buena, y dos es mejor
(también conocido como Opteron 6000)
El cristal ya es tan grande, la tecnología para su producción está ajustada, ¿cuáles son los problemas? NUMA? Pero ya hacemos estos procesadores para servidores y los de múltiples sockets. Como no hay problemas, recogemos dos cristales debajo de una tapa:

(Sí, y luego la gente se divierte: el procesador es uno y los nodos NUMA son dos)
2013: caramelo pero no comestible
(también conocido como eDRAM L4 GPU / CPU cache)
Desde la generación Haswell, los procesadores equipados con gráficos integrados Iris Pro / Iris Plus (y en la generación Skylake, aquellos con Iris regular) vienen en el mismo paquete con un chip de memoria de 64 / 128MB que funciona como un caché L4 y aumenta bastante el rendimiento de los gráficos integrados. Y el chip no es pequeño (aunque la memoria siempre ocupa mucho espacio):

2017: año en que Intel shit brix
(también conocido como Ryzen Threadripper y EPYC)
Los ingenieros de AMD jugaron con Infinity Fabric, jugaron ... Y luego, ¡Uy! Cuatro cristales debajo de una tapa conectados por IF cada uno a cada uno (en el caso de EPYC del lado del servidor) o un par entre sí (Threadripper con dos cristales activos). Todo está bien, solo un problema es NUMA (¡hasta 4 nodos por procesador!), Pero es un problema exclusivo para el software que no está adaptado a él. Entonces salió muy bien:

2018: duplicar el número, duplica la diversión
(también conocido como Zen 2 y Cascade Lake AP)
Entonces llegamos a los eventos actuales. El 5 de noviembre, Intel anunció rápidamente procesadores de doble chip de 48 núcleos (ni siquiera tenían tiempo para tomar fotos), y el 6 de noviembre, AMD mostró nuevos EPYC en su evento Next Horizon. Mil palabras serán reemplazadas por una imagen:

Nueve cristales Nueve maldita sea! Las razones de esta decisión son claras para mí, y son muy simples: en aras de aumentar la producción de chips enteros, reducir el costo total del procesador y acelerar el desarrollo. 7 nm sigue siendo un proceso crudo. Intel, con sus 10 nm (+ - igual a 7 nm proceso TSMC) ya de este rastrillo. Tanto es así, que todavía hemos visto procesadores de 10 nm en vivo solo en la forma de un modelo de portátil stub i3.
El cristal central está hecho en un proceso probado de 14 nm y funciona como un controlador de memoria y todas las entradas / salidas, excepto PCIe 4.0, de las cuales 16 líneas son provistas por cada uno de los cristales satélite con ocho núcleos en cada uno.
Un controlador de memoria común proporciona lo principal: acceso uniforme a la memoria (UMA). Y nunca será superfluo.
Tiempo de especulación
El cristal central está conectado a los satélites utilizando Infinity Fabric, que a su vez ofrece una gran cantidad de posibilidades para utilizar componentes tanto juntos como por separado. ¿Necesita un procesador de escritorio de 16 núcleos? Estamos aserrando un cristal con un controlador de memoria de doble canal y conectado a dos complejos nucleares bajo una cubierta. ¿Necesita un procesador con gráficos integrados? Tiramos un complejo nuclear, en lugar de eso colocamos el chip GPU. El costo de ampliar la gama de procesadores disminuirá en un orden de magnitud. Una reducción en el tamaño de los cristales individuales reduce el porcentaje de rechazos, lo que a su vez tiene un efecto positivo en el costo.
Moar geek porno
Algo sobre lo que no escribí, pero que vale la pena mencionar:
A través de Nano QuadCore, lo olvidé por completo. No tenía nada que ver con ella, no había nada que contar.
CPU de IBM 9121/311
Ibm power 5
Y más nuevos Power 7
Microcontrolador GD32, chip de memoria flash en la parte superior. Foto de un amigo BarsMonster