Este é o terceiro artigo de uma série sobre design de CPU. No primeiro artigo, examinamos a arquitetura de um computador e explicamos sua operação em alto nível. O segundo artigo falou sobre o design e a implementação de alguns componentes do chip. Na terceira parte, aprenderemos como projetos arquitetônicos e circuitos elétricos se tornam chips físicos.
Como transformar um monte de areia em um processador moderno? Vamos descobrir.
Parte 1: Noções básicas de arquitetura de computador (arquiteturas de conjunto de instruções, armazenamento em cache, pipelines, hyperthreading)
Parte 2: Processo de projeto da CPU (circuitos elétricos, transistores, elementos lógicos, sincronização)
Parte 3: Layout e fabricação física do chip (fabricação de VLSI e silicone)
Parte 4: Tendências atuais e importantes direções futuras na arquitetura de computadores (mar de aceleradores, integração tridimensional, FPGA, Near Memory Computing)
Como mencionado anteriormente, os processadores e todas as outras lógicas digitais são compostas de transistores. Um transistor é um interruptor controlado eletricamente que pode ser ligado e desligado aplicando ou desconectando uma tensão de porta. Dissemos que existem dois tipos de transistores: os dispositivos nMOS passam corrente quando o obturador está ligado e os dispositivos pMOS passam corrente quando o obturador está desligado. A estrutura básica do processador são transistores feitos de silício. O silício é um
semicondutor , porque ocupa uma posição intermediária - não conduz a corrente completamente, mas não é um isolador.
Para transformar uma pastilha de silício em um circuito elétrico prático, adicionando transistores, os engenheiros de produção usam um processo chamado
doping . O doping é o processo de adicionar impurezas cuidadosamente selecionadas ao substrato de silicone base para alterar sua condutividade. O objetivo é mudar o comportamento dos elétrons para que possamos controlá-los. Existem dois tipos de transistores e, portanto, dois tipos principais de doping.
O processo de fabricação de uma placa antes de colocar os chips no estojo.Se adicionarmos um número precisamente controlado de elementos doadores de elétrons, como arsênico, antimônio ou fósforo, podemos criar uma região do tipo n. Como a região da placa na qual esses elementos são depositados agora possui um excesso de elétrons, ela se torna carregada negativamente. A partir daqui, veio o nome do tipo (n - negativo) e a letra "n" no nMOS. Ao adicionar elementos aceitadores de elétrons, como boro, índio ou gálio, ao silício, podemos criar uma região do tipo p com carga positiva. A partir daqui, veio a letra "p" no tipo p e pMOS (p - positivo). Os processos específicos para adicionar essas impurezas ao silício são chamados
implantação e
difusão de íons ; não os consideraremos no artigo.
Agora que podemos controlar a condutividade elétrica das partes individuais da pastilha de silício, podemos combinar as propriedades de várias áreas para criar transistores. Os transistores usados em circuitos integrados e chamados MOSFETs (transistores de efeito de campo semicondutores de óxido metálico, estruturas MOS, estruturas condutoras de óxido metálico) têm quatro conexões. A corrente que controlamos flui entre a fonte e o dreno. Em um dispositivo de canal n, a corrente geralmente entra no dreno e sai da fonte, enquanto em um dispositivo de canal p geralmente flui da fonte e sai do dreno. Um portão é um interruptor usado para ligar e desligar um transistor. Finalmente, o dispositivo possui um corpo de transistor (Corpo), que não se aplica ao processador, portanto, não o consideraremos.
A estrutura física do inversor em silício. Áreas de cores diferentes têm propriedades de condutividade diferentes. Observe como os diferentes componentes de silicone correspondem ao diagrama à direita.Os detalhes técnicos da operação dos transistores e a interação de áreas individuais são o conteúdo de todo o curso da faculdade, portanto, tocaremos apenas o básico. Uma boa analogia ao trabalho deles é uma ponte levadiça sobre um rio. Os carros - os elétrons no transistor - querem fluir de um lado do rio para o outro, essa é a fonte e o dreno do transistor. Tome o dispositivo nMOS como um exemplo: quando o obturador não está carregado, a ponte levadiça é elevada e os elétrons não podem fluir através do canal. Quando abaixamos a ponte, formamos uma estrada sobre o rio e os carros podem circular livremente. A mesma coisa acontece no transistor. Carregar o portão forma um canal entre a fonte e o dreno, permitindo que a corrente flua.
Para um controle preciso sobre a localização de diferentes regiões p e n no silício, fabricantes como Intel e TSMC usam um processo chamado
fotolitografia . Esse é um processo de etapas múltiplas extremamente complexo e as empresas gastam bilhões de dólares aprimorando-o para criar transistores menores, mais rápidos e com maior eficiência de energia. Imagine uma impressora ultra precisa que você pode usar para desenhar padrões de silício para cada área.
O processo de fabricação de transistores em um chip começa com uma pastilha de silicone limpa (substrato). É aquecido no forno para criar uma fina camada de dióxido de silício na superfície da placa. Em seguida, um polímero fotorresistente fotossensível é aplicado ao dióxido de silício. Iluminando o polímero com luz de certas frequências, podemos expor o polímero nas áreas em que queremos realizar a liga. Esta é a etapa da litografia e é semelhante à maneira como as impressoras aplicam tinta em áreas específicas da página, apenas em uma escala menor.
A placa é gravada com ácido fluorídrico para dissolver a sílica nos locais onde o polímero foi removido. Em seguida, o fotorresistente é removido, deixando apenas a camada de óxido abaixo dele. Agora, os íons dopantes podem ser aplicados à placa, que são implantados apenas em locais onde o óxido está ausente.
Esse processo de mascaramento, formação e dopagem é repetido dezenas de vezes para construir lentamente cada nível de elementos em um semicondutor. Depois de concluir o nível básico de silício, você pode criar compostos metálicos na parte superior que conectam diferentes transistores. Um pouco mais tarde, falaremos mais sobre esses compostos e camadas de metalização.
Obviamente, os fabricantes de chips não realizam o processo de criação de transistores sob um. Ao projetar um novo chip, eles geram máscaras para cada estágio do processo de fabricação. Essas máscaras contêm a localização de cada elemento dos bilhões de transistores do chip. Várias fichas são agrupadas e montadas no mesmo chip.
Após a fabricação da placa, ela é cortada em cristais individuais, que são colocados
no caso Cada placa pode conter centenas ou até mais chips. Geralmente, quanto mais poderoso o chip é produzido, maior será o cristal e menos chips o fabricante pode obter de cada placa.
Você pode pensar que precisamos apenas produzir enormes chips superpoderosos com centenas de núcleos, mas isso é impossível. Atualmente, o fator mais sério que dificulta a criação de chips cada vez maiores são os defeitos no processo de fabricação. Os chips modernos contêm bilhões de transistores e, se pelo menos uma parte de um transistor estiver quebrada, o chip inteiro poderá ser lançado. À medida que o tamanho dos processadores aumenta, a probabilidade de um mau funcionamento do chip aumenta.
As empresas ocultam cuidadosamente a produtividade dos processos de fabricação de seus chips, mas pode ser estimado aproximadamente entre 70 e 90%. As empresas costumam fabricar chips com margem porque sabem que algumas peças não funcionam. Por exemplo, a Intel pode projetar um chip de 8 núcleos, mas vendê-lo apenas como 6 núcleos, porque espera que um ou dois núcleos sejam quebrados. Fichas com defeitos invulgarmente baixos são geralmente reservadas para venda a um preço mais elevado. Esse processo é chamado de
binning .
Um dos parâmetros de marketing mais sérios associados à fabricação de chips é o tamanho dos elementos. Por exemplo, a Intel está dominando um processo de 10 nanômetros, a AMD está usando um processo de 7 nanômetros para algumas GPUs e o TSMC começou a trabalhar em um processo de 5 nanômetros. Mas o que todos esses números significam? Tradicionalmente, o tamanho de um elemento é chamado de distância mínima entre o dreno e a fonte do transistor. No processo de desenvolvimento da tecnologia, aprendemos a reduzir os transistores para que mais e mais deles se encaixem em um único chip. À medida que os transistores diminuem, eles também se tornam cada vez mais rápidos.
Observando esses números, é importante lembrar que algumas empresas podem não basear o tamanho do processo de fabricação em uma distância padrão, mas em outros valores. Isso significa que processos com tamanhos diferentes em empresas diferentes podem realmente levar à criação de transistores do mesmo tamanho. Por outro lado, nem todos os transistores em um processo de fabricação separado têm o mesmo tamanho. Os projetistas podem decidir, por uma questão de compromisso, aumentar alguns transistores que outros. Um pequeno transistor será mais rápido, pois leva menos tempo para carregar e descarregar o obturador. No entanto, pequenos transistores podem controlar apenas um número muito pequeno de saídas. Se uma parte da lógica gerencia algo que requer muita energia, por exemplo, um pino de saída, será necessário fazer muito mais. Esses transistores de saída podem ter ordens de magnitude maiores que os transistores lógicos internos.
Foto cristalina de um moderno processador AMD Zen. Esse projeto consiste em vários bilhões de transistores.No entanto, o design e a fabricação de transistores representam apenas metade do chip. Precisamos de condutores para conectar tudo de acordo com o esquema. Esses compostos são criados usando camadas de revestimento em cima de transistores. Imagine um entroncamento rodoviário de vários níveis com entradas, saídas e várias estradas que cruzam. É exatamente o que acontece dentro do chip, apenas em uma escala muito menor. Processadores diferentes têm quantidades diferentes de camadas de ligação de metal sobre transistores. Os transistores são reduzidos e são necessárias mais e mais camadas de metalização para rotear todos os sinais. É relatado que, no futuro, a tecnologia de processo TMSC de 5 nanômetros utilizará 15 camadas. Imagine um cruzamento vertical de 15 níveis - isso lhe dará uma idéia de quão complicado é o roteamento dentro do chip.
A imagem do microscópio abaixo mostra uma grade formada por sete camadas de metalização. Cada camada é plana e, quando sobe, as camadas se tornam maiores para ajudar a reduzir o arrasto. Entre as camadas, existem pequenos cilindros de metal chamados jumpers, que são usados para passar para um nível superior. Normalmente, cada camada muda de direção em relação à camada abaixo dela para reduzir a capacitância indesejada. Estranhas camadas de metalização podem ser usadas para criar juntas horizontais e até mesmo para juntas verticais.

Você pode entender que gerenciar todos esses sinais e camadas de metalização muito rapidamente se torna incrivelmente complexo. Para ajudar a resolver esse problema, são usados programas de computador que posicionam e conectam automaticamente os transistores. Dependendo da complexidade do projeto, os programas podem até converter as funções de um código C de alto nível nos locais físicos de cada condutor e transistor. Normalmente, os projetistas de chips permitem que os computadores gerem a maior parte de um projeto automaticamente e, depois, estudam e otimizam manualmente as partes críticas individuais.
Quando as empresas desejam criar um novo chip, iniciam o processo de design com as células padrão fornecidas pelo fabricante do chip. Por exemplo, a Intel ou TSMC fornece aos projetistas partes básicas, como elementos lógicos ou células de memória. Os designers podem combinar essas células padrão em qualquer chip que desejem produzir. Em seguida, eles são enviados para a fábrica - um local onde o silício bruto é convertido em chips de trabalho - circuitos elétricos dos transistores de chip e camadas de metalização. Esses circuitos se transformam em máscaras, usadas no processo de fabricação descrito acima. A seguir, veremos como pode ser o processo de design de um chip extremamente simples.

Primeiro, vemos o circuito do inversor, que é uma célula padrão. O retângulo verde sombreado na parte superior é o transistor pMOS e o retângulo verde transparente na parte inferior é o transistor nMOS. O condutor vermelho vertical é uma porta de polissilício, as áreas azuis são metalização 1 e as áreas roxas são metalização 2. A entrada A entra à esquerda e a saída Y sai à direita. As conexões de energia e terra são feitas na parte superior e inferior na metalização 2.
Combinando vários elementos lógicos, obtivemos um módulo aritmético simples de 1 bit. Esse design pode adicionar, subtrair e executar operações lógicas com duas entradas de 1 bit. Os condutores azuis sombreados subindo são as camadas de metalização 3. Os quadrados ligeiramente maiores nas extremidades dos condutores são jumpers que conectam as duas camadas.
Finalmente, combinando muitas células e aproximadamente 2.000 transistores, obtivemos um processador simples de 4 bits com 8 bytes de RAM em quatro camadas de metalização. Vendo o quão complicado é, você pode imaginar o quão difícil é projetar um processador de 64 bits com megabytes de cache, vários núcleos e mais de 20 estágios de pipeline. Dado que as CPUs de alto desempenho modernas têm de 5 a 10 bilhões de transistores e uma dúzia de camadas de metalização, não seria exagero dizer que elas são literalmente milhões de vezes mais complexas que o nosso exemplo.
Isso nos faz entender por que o novo processador é uma peça de tecnologia tão cara e por que a AMD e a Intel lançam novos produtos há tanto tempo. Para um novo chip passar de uma prancheta para o mercado, geralmente leva de 3 a 5 anos. Isso significa que os chips modernos mais rápidos são baseados em tecnologias que já têm vários anos e que por muitos anos não veremos chips com um nível moderno de tecnologia de fabricação.
No quarto e último artigo da série, retornaremos à esfera física e consideraremos as tendências atuais do setor. O que os pesquisadores estão desenvolvendo para tornar a próxima geração de computadores ainda mais rápida?