O
supercomputador Cray-1 , o mais rápido da década de 1970, não se parece com um supercomputador. Parece uma modificação de uma atração em que uma pessoa fica em uma parede, se aperta e depois ela a desenrola. Ele está cercado por um banco redondo que esconde um alimento parecido com um donut - se apenas um buraco do donut pudesse dar idéias valiosas relacionadas a armas nucleares.
Depois que
Seymour Cray criou este computador, ele deu ao Laboratório Nacional de Los Alamos seis meses para usá-lo gratuitamente. Mas algo interessante aconteceu durante esses seis meses: 152 erros inexplicáveis de memória ocorreram no computador. E somente mais tarde, os pesquisadores descobriram que os nêutrons dos
raios cósmicos podem colidir com partes do processador e interromper os dados armazenados no computador. Quanto mais alto e maior o número de computadores, mais esse problema afeta você. Los Alamos, localizado a 2,2 km acima do nível do mar, onde estão os computadores mais luxuosos do mundo, tornou-se o principal alvo.
Seymour Cray, criador do supercomputador, ao lado de sua ideia Cray-1Desde então, o mundo mudou e os computadores mudaram. Mas o cosmos permaneceu o mesmo. Portanto, Los Alamos teve que se adaptar - e seus engenheiros começaram a levar em conta partículas cósmicas em equipamentos e software. "Este não é um problema que precisa ser resolvido", explicou Nathan Debardeleben, da equipe de desenvolvimento de computadores de alto desempenho. "Este é um problema que podemos conter."
Para computadores modernos, começando com
o supercomputador Q , isso é algo muito sério. O Q, instalado em 2003, foi muito mais rápido que o Cray-1, projetado para computação relacionada aos estoques de armas nucleares dos EUA. Mas ele caiu com mais frequência do que o esperado - e essas foram as primeiras falhas que deixaram os cientistas de Los Alamos seriamente preocupados com os raios cósmicos do espaço profundo. Eles colidem com elementos químicos na atmosfera e
tudo se divide em partículas menores . "Eles literalmente formam chuveiros peculiares que caem sobre nós", diz Sean Blanchard, outro membro do grupo. Algumas dessas “gotículas” acabam sendo nêutrons - e isso é muito ruim.
"Eles podem fazer com que os bits sejam trocados na memória do computador", diz DeBardeleben, "de 0 a 1 ou de 1 a 0". Para um computador doméstico, isso não faz sentido. Mas Los Alamos tem enormes debulhadores para números. O mesmo Q do começo do século se assemelha às prateleiras dos supermercados. E hoje no laboratório existem salas de computadores do tamanho de um campo de futebol, e todos os computadores da sala podem trabalhar na mesma tarefa. E, assim como há mais chuvas no campo de futebol do que na cabana de verão, os supercomputadores penetram mais raios cósmicos do que o seu laptop.
Em Los Alamos, detectores de nêutrons são implantados em todo o centro de supercomputadoresApós o Q, os engenheiros realmente perceberam que os nêutrons não são partículas tão neutras, e agora estão tentando antecipar problemas. Antes de instalar um novo equipamento, os engenheiros realizam algo como um teste de estresse espacial, colocando a eletrônica em um feixe de nêutrons - há muito mais deles do que nos chuveiros atmosféricos - e observando o que acontece. "Nós pegamos partes individuais, as tornamos radioativas, as fazemos trabalhar em caso de falha", explica Blanchard. Em breve, eles colocarão detectores de nêutrons no centro do supercomputador para medir a força das "tempestades". Se você sabe quantos nêutrons chegaram e sabe como eles afetam a operação dos componentes do computador, "você pode prever o tempo de vida útil de seus aparelhos eletrônicos", diz Susan Novichki, física do grupo de ciências espaciais e aplicadas do laboratório.
Normalmente, os supercomputadores são espertos o suficiente para entender que algo deu errado, e eles sentem a mudança como se você arrancasse os cabelos. [o
autor do artigo original é uma menina / aprox. perev. ] Nesse caso, o sistema geralmente apenas relata um erro e se corrige. Mas, às vezes, diz Blanchard, o computador é mais pessimista. "Eu tenho um erro, muitos bits foram trocados", ele descreve um computador, "não posso consertar, mas queria falar sobre isso".
Quando isso acontece em Los Alamos, as pessoas param intencionalmente todos os computadores. É o mesmo que esquiar em uma montanha, porque será menos doloroso do que tentar resistir. Mas, neste caso, você não precisa voltar ao topo e começar tudo de novo - os engenheiros configuraram "
pontos de verificação " na busca por uma resposta. É o mesmo que economizar pontos nos jogos. Se você morrer, não precisará começar tudo de novo. Comece do último ponto que salvou suas realizações. Os supercomputadores também têm um sistema de armazenamento semelhante.
O verdadeiro problema é a "
corrupção silenciosa de dados "
. É quando os bits são trocados e ninguém percebe. E a resposta que você acha que pode ser verdade pode acabar sendo um sonho inspirado nos nêutrons. É por isso que o trabalho preventivo é tão importante: sabe-se o que esperar e com que frequência e monitorá-lo. Ao mesmo tempo, tendo recebido esse conhecimento, a equipe espera transformar erros silenciosos em gritos altos. Mas se algo passa pela defesa, talvez uma pessoa viva o veja. Geralmente em Los Alamos, eles não dizem "Aqui está a sua resposta!" Até que uma pessoa verifique os resultados do trabalho em busca de significado.
A intervenção pessoal ocorre em parte porque Los Alamos está fazendo uma pesquisa crítica sobre tópicos que afetam muitas outras pessoas. "O laboratório - e o departamento de energia como um todo - estuda mudanças climáticas, novos medicamentos, epidemiologia, propagação de doenças, modelagem de incêndios, ciência de materiais e fragilidade de metais", explica Blanchard. E, como ele acrescenta depois desta lista, o motivo da existência de Los Alamos está nas armas nucleares criadas pelos seres humanos (algumas delas até pertencem a esse mesmo laboratório). "Somos um laboratório de armas nucleares", diz Blanchard. "Nosso trabalho é gerenciar suas reservas." Devemos garantir que seja seguro e funcione como deveria, e não funcione quando não for necessário. ”
Devido à
proibição de testes de armas nucleares , a única maneira legítima de
parar de se preocupar e aprender a manter um suprimento de bombas é simular o que está acontecendo no interior de um supercomputador. É assim que um laboratório preocupado com a radiação na Terra deve se preocupar com a radiação do espaço. Porque não importa qual seja o trabalho dos supercomputadores no futuro, uma coisa é clara: "Todo ano eles se tornam um alvo maior", diz Blanchard.