Por que os HDDs se tornam menos propensos a falhar

Os danos aos discos rígidos são uma das principais razões para o tempo de inatividade do servidor nos data centers. Mas, recentemente, o número de falhas no disco rígido está diminuindo. Vamos explicar por que isso acontece.


/ foto William Warby CC BY

Um pouco de retrospectiva


Vinte anos atrás, um disco rígido era um dos "pontos fracos" de um computador ou servidor. Há uma história conhecida com as unidades IBM Deskstar que falharam mesmo após um breve uso. Esses discos são considerados um dos HDDs comerciais mais confiáveis, para os quais receberam o apelido comum Deathstar ("Estrela da Morte").

Deskstar lançou uma longa sombra sobre a indústria de discos rígidos. Muitos fabricantes começaram a diminuir voluntariamente os períodos de garantia em seus dispositivos. Em alguns casos, eles diminuíram de três para um ano. Mas com o tempo, surgiram novas tecnologias que aumentaram a confiabilidade do disco rígido. De acordo com um estudo realizado por um dos maiores provedores de nuvem ocidentais em 2018, a taxa de falhas (AFR) dos discos rígidos em seu data center foi de 1,25%. Para comparação: em 2016 e 2017, o valor da AFR foi de 1,95% e 1,77%, respectivamente.

Os especialistas do setor de TI associam a redução no número de falhas do HDD ao desenvolvimento da tecnologia, tanto nas próprias unidades quanto nos data centers. Considere algumas dessas soluções.

Câmaras de hélio


Alguns fabricantes modernos de HDD se enchem de hélio. A densidade do hélio é sete vezes menor que a densidade do ar. Esse recurso reduz a força de atrito que atua nos componentes em movimento e reduz a força dos fluxos de gás, o que afeta a precisão do posicionamento das cabeças de leitura. Além disso, a tecnologia elimina o risco de corrosão dos elementos do disco rígido, porque o meio de hélio não contém vapor de água. Tudo isso aumenta o ciclo de vida estimado dos discos rígidos.

De acordo com um estudo HGST realizado há vários anos e com base em estatísticas da Netflix, Huawei e HP, a vida útil dos discos de hélio é o dobro da dos HDDs clássicos. Por esse motivo, as vendas de discos de hélio estão crescendo de ano para ano, e os próprios dispositivos estão sendo cada vez mais usados ​​em data centers de provedores de nuvem.

Melhorando as condições do data center


Outro motivo para melhorar a confiabilidade dos especialistas em HDD do setor chamou a melhoria das condições nos data centers. A vida útil dos discos rígidos está diretamente relacionada à sua temperatura ambiente. A Seagate observa que uma temperatura de 30 ° C será ideal. Se estiver acima de 50 ° C ou abaixo de 5 ° C, o número de falhas aumentará significativamente.

Portanto, as empresas de TI estão desenvolvendo novas soluções de ar condicionado que mantêm a temperatura ideal na sala do servidor. Por exemplo, o Facebook introduziu a tecnologia de resfriamento evaporativo para data centers. A água do sistema é resfriada em um trocador de calor especial, evaporando através de uma camada de membrana especial. Este líquido é então usado para baixar a temperatura na sala de máquinas.

Além dos novos sistemas de refrigeração, também estão sendo desenvolvidas soluções para seu gerenciamento. Em particular, com base no aprendizado de máquina. Esses sistemas usam sensores que coletam dados de temperatura fora e dentro do data center. Esta informação é então usada pelo módulo de controle para ajustar a ventilação - regula a temperatura retirando mais ou menos ar da rua.

Escrevemos em mais detalhes sobre como os sistemas de IA ajudam a esfriar os data centers em um dos materiais de nosso blog.

Desenvolvimento de tecnologias “internas” de HDD


O número de falhas no disco rígido também é afetado pela umidade. Determina a altura em que a cabeça de leitura pode ser localizada com segurança para não danificar a superfície magnética. Para resolver esse problema, os fabricantes de discos estão introduzindo tecnologias que configuram o movimento do bloco principal, dependendo das condições de operação.

Um exemplo dessa tecnologia seria sensores de RV ou sensores de vibração rotacionais. Usando suas leituras, o módulo de controle interno altera a natureza do movimento do bloco de cabeças, de maneira especial redistribuindo a vibração ao corpo do dispositivo. Freqüentemente, os sensores de RV são encontrados em unidades projetadas para trabalhar em matrizes de disco da Seagate, Toshiba e Western Digital.


/ foto enquanto isso e PD

Sobre a confiabilidade de unidades alternativas


Atualmente, o principal concorrente dos discos rígidos, incluindo data centers, são os SSDs. Segundo as estatísticas, o número de falhas dos SSDs é menor que o de um HDD. No entanto, com a idade, "trabalhadores em estado sólido", o número de erros na leitura cresce duas vezes mais rápido. Para resolver esse problema, os fabricantes de SSD estão desenvolvendo métodos de correção de erros que devem aumentar a confiabilidade e a vida útil dos dispositivos.

Um desses métodos é a atualização do SSD ( p. 32 ). Se células individuais da unidade não forem acessadas por um longo período, elas começarão a perder carga. Isso pode resultar na perda de alguns dados. Portanto, o controlador do inversor de tempos em tempos lê informações em células não utilizadas, avalia seu estado atual e as recarrega.

Outra tecnologia que continua a ser usada em data centers é a fita magnética. No relatório Tendências de armazenamento de dados de 2018, a fita se tornou o quarto armazenamento mais popular depois de HDD, SDD e nuvem (estamos falando de várias opções para armazenar dados da empresa, não de métodos de armazenamento em si). As fitas magnéticas são usadas principalmente devido à sua confiabilidade: os erros nesta unidade ocorrem de quatro a cinco ordens de magnitude inferiores às do disco rígido.

Ao mesmo tempo, novas tecnologias ainda estão sendo desenvolvidas para prolongar a vida útil do filme. Em 2017, a IBM e a Sony criaram fita magnética, que foi fornecida com uma camada adicional de "lubrificante" para proteção. Essa camada reduz o risco de danos à fita quando ela se move a uma velocidade de 10 metros por segundo.

Existem mais tecnologias de armazenamento experimental, cuja confiabilidade, em teoria, pode exceder significativamente o desempenho de unidades clássicas. Por exemplo, um grande potencial como portador de longo prazo na comunidade de TI é profetizado para moléculas de DNA .

Os criadores dos repositórios de DNA planejam selar as moléculas em cápsulas de vidro, onde serão isoladas de condições ambientais prejudiciais. Isso permitirá que você armazene dados digitais codificados neles por milhares de anos sem erros. Esse meio de armazenamento pode se tornar realidade nos próximos anos: a Microsoft estava planejando introduzir o armazenamento de DNA em um de seus data centers.

Mas essas soluções ainda são experimentais e não foram projetadas para uso amplo. Portanto, enquanto uma das formas mais populares de armazenar informações nos data centers permanecerá discos rígidos. E, como a confiabilidade deles está aumentando, o HDD ficará conosco por um longo tempo.



Recursos do primeiro blog corporativo de IaaS:


Posts do nosso canal Telegram:

Source: https://habr.com/ru/post/pt440322/


All Articles