Backblaze divulgou estatísticas de confiabilidade do HDD para 2018



Mais de cinco anos atrás, o Backblaze publicou seu primeiro relatório sobre o uso de unidades de disco em seus servidores. O Backblaze fornece um serviço de backup em nuvem barato. No coração de sua infraestrutura estão os discos rígidos de consumo. A empresa coletou grandes estatísticas sobre a tolerância a falhas de vários tipos de HDD. As unidades de backblaze da época consistiam principalmente de unidades Seagate, Hitachi e WD, enquanto as unidades Hitachi eram as mais confiáveis.

Desde então, o Backblaze publica estatísticas anualmente e agora é hora do próximo relatório .

Em 31 de dezembro de 2018, a empresa possuía 106.919 HDDs ativos, dos quais 1965 eram discos de inicialização e 104 954 discos de dados. A análise mostra as taxas de falhas dos discos rígidos com dados nos datacenters da empresa. Novos modelos de HDD que foram adicionados aos racks de servidor em 2018, incluindo o modelo HGST de 12 TB e o modelo Toshiba de 14 TB, também são considerados. É claro que muitas estatísticas ainda não foram coletadas nos novos modelos, porque foram instaladas apenas recentemente e o número é pequeno. Portanto, é muito cedo para finalmente enterrar, por exemplo, o modelo Toshiba MG07ACA14TA com uma taxa de rejeição de 3,03% (se o levarmos anualmente). Talvez o jogo mal sucedido tenha aparecido.

A tabela mostra apenas os modelos para os quais as estatísticas são coletadas de pelo menos 45 cópias (algumas dessas unidades foram usadas apenas para teste). O número 45 é a quantidade mínima necessária para preencher um Backblaze Storage Pod no data center. Assim, dos 104.954 discos rígidos, 104.778 foram deixados para análise estatística.


Nota: uma taxa de falha anual de 0,00% significa que durante 2018 não houve falhas

Especialistas em backblaze admitem que, no final de 2018, a taxa anual de failover anualizada (AFR) acabou sendo muito boa: apenas 1,25%. Para comparação, em 2013 os números foram muito piores e alguns modelos da Seagate caíram para AFR 25,4% (modelo Seagate Barracuda 7200, ST31500341AS). O segundo e o terceiro anos de operação tornaram-se especialmente críticos para os discos da Seagate.


Estatísticas do primeiro relatório Backblaze de 2013

Agora todos os modelos provaram ser unidades muito confiáveis. A exceção ocorre nos casos em que havia um pequeno número de cópias de um modelo específico (menos de 500) e / ou todos eles trabalhavam juntos um pequeno número de dias (menos de 50.000). Nesses casos, o AFR não pode ser considerado confiável para a tomada de decisões de compra.

O AFR total para todos os modelos no ano foi de apenas 1,25%, valor significativamente menor que nos anos anteriores.

Backblaze escreve que, em 2018, uma tendência notável foi a substituição de unidades antigas de 2, 3 e 4 TB por 8, 10, 12 unidades e outras 14 TB no quarto trimestre. Podemos assumir que essa tendência é característica não apenas para o Backblaze, mas também para todo o mercado consumidor: muitos usuários fizeram essa atualização no ano passado. Em 2018, a capacidade total de armazenamento do Backblaze aumentou de 500 para mais de 750 petabytes, com uma média de 75 unidades adicionadas por dia.

Após as atualizações do ano passado, os discos da Western Digital quase desapareceram, agora apenas 383 unidades funcionam, todas com 6 TB, ou seja, apenas 0,37% do número total de unidades.

Backblaze observa discos de bom desempenho HGST (modelo HUH721212ALN604). Durante o primeiro mês de teste de 1200 unidades desse tipo, apenas uma falha foi registrada; portanto, a empresa decidiu aumentar sua frota. Mas o disco mais popular no data center foi o modelo Seagate de 12 TB (ST12000NM0007), que administra 29,7% do farm.

A tabela a seguir compara o AFR por ano e mostra o quão mais confiáveis ​​os discos se tornaram em 2018: o número de falhas diminuiu constantemente pelo terceiro ano consecutivo.



Outra observação interessante: nenhuma das 45 unidades Toshiba de 5 TB falhou desde o segundo trimestre de 2016 (modelo MD04ABA500V). A confiabilidade das unidades Seagate de 10 TB (modelo ST10000NM0086) com AFR de apenas 0,33% no ano passado também continua impressionando, com 1220 unidades operando no total por cerca de 500.000 dias, portanto as estatísticas são bastante confiáveis.

Por fim, a última tabela mostra as taxas de falhas dos discos rígidos desde abril de 2013 - para os modelos que ainda estão em operação.



O conjunto de dados completo para esta revisão está publicado aqui . Se você precisar apenas das tabelas deste artigo, poderá fazer o download do arquivo CSV com os dados.

Source: https://habr.com/ru/post/pt437204/


All Articles