Backblaze统计信息:确定最佳HDD



考虑到个别硬盘模型故障的数量, 自从使用HDD的统计数据发布以来已经过去了一年现在Backblaze新的统计数据

2016年第一季度,该公司的数据中心使用了61590个硬盘。这比去年增加了9.5%,当时有56,224个磁盘在该公司的DC中工作。过去和现在,公司所有HDD服务器的总运行时间已经超过10亿小时。它是大约4200万天或114155年。

2016年第一季度的失败统计





一些评论:

1.表中的HDD总数为61523,而不是61590。原因是,如果少于45个副本,则将模型从表中排除。
2.对于某些型号,年故障率为0.00%。他们在2016年第一季度没有失败。
3.有些指标用太小的数字表示。例如,容量为3 TB的东芝硬盘的故障率仅为8.56%。这仅仅是一个失败,还不足以做出决定。
4.年故障率仅为1.84%。它比以往任何时候都少。

累计指标



该公司于三年前的2013年4月10日开始收集有关硬盘的统计信息。下表显示了整个时期的一般指标。



十亿小时的车程



如上所述,该公司过去使用到现在工作的所有硬盘的总运行时间总计为10亿小时。这是各个型号的运行时间的细分。



“其他”列是尚未显示的模型;公司中少于45种。

什么是最好的硬盘?







HGST驱动器的模型故障,尤其是2 TB和3 TB驱动器的性能要优于其他驱动器。接下来是大约一年前购买的Seagate 4TB HDD。

以下是按硬盘数量划分的细目:



4 TB HDD已经工作了约5.8亿小时。该公司共有48041个4 TB驱动器,这意味着单个HDD的平均寿命约为503个工作日或1.38年。对于此类驱动器,该百分比被拒绝-仅2.12%。

各种制造商的HDD的可靠性公司中的

大多数硬盘均来自HGST和Seagate。但是还有其他制造商提供的系统。下图显示了从2014年到2016年各个公司的磁盘故障百分比,并且逐年进行细分。



为什么该公司的模型数量少于45件?

原因有几个:

1.最初有45个以上的磁盘,但是一些磁盘出现故障,我们用其他型号的磁盘替换了HDD。
2. 几年前,它们是作为Drive Farming计划的一部分来找我们的,而我们只收到了几张相同型号的光盘。我们喜欢统一设备,更喜欢与一个模型的大量系统一起工作,但总的来说,我们使用的是一切。
3.我们用容量相同但型号和制造商不同的磁盘构建了多个Frankenpods(预制存储盒)。

无论如何,如果少于45个这样的磁盘,它们就不会进入统计信息,它们上只有常规数据。

为什么不使用东芝和Western Digital?



经常有人问该公司为什么不购买这些公司的更多磁盘。简短的回答是“我们很累”。事实是,现在该公司需要大批量的磁盘(5000-10000个副本)。至于东芝,Backblaze并不认为这些光盘是最物有所值的。

至于Western Digital,Backblaze会定期收到有趣的报价,但每次出问题时交易都会失败。

6.8和10 TB的型号呢?



该公司使用少量此容量的磁盘模型,因为TB的价格问题仍然与大容量HDD有关,因此定价策略还不是最优的。第二个问题是这种大小的大批量磁盘的可用性。例如,要填充包含20个Storage Pod 6.0服务器Backblaze Vault,需要1200个HDD。该公司每月下载约3个Backblaze Vaults存储,但仍然很难找到大量的高容量磁盘实例。目前,最佳数量是4 TB,这里的价格与TB的比率非常好,并且有很多这样的型号。

什么驱动器被认为是坏的?



驱动器无法打开或在操作系统中无法识别。
驱动器未同步或未在RAID阵列中保持同步。
SMART统计信息返回不可接受的值。

供参考:Backblaze专门从事在线备份。用户可以使用该服务将其数据的备份副本上传到公司数据中心的云中。数据分布在20个分片上。Backblaze声称可以存储200 PB以上的数据。

Source: https://habr.com/ru/post/zh-CN394067/


All Articles