¿Por qué es menos probable que las HDD fallen?

El daño a los discos duros es una de las principales razones del tiempo de inactividad del servidor en los centros de datos. Pero recientemente, el número de fallas del disco duro ha disminuido. Vamos a explicar por qué sucede esto.


/ foto William Warby CC BY

Un poco de retrospectiva


Hace veinte años, un disco duro era uno de los "puntos débiles" de una computadora o servidor. Existe una historia conocida con las unidades IBM Deskstar que fallaron incluso después de un uso breve. Estos discos se consideran uno de los HDD comerciales más poco confiables, por lo que recibieron el apodo común de Deathstar ("Estrella de la Muerte").

Deskstar ha proyectado una larga sombra sobre la industria de los discos duros. Muchos fabricantes han comenzado a reducir voluntariamente los períodos de garantía en sus dispositivos. En algunos casos, disminuyeron de tres a un año. Pero con el tiempo, aparecieron nuevas tecnologías que aumentaron la confiabilidad del HDD. Según un estudio realizado por uno de los mayores proveedores de la nube occidental en 2018, la tasa de falla (AFR) de los discos duros en su centro de datos fue de 1.25%. A modo de comparación: en 2016 y 2017, el valor AFR fue de 1.95% y 1.77%, respectivamente.

Los expertos en la industria de TI asocian la reducción en el número de fallas de HDD con el desarrollo de tecnología tanto en las unidades como en los centros de datos. Considere algunas de estas soluciones.

Cámaras de helio


Algunos fabricantes modernos de HDD se llenan de helio. La densidad del helio es siete veces menor que la densidad del aire. Esta característica reduce la fuerza de fricción que actúa sobre los componentes móviles y reduce la fuerza de los flujos de gas, lo que afecta la precisión del posicionamiento de los cabezales de lectura. Además, la tecnología elimina el riesgo de corrosión de los elementos HDD, porque el medio de helio no contiene vapor de agua. Todo esto aumenta el ciclo de vida estimado de los discos duros.

Según un estudio de HGST realizado hace varios años y basado en estadísticas de Netflix, Huawei y HP, la vida útil de los discos de helio es el doble que la de los discos duros clásicos. Por esta razón, las ventas de discos de helio crecen de año en año, y los dispositivos en sí se utilizan cada vez más en los centros de datos de los proveedores de la nube.

Mejora de las condiciones del centro de datos.


Otra razón para mejorar la confiabilidad de los expertos en HDD en la industria es la mejora de las condiciones en los centros de datos. La vida útil de los discos duros está directamente relacionada con su temperatura ambiente. Seagate señala que una temperatura de 30 ° C será óptima. Si está por encima de 50 ° C o por debajo de 5 ° C, el número de fallas aumentará significativamente.

Por lo tanto, las empresas de TI están desarrollando nuevas soluciones de aire acondicionado que mantienen la temperatura óptima en la sala de servidores. Por ejemplo, Facebook introdujo la tecnología de enfriamiento evaporativo para centros de datos. El agua para el sistema se enfría en un intercambiador de calor especial, que se evapora a través de una capa de membrana especial. Este líquido se usa para bajar la temperatura en la sala de máquinas.

Además de los nuevos sistemas de refrigeración, también se están desarrollando soluciones para su gestión. En particular, basado en el aprendizaje automático. Dichos sistemas utilizan sensores que recopilan datos de temperatura fuera y dentro del centro de datos. Luego, el módulo de control utiliza esta información para configurar la ventilación: regula la temperatura al tomar más o menos aire de la calle.

Escribimos con más detalle sobre cómo los sistemas de inteligencia artificial ayudan a enfriar los centros de datos en uno de los materiales de nuestro blog.

Desarrollo de tecnologías de disco duro "internas"


La cantidad de fallas del disco duro también se ve afectada por la humedad. Determina la altura a la que se puede ubicar con seguridad el cabezal de lectura para no dañar la superficie magnética. Para resolver este problema, los fabricantes de discos están introduciendo tecnologías que configuran el movimiento del bloque de cabeza en función de las condiciones de funcionamiento.

Un ejemplo de tal tecnología serían los sensores RV, o los sensores de vibración rotacional. Usando sus lecturas, el módulo de control incorporado cambia la naturaleza del movimiento del bloque de cabezales, de una manera especial redistribuyendo la vibración al cuerpo del dispositivo. A menudo, los sensores RV se encuentran en unidades diseñadas para trabajar en matrices de discos de Seagate, Toshiba y Western Digital.


/ foto mientras tanto dan PD

Sobre la fiabilidad de unidades alternativas


El principal competidor de los discos duros, incluidos los centros de datos, hoy en día son los SSD. Según las estadísticas, el número de fallas de los SSD es menor que el de un HDD. Sin embargo, con la edad, los "trabajadores de estado sólido" el número de errores en la lectura crece el doble de rápido. Para resolver este problema, los fabricantes de SSD están desarrollando métodos de corrección de errores que deberían aumentar la confiabilidad y la vida útil de los dispositivos.

Uno de estos métodos es la actualización SSD ( p. 32 ). Si no se accede a las celdas individuales de la unidad durante mucho tiempo, comienzan a perder carga. Esto puede provocar la pérdida de algunos datos. Por lo tanto, el controlador de la unidad de vez en cuando lee información en celdas no utilizadas, evalúa su estado actual y las "recarga".

Otra tecnología que se sigue utilizando en los centros de datos es la cinta magnética. En el informe de Tendencias de almacenamiento de datos para 2018, la cinta se convirtió en el cuarto almacenamiento más popular después de HDD, SDD y la nube (estamos hablando de varias opciones para almacenar datos de la empresa, no métodos de almacenamiento como tales). Las cintas magnéticas se utilizan principalmente debido a su fiabilidad: los errores en este disco se producen entre cuatro y cinco órdenes de magnitud menos que en el disco duro.

Al mismo tiempo, todavía se están desarrollando nuevas tecnologías para extender la vida útil de la película. En 2017, IBM y Sony crearon cinta magnética, que recibió una capa adicional de "lubricante" para protección. Esta capa reduce el riesgo de daños a la cinta cuando se mueve a una velocidad de 10 metros por segundo.

Existen tecnologías de almacenamiento más experimentales, cuya fiabilidad, en teoría, puede superar significativamente el rendimiento de las unidades clásicas. Por ejemplo, un gran potencial como portador a largo plazo en la comunidad de TI está profetizado a las moléculas de ADN .

Los creadores de los depósitos de ADN planean sellar las moléculas en cápsulas de vidrio, donde serán aisladas de las condiciones ambientales nocivas. Esto le permitirá almacenar datos digitales codificados en ellos durante miles de años sin errores. Tal medio de almacenamiento puede convertirse en una realidad en los próximos años: Microsoft planeaba introducir el almacenamiento de ADN en uno de sus centros de datos.

Pero tales soluciones aún son experimentales y no están diseñadas para un uso generalizado. Por lo tanto, si bien una de las formas más populares de almacenar información en los centros de datos seguirá siendo el disco duro. Y dado que su confiabilidad está creciendo, el HDD permanecerá con nosotros por mucho tiempo.



Recursos del primer blog corporativo de IaaS:


Publicaciones de nuestro canal de Telegram:

Source: https://habr.com/ru/post/440322/


All Articles