Cuánto tiempo o dónde almacenar rápidamente información en el disco
Buenas tardes, Giktayms!Hace algún tiempo, en la tostadora recibí algunas preguntas interesantes sobre el almacenamiento de información en discos duros, lo que me hizo querer profundizar un poco más, e investigué un poco.Parte de la información ya pasó por Habré, pero no toda. Y como no pude encontrar algo en la Internet de habla rusa, decidí compartir lo que encontré con la comunidad.Sobre la desmagnetización de datos en un disco.
En condiciones de vida normales (la ausencia de un cambio brusco en la temperatura / humedad / presión, la ausencia de golpes), la superficie magnetizada del disco puede almacenar información durante varias décadas. Es difícil garantizarlo, ya que no se han realizado pruebas industriales reales, y las que se llevan a cabo generalmente son solo un cambio en las condiciones externas para la exposición a un entorno agresivo.Pero la mayoría está de acuerdo en que la potencia del campo magnético se degrada a una tasa de aproximadamente 1% por año .Al mismo tiempo, no se puede decir que después de 50 años no se pueda leer la mitad del disco, esto es incorrecto, porque la degradación del campo no es igual a la rotura, aquí la sensibilidad de los cabezales de lectura y la precisión del mecanismo de posicionamiento juegan un papel importante .Incluso en un lote de discos duros de un buen fabricante, la salida es placas ligeramente diferentes, y todo el dispositivo está cuidadosamente calibrado en la fábrica. La recalibración en el hogar no es posible.Con el tiempo, externamente, puede parecer que esto ha deteriorado la grabación magnética, pero en la gran mayoría de los casos, la degradación de lectura está asociada con la degradación mecánica de los materiales, esto también causa errores de posicionamiento y sensibilidad de los cabezales.Si los datos que son importantes para usted han dejado de leerse en el disco duro anterior, lo más probable es que sea una cuestión de degradación mecánica / electrónica, y puede leerse en compañías especiales que se especializan en la recuperación de datos: el disco duro se desmontará, se extraerán panqueques y se instalarán en un dispositivo separado, después de lo cual se leerán ellos datos directamente.Incluso si la mecánica y la electrónica están completamente arruinadas, las placas en sí y la información sobre ellas deben leerse.Hay muchos testigos que tienen discos viejos en el casillero que se pueden leer perfectamente después de 15 e incluso 20 años (por cierto, yo también soy uno de ellos). Y sucede que la unidad no arranca, apenas ha cruzado la vida útil de la garantía.Por lo tanto, en los discos modernos, la electrónica y la mecánica fallan primero, los conectores se rompen, los estándares incluso pueden volverse obsoletos, pero es poco probable que la desmagnetización de los datos sea la razón principal.A esto, podemos agregar que las marcas de bajo nivel de pistas y sectores que fueron aplicadas por el fabricante y que el usuario no podrá sobrescribir utilizando métodos estándar deberían ser las primeras en desmagnetizar. Es cierto que la potencia de campo en el marcado es mucho mayor, lo que se nota bajo un microscopio, pero sin embargo, nada dura para siempre.Las conclusiones de este punto - para sobrescribir la información en el disco con el fin de "actualizar" la grabación magnética - no hay razón.Es mucho más importante garantizar la ausencia de influencias externas agresivas, ya que lo más elemental es apretarlo de manera más confiable para reducir las vibraciones. El encendido y apagado lleva al hecho de que la temperatura del disco cambia y, por lo tanto, el material se expande y se estrecha. Este es uno de los factores importantes por los que los discos duros rápidos viven menos que los discos lentos de la serie "verde", que tienen una caída de temperatura mucho menor. Pero no olvide que si el disco no está caliente al tacto, esto no significa que el metal no se haya expandido: cada ciclo de encendido y apagado acelera la degradación del material, simplemente es mucho más pequeño para los "discos fríos".Si su computadora se duerme regularmente y se despierta varias veces al día, y se alimenta desde la red, tiene sentido aumentar el tiempo de espera hasta que el disco se apague cuando se alimenta desde la red. Los discos duros inactivos modernos consumen solo un par de vatios .Sobre sectores
Esto no es exactamente 512 bytes. Esta es un área en la que se asignan 512 bytes para datos de usuario. También hay información de servicio sobre el sector: esta es una etiqueta de bajo nivel del principio y el final del sector, así como una unidad de corrección de datos, generalmente viene después de los datos del usuario. Más espacio no asignado entre sectores (brecha).Las etiquetas sectoriales son aplicadas por el fabricante durante el denominado formateo de bajo nivel. En la antigüedad, esto se podía hacer independientemente del BIOS, pero ahora, utilizando métodos regulares, esto ya no está disponible para el usuario. El volumen de datos de servicio puede variar dependiendo de la optimización del firmware del disco, pero se cree que el sector junto con los datos de servicio ocupa 577 bytes. Más hueco.Más precisamente, fue antes.En 2007, se propuso un aumento en el tamaño del sector, y después de los procedimientos de aprobación y aprobación, a partir de 2011, todos los discos producidos ya están formateados con un sector de 4096 bytes de datos de usuario (aproximadamente 4211 bytes con datos de servicio), el denominado Formato avanzado.La simplificación del direccionamiento de sectores de bajo nivel, que se hizo ocho veces más pequeño con el mismo volumen, también es un aumento en la productividad debido a la simplificación de los cálculos y el trabajo con bloques grandes, y la eficiencia del uso del disco ha aumentado significativamente. Cuanto Leamos el siguiente párrafo.Bloque de datos ECC
En sectores de 512 bytes, el bloque ECC ocupaba 50 bytes . En sectores de 4096 bytes, el bloque ECC aumentó a 100 bytes , pero el número de sectores disminuyó. Y de hecho, ECC ahora es cuatro veces más pequeño ( 100 bytes para 4096 bytes frente a 400 bytes para 8 * 512 bytes).Además, en una cadena de datos más larga, el algoritmo de corrección funciona de manera más eficiente, como resultado, se ahorró espacio y se aumentó la eficiencia. Según diversas estimaciones, la velocidad de cálculo de ECC aumentó en un 5-10%. Esto significa que el controlador de disco es menos tenso y puede hacer otras cosas. Indirectamente, esto afecta el rendimiento general de la escritura / lectura de datos.Una de las principales ventajas es, por supuesto, el ahorro de espacio.En total, una disminución en el volumen asignado para los bloques de ECC, una disminución en el número total de sectores (menos espacio, menos etiquetas, menos índices para direccionar sectores): ¡el espacio total asignado para los datos del usuario ha aumentado en más del 10% !Hay otra pequeña ventaja asociada con grandes sectores. En el caso de un defecto o defecto en la superficie, inmediatamente se marcará mal un área grande. Si marca megabytes de sectores de 512 bytes, tardará varias veces más de 4 KB.Además, la parte ilegible se marcará de manera más confiable: si cortamos una pieza podrida o lombriz de una deliciosa manzana, cortamos algo de lo bueno, y en el disco duro, es mejor marcar la parte mala no en el trasero .Pero, por supuesto, es mejor deshacerse de los discos duros.La única excepción son los bloques lógicos defectuosos. Están conectados precisamente con ECC, cuando por varias razones (electricidad apagada repentinamente, error de firmware, tormentas de luna ...), y ECC resultó ser incorrecto, tal sector el controlador de disco se considerará malo. Se pueden corregir volviendo a explorar sectores defectuosos: ahora hay muchas utilidades, comenzando con la famosa Victoria.Acerca de los sectores virtuales de 512 bytes
El logotipo con "512e" significa que la unidad en sí ya es un sector de 4kb, pero funciona en el modo de emulación de sectores virtuales de 512 bytes.El logotipo "4Kn" dice que el disco es compatible con una interfaz nativa de 4k, tales discos han estado a la venta desde 2014.Muchos sistemas operativos aún populares (aquí estoy hablando de Windows 7 y Windows Vista) no admiten unidades 4k de forma nativa.Sin embargo, los discos antiguos en ellos funcionan bien, y los nuevos discos proporcionan una interfaz con sectores virtuales de 512 bytes.Los sectores virtuales de 512 bytes deben recordarse cuando esté probando discos de 512s, o cuando esté ejecutando un SO desactualizado durante la prueba.Por ejemplo, registrar sectores aleatorios de 512 bytes en tales condiciones se vería como "leer 4k, escribir 4k", lo que obviamente produciría una degradación de velocidad incomprensible en el gráfico. Al mismo tiempo, las velocidades lineales de escritura y lectura mostrarán un rendimiento normal.Windows admite unidades 4k de forma nativa, comenzando con Windows 8 y Windows Server 2012.Acerca del grupo a horcajadas.
Esto se aplica a las unidades que funcionan en la emulación número 512 (y hay muchas más en uso).Particionaremos dicha unidad en particiones y la formatearemos con la configuración predeterminada. El clúster NTFS estándar es de 4 kilobytes. El bloque HFS + (o ext4) suele ser también de 4 kilobytes. Y el sector físico del disco también es de 4 kilobytes. Tamaño muy conveniente (incluso una página de memoria x86 también es de 4 kB).Pero durante la partición del disco 512e en particiones, puede suceder que la partición no comience desde el comienzo del cuarto sector, sino con un desplazamiento múltiple de 512 bytes.Como resultado, un clúster / bloque de 4 kilobytes se ubicará entre dos sectores físicos de 4 kilobytes del disco duro.Cada vez que lea dicho clúster, el disco duro (debido a la lógica de su funcionamiento) leerá dos sectores por completo. Al grabar, tampoco todo es suave.Varias utilidades de alineación resuelven este problema: la misma herramienta WD Align Tool o HGST Align Tool para Windows 7 y superior.Solo necesita aplicarlos DESPUÉS de dividir el disco en particiones: la utilidad verificará que los bordes de la partición coincidan con el comienzo de un nuevo sector de 4 KB y los moverá si es necesario. Entonces puede trabajar sin una caída en el rendimiento.¿Dónde se lee la información más rápido, al principio o al final del disco?
En los discos duros, el primer sector está en el exterior del disco, y el último sector está en el interior.Al principio de los tiempos, el número de sectores en la pista era el mismo, pero era tan denso que no puedes recordarlo. Las pistas más cercanas al comienzo del disco (fuera) ahora contienen más sectores.Por lo tanto, la velocidad lineal de escritura y lectura de información ubicada al comienzo del disco es mucho mayor . Los números exactos dependen del rendimiento del disco en sí, pero en términos porcentuales: la diferencia puede ser del 200% o incluso un poco más de porcentaje entre las pistas más extremas (!)El número de sectores por pista se indica no individualmente, sino para la zona en la que se combinan varias pistas, por lo que la diferencia de velocidad será visible no para las dos pistas extremas, sino para las dos zonas extremas y disminuirá gradualmente hacia la mitad del disco. Además, se puede decir empíricamente que hay más sectores "rápidos" en el disco, ya que simplemente hay más de ellos en la parte externa del disco.¿Cómo almacenar?
En comparación con los CD, DVD y unidades flash, los CD y las unidades flash pierden claramente la duración del almacenamiento de datos. Los DVD pueden discutir, pero aquí todo es ambiguo: necesita discos de alta calidad, una buena unidad y la grabación no es a la velocidad máxima, y de todos modos, existe la posibilidad de que los datos dejen de leerse. Además, 4.5 o incluso 9 GB en DVD no es tanto, además de la falta de comodidad. Y solo puede guardar una vez: no necesita ponerse en contacto con DVD-RW para el almacenamiento de datos a largo plazo.Quemé más de 5,000 CD / DVD a la vez, probé la lectura. Por supuesto, la calidad de lectura y la durabilidad dependían de la calidad del disco, pero el mismo Verbatim, que era uno de los estándares del CD-R 650, en el DVD era bastante mediocre, y en cada lote podría haber algo sin éxito.Si toma discos Blue Ray, el costo de una grabadora y discos es tal que, si no es más barato, es casi equivalente a comprar un nuevo disco duro en 5 años y transferirle los datos.Actualmente, las formas de bajo costo para almacenar datos personales se dividen principalmente en:* Si no hay demasiados datos e Internet lo permite, puede almacenarlos en la nube, y preferiblemente en dos nubes independientes diferentes, después de cifrar los datos con un trucrypt / archiver. Aquí anunciaré WinRAR, que, además de archivar con una contraseña, también sabe cómo usar ECC. Puede aumentar el tamaño del archivo en un cierto porcentaje, pero puede recuperar datos de cualquier ubicación dañada en este archivo, dentro de este porcentaje. Incluso es posible dividir el archivo en volúmenes y crear un volumen de recuperación como un archivo separado. En la antigüedad, usaba esto activamente con disquetes antiguos, cuando un disquete completo simplemente no podía leerse en la unidad de otra persona.* Disco duro extraíble, pero recomiendo cambiar los medios con una frecuencia de 3-5 años a uno más nuevo, tratando de no alejarse demasiado del período de garantía. Simplemente puede comprar un adaptador SATA / USB y actualizar la unidad del sistema a una más rápida / de mayor capacidad, dar la unidad antigua para copias de seguridad.* Compre un NAS doméstico económico con una redada y configure un espejo simple ordinario. Este método es mucho más costoso que los dos anteriores, pero si uno de los discos falla, solo necesita reemplazar el disco roto por uno nuevo, y el controlador RAID conectará el nuevo disco a la matriz y lo llenará de datos. Es decir, no será necesario reconfigurar nada para buscar y restaurar información de diferentes copias de seguridad. Acabo de reemplazar el disco y listo. NAS también es muy poco exigente en potencia, se puede dejar encendido constantemente y automatizar todos los procesos de respaldo.UPD: DaemonGloom recomienda el maravilloso dispositivo WD My Cloud Mirror, que tiene casi el precio de los tornillos duros, más un pequeño sobrepago para el estuche / controlador:"A los precios actuales: un dispositivo de 2x4TB ofrece un pago en exceso de $ 100, 2x6TB - $ 80".Personalmente, realizo una copia de seguridad de todo lo importante para la segunda unidad y periódicamente suelto archivos en una unidad USB externa manualmente.Por lo tanto, hay a) una copia de trabajo, b) un archivo diario en el segundo disco, yc) un archivo mensual aproximadamente en un disco externo desconectado. Pero, en principio, ya estoy empezando a pensar en NAS.¿Cómo lo guardas?Source: https://habr.com/ru/post/es394111/
All Articles