Por quanto tempo ou onde armazenar rapidamente as informações no disco

Boa tarde, Giktayms!

Há algum tempo, na torradeira, recebi algumas perguntas interessantes sobre o armazenamento de informações em discos rígidos, o que me fez querer aprofundar um pouco mais e fiz uma pequena pesquisa.

Algumas das informações já passaram por Habré, mas não todas. E como não consegui encontrar algo na Internet de língua russa, decidi compartilhar o que encontrei com a comunidade.


Sobre desmagnetização de dados em um disco.


Sob condições normais de vida (a ausência de uma mudança acentuada de temperatura / umidade / pressão, a ausência de choques), a superfície magnetizada do disco pode armazenar informações por várias décadas. É difícil garantir, uma vez que testes industriais reais não foram realizados e os realizados geralmente são apenas uma alteração nas condições externas de exposição a um ambiente agressivo.

Mas a maioria concorda que o poder do campo magnético está se degradando a uma taxa de cerca de 1% ao ano .

Ao mesmo tempo, não se pode dizer que, após 50 anos, metade do disco não pode ser lido - isso está incorreto, porque a degradação do campo não é igual à quebra - aqui a sensibilidade das cabeças de leitura e a precisão do mecanismo de posicionamento desempenham um papel .

Mesmo em um lote de discos rígidos de um bom fabricante, a saída é de placas ligeiramente diferentes, e todo o dispositivo é cuidadosamente calibrado na fábrica. A recalibração em casa não é possível.

Com o tempo, externamente, pode parecer que isso tenha deteriorado a gravação magnética, mas na grande maioria dos casos - a degradação da leitura está associada à degradação mecânica dos materiais - isso também causa erros de posicionamento e sensibilidade das cabeças.

Se os dados importantes para você deixaram de ser lidos no disco rígido antigo - provavelmente é uma questão de degradação mecânica / eletrônica, e podem ser lidos em empresas especializadas em recuperação de dados - o disco rígido será desmontado, as panquecas retiradas e instaladas em um dispositivo separado, após o qual serão lidas em dados diretamente.
Mesmo que a mecânica e a eletrônica estejam completamente estragadas - as próprias placas e as informações nelas devem ser lidas.

Há muitas testemunhas que têm discos antigos no armário que podem ser lidos perfeitamente após 15 e até 20 anos (a propósito, eu também sou um deles). E acontece que a unidade não inicia, mal ultrapassando a vida útil da garantia.

Portanto, nos discos modernos, a eletrônica e a mecânica falham primeiro, os conectores estão quebrados, os padrões podem até se tornar obsoletos, mas é improvável que a desmagnetização dos dados seja o principal motivo.

Para isso, podemos acrescentar que as marcações de baixo nível de faixas e setores que foram aplicadas pelo fabricante e que o usuário não poderá sobrescrever usando métodos padrão devem ser as primeiras a desmagnetizar. É verdade que o poder de campo na marcação é muito maior, o que é perceptível ao microscópio, mas, no entanto, nada dura para sempre.

As conclusões deste ponto - para substituir as informações no disco, a fim de "atualizar" a gravação magnética - não há razão.
É muito mais importante garantir a ausência de influências externas agressivas, pois a coisa mais elementar é reforçá-la com mais segurança, a fim de reduzir as vibrações. On-off leva ao fato de que a temperatura do disco muda e, portanto, o material se expande e se estreita. Esse é um dos fatores importantes pelos quais os HDDs rápidos vivem menos do que os discos lentos da série "verde", que tem uma queda de temperatura muito menor. Mas não esqueça que, se o disco não estiver quente ao toque, isso não significa que o metal não se expandiu - cada ciclo de ativação acelera a degradação do material, é simplesmente muito menor para os "discos frios".

Se o computador adormecer regularmente e acordar várias vezes ao dia, e for alimentado pela rede, faz sentido aumentar o tempo de espera até que o disco seja desligado quando alimentado pela rede. Os discos rígidos ociosos modernos consomem apenas alguns watts .

Sobre setores


Isso não é exatamente 512 bytes. Esta é uma área na qual 512 bytes são alocados para dados do usuário. Também há informações de serviço sobre o setor - esse é um rótulo de baixo nível do início e do final do setor, além de uma unidade de correção de dados, geralmente após os dados do usuário. Mais espaço não alocado entre setores (lacuna).

As etiquetas do setor são aplicadas pelo fabricante durante a chamada formatação de baixo nível. Nos anos antigos, isso podia ser feito independentemente do BIOS, mas agora, usando métodos regulares, isso não está mais disponível para o usuário. O volume de dados de serviço pode variar dependendo da otimização do firmware do disco, mas acredita-se que o setor, juntamente com os dados de serviço, considere 577 bytes. Plus gap.

Mais precisamente, era antes.

Em 2007, foi proposto um aumento no tamanho do setor e, após os procedimentos de aprovação e aprovação, a partir de 2011, todos os discos produzidos já estão formatados com um setor de 4096 bytes de dados do usuário (aproximadamente 4211 bytes com dados de serviço) - o chamado Formato Avançado.
A simplificação do endereçamento de setores de baixo nível, que se tornou oito vezes menor com o mesmo volume, também é um aumento na produtividade devido à simplificação dos cálculos e ao trabalho com grandes blocos, e a eficiência do uso do disco aumentou significativamente. Quanto Vamos ler o próximo parágrafo.

Bloco de dados ECC


Nos setores de 512 bytes, o bloco ECC ocupava 50 bytes . Em setores de 4096 bytes, o bloco ECC aumentou para 100 bytes , mas o número de setores em si diminuiu. Na verdade, o ECC agora é quatro vezes menor ( 100 bytes para 4096 bytes versus 400 bytes para 8 * 512 bytes).

Além disso, em uma cadeia de dados mais longa, o algoritmo de correção funciona com mais eficiência, como resultado, tanto o espaço foi economizado quanto a eficiência aumentada. De acordo com várias estimativas, a velocidade de cálculo do ECC aumentou de 5 a 10%. Isso significa que o controlador de disco é menos tenso e pode fazer outras coisas. Indiretamente, isso afeta o desempenho geral dos dados de gravação / leitura.

Uma das principais vantagens é, obviamente, a economia de espaço.

No total - uma diminuição no volume alocado para blocos de ECC, uma diminuição no número total de setores (menos lacunas, menos etiquetas, menos índices para endereçar setores) - o espaço total alocado para dados do usuário aumentou mais de 10% !

Há outra pequena vantagem associada a grandes setores. No caso de um defeito ou defeito de superfície, imediatamente uma grande área será mal marcada. Se você marcar megabytes de setores de 512 bytes, levará várias vezes mais que 4 KB.
Além disso, a parte ilegível será marcada de maneira mais confiável - se cortarmos um pedaço podre ou com minhoca de uma maçã deliciosa, cortaremos algumas das boas - e no disco rígido - é melhor marcar a parte ruim, não na bunda .

Mas é claro, é melhor se livrar de discos defeituosos.

A única exceção são os blocos inválidos lógicos. Eles estão conectados precisamente ao ECC - quando, por várias razões (eletricidade repentinamente desligada, bug de firmware, tempestades da lua ...), e o ECC se mostra incorreto -, setor em que o controlador de disco será considerado ruim. Eles podem ser corrigidos revendo setores defeituosos - agora existem muitos utilitários, começando pela famosa Victoria.

Sobre setores virtuais de 512 bytes


O logotipo com "512e" significa que a própria unidade já é um setor de 4kb, mas funciona no modo de emular setores virtuais de 512 bytes.
O logotipo "4Kn" diz que o disco suporta uma interface nativa de 4k; esses discos estão à venda desde 2014.

Muitos sistemas operacionais ainda populares (aqui estou falando do Windows 7 e Windows Vista) não oferecem suporte a unidades 4K nativamente.
No entanto, os discos antigos neles funcionam bem e os novos discos fornecem uma interface com setores virtuais de 512 bytes.

Os setores virtuais de 512 bytes devem ser lembrados quando você estiver testando discos 512s ou executando um sistema operacional desatualizado durante o teste.
Por exemplo, gravar setores aleatórios de 512 bytes em tais condições se pareceria com “ler 4k, escrever 4k”, o que obviamente produzirá uma degradação incompreensível da velocidade no gráfico. Ao mesmo tempo, as velocidades lineares de gravação e leitura mostrarão desempenho normal.

O Windows suporta unidades 4K nativamente, começando com o Windows 8 e o Windows server 2012.

Sobre o Cluster Straddling.


Isso se aplica às unidades que funcionam na emulação 512 (e há muito mais em uso)

.Nós iremos particionar essa unidade em partições e formatá-la com as configurações padrão. O cluster NTFS padrão é de 4 kilobytes. O bloco HFS + (ou ext4) também costuma ter 4 kilobytes. E o setor físico do disco também é de 4 kilobytes. Tamanho muito conveniente (mesmo uma página mem x86 também é de 4 kB).

Porém, durante o particionamento do disco 512e em partições, pode acontecer que a partição inicie não no início do quarto setor, mas com um múltiplo de deslocamento de 512 bytes.
Como resultado, um cluster / bloco de 4 kilobytes fica entre dois setores físicos de 4 kilobytes do disco rígido.
Cada vez que você lê um cluster, o disco rígido (devido à lógica de sua operação) lê dois setores inteiramente. Ao gravar também, nem tudo é suave.
Vários utilitários de alinhamento resolvem esse problema - a mesma WD Align Tool ou HGST Align Tool para Windows 7 e superior.
Somente você precisará aplicá-las DEPOIS de dividir o disco em partições - o utilitário verificará se as bordas da partição coincidem com o início de um novo setor de 4 KB e as moverá, se necessário. Então você pode trabalhar sem uma queda no desempenho.

Onde as informações são lidas mais rapidamente - no início ou no final do disco?


Nos discos rígidos, o primeiro setor fica do lado de fora da unidade e o último setor, do lado de dentro.

No começo dos tempos, o número de setores na pista era o mesmo, mas era tão denso que você não consegue se lembrar. As faixas mais próximas do início do disco (fora) agora contêm mais setores.

Portanto, a velocidade linear de gravação e leitura de informações localizadas no início do disco é muito maior . Os números exatos dependem do desempenho do próprio disco, mas em termos percentuais - a diferença pode ser de 200% ou até um pouco mais por cento entre as faixas mais extremas (!)
O número de setores por faixa não é indicado individualmente, mas para a zona na qual várias faixas são combinadas; portanto, a diferença de velocidade não será visível para as duas faixas extremas, mas para as duas zonas extremas e diminuirá gradualmente em direção ao meio do disco. Além disso, pode-se dizer empiricamente que existem mais setores "rápidos" no disco - já que existem simplesmente mais deles na parte externa do disco.

Como guardar?


Comparado a CDs, DVDs e unidades flash, os CDs e unidades flash perdem claramente a duração do armazenamento de dados. Os DVDs podem argumentar, mas aqui tudo é ambíguo - você precisa de discos de alta qualidade, uma boa unidade e a gravação não está na velocidade máxima e, ainda assim, existe a possibilidade de os dados pararem de ler. Além disso, 4.5 ou 9 GB em DVD não é tanto, mais a falta de conforto. E você pode salvar apenas uma vez - não é necessário entrar em contato com o DVD-RW para armazenamento de dados a longo prazo.

Gravei mais de 5.000 CD / DVDs ao mesmo tempo, testei a leitura. É claro que a qualidade e a durabilidade da leitura dependiam da qualidade do disco, mas o mesmo Verbatim, que era um dos padrões do CD-R 650, no DVD, era bastante medíocre e, em cada lote, algo sem êxito poderia ser encontrado.

Se você usa discos Blue Ray, o custo de um gravador e discos é tal que, se não for mais barato, é quase equivalente comprar um novo disco rígido em 5 anos e transferir os dados para ele.

Atualmente, as formas de baixo custo para armazenar dados pessoais são principalmente divididas em:
* Se não houver muitos dados e a Internet permitir - você pode armazená-los na nuvem e, de preferência em duas nuvens independentes diferentes, depois de criptografar os dados com um trucrypt / arquivador. Aqui vou anunciar o WinRAR, que, além de arquivar com uma senha, também sabe como usar o ECC. Você pode aumentar o tamanho do arquivo morto em uma determinada porcentagem, mas conseguir recuperar dados de qualquer local danificado nesse arquivo, dentro dessa porcentagem. É ainda possível dividir o arquivo morto em volumes e criar um volume de recuperação como um arquivo separado. Nos tempos antigos, eu usava isso ativamente com disquetes antigos, quando um disquete inteiro poderia simplesmente não ser lido na unidade de outra pessoa.

* Disco rígido removível, mas recomendo mudar a mídia com uma frequência de 3 a 5 anos para uma mais nova, tentando não ir muito longe do período de garantia. Você pode simplesmente comprar um adaptador SATA / USB e atualizar a unidade do sistema para uma mais rápida / mais espaçosa, fornecendo a unidade antiga para backups.

* Compre um NAS doméstico barato com um ataque e configure um espelho simples comum. Esse método é muito mais caro que os dois anteriores, mas se uma das unidades falhar, você só precisará substituir a unidade quebrada por uma nova, e o controlador de ataque conectará a nova unidade à matriz e a preencherá com dados. Ou seja, nada precisará ser reconfigurado para pesquisar e restaurar informações de diferentes backups. Apenas substituí o disco e é isso. O NAS também é muito exigente em termos de energia, pode ser mantido constantemente e automatizar todos os processos de backup.

UPD: DaemonGloom recomenda o maravilhoso dispositivo WD My Cloud Mirror, que custa quase o preço de parafusos rígidos, além de um pequeno pagamento a mais pelo gabinete / controlador:
"A preços atuais - um dispositivo 2x4TB oferece um pagamento em excesso de US $ 100, 2x6TB - US $ 80".

Pessoalmente, faço backup de tudo o que é importante para a segunda unidade e periodicamente solto arquivos manualmente em uma unidade USB externa.
Assim, há a) uma cópia de trabalho, b) um arquivo diário no segundo disco ec) um arquivo aproximadamente mensal em um disco externo desconectado. Mas, em princípio, já estou começando a pensar no NAS.

Como você mantém isso?

Source: https://habr.com/ru/post/pt394111/


All Articles