"O teste não pode ser diagnosticado" - onde você colocaria a vírgula nesta frase? Esperamos que, depois de ler este material, você possa dar uma resposta clara a esta pergunta sem problemas. Muitos usuários já enfrentaram a perda de dados por um motivo ou outro, seja um problema de software ou hardware da própria unidade ou um impacto físico não padrão nela, se você entende do que estamos falando. Mas não se trata de danos físicos que serão discutidos hoje. Vamos apenas falar sobre o que não depende de nossas mãos. Vale a pena testar o SSD todos os dias / semanas / meses ou é um desperdício de seus recursos? E como você os testa? Quando você obtém certos resultados, você os entende corretamente? E como você pode, de maneira simples e rápida, garantir que a unidade esteja em ordem ou que seus dados estejam em risco?

Teste ou diagnóstico? Existem muitos programas, mas a essência é uma
À primeira vista, o diagnóstico implica teste, se você pensar globalmente. Mas no caso de drives, seja HDD ou SSD, tudo é um pouco diferente. Ao testar, um usuário comum significa verificar suas características e comparar os indicadores obtidos com os declarados. E sob o diagnóstico está o estudo da SMART, sobre o qual também falaremos hoje, mas um pouco mais tarde. O HDD clássico também entrou na foto, o que, de fato, não é um acidente ...
Aconteceu que o subsistema de armazenamento de dados nos sistemas de desktop é um dos locais mais vulneráveis, já que a vida útil das unidades é geralmente menor que a dos outros componentes de um PC, multifuncional ou laptop. Se anteriormente isso era devido ao componente mecânico (as placas giram nos discos rígidos, as cabeças se movem) e alguns problemas poderiam ser identificados sem a execução de nenhum programa, agora tudo se tornou um pouco mais complicado - não há trituração no SSD e não pode ser. Então, o que os proprietários de SSD fazem?
Existem muitos programas para testar SSDs. Alguns deles se tornaram populares e estão sendo atualizados constantemente, alguns foram esquecidos e outros são tão bons que os desenvolvedores não os atualizam há anos - simplesmente não faz sentido. Em casos graves, você pode executar um teste completo usando a PTS (Performance Test Specification), mas não nos apressaremos ao extremo. Imediatamente, também observamos que alguns fabricantes reivindicam a mesma velocidade operacional, mas, de fato, a velocidade pode ser notavelmente mais baixa: se a unidade for nova e reparável, teremos uma solução com armazenamento em cache SLC, onde a velocidade máxima estará disponível apenas nos primeiros gigabytes (ou dezenas de gigabytes) se a capacidade do disco for superior a 900 GB) e a velocidade diminuirá. Esta é uma situação completamente normal. Como entender o tamanho do cache e garantir que o problema não seja realmente um problema? Pegue um arquivo, por exemplo, com uma capacidade de 50 GB e copie-o para a unidade experimental a partir de uma mídia obviamente mais rápida. A velocidade será alta e, em seguida, diminuirá e permanecerá uniforme até o final dentro de 50-150 MB / s, dependendo do modelo SSD. Se o arquivo de teste não for copiado de maneira desigual (por exemplo, há pausas com uma queda na velocidade de 0 MB / s), você deve pensar em testes adicionais e estudar o status do SSD usando software proprietário do fabricante.
Um exemplo vívido da operação correta de SSDs com tecnologia de cache SLC é apresentado na captura de tela:

Os usuários que usam o Windows 10 podem descobrir os problemas sem mais ações - assim que o sistema operacional vê alterações negativas no SMART, ele avisa sobre isso com uma recomendação para fazer cópias de segurança dos dados. Mas vamos voltar um pouco, ou seja, aos chamados benchmarks. AS SSD Benchmark, CrystalDiskMark, Anvils Storage Utilities, ATTO Disk Benchmark, TxBench e, afinal, Iometer são nomes conhecidos, não são? É inegável que cada um de vocês com alguma periodicidade lança esses mesmos benchmarks para verificar a velocidade do SSD instalado. Se a unidade está viva e bem, vemos, por assim dizer, belos resultados agradáveis aos olhos e que garantem tranquilidade ao dinheiro da carteira. E que tipo de números vemos? Na maioria das vezes, quatro indicadores são medidos - leitura e gravação sequencial, operações em bloco 4K (KB), operações em bloco 4K multithread e tempo de resposta da unidade. Todos os indicadores acima são importantes. Sim, cada um deles pode ser completamente diferente para unidades diferentes. Por exemplo, para as unidades nº 1 e nº 2, as mesmas velocidades de leitura e gravação seqüenciais são declaradas, mas as velocidades com blocos 4K podem variar em uma ordem de magnitude - tudo depende da memória, controlador e firmware. Portanto, é simplesmente impossível comparar os resultados de diferentes modelos. Para uma comparação correta, apenas unidades completamente idênticas são permitidas. Ainda existe um indicador como IOPS, mas depende dos outros indicadores listados acima, portanto, não devemos falar sobre isso separadamente. Às vezes, nos benchmarks existem indicadores de leitura / gravação aleatória, mas não faz sentido considerá-los os principais, em nossa opinião.

E, como você pode imaginar, os resultados de cada programa podem mostrar dados diferentes - tudo depende dos parâmetros de teste que o desenvolvedor define. Em alguns casos, eles podem ser alterados para obter resultados diferentes. Mas se você testar "na testa", os números podem ser muito diferentes. Aqui está outro exemplo de teste em que, com as configurações padrão, vemos resultados visivelmente distinguíveis de leitura e gravação seqüencial. Mas você também deve prestar atenção à velocidade de trabalhar com blocos 4K - aqui todos os programas já mostram o mesmo resultado. Na verdade, este teste é uma das principais.

Mas, como notamos, apenas uma das chaves. Sim, e algo mais a ter em mente - o estado da unidade. Se você trouxe um disco de uma loja e o testou em um dos benchmarks listados acima, quase sempre obterá as características declaradas. Mas se você repetir o teste após algum tempo, quando o disco estiver parcialmente ou quase completamente cheio ou cheio, mas você excluir uma certa quantidade de dados da maneira mais usual, os resultados poderão ser muito diferentes. Isso se deve precisamente ao princípio de operação de unidades de estado sólido com dados, quando eles não são excluídos imediatamente, mas apenas marcados para exclusão. Nesse caso, antes de gravar novos dados (os mesmos arquivos de teste dos benchmarks), os dados antigos são excluídos primeiro. Falamos sobre isso
em mais detalhes
no artigo anterior .
De fato, dependendo dos cenários, você mesmo deve escolher os parâmetros. Uma coisa - sistemas domésticos ou de escritório que usam Windows / Linux / MacOS e outra - sistemas de servidor projetados para executar determinadas tarefas. Por exemplo, em servidores que trabalham com bancos de dados, podem ser instaladas unidades NVMe que digerem perfeitamente profundidades de fila de pelo menos 256 e para as quais 32 ou 64 são conversas de bebês. Obviamente, usar os benchmarks clássicos listados acima, nesse caso, é uma perda de tempo. Grandes empresas usam scripts de teste proprietários, por exemplo, com base no utilitário fio. Quem não precisa reproduzir determinadas tarefas pode usar a metodologia internacional
SNIA , que descreve todos os testes e oferece pseudo-scripts. Sim, será necessário um pouco de trabalho neles, mas você pode obter testes totalmente automatizados, de acordo com os resultados dos quais você pode entender o comportamento da unidade - identificar seus pontos fortes e fracos, ver como ele se comporta sob cargas prolongadas e ter uma idéia do desempenho ao trabalhar com diferentes blocos de dados .
De qualquer forma, deve-se dizer que cada fabricante possui seu próprio software de teste. Na maioria das vezes, o nome, a versão e os parâmetros do benchmark escolhido por ele são adicionados à especificação em letras pequenas em algum lugar abaixo. Obviamente, os resultados são aproximadamente comparáveis, mas as diferenças nos resultados podem certamente ser. A seguir, não importa o quão triste possa parecer, o usuário precisa ter cuidado ao testar: se o resultado não corresponder ao declarado, talvez outros parâmetros de teste sejam definidos, dos quais depende muito.
A teoria é boa, mas vamos voltar ao estado real das coisas. Como já dissemos, é importante encontrar dados sobre os parâmetros de teste pelo fabricante da unidade específica que você comprou. Pense em tudo? Não, não todos. Depende muito da plataforma de hardware - a bancada de testes na qual os testes são realizados. Obviamente, esses dados também podem ser indicados na especificação de um SSD específico, mas isso nem sempre acontece. O que depende disso? Por exemplo, antes de comprar um SSD, você lê alguns comentários. Em cada um deles, os autores usaram os mesmos benchmarks padrão, que mostraram resultados diferentes. Em quem acreditar? Se as placas-mãe e o software (incluindo o sistema operacional) fossem os mesmos - a questão é justa, é preciso procurar uma fonte independente de informação adicional. Mas se as placas ou o sistema operacional forem diferentes - as diferenças nos resultados podem ser consideradas na ordem das coisas. Outro driver, outro sistema operacional, outra placa-mãe e diferentes unidades de temperatura durante o teste - tudo isso afeta os resultados finais. É por esse motivo que é quase impossível obter os números que você vê nos sites dos fabricantes ou nas análises. E por esse motivo, não faz sentido se preocupar com as diferenças entre seus resultados e os de outros usuários. Por exemplo, os controladores SATA de terceiros às vezes são implementados na placa-mãe (para aumentar o número de portas correspondentes) e geralmente têm velocidades piores. Além disso, a diferença pode ser de 25 a 35%! Em outras palavras, para reproduzir os resultados reivindicados, será necessário observar rigorosamente todos os aspectos da metodologia de teste. Portanto, se os indicadores de velocidade recebidos não corresponderem aos declarados, você não deve levar a compra de volta à loja no mesmo dia. A menos, é claro, que essa não seja uma situação crítica com velocidade e falhas mínimas ao ler ou gravar dados. Além disso, as velocidades da maioria dos SSDs mudam com uma velocidade pior ao longo do tempo, parando em um determinado ponto chamado desempenho estacionário. Portanto, a pergunta é: é necessário testar constantemente o SSD no final? Embora não esteja totalmente certo. É melhor: faz sentido testar constantemente os SSDs?
Teste regular ou comportamento de monitoramento?
Então, se é necessário, voltando do trabalho para casa, começar a afastar a referência mais uma vez? Isso simplesmente não é recomendado. Goste ou não, mas qualquer um dos programas existentes desse tipo grava dados na unidade. Alguns mais, outros menos, mas eles escrevem. Sim, comparado com o recurso SSD, o volume gravado é bastante pequeno, mas é. E as funções TRIM / Deallocate levarão tempo para processar os dados excluídos. Em geral, não faz sentido executar testes regularmente ou sem nada para fazer. Mas se, no trabalho diário, você começar a notar uma desaceleração do sistema ou software pesado instalado no SSD, além de congela, BSODs, erros na gravação e na leitura de arquivos, você já deve estar confuso ao identificar a causa do problema. É possível que o problema esteja do lado de outros componentes, mas verificar a unidade é o mais fácil. Isso exigirá software proprietário do fabricante do SSD. Para nossas unidades - Kingston SSD Manager. Mas, antes de tudo, faça backup de dados importantes e só então faça diagnósticos e testes. Primeiro, olhe para a área SSD Health. Possui dois indicadores em porcentagem. O primeiro é o chamado desgaste da unidade, o segundo é o uso da área de memória sobressalente. Quanto menor o valor, mais preocupação você deve ter. Obviamente, se os valores diminuírem 1-2-3% ao ano com o uso intensivo do inversor, essa é uma situação normal. Outra coisa é se, sem cargas especiais, os valores diminuem extraordinariamente rapidamente. Nas proximidades, há outra área - Visão Geral da Saúde. Ele relata brevemente se erros de vários tipos foram registrados e as condições gerais do inversor são indicadas. Também verificamos novos firmware. Mais precisamente, o programa faz isso sozinho. Se houver um e o disco se comportar de maneira estranha (há erros, o nível de "integridade" é reduzido e outros componentes geralmente são excluídos), podemos instalá-lo com segurança.

Se o fabricante do seu SSD não cuidar do suporte na forma de software proprietário, você poderá usar um universal, por exemplo - CrystalDiskInfo. Não, a Intel possui seu próprio software, a captura de tela abaixo é apenas um exemplo :) O que devo procurar? Pela porcentagem do estado de saúde (pelo menos aproximadamente, mas a situação ficará clara), pelo tempo total de operação, pelo número de inclusões e pelos volumes de dados registrados e lidos. Nem sempre esses valores serão exibidos e alguns dos atributos na lista estarão visíveis como específicos do fornecedor. Mais sobre isso mais tarde.

E aqui está um exemplo vívido de uma unidade que já falhou, que funcionou por um tempo relativamente curto, mas que começou a funcionar "de vez em quando". Quando ligado, o sistema não o viu e, após uma reinicialização, tudo estava bem. E essa situação foi repetida em ordem aleatória. A principal coisa com esse comportamento da unidade é fazer backup imediato de dados importantes, o que, no entanto, dissemos recentemente. Mas não vamos cansar de repetir isso. O número de partidas e tempos de execução é completamente inatingível. Quase 20 mil dias de trabalho. Ou cerca de 54 anos ...

Mas isso não é tudo - dê uma olhada nos valores do software proprietário do fabricante! Valores incríveis, certo? Nesses casos, a atualização do firmware para a versão atual pode ajudar. Caso contrário, é melhor entrar em contato com o fabricante como parte do serviço de garantia. E se houver um novo firmware, depois da atualização, não jogue dados importantes no disco, mas trabalhe com cuidado com ele e observe o assunto da estabilidade. Talvez o problema seja resolvido, mas talvez não.

Você pode adicionar mais uma coisa. Alguns usuários, por hábito ou ignorância, usam software que eles conhecem há muito tempo, que monitoram o status dos discos rígidos clássicos (HDDs). Isso é fortemente desencorajado, uma vez que os algoritmos de operação do HDD e SSD são surpreendentemente diferentes, assim como o conjunto de comandos do controlador. Isto é especialmente verdade para os SSDs NVMe. Alguns programas (por exemplo, Victoria) receberam suporte de SSD, mas ainda continuam sendo finalizados (e serão finalizados?) Em termos de correção da demonstração de informações sobre a mídia conectada. Por exemplo, apenas um mês se passou desde o momento em que as leituras SMART dos SSDs da Kingston adquiriram pelo menos alguma forma correta e, mesmo assim, não completamente. Tudo isso se aplica não apenas ao programa mencionado, mas também a muitos outros. É por isso que, para evitar a interpretação incorreta dos dados, vale a pena usar apenas o software em que há confiança - utilitários proprietários de fabricantes ou projetos grandes e atualizados com freqüência.
Manter um olho em cada célula é ousado. Estúpido, mas corajoso
Alguns fabricantes implementam em seu software a capacidade de verificar os endereços de cada unidade lógica (LBA) quanto a erros durante a leitura. Durante esse teste, todo o espaço livre da unidade é usado para gravar dados arbitrários e lê-los novamente para verificar a integridade. Essa verificação pode levar mais de uma hora (depende do volume da unidade e do espaço livre nela, bem como de seus indicadores de velocidade). Este teste permite identificar células defeituosas. Mas isso não acontece sem nuances. Primeiramente, de uma maneira boa, o SSD deve estar vazio para verificar a memória máxima. Outro problema surge disso: você precisa fazer backups e preenchê-los novamente, o que tira o recurso da unidade. Em segundo lugar, ainda mais recursos de memória são gastos no próprio teste. Sem mencionar o tempo gasto. E o que aprendemos com os resultados dos testes? Existem duas opções, como você entende, ou haverá células quebradas ou não. No primeiro caso, estamos desperdiçando um recurso e tempo e, no segundo, estamos desperdiçando um recurso e tempo. Sim, é assim que parece. As células ruins e sem esses testes se sentirão quando chegar a hora. Portanto, não faz sentido verificar cada LBA.
Você poderia dar mais detalhes sobre o SMART?
Todos viram uma vez um conjunto de nomes específicos (atributos) e seus valores exibidos em uma lista na seção correspondente ou diretamente na janela principal do programa, como visto na captura de tela acima. Mas o que eles significam e como entendê-los? Vamos voltar um pouco para entender o que é o quê. Em teoria, cada fabricante traz algo próprio para o produto, a fim de atrair um potencial comprador com essa singularidade. Mas com o SMART, o resultado foi um pouco diferente.
Dependendo do fabricante e do modelo do inversor, o conjunto de parâmetros pode variar; portanto, os programas universais podem não conhecer determinados valores, marcando-os como específicos do fornecedor. Muitos fabricantes fornecem documentação de acesso aberto para entender os atributos de suas unidades - SMART Attribute. Pode ser encontrado no site do fabricante.

É por isso que é recomendável usar software proprietário que esteja ciente de todas as complexidades dos modelos de unidades compatíveis. Além disso, é altamente recomendável usar a interface em inglês para obter informações confiáveis sobre o status da unidade. Muitas vezes, a tradução para o russo não é totalmente correta, o que pode causar confusão. E a documentação em si, mencionada acima, é frequentemente fornecida em inglês.
Agora, veremos os atributos básicos usando a unidade Kingston UV500 como exemplo. Para quem é interessante - lemos, para quem não é - pressionamos PageDown algumas vezes e lemos a conclusão. Mas esperamos que você ainda esteja interessado - de qualquer forma, a informação é útil. A construção do texto pode parecer incomum, mas será mais conveniente para todos - você não precisará digitar palavras-variáveis adicionais e será mais fácil encontrar as palavras originais no relatório da sua unidade.
(ID 1) Read Error Rate – .
(ID 5) Reallocated Sector Count – . , , . SSD , . . LBA , , . – . , .
(ID 9) Power On Hours – , .
(ID 12) Power Cycle Count – , ( ).
(ID 170) Used Reserved Block Count – .
(ID 171) Program Fail Count – .
(ID 172) Erase Fail Count – .
(ID 174) Unexpected Power Off Count – ( ) .
(ID 175) Program Fail Count Worst Die – .
(ID 176) Erase Fail Count Worst Die – .
(ID 178) Used Reserved Block Count worst Die – .
(ID 180) Unused Reserved Block Count (SSD Total) – ( , ) .
(ID 187) Reported Uncorrectable Errors – .
(ID 194) Temperature – .
(ID 195) On-the-Fly ECC Uncorrectable Error Count – .
(ID 196) Reallocation Event Count – .
(ID 197) Pending Sector Count – , .
(ID 199) UDMA CRC Error Count – , SATA .
(ID 201) Uncorrectable Read Error Rate – .
(ID 204) Soft ECC Correction Rate – .
(ID 231) SSD Life Left – / .
(ID 241) GB Written from Interface – , .
(ID 242) GB Read from Interface – , .
(ID 250) Total Number of NAND Read Retries – .
, . , , . , : – , – . – . - – , , .
?
, . – . , SSD. , . , , . . . , . – . , -, – . Kingston A400R 256 . TBW 80 (81920 ), – 1 . , , 224 . ? – . 25 , 9 . A1000 150 600 , ! 5- , 960 330 , , , . , ? , – . , . – . Kingston HyperX
Gerenciador de SSD , que tem todo o necessário para a funcionalidade média do usuário. Embora seja improvável que o seu Kingston ou HyperX falhe ... Isso é tudo, sucesso em todos e longa vida útil de seus discos!PS Em caso de problemas com o SSD, a bananeira ainda não ajuda :(
Para obter mais informações sobre os produtos Kingston , visite o site da empresa.