Os algoritmos RAID são há muito um padrão reconhecido no campo de armazenamento de dados, fornecendo indicadores predefinidos de confiabilidade e velocidade de acesso. Embora não haja muitas variações de RAID, as principais no momento são os níveis 1, 5 e 6 (mais sua combinação com um nível zero). Mas seu desenvolvimento posterior na forma de RAID EE permitiu aumentar suas vantagens e reduzir algumas desvantagens existentes.
Em geral, a ideia de RAID EE não é nova. E há muito tempo está incorporado em vários controladores. Pegue pelo menos os controladores RAID bastante populares da Adaptec. No entanto, entre os sistemas de armazenamento de dados, o suporte a esses algoritmos ainda é muito raro. O fabricante taiwanês de armazenamento Qsan Technology é apenas um dos poucos que implementou a capacidade de usar o RAID EE em seus produtos (começando com a versão de firmware 1.3.0).
Para que é tão bom o RAID EE?
A principal diferença entre o EE e os níveis tradicionais é a inclusão de um disco de backup hot spare (ou vários discos ao mesmo tempo) no grupo RAID. Ou seja, em outras palavras, os dados do grupo são "distribuídos" não apenas pelos discos principais, mas também pelo (s) disco (s) Hot Spare (s), de forma que haja blocos livres em cada disco, cujo volume total seja igual ao volume do (s) disco (s) " reserva quente.
O RAID EE pode ser usado para os níveis 5 e 6 clássicos, bem como suas combinações com um nível zero (50, 60). Por exemplo, considere um esquema de alocação de bloco para o nível 5EE de 4 discos mais Hot Spare.
No diagrama, P é um bloco de paridade, S é um bloco de Hot Spare. Digamos que a unidade 2 falhou em um grupo.
Como resultado, os blocos com dados do disco 2 serão restaurados para os blocos de Hot Spare.
Assim que substituirmos o disco com falha, os blocos copiados anteriormente retornarão ao seu lugar, e os blocos de Hot Spare estarão novamente disponíveis para uma reserva "quente".
Você também pode dar um exemplo de um esquema de alocação de bloco para o nível 60EE de 8 discos (2 grupos 2 + 2) e dois discos de reposição.
Observe que os sistemas de armazenamento Qsan suportam até 8 unidades Hot Spare como parte de um único grupo EE RAID, fornecendo um nível sem precedentes de proteção de dados.
O uso de discos Hot Spare como parte de um grupo tem várias vantagens sobre os dedicados. Primeiro de tudo, é que esses discos estão envolvidos em operações de leitura / gravação, aumentando assim o desempenho geral do grupo RAID. Obviamente, o aumento na velocidade de acesso não será impressionante, mas é absolutamente gratuito.
O segundo ponto e ainda mais importante é uma redução significativa no tempo de reconstrução. Se considerarmos os níveis tradicionais do RAID 5 ou 6, no caso de uma falha no disco, o processo de recuperação dos blocos ausentes na unidade de backup é iniciado. Nesse caso, a velocidade de gravação dos blocos restaurados dependerá do desempenho de um único disco Hot Spare. Também não esquecemos as operações de E / S padrão enquanto trabalhamos com a matriz, que deve ser processada juntamente com o processo de recuperação. Quanto mais discos em um grupo e maior a capacidade de cada disco, mais demorará o processo de reconstrução. Como resultado, o processo de recuperação em grandes discos NL-SAS pode levar vários dias, durante os quais a matriz está no estado Degradado.
No caso de usar o RAID EE, o processo de reconstrução será mais rápido. Blocos de reposição estão localizados em todos os discos do grupo. E o processo de gravação nesses blocos ocorrerá em paralelo. Obviamente, o tempo de recuperação ainda dependerá do tamanho do disco no grupo e da atividade atual das operações de E / S. Mas o uso da gravação paralela em áreas reservadas em discos pode reduzir significativamente o tempo gasto pela matriz no estado Degradado. Vale ressaltar que o aumento nas unidades Hot Spare como parte do grupo RAID EE pode reduzir ainda mais o tempo de recuperação devido ao maior paralelismo das operações de gravação para liberar blocos.
Para verificar o fato de que o tempo de reconstrução foi reduzido, vários testes foram conduzidos. Um pequeno volume de 100 GB foi usado especialmente para obter resultados em um tempo saudável.
Testamos o Qsan XS5224-D com a interface iSCSI conectada ao servidor, que criou a carga usando o IOMeter. As unidades usadas foram 24 x Seagate Constellation ES, ST500NM0001, 500 GB.
Perfis de carga:
- Padrão de backup (leitura / gravação sequencial, 256 KB (MB / s))
- Padrão de acesso ao banco de dados (conforme definido pela Intel / StorageReview.com, 8 KB, 67% de leitura, 100% aleatório)
- Padrão de acesso ao servidor de arquivos (conforme definido pela Intel)
- Inativo
Comparação RAID5 e RADI5 EE
Comparação RAID60 e RADI60 EE
Com base nos testes, podemos concluir que a implementação do RAID EE no armazenamento Qsan realmente ajuda a reduzir o tempo de recuperação. Mas essa afirmação é verdadeira apenas para aquelas situações em que as operações de leitura prevalecem na natureza da carga.
Não esqueça que durante a reconstrução, a probabilidade de falha de outros discos no grupo aumenta significativamente devido ao aumento acentuado da carga neles. Portanto, reduzir o tempo de recuperação é um dos principais parâmetros de preservação de dados. A possibilidade de usar o RAID EE apenas permite melhorar esta figura. Mas você pode obter ainda mais eficiência se usar o RAID EE no armazenamento Qsan junto com outra tecnologia proprietária - Fast Rebuild , que copia apenas blocos de dados realmente ocupados. O planejamento adequado do espaço de armazenamento eliminará possíveis problemas no futuro. E o rico arsenal de oportunidades para isso fornecido pelo fabricante dos sistemas de armazenamento apenas aumentará a atratividade desses sistemas aos olhos do cliente.