Em nossa postagem anterior, compartilhamos nossas medidas de desempenho do hipervisor após instalar patches contra as vulnerabilidades Meltdown e Spectre. Hoje, é hora de falar sobre o desempenho do data warehouse.
Graças às otimizações do VzKernel e sua recompilação com a opção "Retpoline", substituímos as seqüências vulneráveis de códigos de máquina e conseguimos eliminar quase completamente os problemas de desempenho causados pela necessidade de proteger o hipervisor de vulnerabilidades nos processadores Intel. Como resultado, a diminuição da produtividade foi reduzida para 1-2%. No entanto, nesse contexto, muitos têm dúvidas sobre a operação do armazém de dados. E isso não é surpreendente, porque em ambientes hiperconvergentes, o armazenamento distribuído de dados desempenha um papel fundamental e, com o armazenamento lento, todas as vantagens de desempenho de máquinas e contêineres virtuais podem ser inúteis.
Hoje, queremos compartilhar com você dois testes de demonstração que foram realizados para avaliar o desempenho de máquinas virtuais e a densidade de dados no armazenamento distribuído do VZ Storage, integrado à família de produtos Virtuozzo 7. Um cluster de 6 nós foi usado como banco de ensaio, com armazenamento de dados diretamente apenas cinco deles estavam ocupados e no nó restante as máquinas virtuais estavam localizadas.
Cada nó teve a seguinte configuração:
- Processador: 2 x Intel Xeon E5-2620 v4 a 2.1 GHz
- RAM: 64 GB DDR4 2133 MHz
- NET: 2 x 10 Gb / s - duas sub-redes separadas para separar o tráfego de teste e o tráfego de armazenamento de dados distribuídos
- Capacidades:
- HDD: 8 x 1 TB 7200 RPM - incluindo 7 HDD para servidores de bloco (CS)
- SSD: PCIe Intel DC P3600 de 400 GB - para metadados (MDS), registro no diário e cache do cliente
Um dos discos em cada nó foi alocado para o sistema e os 7 restantes para o servidor de chunk (CS) para armazenamento de dados. Como resultado, o cluster acabou sendo 42 servidores de partes. Para gerenciar essa economia, lançamos três servidores de metadados (MDS). A replicação de dados foi implementada de acordo com o esquema 3: 2, que pode ser considerado uma solução padrão para as tarefas mais comuns.
De acordo com os resultados do teste WebBench, onde avaliamos o desempenho e a densidade de máquinas virtuais com o Windows Server 2012 R2, o número de solicitações de armazenamento virtual no VZ7 é muito maior e o desempenho geral é 30% maior que os resultados da geração anterior de armazenamento entregue com o VZ6 . Ao mesmo tempo, o VZ Storage, juntamente com o hipervisor Virtuozzo 7, pode suportar a operação simultânea de mais de 100 máquinas virtuais em um cluster desse tamanho, proporcionando desempenho aceitável.
WebBench: VM de densidade Windows 2012 R2 com base no VStorage
O segundo teste foi realizado usando o utilitário SysBench e emulado não solicitações OLTP, mas transações OLTP. Carregamos as mesmas máquinas virtuais com o Microsoft Windows Server 2012 R2 no mesmo cluster e obtivemos resultados ainda mais interessantes. Além da vantagem de desempenho com VMs a partir de 30 unidades, o VZ7 mostrou uma maior densidade de distribuição, lidando com a operação simultânea de mais de 100 máquinas virtuais. Ao mesmo tempo, o armazenamento desatualizado no VZ6 demonstra desempenho aceitável para um máximo de 60 máquinas virtuais em um cluster reduzido.
SysBench: densidade de VM do Windows 2012 R2 baseada em VStorage

E um pouco mais sobre a codificação de apagamento
Além de tudo isso, o Virtuozzo continua sendo um defensor do uso de tecnologias de compressão baseadas nos códigos Reed-Solomon ou Erasure Coding. Apesar de uma ampla discussão sobre essa tecnologia, muitos ainda preferem usar cópias diretas e armazenar até 3 cópias de dados em sua rede. No entanto, como a prática demonstrou, essa abordagem reduz o desempenho da rede e diminui o processo de backup.
Para verificar esse fato, montamos dois clusters, 6 nós cada. Ambos os clusters lançaram 3 servidores de metadados (MDS) e 66 servidores de fragmentos (CS) para armazenar dados em unidades SAS 15K. Um dos clusters foi usado para hospedar máquinas virtuais e o outro para backup. Tentamos duas maneiras de colocar backups: EC no modo 3 + 2 (duas somas de hash para três dados) e backup completo 3: 2 (duas cópias completas de dados são armazenadas na rede). Do ponto de vista da proteção de dados, as configurações são idênticas - elas permitem recuperar todas as informações mesmo quando ocorrem dois pontos de falha. No entanto, em termos de desempenho, a CE mostra resultados muito melhores.
Eliminação de codificação e replicação de dados em um script de backup de VM paralela
A abscissa indica o número de máquinas virtuais envolvidas simultaneamente nos processos de backup. E ao longo do eixo das ordenadas está a velocidade média de backup em MB / s. A velocidade é calculada por nó, portanto, o rendimento total e o desempenho do cluster são muito maiores, um múltiplo do número de nós. O gráfico mostra que, com um backup simultâneo de 15 máquinas virtuais de cada nó, o ganho de desempenho devido ao uso de EC está no nível de 10%.
Conclusão
Esses testes mostram as vantagens da arquitetura atualizada e da operação aprimorada do armazenamento VZ ao trabalhar com máquinas virtuais MS Windows, que são tradicionalmente mais difíceis de otimizar e compactar do que as VMs com Linux convidado, que geralmente podem ser convertidas em contêineres do sistema. Neste teste, usamos discos rígidos SAS 15K, não unidades de estado sólido, para os quais os resultados seriam ainda maiores devido a um aumento no tempo de resposta geral e na velocidade do subsistema de armazenamento.