Como o HPE SimpliVity 380 for VDI funcionará: testes de carga difíceis

imagem

O cliente queria VDI. Eu olhei atentamente para o monte de desktop virtual SimpliVity + VDI Citrix. Para todos os operadores, trabalhadores de escritório nas cidades e assim por diante. Existem cinco mil usuários apenas na primeira onda de migração e, portanto, eles insistiram no teste de estresse. O VDI pode começar a desacelerar, pode calmamente se deitar - e isso nem sempre acontece devido a problemas com o canal. Compramos um pacote de testes muito poderoso especificamente para a VDI e carregamos a infraestrutura até que ela caísse nos discos e no processador.

Portanto, precisamos de uma garrafa de plástico, o software LoginVSI para testes sofisticados de VDI. Temos licenças para 300 usuários. Em seguida, eles levaram o hardware HPE SimpliVity 380 em um pacote adequado para a tarefa de densidade máxima do usuário em um servidor, cortaram máquinas virtuais com uma boa inscrição excessiva, colocaram o software de escritório no Win10 e começaram a testar.

Vamos lá!

O sistema


Dois nós (servidores) HPE SimpliVity 380 Gen10. Em cada um:

  • 2 x Intel Xeon Platinum 8170 26c 2.1Ghz.
  • RAM: 768 GB, LRDIMMs de 12 x 64 GB DDR4 2666 MHz.
  • Controlador de disco principal: HPE Smart Array P816i-a SR Gen10.
  • Discos rígidos: SSD SATA 6Gb / s de 9 x 1,92 TB (na configuração RAID6 7 + 2, ou seja, é um modelo Médio em termos de HPE SimpliVity).
  • Placas de rede: 4 x 1Gb Eth (dados do usuário), 2 x 10Gb Eth (back-end SimpliVity e vMotion).
  • Placas FPGA integradas especiais em cada nó para desduplicação / compactação.

Os nós são conectados entre si por uma interconexão Ethernet de 10 Gb diretamente sem um comutador externo, que é usado como um back-end SimpliVity e para transmitir dados da máquina virtual via NFS. Os dados da máquina virtual em um cluster são sempre espelhados entre dois nós.

Os nós são agrupados em um cluster do Vmware vSphere executando o vCenter.

Para teste, um controlador de domínio e um intermediário de conexão Citrix são implantados. O controlador de domínio, o broker e o vCenter são colocados em um cluster separado.
imagem
imagem
Como uma infraestrutura de teste, 300 áreas de trabalho virtuais são implantadas na configuração Dedicado - Cópia Completa, ou seja, cada área de trabalho é uma cópia completa da imagem original da máquina virtual e salva todas as alterações feitas pelos usuários.

Cada máquina virtual possui 2vCPU e 4GB de RAM:

imagem

imagem

O seguinte software necessário para teste foi instalado nas máquinas virtuais:

  • Windows 10 (64 bits), versão 1809.
  • Adobe Reader XI.
  • Citrix Virtual Delivery Agent 1811.1.
  • Doro PDF 1.82.
  • Atualização 7 do Java 7.
  • Microsoft Office Professional Plus 2016.

Entre nós - replicação síncrona. Cada bloco de dados no cluster possui duas cópias. Ou seja, agora um conjunto completo de dados em cada um dos nós. Com um cluster de três ou mais nós - cópias de blocos em dois lugares diferentes. Ao criar uma nova VM, uma cópia adicional é criada em um dos nós do cluster. Se um nó falhar, todas as VMs executadas anteriormente nele serão reiniciadas automaticamente em outros nós em que tenham réplicas. Se o nó falhar por um longo tempo, uma recuperação gradual de redundância será iniciada e o cluster retornará à redundância N + 1 novamente.

O equilíbrio e o armazenamento de dados ocorrem no nível do armazenamento de software do próprio SimpliVity.

As máquinas virtuais executam um cluster de virtualização e também as hospedam no armazenamento de software. Os próprios desktops foram tomados de acordo com o modelo padrão: as tabelas de financiadores e operacionalistas fizeram um teste (esses são dois modelos diferentes).

Teste


Para o teste, foi utilizado o complexo de testes do software LoginVSI 4.1. O complexo LoginVSI como parte do servidor de gerenciamento e 12 máquinas para conexões de teste foram implantados em um host físico separado.
imagem

O teste foi realizado em três modos:

Modo de referência - opções de carregamento para 300 trabalhadores do conhecimento e 300 trabalhadores do armazenamento.

O modo padrão é a opção de carregamento de 300 trabalhadores de energia.

Para permitir que os funcionários do Power trabalhem e aumentem a diversidade de carga, uma biblioteca de arquivos adicionais do Power Library foi adicionada ao complexo LoginVSI. Para garantir a repetibilidade dos resultados, todas as configurações da bancada de testes foram deixadas em Padrão.

Os testes dos trabalhadores da Knowledge and Power simulam a carga real de usuários que trabalham em estações de trabalho virtuais.

O teste de trabalhadores de armazenamento foi criado especificamente para testar sistemas de armazenamento, longe de cargas de trabalho reais e, em grande parte, consiste no trabalho do usuário com um grande número de arquivos de tamanhos diferentes.

Durante o teste, os usuários efetuam logon nas estações de trabalho por 48 minutos, aproximadamente um usuário a cada 10 segundos.

Resultados


O principal resultado do teste do LoginVSI é a métrica VSImax, que é compilada a partir do tempo de execução de várias tarefas executadas pelo usuário. Por exemplo: tempo de abertura do arquivo no bloco de notas, tempo de compactação do arquivo no 7-Zip, etc.

Uma descrição detalhada do cálculo das métricas está disponível na documentação oficial no link .

Em outras palavras, o LoginVSI repete um padrão de carregamento típico, simulando ações do usuário em um pacote de escritório, lendo PDFs e assim por diante, e mede vários atrasos. Há um nível crítico de atrasos "tudo fica mais lento, é impossível trabalhar"), antes do qual se considera que o máximo de usuários não é atingido. Se o tempo de resposta for 1.000 ms mais rápido que esse estado "tudo fica mais lento", o sistema é considerado bom e você pode adicionar mais usuários.

Aqui estão as métricas básicas:

Métrica


Ação tomada


Descrição detalhada


Componentes carregáveis


NSLD


Horário de abertura do texto
lima pesando 1.500 kB


O bloco de notas é iniciado e
abre um documento aleatório com 1.500 Kbytes, copiado da piscina
de recursos


CPU e E / S


Nfo


Horário de abertura do diálogo
janelas de bloco de notas


Abrindo um arquivo VSI-Notepad [Ctrl + O]


CPU, RAM e E / S



ZHC *


Tempo de criação de arquivo zip de compactação forte


Compactação local
tamanho de arquivo .pst aleatório de 5 MB, copiado de
pool de recursos


CPU e E / S


ZLC *


Tempo de criação de arquivo zip de baixa compactação


Compactação local
tamanho de arquivo .pst aleatório de 5 MB, copiado de
pool de recursos


I / O



CPU


Cálculo grande
matriz de dados aleatórios


Crie uma grande matriz
dados aleatórios a serem usados ​​no temporizador de E / S (temporizador de E / S)


CPU



Ao executar o teste, a métrica básica do VSIbase é inicialmente calculada, o que mostra a velocidade das tarefas sem a carga no sistema. Com base nisso, o VSImax Threshold é determinado, que é igual a VSIbase + 1000ms.

As conclusões sobre o desempenho do sistema são feitas com base em duas métricas: VSIbase, que determina a velocidade do sistema, e o limite VSImax, que determina o número máximo de usuários que o sistema pode suportar sem degradação significativa.

Referência de 300 trabalhadores do conhecimento


Trabalhadores do conhecimento são usuários que carregam regularmente memória, processador e E / S com vários pequenos picos. O software emula a carga de usuários exigentes de escritório, como se estivessem constantemente cutucando algo (PDF, Java, suíte de escritório, visualizando fotos, 7-Zip). À medida que os usuários são adicionados de zero a 300, o atraso de cada um aumenta gradualmente.

Dados estatísticos do VSImax:
imagem
VSIbase = 986ms, o limite de VSI não foi atingido.

Estatísticas da carga no sistema de armazenamento do monitoramento SimpliVity:
imagem

Com esse tipo de carga, o sistema pode suportar carga aumentada com pouca ou nenhuma degradação no desempenho. O tempo de execução das tarefas do usuário aumenta sem problemas, o tempo de resposta do sistema não muda durante o teste e é de até 3 ms para gravação e até 1 ms para leitura.

Conclusão: 300 conhecimentos de usuários sem problemas trabalham no cluster atual e não interferem entre si, atingindo a assinatura excessiva de pCPU / vCPU 1 a 6. Os atrasos gerais aumentam uniformemente, mas o limite condicional não foi atingido.

Referência de 300 trabalhadores de armazenamento


São usuários que constantemente escrevem e leem na proporção de 30 a 70, respectivamente. Este teste foi realizado mais por uma questão de experiência. Dados estatísticos do VSImax:
imagem

VSIbase = 1673, limite de VSI atingido em 240 usuários.

Estatísticas da carga no sistema de armazenamento do monitoramento SimpliVity:
imagem
Na verdade, esse tipo de carga é um teste de estresse do sistema de armazenamento. Quando é executado, cada usuário grava no disco muitos arquivos aleatórios de tamanhos diferentes. Nesse caso, é possível observar que, quando um determinado limite de carregamento é excedido, alguns usuários aumentam o tempo necessário para concluir as tarefas de gravação de arquivos. Ao mesmo tempo, a carga no sistema de armazenamento, processador e memória do host não muda significativamente; portanto, atualmente é impossível determinar exatamente a que os atrasos estão associados.

Conclusões sobre o desempenho do sistema usando este teste só podem ser feitas em comparação com os resultados de outros sistemas, uma vez que essas cargas são sintéticas, irreais. No entanto, em geral, o teste foi bem. Até 210 sessões, tudo correu bem e, em seguida, começaram respostas incompreensíveis, que não foram rastreadas em nenhum outro lugar, exceto no Login VSI.

300 trabalhadores do poder


Esses são usuários que amam o processador, a memória e o IO alto. Esses “usuários avançados” executam regularmente tarefas complexas com altos picos, como instalar novo software e descompactar arquivos grandes. Dados estatísticos do VSImax:
imagem

VSIbase = 970, o limite de VSI não foi atingido.

Estatísticas da carga no sistema de armazenamento do monitoramento SimpliVity:
imagem

Durante o teste, o limite de carga do processador foi atingido em um dos nós do sistema, mas isso não teve um impacto significativo em sua operação:

imagem

imagem

Nesse caso, o sistema pode suportar carga aumentada sem degradação significativa do desempenho. O tempo de execução das tarefas do usuário aumenta sem problemas, o tempo de resposta do sistema não muda durante o teste e é de até 3 ms para gravação e de 1 ms para leitura.

Os testes habituais para o cliente não foram suficientes, e fomos além: aumentamos as características da VM (o número de vCPUs para avaliar o aumento no tamanho do disco e do excesso de assinatura) e adicionamos carga adicional.

Durante testes adicionais, a seguinte configuração de suporte foi usada:
Implantou 300 áreas de trabalho virtuais na configuração de 4vCPU, 4GB RAM, 80GB HDD.

Configuração de uma das máquinas de teste:
imagem

As máquinas são implantadas na opção Dedicado - Cópia completa:

imagem

imagem

300 trabalhadores do conhecimento avaliam 12 excesso de inscrições


Dados estatísticos do VSImax:
imagem

VSIbase = 921 ms, o limite de VSI não foi atingido.

Estatísticas da carga no sistema de armazenamento do monitoramento SimpliVity:
imagem

Os resultados são semelhantes a testar a configuração anterior da VM.

300 trabalhadores de energia com excesso de inscrições 12


Dados estatísticos do VSImax:
imagem

VSIbase = 933, o limite de VSI não foi atingido.

Estatísticas da carga no sistema de armazenamento do monitoramento SimpliVity:
imagem

Nesse teste, o limite de carga do processador também foi atingido, mas isso não teve um impacto significativo no desempenho:

imagem

imagem

Os resultados são semelhantes a testar a configuração anterior.

O que acontece se você iniciar o carregamento por 10 horas?


Agora vamos ver se haverá um "efeito de acumulação" e executar testes por 10 horas seguidas.

Testes longos e uma descrição da seção devem visar o fato de que queríamos verificar se haveria algum problema no farm com uma carga longa.

Referência de 300 trabalhadores do conhecimento + 10 horas


Além disso, o teste da variante de carga de 300 trabalhadores do conhecimento foi realizado com o trabalho subsequente dos usuários por 10 horas.

Dados estatísticos do VSImax:
imagem

VSIbase = 919 ms, o limite de VSI não foi atingido.

Dados estatísticos detalhados do VSImax:
imagem

O gráfico mostra que durante todo o teste não há degradação do desempenho.

Estatísticas da carga no sistema de armazenamento do monitoramento SimpliVity:
imagem

O desempenho do sistema de armazenamento permanece no mesmo nível durante o teste.

Testes adicionais com carga sintética adicionada


O cliente pediu para adicionar uma carga selvagem ao disco. Para fazer isso, uma tarefa foi adicionada ao sistema de armazenamento em cada uma das máquinas virtuais do usuário para iniciar uma carga sintética no disco quando o usuário faz logon no sistema. A carga foi fornecida pelo utilitário fio, que permite limitar a carga no disco pelo número de IOPS. Em cada máquina, uma tarefa foi iniciada para iniciar uma carga adicional no valor de 22 IOPS 70% / 30% de Leitura / Gravação Aleatória.

Referência de 300 profissionais do conhecimento + 22 IOPS por usuário


Durante o teste inicial, foi descoberto que o fio cria uma carga adicional significativa no processador de máquinas virtuais. Isso levou a uma rápida sobrecarga de host na CPU e afetou bastante a operação do sistema como um todo.

Carga da CPU dos hosts:
imagem

imagem

Os atrasos do sistema de armazenamento também aumentaram naturalmente:
imagem

A falta de poder de computação tornou-se crítica para aproximadamente 240 usuários:
imagem

Devido aos resultados, foi decidido realizar um teste que consome menos CPU.

Referência de 230 funcionários de escritório + 22 IOPS por usuário


Para reduzir a carga na CPU, o tipo de carga de trabalhadores do Office foi selecionado e 22 IOPS de carga sintética foram adicionados a cada sessão.

O teste foi limitado a 230 sessões para não exceder a carga máxima na CPU.

O teste foi iniciado com o trabalho subsequente dos usuários por 10 horas para verificar a estabilidade do sistema durante operação prolongada a uma carga próxima ao máximo.

Dados estatísticos do VSImax:
imagem

VSIbase = 918 ms, o limite do VSI não foi atingido.

Dados estatísticos detalhados do VSImax:
imagem

O gráfico mostra que durante todo o teste não há degradação do desempenho.

Estatísticas da CPU:
imagem

imagem

Ao executar este teste, a carga na CPU dos hosts era quase máxima.

Estatísticas da carga no sistema de armazenamento do monitoramento SimpliVity:
imagem

O desempenho do sistema de armazenamento permanece no mesmo nível durante o teste.

A carga no sistema de armazenamento durante o teste foi de aproximadamente 6.500 IOPS na proporção 60/40 (3.900 IOPS para leitura, 2.600 IOPS para gravação), que é de cerca de 28 IOPS por estação de trabalho.

O tempo de resposta foi em média de 3 ms para gravação e até 1 ms para leitura.

Sumário


Ao simular cargas reais na infraestrutura HPE SimpliVity, foram obtidos resultados confirmando a capacidade do sistema de fornecer desktops virtuais na quantidade de pelo menos 300 máquinas Full Clone em um par de nós SimpliVity. Ao mesmo tempo, o tempo de resposta do sistema de armazenamento foi mantido em um nível ideal durante todo o teste.

Estamos muito impressionados com a abordagem sobre testes demorados e a comparação de soluções antes da implementação. Podemos testar o desempenho de suas cargas de trabalho, se você desejar. Incluindo outras soluções hiperconvergentes. O cliente mencionado agora está concluindo testes em outra solução em paralelo. Sua infraestrutura atual é apenas uma frota de computadores, domínio e software em todos os locais de trabalho. Mudar para VDI sem testes é, obviamente, bastante difícil. Especificamente, é difícil entender os recursos reais do farm de VDI sem migrar usuários reais para ele. E esses testes permitem avaliar rapidamente os recursos reais de um sistema específico sem a necessidade de atrair usuários comuns. Portanto, esse estudo surgiu.

A segunda abordagem importante - o cliente estabeleceu imediatamente a escala correta. Aqui você pode comprar um servidor e adicionar um farm, por exemplo, para 100 usuários, tudo é previsível pelo preço do usuário. Por exemplo, quando precisar adicionar outros 300 usuários, eles saberão que precisam de dois servidores em uma configuração já definida e não reconsiderarão as possibilidades de atualizar sua infraestrutura como um todo.

Recursos interessantes da HPE SimpliVity Federation. Os negócios estão geograficamente divididos, portanto, faz sentido colocar seu próprio pedaço de ferro VDI separado em um escritório distante. Na Federação SimpliVity, cada máquina virtual é replicada em um cronograma com a capacidade de realizar clusters geograficamente remotos muito rapidamente e sem carga no canal - esse é um backup interno muito bom. Ao replicar VMs entre sites, o canal é usado o mínimo possível, e isso permite criar arquiteturas de DR muito interessantes com um único centro de controle e vários sites de armazenamento descentralizados.
imagem
Federação

Tudo isso permite avaliar o lado financeiro em grande detalhe, impor os custos da VDI aos planos de crescimento da empresa e entender com que rapidez a solução será recompensada e como ela funcionará. Porque qualquer VDI é uma solução que economiza uma tonelada de recursos, mas ao mesmo tempo, provavelmente, sem uma oportunidade econômica de alterá-lo dentro de 5-7 anos de uso.

Em geral, se você tiver alguma dúvida que não seja para comentários, escreva-me para mk@croc.ru.

Source: https://habr.com/ru/post/pt449210/


All Articles