
El cliente quería VDI. Miré muy de cerca el montón de SimpliVity + VDI Citrix Virtual Desktop. Para todos los operadores, trabajadores de oficina en ciudades, etc. Hay cinco mil usuarios solo en la primera ola de migración y, por lo tanto, insistieron en realizar pruebas de estrés. VDI puede comenzar a disminuir, puede descansar tranquilamente, y esto no siempre sucede debido a problemas con el canal. Compramos un paquete de prueba muy potente específicamente para VDI y cargamos la infraestructura hasta que cayó en los discos y el procesador.
Por lo tanto, necesitamos una botella de plástico, el software LoginVSI para pruebas sofisticadas de VDI. Lo tenemos con licencias para 300 usuarios. Luego tomaron el hardware HPE SimpliVity 380 en un paquete adecuado para la tarea de máxima densidad de usuario en un servidor, cortaron máquinas virtuales con una buena suscripción, colocaron software de oficina en Win10 y comenzaron las pruebas.
Vamos! El sistema
Dos nodos (servidores) HPE SimpliVity 380 Gen10. En cada uno:
- 2 x Intel Xeon Platinum 8170 26c 2.1Ghz.
- RAM: 768 GB, 12 x 64 GB LRDIMM DDR4 2666 MHz.
- Controlador de disco primario: HPE Smart Array P816i-a SR Gen10.
- Discos duros: 9 x 1.92 TB SATA 6Gb / s SSD (en configuración RAID6 7 + 2, es decir, este es un modelo mediano en términos de HPE SimpliVity).
- Tarjetas de red: 4 x 1 Gb Eth (datos del usuario), 2 x 10 Gb Eth (SimpliVity y vMotion backend).
- Tarjetas especiales FPGA integradas en cada nodo para deduplicación / compresión.
Los nodos están conectados entre sí mediante una interconexión Ethernet de 10 Gb directamente sin un conmutador externo, que se utiliza como un backend SimpliVity y para transmitir datos de máquinas virtuales a través de NFS. Los datos de la máquina virtual en un clúster siempre se reflejan entre dos nodos.
Los nodos se agrupan en un clúster de Vmware vSphere que ejecuta vCenter.
Para las pruebas, se implementa un controlador de dominio y un agente de conexión Citrix. El controlador de dominio, el intermediario y vCenter se colocan en un clúster separado.


Como infraestructura de prueba, se implementan 300 escritorios virtuales en la configuración Dedicado - Copia completa, es decir, cada escritorio es una copia completa de la imagen original de la máquina virtual y guarda todos los cambios realizados por los usuarios.
Cada máquina virtual tiene 2vCPU y 4GB de RAM:


El siguiente software requerido para la prueba se instaló en las máquinas virtuales:
- Windows 10 (64 bits), versión 1809.
- Adobe Reader XI.
- Citrix Virtual Delivery Agent 1811.1.
- Doro PDF 1.82.
- Actualización de Java 7 13.
- Microsoft Office Professional Plus 2016.
Entre nodos: replicación sincrónica. Cada bloque de datos en el clúster tiene dos copias. Es decir, ahora un conjunto completo de datos en cada uno de los nodos. Con un grupo de tres o más nodos, copias de bloques en dos lugares diferentes. Al crear una nueva máquina virtual, se crea una copia adicional en uno de los nodos del clúster. Si un nodo falla, todas las máquinas virtuales que se ejecutaban anteriormente en él se reinician automáticamente en otros nodos donde tienen réplicas. Si el nodo falla durante mucho tiempo, comienza una recuperación de redundancia gradual y el clúster vuelve a la redundancia N + 1 nuevamente.
El equilibrio y el almacenamiento de datos se produce al nivel del almacenamiento de software de SimpliVity.
Las máquinas virtuales ejecutan un clúster de virtualización; también las aloja en el almacenamiento de software. Los escritorios en sí se tomaron de acuerdo con la plantilla estándar: las tablas de financieros y operacionalistas se sometieron a una prueba (estas son dos plantillas diferentes).
Prueba
Para las pruebas, se utilizó el complejo de pruebas del software LoginVSI 4.1. El complejo LoginVSI como parte del servidor de administración y 12 máquinas para conexiones de prueba se implementaron en un host físico separado.

Las pruebas se llevaron a cabo en tres modos:
Modo de referencia: opciones de carga para 300 trabajadores del conocimiento y 300 trabajadores de almacenamiento.
El modo estándar es la opción de carga 300 Power Workers.
Para permitir que los trabajadores de Power trabajen y aumenten la diversidad de carga, se agregó una biblioteca de archivos adicionales de Power Library al complejo LoginVSI. Para garantizar la repetibilidad de los resultados, todos los ajustes del banco de pruebas se dejaron en Predeterminado.
Las pruebas para trabajadores de Knowledge and Power simulan la carga real de usuarios que trabajan en estaciones de trabajo virtuales.
La prueba de los trabajadores de almacenamiento se creó específicamente para probar sistemas de almacenamiento, lejos de las cargas de trabajo reales y, en su mayor parte, consiste en el trabajo del usuario con una gran cantidad de archivos de diferentes tamaños.
Durante las pruebas, los usuarios inician sesión en las estaciones de trabajo durante 48 minutos, aproximadamente un usuario cada 10 segundos.
Resultados
El resultado principal de las pruebas de LoginVSI es la métrica VSImax, que se compila a partir del tiempo de ejecución de varias tareas ejecutadas por el usuario. Por ejemplo: tiempo de apertura de archivo en el bloc de notas, tiempo de compresión de archivo en 7-Zip, etc.
Una descripción detallada del cálculo de las métricas está disponible en la documentación oficial en el
enlace .
En otras palabras, LoginVSI repite un patrón de carga típico, simula las acciones del usuario en una suite ofimática, lee archivos PDF, etc., y mide varios retrasos. Hay un nivel crítico de demoras "todo se ralentiza, es imposible trabajar"), antes de lo cual se considera que no se alcanza el máximo de usuarios. Si el tiempo de respuesta es 1,000 ms más rápido que este estado de "todo se ralentiza", entonces se considera que el sistema funciona bien y puede agregar más usuarios.
Aquí están las métricas básicas:
Métrica
| Acción tomada
| Descripción detallada
| Componentes cargables
|
NSLD
| Hora de apertura del texto archivo con un peso de 1.500 kB
| El bloc de notas comienza y abre un documento aleatorio que pesa 1.500 Kbytes, que se copia del grupo de recursos
| CPU y E / S
|
Nfo
| Hora de apertura del diálogo ventanas de bloc de notas
| Abrir un archivo VSI-Notepad [Ctrl + O]
| CPU, RAM y E / S
|
ZHC *
| Tiempo de creación de archivo comprimido de compresión fuerte
| Compresión local tamaño de archivo aleatorio .pst de 5 MB, que se copia de grupo de recursos
| CPU y E / S
|
ZLC *
| Tiempo de creación de archivo comprimido de baja compresión
| Compresión local tamaño de archivo aleatorio .pst de 5 MB, que se copia de grupo de recursos
| I / O
|
CPU
| Cálculo grande matriz de datos aleatorios
| Crea una gran variedad datos aleatorios que se utilizarán en el temporizador de E / S (temporizador de E / S)
| CPU
|
Al realizar la prueba, se calcula inicialmente la métrica básica de VSIbase, que muestra la velocidad de las tareas sin la carga en el sistema. En base a esto, se determina el umbral VSImax, que es igual a VSIbase + 1000ms.
Las conclusiones sobre el rendimiento del sistema se basan en dos métricas: VSIbase, que determina la velocidad del sistema, y el umbral VSImax, que determina el número máximo de usuarios que el sistema puede soportar sin una degradación significativa.
Punto de referencia de 300 trabajadores del conocimiento
Los trabajadores del conocimiento son usuarios que regularmente cargan memoria, procesador e IO con varios picos pequeños. El software emula la carga de los usuarios exigentes de la oficina, como si estuvieran constantemente metiendo algo (PDF, Java, suite ofimática, viendo fotos, 7-Zip). A medida que se agregan usuarios de cero a 300, la demora para cada uno aumenta gradualmente.
Datos estadísticos de VSImax:

VSIbase = 986 ms, no se alcanzó el umbral de VSI.
Estadísticas de la carga en el sistema de almacenamiento de la supervisión de SimpliVity:

Con este tipo de carga, el sistema puede soportar una carga mayor con poca o ninguna degradación en el rendimiento. El tiempo de ejecución de las tareas del usuario crece sin problemas, el tiempo de respuesta del sistema no cambia durante las pruebas y es de hasta 3 ms para escritura y de hasta 1 ms para lectura.
Conclusión: 300 conocimientos de usuarios sin ningún problema trabajan en el clúster actual y no interfieren entre sí, alcanzando una sobre suscripción de pCPU / vCPU 1 a 6. Los retrasos generales aumentan de manera uniforme, pero no se ha alcanzado el límite condicional.
Punto de referencia de 300 trabajadores de almacenamiento
Estos son usuarios que constantemente escriben y leen en una proporción de 30 a 70, respectivamente. Esta prueba se realizó más por el bien del experimento. Datos estadísticos de VSImax:

VSIbase = 1673, umbral de VSI alcanzado en 240 usuarios.
Estadísticas de la carga en el sistema de almacenamiento de la supervisión de SimpliVity:

Este tipo de carga, de hecho, es una prueba de esfuerzo del sistema de almacenamiento. Cuando se ejecuta, cada usuario escribe en el disco muchos archivos aleatorios de diferentes tamaños. En este caso, se puede ver que cuando se excede un cierto umbral de carga, algunos usuarios aumentan el tiempo requerido para completar las tareas de grabación de archivos. Al mismo tiempo, la carga en el sistema de almacenamiento, el procesador y la memoria del host no cambia significativamente, por lo tanto, actualmente es imposible determinar exactamente a qué se asocian los retrasos.
Las conclusiones sobre el rendimiento del sistema usando esta prueba solo se pueden hacer en comparación con los resultados de la prueba en otros sistemas, ya que tales cargas son sintéticas, poco realistas. Sin embargo, en general, la prueba salió bien. Hasta 210 sesiones, todo salió bien, y luego comenzaron las respuestas incomprensibles, que no se rastrearon en ninguna parte excepto Login VSI.
300 trabajadores de poder
Estos son usuarios que aman el procesador, la memoria y el alto IO. Estos "usuarios avanzados" ejecutan regularmente tareas complejas con picos largos como instalar nuevo software y desempacar grandes archivos. Datos estadísticos de VSImax:

VSIbase = 970, no se alcanzó el umbral de VSI.
Estadísticas de la carga en el sistema de almacenamiento de la supervisión de SimpliVity:

Durante las pruebas, se alcanzó el umbral de carga del procesador en uno de los nodos del sistema, pero esto no tuvo un impacto significativo en su funcionamiento:


En este caso, el sistema puede soportar una carga mayor sin una degradación significativa del rendimiento. El tiempo de ejecución de las tareas del usuario crece sin problemas, el tiempo de respuesta del sistema no cambia durante las pruebas y es de hasta 3 ms para escritura y de hasta 1 ms para lectura.
Las pruebas habituales para el cliente no fueron suficientes, y fuimos más allá: aumentamos las características de la VM (la cantidad de vCPU para evaluar el aumento de la suscripción excesiva y el tamaño del disco) y agregamos carga adicional.
Durante pruebas adicionales, se utilizó la siguiente configuración de soporte:
Implementé 300 escritorios virtuales en la configuración de 4vCPU, 4GB RAM, 80GB HDD.
Configuración de una de las máquinas de prueba:

Las máquinas se implementan en la opción Dedicado - Copia completa:


300 trabajadores del conocimiento de referencia 12 sobresuscripción
Datos estadísticos de VSImax:

VSIbase = 921 ms, no se alcanzó el umbral de VSI.
Estadísticas de la carga en el sistema de almacenamiento de la supervisión de SimpliVity:

Los resultados son similares a probar la configuración anterior de VM.
300 trabajadores en exceso suscribiéndose 12
Datos estadísticos de VSImax:

VSIbase = 933, no se alcanzó el umbral de VSI.
Estadísticas de la carga en el sistema de almacenamiento de la supervisión de SimpliVity:

En esta prueba, también se alcanzó el umbral de carga del procesador, pero esto no tuvo un impacto significativo en el rendimiento:


Los resultados son similares a probar la configuración anterior.
¿Qué sucede si comienza la carga durante 10 horas?
Ahora veremos si habrá un "efecto de acumulación" y ejecutaremos pruebas durante 10 horas seguidas.
Las pruebas largas y una descripción de la sección deben estar dirigidas al hecho de que queríamos verificar si habría algún problema con la granja con una carga larga.
Punto de referencia de 300 trabajadores del conocimiento + 10 horas
Además, la prueba de la variante de carga de 300 trabajadores del conocimiento se llevó a cabo con el trabajo posterior de los usuarios durante 10 horas.
Datos estadísticos de VSImax:

VSIbase = 919 ms, no se alcanzó el umbral de VSI.
VSImax Datos estadísticos detallados:

El gráfico muestra que durante toda la prueba no hay degradación del rendimiento.
Estadísticas de la carga en el sistema de almacenamiento de la supervisión de SimpliVity:

El rendimiento del sistema de almacenamiento permanece en el mismo nivel durante toda la prueba.
Pruebas adicionales con carga sintética adicional
El cliente solicitó agregar una carga salvaje al disco. Para hacer esto, se agregó una tarea al sistema de almacenamiento en cada una de las máquinas virtuales del usuario para iniciar una carga sintética en el disco cuando el usuario inicia sesión en el sistema. La carga fue proporcionada por la utilidad fio, que permite limitar la carga en el disco por el número de IOPS. En cada máquina, se lanzó una tarea para iniciar una carga adicional en la cantidad de 22 IOPS 70% / 30% de lectura / escritura aleatoria.
Punto de referencia de 300 trabajadores del conocimiento + 22 IOPS por usuario
Durante las pruebas iniciales, se descubrió que fio crea una carga adicional significativa en el procesador de las máquinas virtuales. Esto condujo a una rápida sobrecarga del host en la CPU y afectó en gran medida el funcionamiento del sistema en su conjunto.
Carga de CPU de los hosts:


Los retrasos del sistema de almacenamiento también aumentaron naturalmente:

La falta de potencia informática se ha vuelto crítica para aproximadamente 240 usuarios:

Debido a los resultados, se decidió realizar una prueba que requiere menos CPU.
Referencia de 230 trabajadores de oficina + 22 IOPS por usuario
Para reducir la carga en la CPU, se seleccionó el tipo de carga de los trabajadores de Office y se agregaron 22 IOPS de carga sintética a cada sesión.
La prueba se limitó a 230 sesiones para no exceder la carga máxima en la CPU.
La prueba se lanzó con el trabajo posterior de los usuarios durante 10 horas para verificar la estabilidad del sistema durante la operación prolongada a una carga cercana al máximo.
Datos estadísticos de VSImax:

VSIbase = 918 ms, no se alcanzó el umbral de VSI.
VSImax Datos estadísticos detallados:

El gráfico muestra que durante toda la prueba no hay degradación del rendimiento.
Estadísticas de CPU:


Al realizar esta prueba, la carga en la CPU de los hosts era casi máxima.
Estadísticas de la carga en el sistema de almacenamiento de la supervisión de SimpliVity:

El rendimiento del sistema de almacenamiento permanece en el mismo nivel durante toda la prueba.
La carga en el sistema de almacenamiento durante la prueba fue de aproximadamente 6.500 IOPS en una proporción de 60/40 (3.900 IOPS para lectura, 2.600 IOPS para escritura), que es de aproximadamente 28 IOPS por estación de trabajo.
El tiempo de respuesta promedió 3 ms para escritura y hasta 1 ms para lectura.
Resumen
Al modelar cargas reales en la infraestructura HPE SimpliVity, se obtuvieron resultados que confirmaron la capacidad del sistema para proporcionar escritorios virtuales en la cantidad de al menos 300 máquinas Full Clone en un par de nodos SimpliVity. Al mismo tiempo, el tiempo de respuesta del sistema de almacenamiento se mantuvo en un nivel óptimo durante toda la prueba.
Estamos muy impresionados por el enfoque sobre las largas pruebas y la comparación de soluciones antes de la implementación. Podemos probar el rendimiento de sus cargas de trabajo si lo desea. Incluyendo otras soluciones hiperconvergentes. El cliente mencionado ahora está completando pruebas en otra solución en paralelo. Su infraestructura actual es solo una flota de PC, dominio y software en cada lugar de trabajo. Pasar a VDI sin pruebas es, por supuesto, bastante difícil. Específicamente, es difícil comprender las capacidades reales de la granja de servidores VDI sin migrar usuarios reales a ella. Y estas pruebas le permiten evaluar rápidamente las capacidades reales de un sistema en particular sin la necesidad de atraer usuarios comunes. Por lo tanto, tal estudio surgió.
El segundo enfoque importante: el cliente estableció inmediatamente la escala correcta. Aquí puede comprar un servidor y agregar una granja, por ejemplo, para 100 usuarios, todo es predecible al precio del usuario. Por ejemplo, cuando necesiten agregar otros 300 usuarios, sabrán que necesitan dos servidores en una configuración ya definida y no reconsiderarán las posibilidades de actualizar su infraestructura como un todo.
Características interesantes de la Federación HPE SimpliVity. El negocio está dividido geográficamente, por lo que tiene sentido colocar su propia pieza de hierro VDI por separado en una oficina distante. En SimpliVity Federation, cada máquina virtual se replica de acuerdo con un cronograma con la capacidad de hacerlo entre grupos geográficamente remotos muy rápidamente y sin carga en el canal; esta es una muy buena copia de seguridad integrada. Cuando se replican máquinas virtuales entre sitios, el canal se usa lo menos posible, y esto hace posible construir arquitecturas DR muy interesantes con un solo centro de control y un montón de sitios de almacenamiento descentralizados.
FederaciónTodo esto en conjunto permite evaluar el aspecto financiero con gran detalle, e imponer los costos de VDI en los planes de crecimiento de la compañía, y comprender cuán rápido la solución dará sus frutos y cómo funcionará. Porque cualquier VDI es una solución que en última instancia ahorra una tonelada de recursos, pero al mismo tiempo, muy probablemente, sin una oportunidad rentable de cambiarlo dentro de los 5-7 años de uso.
En general, si tiene alguna pregunta que no sea para comentarios, escríbame a mk@croc.ru.