
Le client voulait VDI. J'ai regardé de très près le bouquet de SimpliVity + VDI Citrix Virtual Desktop. Pour tous les opérateurs, employés de bureau dans les villes, etc. Il n'y a que cinq mille utilisateurs seulement dans la première vague de migration, et ils ont donc insisté sur les tests de résistance. Le VDI peut commencer à ralentir, il peut se coucher calmement - et cela ne se produit pas toujours en raison de problèmes avec le canal. Nous avons acheté un package de test très puissant spécialement pour VDI et chargé l'infrastructure jusqu'à ce qu'elle tombe sur les disques et le processeur.
Nous avons donc besoin d'une bouteille en plastique, du logiciel LoginVSI pour des tests VDI sophistiqués. Nous l'avons avec des licences pour 300 utilisateurs. Ils ont ensuite pris le matériel HPE SimpliVity 380 dans un emballage adapté à la tâche de densité maximale d'utilisateurs sur un serveur, coupé des machines virtuelles avec une bonne surabonnement, mis des logiciels de bureau sur Win10 et commencé les tests.
C'est parti! Le système
Deux nœuds (serveurs) HPE SimpliVity 380 Gen10. Sur chacun:
- 2 x Intel Xeon Platinum 8170 26c 2,1 GHz.
- RAM: 768 Go, 12 x 64 Go de LRDIMM DDR4 2666 MHz.
- Contrôleur de disque principal: HPE Smart Array P816i-a SR Gen10.
- Disques durs: SSD 9 x 1,92 To SATA 6 Gb / s (en configuration RAID6 7 + 2, c'est-à-dire qu'il s'agit d'un modèle moyen en termes de HPE SimpliVity).
- Cartes réseau: 4 x Eth 1Gb (données utilisateur), 2 x Eth 10Gb (backend SimpliVity et vMotion).
- Cartes FPGA spéciales intégrées dans chaque nœud pour la déduplication / compression.
Les nœuds sont connectés les uns aux autres par une interconnexion Ethernet 10 Gb directement sans commutateur externe, qui est utilisé comme backend SimpliVity et pour transmettre des données de machine virtuelle via NFS. Les données de la machine virtuelle dans un cluster sont toujours mises en miroir entre deux nœuds.
Les nœuds sont regroupés dans un cluster Vmware vSphere exécutant vCenter.
Pour les tests, un contrôleur de domaine et un courtier de connexion Citrix sont déployés. Le contrôleur de domaine, le courtier et vCenter sont placés sur un cluster distinct.


En tant qu'infrastructure de test, 300 bureaux virtuels sont déployés dans la configuration Dédiée - Copie complète, c'est-à-dire que chaque bureau est une copie complète de l'image d'origine de la machine virtuelle et enregistre toutes les modifications apportées par les utilisateurs.
Chaque machine virtuelle a 2vCPU et 4 Go de RAM:


Le logiciel suivant requis pour les tests a été installé sur les machines virtuelles:
- Windows 10 (64 bits), version 1809.
- Adobe Reader XI.
- Citrix Virtual Delivery Agent 1811.1.
- Doro PDF 1.82.
- Mise à jour Java 7 13.
- Microsoft Office Professionnel Plus 2016.
Entre les nœuds - réplication synchrone. Chaque bloc de données du cluster a deux copies. Autrement dit, maintenant un ensemble complet de données sur chacun des nœuds. Avec un cluster de trois nœuds ou plus - des copies de blocs à deux endroits différents. Lors de la création d'une nouvelle machine virtuelle, une copie supplémentaire est créée sur l'un des nœuds de cluster. Si un nœud tombe en panne, toutes les machines virtuelles précédemment exécutées sur celui-ci redémarrent automatiquement sur les autres nœuds où elles ont des répliques. Si le nœud tombe en panne pendant une longue période, une reprise progressive de la redondance commence et le cluster retourne à nouveau à la redondance N + 1.
L'équilibrage et le stockage des données se produisent au niveau du stockage logiciel de SimpliVity lui-même.
Les machines virtuelles exécutent un cluster de virtualisation; il les héberge également sur le stockage logiciel. Les ordinateurs de bureau eux-mêmes ont été pris selon le modèle standard: les tableaux des financiers et des opérationnels ont conduit pour un test (ce sont deux modèles différents).
Test
Pour les tests, le complexe de test du logiciel LoginVSI 4.1 a été utilisé. Le complexe LoginVSI faisant partie du serveur de gestion et 12 machines pour les connexions de test ont été déployés sur un hôte physique distinct.

Les tests ont été effectués en trois modes:
Mode Benchmark - options de chargement pour 300 travailleurs du savoir et 300 travailleurs du stockage.
Le mode standard est l'option de charge 300 Power Workers.
Pour permettre aux travailleurs de Power de travailler et d'augmenter la diversité de charge, une bibliothèque de fichiers Power Library supplémentaires a été ajoutée au complexe LoginVSI. Pour garantir la répétabilité des résultats, tous les paramètres du banc de test ont été laissés à Par défaut.
Les tests des travailleurs Knowledge et Power simulent la charge réelle des utilisateurs travaillant sur des postes de travail virtuels.
Le test des travailleurs du stockage a été créé spécifiquement pour tester les systèmes de stockage, loin des charges de travail réelles et consiste en grande partie dans le travail de l'utilisateur avec un grand nombre de fichiers de tailles différentes.
Pendant les tests, les utilisateurs se connectent aux postes de travail pendant 48 minutes, soit environ un utilisateur toutes les 10 secondes.
Résultats
Le résultat principal des tests LoginVSI est la métrique VSImax, qui est compilée à partir du temps d'exécution de diverses tâches exécutées par l'utilisateur. Par exemple: temps d'ouverture des fichiers dans le bloc-notes, temps de compression des fichiers dans 7-Zip, etc.
Une description détaillée du calcul des métriques est disponible dans la documentation officielle sur le
lien .
En d'autres termes, LoginVSI répète un modèle de charge typique, simulant les actions de l'utilisateur dans une suite bureautique, lisant des fichiers PDF, etc., et mesure divers retards. Il existe un niveau critique de retards «tout ralentit, il est impossible de travailler»), avant lequel on considère que le maximum d'utilisateurs n'est pas atteint. Si le temps de réponse est 1 000 ms plus rapide que cet état «tout ralentit», le système est considéré comme fonctionnant correctement et vous pouvez ajouter plus d'utilisateurs.
Voici les métriques de base:
Métrique
| Mesures prises
| Description détaillée
| Composants chargeables
|
NSLD
| Heure d'ouverture du texte fichier pesant 1 500 ko
| Le bloc-notes démarre et ouvre un document aléatoire pesant 1 500 kilo-octets, qui est copié à partir du pool des ressources
| CPU et E / S
|
Nfo
| Heure d'ouverture du dialogue fenêtres du bloc-notes
| Ouverture d'un fichier du bloc-notes VSI [Ctrl + O]
| CPU, RAM et E / S
|
ZHC *
| Temps de création du fichier Zip de compression forte
| Compression locale taille de fichier .pst aléatoire de 5 Mo, qui est copiée de pool de ressources
| CPU et E / S
|
ZLC *
| Temps de création du fichier Zip à faible compression
| Compression locale taille de fichier .pst aléatoire de 5 Mo, qui est copiée de pool de ressources
| E / S
|
CPU
| Calculer grand tableau de données aléatoires
| Créer un grand tableau données aléatoires à utiliser dans le temporisateur d'E / S (temporisateur d'E / S)
| CPU
|
Lors de l'exécution du test, la métrique de base VSIbase est initialement calculée, ce qui montre la vitesse des tâches sans la charge du système. Sur cette base, le seuil VSImax est déterminé, ce qui est égal à VSIbase + 1000 ms.
Les conclusions sur les performances du système sont basées sur deux mesures: VSIbase, qui détermine la vitesse du système, et VSImax seuil, qui détermine le nombre maximal d'utilisateurs que le système peut supporter sans dégradation significative.
300 benchmark des travailleurs du savoir
Les travailleurs du savoir sont des utilisateurs qui chargent régulièrement la mémoire, le processeur et les E / S avec divers petits pics. Le logiciel émule la charge des utilisateurs bureautiques exigeants, comme s'ils poussaient constamment quelque chose (PDF, Java, suite bureautique, visualisation de photos, 7-Zip). Au fur et à mesure que les utilisateurs sont ajoutés de zéro à 300, le délai de chacun augmente progressivement.
Données statistiques VSImax:

VSIbase = 986 ms, le seuil VSI n'a pas été atteint.
Statistiques de la charge sur le système de stockage à partir de la surveillance SimpliVity:

Avec ce type de charge, le système peut supporter une charge accrue avec peu ou pas de dégradation des performances. Le temps d'exécution des tâches utilisateur croît en douceur, le temps de réponse du système ne change pas pendant les tests et peut aller jusqu'à 3 ms pour l'écriture et jusqu'à 1 ms pour la lecture.
Conclusion: 300 connaissances des utilisateurs sans aucun problème fonctionnent sur le cluster actuel et n'interfèrent pas les uns avec les autres, atteignant une sursouscription pCPU / vCPU 1 à 6. Les délais généraux augmentent de manière égale, mais la limite conditionnelle n'a pas été atteinte.
300 benchmark des travailleurs du stockage
Ce sont des utilisateurs qui écrivent et lisent constamment dans un rapport de 30 à 70, respectivement. Ce test a été effectué davantage dans un souci d'expérience. Données statistiques VSImax:

VSIbase = 1673, seuil VSI atteint sur 240 utilisateurs.
Statistiques de la charge sur le système de stockage à partir de la surveillance SimpliVity:

Ce type de charge est en fait un test de résistance du système de stockage. Lorsqu'il est exécuté, chaque utilisateur écrit sur le disque de nombreux fichiers aléatoires de tailles différentes. Dans ce cas, on peut voir que lorsqu'un certain seuil de chargement est dépassé, certains utilisateurs augmentent le temps nécessaire pour terminer les tâches d'enregistrement de fichier. Dans le même temps, la charge sur le système de stockage, le processeur et la mémoire hôte ne change pas de manière significative, par conséquent, il est actuellement impossible de déterminer exactement à quoi les retards sont associés.
Des conclusions sur les performances du système à l'aide de ce test ne peuvent être tirées qu'en comparaison avec les résultats des tests sur d'autres systèmes, car ces charges sont synthétiques, irréalistes. Cependant, en général, le test s'est bien passé. Jusqu'à 210 sessions, tout s'est bien passé, puis des réponses incompréhensibles ont commencé, qui n'ont été suivies nulle part, sauf Login VSI.
300 travailleurs de l'électricité
Ce sont des utilisateurs qui aiment le processeur, la mémoire et les E / S élevées. Ces «utilisateurs avancés» exécutent régulièrement des tâches complexes avec de longs pics comme l'installation de nouveaux logiciels et le déballage de grandes archives. Données statistiques VSImax:

VSIbase = 970, le seuil VSI n'a pas été atteint.
Statistiques de la charge sur le système de stockage à partir de la surveillance SimpliVity:

Pendant les tests, le seuil de charge du processeur a été atteint sur l'un des nœuds du système, mais cela n'a pas eu d'impact significatif sur son fonctionnement:


Dans ce cas, le système peut supporter une charge accrue sans dégradation significative des performances. Le temps d'exécution des tâches utilisateur croît en douceur, le temps de réponse du système ne change pas pendant les tests et peut aller jusqu'à 3 ms pour l'écriture et jusqu'à 1 ms pour la lecture.
Les tests habituels pour le client n'étaient pas suffisants, et nous sommes allés plus loin: augmentation des caractéristiques de la VM (le nombre de vCPU afin d'évaluer l'augmentation de la surabonnement et de la taille du disque) et ajout de charge supplémentaire.
Lors de tests supplémentaires, la configuration de stand suivante a été utilisée:
Déploiement de 300 bureaux virtuels dans la configuration de 4vCPU, 4 Go de RAM, 80 Go de disque dur.
Configuration de l'une des machines de test:

Les machines sont déployées dans l'option Dédié - Copie complète:


300 travailleurs du savoir repèrent 12 sursouscriptions
Données statistiques VSImax:

VSIbase = 921 ms, le seuil VSI n'a pas été atteint.
Statistiques de la charge sur le système de stockage à partir de la surveillance SimpliVity:

Les résultats sont similaires au test de la configuration VM précédente.
300 travailleurs de l'énergie sursouscrits 12
Données statistiques VSImax:

VSIbase = 933, le seuil VSI n'a pas été atteint.
Statistiques de la charge sur le système de stockage à partir de la surveillance SimpliVity:

Dans ce test, le seuil de charge du processeur a également été atteint, mais cela n'a pas eu d'impact significatif sur les performances:


Les résultats sont similaires au test de la configuration précédente.
Que se passe-t-il si vous démarrez la charge pendant 10 heures?
Nous allons maintenant voir s'il y aura un "effet d'accumulation" et exécuter des tests pendant 10 heures d'affilée.
De longs tests et une description de la section devraient viser le fait que nous voulions vérifier s'il y aurait des problèmes avec la ferme avec une longue charge.
300 benchmark des travailleurs du savoir + 10 heures
En outre, le test de la variante de charge de 300 travailleurs du savoir a été effectué avec le travail ultérieur des utilisateurs pendant 10 heures.
Données statistiques VSImax:

VSIbase = 919 ms, le seuil VSI n'a pas été atteint.
VSImax Données statistiques détaillées:

Le graphique montre que pendant tout le test, il n'y a pas de dégradation des performances.
Statistiques de la charge sur le système de stockage à partir de la surveillance SimpliVity:

Les performances du système de stockage restent au même niveau tout au long du test.
Tests supplémentaires avec charge synthétique ajoutée
Le client a demandé d'ajouter une charge sauvage au disque. Pour ce faire, une tâche a été ajoutée au système de stockage dans chacune des machines virtuelles de l'utilisateur pour lancer une charge synthétique sur le disque lorsque l'utilisateur se connecte au système. La charge a été fournie par l'utilitaire fio, qui permet de limiter la charge sur le disque par le nombre d'IOPS. Dans chaque machine, une tâche a été lancée pour démarrer une charge supplémentaire d'un montant de 22 IOPS 70% / 30% lecture / écriture aléatoire.
300 benchmark des travailleurs du savoir + 22 IOPS par utilisateur
Lors des tests initiaux, il a été découvert que fio crée une charge supplémentaire importante sur le processeur des machines virtuelles. Cela a entraîné une surcharge rapide de l'hôte sur le processeur et a considérablement affecté le fonctionnement du système dans son ensemble.
Charge CPU des hôtes:


Les retards du système de stockage ont également naturellement augmenté:

Le manque de puissance de calcul est devenu critique pour environ 240 utilisateurs:

En raison des résultats, il a été décidé de réaliser un test moins gourmand en ressources processeur.
230 benchmark des employés de bureau + 22 IOPS par utilisateur
Pour réduire la charge sur le processeur, le type de charge des employés Office a été sélectionné et 22 IOPS de charge synthétique ont été ajoutés à chaque session.
Le test a été limité à 230 sessions afin de ne pas dépasser la charge maximale sur le CPU.
Le test a été lancé avec le travail ultérieur des utilisateurs pendant 10 heures pour vérifier la stabilité du système lors d'un fonctionnement prolongé à une charge proche du maximum.
Données statistiques VSImax:

VSIbase = 918 ms, le seuil VSI n'a pas été atteint.
VSImax Données statistiques détaillées:

Le graphique montre que pendant tout le test, il n'y a pas de dégradation des performances.
Statistiques CPU:


Lors de l'exécution de ce test, la charge sur le processeur des hôtes était presque maximale.
Statistiques de la charge sur le système de stockage à partir de la surveillance SimpliVity:

Les performances du système de stockage restent au même niveau tout au long du test.
La charge sur le système de stockage pendant le test était d'environ 6 500 IOPS dans un rapport 60/40 (3 900 IOPS pour la lecture, 2 600 IOPS pour l'écriture), soit environ 28 IOPS par poste de travail.
Le temps de réponse était en moyenne de 3 ms pour l'écriture et jusqu'à 1 ms pour la lecture.
Résumé
Lors de la simulation de charges réelles sur l'infrastructure HPE SimpliVity, des résultats ont été obtenus confirmant la capacité du système à fournir des bureaux virtuels d'au moins 300 machines Full Clone sur une paire de nœuds SimpliVity. Dans le même temps, le temps de réponse du système de stockage a été maintenu à un niveau optimal tout au long du test.
Nous sommes très impressionnés par l'approche concernant les longs tests et la comparaison des solutions avant la mise en œuvre. Nous pouvons tester les performances de vos charges de travail si vous le souhaitez. Y compris d'autres solutions hyperconvergées. Le client mentionné effectue actuellement des tests sur une autre solution en parallèle. Son infrastructure actuelle n'est qu'un parc de PC, un domaine et des logiciels sur chaque lieu de travail. Passer à VDI sans tests est, bien sûr, assez difficile. Plus précisément, il est difficile de comprendre les capacités réelles de la batterie VDI sans migrer de vrais utilisateurs vers celle-ci. Et ces tests vous permettent d'évaluer rapidement les capacités réelles d'un système particulier sans avoir besoin d'attirer des utilisateurs ordinaires. Par conséquent, une telle étude est née.
La deuxième approche importante - le client s'est immédiatement fixé sur la mise à l'échelle correcte. Ici, vous pouvez acheter un serveur et ajouter une ferme, par exemple, pour 100 utilisateurs, tout est prévisible au prix de l'utilisateur. Par exemple, lorsqu'ils doivent ajouter 300 autres utilisateurs, ils sauront qu'ils ont besoin de deux serveurs dans une configuration déjà définie, et ne reconsidéreront pas les possibilités de mise à niveau de leur infrastructure dans son ensemble.
Fonctionnalités intéressantes de la Fédération HPE SimpliVity. Les affaires sont géographiquement divisées, il est donc logique de placer votre propre morceau de fer VDI séparé dans un bureau éloigné. Dans la Fédération SimpliVity, chaque machine virtuelle est répliquée selon un calendrier avec la possibilité de faire entre des clusters géographiquement distants très rapidement et sans charge sur le canal - c'est une très bonne sauvegarde intégrée. Lors de la réplication de VM entre sites, le canal est utilisé le moins possible, ce qui permet de construire des architectures DR très intéressantes avec un seul centre de contrôle et un tas de sites de stockage décentralisés.
FédérationL'ensemble de ces éléments permet d'évaluer en détail l'aspect financier, d'imposer les coûts de VDI aux plans de croissance de l'entreprise et de comprendre à quelle vitesse la solution sera rentable et comment elle fonctionnera. Parce que tout VDI est une solution qui économise finalement une tonne de ressources, mais en même temps, très probablement, sans possibilité rentable de le changer dans les 5-7 ans d'utilisation.
En général, si vous avez des questions autres que des commentaires, veuillez m'écrire à mk@croc.ru.