So funktioniert HPE SimpliVity 380 für VDI: Tests mit hoher Belastung

Bild

Der Kunde wollte VDI. Ich habe mir die Reihe von SimpliVity + VDI Citrix Virtual Desktop sehr genau angesehen. Für alle Betreiber, Büroangestellte in Städten und so weiter. Nur in der ersten Migrationswelle gibt es fünftausend Benutzer, und deshalb bestanden sie auf Stresstests. VDI kann langsamer werden, es kann sich ruhig hinlegen - und dies geschieht nicht immer aufgrund von Problemen mit dem Kanal. Wir haben ein sehr leistungsfähiges Testpaket speziell für VDI gekauft und die Infrastruktur geladen, bis sie auf die Festplatten und den Prozessor fiel.

Wir benötigen also eine Plastikflasche, LoginVSI-Software für anspruchsvolle VDI-Tests. Wir haben es mit Lizenzen für 300 Benutzer. Dann nahmen sie die HPE SimpliVity 380-Hardware in eine Verpackung, die für die Aufgabe der maximalen Benutzerdichte auf einem Server geeignet war, schnitten virtuelle Maschinen mit einer guten Überzeichnung, setzten Office-Software auf Win10 und begannen mit dem Testen.

Lass uns gehen!

Das System


Zwei Knoten (Server) HPE SimpliVity 380 Gen10. Auf jedem:

  • 2 x Intel Xeon Platinum 8170 26c 2,1 GHz.
  • RAM: 768 GB, 12 x 64 GB LRDIMMs DDR4 2666 MHz.
  • Primärer Festplattencontroller: HPE Smart Array P816i-a SR Gen10.
  • Festplatten: 9 x 1,92 TB SATA 6 Gbit / s SSD (in RAID6 7 + 2-Konfiguration, d. H. Es handelt sich um ein mittleres Modell in Bezug auf HPE SimpliVity).
  • Netzwerkkarten: 4 x 1 GB Eth (Benutzerdaten), 2 x 10 GB Eth (SimpliVity- und vMotion-Backend).
  • Spezielle integrierte FPGA-Karten in jedem Knoten zur Deduplizierung / Komprimierung.

Die Knoten sind über eine 10-Gbit-Ethernet-Verbindung direkt ohne externen Switch miteinander verbunden, der als SimpliVity-Backend und zur Übertragung von Daten virtueller Maschinen über NFS verwendet wird. Daten virtueller Maschinen in einem Cluster werden immer zwischen zwei Knoten gespiegelt.

Knoten werden in einem Vmware vSphere-Cluster geclustert, in dem vCenter ausgeführt wird.

Zum Testen werden ein Domänencontroller und ein Citrix-Verbindungsbroker bereitgestellt. Der Domänencontroller, der Broker und vCenter befinden sich in einem separaten Cluster.
Bild
Bild
Als Testinfrastruktur werden 300 virtuelle Desktops in der Konfiguration "Dedicated - Full Copy" bereitgestellt, dh jeder Desktop ist eine vollständige Kopie des Originalabbilds der virtuellen Maschine und speichert alle von Benutzern vorgenommenen Änderungen.

Jede virtuelle Maschine verfügt über 2vCPU und 4 GB RAM:

Bild

Bild

Die folgende zum Testen erforderliche Software wurde auf den virtuellen Maschinen installiert:

  • Windows 10 (64-Bit), Version 1809.
  • Adobe Reader XI.
  • Citrix Virtual Delivery Agent 1811.1.
  • Doro PDF 1.82.
  • Java 7 Update 13.
  • Microsoft Office Professional Plus 2016.

Zwischen Knoten - synchrone Replikation. Jeder Datenblock im Cluster hat zwei Kopien. Das heißt, jetzt ein vollständiger Datensatz auf jedem der Knoten. Mit einem Cluster von drei oder mehr Knoten - Kopien von Blöcken an zwei verschiedenen Stellen. Beim Erstellen einer neuen VM wird eine zusätzliche Kopie auf einem der Clusterknoten erstellt. Wenn ein Knoten ausfällt, werden alle zuvor auf ihm ausgeführten VMs automatisch auf anderen Knoten neu gestartet, auf denen sie über Replikate verfügen. Wenn der Knoten längere Zeit ausfällt, beginnt eine schrittweise Wiederherstellung der Redundanz, und der Cluster kehrt wieder zu N + 1-Redundanz zurück.

Das Ausgleichen und Speichern von Daten erfolgt auf der Ebene des Softwarespeichers von SimpliVity.

Virtuelle Maschinen führen einen Virtualisierungscluster aus und hosten sie auch im Softwarespeicher. Die Desktops selbst wurden gemäß der Standardvorlage erstellt: Die Tabellen der Finanziers und Operationalisten fuhren zu einem Test (dies sind zwei verschiedene Vorlagen).

Testen


Zum Testen wurde der Testkomplex der LoginVSI 4.1-Software verwendet. Der LoginVSI-Komplex als Teil des Verwaltungsservers und 12 Computer für Testverbindungen wurden auf einem separaten physischen Host bereitgestellt.
Bild

Die Tests wurden in drei Modi durchgeführt:

Benchmark-Modus - Ladeoptionen für 300 Knowledge Worker und 300 Storage Worker.

Der Standardmodus ist die Ladeoption 300 Power Worker.

Damit Power Worker arbeiten und die Lastvielfalt erhöhen können, wurde dem LoginVSI-Komplex eine Bibliothek mit zusätzlichen Power Library-Dateien hinzugefügt. Um die Wiederholbarkeit der Ergebnisse sicherzustellen, wurden alle Prüfstandseinstellungen auf Standard gesetzt.

Die Knowledge and Power Worker-Tests simulieren die tatsächliche Belastung von Benutzern, die an virtuellen Workstations arbeiten.

Der Storage Worker-Test wurde speziell zum Testen von Speichersystemen entwickelt, weit entfernt von realen Workloads und besteht größtenteils in der Arbeit des Benutzers mit einer großen Anzahl von Dateien unterschiedlicher Größe.

Während des Tests melden sich Benutzer 48 Minuten lang an Arbeitsstationen an, etwa alle 10 Sekunden ein Benutzer.

Ergebnisse


Das Hauptergebnis der LoginVSI-Tests ist die VSImax-Metrik, die aus der Ausführungszeit verschiedener vom Benutzer ausgeführter Aufgaben kompiliert wird. Beispiel: Dateiöffnungszeit im Editor, Dateikomprimierungszeit in 7-Zip usw.

Eine detaillierte Beschreibung der Berechnung von Metriken finden Sie in der offiziellen Dokumentation unter dem Link .

Mit anderen Worten, LoginVSI wiederholt ein typisches Lademuster, simuliert Benutzeraktionen in einer Office-Suite, liest PDFs usw. und misst verschiedene Verzögerungen. Es gibt ein kritisches Maß an Verzögerungen („alles verlangsamt sich, es ist unmöglich zu arbeiten“), bevor davon ausgegangen wird, dass das Maximum an Benutzern nicht erreicht wird. Wenn die Antwortzeit 1.000 ms schneller ist als dieser Status "Alles verlangsamt sich", funktioniert das System als einwandfrei und Sie können weitere Benutzer hinzufügen.

Hier sind die grundlegenden Metriken:

Metrisch


Maßnahmen ergriffen


Detaillierte Beschreibung


Ladefähige Komponenten


NSLD


Öffnungszeit des Textes
Datei mit einem Gewicht von 1.500 kB


Editor startet und
öffnet ein zufälliges Dokument mit einem Gewicht von 1.500 KB, das aus dem Pool kopiert wird
von Ressourcen


CPU und E / A.


Nfo


Dialogöffnungszeit
Notizblockfenster


Öffnen einer VSI-Notepad-Datei [Strg + O]


CPU, RAM und E / A.



ZHC *


Erstellungszeit für ZIP-Dateien mit starker Komprimierung


Lokale Komprimierung
zufällige PST-Dateigröße von 5 MB, aus der kopiert wird
Ressourcenpool


CPU und E / A.


ZLC *


Erstellungszeit für Zip-Dateien mit geringer Komprimierung


Lokale Komprimierung
zufällige PST-Dateigröße von 5 MB, aus der kopiert wird
Ressourcenpool


I / O.



CPU


Berechnung groß
zufälliges Datenarray


Erstellen Sie ein großes Array
Zufallsdaten, die im E / A-Timer verwendet werden sollen (E / A-Timer)


CPU



Bei der Durchführung des Tests wird zunächst die grundlegende VSIbase-Metrik berechnet, die die Geschwindigkeit der Aufgaben ohne Belastung des Systems anzeigt. Darauf basierend wird der VSImax-Schwellenwert bestimmt, der VSIbase + 1000 ms entspricht.

Schlussfolgerungen zur Systemleistung werden auf der Grundlage von zwei Metriken gezogen: VSIbase, die die Geschwindigkeit des Systems bestimmt, und VSImax-Schwellenwert, der die maximale Anzahl von Benutzern bestimmt, denen das System ohne wesentliche Verschlechterung standhalten kann.

300 Benchmark für Wissensarbeiter


Wissensarbeiter sind Benutzer, die regelmäßig Speicher, Prozessor und E / A mit verschiedenen kleinen Spitzen laden. Die Software emuliert die Last anspruchsvoller Bürobenutzer, als würden sie ständig etwas stupsen (PDF, Java, Office Suite, Anzeigen von Fotos, 7-Zip). Wenn Benutzer von Null auf 300 hinzugefügt werden, erhöht sich die Verzögerung für jeden Benutzer allmählich.

VSImax-Statistikdaten:
Bild
VSIbase = 986 ms, VSI-Schwellenwert wurde nicht erreicht.

Statistik der Belastung des Speichersystems durch SimpliVity-Überwachung:
Bild

Mit dieser Art von Last kann das System einer erhöhten Last standhalten, ohne dass die Leistung beeinträchtigt wird. Die Ausführungszeit von Benutzeraufgaben wächst reibungslos, die Antwortzeit des Systems ändert sich während des Tests nicht und beträgt bis zu 3 ms zum Schreiben und bis zu 1 ms zum Lesen.

Schlussfolgerung: 300 Benutzerkenntnisse ohne Probleme arbeiten im aktuellen Cluster und stören sich nicht gegenseitig, wodurch eine Überzeichnung von pCPU / vCPU 1 bis 6 erreicht wird. Allgemeine Verzögerungen nehmen gleichmäßig zu, aber die bedingte Grenze wurde nicht erreicht.

Benchmark für 300 Lagerarbeiter


Dies sind Benutzer, die ständig im Verhältnis 30 zu 70 schreiben und lesen. Dieser Test wurde eher experimentell durchgeführt. VSImax-Statistikdaten:
Bild

VSIbase = 1673, VSI-Schwellenwert bei 240 Benutzern erreicht.

Statistik der Belastung des Speichersystems durch SimpliVity-Überwachung:
Bild
Diese Art der Belastung ist in der Tat ein Stresstest des Speichersystems. Bei der Ausführung schreibt jeder Benutzer viele zufällige Dateien unterschiedlicher Größe auf die Festplatte. In diesem Fall ist ersichtlich, dass einige Benutzer bei Überschreiten eines bestimmten Lastschwellenwerts die Zeit verlängern, die zum Ausführen von Dateiaufzeichnungsaufgaben erforderlich ist. Gleichzeitig ändert sich die Belastung des Speichersystems, des Prozessors und des Hostspeichers nicht wesentlich. Daher ist es derzeit unmöglich, genau zu bestimmen, mit welchen Verzögerungen verbunden ist.

Rückschlüsse auf die Systemleistung mit diesem Test können nur im Vergleich zu den Testergebnissen anderer Systeme gezogen werden, da solche Belastungen synthetisch und unrealistisch sind. Im Allgemeinen verlief der Test jedoch gut. Bis zu 210 Sitzungen lief alles gut, und dann begannen unverständliche Antworten, die nur mit Login VSI verfolgt wurden.

300 Kraftarbeiter


Dies sind Benutzer, die den Prozessor, den Speicher und die hohe E / A lieben. Diese „fortgeschrittenen Benutzer“ führen regelmäßig komplexe Aufgaben mit langen Spitzen aus, z. B. die Installation neuer Software und das Entpacken großer Archive. VSImax-Statistikdaten:
Bild

VSIbase = 970, VSI-Schwellenwert wurde nicht erreicht.

Statistik der Belastung des Speichersystems durch SimpliVity-Überwachung:
Bild

Während des Tests wurde die Prozessorlastschwelle auf einem der Systemknoten erreicht, dies hatte jedoch keine wesentlichen Auswirkungen auf den Betrieb:

Bild

Bild

In diesem Fall kann das System einer erhöhten Belastung standhalten, ohne die Leistung wesentlich zu beeinträchtigen. Die Ausführungszeit von Benutzeraufgaben wächst reibungslos, die Antwortzeit des Systems ändert sich während des Tests nicht und beträgt bis zu 3 ms zum Schreiben und bis zu 1 ms zum Lesen.

Die üblichen Tests für den Kunden reichten nicht aus, und wir gingen weiter: Wir erhöhten die Eigenschaften der VM (die Anzahl der vCPUs, um die Zunahme der Überbelegung und der Festplattengröße zu bewerten) und fügten zusätzliche Last hinzu.

Bei zusätzlichen Tests wurde die folgende Standkonfiguration verwendet:
Bereitstellung von 300 virtuellen Desktops in der Konfiguration von 4vCPU, 4 GB RAM und 80 GB Festplatte.

Konfiguration einer der Testmaschinen:
Bild

Maschinen werden in der Option Dedicated - Full Copy bereitgestellt:

Bild

Bild

300 Wissensarbeiter messen 12 Überzeichnungen


VSImax-Statistikdaten:
Bild

VSIbase = 921 ms, VSI-Schwellenwert wurde nicht erreicht.

Statistik der Belastung des Speichersystems durch SimpliVity-Überwachung:
Bild

Die Ergebnisse ähneln dem Testen der vorherigen VM-Konfiguration.

300 Power Worker überzeichnen 12


VSImax-Statistikdaten:
Bild

VSIbase = 933, VSI-Schwellenwert wurde nicht erreicht.

Statistik der Belastung des Speichersystems durch SimpliVity-Überwachung:
Bild

In diesem Test wurde auch die Prozessorlastschwelle erreicht, dies hatte jedoch keinen signifikanten Einfluss auf die Leistung:

Bild

Bild

Die Ergebnisse ähneln dem Testen der vorherigen Konfiguration.

Was passiert, wenn Sie den Ladevorgang 10 Stunden lang starten?


Jetzt werden wir sehen, ob es einen "Akkumulationseffekt" gibt, und 10 Stunden hintereinander Tests durchführen.

Lange Tests und eine Beschreibung des Abschnitts sollten darauf abzielen, dass wir prüfen wollten, ob es Probleme mit der Farm mit einer langen Belastung gibt.

300 Wissensarbeiter Benchmark + 10 Stunden


Zusätzlich wurde der Test der Lastvariante von 300 Wissensarbeitern mit der anschließenden Arbeit der Benutzer für 10 Stunden durchgeführt.

VSImax-Statistikdaten:
Bild

VSIbase = 919 ms, VSI-Schwellenwert wurde nicht erreicht.

VSImax Detaillierte Statistikdaten:
Bild

Die Grafik zeigt, dass während des gesamten Tests keine Leistungseinbußen auftreten.

Statistik der Belastung des Speichersystems durch SimpliVity-Überwachung:
Bild

Die Leistung des Speichersystems bleibt während des gesamten Tests auf dem gleichen Niveau.

Zusätzliche Tests mit zusätzlicher synthetischer Belastung


Der Kunde hat darum gebeten, der Festplatte eine Wildload hinzuzufügen. Zu diesem Zweck wurde dem Speichersystem in jeder virtuellen Maschine des Benutzers eine Aufgabe hinzugefügt, um eine synthetische Last auf der Festplatte zu starten, wenn sich der Benutzer am System anmeldet. Die Last wurde vom Dienstprogramm fio bereitgestellt, mit dem die Last auf der Festplatte durch die Anzahl der IOPS begrenzt werden kann. In jeder Maschine wurde eine Aufgabe gestartet, um eine zusätzliche Last in Höhe von 22 IOPS 70% / 30% Random Read / Write zu starten.

Benchmark für 300 Wissensarbeiter + 22 IOPS pro Benutzer


Bei ersten Tests wurde festgestellt, dass fio den Prozessor virtueller Maschinen erheblich zusätzlich belastet. Dies führte zu einer schnellen Hostüberlastung der CPU und beeinträchtigte den Betrieb des gesamten Systems erheblich.

CPU-Auslastung der Hosts:
Bild

Bild

Die Verzögerungen des Speichersystems nahmen natürlich ebenfalls zu:
Bild

Der Mangel an Rechenleistung ist für ungefähr 240 Benutzer kritisch geworden:
Bild

Aufgrund der Ergebnisse wurde beschlossen, einen Test durchzuführen, der weniger CPU-intensiv ist.

230 Benchmark für Büroangestellte + 22 IOPS pro Benutzer


Um die Belastung der CPU zu verringern, wurde der Lasttyp der Büroangestellten ausgewählt und jeder Sitzung wurden 22 IOPS synthetische Last hinzugefügt.

Der Test wurde auf 230 Sitzungen begrenzt, um die maximale Belastung der CPU nicht zu überschreiten.

Der Test wurde mit der anschließenden Arbeit der Benutzer für 10 Stunden gestartet, um die Stabilität des Systems bei längerem Betrieb bei einer Last nahe dem Maximum zu überprüfen.

VSImax-Statistikdaten:
Bild

VSIbase = 918 ms, VSI-Schwellenwert wurde nicht erreicht.

VSImax Detaillierte Statistikdaten:
Bild

Die Grafik zeigt, dass während des gesamten Tests keine Leistungseinbußen auftreten.

CPU-Statistiken:
Bild

Bild

Bei diesem Test war die CPU-Belastung der Hosts nahezu maximal.

Statistik der Belastung des Speichersystems durch SimpliVity-Überwachung:
Bild

Die Leistung des Speichersystems bleibt während des gesamten Tests auf dem gleichen Niveau.

Die Belastung des Speichersystems während des Tests betrug ungefähr 6.500 IOPS in einem Verhältnis von 60/40 (3.900 IOPS zum Lesen, 2.600 IOPS zum Schreiben), was ungefähr 28 IOPS pro Workstation entspricht.

Die durchschnittliche Antwortzeit betrug 3 ms zum Schreiben und bis zu 1 ms zum Lesen.

Zusammenfassung


Bei der Simulation realer Lasten der HPE SimpliVity-Infrastruktur wurden Ergebnisse erzielt, die die Fähigkeit des Systems bestätigen, virtuelle Desktops in Höhe von mindestens 300 Full Clone-Computern auf einem Paar von SimpliVity-Knoten bereitzustellen. Gleichzeitig wurde die Reaktionszeit des Speichersystems während des gesamten Tests auf einem optimalen Niveau gehalten.

Wir sind sehr beeindruckt von dem Ansatz, langwierige Tests durchzuführen und Lösungen vor der Implementierung zu vergleichen. Wenn Sie möchten, können wir die Leistung für Ihre Workloads testen. Einschließlich anderer hyperkonvergenter Lösungen. Der genannte Kunde führt nun parallel Tests an einer anderen Lösung durch. Die derzeitige Infrastruktur besteht lediglich aus einer PC-Flotte, einer Domäne und einer Software an jedem Arbeitsplatz. Der Wechsel zu VDI ohne Tests ist natürlich ziemlich schwierig. Insbesondere ist es schwierig, die tatsächlichen Funktionen der VDI-Farm zu verstehen, ohne echte Benutzer darauf zu migrieren. Mit diesen Tests können Sie schnell die tatsächlichen Fähigkeiten eines bestimmten Systems beurteilen, ohne normale Benutzer anziehen zu müssen. Daher entstand eine solche Studie.

Der zweite wichtige Ansatz - der Kunde hat sofort die richtige Skalierung festgelegt. Hier können Sie einen Server kaufen und eine Farm hinzufügen, zum Beispiel für 100 Benutzer, alles ist zum Preis des Benutzers vorhersehbar. Wenn sie beispielsweise weitere 300 Benutzer hinzufügen müssen, wissen sie, dass sie zwei Server in einer bereits definierten Konfiguration benötigen, und überdenken nicht die Möglichkeiten, ihre Infrastruktur insgesamt zu aktualisieren.

Interessante Funktionen der HPE SimpliVity Federation. Das Geschäft ist geografisch aufgeteilt, daher ist es sinnvoll, ein separates VDI-Stück Eisen in einem entfernten Büro aufzubewahren. In der SimpliVity Federation wird jede virtuelle Maschine nach einem Zeitplan repliziert, mit der Möglichkeit, sehr schnell und ohne Belastung des Kanals zwischen geografisch entfernten Clustern zu wechseln. Dies ist eine sehr gute integrierte Sicherung. Beim Replizieren von VMs zwischen Standorten wird der Kanal so minimal wie möglich verwendet. Auf diese Weise können sehr interessante DR-Architekturen mit einem einzigen Kontrollzentrum und einer Reihe von dezentralen Speicherstandorten erstellt werden.
Bild
Föderation

All dies zusammen ermöglicht es, die finanzielle Seite detailliert zu bewerten, die Kosten von VDI den Wachstumsplänen des Unternehmens aufzuerlegen und zu verstehen, wie schnell sich die Lösung auszahlt und wie sie funktioniert. Denn jeder VDI ist eine Lösung, die letztendlich viele Ressourcen spart, aber höchstwahrscheinlich gleichzeitig keine kostengünstige Möglichkeit bietet, sie innerhalb von 5-7 Jahren nach ihrer Verwendung zu ändern.

Wenn Sie Fragen haben, die keine Kommentare enthalten, schreiben Sie mir im Allgemeinen unter mk@croc.ru.

Source: https://habr.com/ru/post/de449210/


All Articles