Wir teilen unsere Erfahrungen damit, wie SSDs unter RAID angezeigt werden und welche Array-Ebene rentabler ist

Im vorherigen Artikel haben wir uns bereits am Beispiel von Kingston-Laufwerken mit der Frage befasst, ob RAID auf SSDs anwendbar ist. Dies haben wir jedoch nur im Rahmen der Null-Ebene getan. In diesem Artikel werden die Optionen für den Einsatz von professionellen und Heim-NVMe-Lösungen in den gängigsten RAID-Arrays analysiert und die Kompatibilität von Broadcom- Controllern mit Kingston-Laufwerken erörtert.



Warum brauche ich RAID auf einer SSD?


Zu den Vorteilen von SSD-basierten Speicher-Arrays gegenüber Festplatten-Speicher-Arrays zählen eine kürzere Zugriffszeit auf das Laufwerk und eine überlegene Lese- / Schreibleistung. Für die optimale Leistung eines SSD-basierten RAID ist jedoch eine optimale Kombination aus Prozessor, Cache, Software und Hardware erforderlich. Wenn all diese Faktoren perfekt zusammenwirken, kann ein RAID-Array von einer SSD eine vergleichbare Konfiguration mit herkömmlichen Festplatten deutlich übertreffen.

Eine typische SSD verbraucht weniger Strom als Festplatten. Wenn Sie also eine große Anzahl von Solid-State-Laufwerken in einem RAID-Array kombinieren, können Sie im Vergleich zu einem RAID-Array von einer Festplatte auch Energie sparen und so die Kosten für die Stromrechnung Ihres Unternehmens senken.

SSD RAID hat jedoch Einschränkungen und Nachteile: Insbesondere ein höherer Preis pro Gigabyte Speicherplatz im Vergleich zu Festplatten mit vergleichbarer Kapazität. Die Flash-MTBF ist durch eine bestimmte Anzahl von Überschreibzyklen begrenzt. Das heißt, SSD-Laufwerke haben eine bestimmte Lebensdauer, die vom Betrieb abhängt: Je aktiver die darauf enthaltenen Informationen überschrieben werden, desto schneller fällt das Laufwerk aus. SSDs von Unternehmen hingegen haben eine angemessene Lebensdauer, die mit mechanischen Festplatten vergleichbar ist.

So leben Kingston-SSDs mit Broadcom-Controllern im RAID-Modus


Zu Beginn der Einführung von SSDs waren RAID-Designs mit vielen Nuancen behaftet. Einschließlich aufgrund der Verwendung von weniger fehlertoleranten HDD-Laufwerken. Solid-State-Laufwerke sind viel zuverlässiger als ihre Gegenstücke auf Basis von Magnetplatten. Wie wir wissen, sind in SSD-Lösungen keine beweglichen Elemente enthalten, sodass die mechanische Beschädigung auf null reduziert wird. Ein Ausfall der SSD aufgrund von Spannungsspitzen ist ebenfalls unwahrscheinlich, da Sie auf der Ebene Ihres Heim-PCs und jedes Servers durch USVs, Mehrfachsteckdosen und sogar ein Netzteil geschützt sind.

Gleichzeitig haben Solid-State-Laufwerke ein weiteres bedeutendes Plus: Selbst wenn die Speicherzellen zum Schreiben abgenutzt sind, können noch Daten von ihnen gelesen werden, wenn jedoch die Magnetplatte beschädigt ist.



Die Verwendung von SSD-Lösungen in RAID-Arrays mit unterschiedlichen Ebenen ist heutzutage eine ganz normale Praxis. Die Hauptsache ist, die richtigen Solid-State-Laufwerke auszuwählen, deren Latenz minimal ist. Es ist auch ideal, SSDs desselben Herstellers und desselben Modells zu verwenden, damit es nicht zu einem Durcheinander von Laufwerken kommt, die verschiedene Lasttypen unterstützen und auf der Grundlage verschiedener Speichertypen, Controller und anderer Technologien erstellt wurden. Wenn wir uns also für vier oder 16 Kingston NVMe-SSDs zur Erstellung eines RAID-Arrays entscheiden, ist es besser, wenn alle aus derselben Serie und Modellreihe stammen.

Übrigens haben wir im letzten Artikel Broadcom-Controller als Beispiel angeführt, als wir über die NVMe-SSD von Kingston sprachen. Fakt ist, dass in den Handbüchern zu diesen Geräten sofort kompatible Laufwerke (einschließlich Lösungen des genannten amerikanischen Herstellers SSD) registriert sind, mit denen der Controller einwandfrei arbeiten wird. Bei der Auswahl des „Controller-SSD“ -Pakets für RAID müssen Sie sich auf diese Informationen verlassen.

Wir analysieren die Arbeit von Kingston-SSDs in den gängigsten RAID-Typen: "1", "5", "10", "50".


Die RAID-Stufe „Null“ bietet also keine Datenredundanz, sondern erhöht nur die Produktivität. RAID 0 bietet überhaupt keinen Datenschutz, daher werden wir ihn nicht im Unternehmenssegment berücksichtigen. RAID 1 bietet hingegen vollständige Redundanz, jedoch nur eine bescheidene Leistungssteigerung. Daher sollte in Betracht gezogen werden, wenn die Leistungsverbesserung kein grundlegender Faktor beim Erstellen eines RAID-Arrays von einer SSD ist.

RAID 1 basierend auf Kingston SSDs und Broadcom Controllern


Das RAID-Array der ersten Ebene, das auf dem Broadcom MegaRAID 9460-16i-Controller basiert, kombiniert zwei bis 32 Kingston-Laufwerke, die Kopien voneinander sind, und bietet vollständige Redundanz. Wenn Sie herkömmliche Festplatten verwenden, bleibt die Geschwindigkeit beim Schreiben und Lesen von Daten auf dem Niveau dieser Festplatte. Mit NVMe-SSD-Lösungen können Sie die Leistung verzehnfachen. Besonders in Bezug auf die Datenzugriffszeit. Zum Beispiel erhalten wir mit zwei Kingston DC1000M U.2 NVMe-SSDs in Server-RAID 1 350.000 IOPS beim Lesen von Zufallsdaten und 75.000 IOPS beim Schreiben.



In Bezug auf die sequentielle Lesegeschwindigkeit entsprechen die Ergebnisse den Eigenschaften des Laufwerks - 3200 MB / s. Da jedoch beide NVMe-SSDs betriebsbereit sind, können Daten gleichzeitig von ihnen gelesen werden, was Lesevorgänge ziemlich schnell macht. Die Schreibgeschwindigkeit (behauptet 2000 MB / s) ist jedoch langsamer, da jeder Schreibvorgang zweimal ausgeführt wird.



Das RAID 1-Array ist ideal für kleine Datenbanken oder jede andere Umgebung, die Fehlertoleranz erfordert, aber nur eine geringe Kapazität. Das Spiegeln von Laufwerken ist besonders in Disaster-Recovery-Szenarien hilfreich (die Leistung verschlechtert sich geringfügig), da wichtige Daten sofort „wiederbelebt“ werden, wenn eines der Laufwerke im Array ausfällt. Da diese Schutzstufe die Verdoppelung der Speicherkapazität für eine Spiegelkopie von Daten erfordert (100 TB erfordern 200 TB Speicherplatz), verwenden viele Unternehmenssysteme wirtschaftlichere Speicheroptionen: RAID 5 und RAID 6.

RAID 5 basierend auf Kingston SSDs und Broadcom Controllern


Um ein RAID-Array der fünften Ebene zu organisieren, benötigen Sie mindestens drei Laufwerke, deren Daten gestreift (zyklisch auf alle Laufwerke im Array geschrieben), jedoch nicht dupliziert werden. Bei der Organisation sollte man ihre komplexere Struktur berücksichtigen, da hier ein Begriff wie „Prüfsumme“ (oder „Parität“) vorkommt. Dieses Konzept bezieht sich auf die logische algebraische Funktion XOR (es ist auch das exklusive "OR"), die die Verwendung von mindestens drei Laufwerken im Array vorschreibt (maximal - 32). In diesem Fall werden die Paritätsinformationen auf allen „Festplatten“ im Array aufgezeichnet.



Für ein Array von vier Kingston DC500R SATA-SSDs mit einer Kapazität von jeweils 3,84 TB erhalten wir 11,52 TB Speicherplatz und 3,84 TB für Prüfsummen. Wenn Sie 16 Kingston DC1000M U.2 NVMe-Laufwerke in einem RAID der fünften Ebene mit einer Kapazität von 7,68 TB kombinieren, lernen Sie 115,2 TB mit einem Verlust von 7,68 TB. Wie Sie sehen, ist es umso besser, je mehr Laufwerke vorhanden sind. Es ist auch besser, da die Gesamtschreibleistung umso höher ist, je mehr Laufwerke in RAID 5 vorhanden sind. Das lineare Lesen erreicht RAID 0.



Eine RAID 5-Laufwerksgruppe bietet einen hohen Durchsatz (insbesondere für große Dateien) und Redundanz bei minimalem Energieverlust. Diese Art der Array-Organisation eignet sich am besten für Netzwerke, in denen viele kleine E / A-Vorgänge gleichzeitig ausgeführt werden. Es lohnt sich jedoch nicht, es für Aufgaben zu verwenden, die eine große Anzahl von Schreibvorgängen für kleine oder kleine Blöcke erfordern.
Es gibt noch eine weitere Nuance: Wenn mindestens eines der NVMe-Laufwerke ausfällt, wechselt RAID 5 in den Degradationsmodus und der Ausfall eines anderen Speichergeräts kann für alle Daten kritisch werden. Bei einem Ausfall eines einzelnen Laufwerks im Array verwendet der RAID-Controller die Paritätsinformationen, um alle fehlenden Daten neu zu erstellen.

RAID 10 basierend auf Kingston SSDs und Broadcom Controllern


Mit RAID 0 können wir also die Geschwindigkeit und die Zugriffszeit verdoppeln, und RAID 1 bietet Zuverlässigkeit. Es wäre ideal, sie zu kombinieren, und hier kommt RAID 10 (oder 1 + 0) zur Rettung. "Ten" setzt sich aus vier SATA-SSD- oder NVMe-Laufwerken (maximal 32) zusammen und impliziert eine Reihe von "Spiegeln", wobei die Anzahl der Laufwerke immer ein Vielfaches von vier sein sollte. Die Daten in diesem Array werden durch Partitionieren in feste Blöcke (wie im Fall von RAID 0) und Verschachteln zwischen Laufwerken und Verteilen von Kopien zwischen den „Datenträgern“ in RAID 1 geschrieben. Aufgrund der Möglichkeit des gleichzeitigen Zugriffs auf mehrere Datenträgergruppen weist RAID 10 eine hohe Leistung auf.



Da RAID 10 in der Lage ist, Daten auf mehrere Spiegelpaare zu verteilen, kann dies den Ausfall eines Laufwerks in einem Paar ermöglichen. Im Falle eines Ausfalls beider Spiegelpaare (d. H. Aller vier Laufwerke) tritt jedoch unvermeidlicher Datenverlust auf. Dadurch erhalten wir auch eine gute Fehlertoleranz und Zuverlässigkeit. Beachten Sie jedoch, dass ein Array der zehnten Ebene wie RAID 1 nur die Hälfte der Gesamtkapazität belegt und daher eine teure Lösung darstellt. Ja und schwer zu konfigurieren.

RAID 10 eignet sich für die Verwendung in Data Warehouses, die eine 100% ige Redundanz der Spiegelplattengruppen sowie eine höhere RAID 0-E / A-Leistung erfordern. Dies ist die beste Lösung für mittelgroße Datenbanken oder Umgebungen, die eine höhere Fehlertoleranz als RAID erfordern 5.

RAID 50 basierend auf Kingston SSDs und Broadcom Controllern


Ein kombiniertes Array, ähnlich dem RAID der zehnten Ebene, bei dem es sich um ein Array mit null Ebenen handelt, das aus Arrays der fünften Ebene erstellt wurde. Wie im vorherigen Fall besteht das Hauptziel dieses Arrays darin, die Leistung zu verdoppeln und gleichzeitig die Datenzuverlässigkeit in RAID 5-Arrays zu gewährleisten. Gleichzeitig bietet RAID 50 eine höhere Schreibleistung und einen besseren Datenschutz als Standard-RAID 5 bei einem Festplattenausfall Schnellere Wiederherstellung bei Ausfall eines Laufwerks.



Eine RAID 50-Datenträgergruppe teilt die Daten in kleinere Blöcke auf und verteilt sie dann auf jedes RAID 5. Eine RAID 5-Datenträgergruppe teilt die Daten wiederum in kleinere Blöcke auf, berechnet die Parität, führt eine logische ODER-Verknüpfung für die Blöcke durch und dann führt Schreibvorgänge für Datenblöcke und Parität für jede Festplatte in der Festplattengruppe aus.

Und obwohl die Leistung bei einem Ausfall eines der Laufwerke unvermeidlich abnimmt, ist sie nicht so bedeutend wie bei einem RAID 5-Array, da ein Ausfall nur eines der Arrays betrifft und das andere voll funktionsfähig bleibt. In der Tat kann ein RAID 50 bis zu acht Ausfällen des Festplatten- / SSD- / NVMe- Laufwerks standhalten, wenn sich jedes ausgefallene Laufwerk in einem separaten RAID 5-Array befindet.



RAID 50 wird am besten für Anwendungen verwendet, die eine hohe Zuverlässigkeit erfordern und eine große Anzahl von Anforderungen verarbeiten müssen, während hohe Datenübertragungsraten und kostengünstigere Laufwerke als RAID 10 beibehalten werden. Da jedoch mindestens sechs Laufwerke für die Konfiguration von RAID 50 erforderlich sind, Kosten sind als Faktor nicht vollständig ausgeschlossen. Einer der Nachteile von RAID 50 ist, dass es wie RAID 5 einen ausgeklügelten Controller benötigt: wie den Broadcom MegaRAID 9460-16i, den wir in einem früheren Artikel erwähnt haben.

Es ist auch anzumerken, dass RAID 50 aufgrund der Zuweisung von Kapazität für den Inhalt von Paritätsdatensätzen weniger Speicherplatz als RAID 5 hat. Es verfügt jedoch immer noch über mehr nutzbaren Speicherplatz als andere RAID-Level, insbesondere solche, die Spiegelung verwenden. Mit einer Mindestanforderung von sechs Laufwerken kann RAID 50 eine teure Option sein, aber der zusätzliche Speicherplatz rechtfertigt die Kosten durch den Schutz von Unternehmensdaten. Dieser Array-Typ wird für die Arbeit mit Daten empfohlen, die eine hohe Speicherzuverlässigkeit, eine hohe Anforderungsfrequenz, eine hohe Übertragungsgeschwindigkeit und eine hohe Hosting-Kapazität erfordern.

RAID 6 und RAID 60: Wir haben sie nicht vergessen


Da wir über Arrays der fünften und fünfzigsten Ebene gesprochen haben, ist es eine Sünde, Arrays wie RAID 6 und RAID 60 nicht anders zu organisieren.



Die Leistung von RAID 6 ähnelt der von RAID 5, hier werden jedoch mindestens zwei Laufwerke paritätiert, sodass das Array den Ausfall von zwei Laufwerken ohne Datenverlust überstehen kann (in RAID 5 ist diese Situation äußerst unerwünscht). Dies gewährleistet eine höhere Zuverlässigkeit. Ansonsten stimmt alles mit dem Array der fünften Ebene überein: Bei einem Ausfall von ein oder zwei Festplatten erstellt der RAID-Controller mithilfe von Paritätsblöcken alle fehlenden Informationen neu. Wenn zwei Laufwerke ausfallen, wird die Wiederherstellung nicht gleichzeitig durchgeführt: Zuerst wird das erste Laufwerk neu gestartet, dann das zweite. Somit werden zwei Datenwiederherstellungsoperationen durchgeführt.



Es ist leicht zu erraten, dass RAID 50, wenn es sich um ein Array der fünften Ebene auf Nullebene handelt, ein Array der sechsten Ebene auf Nullebene ist, worüber wir gerade gesprochen haben. Diese Organisation des RAID-Speichers ermöglicht es Ihnen, den Verlust von zwei SSDs in jeder Gruppe von RAID 6-Laufwerken zu überstehen. Das Funktionsprinzip ähnelt dem, das wir im Abschnitt zu RAID 50 beschrieben haben, aber die Anzahl der Ausfälle, denen ein Array der sechzigsten Ebene standhalten kann, steigt von 8 auf 16 Antriebe. In der Regel werden diese Arrays für den Online-Kundendienst verwendet, der eine hohe Fehlertoleranz erfordert.

Um zusammenzufassen:


Das Spiegeln bietet zwar eine höhere Fehlertoleranz als RAID 50/60, benötigt jedoch auch viel mehr Speicherplatz. Da sich die Datenmenge verdoppelt, erhalten Sie tatsächlich nur 50% der Gesamtkapazität der im Server installierten Laufwerke zum Aufzeichnen und Speichern von Informationen. Die Wahl zwischen RAID 50/60 und RAID 10 hängt höchstwahrscheinlich von Ihrem Budget, Ihrer Serverkapazität und Ihren Datenschutzanforderungen ab. Und die Kosten rücken in den Vordergrund, wenn es um SSD-Lösungen (sowohl für Unternehmen als auch für Endverbraucher) geht.

Genauso wichtig ist es, dass wir jetzt genau wissen: RAID auf Basis von SSD ist eine absolut sichere Lösung und für moderne Unternehmen die übliche Praxis. Im Rahmen des Heimgebrauchs gibt es auch einen Grund, auf NVMe umzusteigen, wenn die Budgets dies zulassen. Und wenn Sie noch eine Frage haben, warum dies alles notwendig ist, kehren Sie zum Anfang des Artikels zurück - wir haben sie bereits ausführlich beantwortet.

Dieser Artikel wurde mit der Unterstützung unserer Broadcom-Kollegen erstellt, die ihre Controller den Ingenieuren von Kingston zum Testen mit SATA / SAS / NVMe-Laufwerken der Enterprise-Klasse zur Verfügung stellen. Dank dieser freundlichen Symbiose müssen Kunden nicht an der Zuverlässigkeit und Stabilität der Kingston-Laufwerke mit Broadcoms HBA- und RAID-Controllern zweifeln.

Weitere Informationen zu Kingston-Produkten finden Sie auf der offiziellen Website des Unternehmens.

Source: https://habr.com/ru/post/de482248/


All Articles