FlexiRemap® vs RAID

RAID-Algorithmen wurden bereits 1987 der Öffentlichkeit vorgestellt. Bis heute sind sie die beliebteste Technologie zum Schutz und zur Beschleunigung des Zugriffs auf Daten im Bereich der Informationsspeicherung. Das Zeitalter der IT-Technologie, das einen 30-jährigen Meilenstein überschritten hat, ist jedoch nicht die Reife, sondern das Alter. Der Grund ist Fortschritt, der unaufhaltsam neue Möglichkeiten mit sich bringt. In Zeiten, in denen es außer der Festplatte praktisch keine anderen Laufwerke gab, ermöglichten RAID-Algorithmen die effizienteste Nutzung der verfügbaren Speicherressourcen. Mit dem Aufkommen der SSD hat sich die Situation jedoch grundlegend geändert. Jetzt ist RAID bei der Arbeit mit SSDs bereits eine "Schlinge" für ihre Leistung. Um das volle Potenzial der Geschwindigkeitseigenschaften von SSD auszuschöpfen, ist daher einfach ein völlig anderer Ansatz für die Arbeit mit ihnen erforderlich.



Neben den offensichtlichen Unterschieden zwischen HDD und SSD in den Funktionsprinzipien weisen diese Medientypen ein weiteres wichtiges Merkmal auf: Jede Festplatte kann alle Daten mit Granularität in einem Block überschreiben (jetzt sind es meistens 4 KB). Bei SSDs ist der Umschreibvorgang viel komplizierter:


  • Geänderte Daten werden an einen neuen Speicherort kopiert. Gleichzeitig ist die Granularität derselbe Block, besteht jedoch aus mehreren Seiten und hat eine Größe von 256 KB - 4 MB. Das heißt, Wenn Sie die gleichen 4 KB ändern, müssen Sie alle benachbarten Seiten kopieren und einen einzigen Block bilden.
  • Markieren Sie die "alten" Blöcke als unbenutzt und wischen Sie sie dann mit dem Müllsammler ab.


Sequentielles Schreiben / Überschreiben auf SSD


Bei der sequentiellen Aufnahme / Synchronisation spielt diese Funktion der SSD keine große Rolle für ihre Leistung, weil Die Blöcke befinden sich in der Nähe, und der Müllsammler erledigt seine Arbeit im Hintergrund. Im wirklichen Leben und insbesondere im Enterprise-Segment für SSD wird jedoch am häufigsten der wahlfreie Zugriff auf Daten verwendet. Und diese Daten werden an beliebige Stellen auf den Laufwerken geschrieben.


Je mehr Daten auf die SSD geschrieben werden, desto schwieriger ist es für den Garbage Collector, zu arbeiten, da die Fragmentierung schnell zunimmt. Infolgedessen kommt der Moment, in dem der Prozess der Reinigung des Laufwerks nicht mehr „Hintergrund“ ist: Die Leistung der SSD sinkt erheblich, weil Ein wesentlicher Teil davon wird vom Garbage Collector übernommen.



Reales Datenlayout auf SSD für den täglichen Gebrauch


Um die Auswirkungen des Garbage Collectors in Abhängigkeit vom Aufnahmemodus auf dem Laufwerk zu veranschaulichen, können einfache Tests durchgeführt werden: sequentielle und zufällige Aufzeichnung in 4K-Blöcken auf einem 100-GB-Laufwerk. (Quelle - Mikron )



Sequentielle Schreibleistung



Zufällige Schreibleistung


Wie Sie den Tests entnehmen können, kann der Leistungsabfall mehr als zweimal betragen. Und das ist nur ein einziges Laufwerk. Bei Verwendung von SSDs als Teil einer RAID-Gruppe steigt die Anzahl der Umschreibungsvorgänge dank der Arbeit mit Parität erheblich an.


Dank dieser Merkmale der SSD gibt es für sie im Allgemeinen einen Parameter wie einen Schreibkoeffizienten (Schreibverstärkung). Dies ist das Verhältnis der auf das Laufwerk geschriebenen Datenmenge zur tatsächlich vom Host gesendeten Datenmenge. Und für das beliebteste RAID5 beträgt dieses Verhältnis ~ 3,5.


Infolgedessen verwenden Systeme mit klassischem RAID im Grunde genommen SSDs nur ~ 10% ihrer tatsächlichen Geschwindigkeit und skalieren schlecht in der Leistung, wobei die Anzahl der Laufwerke über ein Dutzend steigt.


Wir stellen außerdem fest, dass übermäßige Schreibvorgänge nicht nur die Leistung von SSDs verringern, sondern auch die weit von endlosen Ressourcen entfernt, wodurch die Lebensdauer des Laufwerks verkürzt wird.


Die FlexiRemap®-Technologie , die den Kern aller AccelStor-Produkte bildet, wurde als Alternative zu den klassischen RAID-Algorithmen für die Arbeit mit SSDs entwickelt. Die Innovation der Technologie wurde sowohl durch verschiedene Patente und Auszeichnungen (einschließlich auf dem Flash Memory Summit 2016) als auch durch die Ergebnisse unabhängiger Tests (z. B. SPC1) festgestellt.


Die Essenz von FlexiRemap® besteht darin, alle eingehenden Schreibanforderungen und hauptsächlich vom Typ Zufall in eine Reihe von Blöcken umzuwandeln, die der sequentiellen Aufzeichnung aus Sicht des Laufwerks so ähnlich wie möglich sind. Infolgedessen erfolgt die Aufzeichnung auf der SSD im für sie bequemsten Modus, und die endgültige Leistung übertrifft jedes System mit einem klassischen RAID.


Alle SSDs in AccelStor-Systemen sind in zwei symmetrische FlexiRemap®-Gruppen unterteilt. Die Größe der Gruppe hängt vom Modell ab und beträgt 5-11 Laufwerke. Für die Ausfallsicherheit innerhalb einer Gruppe wird Parität wie RAID5 verwendet. Beide Gruppen werden zusammen verwendet, um einen gemeinsamen Speicherplatz zu bilden. Daher ähnelt die resultierende Fehlertoleranz einem RAID50-Array, das aus zwei Gruppen besteht: Das System kann einem Ausfall von bis zu zwei SSDs standhalten, jedoch nicht mehr als einer in jeder FlexiRemap®-Gruppe.



Alle eingehenden Schreibanforderungen werden in 4K-Blöcke aufgeteilt, die im Round-Robin-Modus in beide FlexiRemap®-Gruppen geschrieben werden. Darüber hinaus verfolgt das System ständig den Bedarf an aufgezeichneten Blöcken und versucht, solche Blöcke so nahe wie möglich beieinander aufzuzeichnen. Es stellt sich als virtuelles Analogon des Zerreißens heraus, wenn es als Speicher ausgedrückt wird. In diesem Fall wird die Arbeit des Müllsammlers erheblich erleichtert: Schließlich sind nicht verwendete Blöcke immer in der Nähe.


Es ist zu beachten, dass AccelStor-Systeme im Gegensatz zu Produkten von Wettbewerbern nicht die Caching-Funktionalität eingehender Anforderungen im Controller-RAM verwenden. Alle eingehenden Datenblöcke werden sofort auf die SSD geschrieben. Der Host erhält die Bestätigung der erfolgreichen Aufzeichnung erst nach der physischen Platzierung der Daten auf den Laufwerken. Nur Tabellen der Blockzuordnung auf der SSD werden im RAM gespeichert, um den Zugriff zu beschleunigen und zu bestimmen, wo der nächste Datenblock geschrieben werden soll. Aus Gründen der Zuverlässigkeit befinden sich Kopien dieser Tabellen natürlich auch auf den Medien. Infolgedessen benötigen AccelStor-Systeme keinen Cache-Schutz in Form einer Batterie / eines Kondensators (es besteht jedoch die Möglichkeit, eine Verbindung mit der USV herzustellen, um bei Stromproblemen „sanft“ herunterzufahren).


Dank dieses Ansatzes zum Organisieren von Aufzeichnungen kann der Garbage Collector wirklich im Hintergrund arbeiten, ohne die Geschwindigkeit der Laufwerke wesentlich zu beeinträchtigen, wodurch letztendlich bis zu 90% der SSD-Leistung im System genutzt werden können. Genau das ist IOPS in AccelStor-Systemen gegen All Flash, basierend auf RAID-Algorithmen.


Ein weiteres wichtiges Merkmal der FlexiRemap®-Technologie ist die erhebliche Reduzierung redundanter Schreibvorgänge auf SSDs. Der Schreibverstärkungskoeffizient für AccelStor-Systeme beträgt also nur 1,3, was in die gemeinsame Sprache übersetzt eine Verlängerung der Lebensdauer von Laufwerken um mehr als das 2,5-fache gegenüber RAID5 bedeutet!



Dank der ständigen Überwachung der Richtlinien zum Platzieren von Daten auf der SSD durch das System nutzen sich alle Laufwerke auf die gleiche Weise ab. Dieser Ansatz ermöglicht es uns, ihre Lebensdauer vorherzusagen und dem Administrator im Voraus zu signalisieren, dass die Aufzeichnungsressource erschöpft ist.


Es ist klar, dass SSDs ausfallen können. In diesem Fall beginnt das System sofort mit der Wiederherstellung eines der Hot-Spare-Laufwerke. In diesem Fall wechselt die FlexiRemap®-Gruppe, die sich in einem verschlechterten Zustand befindet, in den schreibgeschützten Modus, und alle Schreibanforderungen werden an die zweite Gruppe gesendet. Ein solcher Schutzmechanismus ist vorgesehen, um den Wiederherstellungsvorgang zu beschleunigen und die Wahrscheinlichkeit eines Ausfalls eines anderen Laufwerks innerhalb derselben Gruppe zu verringern. Es ist kein Geheimnis, dass während des Wiederherstellungsvorgangs alle Laufwerke in der Gruppe aufgrund der Störung von Lese-, Schreib- und Wiederherstellungsvorgängen auf dem Ersatzlaufwerk einer erhöhten Belastung ausgesetzt sind. Dies erhöht die Wahrscheinlichkeit eines Ausfalls eines anderen Laufwerks. Und je mehr Aufnahmevorgänge, desto länger dauert der Wiederaufbau.



Nachdem der Wiederherstellungsprozess abgeschlossen ist und die FlexiRemap®-Gruppe in ihren normalen Zustand zurückkehrt, besteht zwischen den beiden Gruppen eine leichte Verzerrung in der Aufzeichnungsressource. Um es auszurichten, fallen nachfolgende Aufzeichnungsvorgänge häufig auf die wiederhergestellte Gruppe (natürlich so, dass die endgültige Systemleistung nicht viel leidet).


Es ist unmöglich, die Leistung aller auf RAID-Algorithmen basierenden Flash-Systeme über einige Werte (~ 280 KB IOPS @ 4 KB Random Write) zu steigern, selbst wenn komplexe Caching-Systeme verwendet werden. Dank eines völlig anderen Ansatzes zur Organisation des Speicherplatzes kann die FlexiRemap®-Technologie diese Barriere nicht nur leicht überwinden, sondern gleichzeitig auch die Lebensdauer von SSDs erhöhen. Daher bieten AccelStor- Systeme bei allen Flash-Arrays an vielen Fronten (IOPS / $, GB / $, TCO, ROI) erhebliche Vorteile und sind daher ideale Kandidaten für Schlüsselpositionen in Kundendatenzentren zur Lösung ressourcenintensiver Aufgaben.

Source: https://habr.com/ru/post/de445336/


All Articles