AccelStor - propre vision sur le travail d'All Flash

Actuellement, les lecteurs flash occupent de plus en plus la niche des supports de stockage dans le segment Entreprise. Ceci est facilité à la fois par une réduction significative de leur coût et une augmentation de la capacité des disques individuels. Là où, jusqu'à récemment, seuls des disques durs mécaniques étaient utilisés, les SSD sont désormais activement exploités. Et nous parlons non seulement des lecteurs internes dans les systèmes clients, mais aussi du sous-système de disques des serveurs et des systèmes de stockage de données. Et dans ce segment, les configurations de systèmes de stockage occupent une place distincte, où seuls les SSD sont utilisés comme supports de stockage. Ce sont les soi-disant systèmes All Flash.





Tout d'abord, vous devez comprendre par vous-même ce qu'est le système de stockage All Flash. Il est clair que le nom implique l'utilisation uniquement de lecteurs Flash. Cependant, tous les systèmes All Flash ne sont pas identiques. Classiquement, ils peuvent être divisés en trois sous-espèces.


1. Stockage traditionnel avec SSD


En fait, il s'agit du type de système de stockage All Flash le plus nombreux. Car pour le constructeur, rien de plus simple que d'équiper votre stockage existant de disques SSD. Bien sûr, les principaux fournisseurs, en plus de recoller les plaques signalétiques (stockage All Flash), sont également engagés dans une optimisation supplémentaire du micrologiciel pour la commodité de travailler avec les SSD ainsi que pour augmenter la vitesse du système dans son ensemble. Mais il y a ceux qui ne se soucient pas particulièrement et proposent simplement des offres comprenant un stockage régulier et un ensemble de SSD. En conséquence, vous pouvez trouver des offres sur le marché, allant de All Flash NAS Qnap (nous laissons de côté la discussion sur la faisabilité de cette solution, mais, en effet, All Flash n'est pas à blâmer!) Au monstrueux multijoueur Netapp FAS.


Le principal avantage d'une telle solution est avant tout un coût modéré. Bien sûr, chaque fournisseur a son propre supplément pour la marque, mais en général, le prix d'un système All Flash (parler de la «tête» avec les contrôleurs) ne diffère pas beaucoup par rapport au système de stockage classique (par rapport au coût d'un SSD, c'est vraiment un sou).


L'inconvénient est la faible performance globale de la solution. Tous les systèmes All Flash similaires avec du matériel moderne à l'intérieur produisent environ 300K IOPS (4K, 100% aléatoire), nous considérons le mode d'enregistrement pour la raison qu'il est beaucoup plus difficile à stocker que la lecture. Les indicateurs de lecture sont, bien sûr, beaucoup plus élevés ) Un fort écart négatif par rapport à cette valeur est plutôt une grave faille dans le firmware, et des indicateurs de performances plus élevés indiquent une meilleure mise en cache et / ou des algorithmes d'optimisation du firmware pour des modèles SSD spécifiques. Dans tous les cas, la «saturation» se produit même avec le nombre de disques ~ 10-20. Par conséquent, l'ajout supplémentaire de disques ne fera qu'augmenter la capacité de stockage disponible, mais pas la vitesse de travail.


La principale raison de cette limitation des performances est l'utilisation d'algorithmes RAID classiques. Ces algorithmes ont été développés il y a longtemps pour travailler avec des disques durs mécaniques et ne prennent absolument pas en compte les caractéristiques de fonctionnement des disques SSD. Après tout, un SSD, contrairement à un disque dur, ne peut pas simplement écraser un bloc de données. Il doit réécrire la page entière contenant le bloc à changer vers un nouvel emplacement et libérer l'ancien emplacement pour un nouvel enregistrement ultérieur. Ces circonstances, en plus de la pénalité RAID standard, fournissent une énorme surcharge pour les opérations de réécriture.


2. Toutes les baies Flash avec du matériel propriétaire


Pour surmonter les goulots d'étranglement des systèmes de stockage traditionnels, il est nécessaire d'utiliser une architecture matérielle et logicielle complètement différente. Un exemple de telles solutions est le stockage Pure ou les produits IBM Flash System. Ils n'ont ni RAID au sens habituel (parité, bien sûr, il y a une tolérance aux pannes), ni SSD en soi (ils ont leurs propres «disques» à la place). Le résultat est tout simplement des performances folles et des taux de latence particulièrement bas. Mais le coût ... En effet, comme une aile d'avion.


3. Stockage défini par logiciel


En dehors de tout ce «zoo» de tous les tableaux Flash sont des logiciels de stockage défini (SDS). SDS est un logiciel qui fonctionne sur du matériel x86 standard et émule des systèmes de stockage. Ce n'est pas en vain que nous avons utilisé ce terme entre guillemets, car Actuellement, la frontière entre les contrôleurs matériels et logiciels est très arbitraire, contrairement à l'ancien temps. Les systèmes de stockage modernes utilisent le plus souvent l'architecture standard x86 exécutant des systèmes d'exploitation de type Linux. Oui, des contrôleurs de déchargement supplémentaires peuvent être utilisés pour certaines opérations. Mais la principale différence avec SDS est la nature fermée du matériel et des logiciels pour l'utilisateur. SDS, en revanche, vous permet d'utiliser presque n'importe quel matériel recommandé et d'apporter des modifications modérées aux composants logiciels.


Cependant, si vous utilisez SDS non seulement comme système de stockage, mais comme baie All Flash, il est incorrect de donner à l'utilisateur la liberté de choisir une plate-forme serveur et d'effectuer une installation logicielle indépendante. La raison principale est l'incapacité à garantir les indicateurs de performance spécifiés (en fait, la principale raison de choisir All Flash), ainsi que la difficulté de prendre en charge une large liste d'équipements. Par conséquent, la soi-disant appliance est présente sur le marché - des solutions complètes comprenant une plate-forme de serveur avec des logiciels préinstallés et configurés et équipés du nombre nécessaire de SSD, qui en général fournissent les performances spécifiées.


Les représentants de ce type de solution (SDS appliance) sont les héros de notre revue - Toutes les baies Flash d' AccelStor .


AccelStor - propre vision sur le travail d'All Flash


AccelStor a été créé en tant que startup en 2014. L'investisseur clé (essentiellement le propriétaire de ce projet) est le célèbre géant informatique Toshiba. Même avant le lancement commercial, la société a attiré l'attention en recevant les plus hautes récompenses lors de divers événements dédiés aux technologies Flash. L'un des meilleurs prix de leur liste a été décerné lors du très célèbre et prestigieux événement Flash Memory Summit (2016).



Prix ​​AccelStor


Tous ces prix ont été décernés pour une approche innovante de l'utilisation de la mémoire flash implémentée dans la technologie propriétaire FlexiRemap, que toutes les baies AccelStor NeoSapphire possèdent .


La technologie FlexiRemap est un algorithme spécial pour travailler avec les SSD afin de se débarrasser des goulots d'étranglement en termes de performances, ainsi que de maximiser la durée de vie des disques. L'idée principale est de convertir les demandes d'écriture aléatoires en chaînes séquentielles. C'est-à-dire les blocs de données reçus sont combinés en chaînes qui sont des multiples de «pages», et alors seulement sont écrits sur le SSD. En conséquence, cette approche de l'enregistrement de nouvelles données est cohérente du point de vue des disques, ce qui permet finalement d'atteindre des indicateurs de haute performance.


Dans le processus, l'algorithme FlexiRemap garde une trace de la demande pour tous les blocs de données. En fonction de la fréquence d'utilisation, les données sont automatiquement classées lors de l'écrasement afin que toutes les données "chaudes" soient situées le plus près possible les unes des autres. Ensuite, dans le processus de changement de blocs, ces données seront également déplacées vers de nouvelles «pages» ensemble, ce qui permettra à nouveau d'utiliser un mode d'enregistrement séquentiel plus productif sur SSD par rapport à l'approche traditionnelle. Ce mécanisme est similaire à une sorte d'appairage virtuel, qui, entre autres, accélère également la collecte des ordures, comme Le garbage collector fera également son travail en mode séquentiel.


Malgré le fait que le RAID n'est pas utilisé ici, les données sont toujours protégées. Pour ce faire, tous les SSD sont divisés en deux groupes symétriques. Toutes les E / S sont réparties uniformément sur les deux groupes (bande). En plus des données, chaque groupe contient des sommes de contrôle afin qu'il soit possible de continuer à travailler en cas de panne d'un lecteur. Au total, la baie peut résister à la défaillance de deux SSD, ce qui, par rapport au RAID, équivaut au niveau de RAID 50 de deux groupes.



Organisation d'un tableau de données


Lors de l'enregistrement, le mécanisme de répétition alternée est utilisé, grâce auquel les données sont réparties aussi uniformément que possible sur tous les disques. De plus, chaque SSD a son propre coefficient de poids, qui dépend de sa ressource d'enregistrement actuelle. Par conséquent, si un disque est plus usé que les autres, il sera moins susceptible de recevoir de nouvelles données jusqu'à ce que les indicateurs de ressources soient égaux. Par rapport à la méthode RAID traditionnelle, la technologie FlexiRemap peut augmenter considérablement la durée de vie des disques en raison de leur utilisation uniforme.



FlexiRemap vs RAID


Il convient de noter en particulier le mécanisme de conservation des données en cas de panne d'un lecteur. Dans ce cas, le groupe que le SSD a refusé est automatiquement mis en mode lecture seule. Cette opération est effectuée pour terminer le processus de reconstruction sur le disque de secours le plus rapidement possible. Une fois le groupe restauré, il peut à nouveau participer à tous les types d'opérations. De plus, le mécanisme précédemment décrit pour aligner la ressource d'enregistrement fonctionnera automatiquement.


En parlant de l'appliance SDS, vous devez comprendre qu'il s'agit essentiellement d'un serveur avec des logiciels préinstallés. Il s'agit donc a priori d'un seul contrôleur, exprimé en termes de systèmes de stockage. Et bien qu'un certain nombre de tâches nous permettent de ne pas recourir à des contrôleurs de système de stockage redondants, tous les fournisseurs de stockage nous ont longtemps appris que le système de stockage «correct» est le stockage avec deux (ou même plus) contrôleurs. AccelStor a également sa propre réponse à cela: la technologie Nothing Nothing pour deux nœuds d'un cluster.


Les modèles AccelStor NeoSapphire à deux nœuds peuvent être regroupés dans un seul package (basé sur des serveurs jumeaux) ou sous la forme de deux serveurs distincts. Ces derniers peuvent être répartis à une distance de 100 m les uns des autres pour créer une reprise après sinistre. Dans tous les cas, une connexion externe via InfiniBand 56G est utilisée pour synchroniser les données entre les nœuds avec un contrôle de fréquence cardiaque supplémentaire via Ethernet.



Organisation de la synchronisation entre les nœuds


Contrairement au stockage à double contrôleur habituel, non seulement les contrôleurs (nœuds) avec la liaison obligatoire sous la forme de modules de refroidissement et d'alimentations sont ici dupliqués, mais également les données elles-mêmes. Chaque nœud dans AccelStor NeoSapphire est complètement indépendant et contient une copie complète des données grâce à la réplication synchrone continue. Les deux nœuds fonctionnent en mode symétrique actif-actif sans utiliser de transfert de requête entre eux (ALUA), comme dans les systèmes de stockage classiques. Par conséquent, le temps de commutation en cas de panne de la part d'AccelStor tend vraiment à zéro. Et la présence de deux copies de données peut améliorer considérablement la fiabilité du système par rapport à l'architecture traditionnelle.


Poursuivant le sujet de la fiabilité, il convient de noter que les tableaux Accelstor ne mettent pas en cache les données pendant les opérations d'écriture, car travailler en mode synchrone. Toutes les actions intermédiaires sur cet algorithme FlexiRemap sont effectuées dans la RAM du contrôleur. Mais la baie ne donnera confirmation à l'hôte de la réussite de l'opération qu'après l'enregistrement physique sur le SSD. Par conséquent, les baies Accelstor All Flash ne disposent pas de batteries / condensateurs en raison de leur manque de nécessité.


Outre les technologies All Flash uniques, les baies AccelStor NeoSapphire ont également les fonctionnalités standard pour le marché des entreprises : approvisionnement léger, instantanés de redirection sur écriture avec la possibilité de les sauvegarder et de les restaurer via des dossiers CIFS / NFS externes, réplication asynchrone, compression et déduplication. Séparément, il convient de noter la fonction Free Clone pour créer des copies de volumes qui ne prennent pas physiquement de l'espace, car Ce sont essentiellement des liens vers le volume source. Cette fonctionnalité peut être très utile, par exemple, dans VDI.
Bien sûr, tous les systèmes d'exploitation et plates-formes de virtualisation modernes sont pris en charge. Il existe un plug-in pour VMware vSphere Web Client avec la possibilité de gérer les volumes et implémente pleinement les fonctionnalités de Free Clone.


Un avantage important d'Accelstor NeoSapphire en tant que stockage défini par logiciel est la possibilité de travailler sur un matériel x86 standard avec des SSD complètement standard. Oui, le fabricant ne donne pas de liberté pour choisir une plate-forme matérielle: il le fait pour vous. Cette opération est effectuée principalement pour garantir des performances prévisibles garanties de la solution, ainsi que pour éliminer les problèmes de compatibilité. Toutes les baies Accelstor All Flash sont assemblées pour un client spécifique dans la configuration dont elles ont besoin et subissent des tests rigoureux avant expédition. La garantie standard sur toutes les baies est de 3 ans de NBD avec des pièces de rechange avancées. Parce que le vendeur est présent sur le territoire de la Russie, le support technique est également disponible en russe.



Lorsque vous commandez une baie All Flash Accelstor NeoSapphire, vous pouvez sélectionner de manière flexible le volume requis. De plus, ce volume est ce qui est vraiment disponible pour que les hôtes fonctionnent, quelle que soit l'organisation physique de l'espace disque. Veuillez noter que tous les modèles sont entièrement chargés avec des disques. Il n'y a pas d'emplacements libres - vous ne pouvez pas ajouter de disques. Tout cela est dû aux mêmes exigences de performances et de fiabilité mentionnées précédemment. Si à l'avenir vous devez augmenter le volume, cela peut être fait en utilisant les étagères d'extension (disponibles pour les anciens modèles). Il est également nécessaire de déterminer à l'avance le nombre de nœuds (contrôleurs) qui seront dans le tableau, car La mise à niveau vers le mode bimode actuel n'est pas fournie.


En tant qu'interfaces pour tous les modèles, un choix de 10G iSCSI ou 16G Fibre Channel est disponible. En option, il peut également y avoir un InfiniBand 56G. Pour les modèles iSCSI, en plus de bloquer l'accès, le bonus est la prise en charge des protocoles de fichiers CIFS et NFS. Le nombre de ports est déterminé par les performances du système donné afin qu'ils ne constituent pas un goulot d'étranglement (généralement 2 à 6 ports par nœud).


En tant que lecteurs, des SSD de classe entreprise standard sont utilisés. Le plus souvent avec l'interface SATA, comme il n'est pas nécessaire de travailler avec deux contrôleurs. Il existe également des modèles de tableaux All Flash basés sur des disques NVMe.


L'utilisation de plates-formes de serveurs standard et de disques SSD peut optimiser considérablement le coût de la solution dans son ensemble. Dans le même temps, AccelStor fournit un service en son nom propre pour l'ensemble de la solution, quels que soient les composants dont le fabricant fait partie de la baie.


Et, oui, un point extrêmement important: pas de licences payantes! Toutes les fonctionnalités sont immédiatement disponibles «prêtes à l'emploi». De plus, si la fonctionnalité est étendue, de nouvelles fonctionnalités seront disponibles lors de la mise à jour du firmware.


Vérification en entreprise


AccelStor dispose d'une large gamme de modèles avec différentes performances déclarées. Le plus petit NeoSapphire 3401 avec 8 SSD peut fournir 300K IOPS @ 4K. Et le P710 haut de gamme avec 24 SSD produit déjà 700K IOPS @ 4K. Comme pour les modèles NVMe, les mêmes performances de 700K IOPS @ 4K sont atteintes dans le NeoSapphire P310 avec seulement 8 SSD! Et notez que les valeurs de performance indiquées sont un enregistrement en mode établi (lecture et toutes sortes de valeurs de crête ci-dessus), c'est-à-dire dans le mode de fonctionnement le plus lourd de la baie.


Nous avons testé un système NeoSapphire H710 à deux avec 48 SSD (24 SSD dans chaque nœud) avec une capacité disponible de 27 To. Accelstor déclare que les performances de ce modèle ne sont pas inférieures à 600K IOPS 4K, écriture aléatoire. Les tests ont été effectués dans IOmeter à partir de trois serveurs connectés via Fibre Channel.



Dans tous les tests synthétiques Flash, le tableau s'est avéré encore meilleur que promis dans la spécification, qui, à notre avis, n'est qu'un avantage sur le segment de marché, où tous les indicateurs sont remis en question (grâce aux spécialistes du marketing arrachés à la réalité pour cela!).


Il est important de noter que l'un des principaux avantages de l'algorithme FlexiRemap est sa haute performance en mode enregistrement sans dégradation dans le temps. C'est-à-dire l'indicateur atteint dans le mode établi sera le même après 10min / heure / ... de fonctionnement continu. Pour confirmer ce fait, nous avons effectué le test IOmeter (4K, écriture aléatoire à 100%) pendant plusieurs heures (un hôte a été utilisé). Oui, c'est vrai: les performances ne changent presque pas avec le temps.



Le verdict


Lors du choix d'une baie All Flash, par défaut, la plupart des utilisateurs préfèrent considérer les systèmes de stockage traditionnels équipés de SSD comme candidats. Et si les performances ~ 280K IOPS (4K, écriture aléatoire) vous conviennent, alors vous pensez dans la bonne direction. Ce ne sont que des tâches commerciales qui exigent de plus en plus que l'équipement fonctionne à 146%. Et avec un système de stockage conventionnel, hélas, ils ne sauteront pas au-dessus de leurs têtes, et certains IBM Flash System coûtent très cher. Et ici, tous les tableaux Flash AccelStor seront les bienvenus. Performances décentes, haute fiabilité, choix de configuration flexible et support technique adéquat - ce n'est pas une liste complète des avantages de ces baies. Ajoutez à cela l'absence totale de frais cachés pour les licences et l'utilisation plus longue des SSD - et vous obtiendrez non seulement un produit intéressant, mais un outil valable dans votre entreprise.


Ainsi, AccelStor a déjà eu lieu sous le soleil sur le marché des baies ultra-rapides va inévitablement se développer. Et qui sait quels sommets ils peuvent atteindre.


Source: https://habr.com/ru/post/fr437210/


All Articles