Réduisez les risques de temps d'arrêt avec l'architecture Shared Nothing

Le thème de la tolérance aux pannes dans les systèmes de stockage de données est toujours d'actualité, car dans notre siècle de virtualisation omniprésente et de consolidation des ressources de stockage, le stockage est le lien dont la défaillance entraînera non seulement un accident ordinaire, mais aussi une longue interruption des services. Par conséquent, les systèmes de stockage modernes intègrent de nombreux composants dupliqués (jusqu'aux contrôleurs). Mais cette protection est-elle suffisante?




Absolument tous les fournisseurs, énumérant les caractéristiques des systèmes de stockage, mentionnent toujours la haute tolérance aux pannes de leurs solutions, sans faute d'ajouter le terme «sans un seul point de défaillance». Examinez de plus près un système de stockage typique. Pour éliminer les interruptions de service, les alimentations, les modules de refroidissement, les ports d'E / S, les disques (c'est-à-dire RAID) et, bien sûr, les contrôleurs sont dupliqués dans le système de stockage. Si vous regardez attentivement cette architecture, vous remarquerez au moins deux points de défaillance potentiels, qui sont modestement silencieux sur:


  1. La présence d'un seul fond de panier (fond de panier)
  2. Une copie des données

Backplein est un appareil techniquement sophistiqué qui doit subir des tests rigoureux en production. Et donc, il y a des cas extrêmement rares où il échoue complètement. Cependant, même en cas de dysfonctionnements partiels, tels qu'un emplacement de lecteur non fonctionnel, il sera nécessaire de le remplacer par un arrêt complet du système de stockage.


La création de plusieurs copies des données n'est pas non plus un problème à première vue. Ainsi, par exemple, la fonctionnalité Clone dans les systèmes de stockage, qui permet de mettre à jour une copie complète des données avec une certaine périodicité, est assez répandue. Cependant, en cas de problème avec le même fond de panier, la copie sera aussi inaccessible que l'original.


Une solution tout à fait évidente pour surmonter ces lacunes est la réplication vers un autre système de stockage. Si nous fermons les yeux sur le doublement attendu du coût du matériel (néanmoins, nous supposons que les personnes qui choisissent une telle solution pensent et acceptent ce fait à l'avance), il y aura toujours des frais possibles pour organiser la réplication sous forme de licences, de logiciels et de matériel supplémentaires. Et le plus important - vous devez en quelque sorte assurer la cohérence des données répliquées. C'est-à-dire construire un virtualiseur de stockage / vSAN / etc., qui nécessite également des ressources en argent et en temps.


AccelStor, lors de la création de ses systèmes à haute disponibilité, a cherché à éliminer les inconvénients ci-dessus. Il y a donc eu une interprétation de la technologie Shared Nothing, qui dans une traduction gratuite signifie «sans utiliser d'appareils communs».


Le concept d'architecture Nothing Nothing est l'utilisation de deux nœuds indépendants (contrôleurs), chacun ayant son propre ensemble de données. Entre les nœuds, la réplication synchrone via l'interface InfiniBand 56G est rendue absolument transparente pour les logiciels s'exécutant au-dessus du système de stockage. Par conséquent, l'utilisation de virtualiseurs de stockage, d'agents logiciels, etc. n'est pas requise.


Physiquement, la solution à deux solutions AccelStor peut être implémentée dans deux modèles:


  • H510 - basé sur des serveurs jumeaux dans un boîtier 2U, si des performances et une capacité modérées jusqu'à 22 To sont requises;
  • H710 - basé sur des serveurs 2U séparés, si des performances élevées et une capacité élevée (jusqu'à 57 To) sont requises.


Modèle de serveur double H510



Modèle H710 basé sur des serveurs séparés


L'utilisation de différents facteurs de forme est due à la nécessité d'un nombre différent de SSD pour atteindre un volume et des performances donnés. De plus, la plate-forme Twin est moins chère et vous permet d'offrir des solutions plus abordables, mais avec un "inconvénient" conditionnel sous la forme d'un seul fond de panier. Tout le reste, y compris les principes de fonctionnement, est complètement identique pour les deux modèles.


L'ensemble de données pour chaque nœud a deux groupes FlexiRemap , plus 2 disques de rechange. Chaque groupe est capable de résister à la panne d'un SSD. Conformément à l' idéologie, FlexiRemap reconstruit toutes les demandes entrantes d'enregistrement d'un nœud en chaînes séquentielles avec des blocs 4K, qui sont ensuite écrits sur le SSD dans le mode le plus confortable pour eux (enregistrement séquentiel). De plus, l'hôte ne confirme l'enregistrement qu'après le placement physique des données sur le SSD, c'est-à-dire sans mise en cache dans la RAM. Le résultat est une performance très impressionnante allant jusqu'à 600K IOPS pour l'écriture et 1M + IOPS pour la lecture (modèle H710).


Comme mentionné précédemment, la synchronisation de l'ensemble de données se produit en temps réel via l'interface InfiniBand 56G, qui a une bande passante élevée et une faible latence. Afin de maximiser l'utilisation du canal de communication lors de la transmission de petits paquets. Parce que il n'y a qu'un seul canal de communication; pour une vérification d'impulsion supplémentaire, une liaison 1GbE dédiée est utilisée. Seul le rythme cardiaque est transmis à travers lui, il n'y a donc aucune exigence pour les caractéristiques de vitesse.


Si la capacité du système est augmentée (jusqu'à 400 + To) en raison des étagères d'extension, elles sont également connectées par paires pour respecter le concept «sans un seul point de défaillance».


Pour une protection supplémentaire des données (outre le fait qu'AccelStor possède déjà deux copies), un algorithme de comportement spécial est utilisé en cas de panne de tout SSD. Si le SSD tombe en panne, le nœud commencera à reconstruire les données sur l'un des disques de secours. Un groupe FlexiRemap qui est dans un état dégradé passera en mode lecture seule. Ceci est fait pour éliminer l'interférence des opérations d'écriture et de reconstruction sur le disque de sauvegarde, ce qui accélère finalement le processus de récupération et réduit le temps où le système est potentiellement vulnérable. Une fois la reconstruction terminée, le nœud repasse en mode lecture-écriture normal.



Bien sûr, comme avec d'autres systèmes, pendant la reconstruction, les performances globales diminuent (après tout, l'un des groupes FlexiRemap ne fonctionne pas sur l'enregistrement). Mais le processus de récupération lui-même est aussi rapide que possible, ce qui distingue les systèmes AccelStor des solutions d'autres fournisseurs.


Une autre caractéristique utile de la technologie Nothing Shared est le fonctionnement des nœuds dans le soi-disant vrai mode actif-actif. Contrairement à l'architecture «classique», où un seul contrôleur possède un volume / pool spécifique et le second effectue simplement des opérations d'entrée / sortie, dans les systèmes AccelStor , chaque nœud fonctionne avec son propre ensemble de données et ne transmet pas de requêtes au «voisin». En conséquence, les performances globales du système sont améliorées en raison du traitement parallèle des demandes d'entrée / sortie par les nœuds et de l'accès aux disques. De plus, le basculement n'existe pas, car vous n'avez tout simplement pas besoin de transférer le contrôle du volume vers un autre nœud en cas de panne.


Si nous comparons la technologie de l'architecture Nothing Shared avec une duplication complète du stockage, alors, à première vue, elle sera légèrement inférieure à la mise en œuvre complète de la reprise après sinistre en termes de flexibilité. Cela est particulièrement vrai pour l'organisation de la ligne de communication entre les systèmes de stockage. Ainsi, dans le modèle H710, il est possible d'étaler les nœuds à une distance de 100 m en raison de l'utilisation de câbles optiques actifs InfiniBand pas si bon marché. Mais même si elle est comparée à la mise en œuvre habituelle de la réplication synchrone d'autres fournisseurs via le FibreChannel disponible, même à de plus grandes distances, la solution d'AccelStor sera moins chère et plus facile à installer / utiliser, car il n'est pas nécessaire d'installer des virtualiseurs de stockage et / ou de les intégrer au logiciel (ce qui est loin d'être toujours possible en principe). De plus, n'oubliez pas que les solutions AccelStor sont des baies 100% Flash avec des performances supérieures à celles des systèmes de stockage «classiques» avec SSD uniquement.



Lorsque vous utilisez la technologie Nothing Shared d'AccelStor, il est réaliste d'obtenir une disponibilité du système de stockage de 99,9999% à un coût très raisonnable. Associées à une grande fiabilité de la solution, notamment grâce à l'utilisation de deux copies de données, et à des performances impressionnantes grâce aux algorithmes FlexiRemap propriétaires, les solutions AccelStor sont d'excellents candidats pour des postes clés dans la construction d'un centre de données moderne.

Source: https://habr.com/ru/post/fr441780/


All Articles