À l'intérieur d'IBM FlashSystem 900
La famille IBM FlashSystem est le résultat d'années de développement et d'investissement de 1 milliard de dollars dans la technologie flash. La structure interne des AFA est souvent le secret commercial le plus strict. En règle générale, les fabricants se concentrent sur le marketing (vitesse de traitement des données, vitesse d'écriture / lecture, fiabilité), mais ils ne divulguent pas les détails de la structure des systèmes.
Il n'y a pas si longtemps, IBM a fourni l'opportunité de considérer les composants de son FlashSystem 900, qui fonctionne comme un périphérique autonome et fournit 1 million / 600 000 IOPS pour la lecture / écriture aléatoire et 10,5 / 4,5 Gb / s d'E / S pour la lecture / écriture séquentielle. FlashSystem 900 sert également de composant dans des systèmes plus grands des mêmes AFA IBM, FlashSystem V9000 et A9000. Par conséquent, la familiarisation avec FlashSystem 900 vous permet de voir la différence entre un composant et un système plus grand créé à partir de ces composants.L'évolution des baies flash
Les baies flash ont évolué au fil des ans, mais elles ont commencé avec l'utilisation de SSD conventionnels avec un facteur de forme standard de 2,5 pouces, qui étaient connectés à des systèmes de stockage conçus pour les disques durs. L'utilisation de SSD a permis d'accélérer considérablement le système par rapport au HDD. Mais cela n'a pas résolu le problème complètement, des goulots d'étranglement ont simplement erré dans d'autres composants de la matrice (contrôleur RAID ou interface réseau).Les pionniers des baies flash ont commencé à développer des dispositifs SSD optimisés avec des composants internes plus rapides et des canaux de transfert de données optimisés, alors que les besoins des centres de données ne faisaient que croître. La plupart des fabricants AFA utilisent toujours 2,5 SSD. Les derniers AFA basés sur 2,5 SSD offrent aux utilisateurs des performances élevées et une tolérance aux pannes, mais les capacités de ces SSD sont limitées en raison du firmware d'usine.D'autres fabricants, comme IBM, XtremIO (EMC) et Violin, ont créé leurs propres AFA à l'aide de modules flash spécialement conçus. Ces nouveaux produits offrent la possibilité de contrôler la NAND elle-même, ce qui vous donne à son tour la possibilité de contrôler la densité des données, les performances, la durabilité et l'économie.IBM FlashSystem 900
Le FlashSystem 900 est un châssis 2U pouvant accueillir 12 modules MicroLatency remplaçables à chaud, comme indiqué dans l'image ci-dessous. De plus, le système dispose de deux grandes batteries lithium-ion (à gauche) qui fournissent suffisamment de puissance pour terminer le processus d'enregistrement en cas de panne de la source d'alimentation principale. Les batteries fournissent suffisamment d'énergie pour arrêter la baie correctement et sans aucune perte de données.
Chaque module MicroLatency peut contenir une mémoire flash de 1,2 To, 2,9 To ou 5,7 To. À son tour, le système enregistre les données via un module. Les modules eux-mêmes sont configurés en RAID 5 pour assurer une sécurité maximale des données en cas de panne de l'un des modules. IBM utilise également son propre chemin de variable RAID de niveau flash pour créer un schéma de contrôle de parité à deux dimensions.
Chaque module MicroLatency a une conception à double PCB avec Xilinx Kintex-7 FDA. Chaque carte de circuit imprimé peut accueillir jusqu'à quatre FPGA, mais le nombre de FPGA varie en fonction de la densité du module. Par exemple, un module de 1,2 To n'utilisera qu'un seul FPGA sur une seule carte de circuit imprimé. L'utilisation d'une architecture multi-FPGA permet à IBM de faire évoluer les performances et la puissance de manière linéaire.
Un examen plus approfondi à l'arrière de la carte révèle deux connexions PCIe 3.0 x2 sur le côté gauche. Ces emplacements sont utilisés pour se connecter à l'hôte et communiquer en utilisant le protocole série breveté par IBM. Le protocole offre des avantages similaires à NVM Express: charge processeur réduite, latence, performances améliorées. Le protocole propriétaire utilise un chemin de données accéléré par le matériel avec un routage de bout en bout pour éliminer les processus entraînant des retards tels que les interruptions.
Chaque FPGA possède sa propre DRAM pour la gestion LBA, et IBM utilise également la DRAM pour mettre en cache les données utilisateur.La plupart des SSD ne mettent pas en cache les données utilisateur dans la DRAM, mais l'approche de protection de la perte d'alimentation au niveau du système (via des batteries) offre à IBM plusieurs avantages. Les SSD individuels utilisés dans le FlashSystem 900 ne nécessitent pas de condensateurs spéciaux qui utilisent des SSD ordinaires de 2,5 pouces. Cela permet à l'entreprise d'intégrer davantage de mémoire flash dans le projet. Moins de condensateurs réduisent également les points de défaillance potentiels et la complexité logicielle.Plusieurs condensateurs sont toujours situés entre les paquets de mémoire flash, mais ils sont utilisés pour combattre la chute de tension lorsque le système écrit sur plusieurs paquets NAND en même temps.
IBM a forgé un partenariat stratégique avec Micron pour tirer parti de FortisFlash NAND, qui est personnalisable et offre des capacités de programmation système avancées. Cela permet à IBM de modifier dynamiquement la programmation de base de chaque unité tout au long de sa vie NAND, en fonction de l'âge et de la santé. Micron a souligné qu'avec une configuration appropriée, le FortisFlash NAND MLC peut offrir jusqu'à 10 000 cycles de réécriture (plus de trois fois la norme de 3000 cycles).Il existe de nombreuses variétés différentes d'ECC, telles que BCH et LDPC, et chacune a ses propres avantages et inconvénients. Les fournisseurs AFA qui utilisent un SSD de 2,5 pouces sont limités à ECC, ils ne peuvent utiliser que le disque SSD installé par le fabricant. Mais la conception personnalisée offre la flexibilité d'utiliser des algorithmes ECC personnalisés.IBM a développé son propre algorithme ECC. Cette implémentation oscille entre BCH, qui est une méthode intensive mais qui a des capacités de correction d'erreur limitées, et LDPC, qui peut subir une amplification d'enregistrement excessive pendant le processus de correction d'erreur (réduisant ainsi la résistance à l'usure). IBM estime que la correction d'erreur personnalisée «à lecture unique» inclut la meilleure des deux méthodes.IBM utilise également la séparation thermique, qui détecte les données chaudes et froides, puis les combine pour réduire l'usure. La société suit dynamiquement le nombre restant de remplacements possibles de chaque cellule, de sorte que les données «froides» rarement modifiées sont stockées dans des cellules NAND plus anciennes. Grâce à laquelle la résistance à l'usure est maintenue. IBM affirme que l'isolation thermique augmente l'endurance de 49%, et l'ajout d'un nivellement sélectif de l'usure (basé sur la santé NAND) augmente l'endurance de 57%.
Chaque châssis 2U contient deux blocs d'alimentation redondants situés juste derrière le panneau avant de la batterie remplaçable à chaud disponible. Le système dispose de quatre ventilateurs modulaires remplaçables à chaud situés dans deux grands bacs à blocs (à gauche). Chacun d'eux possède un certain nombre de ports d'E / S (plages Fibre Channel, iSCSI et FCoE) en haut, qui sont situés sur les cartes d'interface remplaçables à chaud.
Chaque cartouche contient deux processeurs de la série Intel Xeon E5v2, 64 Go de RAM et un contrôleur RAID (XBAR). Les cartouches sont également remplaçables à chaud pour minimiser les temps d'arrêt en cas de défaillance d'une partie calculée du système ou de la mémoire. La conception elle-même est optimisée pour fournir un maximum de deux sauts et plus jamais des ports d'entrée / sortie de données à la mémoire flash, ce qui garantit des performances stables et une latence en acier.Une pertinence plus large.
IBM a acquis Texas Memory Systems en 2012 et a réalisé un investissement supplémentaire de 1 milliard de dollars dans la technologie flash en 2013. Cela a permis à l'entreprise de développer des baies flash individuelles qui ont des performances et une fiabilité supérieures à celles des baies flash classiques utilisant des disques SSD de 2,5. IBM affirme que la famille FlashSystem offre 9,41% plus d'endurance que les solutions concurrentes et lui offre une garantie de sept ans. Les spécialistes IBM peuvent augmenter la densité de la mémoire dans leurs modules MicroLatency, qui offrent une protection contre les coupures de courant dans tout le système. Ils peuvent le faire en utilisant leur propre interface série, contrôlée par le matériel, qui élimine les retards causés par le logiciel. L'entreprise a développé sa propre architecture,pour fournir une gamme d'avantages, tels que des algorithmes ECC personnalisés et NAND adaptatifs, qui offrent de grands avantages pour l'utilisateur final en termes de densité, de performances et de coût.IBM n'est pas la seule entreprise dans la course aux lecteurs flash. EMC a récemment introduit une gamme complète de périphériques flash, dont certains utilisent des conceptions SSD personnalisées. L'entreprise convertit entièrement tous ses systèmes de stockage à l'utilisation de la mémoire flash. Pure Storage a également une initiative FlashBlade prometteuse, mais la plate-forme n'est toujours pas disponible sur le marché pour le moment. Violin Memory a également un projet individuel, mais ses performances médiocres et ses perspectives sombres dissuadent beaucoup d'utiliser cette solution.IBM est parmi les meilleurs fournisseurs d'AFA en termes de performances, mais en aucun cas le premier en termes de revenus. La société affirme que le résultat final d'un projet individuel offrira des performances flash supérieures à un coût inférieur à celui de ses concurrents.Il est clair que l'avenir basé sur la technologie flash apportera des projets encore plus spécialisés et optimisés. Probablement - cela entraînera la mort de nombreux systèmes (et entreprises) qui utilisent des SSD 2,5 pouces commercialisés. Source: https://habr.com/ru/post/fr395715/
All Articles