Dentro de IBM FlashSystem 900

La familia IBM FlashSystem es el resultado de años de desarrollo e inversión de $ 1 mil millones en tecnología flash. La estructura interna de las AFA es a menudo el secreto comercial más estricto. Los fabricantes, por regla general, se centran en el marketing (qué tan rápido se procesarán los datos, velocidad de escritura / lectura, confiabilidad), pero no revelan detalles de la estructura de los sistemas.



No hace mucho tiempo, IBM brindó la oportunidad de considerar los componentes de su FlashSystem 900, que funciona como un dispositivo independiente y proporciona 1 millón / 600,000 IOPS para lectura / escritura aleatoria y 10.5 / 4.5 Gb / s E / S para lectura / escritura secuencial. FlashSystem 900 también sirve como componente en sistemas más grandes de los mismos AFA de IBM, FlashSystem V9000 y A9000. Por lo tanto, la familiarización con FlashSystem 900 le permite ver la diferencia entre un componente y un sistema más grande creado a partir de estos componentes.

La evolución de los arreglos flash


Los arreglos flash han evolucionado a lo largo de varios años, pero comenzaron con el uso de SSD convencionales con un factor de forma estándar de 2.5 pulgadas, que se conectaron a sistemas de almacenamiento diseñados para unidades HDD. El uso de SSD permitió acelerar significativamente el sistema en comparación con HDD. Pero esto no resolvió el problema por completo, los cuellos de botella simplemente llegaron a otros componentes de la matriz (controlador RAID o interfaz de red).

Los pioneros de los arreglos flash comenzaron a desarrollar dispositivos SSD optimizados con componentes internos más rápidos y canales de transferencia de datos optimizados, mientras que las necesidades de los centros de datos solo estaban creciendo. La mayoría de los fabricantes de AFA todavía usan 2.5 SSD. Los últimos AFA basados ​​en SSD 2.5 proporcionan a los usuarios un alto rendimiento y tolerancia a fallas, pero las capacidades de tales SSD son limitadas debido al firmware de fábrica.

Otros fabricantes, como IBM, XtremIO (EMC) y Violin, han creado sus propios AFA utilizando módulos flash especialmente diseñados. Estos nuevos productos brindan la capacidad de controlar NAND, lo que a su vez le brinda la capacidad de controlar la densidad de datos, el rendimiento, la durabilidad y la economía.

IBM FlashSystem 900


FlashSystem 900 es un chasis de 2U que admite 12 módulos MicroLatency intercambiables en caliente, como se muestra en la imagen a continuación. Además, el sistema tiene dos grandes baterías de iones de litio (izquierda) que proporcionan suficiente energía para completar el proceso de grabación en caso de falla de la fuente de alimentación principal. Las baterías proporcionan suficiente energía para apagar la matriz correctamente y sin pérdida de datos.



Cada módulo MicroLatency puede contener una memoria flash de 1.2 TB, 2.9 TB o 5.7 TB. A su vez, el sistema registra datos a través de un módulo. Los módulos en sí están configurados en RAID 5 para garantizar la máxima seguridad de los datos en caso de falla de uno de los módulos. IBM también utiliza su propia ruta variable RAID de nivel de flash para crear un esquema de control de paridad bidimensional.



Cada módulo MicroLatency tiene un diseño de PCB doble con Xilinx Kintex-7 FDA. Cada placa de circuito puede acomodar hasta cuatro FPGA, pero el número de FPGA varía según la densidad del módulo. Por ejemplo, un módulo de 1.2 TB usará solo un FPGA en una sola placa de circuito. El uso de la arquitectura multi-FPGA le permite a IBM escalar el rendimiento y la potencia linealmente.



Una mirada más cercana a la parte posterior de la placa revela dos conexiones PCIe 3.0 x2 en el lado izquierdo. Estas ranuras se utilizan para conectarse al host y comunicarse mediante el protocolo serie patentado por IBM. El protocolo proporciona ventajas similares de NVM Express: carga reducida del procesador, latencia, rendimiento mejorado. El protocolo propietario utiliza una ruta de datos acelerada por hardware con enrutamiento de extremo a extremo para eliminar procesos que causan demoras, como interrupciones.



Cada FPGA tiene su propia DRAM para la administración de LBA, e IBM también usa DRAM para almacenar en caché los datos del usuario.
La mayoría de los SSD no almacenan en caché los datos del usuario en DRAM, pero el enfoque para proteger la pérdida de energía a nivel del sistema (a través de las baterías) proporciona a IBM varias ventajas. Los SSD individuales utilizados en FlashSystem 900 no requieren condensadores especiales que usen SSD normales de 2.5 pulgadas. Esto permite a la compañía empaquetar más memoria flash en el proyecto. Menos condensadores también reducen los posibles puntos de falla y la complejidad del software.

Todavía se encuentran varios condensadores entre los paquetes de memoria flash, pero se usan para combatir la caída de voltaje cuando el sistema escribe en varios paquetes NAND al mismo tiempo.



IBM ha forjado una asociación estratégica con Micron para aprovechar FortisFlash NAND, que es personalizable y proporciona capacidades avanzadas de programación del sistema. Esto le permite a IBM cambiar dinámicamente la programación central de cada unidad a lo largo de su vida útil NAND, según la edad y el estado de salud. Micron señaló que con la configuración adecuada, el FortisFlash NAND MLC puede ofrecer hasta 10,000 ciclos de reescritura (más de tres veces la calificación estándar de 3,000 ciclos).

Existen muchas variedades diferentes de ECC, como BCH y LDPC, y cada una tiene sus propias ventajas y desventajas. Los proveedores de AFA que usan una SSD de 2.5 pulgadas están limitados a ECC, solo pueden usar la unidad SSD instalada por el fabricante. Pero el diseño personalizado proporciona la flexibilidad para usar algoritmos ECC personalizados.

IBM ha desarrollado su propio algoritmo ECC. Esta implementación fluctúa entre BCH, que es un método intensivo pero tiene capacidades limitadas de corrección de errores, y LDPC, que puede sufrir una amplificación de grabación excesiva durante el proceso de corrección de errores (reduciendo así la resistencia al desgaste). IBM cree que la corrección de errores personalizada "leer una vez" incluye lo mejor de ambos métodos.

IBM también utiliza la segregación de calor, que detecta datos fríos y calientes y luego los combina para reducir el desgaste. La compañía rastrea dinámicamente el número restante de posibles sobrescrituras de cada celda, por lo que rara vez los datos "en frío" cambiados se almacenan en celdas NAND más antiguas. Debido a que se mantiene la resistencia al desgaste. IBM afirma que el aislamiento térmico aumenta la resistencia en un 49 por ciento, y la adición de nivelación de desgaste selectiva (basada en la salud NAND) aumenta la resistencia en un 57 por ciento.



Cada chasis de 2U contiene dos fuentes de alimentación redundantes justo detrás del panel frontal de la batería intercambiable en caliente disponible. El sistema tiene cuatro ventiladores modulares intercambiables en caliente ubicados en dos recipientes de bloques grandes (izquierda). Cada uno de ellos tiene varios puertos de E / S (Fibre Channel, rangos iSCSI y FCoE) en la parte superior, que se encuentran en las tarjetas de interfaz intercambiables en caliente.



Cada recipiente contiene dos procesadores de la serie Intel Xeon E5v2, 64 GB de RAM y un controlador RAID (XBAR). Los recipientes también son intercambiables en caliente para minimizar el tiempo de inactividad en caso de falla en una parte calculada del sistema o la memoria. El diseño en sí está optimizado para proporcionar un máximo de dos saltos y nunca más desde los puertos de entrada / salida de datos hasta la memoria flash, lo que garantiza un rendimiento estable y una latencia de acero.

Mayor relevancia.


IBM adquirió Texas Memory Systems en 2012 e hizo una inversión adicional de $ 1 mil millones en tecnología flash en 2013. Esto permitió a la compañía desarrollar arreglos flash individuales que tienen un mayor rendimiento y confiabilidad que los arreglos flash típicos que usan 2.5 SSD. IBM afirma que la familia FlashSystem proporciona un 9,41 por ciento más de resistencia que las soluciones de la competencia y le proporciona una garantía de siete años. Los especialistas de IBM pueden aumentar la densidad de memoria en sus módulos MicroLatency, que brindan protección contra la pérdida de energía en todo el sistema. Pueden hacerlo utilizando su propia interfaz en serie controlada por hardware que elimina los retrasos causados ​​por el software. La compañía desarrolló su propia arquitectura,para proporcionar una variedad de beneficios, como ECC personalizados y algoritmos adaptativos NAND, que brindan grandes beneficios para el usuario final en términos de densidad, rendimiento y costo.

IBM no es la única compañía en la carrera de unidades flash. EMC introdujo recientemente una línea completa de dispositivos flash, algunos de los cuales usaban diseños SSD personalizados. La compañía está convirtiendo todos sus sistemas de almacenamiento al uso de memoria flash. Pure Storage también tiene una prometedora iniciativa FlashBlade, pero la plataforma todavía no está disponible en el mercado en este momento. Violin Memory también tiene un proyecto individual, pero su bajo rendimiento y sus sombrías perspectivas disuaden a muchos de usar esta solución.

IBM se encuentra entre los principales proveedores de AFA en términos de rendimiento, pero de ninguna manera es el primero en ingresos. La compañía afirma que en el resultado final de un proyecto individual, ofrecerán un mayor rendimiento flash a un costo menor que los competidores.

Está claro que el futuro basado en la tecnología flash traerá proyectos aún más especializados y optimizados. Probablemente, esto conducirá a la muerte de muchos sistemas (y compañías) que usan SSD comercializados de 2.5 pulgadas.

Source: https://habr.com/ru/post/es395715/


All Articles