🙌🏿 🅾️ 😼 AccelStor: visión propia sobre el trabajo de All Flash ⏩ 🤾🏼 ✊🏽

Actualmente, las unidades flash ocupan cada vez más el nicho de los medios de almacenamiento en el segmento empresarial. Esto se ve facilitado por una reducción significativa en su costo y un aumento en la capacidad de las unidades individuales. Donde, hasta hace poco, solo se usaban discos duros mecánicos, los SSD ahora se explotan activamente. Y estamos hablando no solo de unidades internas en sistemas cliente, sino también del subsistema de disco de servidores y sistemas de almacenamiento de datos. Y en este segmento, las configuraciones de los sistemas de almacenamiento ocupan un lugar separado, donde solo se utilizan SSD como medios de almacenamiento. Estos son los llamados sistemas All Flash.

En primer lugar, debe comprender por sí mismo qué es el sistema de almacenamiento All Flash. Está claro que el nombre implica el uso de solo unidades Flash en él. Sin embargo, no todos los sistemas All Flash son iguales. Convencionalmente, se pueden dividir en tres subespecies.

1. Almacenamiento tradicional usando SSD

De hecho, este es el tipo más numeroso de sistemas de almacenamiento All Flash. Porque para el fabricante no hay nada más fácil que equipar su almacenamiento existente con unidades SSD. Por supuesto, los principales proveedores, además de volver a pegar las placas de identificación (almacenamiento All Flash), también se dedican a la optimización de firmware adicional para la conveniencia de trabajar con SSD y aumentar la velocidad del sistema en su conjunto. Pero hay quienes no se molestan particularmente y solo ofrecen paquetes que consisten en almacenamiento regular y un conjunto de SSD. Como resultado, puede encontrar ofertas en el mercado, que van desde All Flash NAS Qnap (omitimos la discusión sobre la viabilidad de esta solución, pero, de hecho, ¡All Flash no tiene fallas!) Hasta el monstruoso Netapp FAS multijugador.

La principal ventaja de tal solución es, sobre todo, un costo moderado. Por supuesto, cada proveedor tiene su propio recargo para la marca, pero en general, el precio de un sistema All Flash (hablando de la "cabeza" con controladores) no difiere mucho en comparación con el sistema de almacenamiento clásico (en comparación con el costo de un SSD, es realmente un centavo).

La desventaja es el bajo rendimiento general de la solución. Todos los sistemas All Flash similares con hardware moderno en el interior producen aproximadamente 300K IOPS (4K, 100% aleatorio), consideramos el modo de grabación porque es mucho más difícil de almacenar que leer. Los indicadores de lectura son, por supuesto, mucho más altos ) Una fuerte desviación negativa de este valor es más bien una falla grave en el firmware, y los indicadores de rendimiento más altos indican mejores algoritmos de almacenamiento en caché y / o optimización de firmware para modelos SSD específicos. En cualquier caso, la "saturación" ocurre incluso con el número de discos ~ 10-20. Por lo tanto, la adición adicional de discos solo aumentará la capacidad de almacenamiento disponible, pero no la velocidad de trabajo.

La razón principal de esta limitación de rendimiento es el uso de algoritmos RAID clásicos. Estos algoritmos se desarrollaron hace mucho tiempo para trabajar con discos duros mecánicos y no tienen en cuenta las características del funcionamiento de las unidades de estado sólido. Después de todo, un SSD, a diferencia de un HDD, no puede simplemente sobrescribir un bloque de datos. Necesita reescribir toda la página que contiene el bloque para cambiarla a una nueva ubicación y liberar el lugar anterior para una nueva grabación posterior. Estas circunstancias, además de la penalización RAID estándar, proporcionan una gran sobrecarga para las operaciones de reescritura.

2. Todos los arreglos Flash con hardware propietario

Para superar los cuellos de botella de los sistemas de almacenamiento tradicionales, es necesario utilizar una arquitectura de hardware y software completamente diferente. Un ejemplo de tales soluciones son los productos Pure Storage o IBM Flash System. No tienen RAID en el sentido habitual (paridad, por supuesto, hay tolerancia a fallos), ni como tales SSD (en lugar de ellos hay sus propias "unidades"). El resultado es simplemente un rendimiento loco y tasas de latencia especialmente bajas. Pero el costo ... De hecho, como un ala de un avión.

3. Almacenamiento definido por software

Además de todo este "zoológico" de todos los arreglos Flash, se encuentra el almacenamiento definido por software (SDS). SDS es un software que se ejecuta en hardware x86 normal y emula sistemas de almacenamiento. No en vano usamos este término entre comillas, porque Actualmente, la frontera entre los controladores de hardware y software es muy arbitraria, a diferencia de los viejos tiempos. Los sistemas de almacenamiento modernos utilizan con mayor frecuencia la arquitectura estándar x86 que ejecuta sistemas operativos similares a Linux. Sí, se pueden usar controladores de descarga adicionales para algunas operaciones. Pero la principal diferencia de SDS es la naturaleza cerrada tanto del hardware como del software para el usuario. SDS, por el contrario, le permite utilizar casi cualquier hardware recomendado y realizar modificaciones moderadas en los componentes del software.

Sin embargo, si usa SDS no solo como un sistema de almacenamiento, sino como una matriz All Flash, entonces es incorrecto darle al usuario la libertad de elegir una plataforma de servidor y realizar una instalación de software independiente. La razón principal es la incapacidad de garantizar los indicadores de rendimiento especificados (de hecho, la razón principal para elegir All Flash), así como la dificultad de admitir una amplia lista de equipos. Por lo tanto, el llamado dispositivo está presente en el mercado: soluciones completas que consisten en una plataforma de servidor con software preinstalado y configurado y equipado con la cantidad necesaria de SSD, que en general proporciona el rendimiento especificado.

Los representantes de este tipo de solución (dispositivo SDS) son los héroes de nuestra revisión: todos los arreglos Flash de AccelStor .

AccelStor: visión propia sobre el trabajo de All Flash

AccelStor se estableció como startup en 2014. El inversionista clave (esencialmente el propietario de este proyecto) es el conocido gigante de TI Toshiba. Incluso antes del lanzamiento comercial, la compañía atrajo la atención, recibiendo los más altos premios en varios eventos dedicados a las tecnologías Flash. Uno de los principales premios de su lista fue recibido en el muy famoso y prestigioso evento Flash Memory Summit (2016).

Premios AccelStor

Todos estos premios fueron recibidos por un enfoque innovador para trabajar con memoria flash implementada en la tecnología patentada FlexiRemap, que poseen todos los arreglos AccelStor NeoSapphire .

La tecnología FlexiRemap es un algoritmo especial para trabajar con SSD a fin de eliminar los cuellos de botella en términos de rendimiento, así como maximizar la vida útil de las unidades. La idea principal es convertir solicitudes de escritura aleatorias en cadenas secuenciales. Es decir los bloques de datos recibidos se combinan en cadenas que son múltiplos de "páginas", y solo entonces se escriben en el SSD. Como resultado, este enfoque para registrar nuevos datos es consistente desde el punto de vista de las unidades, lo que finalmente permite lograr indicadores de alto rendimiento.

En el proceso, el algoritmo FlexiRemap realiza un seguimiento de la demanda de todos los bloques de datos. De acuerdo con la frecuencia de uso, los datos se clasifican automáticamente cuando se sobrescriben para que todos los datos "activos" se encuentren lo más cerca posible entre sí. Luego, en el proceso de cambiar bloques, estos datos también se moverán a nuevas "páginas" juntas, lo que nuevamente permitirá utilizar un modo de grabación secuencial más eficiente en SSD en comparación con el enfoque tradicional. Este mecanismo es similar a un tipo de emparejamiento virtual que, entre otras cosas, también acelera la recolección de basura, ya que El recolector de basura también hará su trabajo en modo secuencial.

A pesar de que RAID no se usa aquí, los datos aún están protegidos. Para hacer esto, todos los SSD se dividen en dos grupos simétricos. Todas las E / S se distribuyen uniformemente entre ambos grupos (banda). Además de los datos, cada grupo contiene sumas de verificación para que sea posible continuar trabajando si falla una unidad. En total, la matriz puede soportar la falla de dos SSD, que en comparación con RAID es equivalente al nivel de RAID 50 de dos grupos.

Organización de una matriz de datos.

Al grabar, se utiliza el mecanismo round robin, gracias al cual los datos se distribuyen de la manera más uniforme posible en todos los discos. Además, cada SSD tiene su propio coeficiente de peso, que depende de su recurso de grabación actual. Por lo tanto, si algún disco se desgasta más que los demás, será menos probable que reciba nuevos datos hasta que los indicadores de recursos sean iguales. En comparación con el método RAID tradicional, la tecnología FlexiRemap puede aumentar significativamente la vida útil de las unidades debido a su uso uniforme.

FlexiRemap vs RAID

De particular interés es el mecanismo de retención de datos en caso de falla de la unidad. En este caso, el grupo que el SSD rechazó se establece automáticamente en modo de solo lectura. Esto se hace para completar el proceso de reconstrucción en el disco de repuesto dinámico lo más rápido posible. Una vez que se restaura el grupo, puede volver a participar en todo tipo de operaciones. Además, el mecanismo descrito anteriormente para alinear el recurso de grabación funcionará automáticamente.

Hablando sobre el dispositivo SDS, debe comprender que este es esencialmente un servidor con software preinstalado. Por lo tanto, es un controlador único a priori, expresado en términos de sistemas de almacenamiento. Y aunque varias tareas nos permiten no recurrir a controladores de sistema de almacenamiento redundantes, todos los proveedores de almacenamiento nos han enseñado durante mucho tiempo que el sistema de almacenamiento "correcto" es el almacenamiento con dos (o incluso más) controladores. AccelStor también tiene su propia respuesta a esto: tecnología Shared Nothing para dos nodos en un clúster.

Los modelos AccelStor NeoSapphire con dos nodos pueden estar en un solo paquete (basado en servidores gemelos) o en forma de dos servidores separados. Este último se puede extender a una distancia de 100 m entre sí para crear una recuperación ante desastres. En cualquier caso, se utiliza una conexión externa a través de InfiniBand 56G para sincronizar datos entre nodos con una verificación de frecuencia cardíaca adicional a través de Ethernet.

Organización de la sincronización entre nodos.

A diferencia del almacenamiento habitual de dos controladores, aquí no solo se duplican los controladores (nodos) con el enlace obligatorio en forma de módulos de refrigeración y fuentes de alimentación, sino también los datos en sí. Cada nodo en AccelStor NeoSapphire es completamente independiente y contiene una copia completa de los datos gracias a la replicación sincrónica continua. Ambos nodos operan en el modo Simétrico Activo-Activo sin el uso de transferencia de consultas entre sí (ALUA), como en los sistemas de almacenamiento clásicos. Por lo tanto, el tiempo de conmutación en caso de falla por parte de AccelStor realmente tiende a cero. Y la presencia de dos copias de datos puede mejorar significativamente la confiabilidad del sistema en comparación con la arquitectura tradicional.

Continuando con el tema de la confiabilidad, vale la pena señalar que los arreglos Accelstor no almacenan datos en caché durante las operaciones de escritura, porque trabajar en modo síncrono. Todas las acciones intermedias en estos algoritmos FlexiRemap se realizan en la RAM del controlador. Pero la matriz le dará confirmación al host sobre la finalización exitosa de la operación solo después del registro físico en el SSD. Por lo tanto, los arreglos Accelstor All Flash no tienen baterías / condensadores debido a la falta de necesidad de ellos.

Además de las exclusivas tecnologías All Flash, los arreglos AccelStor NeoSapphire también tienen la funcionalidad estándar para el mercado empresarial : aprovisionamiento fino, instantáneas de redireccionamiento en escritura con la capacidad de hacer copias de seguridad y restaurarlas a través de carpetas externas CIFS / NFS, replicación asincrónica, compresión y deduplicación. Por separado, vale la pena señalar la función Free Clone para crear copias de volúmenes que físicamente no ocupan espacio, porque Son esencialmente enlaces al volumen de origen. Esta característica puede ser muy útil, por ejemplo, en VDI.
Por supuesto, hay soporte para todos los sistemas operativos modernos y plataformas de virtualización. Existe un complemento para VMware vSphere Web Client con la capacidad de administrar volúmenes e implementar completamente la funcionalidad de Free Clone.

Una ventaja importante de Accelstor NeoSapphire como almacenamiento definido por software es la capacidad de trabajar en un hardware x86 normal con SSD completamente estándar. Sí, el fabricante no brinda libertades para elegir una plataforma de hardware: lo hace por usted. Esto se realiza principalmente para garantizar un rendimiento predecible de la solución, así como para eliminar problemas de compatibilidad. Todos los arreglos Accelstor All Flash se ensamblan para un cliente específico en la configuración que necesitan y se someten a pruebas rigurosas antes del envío. La garantía estándar en todos los arreglos es de 3 años de NBD con piezas de repuesto avanzadas. Porque El proveedor está presente en el territorio de Rusia, el soporte técnico también está disponible en ruso.

Al ordenar una matriz All Flash Accelstor NeoSapphire, puede seleccionar de manera flexible el volumen requerido. Además, este volumen es lo que realmente está disponible para que los hosts trabajen, independientemente de la organización física del espacio en disco. Tenga en cuenta que todos los modelos vienen completamente cargados con discos. No hay espacios libres, no puede agregar discos. Todo esto se debe a los mismos requisitos de rendimiento y confiabilidad mencionados anteriormente. Si en el futuro necesita aumentar el volumen, puede hacerlo utilizando los estantes de expansión (disponibles para modelos más antiguos). También es necesario determinar de antemano cuántos nodos (controladores) habrá en la matriz, porque No se proporciona la actualización al modo de dos modos actual.

Como interfaces para todos los modelos, está disponible una opción de 10G iSCSI o 16G Fibre Channel. Opcionalmente, también puede haber un 56G InfiniBand. Para los modelos iSCSI, además de bloquear el acceso, la ventaja es el soporte de los protocolos de archivos CIFS y NFS. El número de puertos está determinado por el rendimiento del sistema dado de modo que no sean un cuello de botella (por lo general, de 2 a 6 puertos por nodo).

Como unidades, se utilizan SSD de clase empresarial estándar. Muy a menudo con la interfaz SATA, como No se requiere trabajar con dos controladores. También hay modelos de matrices All Flash basadas en discos NVMe.

El uso de plataformas de servidor estándar y SSD puede optimizar significativamente el costo de la solución en su conjunto. Al mismo tiempo, AccelStor proporciona servicio en su propio nombre para toda la solución, independientemente de qué componentes de qué fabricante formen parte de la matriz.

Y sí, un punto extremadamente importante: ¡no hay licencias pagas! Toda la funcionalidad está disponible de inmediato "fuera de la caja". Además, si la funcionalidad se expande, habrá nuevas funciones disponibles al actualizar el firmware.

Verificación en negocios

AccelStor tiene una amplia gama de modelos con varios rendimientos declarados. El NeoSapphire 3401 más pequeño con 8 SSD puede proporcionar 300K IOPS @ 4K. Y el P710 de gama alta con 24 SSD ya produce 700K IOPS @ 4K. En cuanto a los modelos NVMe, ¡se logra el mismo rendimiento de 700K IOPS @ 4K en NeoSapphire P310 con solo 8 SSD! Y tenga en cuenta que los valores de rendimiento indicados son un registro en el modo establecido (lectura y todo tipo de valores máximos anteriores), es decir en el modo de operación más pesado para la matriz.

Probamos un sistema NeoSapphire H710 con 48 SSD (24 SSD en cada nodo) con una capacidad disponible de 27 TB. Accelstor declara que el rendimiento de este modelo no es inferior a 600K IOPS 4K, escritura aleatoria. Las pruebas se llevaron a cabo en IOmeter desde tres servidores conectados a través de Fibre Channel.

En las pruebas sintéticas All Flash, la matriz resultó ser incluso mejor de lo prometido en la especificación, lo que, en nuestra opinión, es solo una ventaja en el segmento de mercado, donde se cuestiona cualquier indicador (¡gracias a los vendedores desgarrados de la realidad por esto!).

Es importante tener en cuenta que una de las principales ventajas del algoritmo FlexiRemap es su alto rendimiento en el modo de grabación sin degradación con el tiempo. Es decir el indicador alcanzado en el modo establecido será el mismo después de 10 minutos / hora / ... de operación continua. Para confirmar este hecho, ejecutamos la prueba IOmeter (4K, escritura aleatoria 100%) durante varias horas (se usó un host). Sí, esto es cierto: el rendimiento casi no cambia con el tiempo.

El veredicto

Al elegir una matriz All Flash, por defecto, la mayoría de los usuarios prefieren considerar los sistemas de almacenamiento tradicionales equipados con SSD como candidatos. Y si el rendimiento ~ 280K IOPS (4K, escritura aleatoria) le conviene, entonces piensa en la dirección correcta. Aquí hay solo tareas comerciales que requieren cada vez más que el equipo funcione en absoluto 146%. Y con un sistema de almacenamiento convencional, por desgracia, no saltarán por encima de sus cabezas, y algunos IBM Flash System cuestan mucho dinero. Y aquí todos los arreglos de Flash AccelStor serán muy bienvenidos. Rendimiento decente, alta confiabilidad, opciones de configuración flexibles y soporte técnico adecuado: esta no es una lista completa de las ventajas de estos arreglos. Agregue a esto la ausencia total de tarifas ocultas para licencias y el uso prolongado de SSD, y obtendrá no solo un producto interesante, sino una herramienta digna en su negocio.

Por lo tanto, AccelStor ya se llevó a cabo bajo el sol en el mercado ultrarrápido de matrices, inevitablemente se expandirá. Y, quién sabe qué picos pueden alcanzar.

AccelStor: visión propia sobre el trabajo de All Flash

1. Almacenamiento tradicional usando SSD

2. Todos los arreglos Flash con hardware propietario

3. Almacenamiento definido por software

AccelStor: visión propia sobre el trabajo de All Flash

Verificación en negocios

El veredicto

More articles: