Reduzca los riesgos de tiempo de inactividad con la arquitectura Shared Nothing

El tema de la tolerancia a fallas en los sistemas de almacenamiento de datos siempre es relevante, porque en nuestra era de virtualización ubicua y consolidación de los recursos de almacenamiento, el almacenamiento es el enlace cuya falla conducirá no solo a un accidente ordinario, sino a un largo tiempo de inactividad de los servicios. Por lo tanto, los sistemas de almacenamiento modernos incorporan muchos componentes duplicados (hasta controladores). ¿Pero es suficiente esa protección?




Absolutamente todos los proveedores, que enumeran las características de los sistemas de almacenamiento, siempre mencionan la alta tolerancia a fallas de sus soluciones, sin fallar agregando el término "sin un solo punto de falla". Eche un vistazo más de cerca a un sistema de almacenamiento típico. Para eliminar el tiempo de inactividad del servicio, las fuentes de alimentación, los módulos de refrigeración, los puertos de E / S, las unidades (es decir, RAID) y, por supuesto, los controladores se duplican en el sistema de almacenamiento. Si observa de cerca esta arquitectura, notará al menos dos puntos potenciales de falla, que son modestamente silenciosos sobre:


  1. La presencia de un solo plano posterior (plano posterior)
  2. Una copia de los datos.

Backplein es un dispositivo técnicamente sofisticado que debe someterse a pruebas rigurosas en producción. Y por lo tanto, hay casos extremadamente raros cuando falla por completo. Sin embargo, incluso en caso de mal funcionamiento parcial, como una ranura de unidad que no funciona, será necesario reemplazarlo con un apagado completo del sistema de almacenamiento.


Crear múltiples copias de los datos tampoco es un problema a primera vista. Entonces, por ejemplo, la funcionalidad Clonar en sistemas de almacenamiento, que permite actualizar una copia completa de datos con cierta periodicidad, está bastante extendida. Sin embargo, en caso de problemas con el mismo plano posterior, la copia será tan inaccesible como el original.


Una solución completamente obvia para superar estas deficiencias es la replicación a otro sistema de almacenamiento. Si cerramos los ojos a la duplicación esperada del costo del hardware (sin embargo, suponemos que las personas que eligen una solución de este tipo piensan y aceptan este hecho de antemano adecuadamente), todavía habrá posibles gastos para organizar la replicación en forma de licencias, software y hardware adicionales. Y lo más importante: debe garantizar de alguna manera la coherencia de los datos replicados. Es decir construir virtualizador de almacenamiento / vSAN / etc., que también requiere recursos de efectivo y tiempo.


AccelStor en la creación de sus sistemas de alta disponibilidad se dispuso a deshacerse de las desventajas anteriores. Así que hubo una interpretación de la tecnología Shared Nothing, que en una traducción gratuita significa "sin usar dispositivos comunes".


El concepto de arquitectura Shared Nothing es el uso de dos nodos independientes (controladores), cada uno de los cuales tiene su propio conjunto de datos. La replicación síncrona entre nodos a través de la interfaz InfiniBand 56G se hace absolutamente transparente para el software que se ejecuta en la parte superior del sistema de almacenamiento. Como resultado, no se requiere el uso de virtualizadores de almacenamiento, agentes de software, etc.


Físicamente, la solución de dos soluciones AccelStor se puede implementar en dos modelos:


  • H510 : basado en servidores Twin en un paquete de 2U, si se requiere un rendimiento moderado y una capacidad de hasta 22 TB;
  • H710 : basado en servidores separados de 2U, si se requiere un alto rendimiento y una alta capacidad (hasta 57 TB).


Modelo de servidor doble H510



Modelo H710 basado en servidores separados


El uso de diferentes factores de forma se debe a la necesidad de un número diferente de SSD para lograr un volumen y un rendimiento determinados. Además, la plataforma Twin es más barata y le permite ofrecer soluciones más asequibles, aunque con algún "inconveniente" condicional en forma de un solo plano posterior. Todo lo demás, incluidos los principios de funcionamiento, es completamente idéntico para ambos modelos.


El conjunto de datos para cada nodo tiene dos grupos FlexiRemap , más 2 de repuesto dinámico. Cada grupo puede soportar la falla de un SSD. De acuerdo con la ideología, FlexiRemap reconstruye todas las solicitudes entrantes para grabar un nodo en cadenas secuenciales con bloques de 4KB, que luego se escriben en el SSD en el modo más cómodo para ellos (grabación secuencial). Además, el host confirma el registro solo después de la colocación física de los datos en el SSD, es decir, sin almacenamiento en caché en RAM. El resultado es un rendimiento muy impresionante de hasta 600K IOPS para escritura y 1M + IOPS para lectura (modelo H710).


Como se mencionó anteriormente, la sincronización del conjunto de datos ocurre en tiempo real a través de la interfaz InfiniBand 56G, que tiene un ancho de banda alto y una baja latencia. Para maximizar el uso del canal de comunicación cuando se transmiten paquetes pequeños. Porque solo hay un canal de comunicación; para una verificación de pulso adicional, se utiliza un enlace dedicado de 1 GbE. Solo se transmiten los latidos del corazón, por lo que no hay requisitos para las características de velocidad.


Si la capacidad del sistema aumenta (hasta 400+ TB) debido a los estantes de expansión, también se conectan en pares para cumplir con el concepto "sin un solo punto de falla".


Para protección adicional de datos (además del hecho de que AccelStor ya tiene dos copias), se utiliza un algoritmo especial de comportamiento en caso de falla de cualquier SSD. Si la SSD falla, el nodo comenzará a reconstruir los datos en una de las unidades de repuesto dinámico. Un grupo FlexiRemap que está en un estado degradado entrará en modo de solo lectura. Esto se hace para eliminar la interferencia de las operaciones de escritura y reconstrucción en el disco de respaldo, lo que finalmente acelera el proceso de recuperación y reduce el tiempo en que el sistema es potencialmente vulnerable. Al finalizar la reconstrucción, el nodo vuelve al modo normal de lectura y escritura.



Por supuesto, como con otros sistemas, durante la reconstrucción, el rendimiento general disminuye (después de todo, uno de los grupos FlexiRemap no funciona en la grabación). Pero el proceso de recuperación en sí mismo es lo más rápido posible, lo que distingue los sistemas AccelStor de las soluciones de otros proveedores.


Otra característica útil de la tecnología Nothing Shared es la operación de nodos en el llamado modo verdadero activo-activo. A diferencia de la arquitectura "clásica", donde solo un controlador posee un volumen / grupo específico, y el segundo simplemente realiza operaciones de entrada / salida, en los sistemas AccelStor cada nodo trabaja con su propio conjunto de datos y no transmite solicitudes al "vecino". Como resultado, el rendimiento general del sistema mejora debido al procesamiento paralelo de las solicitudes de entrada / salida por parte de los nodos y el acceso a las unidades. Además, en realidad no existe el failover, porque simplemente no necesita transferir el control de volumen a otro nodo en caso de falla.


Si comparamos la tecnología de la arquitectura Nothing Shared con la duplicación completa del almacenamiento, a primera vista, será ligeramente inferior a la implementación completa de recuperación ante desastres en flexibilidad. Esto es especialmente cierto en la organización de la línea de comunicación entre sistemas de almacenamiento. Entonces, en el modelo H710, es posible extender los nodos a una distancia de 100 m debido al uso de cables ópticos activos InfiniBand no tan baratos. Pero incluso si se compara con la implementación habitual de la replicación sincrónica de otros proveedores a través del FibreChannel disponible, incluso a distancias mayores, la solución de AccelStor será más barata y fácil de instalar / operar, ya que no es necesario instalar virtualizadores de almacenamiento o integrarse con el software (que, en principio, está lejos de ser siempre posible). Además, no olvide que las soluciones de AccelStor son matrices All Flash con un rendimiento superior al de los sistemas de almacenamiento "clásicos" con SSD únicamente.



Cuando se utiliza la tecnología Nothing Shared de AccelStor, es realista obtener una disponibilidad del sistema de almacenamiento del 99.9999% por un costo muy razonable. Junto con la alta confiabilidad de la solución, incluso mediante el uso de dos copias de datos y un rendimiento impresionante gracias a los algoritmos patentados FlexiRemap , las soluciones AccelStor son excelentes candidatos para puestos clave en la construcción de un centro de datos moderno.

Source: https://habr.com/ru/post/441780/


All Articles