Mudarse al almacenamiento puro: nuestro nuevo almacenamiento



Recientemente, transferimos nuestras bases de datos altamente cargadas (servicios de oficina centralizados, correo, estaciones de trabajo virtuales, así como sistemas y sitios comerciales mvideo.ru y eldorado.ru) a arreglos flash de Pure Storage. Y hoy le diremos por qué decidimos hacer esto y cómo cambiamos a otros nuevos.

Antecedentes


Después de la fusión de M.Video y Eldorado, el Grupo adoptó el programa ONE RETAIL a largo plazo, que desarrolla activamente plataformas digitales y automatiza los servicios de TI. Cambiamos a una infraestructura híbrida desde nuestras propias instalaciones y entornos en la nube. Sin embargo, una gran flota de equipos de varios fabricantes, que se formó como resultado de la fusión, impidió una mayor mejora en la eficiencia de los sistemas.

Por lo tanto, se nos ocurrió la idea de actualizar parte de los repositorios. Después de analizar soluciones de diferentes fabricantes, nos decidimos por Pure Storage. Pero antes de tomar la decisión final, era necesario probar el equipo con nuestros datos.

Prueba


Los sistemas que participaron en las pruebas se ubicaron en el sistema de almacenamiento de varios proveedores, que utilizaban discos duros clásicos y de estado sólido. Después de acordar un programa de prueba e instalar equipos de Pure Storage en nuestro centro de datos, comenzamos a migrar.



Uno de los primeros en migrar el servicio de escritorio virtual. Como resultado, los usuarios finales, no los administradores de sistemas, notaron un aumento significativo en la productividad: los archivos PDF, documentos de texto y tablas se abrieron mucho más rápido. Después de que el servicio regresó a su sistema de almacenamiento original, la velocidad de respuesta disminuyó. Es decir, debido a la transferencia al almacenamiento con la arquitectura All-Flash, el rendimiento de un sistema bastante crítico ha aumentado notablemente. No realizamos mediciones precisas, pero según las sensaciones, el aumento de velocidad fue del 50-70%. Para algunas aplicaciones, los tiempos de respuesta han disminuido significativamente.

Luego probamos la compresión y la deduplicación. Una de las diferencias entre Pure Storage es que en sus sistemas de almacenamiento, la deduplicación y la compresión funcionan a nivel global, sobre la marcha, por lo que no necesita distribuir datos entre volúmenes de almacenamiento separados. Además, el sistema de almacenamiento también puede comprimir información con el tiempo, utilizando los algoritmos de compresión y deduplicación más avanzados en modo diferido. Y, por último, los algoritmos de compresión y deduplicación en Pure Storage funcionan con bloques de datos muy pequeños, a partir de 512 bytes: la longitud del bloque puede cambiar y adaptarse a diferentes tipos de datos.

Gracias a estos trucos, el volumen de las bases de datos MySQL y Oracle (seleccionadas para la prueba) disminuyó 3.1 veces en comparación con el sistema de almacenamiento original.

Implementación


Estábamos interesados ​​en aumentar no solo el rendimiento del almacenamiento, sino también la confiabilidad del almacenamiento. Por lo tanto, en el siguiente paso, decidimos introducir un clúster de almacenamiento distribuido de acuerdo con el esquema Active-Active (Pure Storage ActiveCluster), es decir, distribuir nuestros sistemas en dos centros de datos. Cada sistema de almacenamiento de Pure Storage ya incluye el conjunto de herramientas necesarias para la replicación síncrona y asíncrona, incluida la creación de clústeres activo-activo distribuidos geográficamente.





Después de la aparición del segundo sistema de almacenamiento Pure, utilizamos la función de replicación síncrona a nivel de matriz, lo que aceleró significativamente la migración de datos entre sitios, ya que los datos se transmiten en forma comprimida. Ahora estamos eligiendo servicios que operarán en modo de sincronización continua para garantizar una alta disponibilidad: en caso de emergencia o falla de todo el sitio, los servicios de TI de la compañía continuarán funcionando sin interrupción. Dado que la replicación funciona en modo Activo-Activo, la falla real de todo el sistema de almacenamiento conduce a la pérdida de algunas rutas, pero no afecta la disponibilidad de las aplicaciones alojadas. Para los usuarios finales, esto pasa desapercibido. Dado que, de forma predeterminada, Pure Storage brinda confiabilidad al nivel del 99.9999% (31.5 segundos de tiempo de inactividad por año), incluso más, en este momento, según las estadísticas que el fabricante recopila de su servicio en la nube, los arreglos Pure, en nuestra opinión, exceden 6 nueves (y esto es solo 3 segundos de tiempo de inactividad por año), con la ayuda de la sincronización continua de ActiveCluster, el tiempo de actividad puro se convierte en casi el 100%. Es decir, incluso si falla todo el centro de datos, los usuarios trabajarán en silencio, como si nada hubiera pasado.

Gestión


Junto con la introducción de las primeras unidades de equipos de Pure Storage, comenzamos a usar el servicio patentado de monitoreo y control en la nube: Pure1. Proporciona un único panel de control que muestra el estado de todos los sistemas de almacenamiento y las condiciones previstas para los próximos años. Es decir, no necesitamos calcular cuándo el rendimiento o la capacidad dejarán de ser suficientes: el sistema avisará con anticipación o permitirá predecir con anticipación. Esto simplifica enormemente el proceso de futuras extensiones y actualizaciones.

Pure1 también tiene una herramienta llamada VM Analytics. Dado que todos nuestros servicios y aplicaciones están completamente virtualizados en función de la solución VMware, podemos conectarnos al clúster de virtualización VMware y ver la topología de toda la infraestructura en Pure1. Se mostrarán todos los puntos de contacto intermedios: máquinas virtuales, volúmenes, almacenamiento, relaciones individuales. Y en caso de cualquier problema, veremos dónde y qué sucedió sin la ayuda de un proveedor.

Densidad de colocación


Migramos datos de 6 tipos de sistemas de almacenamiento de diferentes fabricantes a dos modelos de sistemas de almacenamiento Pure Storage. Los dispositivos viejos ocupaban varios bastidores. Y ahora el equipo con los mismos datos, aproximadamente 1,5 petabytes, ocupa un tercio de un rack, 18 unidades, mientras que queda una reserva de capacidad de disco en la región del 15 al 20%. El consumo de energía y la disipación de calor disminuyeron significativamente, lo que ahorra en el sistema de enfriamiento.

Otras características y capacidades


En el corazón del soporte técnico de Pure Storage hay un motor de "inteligencia artificial" que puede predecir posibles problemas.

Además de los servicios de bloque tradicionales, los sistemas de almacenamiento Pure Storage permiten la implementación de servicios de archivos debido a la arquitectura modular interna definida por software. Así lo hicimos: en x50 y x70 creamos servidores de archivos de Windows y comenzamos la migración de los recursos de almacenamiento de archivos.

También me gustaría mencionar que no importa qué componente de software se use en Pure Storage, no necesita pensar en futuras licencias: una licencia implica la adición automática de todas las nuevas características futuras. Por ejemplo, desde el momento de la implementación inicial, ha aparecido la función de cargar instantáneas a través del protocolo NFS a un sistema de almacenamiento externo de cualquier fabricante, o a través del protocolo S3 a un almacenamiento externo en la nube.
También uno de los beneficios de los productos Pure Storage es su facilidad de administración.





Ahora estamos integrando instantáneas de Pure Storage con un sistema de respaldo centralizado. Con su ayuda, podemos crear copias de seguridad instantáneas, esto le permitirá descargar aplicaciones durante el proceso de copia de seguridad y reducir significativamente el tiempo requerido para la recuperación. En caso de falla, el proceso de recuperación de aplicaciones de la instantánea será casi instantáneo. Cuando utiliza instantáneas con un sistema de respaldo, obtiene una solución completa de alto rendimiento. Es decir, los recursos más exigentes se asignarán al sistema de almacenamiento. Tales instantáneas de hardware no reducen el rendimiento del sistema, a diferencia de las instantáneas creadas a nivel de aplicación o virtualización.

Source: https://habr.com/ru/post/481842/


All Articles