RAID de hardware: características de uso



Organizar un espacio de disco único es una tarea que se puede resolver fácilmente utilizando un controlador RAID de hardware. Sin embargo, primero debe familiarizarse con las características de uso y administración de dicho controlador. Hablaremos de esto hoy en nuestro artículo.

La confiabilidad y la velocidad de las unidades de disco son motivo de preocupación para todos los administradores de sistemas. A pesar de las garantías de los fabricantes sobre la calidad de sus propios dispositivos, HDD y SSD continúan fallando en el momento más inoportuno, perdiendo datos valiosos. La tecnología SMART en la mayoría de los casos permite evaluar el "estado" de la unidad, pero esto no garantiza que la unidad continuará funcionando sin problemas.

Es imposible predecir la falla de una unidad con una precisión del 100%, por lo que debe considerar la opción en la que esto no se convierta en un problema o cause una parada del servicio. El uso de matrices RAID resuelve este problema. Considere los tres enfoques principales utilizados para esta tarea:

  • El software RAID es la opción menos costosa, pero también la menos productiva. El sistema operativo crea la matriz, toda la carga del procesamiento de datos recae sobre los hombros del procesador central.
  • El RAID de hardware integrado (a menudo también llamado Fake-RAID) es un microchip instalado en la placa base, que asume parte de la funcionalidad del controlador RAID de hardware, trabajando en conjunto con el procesador central. Este enfoque funciona un poco más rápido que el RAID de software, pero la confiabilidad de tal arreglo deja mucho que desear.
  • El RAID de hardware es un controlador separado con su propio procesador y memoria de caché, que se encarga completamente de todas las operaciones del disco. La opción más costosa, sin embargo, la más productiva y confiable de usar.

Veamos el RAID de hardware en detalle.

Apariencia


Hemos seleccionado soluciones Adaptec de Microsemi. Estos son controladores RAID con usabilidad probada y alto rendimiento. Los instalamos si nuestro cliente decide pedir un servidor de configuración arbitraria o fija.



Para conectar discos, se utilizan cables de interfaz especiales. En el lado del controlador, se utilizan conectores SFF8643 . Cada cable le permite conectar hasta 4 unidades SAS o SATA (según el modelo). Además, el cable de interfaz también tiene un conector SFF-8485 de ocho pines para el bus SGPIO, del que hablaremos más adelante sobre el propósito.

Además del controlador RAID en sí, hay dos dispositivos adicionales que pueden aumentar la confiabilidad:

  • BBU (Battery Backup Unit) es un módulo de expansión con una batería de iones de litio que le permite mantener el voltaje en un chip de caché volátil. En caso de un apagón repentino del servidor, su uso le permite guardar temporalmente el contenido de la memoria caché, que aún no se ha escrito en los discos.

    Tan pronto como se restablezca la fuente de alimentación del servidor, el contenido de la memoria caché se escribirá en los discos en el modo normal. Según el fabricante, una batería completamente cargada es capaz de almacenar datos de caché durante 72 horas.
  • ZMCP (Zero-Maintenance Cache Protection) es un módulo de expansión especial para el controlador RAID, que tiene su propia memoria no volátil y supercondensador. En el caso de una falla de alimentación del servidor, el supercondensador proporciona al microcircuito energía eléctrica, que es suficiente para escribir el contenido de la memoria caché volátil en la memoria ZMCP NAND.

    Una vez que se restablece la alimentación del servidor, el contenido de la memoria caché se escribirá automáticamente en los discos. Estos módulos se instalan en nuestros servidores con controlador RAID de hardware y protección de caché.



Esto es especialmente importante cuando la reescritura está habilitada. En el caso de una falla de energía, el contenido de la memoria caché no se depositará en los discos, lo que provocará la pérdida de datos y, como resultado, se interrumpirá el funcionamiento regular de la matriz de discos.

Especificaciones técnicas


Temperatura


Primero, me gustaría tocar algo tan importante como el régimen de temperatura de los controladores RAID de hardware Adaptec. Todos ellos están equipados con pequeños radiadores pasivos, que pueden causar una falsa impresión de una pequeña disipación de calor.

El fabricante del controlador cita 200 LFM (pies lineales por minuto) como el valor de flujo de aire recomendado, que corresponde a un indicador de 8.24 litros por segundo (o 1.02 metros por segundo). Dichos controladores están diseñados exclusivamente para su instalación en cajas de montaje en bastidor, donde dicho flujo de aire es creado por enfriadores estándar de alta velocidad.

De 0 ° C a 40-55 ° C: la temperatura de funcionamiento de la mayoría de los controladores RAID Adaptec (según la disponibilidad de los módulos instalados), recomendada por el fabricante. La temperatura máxima de funcionamiento del chip es de 100 ° C. Operar el controlador a temperaturas elevadas (más de 85 ° C) puede dañarlo. En aras de la conveniencia, debajo del alerón, ofrecemos una placa de temperaturas recomendadas para diferentes series de controladores Adaptec.

Temperaturas recomendadas
Serie 2 (2405, 2045, 2805) y 2405Q55 ° C sin módulos
Serie 5 (5405, 5445, 5085, 5805, 51245, 51645, 52445)55 ° C sin módulo de batería, 40 ° C con módulo de batería ABM-800
Serie 5Z (5405Z, 5445Z, 5805Z, 5805ZQ)50 ° C con módulo ZMCP
Serie 5Q (5805Q)55 ° C sin módulo de batería, 40 ° C con módulo de batería ABM-800
Serie 6E (6405E, 6805E)55 ° C sin módulos
Serie 6 / 6T (6405, 6445, 6805, 6405T, 6805T)55 ° C sin módulo ZMCP, 50 ° C con módulo ZMCP AFM-600
Serie 6Q (6805Q, 6805TQ)50 ° C con módulo ZMCP AFM-600
Serie 7E (71605E)55 ° C sin módulos
Serie 7 (7805, 71605, 71685, 78165, 72405)55 ° C sin módulo ZMCP, 50 ° C con módulo ZMCP AFM-700
Serie 7Q (7805Q, 71605Q)50 ° C con módulo ZMCP AFM-700
Serie 8E (8405E, 8805E)55 ° C sin módulos
Serie 8 (8405, 8805, 8885)55 ° C sin módulo ZMCP, 50 ° C con módulo ZMCP AFM-700
Serie 8Q (8885Q, 81605Z, 81605ZQ)50 ° C con módulo ZMCP AFM-700


Nuestros clientes no tienen que preocuparse por el sobrecalentamiento de los controladores, porque nuestros centros de datos mantienen un régimen de temperatura constante y el ensamblaje de servidores de configuración arbitraria tiene en cuenta las características de dichos componentes (como mencionamos en nuestro artículo anterior ).

Velocidad de trabajo


Para demostrar cómo la disponibilidad de un controlador RAID de hardware ayuda a aumentar la velocidad del servidor, decidimos armar un banco de pruebas con la siguiente configuración:

  • CPU Intel Xeon E3-1230v5;
  • RAM 16 Gb DDR4 2133 ECC;
  • 4 discos duros con una capacidad de 1 TB.

El sistema operativo se instalará CentOS 7. La función de la aplicación del servidor asumirá 1C Bitrix24. Primero, crearemos el RAID de software usando mdadm y mediremos el rendimiento usando la prueba integrada en Bitrix24. No realizamos ningún cambio o configuración adicional en el sistema, se instala una configuración de demostración con la configuración predeterminada.

Luego colocaremos el controlador RAID Adaptec ASR 7805 con el módulo de protección de caché AFM-700 en el mismo soporte, conectaremos los mismos discos duros y realizaremos exactamente la misma prueba.

Con software RAID


La ventaja indudable del software RAID es la facilidad de uso. Se crea una matriz en Linux utilizando la utilidad estándar mdadm. Al instalar el sistema operativo, la mayoría de las veces la creación de una matriz se realiza directamente desde el instalador. En el caso de que el instalador no brinde tal oportunidad, es suficiente ir a la siguiente consola usando la combinación de teclas Ctrl + Alt + F2 (donde el número de la tecla de función es el número del tty llamado).

Crear una matriz es muy simple. El comando fdisk -l analiza qué discos están presentes en el sistema. En nuestro caso, estos son 4 discos:

/dev/sda /dev/sdb /dev/sdc /dev/sdd 

Compruebe que no hay metadatos en los discos, por ejemplo, de la matriz anterior:

 mdadm --examine /dev/sda /dev/sdb /dev/sdc /dev/sdd 

En los 4 discos debería haber un mensaje:

 mdadm: No md superblock detected 

Si hay metadatos en uno o varios discos, puede eliminarlos de la siguiente manera (donde sdX es el disco requerido):

 mdadm --zero-superblock /dev/sdX 

Cree particiones en cada disco para la matriz futura usando fdisk . El tipo de partición debe ser fd (detección automática de RAID de Linux) .

 fdisk /dev/sdX 

Recopilamos la matriz RAID 10 de las particiones creadas usando el comando:

 mdadm --create --verbose /dev/md0 --level=10 --raid-devices=4 /dev/sda1 /dev/sdb1 /dev/sdc1 /dev/sdd1 

Inmediatamente después de eso, se creará la matriz / dev / md0 y se iniciará el proceso de reconstrucción de los datos en los discos. Para rastrear el estado actual del proceso, ingrese:

 cat /proc/mdstat 



Hasta que se complete el proceso de reconstrucción de datos, se reducirá la velocidad de la matriz de discos.

Después de instalar el sistema operativo y Bitrix24 en la matriz creada, lanzamos la prueba estándar y obtuvimos los siguientes resultados:



Con RAID de hardware


Antes de que el servidor pueda usar el espacio de disco único de la matriz RAID, es necesario realizar la configuración básica del controlador y las unidades lógicas. Hay dos formas de hacer esto:

  • usando la utilidad del controlador interno,
  • utilidad del sistema operativo.

El primer método es ideal para la configuración inicial. El inicio de sesión en la utilidad en modo Legacy (el modo predeterminado para nuestros servidores) se realiza mediante la combinación de teclas CTRL + A cuando aparece una notificación durante el proceso de inicialización POST.



La utilidad permite no solo controlar la configuración del controlador, sino también los dispositivos lógicos. Inicializamos discos físicos (toda la información sobre los discos durante la inicialización se destruirá) y creamos una matriz RAID-10 usando la sección Crear matriz. Al crear, el sistema solicitará el tamaño de banda deseado, es decir, el tamaño del bloque de datos para una operación de E / S:

  • el tamaño de banda más grande es ideal para trabajar con archivos grandes;
  • El tamaño de banda más pequeño es adecuado para procesar una gran cantidad de archivos pequeños.
Importante: el tamaño de la franja se establece solo una vez (al crear la matriz) y este valor no se puede cambiar en el futuro.



Inmediatamente después de que el controlador recibió el comando para crear una matriz, así como con RAID de software, comienza el proceso de reconstrucción de datos en discos. Este proceso se ejecuta en segundo plano y el BIOS puede acceder de inmediato a la unidad lógica. El rendimiento del subsistema de disco también se reducirá hasta que se complete el proceso. Si se crearon varias matrices, entonces es necesario determinar la matriz de arranque utilizando el método abreviado de teclado Ctrl + B.

Después de que el estado de la matriz cambió a Óptimo , instalamos Bitrix24 y realizamos exactamente la misma prueba. Resultado de la prueba:



De inmediato queda claro que el controlador RAID de hardware acelera las operaciones de lectura y escritura en los medios de disco mediante el uso de una memoria caché, lo que permite un procesamiento más rápido de las solicitudes masivas de usuarios.

Gestión del controlador


Directamente desde el sistema operativo, el controlador se controla mediante el software disponible para descargar desde el sitio web del fabricante . Las opciones están disponibles para la mayoría de los sistemas operativos e hipervisores:

  • Debian
  • Ubuntu
  • Red Hat Linux,
  • Fedora
  • SuSE Linux,
  • FreeBSD
  • Solaris
  • Microsoft Windows
  • Citrix XenServer,
  • VMware ESXi

Otras distribuciones de Linux también tienen códigos fuente de controladores disponibles. Además de los controladores y la utilidad de consola ARCCONF, el fabricante también ofrece un programa con una interfaz gráfica para un control conveniente del controlador: maxView Storage Manager.

Con estas utilidades, sin interrumpir el servidor, puede administrar fácilmente discos lógicos y físicos. También puede utilizar funcionalidades útiles como "resaltado de disco". Ya mencionamos el quinto cable para conectar SGPIO: este cable se conecta directamente a la placa posterior (desde la placa posterior en inglés, la placa de conexión para las unidades del servidor) y permite que el controlador RAID controle completamente la indicación luminosa de cada disco.

Tenga en cuenta que los backplanes no solo son compatibles con SGPIO, sino también con I2C. El cambio entre estos modos se realiza con mayor frecuencia utilizando puentes en el plano posterior.

A cada dispositivo conectado al controlador RAID de hardware Adaptec se le asigna un identificador que consiste en un número de canal y un número de disco físico. Los números de canal corresponden a los números de puerto en el controlador.

El reemplazo del disco es una operación regular, sin embargo, requiere una identificación inequívoca. Si comete un error durante esta operación, puede perder datos e interrumpir el servidor. Con un controlador RAID de hardware, este error es raro.

Esto se hace de manera muy simple:

  1. Se solicita una lista de unidades asignadas al controlador:

     arcconf getconfig 1 
  2. Se encuentra un disco que requiere reemplazo y se registran sus "coordenadas" (parámetro Canal informado, Dispositivo (T: L) ).


  3. El disco se "resalta" con el comando:

     arcconf identify 1 device 0 0 

El controlador dará el comando de plano posterior apropiado, y el LED de la unidad deseada comenzará a parpadear de manera uniforme en un color diferente al que funciona de manera estándar.

Por ejemplo, en las plataformas Supermicro, el funcionamiento normal del disco es verde o azul, y el disco "resaltado" parpadeará en rojo. Es imposible mezclar los discos en este caso, lo que permitirá evitar errores debido al factor humano.



Configurar el almacenamiento en caché


Ahora algunas palabras sobre las opciones para trabajar la caché de escritura. La opción Escribir a través significa que el controlador le dice al sistema operativo sobre el éxito de la operación de escritura solo después de que los datos se hayan escrito en los discos. Esto aumenta la fiabilidad de la seguridad de los datos, pero no aumenta la productividad.

Para alcanzar la velocidad máxima, debe usar la opción Escribir de nuevo . Con este esquema de operación, el controlador informará al sistema operativo de la operación exitosa de E / S inmediatamente después de que los datos lleguen al caché.
Importante: cuando se utiliza Write Back, se recomienda encarecidamente utilizar un módulo BBU o ZMCP, porque sin él, durante un apagón repentino, algunos de los datos pueden perderse.

Configuración de monitoreo


La cuestión de supervisar el estado del equipo y la posibilidad de notificación es bastante grave para cualquier administrador del sistema. Para configurar el "paquete" de Zabbix y el controlador RAID Adaptec, recomendamos utilizar las soluciones enumeradas .

A menudo, debe controlar el estado del controlador directamente desde el hipervisor, por ejemplo, VMware ESXi. El problema se resuelve instalando el proveedor de CIM utilizando la instrucción Microsemi .

Firmware


La necesidad del firmware del controlador RAID surge con mayor frecuencia para solucionar los problemas identificados por el fabricante con el funcionamiento del dispositivo. A pesar de que el firmware está disponible para la actualización automática, esta operación debe abordarse de manera muy responsable, especialmente si el procedimiento se realiza en un sistema de "combate".

Si nuestro cliente necesita cambiar la versión del firmware del controlador, entonces solo necesita crear un ticket en nuestro panel de control. Los ingenieros de sistemas actualizarán el controlador RAID a la versión requerida en el momento especificado y lo harán lo más correctamente posible.
Importante: no debe realizar el flasheo usted mismo, ya que cualquier error puede provocar la pérdida de datos.

Conclusión


El uso de un controlador RAID de hardware está justificado en la mayoría de los casos cuando se requiere alta velocidad y confiabilidad del subsistema de disco.

Los ingenieros del sistema Selectel realizarán la configuración básica de la matriz de discos en el controlador RAID de hardware de forma gratuita cuando soliciten un servidor de configuración arbitraria. En caso de que se requiera asistencia adicional con la configuración, estaremos encantados de ayudarlo como parte de nuestro servicio de administración . Además, hemos preparado para nuestros lectores una pequeña nota sobre los comandos de la utilidad arcconf.

¿Utiliza controladores RAID de hardware? Nos vemos en los comentarios.

Source: https://habr.com/ru/post/449312/


All Articles