
En la primavera de 2018, Selectel lanzó un servicio de respaldo para
VMware Cloud a través de Veeam® Backup & Replication ™ (en adelante VBR). Abordamos el proyecto a fondo, planificamos y realizamos la siguiente lista de trabajos:
- Explorando la documentación del producto Veeam y las mejores prácticas
- Diseño de una arquitectura VBR de nivel de proveedor de servicios
- Implementar infraestructura VBR
- Probar la solución, determinar la configuración óptima y los modos operativos
- Lanzamiento de la solución en operación industrial (comercial)
Al final resultó que no en vano. El servicio es estable, los clientes pueden hacer una copia de seguridad de sus máquinas virtuales y tenemos una cierta experiencia que queremos compartir.
En este artículo queremos hablar sobre los resultados de las pruebas de carga VBR para los dos modos operativos de proxy de respaldo más populares, teniendo en cuenta la variación en el número de tareas paralelas.
Aquí puedes ver:
- Descripción de la infraestructura de producción de Selectel utilizada para las pruebas.
- Características del proxy de respaldo (proxy de respaldo) en varios modos de transporte
- Descripción del programa de prueba y configuraciones de componentes VBR para su implementación
- Indicadores cuantitativos, su comparación y conclusiones.
Probar la configuración de la infraestructura
Infraestructura de origen
Como plataforma para probar el rendimiento de VBR, se creó uno de los grupos de producción de la
nube pública
basada en VMware .
- La configuración de hardware de los hosts en este clúster:
- Procesadores Intel® Xeon® Gold 6140
- Intel® DC NVMe P4600 y P3520
- 4 puertos de 10 GbE por host
El clúster se basa en las siguientes soluciones:
- Red física: fábrica de Ethernet en conmutadores Brocade VDX, arquitectura Leaf-Spine (puertos de 10 GbE - hosts de conexión, enlaces ascendentes de 40 GbE a Spine)
- Entorno de virtualización: VMware vSphere® 6.5
- Almacenamiento de VM: VMware vSAN ™ 6.6 (clúster All-Flash vSAN)
- Virtualización de red: VMware NSX® 6.4
El rendimiento de la plataforma de prueba es más que suficiente y no hay dudas. Por supuesto, para un rendimiento de alta velocidad, todo esto debe configurarse correctamente, pero como se trata de producción, con clientes vivos y satisfechos, puede estar seguro de que todo está bien en este sentido.
Junto con la nube basada en VMware, Selectel lanzó un
servicio para su copia de seguridad en la plataforma VBR. Los clientes reciben un portal web de autoservicio donde pueden hacer copias de seguridad y restaurar vApp y máquinas virtuales desde su VDC (centro de datos virtual).
Los clientes tienen acceso a este portal (portal de autoservicio Veeam® Enterprise Manager) con los mismos derechos que vCloud Director® (vCD). Esto es posible debido a la integración de Veeam® Backup Enterprise Manager (EM) y vCD, mientras que cada cliente, cuando está conectado a EM, está limitado por los recursos de su VDC, no verá otras máquinas virtuales.
El cliente no necesita implementar su propio VBR y la infraestructura de respaldo asociada, lo que implica el costo de los recursos informáticos y de red, el almacenamiento, las licencias Veeam y MS, y la administración. Es largo, costoso y complicado. Selectel proporciona las capacidades básicas de VBR como un servicio BaaS (Backup-as-a-Service): de forma instantánea, simple, conveniente y económica.
Para proporcionar este servicio, Selectel implementó una infraestructura de proveedor VBR que cubre todos los clústeres vSphere y VDC de clientes de nube VMware, incluido el clúster en el que se realizó esta prueba. Por lo tanto, los resultados de la prueba nos permitirán juzgar la velocidad máxima con la que los clientes pueden respaldar sus máquinas virtuales.
Prueba de máquinas virtuales
Para probar el rendimiento de la copia de seguridad, se implementaron 6 máquinas virtuales idénticas en el clúster de vSphere en la siguiente configuración:
- SO Windows Server 2016, 2 vCPU, 4 GB de RAM
- Disco virtual de 200 GB
El disco está casi lleno: 193 GB. Además de los archivos del sistema operativo, se creó una carpeta con distribuciones de varios sistemas operativos y DBMS con una capacidad de 60 GB (datos únicos). En la misma unidad, se crearon 3 copias de esta carpeta, un total de 180 GB de datos que no son del sistema.
No se instalaron aplicaciones en estas máquinas virtuales, solo un sistema operativo "limpio" y datos "fríos". Sin carga, computacional o de red, comenzó. Para esta prueba, esto no fue requerido.
DRS está habilitado en el clúster de vSphere, por lo que las máquinas virtuales de prueba se distribuyen automáticamente de manera óptima entre los hosts VMware ESXi ™ para el equilibrio de carga.
Proxy de respaldo
Una VM con proxy de respaldo se implementa directamente en el clúster de vSphere descrito anteriormente (la infraestructura de origen, en adelante denominada el clúster de vSphere), esta es una condición necesaria para realizar pruebas en el modo de dispositivo virtual.
Configuración de VM:
- 8 vCPU
- 8 GB de RAM
- Disco virtual de 40 GB
- 10GbE vNIC vmxnet3
- SO Windows Server 2016
El parámetro "Tareas simultáneas máximas" para el proxy de respaldo en el nivel VBR se establece en 6. Esto significa que el proxy de respaldo puede procesar simultáneamente (en paralelo) hasta 6 tareas de respaldo. Una tarea es una copia de seguridad de un disco VM virtual.
Depósito de respaldo
El servidor físico que actúa como un repositorio de respaldo de VBR actúa como una interfaz del almacenamiento de respaldo. Configuración del servidor:
- CPU E5-1650v3
- 32 GB de RAM
- 2 puertos de 10 GbE
Backend de almacenamiento: clúster CephFS con caché NVMe.
El repositorio de respaldo y los nodos Ceph se comunican a través de una red de 10 GbE, cada uno de ellos está conectado a los conmutadores por dos puertos.
Una descripción detallada de la configuración del clúster Ceph está más allá del alcance de este artículo. Tenga en cuenta que para la fiabilidad y la tolerancia a fallos, los datos se almacenan en tres copias. El rendimiento del clúster no es satisfactorio y, con un margen, los resultados de la prueba mostraron que en ninguno de ellos el almacenamiento de respaldo era un cuello de botella.
El parámetro "Limitar las tareas simultáneas máximas" para el repositorio de respaldo en el nivel VBR se establece en 6. Esto significa que el repositorio de respaldo podrá procesar simultáneamente (hasta 6) tareas de respaldo.
Red de respaldo
La red física de la infraestructura descrita anteriormente está limitada por un ancho de banda de 10 Gbit / s, los conmutadores y los puertos de 10 GbE se utilizan en todas partes. Esto es cierto no solo para vSAN, sino también para las interfaces de administración de hosts ESXi.
Para alojar un proxy de respaldo en el nivel VMware NSX, se ha creado una subred dedicada con su propio conmutador lógico. Por su conectividad con la física y el enrutamiento, se ha implementado el NSX-edge, un tamaño X-grande.
Mirando hacia el futuro, de acuerdo con los resultados de la prueba, está claro que la red puede soportar una carga de hasta 8 Gb / s. Este es un ancho de banda muy sólido, que es suficiente en esta etapa, si es necesario, se puede aumentar.
Diagrama de interacción de componentes
Los servidores proxy de respaldo y las máquinas virtuales de prueba se implementan en el mismo clúster VMware vSAN. Después de iniciar el trabajo de respaldo (trabajo de respaldo), dependiendo del modo de transporte seleccionado, cuyas características se analizan a continuación, un proxy de respaldo:
- Recupera datos de máquinas virtuales de respaldo a través de vSAN (HotAdd) o red de control (NBD)
- Transfiere datos procesados al repositorio de respaldo en la subred asignada para este propósito
Modos de transporte de proxy de respaldo
El proxy de respaldo es un componente de la infraestructura VBR que realiza directamente el procesamiento del trabajo de respaldo. Extrae datos de la VM, los procesa (comprime, deduplica, encripta) y los envía al repositorio, donde se guardan en los archivos de respaldo.
El proxy de respaldo le permite trabajar en tres modos de transporte:
- Acceso directo al almacenamiento
- Dispositivo virtual
- Red
La nube basada en VMware Selectel
utiliza vSAN como almacenamiento, en esta configuración no se admite el acceso directo al almacenamiento, por lo tanto, este modo no se considera y no se ha probado. Los dos modos restantes funcionan maravillosamente en cada uno de nuestros clústeres de vSphere. Consideremos con más detalle.
Modo de dispositivo virtual (HotAdd)
El dispositivo virtual es el modo recomendado al implementar proxies de respaldo como máquinas virtuales. Los hosts ESXi en los que se implementan proxies de respaldo deben tener acceso a todos los almacenes de datos del clúster de vSphere que almacena las máquinas virtuales de respaldo. La esencia del modo es que el proxy monta los discos de la VM de respaldo (VMware SCSI HotAdd) y toma datos de ellos como si fueran propios. La extracción de datos se produce con Datastore a través de una red de almacenamiento.
En nuestro caso, la máquina virtual de proxy de respaldo debe ubicarse en uno de los hosts ESXi del clúster vSAN, del cual respaldamos. La extracción de datos se realiza a través de vSAN. Por lo tanto, para trabajar en modo de dispositivo virtual, se debe implementar al menos un proxy de respaldo en cada clúster de vSAN. Expanda un par de servidores proxy de copia de seguridad (por ejemplo, en un clúster de administración) y haga una copia de seguridad de todos los clústeres de vSAN con ellos fallarán.
Pros | Contras |
Rápido, como regla, es mucho más rápido que NBD, especialmente en el caso de una copia de seguridad completa o grandes incrementos. Solo el acceso directo al almacenamiento puede ser inferior en velocidad. | La operación de montar discos (HotAdd) en un proxy puede tomar hasta 2 minutos por disco. Con copias de seguridad incrementales de pequeños fragmentos de datos, NBD puede ser más rápido. |
Elimina la red de almacenamiento. No carga la interfaz de administración y el hipervisor. | Proxy VM consume parte de los recursos del host. A veces puede haber problemas con la eliminación de instantáneas. |
Modo de red (NBD)
Es el modo más simple y universal, adecuado tanto para servidores proxy de respaldo físicos como virtuales. La extracción de datos, a diferencia de los dos modos anteriores, no se produce a través de la red de almacenamiento. Un proxy de respaldo toma datos de VM conectándose a la interfaz de administración de los hosts ESXi en los que se están ejecutando.
Este enfoque tiene las siguientes desventajas:
- A menudo, las interfaces de administración de ESXi no se cuelgan en los enlaces ascendentes más rápidos, como regla, esto es 1GbE
- Incluso si la interfaz de administración tendrá puertos de 10 GbE, ESXi no renunciará a todo el proxy de la banda de proxy: lo limita artificialmente y asigna solo una parte del ancho de banda de la interfaz para las copias de seguridad
Pros | Contras |
Simple y versátil. Los proxies pueden ser físicos y virtuales. | Como regla, es mucho más lento que HotAdd, especialmente en grandes volúmenes de respaldo y una pequeña cantidad de tareas paralelas. |
Inicio rápido, sin demora en el montaje de unidades. No hay problema con las instantáneas. | Crea una carga (pequeña) en la interfaz de administración y el hipervisor. |
Al mismo tiempo, muchas fuentes afirman que NBD es muy lento a 1 GbE, pero a 10 GbE puede ser bastante rápido. Definitivamente comprobaremos esto.
Programa de prueba
En la infraestructura descrita anteriormente, es necesario hacer una copia de seguridad de las máquinas virtuales de prueba y registrar los siguientes indicadores:
- Carga de la CPU,%
- Consumo de RAM, GB
- Carga de red, Gbps
- Rendimiento de respaldo, MB / s
- Tiempo de respaldo, mm: ss
Los indicadores deben repararse para la copia de seguridad de una máquina virtual de prueba y para la copia de seguridad paralela de dos, cuatro y seis máquinas virtuales de prueba.
Los indicadores deben registrarse para los modos de funcionamiento del dispositivo virtual y el proxy de respaldo de red. Cada vez que se debe realizar una copia de seguridad completa, no hay incrementos.
Por lo tanto, es necesario crear 4 trabajos de copia de seguridad:
- Para una prueba de VM
- Para dos máquinas virtuales de prueba
- Para cuatro máquinas virtuales de prueba
- Para seis máquinas virtuales de prueba
Como parte de la prueba, es necesario:
- Ejecuta secuencialmente todas las tareas en un modo
- Eliminar las copias de seguridad creadas para que no haya incrementos
- Repita las ejecuciones en el segundo modo, cada vez que fija los indicadores
En la configuración de cada tarea, debe seleccionar manualmente un proxy de respaldo preparado para la prueba, ya que no es el único en la infraestructura general de VBR, y por defecto el proxy se selecciona automáticamente.
El modo proxy de respaldo predeterminado también se selecciona automáticamente. Por lo tanto, en la configuración del proxy de respaldo, antes de cada ejecución, configure manualmente el modo de transporte deseado.
El indicador más interesante es la velocidad promedio o el rendimiento de la copia de seguridad. Se puede ver en los resultados del trabajo en la consola VBR. También mostrará el tiempo de ejecución de la copia de seguridad.
Además, debe evaluar la carga en el proxy de respaldo en cada una de las pruebas. La CPU, la memoria y la congestión de la red se pueden monitorear utilizando las herramientas del sistema operativo invitado (Windows 2016) y a nivel de VMware.
En el proxy de respaldo y los repositorios de respaldo, el parámetro para el número máximo de tareas simultáneas se establece en 6. Esto significa que durante la prueba, todas las máquinas virtuales en cada tarea se procesarán en paralelo, ninguna de ellas esperará en la cola, el rendimiento será máximo.
Veeam® recomienda que la cantidad de tareas paralelas no debe exceder la cantidad de núcleos de procesador en servidores proxy y repositorios. La cantidad recomendada de RAM en el repositorio es de 2 GB por núcleo, un total de 12 GB. La configuración de la infraestructura muestra que se siguen todas las recomendaciones.
Velocidad de respaldo y carga en modo Virtual Appliance (Hot Add)
Copia de seguridad 1 VM
Carga de proxy de respaldoIndicador | Valor |
Carga de la CPU,% | 55-95 |
Consumo de RAM, GB | 2-2,2 |
Carga de red, Gbps | 4.7-6.4 |
Velocidad de respaldoIndicador | Valor |
Rendimiento de respaldo, MB / s | 709 |
Tiempo de respaldo, mm: ss | 06:35 |
Backup 2 VM
Carga de proxy de respaldoIndicador | Valor |
Carga de la CPU,% | 70-100 (estante 100% con caídas cortas y agudas al 70%) |
Consumo de RAM, GB | 2.3-2.5 |
Carga de red, Gbps | 5-7.7 |
Velocidad de respaldoIndicador | Valor |
Rendimiento de respaldo, MB / s | 816 |
Tiempo de respaldo, mm: ss | 10:03 |
Backup 4 VM
Carga de proxy de respaldoIndicador | Valor |
Carga de la CPU,% | 100 (estante 100% con pequeñas gotas raras) |
Consumo de RAM, GB | 3-3.5 |
Carga de red, Gbps | 5-8,2 |
Velocidad de respaldoIndicador | Valor |
Rendimiento de respaldo, MB / s | 885 |
Tiempo de respaldo, mm: ss | 17:10 |
Backup 6 VM
Carga de proxy de respaldoIndicador | Valor |
Carga de la CPU,% | 100 (estante 100% con pequeñas gotas raras) |
Consumo de RAM, GB | 4-4,2 |
Carga de red, Gbps | 5-8,2 |
Velocidad de respaldoIndicador | Valor |
Rendimiento de respaldo, MB / s | 888 |
Tiempo de respaldo, mm: ss | 24:42 |
Velocidad de respaldo y carga de modo de red (NBD)
Copia de seguridad 1 VM
Carga de proxy de respaldoIndicador | Valor |
Carga de la CPU,% | 18-24 |
Consumo de RAM, GB | 1.9-2.1 |
Carga de red, Gbps | 1.2-1.8 |
Velocidad de respaldoIndicador | Valor |
Rendimiento de respaldo, MB / s | 192 |
Tiempo de respaldo, mm: ss | 18:30 |
Backup 2 VM
Carga de proxy de respaldoIndicador | Valor |
Carga de la CPU,% | 25-33 |
Consumo de RAM, GB | 2.2-2.4 |
Carga de red, Gbps | 1.5-2.5 |
Velocidad de respaldoIndicador | Valor |
Rendimiento de respaldo, MB / s | 269 |
Tiempo de respaldo, mm: ss | 25:50 |
Backup 4 VM
Carga de proxy de respaldoIndicador | Valor |
Carga de la CPU,% | 45-55 |
Consumo de RAM, GB | 2.8-3.5 |
Carga de red, Gbps | 2.8-4.5 |
Velocidad de respaldoIndicador | Valor |
Rendimiento de respaldo, MB / s | 446 |
Tiempo de respaldo, mm: ss | 31:14 |
Backup 6 VM
Carga de proxy de respaldoIndicador | Valor |
Carga de la CPU,% | 50-70 |
Consumo de RAM, GB | 3,5-4 |
Carga de red, Gbps | 3,5-5 |
Velocidad de respaldoIndicador | Valor |
Rendimiento de respaldo, MB / s | 517 |
Tiempo de respaldo, mm: ss | 40:02 |
Comparación de rendimiento y carga en el dispositivo virtual (HotAdd) y el modo de red (NBD)
Recuento de VM | Velocidad - HotAdd, MB / s | Velocidad - NBD, MB / s | HotAdd / NBD |
1 | 709 | 192 | 3,69 |
2 | 816 | 269 | 3,03 |
4 4 | 885 | 446 | 1,98 |
6 6 | 888 | 517 | 1,72 |
Recuento de VM | Carga de CPU: HotAdd,% | Carga de CPU - NBD,% | HotAdd / NBD |
1 | 55-95 | 18-24 | 3.06-3.96 |
2 | 70-100 | 25-33 | 2.8-3.03 |
4 4 | 100 | 45-55 | 1.82-2.22 |
6 6 | 100 | 50-70 | 1.43-2 |
Recuento de VM | Descargar RAM. HotAdd, GB | Carga de RAM - NBD, GB | HotAdd / NBD |
1 | 2-2,2 | 1.9-2.1 | 1.05 |
2 | 2.3-2.5 | 2.2-2.4 | 1,04-1,05 |
4 4 | 3-3.5 | 2.8-3.5 | 1-1.07 |
6 6 | 4-4,2 | 3,5-4 | 1.14-1.05 |
Recuento de VM | Descarga de red - HotAdd, Gb / s | Descarga de red - NBD, Gb / s | HotAdd / NBD |
1 | 4.7-6.4 | 1.2-1.8 | 3.56-3.92 |
2 | 5-7.7 | 1.5-2.5 | 3.08-3.33 |
4 4 | 5-8,2 | 2.8-4.5 | 1.79-1.82 |
6 6 | 5-8,2 | 3,5-5 | 1.43-1.64 |
Resultados de prueba
Los indicadores de rendimiento de la copia de seguridad obtenidos como resultado de las pruebas confirman inequívocamente el hecho de que el modo de dispositivo virtual es significativamente superior en velocidad en comparación con el modo de red, especialmente en un pequeño número de tareas paralelas.
Permítame recordarle que las pruebas para ambos modos se ejecutaron bajo condiciones absolutamente idénticas en la misma plataforma. El ancho de banda de la red también era el mismo: las interfaces de control a través de las cuales el proxy recopila datos en modo NBD proporcionan 10 Gbit / s, como la red vSAN para el modo HotAdd, no establecimos ningún límite de ancho de banda.
Obviamente, ESXi realmente ralentiza Veeam® y le da solo una parte de la banda en modo Red, de ahí las diferencias en la velocidad de respaldo. Sin embargo, con el aumento en el número de subprocesos (tareas de copia de seguridad simultáneas), el modo de red reduce significativamente la acumulación.
Vemos que en el modo de dispositivo virtual, ya en 4 VM, el proxy de respaldo descansa en el procesador, no puede funcionar más rápido, para 6 VM la velocidad de respaldo no ha cambiado mucho. Al mismo tiempo, la velocidad de respaldo de 1-2 máquinas virtuales en este modo está ligeramente por detrás, las capacidades de los servidores proxy y las plataformas de respaldo se utilizan al máximo incluso en un pequeño número de subprocesos.
En el modo Red, por el contrario, hay un aumento significativo en la productividad con un aumento en el número de tareas simultáneas. Al mismo tiempo, la carga en el procesador proxy de respaldo es significativamente menor que en el modo HotAdd, incluso en 6 subprocesos no supera el 70%.
El consumo de memoria del proxy de respaldo es pequeño y aproximadamente el mismo en ambos modos.
La carga en la red de proxy de respaldo se correlaciona con la velocidad de respaldo, excediéndola en ~ 10-17%. Aparentemente, el proxy toma los datos de las fuentes de VM un poco más rápido de lo que carga en el repositorio, ya que necesitan ser procesados.
Es interesante observar la carga de la línea en las imágenes con los resultados de la ejecución del trabajo. Muestra el nivel de carga en varios elementos de la infraestructura de respaldo: fuente, proxy, red, repositorio.
En el modo de dispositivo virtual, vemos que el rendimiento de la copia de seguridad se basa en el proxy y la red, siempre son aproximadamente la misma carga. La fuente y el repositorio no son un cuello de botella.
En el modo de red, el cuello de botella es siempre la fuente, incluso para una sola secuencia. Se puede ver que el resto de la infraestructura puede dar más, pero ESXi no les da.
Resumen
, - , .
Veeam® :
, .
, .