Cómo compactar hasta un 90% de almacenamiento de copias de seguridad en el almacenamiento de objetos

Nuestros clientes turcos nos pidieron que configuremos la copia de seguridad para el centro de datos correctamente. Estamos haciendo proyectos similares en Rusia, pero fue aquí donde la historia fue más sobre investigar la mejor manera de hacerlo.

Dado: hay un almacenamiento local S3, hay Veritas NetBackup, que ha adquirido una nueva funcionalidad avanzada para mover datos a tiendas de objetos ahora con soporte de deduplicación, y hay un problema con el espacio libre en este almacenamiento local.

Objetivo: hacer todo para que el proceso de almacenamiento de respaldo sea rápido y económico.

En realidad, antes de eso, en S3 todo eran solo archivos, y estos eran modelos completos de máquinas críticas de centros de datos. No es que esté muy optimizado, pero todo funcionó desde el principio. Ahora es el momento de resolverlo y hacerlo bien.

En la imagen, a lo que hemos llegado:



Como puede ver, la primera copia de seguridad se realizó lentamente (70 Mb / s), y las copias de seguridad posteriores de los mismos sistemas fueron mucho más rápidas.

En realidad, un poco más de detalles sobre qué características hay.

Registros de respaldo para aquellos que están listos para leer media página de volcado
Completo con reescaneo
18 de diciembre de 2018 12:09:43 PM - El acelerador Info bpbkar (pid = 4452) envió 14883996160 bytes de 14883994624 bytes al servidor, optimización 0.0%
18 de diciembre de 2018 12:10:07 PM - Información NBCC (pid = 23002) StorageServer = PureDisk_rhceph_rawd: s3.cloud.ngn.com.tr; Informe = Estadísticas PDDO (flujo de subprocesos múltiples utilizado) para (NBCC): escaneado: 14570817 KB, CR enviado: 1760761 KB, CR enviado a través de FC: 0 KB, deduplicación: 87.9%, caché deshabilitado

Lleno
18 de diciembre de 2018 12:13:18 PM - El acelerador Info bpbkar (pid = 2864) envió 181675008 bytes de 14884060160 bytes al servidor, optimización 98.8%
18 de diciembre de 2018 12:13:40 PM - Información NBCC (pid = 23527) StorageServer = PureDisk_rhceph_rawd: s3.cloud.ngn.com.tr; Informe = PDDO Estadísticas para (NBCC): escaneado: 14569706 KB, CR enviado: 45145 KB, CR enviado a través de FC: 0 KB, deduplicación: 99.7%, caché deshabilitado

Incremental
18 de diciembre de 2018 12:15:32 PM - El acelerador Info bpbkar (pid = 792) envió 9970688 bytes de 14726108160 bytes al servidor, optimización 99.9%
18 de diciembre de 2018 12:15:53 ​​PM - Información NBCC (pid = 23656) StorageServer = PureDisk_rhceph_rawd: s3.cloud.ngn.com.tr; Informe = PDDO Stats for (NBCC): escaneado: 14383788 KB, CR enviado: 15700 KB, CR enviado a través de FC: 0 KB, deduplicación: 99.9%, caché deshabilitado

Lleno
18 de diciembre de 2018 12:18:02 PM - El acelerador Info bpbkar (pid = 3496) envió 171746816 bytes de 14884093952 bytes al servidor, optimización 98.8%
18 de diciembre de 2018 12:18:24 PM - Información NBCC (pid = 23878) StorageServer = PureDisk_rhceph_rawd: s3.cloud.ngn.com.tr; Informe = PDDO Stats for (NBCC): escaneado: 14569739 KB, CR enviado: 34120 KB, CR enviado a través de FC: 0 KB, deduplicación: 99.8%, caché deshabilitado


Cual es el problema


Los clientes desean realizar copias de seguridad con la mayor frecuencia posible y almacenar de la manera más económica posible. Es barato almacenarlos mejor en el almacenamiento de objetos de tipo S3, porque son los más baratos al precio de mantenimiento por megabyte desde donde puede retroceder en un período de tiempo razonable. Cuando hay muchas copias de seguridad, no es muy barato, porque la mayor parte del almacenamiento está ocupado por copias de los mismos datos. En el caso de HaaS de colegas turcos, el almacenamiento puede densificarse en aproximadamente un 80-90%. Está claro que esto se aplica específicamente a sus detalles, pero definitivamente contaría con al menos el 50% de la deducción.

Para resolver el problema, los principales proveedores han creado puertas de enlace en Amazon S3. Todos sus métodos son compatibles con S3 local si son compatibles con la API de Amazon. En el centro de datos turco, la copia de seguridad se realiza en nuestro S3, así como en el "Compresor" T-III en Rusia, ya que dicho esquema de trabajo demostró ser bueno con nosotros.

Y nuestro S3 es totalmente compatible con los métodos de copia de seguridad en Amazon S3. Es decir, todas las herramientas de respaldo que admiten estos métodos le permiten copiar todo a ese almacenamiento "listo para usar".

Veritas NetBackup creó una característica de CloudCatalyst:



Es decir, entre las máquinas que necesitan copia de seguridad y la puerta de enlace hay un servidor Linux intermedio a través del cual pasa el tráfico de copia de seguridad de los agentes de CPC y la deduplicación se realiza sobre la marcha antes de transferirlos a S3. Si antes había 30 copias de seguridad de 20 GB cada una con compresión, ahora (debido a la similitud de las máquinas) se han vuelto un 90% más pequeñas en volumen. El motor de deduplicación se usa igual que cuando se almacena en discos normales con Netbackup.

Esto es lo que sucede antes del servidor provisional:



Probamos y llegamos a la conclusión de que cuando se implementa en nuestros centros de datos, esto ahorra espacio en los almacenes S3 para nosotros y para los clientes. Como propietario de los centros de datos comerciales, por supuesto, cobramos por el volumen ocupado, pero aún así es muy rentable para nosotros, porque comenzamos a ganar lugares más escalables en el software y no en el alquiler de hierro. Bueno, esto es una reducción en los costos internos.

Registros
228 Trabajos (0 En cola 0 Activo 0 En espera de reintento 0 Suspendido 0 Incompleto 228 Hecho - 13 seleccionados)
(Filtro aplicado [13])

Tipo de Id. De trabajo Estado Estado Detalles Estado Política de trabajo Horario de trabajo Cliente Servidor de medios Hora de inicio Tiempo transcurrido Hora de finalización Unidad de almacenamiento Intento Operación Kilobytes Archivos Nombre de ruta% completado (estimado) PID del propietario Propietario Copiar ID de trabajo principal KB / Sec Inicio activo Activo Active Elapsed Robot Vault Profile Session Medios de ID para expulsar el movimiento de datos Tipo fuera del host Prioridad maestra Tasa de deduplicación Acelerador de transporte Instancia de optimización o base de datos Compartir host
- 1358 Instantánea realizada 0 VMware - NGNCloudADC NBCC 18 de diciembre de 2018 12:16:19 PM 00:02:18 18 de diciembre de 2018 12:18:37 PM STU_DP_S3 _ **** copia de seguridad 1 100% raíz 1358 18 de diciembre de 2018 12 : 16: 27 PM 00:02:10 Disco de recuperación instantánea WIN estándar - *********** 0
1360 Copia de seguridad realizada 0 VMware Full NGNCloudADC NBCC 18 de diciembre de 2018 12:16:48 PM 00:01:39 18 de diciembre de 2018 12:18:27 PM STU_DP_S3 _ **** copia de seguridad 1 14,535,248 149654 100% 23858 raíz 1358 335,098 dic 18 , 2018 12:16:48 PM 00:01:39 Disco de recuperación instantánea WIN estándar - *********** 0 99.8% 99%
1352 Instantánea realizada 0 VMware - NGNCloudADC NBCC 18 de diciembre de 2018 12:14:04 PM 00:02:01 18 de diciembre de 2018 12:16:05 PM STU_DP_S3 _ **** copia de seguridad 1 100% raíz 1352 18 de diciembre de 2018 12: 14:14 PM 00:01:51 Disco de recuperación instantánea WIN estándar - *********** 0
1354 Copia de seguridad realizada 0 VMware Incremental NGNCloudADC NBCC 18 de diciembre de 2018 12:14:34 PM 00:01:21 18 de diciembre de 2018 12:15:55 PM STU_DP_S3 _ **** copia de seguridad 1 14.380.965 147 100% 23617 raíz 1352 500.817 18 de diciembre , 2018 12:14:34 PM 00:01:21 Disco de recuperación instantánea WIN estándar - *********** 0 99.9% 100%
1347 Instantánea realizada 0 VMware - NGNCloudADC NBCC 18 de diciembre de 2018 12:11:45 PM 00:02:08 18 de diciembre de 2018 12:13:53 PM STU_DP_S3 _ **** copia de seguridad 1 100% raíz 1347 18 de diciembre de 2018 12: 11:45 PM 00:02:08 Disco de recuperación instantánea WIN estándar - *********** 0
1349 Copia de seguridad realizada 0 VMware Full NGNCloudADC NBCC 18 de diciembre de 2018 12:12:02 PM 00:01:41 18 de diciembre de 2018 12:13:43 PM STU_DP_S3 _ **** copia de seguridad 1 14,535,215 149653 100% 23508 raíz 1347 316,319 18 de diciembre , 2018 12:12:02 PM 00:01:41 Disco de recuperación instantánea WIN estándar - *********** 0 99.7% 99%
1341 Instantánea realizada 0 VMware - NGNCloudADC NBCC 18 de diciembre de 2018 12:05:28 PM 00:04:53 18 de diciembre de 2018 12:10:21 PM STU_DP_S3 _ **** copia de seguridad 1 100% raíz 1341 18 de diciembre de 2018 12: 05:28 PM 00:04:53 Disco de recuperación instantánea WIN estándar - *********** 0
1342 Copia de seguridad realizada 0 VMware Full_Rescan NGNCloudADC NBCC 18 de diciembre de 2018 12:05:47 PM 00:04:24 18 de diciembre de 2018 12:10:11 PM STU_DP_S3 _ **** copia de seguridad 1 14,535,151 149653 100% 22999 raíz 1341 70,380 18 de diciembre , 2018 12:05:47 PM 00:04:24 Disco de recuperación instantánea WIN estándar - *********** 0 87.9% 0%

1339 Instantánea realizada 150 VMware - NGNCloudADC NBCC 18 de diciembre de 2018 11:05:46 AM 00:00:53 18 de diciembre de 2018 11:06:39 AM STU_DP_S3 _ **** copia de seguridad 1 100% raíz 1339 18 de diciembre de 2018 11: 05:46 AM 00:00:53 Instant Recovery Disk Standard WIN - *********** 0
1327 Instantánea realizada 0 VMware - *******. ********. Cloud NBCC 17 de diciembre de 2018 12:54:42 PM 05:51:38 17 de diciembre de 2018 6:46:20 PM STU_DP_S3 _ **** copia de seguridad 1 100% raíz 1327 17 de diciembre de 2018 12:54:42 PM 05:51:38 Disco de recuperación instantánea Estándar WIN - *********** 0
1328 Copia de seguridad realizada 0 VMware Full *******. ********. Cloud NBCC 17 de diciembre de 2018 12:55:10 PM 05:29:21 17 de diciembre de 2018 6:24:31 PM STU_DP_S3 _ **** copia de seguridad 1.222.602.719 258932 100% 12856 raíz 1327 11.326 17 de diciembre de 2018 12:55:10 PM 05:29:21 Disco de recuperación instantánea Estándar WIN - *********** 0 87.9% 0%
1136 Instantánea realizada 0 VMware - *******. ********. Cloud NBCC 14 de diciembre de 2018 4:48:22 PM 04:05:16 14 de diciembre de 2018 8:53:38 PM STU_DP_S3 _ **** copia de seguridad 1 100% raíz 1136 14 de diciembre de 2018 4:48:22 PM 04:05:16 Instant Recovery Disk Standard WIN - *********** 0
1140 Copia de seguridad realizada 0 VMware Full_Scan *******. ********. Cloud NBCC 14 de diciembre de 2018 4:49:14 PM 03:49:58 14 de diciembre de 2018 8:39:12 PM STU_DP_S3 _ **** copia de seguridad 1 217,631,332 255465 100% 26438 raíz 1136 15,963 14 de diciembre de 2018 4:49:14 PM 03:49:58 Disco de recuperación instantánea Estándar WIN - *********** 0 45.2% 0%

El acelerador le permite reducir el tráfico de los agentes, porque solo se transmiten los cambios de datos, es decir, incluso las copias de seguridad completas no se vuelven completas, ya que el servidor de medios recopila las copias de seguridad completas posteriores de las copias de seguridad incrementales.

El servidor intermedio tiene su propio repositorio donde escribe un "caché" de datos y contiene la base para la deduplicación.

En arquitectura completa, se ve así:

  1. El servidor maestro administra la configuración, las actualizaciones y más, y se encuentra en la nube.
  2. El servidor de medios (máquina intermedia * nix) debe ubicarse más cerca de los sistemas redundantes en términos de disponibilidad de red. Aquí las copias de seguridad se deduplican de todas las máquinas redundantes.
  3. Hay agentes en las máquinas redundantes que generalmente envían al servidor de medios solo lo que no está en su almacenamiento.

Todo comienza con un escaneo completo: esta es una copia de seguridad completa. En este punto, el servidor de medios toma todo, lo deduplica y lo transfiere a S3. La velocidad para el servidor de medios es baja, desde allí, más alta. La principal limitación es la potencia de procesamiento del servidor.

Las siguientes copias de seguridad se completan desde el punto de vista de todos los sistemas, pero en realidad es algo así como copias de seguridad completas sintéticas. Es decir, la transferencia y la grabación reales en el servidor de medios son solo aquellos bloques de datos que aún no se han visto en las copias de seguridad de VM. Y la transferencia y grabación a S3 son solo aquellos bloques de datos cuyo hash no está en la base de datos de deduplicación del servidor de medios. En palabras más simples, que antes no había máquinas virtuales en ninguna copia de seguridad.

Al restaurar, el servidor de medios solicita los objetos deduplicados necesarios de S3, los rehidrata y los pasa a los agentes de CPC, es decir Es necesario tener en cuenta el volumen de tráfico durante la restauración, que será igual al volumen real de datos que se está restaurando.

Así es como se ve:



Y aquí hay otra pieza de troncos
169 Trabajos (0 En cola 0 Activo 0 En espera de reintento 0 Suspendido 0 Incompleto 169 Hecho - 1 seleccionado)

Tipo de Id. De trabajo Estado Estado Detalles Estado Política de trabajo Horario de trabajo Cliente Servidor de medios Hora de inicio Tiempo transcurrido Hora de finalización Unidad de almacenamiento Intento Operación Kilobytes Archivos Nombre de ruta% completado (estimado) PID del propietario Propietario Copiar ID de trabajo principal KB / Sec Inicio activo Activo Active Elapsed Robot Vault Profile Session Medios de ID para expulsar el movimiento de datos Tipo fuera del host Prioridad maestra Tasa de deduplicación Acelerador de transporte Instancia de optimización o base de datos Compartir host
- 1372 Restauración realizada 0 nbpr01 NBCC 19 de diciembre de 2018 1:05:58 PM 00:04:32 19 de diciembre de 2018 1:10:30 PM 1 14,380,577 1 100% 8548 raíz 1372 70,567 19 de diciembre de 2018 1:06:00 PM 00:04:30 GANAR - *********** 90,000

La integridad de los datos está garantizada por la protección de S3 en sí misma: existe una buena redundancia para proteger contra fallas de hardware, como un eje muerto del disco duro.

El servidor de medios necesita 4 terabytes de caché; esta es la recomendación de Veritas para el tamaño mínimo. Mejor aún, pero acabamos de hacer eso.

Resumen


Cuando un socio lanzó 20 GB a nuestro S3, almacenamos 60 GB, porque proporcionamos tres veces la geo-reserva de datos. Ahora el tráfico es mucho menor, lo cual es bueno tanto para el canal como para la carga de almacenamiento.

En este caso, las rutas se cierran más allá de la "gran Internet", pero puede conducir el tráfico a través de VPN L2 a través de Internet, pero es mejor configurar el servidor de medios en la entrada del proveedor.

Si está interesado en conocer estas características en nuestros centros de datos rusos o si tiene preguntas sobre su implementación, pregunte en los comentarios o ekorotkikh@croc.ru.

Source: https://habr.com/ru/post/461717/


All Articles