Veeam Backup & Replication: consejos útiles para hacer viables las copias de seguridad y réplicas

Hoy, nuevamente me complace presentarles buenos consejos de mi colega Evgeny Ivanov, líder del equipo de soporte técnico de Veeam. Esta vez, Zhenya compartió recomendaciones para trabajar con copias de seguridad y réplicas. Espero que lo ayuden a evitar errores comunes, y sus réplicas y copias de seguridad nunca serán un "eslabón débil" en el proceso de recuperación, si es necesario.

Así que bienvenido al gato.



En mi artículo anterior , descubrimos cómo optimizar la carga en los componentes de la infraestructura de respaldo y examinamos los errores de configuración típicos. Pasamos a otro tema importante: la preparación competente y la implementación de la recuperación. También lo analizaremos con ejemplos reales con los que el equipo de soporte técnico ha trabajado.

Copia de seguridad sin restaurante: dinero por el desagüe


Nos contactan regularmente los usuarios que se encuentran en situaciones difíciles similares: es necesario realizar una recuperación de la copia de seguridad, pero cuando intentan hacerlo, las personas se topan con un problema insoluble para ellos. Y este problema no es en absoluto la falta de una copia de seguridad, la actividad de CryptoLocker o algo así. Esto es "simplemente" una falta de atención para verificar las copias de seguridad y las réplicas para la recuperación. Muchos a menudo se centran únicamente en el proceso de copia de seguridad, olvidando que simplemente tener una copia de seguridad no es una panacea para posibles problemas. Debe comprender que la recuperación es un proceso completamente diferente, que tiene sus propias características y que debe ser monitoreado y probado antes de iniciar la producción. Aquí hay algunos ejemplos ilustrativos:

  1. El usuario tuvo una falla en la operación de una máquina virtual crítica de tamaño 20 TB. El tiempo de inactividad, por supuesto, es inaceptable, y el administrador inicia el proceso de recuperación instantánea (recuperación instantánea de VM): después de 5 minutos, la máquina está activa. Pero recordamos que este estado de la máquina solo puede usarse temporalmente, debe migrarse al almacén de datos de producción. Y en este ejemplo, como resultó, las capacidades de infraestructura no permitieron copiar 20 TB de datos en un tiempo razonable. En la configuración del proceso de recuperación instantánea, se eligió guardar los cambios en la unidad C: del servidor Veeam Backup & Replication (a diferencia de la instantánea vSphere), como resultado, por supuesto, el espacio libre en el disco se llenó rápidamente. Para cuando el usuario contactó con el soporte, la VM tenía cambios que no podían ignorarse. Es decir, tenemos una situación en la que es imposible finalizar rápidamente el proceso de recuperación instantánea de una máquina crítica: ¿cómo puede guardar datos?

    Debo admitir que en los últimos años no mencionaré todos los detalles del final, pero recuerdo que al final nunca se nos ocurrió nada brillante. Los clientes de su lado al menos resolvieron este problema expandiendo la unidad C: desde las reservas, copiaron los archivos más importantes y luego apagaron las máquinas virtuales y migraron. En general, no ocurrió un milagro.
  2. El usuario tenía un controlador de dominio en la infraestructura, y todos los componentes de Veeam Backup & Replication se configuraron utilizando DNS. Sí, es cierto, has oído bien. Hubo un centenar de opciones para eventos, nada menos, pero la realidad fue así: la gente planificó el mantenimiento y decidió cambiar a una réplica de su controlador de dominio. Involucraban el cambio planificado, que, en general, se recomienda hacer en tales situaciones. En la primera etapa, todo salió bien, y en la segunda, la VM original se apagó brevemente para transferir los datos restantes. Por supuesto, el trabajo de cambio terminó inmediatamente en error, porque DNS dejó de funcionar.

    Afortunadamente, aquí pudimos hacer frente a la situación al habilitar la réplica manualmente desde vSphere (en realidad, no se recomienda realizar esta operación por nuestra cuenta, como verá en el siguiente ejemplo). Pero, como comprenderá, el proceso de mantenimiento fue interrumpido y pospuesto. Además, tuvimos que ingresar manualmente los nombres de host en el archivo C: \ Windows \ System32 \ drivers \ etc \ hosts en el servidor Veeam Backup & Replication para garantizar la corrección al volver a cambiar.
  3. Otro cliente tenía toda la infraestructura de respaldo construida alrededor de unidades de cinta, y solo se almacenaban cadenas cortas de archivos en el disco. Cuando necesitaban restaurar una cantidad de archivos de un servidor de archivos grande, resultó que ninguna máquina podía usarse como depósito auxiliar cuando se recuperaba de la cinta, ya que no había suficiente espacio libre en uno. (Puede leer sobre la recuperación de la cinta magnética directamente y usar un repositorio auxiliar aquí (hasta ahora en inglés)).

Creo que en los tres ejemplos, los usuarios, por así decirlo, quedaron cautivados por las ilusiones: sugirieron que si la copia de seguridad fue exitosa, entonces no habrá problemas con la recuperación. Pero esto, como usted sabe, no es siempre el caso, y por lo tanto, debe prepararse para la recuperación tan cuidadosamente como lo hace para la copia de seguridad. Para empezar, vale la pena estudiar el manual del usuario , que contiene información bastante detallada sobre los diferentes tipos de recuperación. Al comienzo de cada párrafo, se enumeran los requisitos, los pasos preparatorios y las posibles limitaciones. La descripción de la recuperación de cintas magnéticas o de imágenes de hardware de sistemas de almacenamiento se puede encontrar en las secciones de la documentación y en nuestros artículos sobre Habré. Además, los pasos para preparar la recuperación de los objetos de la aplicación utilizando las herramientas Veeam Explorers se describen en la sección "Planificación y preparación" del manual para cada herramienta. Le recomiendo que los lea detenidamente; esto lo ayudará a preparar adecuadamente el sistema para la recuperación si es necesario. En ruso, aquí se dan instrucciones para restaurar la base de datos de SQL Server.

¿Por qué no necesita trabajar con réplicas desde la consola vSphere?


En teoría, las réplicas de Veeam son máquinas virtuales ordinarias con las que parece lógico trabajar usando el kit de herramientas vSphere, en particular, el cliente vSphere. Sin embargo, no recomendamos hacer esto, y he aquí por qué: cambiar a una réplica en Veeam Backup & Replication es un proceso bastante complicado que requiere pasos estrictamente secuenciales (para que pueda retroceder un paso en ese caso) y los pasos finales correctos: solo mire imagen que ilustra el proceso:



Si decide habilitar una réplica del cliente vSphere, en el futuro lo más probable es que espere una serie de problemas:

  1. El cambio al mecanismo de réplica de Veeam Backup & replication (que se muestra en el diagrama) para esta máquina ya no funcionará.
  2. Los datos en la base de datos de Veeam Backup no se corresponderán con el estado real de la VM. En el peor de los casos, debe editar la base de datos para solucionarlo.
  3. Incluso puede haber pérdida de datos, como en este ejemplo: el usuario activó manualmente la réplica en el cliente vSphere y decidió continuar trabajando con ella. Después de un tiempo, notó que la réplica todavía se mostraba en la consola Veeam Backup & Replication y decidió eliminarla como innecesaria. Hice clic con el botón derecho y le di el comando "Eliminar del disco" . Veeam Backup & Replication eliminó inmediatamente la réplica del disco, que, por un momento, ya estaba en pleno uso como una máquina virtual normal y contenía los datos necesarios y útiles.

Por supuesto, hay situaciones en las que todavía tiene que habilitar la réplica desde el cliente vSphere; por regla general, estos son casos en los que el servidor Veeam está apagado y la réplica debe encenderse con demora. Pero si todo está en orden con el servidor Veeam, entonces debe trabajar con réplicas desde su consola.

Además, no elimine réplicas con el cliente vSphere. Veeam Backup & Replication no se dará cuenta de dicho cambio, y esto está lleno de errores y datos obsoletos. Si ya no necesita la réplica, elimínela utilizando la consola Veeam, y no como una VM del cliente vSphere. Por lo tanto, siempre tendrá una lista actualizada de réplicas.

"O" - ¡cuidado, actualizaciones!


Aquí nos referimos, por supuesto, a actualizaciones para hipervisores y varias aplicaciones que se respaldan con Veeam. Si los mira desde el punto de vista de trabajar con Veeam Backup & Replication, las actualizaciones se pueden dividir en 2 categorías: grandes, serias, con muchos cambios, y pequeñas.

Considere primero la primera categoría.

Las actualizaciones más importantes son las diseñadas para el hipervisor. Antes de instalar dicha actualización, debe asegurarse de que sea compatible con Veeam Backup & Replication. Dichas actualizaciones traen muchos cambios a las bibliotecas y API que utiliza Veeam Backup & Replication, por lo que para anunciar oficialmente su soporte, debe actualizar el código Veeam Backup & Replication y realizar pruebas rigurosas.

También debemos tener en cuenta que, por ejemplo, VMware no proporciona acceso preliminar a las últimas versiones de vSphere para los fabricantes de software, por lo que los desarrolladores y evaluadores de Veeam reciben una nueva versión al mismo tiempo que el resto de la humanidad progresiva, por lo tanto, generalmente entre el lanzamiento de VMware y el soporte anunciado oficialmente cierto tiempo El número y la variedad de cambios necesarios para hacer que una simple revisión se ajuste a sus posibilidades es pequeña, y el soporte oficial, como regla, se anuncia junto con el lanzamiento de la versión de lanzamiento de Veeam Backup & Replication.

Como resultado, existe ese momento incómodo cuando, después del lanzamiento de la nueva versión de vSphere, la cantidad de solicitudes de soporte técnico aumenta drásticamente, porque los usuarios se apresuran a instalar la nueva versión y, por supuesto, sus copias de seguridad dejan de funcionar inmediatamente. Nosotros, el soporte técnico de Veeam, tenemos que explicar a los usuarios exactamente lo que hicieron mal, pedirles que retrocedan (si es posible), o pensar en formas intrincadas para superar el punto muerto. Por lo tanto, antes de instalar una actualización importante, asegúrese de verificar su compatibilidad con el software que se ejecuta en su computadora, ¡se lo ruego!

Todo lo anterior se aplica a las aplicaciones que respalda y espera recuperar con Veeam. La línea de herramientas de Veeam Explorers también tiene una lista de versiones compatibles de las aplicaciones respectivas, que se actualiza con cada versión de Veeam Backup & Replication. Por lo tanto, antes de instalar una nueva versión de su aplicación, ya sea Exchange, Oracle o SharePoint, asegúrese de volver a leer la sección correspondiente de la documentación de Veeam Explorers .

A la segunda categoría, es decir Me refiero a actualizaciones menores, por ejemplo, nuevas versiones de VMware Tools, actualizaciones acumulativas de Exchange, actualizaciones de seguridad de vSphere, etc. Como regla general, no llevan modificaciones importantes con ellos, y en la mayoría de los casos Veeam Backup & Replication no experimenta problemas con ellos. (Por lo tanto, no hay anuncios públicos de soporte oficial para el producto para ellos). Sin embargo, en nuestra práctica ha habido casos en que dichas actualizaciones han cambiado el curso habitual de las cosas de manera tan significativa que provocaron errores en Veeam Backup & Replication. En tales situaciones, después de confirmar el problema, los ingenieros de Veeam intentan liberar la revisión rápidamente.

Los que hablan inglés técnico.
Si desea saber en qué están trabajando los ingenieros y a qué se enfrentan los arquitectos de sistemas y los especialistas en soporte técnico, le recomiendo suscribirse a nuestros foros . Cada semana, TheRealGostev crea un boletín de Word from Gostev para los suscriptores . En él, Anton Gostev, jefe del departamento de gestión de productos, habla sobre los problemas encontrados recientemente (y no solo en el lado de Veeam), planea nuevas versiones y noticias del mundo de TI. Si necesita más información, puede estudiar los temas del foro; si uno de los clientes tiene un problema con el producto después de cualquier actualización, lo más probable es que ya haya escrito sobre él en el foro.

Como comprenderá, los parches y las actualizaciones pueden generar problemas no solo con las copias de seguridad, sino también con las aplicaciones para las que se realizan estas copias de seguridad. Y aquí los laboratorios virtuales: Veeam DataLabs lo ayudará. Probablemente haya escuchado sobre la funcionalidad de SureBackup, diseñada para verificar las copias de seguridad. Se basa precisamente en el uso de DataLabs, con la creación de un entorno aislado en el que puede, en particular, probar actualizaciones antes de instalarlas en producción. Te recomiendo encarecidamente que lo hagas: ahórrate muchas células nerviosas. Y si alguien más no sabe acerca de SureBackup, le recomiendo leer la documentación .

Quizás por hoy lo tengo todo, ¡gracias por su atención!

Que mas leer


Artículos sobre Habré:


Manual de usuario (en ruso)

Source: https://habr.com/ru/post/451770/


All Articles