Veeam Backup & Replication: conseils utiles pour rendre les sauvegardes et les répliques viables

Aujourd'hui, je suis à nouveau heureux de vous présenter les bons conseils de mon collègue Evgeny Ivanov, chef d'équipe du support technique Veeam. Cette fois, Zhenya a partagé des recommandations pour travailler avec des sauvegardes et des répliques. J'espère qu'ils vous aideront à éviter les erreurs courantes et que vos répliques et vos sauvegardes ne seront jamais un "maillon faible" dans le processus de récupération, si nécessaire.

Alors bienvenue au chat.



Dans mon article précédent , nous avons compris comment optimiser la charge sur les composants de l'infrastructure de sauvegarde et examiné les erreurs de configuration typiques. Nous passons à un autre sujet important - la préparation et la mise en œuvre compétentes du rétablissement. Nous allons également l'analyser à l'aide d'exemples concrets avec lesquels l'équipe de support technique a travaillé.

Sauvegarde sans restaurant - l'argent dans les égouts


Nous sommes régulièrement contactés par des utilisateurs qui se trouvent dans des situations difficiles similaires: il est nécessaire d'effectuer une récupération à partir d'une sauvegarde, mais lorsqu'ils tentent de le faire, les gens tombent sur un problème insoluble pour eux. Et ce problème n'est pas un manque de sauvegarde, l'activité de CryptoLocker ou quelque chose comme ça. Il s'agit «simplement» d'un manque d'attention à la vérification des sauvegardes et des répliques pour la récupération. Beaucoup se concentrent souvent uniquement sur le processus de sauvegarde, oubliant que le simple fait d'avoir une sauvegarde n'est pas une panacée pour d'éventuels problèmes. Vous devez comprendre que la récupération est un processus complètement différent, qui a ses propres caractéristiques et qui doit être surveillé et testé avant le lancement en production. Voici quelques exemples illustratifs:

  1. L'utilisateur a échoué dans le fonctionnement d'une machine virtuelle critique de taille 20 To. Les temps d'arrêt, bien sûr, sont inacceptables, et l'administrateur démarre le processus de récupération instantanée (récupération instantanée de la machine virtuelle) - après 5 minutes, la machine est en marche. Mais nous nous souvenons que cet état de la machine ne peut être utilisé que temporairement - il doit être migré vers le magasin de données de production. Et dans cet exemple, il s'est avéré que les capacités de l'infrastructure ne permettaient pas de copier 20 To de données dans un délai raisonnable. Dans les paramètres du processus de récupération instantanée, il a été choisi d'enregistrer les modifications sur le lecteur C: du serveur Veeam Backup & Replication (contrairement à l'instantané vSphere) - en conséquence, bien sûr, l'espace libre sur le disque est rapidement devenu plein. Au moment où l'utilisateur a contacté le support, la machine virtuelle avait des modifications qui ne pouvaient pas être ignorées. Autrement dit, nous avons une situation où il est impossible de finaliser rapidement le processus de récupération instantanée d'une machine critique - comment pouvez-vous enregistrer des données?

    Je dois admettre qu'au cours des dernières années, je ne mentionnerai pas tous les détails de la finale, mais je me souviens qu'au final, nous n'avons jamais rien trouvé de brillant. Les clients de leur côté, à tout le moins, ont résolu ce problème en développant le lecteur C: à partir des réserves, en copiant les fichiers les plus importants, puis en désactivant les machines virtuelles et en migrant ainsi. En général, un miracle ne s'est pas produit.
  2. L'utilisateur avait un contrôleur de domaine dans l'infrastructure et tous les composants Veeam Backup & Replication ont été configurés à l'aide de DNS. Oui, c'est vrai, vous avez bien entendu. Il y avait une centaine d'options pour les événements, pas moins, mais la réalité était la suivante: les gens ont planifié la maintenance et ont décidé de passer à une réplique de leur contrôleur de domaine. Ils impliquaient un changement planifié, ce qui est généralement recommandé dans de telles situations. Dans la première étape, tout s'est bien passé et dans la seconde, la machine virtuelle d'origine a été brièvement désactivée pour transférer les données restantes. Bien sûr, le travail de commutation s'est immédiatement terminé par erreur, car DNS a cessé de fonctionner.

    Heureusement, ici, nous avons pu faire face à la situation en activant manuellement la réplique à partir de vSphere (en fait, il n'est pas recommandé d'effectuer cette opération par nous-mêmes, comme vous le verrez dans l'exemple suivant). Mais, comme vous le comprenez, le processus de maintenance a été interrompu et reporté. De plus, nous avons dû saisir manuellement les noms d'hôte dans le fichier C: \ Windows \ System32 \ drivers \ etc \ hosts sur le serveur Veeam Backup & Replication pour garantir l'exactitude lors du basculement.
  3. Un autre client a construit toute l'infrastructure de sauvegarde autour de lecteurs de bande, et seules de courtes chaînes de fichiers ont été stockées sur le disque. Quand ils ont dû restaurer un certain nombre de fichiers à partir d'un grand serveur de fichiers, il s'est avéré qu'aucune machine ne pouvait être utilisée comme référentiel auxiliaire lors de la récupération à partir d'une bande, car il n'y avait pas assez d'espace libre sur une seule. (Vous pouvez en savoir plus sur la récupération à partir d'une bande magnétique et sur l'utilisation d'un référentiel auxiliaire ici (jusqu'à présent en anglais)).

Je pense que dans les trois exemples, les utilisateurs, pour ainsi dire, ont été captivés par des illusions - ils ont suggéré que si la sauvegarde était réussie, il n'y aurait aucun problème avec la récupération. Mais cela, comme vous le savez, n'est en aucun cas toujours le cas, et vous devez donc préparer la récupération aussi soigneusement que vous le faites pour la sauvegarde. Pour commencer, il vaut la peine d'étudier le manuel de l'utilisateur , qui contient des informations assez détaillées sur les différents types de récupération. Au début de chaque paragraphe, les exigences, les étapes préparatoires et les éventuelles limitations sont répertoriées. La description de la récupération à partir de bandes magnétiques ou d'images matérielles de systèmes de stockage se trouve dans les sections de la documentation et dans nos articles sur Habré. De plus, les étapes de préparation de la récupération des objets d'application à l'aide des outils Veeam Explorers sont décrites dans la section «Planification et préparation» du manuel de chaque outil. Je vous recommande de les lire attentivement - cela vous aidera à préparer correctement le système pour la récupération si nécessaire. En russe, les instructions de restauration de la base de données SQL Server sont données ici .

Pourquoi n'avez-vous pas besoin de travailler avec des répliques à partir de la console vSphere?


En théorie, les répliques Veeam sont des machines virtuelles ordinaires avec lesquelles il semble logique de travailler avec la boîte à outils vSphere, en particulier le client vSphere. Cependant, nous ne recommandons pas de le faire, et voici pourquoi: le passage à une réplique dans Veeam Backup & Replication est un processus assez compliqué qui nécessite des étapes strictement séquentielles (afin que vous puissiez annuler une étape si nécessaire) et les étapes finales correctes - il vous suffit de regarder image illustrant le processus:



Si vous décidez d'activer une réplique à partir du client vSphere, vous vous attendez très probablement à l'avenir à un certain nombre de problèmes:

  1. Le mécanisme de basculement vers la réplique de Veeam Backup & replication (illustré dans le diagramme) pour cette machine ne fonctionnera plus.
  2. Les données de la base de données Veeam Backup ne correspondront pas à l'état réel de la machine virtuelle. Dans le pire des cas, vous devez modifier la base de données pour la corriger.
  3. Il peut même y avoir une perte de données, comme dans cet exemple: l'utilisateur a activé manuellement la réplique dans le client vSphere et a décidé de continuer à travailler avec. Après un certain temps, il a remarqué que la réplique était toujours affichée dans la console Veeam Backup & Replication et a décidé de la supprimer comme inutile. J'ai cliqué dessus avec le bouton droit et donné la commande "Supprimer du disque" . Veeam Backup & Replication a immédiatement supprimé la réplique du disque, qui, pour un moment, était déjà pleinement utilisé en tant que machine virtuelle standard et contenait les données nécessaires et utiles.

Bien sûr, il existe des situations où vous devez encore activer la réplique à partir du client vSphere - en règle générale, il s'agit de cas où le serveur Veeam est éteint et la réplique doit être activée avec un délai. Mais si tout est en ordre avec le serveur Veeam, vous devez travailler avec des répliques depuis sa console.

De plus, ne supprimez pas les réplicas à l'aide du client vSphere. Veeam Backup & Replication ne sera pas au courant de ce changement, ce qui est lourd d'erreurs et de données obsolètes. Si vous n'avez plus besoin de la réplique, supprimez-la à l'aide de la console Veeam, et non en tant que machine virtuelle du client vSphere. Vous aurez donc toujours une liste à jour des répliques.

"O" - soigneusement, les mises à jour!


Ici, nous entendons, bien sûr, les mises à jour pour les hyperviseurs et diverses applications qui sont sauvegardées à l'aide de Veeam. Si vous les regardez du point de vue du travail avec Veeam Backup & Replication, les mises à jour peuvent être divisées en 2 catégories: grandes, sérieuses, apportant beaucoup de changements - et petites.

Considérez d'abord la première catégorie.

Les mises à jour les plus importantes sont celles conçues pour l'hyperviseur. Avant d'installer une telle mise à jour, vous devez vous assurer qu'elle est prise en charge par Veeam Backup & Replication. De telles mises à jour apportent de nombreuses modifications aux bibliothèques et aux API utilisées par Veeam Backup & Replication, afin d'annoncer officiellement leur prise en charge, vous devez mettre à jour le code Veeam Backup & Replication et effectuer des tests rigoureux.

Nous devons également garder à l'esprit que, par exemple, VMware ne fournit pas un accès préliminaire aux dernières versions de vSphere pour les fabricants de logiciels, de sorte que les développeurs et les testeurs Veeam reçoivent une nouvelle version en même temps que le reste de l'humanité progressive - donc, généralement entre la sortie de VMware et le support officiellement annoncé. un certain temps. Le nombre et la variété des changements nécessaires pour faire en sorte que dans un simple correctif pour répondre à leurs chances est faible - et le support officiel, en règle générale, est annoncé avec la sortie de la version finale de Veeam Backup & Replication.

En conséquence, il y a ce moment gênant où, après la sortie de la nouvelle version de vSphere, le nombre d'applications de support technique augmente fortement, car les utilisateurs se précipitent pour installer la nouvelle version, et leurs sauvegardes, bien sûr, cessent immédiatement de fonctionner immédiatement. Nous, le support technique de Veeam, devons expliquer aux utilisateurs exactement ce qu'ils ont fait de mal, leur demander de revenir en arrière (si possible), ou penser à des moyens complexes pour sortir de l'impasse. Par conséquent, avant d'installer une mise à jour majeure, assurez-vous de vérifier sa compatibilité avec le logiciel exécuté sur votre ordinateur, je vous en prie!

Tout ce qui précède s'applique aux applications que vous sauvegardez et prévoyez de récupérer à l'aide de Veeam. La gamme d'outils Veeam Explorers comprend également une liste des versions prises en charge des applications respectives, qui est mise à jour avec chaque version de Veeam Backup & Replication. Par conséquent, avant d'installer une nouvelle version de votre application - que ce soit Exchange, Oracle ou SharePoint - assurez-vous de relire la section correspondante de la documentation de Veeam Explorers .

À la deuxième catégorie, c'est-à-dire Je fais référence aux mises à jour mineures, par exemple, les nouvelles versions de VMware Tools, les mises à jour cumulatives Exchange, les mises à jour de sécurité vSphere, etc. En règle générale, ils n'apportent aucune modification majeure avec eux, et dans la plupart des cas, Veeam Backup & Replication ne rencontre aucun problème avec eux. (Par conséquent, il n'y a aucune annonce publique de prise en charge officielle du produit pour eux.) Cependant, dans notre pratique, il y a eu des cas où de telles mises à jour ont changé le cours habituel des choses de manière si significative qu'elles ont conduit à des erreurs dans Veeam Backup & Replication. Dans de telles situations, après avoir confirmé le problème, les ingénieurs Veeam essaient de libérer rapidement le correctif.

Ceux qui parlent anglais technique
Si vous voulez savoir sur quoi travaillent les ingénieurs et à quels architectes système et spécialistes du support technique sont confrontés, je vous recommande de vous abonner à nos forums . Chaque semaine, un bulletin Word de Gostev est rédigé par TheRealGostev pour ses abonnés. Dans ce document, Anton Gostev, chef du département de gestion des produits, parle des problèmes récemment découverts (et pas seulement du côté Veeam), des plans pour de nouvelles versions et des nouvelles du monde informatique. Si vous avez besoin de plus d'informations, vous pouvez étudier les sujets du forum - si l'un des clients a un problème avec le produit après toute mise à jour, il a probablement déjà écrit à ce sujet sur le forum.

Comme vous le comprenez, les correctifs et les mises à jour peuvent entraîner des problèmes non seulement avec les sauvegardes, mais aussi avec les applications pour lesquelles ces sauvegardes sont effectuées. Et ici laboratoires virtuels - Veeam DataLabs vous aidera. Vous avez probablement entendu parler de la fonctionnalité de SureBackup, conçue pour vérifier les sauvegardes. Il repose précisément sur l'utilisation des DataLabs, avec la création d'un environnement isolé dans lequel vous pouvez notamment tester les mises à jour avant de les installer en production. Je vous conseille fortement de le faire - économisez-vous beaucoup de cellules nerveuses. Et si quelqu'un d'autre ne connaît pas SureBackup, je recommande de lire la documentation .

Peut-être pour aujourd'hui j'ai tout, merci pour votre attention!

Quoi d'autre à lire


Articles sur Habré:


Manuel d'utilisation (en russe)

Source: https://habr.com/ru/post/fr451770/


All Articles