Planification de l'infrastructure pour la récupération instantanée des machines virtuelles Instant VM Recovery: Part 2

Nous continuons le sujet, qui a commencé à être examiné dans la première partie . Aujourd'hui, nous allons parler des connexions réseau et des serveurs cibles, présenter les options possibles et les options de planification de l'infrastructure pour une récupération optimale d'Instant VM Recovery. Alors bienvenue au chat.


À propos des connexions réseau


Bien sûr, il est bon d'avoir un canal avec une bande passante de 10 Gbit / s, à travers lequel les données sont transférées pendant la sauvegarde. Cependant, le canal est plus modeste à restaurer à partir d'une sauvegarde, mais il est recommandé d'utiliser l'association NIC avec LACP ou SMB Multichannel, ou une autre option avec agrégation de bande passante. Vous pouvez utiliser, par exemple, des ports LOM dans la version 4x1 Gbit / s. Cette configuration est recommandée pour la connexion «plusieurs périphériques source - 1 périphérique de sauvegarde cible», c'est-à-dire lors de la connexion de «plusieurs à un». (De même, la récupération parallèle d'un stockage de sauvegarde vers des périphériques cibles - en règle générale, ce sont les mêmes que ceux à partir desquels les sauvegardes ont été effectuées - est une connexion un-à-plusieurs.)
Par exemple, vous pouvez configurer plusieurs travaux de sauvegarde à partir de plusieurs hôtes Hyper-V / LUN et enregistrer des sauvegardes sur le même stockage cible. Si vous avez 10 de ces hôtes avec une bande passante totale de canal de 4x1 Gbit / s, alors si vous avez un tuyau de 10 Gbit / s sur le périphérique cible, c'est une configuration tout à fait adéquate.

Dans le cas où le stockage de sauvegarde est un partage SMB, le multicanal fonctionne très bien (il peut être complété par SMB Direct si vous avez des cartes réseau avec prise en charge RDMA configurée). Ces fonctionnalités sont désormais prises en charge dans de nombreux déploiements de cluster Hyper-V. Cependant, le composant de solution Veeam responsable du transfert de données peut utiliser SMB Multichannel et SMB Direct (là encore, avec des cartes réseau configurées avec prise en charge RDMA) uniquement dans le scénario lorsque vous utilisez des machines virtuelles stockées sur le partage de fichiers SMB pour la sauvegarde proxy hors hôte. Ces Veeam Data Movers fonctionnent respectivement sur le proxy de sauvegarde hors hôte et sur le référentiel. Un tel scénario est décrit en détail ici .

Autre point important: lors de l'utilisation de l'association de cartes réseau Windows en mode indépendant du commutateur , le transfert de données est autorisé de tous les participants et ne reçoit que d'un seul. Si vous souhaitez obtenir le débit optimal dans les deux directions pour un processus, vous n'avez pas besoin d'utiliser LACP. Mais dans ce cas, vous devez vous assurer que plusieurs restaurations sont effectuées sur le même hôte.

Comme vous pouvez le voir, l'agrégation de bande passante comporte un certain nombre de limitations et n'est pas complètement identique à la possession d'un bon canal. Dans tous les cas, vous devez vous baser sur des scénarios d'utilisation planifiés.

En résumé: selon votre infrastructure, vous pouvez utiliser le regroupement de cartes réseau Windows en mode LACP ou Switch Independent mode / SMB Multichannel. Cette dernière option est utile si vous travaillez avec le partage de fichiers SMB et que vous souhaitez utiliser SMB Direct (n'oubliez pas les fonctionnalités du travail mentionné ci-dessus).



Une bande passante élevée et une faible latence sont nécessaires afin de fournir les meilleures performances lors du montage de disques virtuels, lors de l'accès et de la copie de données pendant la récupération instantanée de machine virtuelle.

Vous pouvez effectuer plusieurs opérations de récupération en même temps sans arrêter les travaux de sauvegarde. Autrement dit, en présence d'un canal décent, le rôle principal est joué par la ressource informatique et le stockage. Si tout cela est correctement conçu pour la sauvegarde, la récupération sera efficace.

Recommandations pour les appareils cibles


Considérez plusieurs options, parmi lesquelles, très probablement, vous choisirez la meilleure pour vous-même.

Option 1: restauration vers des hôtes Hyper-V et directement vers le LUN dans l'infrastructure de production


Même si vous avez un système de stockage haute performance avec une mise en cache en lecture / écriture ou si le niveau 1 est configuré, alors, comme mentionné dans un article précédent , vous devez faire attention de ne pas déborder. Sinon, les machines virtuelles de production seront affectées. Et cela peut se produire, par exemple, si vous essayez d'écrire de grandes quantités de données dans le système de stockage aussi rapidement que possible - cela se produit lors de la migration des systèmes de stockage. Dans de telles opérations, nous essayons d'éviter l'utilisation de systèmes de stockage de niveau 1. Des considérations similaires s'appliquent à la restauration de grandes machines virtuelles.

Vous pouvez recommander la restauration sur des LUN séparés avec des profils différents. Les VM restaurées peuvent ensuite être migrées lentement vers des CSV de production. Pour garantir une haute disponibilité, vous pouvez utiliser le cluster à l'aide de la migration en direct du stockage (fonctionnalité de migration du stockage «en direct»). Naturellement, vous devez vous concentrer sur les performances de votre baie de stockage.

Option 2: restauration vers des hôtes Hyper-V avec des disques SSD / NMVe locaux


Autre scénario de reprise en production, assez efficace: utiliser l'hôte Hyper-V du stockage local vers SSD ou NVMe. La taille de l'espace disque dépend du nombre de VM que vous souhaitez récupérer sur une certaine période et de la taille de ces VM.

En théorie, il est peu probable que vous ayez besoin de restaurer tout le monde et tout, donc cette configuration devrait être assez économique. Par exemple, vous pouvez utiliser un SSD dans chacun des nœuds de cluster, ou seulement dans quelques-uns, ou en général seulement dans un. Plus vous utilisez de SSD / NVMe, plus ils peuvent être budgétaires, tout en maintenant une répartition de charge assez efficace entre les hôtes. Au stade final de la procédure de récupération instantanée, les machines virtuelles peuvent être facilement transférées vers des CSV de production, en utilisant la même fonctionnalité de migration en direct du stockage.


Le diagramme montre une option de planification d'infrastructure. Bien sûr, vous pouvez combiner les approches ci-dessus à votre discrétion.

Option 3: restauration vers des hôtes Hyper-V dédiés avec des disques SSD / NVMe locaux


Dans cette option, nous allouons un ou plusieurs hôtes spécifiquement pour prendre en charge la récupération. Cela évite une éventuelle pénurie de ressources et l'impact sur le fonctionnement des hôtes de production dans le cluster. Vous pouvez utiliser des disques NVMe. Nous vous recommandons de tester au préalable les capacités de récupération dans cette configuration afin de comprendre comment les ressources s'épuisent.


Si vous envisagez d'augmenter leur consommation, pour la migration finale des machines reconditionnées vers la production, vous pouvez utiliser la migration dite sans partager les ressources Shared Nothing Live Migration. (Pour cela, vous devrez définir des paramètres de sécurité supplémentaires.) En ce qui concerne les ressources réseau, vous pouvez utiliser, par exemple, les capacités multicanaux SMB et SMB Direct pour la migration vers CSV / Live Migration / S2D Hyper-V.
Oui, la migration des systèmes de stockage (Storage live migration) n'est pas le processus le plus rapide, c'est un inconvénient. Mais il y a un avantage: vos machines virtuelles sont restaurées et continuent de fonctionner pendant ce processus.

En conclusion


Bien sûr, chacun choisit les options préférées en fonction du goulot d'étranglement d'une infrastructure particulière (serveur source, serveur cible, ressources réseau). De plus, il est tout à fait possible qu'une étude approfondie ne soit nécessaire que pour planifier la récupération des machines virtuelles les plus critiques ou pour les consommateurs qui paient pour un tel service.

Dans tous les cas, l'objectif principal sera toujours la récupération la plus rapide possible.
Après cela, il est déjà possible de migrer en toute sécurité vers le système de stockage en cluster, garantissant une haute disponibilité et une tolérance aux pannes. Et, bien sûr, les machines virtuelles doivent être protégées sous forme de sauvegarde / réplication au cas où elles devraient être restaurées à nouveau à un moment donné.

Quoi d'autre à lire:


Source: https://habr.com/ru/post/fr414547/


All Articles