Prêt pour la sauvegarde: détruire les mythes des fêtes



La sauvegarde n'est pas une technologie à la mode qui est criée par chaque fer. Il faut que ce soit dans n'importe quelle entreprise sérieuse, c'est tout. Plusieurs milliers de serveurs sont sauvegardés dans notre banque - c'est un travail compliqué et intéressant, sur certaines de ses subtilités, ainsi que sur les idées fausses typiques concernant les sauvegardes que je veux juste dire.

Je traite ce sujet depuis près de 20 ans, dont les 2 dernières années - à Promsvyazbank. Au tout début de la pratique, j'ai effectué une sauvegarde presque manuellement, avec des scripts qui copiaient simplement les fichiers. Ensuite, des outils pratiques sont apparus dans Windows: l'utilitaire Robocopy pour préparer les fichiers et la sauvegarde NT pour la copie. Et le moment est venu pour les logiciels spécialisés, principalement Veritas Backup Exec, qui s'appelle désormais Symantec Backup Exec. Je connais donc les sauvegardes depuis longtemps.

Pour faire simple, la sauvegarde, c'est sauvegarder une copie des données (machines virtuelles, applications, bases de données et fichiers) juste au cas où avec une certaine régularité. Tout cas se manifeste généralement sous la forme d'une défaillance matérielle ou logique et entraîne une perte de données. La tâche du système de sauvegarde est de réduire les pertes dues à la perte d'informations. Une panne matérielle est, par exemple, une panne de serveur ou de stockage où se trouve la base de données. Logique - c'est la perte ou la modification d'une partie des données, y compris en raison du facteur humain: supprimé par inadvertance une table, un fichier, lancé un script pour exécuter une courbe. Le régulateur a également des exigences pour le stockage d'un certain type d'informations pendant une longue période, par exemple jusqu'à plusieurs années.



L'appel le plus typique aux sauvegardes est la restauration d'une copie enregistrée des bases de données pour le déploiement de divers systèmes de test, des clones pour les développeurs.

Il existe plusieurs mythes typiques autour des sauvegardes qu'il est grand temps de dissiper. Voici les plus célèbres d'entre eux.

Mythe 1. La sauvegarde n'a longtemps été qu'une petite fonction dans les systèmes de sécurité ou de stockage.


Les systèmes de sauvegarde sont toujours une classe de solutions distincte et très indépendante. Affaires trop importantes qui leur sont confiées. En fait, ils constituent la dernière ligne de défense en matière de sécurité des données. La sauvegarde fonctionne donc à son propre rythme, selon son propre calendrier. Un rapport quotidien est généré sur les serveurs; il y a des événements qui agissent comme des déclencheurs pour le système de surveillance.



De plus, le modèle de rôle d'accès au système de sauvegarde permet de déléguer une partie de l'autorité aux administrateurs des systèmes cibles pour gérer les sauvegardes.

Mythe 2. Lorsqu'il y a du RAID, la sauvegarde n'est plus nécessaire.




Sans aucun doute, les matrices RAID et la réplication de données sont un bon moyen de protéger les systèmes d'information contre les pannes matérielles, et s'il y a un serveur de secours, vous pouvez rapidement y basculer en cas de panne de la machine principale.

À partir des erreurs logiques commises par les utilisateurs du système, la redondance et la réplication ne sont pas enregistrées. Voici un serveur de secours avec un enregistrement retardé - oui, il peut aider si une erreur est détectée avant sa synchronisation. Et si le moment est manqué? Seule la sauvegarde effectuée à temps vous aidera ici. Si vous savez que les données ont changé hier, vous pouvez restaurer le système avant-hier et en extraire les données nécessaires. Étant donné que les erreurs logiques sont les plus courantes, la bonne vieille sauvegarde reste un outil éprouvé et nécessaire.

Mythe 3. La sauvegarde est effectuée une fois par mois.


La fréquence de sauvegarde est un paramètre configurable, principalement en fonction des exigences du système de sauvegarde. Il est tout à fait possible de trouver des données qui ne changent presque jamais et qui ne sont pas particulièrement importantes, leur perte ne sera pas critique pour l'entreprise.
En effet, ils peuvent être sauvegardés une fois par mois ou même moins. Mais des données plus critiques sont stockées plus souvent, en fonction de l'indicateur RPO (Recovery point objrective), qui définit la perte de données acceptable. Cela peut être une fois par semaine, une fois par jour, voire plusieurs fois par heure. Nous avons ces journaux de transactions du SGBD.



Lors de l'introduction de systèmes dans l'exploitation commerciale, la documentation de sauvegarde est nécessairement approuvée, ce qui reflète les principaux points, la procédure de mise à jour, la procédure de restauration du système, la procédure de stockage des sauvegardes, etc.

Mythe 4. Le volume de copies est en constante augmentation et occupe complètement tout espace alloué


Les sauvegardes ont une durée de vie limitée. Par exemple, cela n'a aucun sens de stocker les 365 sauvegardes quotidiennes au cours de l'année. En règle générale, il est permis de conserver des copies quotidiennes pendant 2 semaines, après quoi elles sont remplacées par de nouvelles, et la version qui a été faite en premier dans le mois reste pour un stockage à long terme. À son tour, il est également stocké pendant un certain temps - chaque copie a une durée de vie.



Il existe une protection contre la perte de données. La règle s'applique: avant la suppression de la sauvegarde, les éléments suivants doivent être formés. Par conséquent, les données ne seront pas supprimées si la sauvegarde échoue, par exemple en raison de l'indisponibilité du serveur. Non seulement le délai est respecté, mais aussi le nombre de copies dans l'ensemble est contrôlé. Si le système indique qu'il doit y avoir deux sauvegardes complètes, il y en aura toujours deux, et l'ancienne ne sera supprimée que lorsqu'un nouveau troisième aura été enregistré avec succès. L'augmentation du volume occupé par l'archive de sauvegarde n'est donc associée qu'à l'augmentation du nombre de données protégées et ne dépend pas du temps.

Mythe 5. La sauvegarde a commencé - tout est suspendu


Il vaut mieux dire ceci: si tout se bloque, alors les mains de l'administrateur ne se développent pas à partir de là. En général, les performances de sauvegarde dépendent de nombreux facteurs. Par exemple, à partir de la vitesse du système de sauvegarde lui-même: à quelle vitesse il y a des stockages sur disque, des bibliothèques de bandes. De la vitesse des serveurs du système de sauvegarde: parviennent-ils à traiter les données, à effectuer la compression et la déduplication. Ainsi que la vitesse des lignes de communication entre le client et le serveur.

Une sauvegarde peut aller dans un ou plusieurs threads, selon que le système redondant prend en charge le multithreading. Par exemple, le SGBD Oracle vous permet de donner plusieurs threads, selon le nombre de processeurs disponibles, jusqu'à ce que la vitesse de transmission repose sur la limitation de la bande passante du réseau.

Si vous essayez de sauvegarder avec un grand nombre de threads, c'est-à-dire une chance de surcharger un système qui fonctionne, cela va vraiment commencer à ralentir. Par conséquent, le nombre optimal de threads est sélectionné pour fournir des performances suffisantes. Si même la moindre diminution des performances est critique, il existe une excellente option lorsque la sauvegarde est effectuée non pas à partir du serveur de combat, mais à partir de son clone - veille dans la terminologie de la base de données. Ce processus ne charge pas le système de production principal. Les données peuvent être prises via un plus grand nombre de threads, car le serveur n'est pas utilisé pour la maintenance.

Dans les grandes organisations, un réseau distinct est créé pour le système de sauvegarde afin que la sauvegarde n'affecte pas les ventes. En outre, le trafic peut ne pas être transmis via le réseau, mais via le SAN.

Nous essayons également de répartir la charge dans le temps. Les sauvegardes se déroulent généralement après les heures de travail: la nuit, le week-end. De plus, ils ne démarrent pas tous en même temps. Les sauvegardes de machines virtuelles sont un cas particulier. Le processus n'a pratiquement aucun effet sur les performances de la machine elle-même, de sorte que la sauvegarde peut être maculée pendant la journée et ne pas tout remettre à plus tard pour la nuit. Il existe de nombreuses subtilités, compte tenu de tout, la sauvegarde n'affectera pas les performances du système.

Mythe 6. Lancement d'un système de sauvegarde - voici la tolérance aux pannes.


N'oubliez jamais qu'un système de sauvegarde est la dernière ligne de défense, ce qui signifie qu'il devrait y avoir cinq autres systèmes devant lui qui garantissent la continuité, la haute disponibilité et la tolérance aux catastrophes de l'infrastructure informatique et des systèmes d'information de l'entreprise.

Il ne vaut pas la peine d'espérer que la sauvegarde restaurera toutes les données et augmentera rapidement le service tombé en panne. La perte de données entre le moment de la sauvegarde et le moment de l'échec est garantie, et les données sur le nouveau serveur peuvent être téléchargées pendant plusieurs heures (ou jours, comme par hasard). Par conséquent, il est logique de créer des systèmes à tolérance de panne à part entière sans tout déplacer vers la sauvegarde.

Mythe 7. J'ai configuré une sauvegarde une fois, vérifié qu'elle fonctionne. Il ne reste plus qu'à regarder les journaux


C'est l'un des mythes les plus nocifs, dont vous ne vous rendez compte que pendant l'incident. Les journaux sur les sauvegardes réussies ne garantissent pas que tout s'est vraiment déroulé comme il se doit. Il est important de vérifier la copie stockée à l'avance pour la déployabilité. Autrement dit, démarrez le processus de récupération dans un environnement de test et examinez le résultat.

Et un peu sur le travail de l'administrateur système


En mode manuel, personne n'a copié de données depuis longtemps. IBS moderne peut sauvegarder presque tout, il vous suffit de le configurer correctement. Si un nouveau serveur a été ajouté, enregistrez les politiques: sélectionnez le contenu qui sera sauvegardé, spécifiez les options de stockage et appliquez la planification.



Dans le même temps, il reste encore beaucoup de travail en raison de la flotte de serveurs étendue, y compris les bases de données, les systèmes de messagerie, les clusters de machines virtuelles et les ressources de fichiers sur Windows et Linux / Unix. Les employés qui prennent en charge le système de sauvegarde ne restent pas inactifs.
En l'honneur de la fête, je souhaite à tous les administrateurs des nerfs solides, une clarté des mouvements et un espace infini pour stocker les sauvegardes!

Source: https://habr.com/ru/post/fr446054/


All Articles