Aujourd'hui, nous continuons la série de messages sur le travail de l'équipe de support technique, qui a commencé à l'époque avec
Loxmatiymamont dans l'
article sur le support Veeam .
Qu'est-ce qui semble être un support technique? Asseyez-vous, résolvez des problèmes techniques, vous êtes le plus intelligent, le plus compétent, vous êtes l'ingénieur même auquel viennent les utilisateurs effrayés. Ils apportent leurs peurs, leurs douleurs, leurs problèmes, et vous décidez, aidez, conseillez et, finalement, l'utilisateur ne vous laisse pas effrayé, mais inspiré.
Avez-vous déjà ressenti la signification de ce travail, les principes philosophiques et pédagogiques profonds qu'il contient?
Donc, tout est un peu différent. Le support technique est, tout d'abord, le support, puis technique, et donc tout le travail est à 99% sur les gens et la communication avec eux, alors bien sûr, nous avons quelque chose à voir avec les misanthropes texturés et les introvertis pathologiques, mais ce sera difficile - cette fois, et deux - les gens ne sont pas toujours prévisibles, et donc, en travaillant au support technique, vous pouvez apprendre, voir et entendre beaucoup de choses intéressantes et inhabituelles. Sous la coupe, je partagerai avec les lecteurs quelques-unes de ces histoires.
Première histoire policière: Veeam Support et une dizaine de jours perdus
Le contexte est le suivant: le serveur NTP (celui qui est responsable de la synchronisation de l'heure sur le réseau) est resté bloqué sur le client, et l'heure a sauté de manière complètement imprévisible sur une variété d'hôtes. Bien sûr, cela ne s'applique pas à Veeam, et le client, en tant que spécialiste techniquement compétent, a tout décidé lui-même, mais: le client utilisant Veeam a sauvegardé ses serveurs MariaDB, et avec un script séparé a fait à la fois un vidage de base et une sauvegarde des journaux binaires. Tous les jours.
Après avoir traité NTP, le client a vérifié les sauvegardes effectuées par notre logiciel et a vu une chose terrible: 12 jours de sauvegarde des journaux binaires ont disparu quelque part, et le rapport de tâche a montré le succès. Tous les jours.
C'est pour résoudre ce mystère qu'ils nous ont appelés.
Une enquête rapide nous a conduits au principal coupable, qui s'est avéré être le même serveur NTP. Comment?
Et voici comment: pendant les sauts de temps, le serveur NTP a généreusement mis sur le serveur les premiers jours de septembre du soulèvement paysan en Normandie, la soumission du Cachemire par les Afghans et le début de la construction de la ligne fortifiée Tobolo-Ishim dans l'Empire russe - c'est-à-dire l'année 1752 de la naissance du Christ. Par un caprice étrange de l'histoire, c'est en septembre de cette année que la Grande-Bretagne et ses colonies nord-américaines ont décidé de passer au calendrier grégorien, et donc le mois ressemble à ceci:
Ainsi, les sauvegardes de base et la sauvegarde des journaux binaires étaient vraiment effectuées tous les jours, seulement ces jours de 1752 se sont avérés être exactement 12 de moins que toujours, et les journaux du 3 septembre étaient datés du quatorzième, du quatrième au quinzième, etc.
Le même problème s'est manifesté lorsque les utilisateurs utilisent le calendrier Hijra - dans ce cas, les sauvegardes se sont déroulées sans accroc, et lors de la restauration des données, le service est devenu fou en essayant de travailler avec une base de données créée vers 1400.
Mais pas toujours des problèmes dans le temps - ce sont des problèmes logiciels: une fois que notre ingénieur a dû prouver au client deux semaines que le deuxième jour de la semaine était mardi, mais pas le jeudi, ce que le client, un bourgeois européen tout à fait respectable, a refusé de croire du tout.
La deuxième histoire - une comédie d'une situation géographique: Veeam Support et 20 mille lieues au-dessus de l'eau
Une histoire qui elle-même provoque sinon un sourire, puis un tic perplexe avec un sourcil à coup sûr.
Le client a longtemps souffert de problèmes dans toutes ses tâches de sauvegarde: ils sont morts à maintes reprises, tout comme le service principal qui surveille leur travail. L'ingénieur, qui a réglé le problème, l'a rapidement découvert: avant chaque épisode, le temps dans nos journaux a sauté pendant une heure, maintenant dans le passé, puis dans le futur. La raison a été découverte simplement en demandant au client.
Croyez en l'explication et supprimez la question "pourquoi?" cela s'est avéré beaucoup plus compliqué.
Imaginez: un navire se rend quelque part dans l'océan Atlantique. Notre logiciel est installé dessus, et un petit script tourne ensuite, suivant les coordonnées GPS du navire. Chaque fois que le navire traverse le fuseau horaire suivant, le script modifie l'heure sur tous les serveurs et services, y compris le nôtre, et de plus, pour être sûr que tout le monde travaille avec l'heure correcte, il recharge également certains services. Un bon exemple de solution créative dans le style de «nous avons résolu un problème au prix de deux autres»).
PS En travaillant sur cet article, je me suis rappelé le serveur de messagerie Dovecot et sa méthode de gestion des situations similaires:
Fatal: le temps vient de reculer de 7 secondes. Cela pourrait causer beaucoup de problèmes, je vais donc me suicider maintenant. (Une erreur catastrophique: un transfert de temps s'est produit il y a 7 secondes. Cela peut entraîner beaucoup de problèmes, donc je me résout juste.)Troisième histoire - «Horreur»: support Veeam et chaudière explosive
Un ami des États-Unis qui nous a appelés a longtemps souffert des blocages de son service Veeam et n'a pas non plus voulu essayer le redémarrage proposé pour des raisons mystiques (le temps de fonctionnement de la machine à ce moment-là avait été calculé pendant des années) jusqu'à ce qu'il abandonne finalement et explique la raison de sa résistance:
«Vous voyez, sur cette machine avec Windows 7, non seulement Veeam tourne, mais aussi le contrôleur de la Smart House: toutes les caméras, les capteurs, l'éclairage, les alarmes et tout. La dernière fois que nous l'avons redémarré, une chaudière a explosé. »
La quatrième histoire, mystique: le soutien de Veeam et l'œil du ciel
Nous avons la technologie Surebackup qui vous permet d'exécuter des sauvegardes dans un environnement isolé et de vérifier leur succès, non seulement dans le rapport, mais aussi dans la réalité (et si elles se sont transformées en citrouilles avec le dernier pour cent de la tâche terminée). Bonne technologie, assez fiable, basée sur l'utilisation de plusieurs scripts de test, dont le test de disponibilité sur le réseau (par exemple, vérification du port d'une application).
Afin de travailler avec un réseau isolé, nous exécutons une application distincte (une petite machine virtuelle), qui fonctionne comme une passerelle et comme l'outil de travail principal de tous les tests - et ici quelque chose s'est mal passé.
L'appliance a été lancée avec succès, mais nous n'avons pas pu nous y connecter nous-mêmes - après un certain temps, le port réseau s'est avéré indisponible. Une analyse cyclique des ports d'adresse IP a rapidement montré que parfois notre port existe, et parfois il n'existe pas, mais le port TCP 544 apparaît quelque part, ce qui ne devrait même pas exister en théorie. Nous essayons d'autres adresses - le script se répète, nous vérifions arp - les adresses mac sont différentes.
En toute confusion, ouvrez l'adresse avec un navigateur Web et étonnez-vous de voir la connexion d'une caméra Web chinoise. Encore une fois, nous changeons l'adresse IP de l'application et nous obtenons exactement la même image - pour une raison quelconque, toutes les adresses IP du réseau seront redirigées vers cette caméra, que ni nous ni le client n'avons compris.
L'énigme est restée non résolue.
***
Pensez-vous que ce sont des exemples isolés? Tout ingénieur pris accidentellement peut vous raconter une douzaine d'histoires de ce genre, sans forcer et sans se répéter.
C'est exactement ce qui donne à notre travail goût et dynamisme. De telles histoires aident à se rappeler que tout notre travail ne se résume pas à une solution sèche aux problèmes techniques, il a de la comédie et du théâtre, une énigme et un défi. Ceci est notre ressource. C'est ce qui nous aide à répondre à chaque appel non pas avec un «bien, qu'est-ce que tu veux encore?» Mais avec une anticipation joyeuse «et avec quoi pouvez-vous me faire plaisir aujourd'hui?»
Je me vante des paroles de l'un des vice-présidents de notre entreprise, a déclaré à propos du soutien:
« Support technique - ils sont monstres! Ils savent non seulement comment résoudre les problèmes techniques, mais aussi comment parler aux clients. » (Le support technique est un gars irréel! Ils savent non seulement comment résoudre les problèmes techniques, mais aussi comment mener correctement un dialogue avec un client. »)
Et nous pouvons vraiment, d'ailleurs, nous enseigner cela: une personne avec une bonne langue (surtout la deuxième ou la troisième, en plus de l'anglais), qui sait communiquer avec les clients et comprend pourquoi cela est nécessaire, nous introduisons l'informatique en général et notre produit en particulier (sauriez-vous combien de diplômés talentueux des universités de langues travaillent pour nous - mais ils ont commencé avec presque aucune connaissance!). Et nous pouvons également renforcer un bon spécialiste technique et aider au développement des compétences générales.
Mais c'est une histoire complètement différente.
***
Et vous, chers lecteurs? Vous avez quelque chose à partager dans les commentaires?
Oui, si vous vous êtes reconnu dans le paragraphe précédent, consultez
careers.veeam.ru/departments/support , il y a peut-être un poste vacant pour vous.