Tout au long de mon travail, j'ai observé périodiquement des situations où la mise en place d'un suivi dans l'entreprise n'a pas donné les résultats escomptés. La surveillance n'a pas bien fonctionné ou n'a pas fonctionné du tout. En analysant de telles situations, j'ai réalisé que leurs causes étaient presque toujours les mêmes. Bien qu'ils se trouvent tous à la surface, je les ai rencontrés tout le temps et j'ai donc décidé de les rassembler pour que vous soyez prévenus et armés.

1. NE PAS mettre en œuvre un outil de surveillance
Si les services informatiques ne reçoivent qu'un outil de surveillance, une surveillance efficace et pertinente ne se fera pas d'elle-même. Au lieu d'introduire un système de surveillance, essayez d'approcher la création d'une infrastructure informatique de surveillance en tant qu'organisation de
processus .
Qu'est-ce que je veux dire par le processus de suivi?
Le processus de surveillance est une combinaison de ressources humaines, de moyens techniques et de mesures organisationnelles visant à résoudre les tâches que l'entreprise pose à la surveillance pendant le fonctionnement de l'infrastructure informatique. Je veux surtout noter que les personnes et les règles de cette définition ne sont pas moins importantes, mais plutôt plus que des moyens techniques.
Voici quelques exemples typiques des noms des projets de surveillance auxquels j'ai déjà participé. Dans la plupart des cas, le nom du projet reflète fidèlement le résultat que le client souhaitait recevoir:
- Mise en place d'un système de gestion et d'exploitation de réseaux de télécommunications d'entreprise
- Création d'un système de surveillance de l'infrastructure informatique
- Développement d'un système de contrôle et fonctionnement du circuit Internet
- Mise en place du système de surveillance des équipements de commutation de l'OJSC
- Création d'un système de gestion des technologies de l'information
- Création d'un complexe matériel-logiciel pour le système de gestion et de surveillance de l'infrastructure informatique
Les entreprises se concentrent sur la technologie et sacrifient le plus souvent les deux autres composantes - les ressources humaines et les mesures organisationnelles. En conséquence, l'outil apparaît, mais une compréhension claire de
qui et
comment utiliser cet outil ne l'est pas.
Naturellement, dans tout projet de mise en œuvre d'un système de surveillance, à un degré ou à un autre, il y a à la fois un modèle de rôle et la documentation qui l'accompagne. Mais en règle générale, cette documentation est formelle et n'aide pas les services informatiques à répondre aux questions qui se posent lors de l'utilisation du système.
2. L'intégrateur NE fera PAS tout le travail pour vous
En règle générale, pour les projets liés à la surveillance, les grandes et moyennes entreprises attirent des spécialistes des entreprises intégratrices. Dans le processus d'examen de l'infrastructure, les intégrateurs s'appuient sur
leur expérience des connaissances et de la résolution de problèmes. Mais loin du fait que c'est exactement ce dont l'entreprise a besoin. Personne ne connaît mieux les subtilités des problèmes liés au fonctionnement de l'infrastructure informatique que les spécialistes de l'entreprise.
Par conséquent, je recommande avant d'
identifier un tiers entrepreneur de
déterminer indépendamment
les problèmes que l'entreprise souhaite résoudre par le biais de la surveillance. Par exemple:
- répartition inégale de la charge sur l'infrastructure virtuelle;
- nombre élevé d'accidents dans l'infrastructure informatique;
- un niveau élevé de chargement de spécialistes hautement qualifiés en effectuant des tâches simples;
- faible disponibilité des services d'entreprise;
- un grand nombre d'appels vers la première ligne;
- longtemps entre le moment de l'accident et sa détection;
- la nécessité d'optimiser le travail des administrateurs système;
- faible productivité de l'infrastructure informatique;
- manque de données fiables sur les ressources de l'infrastructure informatique;
- manque d'outils de prévention des accidents.
Il sera également extrêmement utile, même aux premiers stades de la surveillance, de
corriger les mesures qui quantifieront les problèmes et collecteront des statistiques sur ces mesures. En conséquence, nous recevrons des informations sur l'état de fonctionnement de l'infrastructure informatique avant d'organiser le processus de surveillance. Et après la mise en œuvre du suivi, nous pouvons contrôler comment l'organisation a influencé le changement de ces indicateurs. Des exemples de telles mesures sont:
- nombre moyen d'incidents enregistrés au cours de la période considérée;
- temps d'arrêt moyen des services clés;
- % Moyen de disponibilité de l'infrastructure informatique;
- % moyen d'utilisation des infrastructures;
- le nombre d'appels vers la première ligne pour la période de référence;
- temps moyen entre le moment où l'incident s'est produit et sa découverte;
Plus les métriques qui caractérisent les principaux problèmes de fonctionnement de l'infrastructure informatique seront élaborées, plus leur amélioration sera obtenue pendant la surveillance. Le calcul constant de ces mesures devrait faire partie intégrante du processus. Avec une certaine fréquence, il est nécessaire de réviser les formules pour leur calcul. Ainsi, vous pouvez réagir en temps opportun aux changements dans le développement de l'infrastructure informatique, sa composition qualitative et quantitative. Il est conseillé d'utiliser ces métriques comme KPI lors de l'évaluation des performances des unités de support d'infrastructure informatique.
3. NE PAS confondre la surveillance et l'administration de l'infrastructure informatique
Les professionnels qualifiés sont l'un des trois éléments clés d'un processus de surveillance efficace. Parfois, afin d'économiser de l'argent, en particulier pendant le processus de mise en œuvre, les entreprises tentent de
confier le support et le développement du système de surveillance aux administrateurs système impliqués dans le fonctionnement de l'infrastructure informatique. Mais si vous sélectionnez une structure distincte (spécialiste) pour prendre en charge le suivi, cela augmentera considérablement la qualité du service. Le suivi sera pour ces salariés l'activité
principale et non secondaire, de sorte qu'ils seront beaucoup plus intéressés par sa réussite et sa pertinence.
Les responsabilités de l'unité de surveillance (spécialiste), entre autres, devraient inclure les fonctions suivantes:
- administration d'un complexe de systèmes de surveillance;
- création de nouvelles métriques de surveillance;
- ajustement des seuils de surveillance;
- développement de nouveaux outils de suivi;
- exécution des demandes des utilisateurs;
- rapports;
- développement du processus de surveillance informatique dans son ensemble.
Même si plusieurs départements informatiques seront impliqués conjointement dans la configuration de la surveillance, vous
devez toujours
avoir une structure distincte - un centre d'expertise pour tout ce qui concerne la surveillance . Cela aidera à éviter les coûts de main-d'œuvre en double et à résoudre rapidement toutes les situations de conflit qui, lorsqu'elles sont administrées conjointement, se produiront tôt ou tard.
4. Ne vous attendez pas à ce que vos subordonnés utilisent la surveillance si vous ne le faites pas vous-même.
Il arrive que le chef, qui a démarré la mise en place du monitoring dans l'entreprise, donne les instructions nécessaires, alloue les fonds, conclut un accord avec l'intégrateur, et ceci achève le travail avec le monitoring. Et en vain, car pour que le suivi soit efficace, il doit être sous une forme ou une autre demandé à tous les niveaux de la hiérarchie de l'entreprise. Dès que le gestionnaire commence à utiliser le service de surveillance, il deviendra automatiquement obligatoire pour tous ses subordonnés.

5. NE PAS forcer les employés à travailler avec le système de surveillance
Tôt ou tard, la mise en œuvre du système de surveillance est terminée et son fonctionnement commence. Parfois, cela s'accompagne d'une commande: tous les services informatiques doivent commencer à travailler avec le système. En règle générale, la coercition directe n'apporte pas de résultats positifs. Le maximum qui peut être atteint est une exécution formelle du montant minimum nécessaire.
Le suivi sera reçu positivement s'il aide chaque unité à résoudre ses problèmes. Si les services des opérations informatiques ne commencent pas à utiliser la surveillance, cela peut indiquer que les objectifs de mise en œuvre de la surveillance ont été mal définis. Ou que les objectifs de mise en œuvre ne coïncident pas avec les objectifs des services informatiques.
Motiver les services de l'entreprise à utiliser les résultats du suivi et ne pas les y obliger. Une bonne option pour une telle motivation serait de créer pour chaque unité des indicateurs clés basés sur des métriques qui décrivent les problèmes de fonctionnement de l'infrastructure informatique en termes quantitatifs. J'ai donné leurs exemples ci-dessus.
6. NE PAS se concentrer sur le test de la fonctionnalité du système de surveillance pendant son test.
Après le développement du système de surveillance, il est testé puis testé. Ici, notre prochain «non» devient pertinent. À un degré ou à un autre, j'ai rencontré ce problème dans chaque projet.
Si la mise en œuvre de l'outil de surveillance est effectuée par une organisation tierce, il est important que les spécialistes de l'entreprise participent activement à la formation des méthodes de test du système aux stades des tests d'acceptation et de l'opération d'essai. Lors des tests, il est nécessaire de se concentrer précisément sur la
question de
savoir si l'outil aide réellement à atteindre les buts et objectifs fixés pour le suivi .
Voici quelques exemples d'utilisation de métriques pour les tests finaux:
- Optimisation de l'utilisation de l'infrastructure informatique. Sur la base des rapports du système de surveillance, il est possible de prendre des décisions sans ambiguïté et motivées concernant l'élimination optimale et la distribution plus rationnelle de l'infrastructure informatique.
- Réduire le nombre d'accidents dans l'infrastructure informatique. La surveillance de l'infrastructure informatique doit donner autant de signaux corrects que possible et aussi peu de faux signaux que possible. Vous pouvez le vérifier en collectant des statistiques sur le pourcentage de signaux du système de surveillance qui signalent réellement l'état d'urgence des composants de l'infrastructure informatique et ont conduit à une réaction pour éliminer les causes de l'accident.
- Réduire la charge de spécialistes hautement qualifiés en effectuant des tâches simples. Vérification de l'exhaustivité et du détail du modèle de rôle construit dans le système, ainsi que de l'exhaustivité de son remplissage avec des informations sur les unités structurelles de l'entreprise, analyse des règles d'escalade des alertes dans le cas où le système les prévoit. Il sera également utile de déterminer le pourcentage de signaux qui atteignent les destinataires cibles et de comparer cette valeur avec les indicateurs cibles.
- Amélioration de la disponibilité des services d'entreprise . Comparaison des indicateurs d'accessibilité des services d'entreprise définis par le système de suivi avec les indicateurs réels de disponibilité pour la période de reporting, qui sont déterminés par des méthodes alternatives. Cela comprend également la vérification de l'exhaustivité et des détails de la liste des mesures utilisées pour déterminer la disponibilité des services d'entreprise, les valeurs de seuil de ces mesures et la définition d'alertes pour les groupes cibles de prise en charge des services d'entreprise.
- Vérification de la qualité des services informatiques fournis par un contractant externe . Vérification que les mesures de surveillance des services fournis couvrent autant que possible les paramètres du SLA signé avec un contractant externe. Sur la base de leurs données, nous pouvons clairement dire que l'entrepreneur remplit les conditions du SLA.
- Inventaire de l'infrastructure informatique. Vérifier l'exhaustivité des informations d'inventaire collectées par le système de suivi et leur conformité aux exigences et objectifs de l'inventaire; vérifier la qualité et la facilité d'utilisation des rapports d'inventaire émis par le système de suivi.
- Avertissement proactif d'accident. Comparaison des statistiques sur le nombre d'accidents pour la période considérée avant le début de l'utilisation du système de surveillance et après sa mise en service; comparer ces valeurs avec des cibles.
D'une part, il est assez difficile de le vérifier - vous devez d'abord déterminer la méthode de calcul de ces statistiques, puis accumuler des statistiques à leur sujet. Mais d'un autre côté, ces métriques peuvent être utilisées non seulement dans le processus de test de surveillance, mais également fixées à l'avenir dans le système de motivation des services informatiques impliqués dans l'exploitation.
La vérification des fonctionnalités de base - par exemple, l'apparition d'une alarme dans le système de surveillance en cas de panne de courant au niveau de l'interrupteur - ne donne pas à elle seule une idée que le système fera face à ses tâches. Une telle vérification montrera seulement que le système fonctionne fondamentalement.
7. La surveillance ne commencera à être bénéfique que si vous commencez à travailler avec elle et à l'adapter à vos besoins.
Ce «non» fait référence au stade de fonctionnement du système après l'achèvement de la mise en œuvre. Il est extrêmement important de comprendre que sans un processus de surveillance correctement construit et sa mise à jour, les données du système commenceront à devenir obsolètes immédiatement après la fin de sa mise en œuvre.
Au moment de la mise en service, tous les problèmes organisationnels liés à la maintenance du système et au fonctionnement de la surveillance, aux règles de son utilisation et à la répartition des responsabilités et du soutien devraient être résolus autant que possible. Il convient également de définir les règles et procédures de résolution des problèmes pouvant survenir pendant l'exploitation. L'absence de ces règles est la principale raison pour laquelle la surveillance cesse de fonctionner et l'intégrateur commence à se dégrader après la fin de la phase active de travail.
Enfin, au début de l'exploitation commerciale du système de surveillance, des règlements devraient être élaborés qui formuleront les règles de base pour travailler dans le cadre du processus de surveillance:
- qui et comment fonctionnera avec le système;
- qui est responsable de la mise à jour du système;
- qui a le droit d'ajuster les valeurs métriques de seuil;
- comment est la création de nouvelles métriques;
- dans ce cas, de nouvelles métriques doivent être créées;
- combien de temps la création de nouvelles mesures se produit-elle;
- que doit-il se passer si le système de surveillance enregistre un accident;
- qui et comment réagir à cet accident;
- qui est responsable du fonctionnement du système de surveillance;
- comment les conflits liés à l'apparition de faux signaux ou à l'absence de signaux corrects seront résolus.
Conclusion
J'espère vraiment qu'après avoir lu mon article, vous ne trouverez pas de situations similaires à ce qui se passe dans votre entreprise. Dans le cas où la surveillance commence à peine à se développer dans votre entreprise, des informations sur ces sept grandes erreurs, à mon avis, dans le processus de mise en œuvre de la surveillance vous aideront à créer un processus efficace qui apportera de la stabilité au travail de votre infrastructure informatique.