À quelle fréquence avez-vous rencontré des administrateurs d'applications qui aiment gérer la résolution des incidents?
De plus, un flux important d'incidents sur la deuxième ligne de support est ce que l'on appelle les incidents métier, c'est-à-dire les incidents qui sont soit associés à une violation de la logique du processus métier dans le service, soit à des actions incorrectes de l'utilisateur.
Nous avons été en mesure de supprimer cette fonctionnalité de la deuxième ligne autant que possible, en la transférant à une équipe distincte composée des employés de la première ligne de support technique.
Nous vous expliquerons comment nous avons procédé et quelles difficultés nous avons rencontrées dans cet article.
Traditionnellement, la deuxième ligne de support technique était engagée dans la résolution des incidents sur les systèmes, ceux qui fournissent un support pour le service lui-même, effectuent les paramètres de configuration du produit, testent les environnements, surveillent le système, installent les correctifs, participent aux quarts de garde, etc. Et la solution des incidents dans ces équipes s'est souvent accompagnée d'un «principe résiduel» (sauf s'il s'agit bien sûr d'un incident à priorité critique), mais dans la plupart des cas, ils s'inscrivent dans les SLA attribués.
Conscient que de nombreux incidents (et sur le devant des systèmes - derrière chacun) pourraient potentiellement être le problème du client de la Banque, nous avons décidé de minimiser le temps nécessaire pour répondre à ces demandes, mais nous n'avons pas commencé par augmenter le nombre d'équipes de support, mais en analysant chacune des étapes de ce processus.
Le processus de soutien traditionnel à la Banque a été construit selon le schéma classique et se présente comme suit
Fig.1 Schéma de l'organisation du processus de soutien (était)La demande, passée par les première, deuxième et troisième lignes de soutien, a été répartie entre eux dans les proportions suivantes: 15:75:10.
La première ligne - Service Desk - réception, traitement, routage des appels en utilisant les canaux de communication suivants:
- téléphone - 8% du nombre total d'appels
portail libre-service - 83% du nombre total d'appels
e-mail - 4% du nombre total d'appels
chat bot à Viber et Telegram - 5% du total
La première ligne traite également de la résolution des incidents à distance sur les postes de travail des utilisateurs, donnant accès aux systèmes d'information de la Banque. J'ai écrit sur le travail de cette unité dans un article séparé -
lien iciLa deuxième ligne - équipes de maintenance logicielle applicative + infrastructure + DBA + ...,
La troisième ligne est celle des équipes de développement.
Étant donné que les systèmes bancaires sont intégrés les uns aux autres, la survenance d'un incident dans l'un des systèmes est souvent le résultat d'une erreur qui se produit dans un autre système. Et les erreurs sur les «systèmes de sauvegarde» apparaissent principalement sur le «front», ayant un impact direct sur les utilisateurs.
L'identification de la cause profonde de l'occurrence dans ce cas nécessite la participation de plusieurs équipes d'escorte et, par conséquent, une série de routages.
Prenant un échantillon d'incidents pendant plusieurs mois et analysant leur cycle de vie, nous avons découvert qu'ils passent la majeure partie de leur vie en ligne, en attendant une analyse de l'équipe de support de deuxième ligne (parfois jusqu'à 80%), périodiquement, avec une réaffectation entre équipes et une longue correspondance dans le corps de la demande.
Au cours de l'analyse et de l'analyse de ces incidents, nous avons découvert que pour résoudre les erreurs d'intégration, les collègues ont besoin d'informations provenant de systèmes d'intégration adjacents (journaux, analyse d'impact, etc.), pour lesquels ils se tournent les uns vers les autres, acheminant les incidents.
Afin de minimiser le temps de résolution des incidents, dans le cadre d'un projet pilote, nous avons décidé de créer une équipe intégrée interfonctionnelle d'employés de première et de deuxième ligne pour résoudre les incidents dans les systèmes frontaux de la Banque - services bancaires par Internet, services bancaires mobiles, services d'envoi de messages (sms et push) + front principal - Système de bureau de banque.
Cette commande est intermédiaire entre la première et la deuxième ligne - une ligne et demie de support, que nous avons appelée «Frontline».
Déjà au stade de la formation de cette équipe, nous avons rencontré certaines difficultés, y compris du côté des responsables de deuxième ligne, de sorte que le transfert d’un seul employé à ce projet de chacun des systèmes a entraîné une diminution des capacités de l’équipe actuelle. Et les employés de deuxième ligne eux-mêmes, qui étaient censés participer au pilote, n'étaient pas désireux de plonger tête baissée dans la résolution des incidents.
Grâce à des négociations itératives, nous avons pu convenir que la tâche principale des participants de deuxième ligne à ce projet est la formation des employés de première ligne, la création conjointe d'une base de connaissances commune, la construction de processus d'interaction interne, la fourniture des accès nécessaires et, par la suite, un retour progressif vers leur unités.
Le site de Frontline était situé au centre informatique de la Banque à Obninsk.
La première composition de la ligne de support d'un an et demi était la suivante:
- deux employés de soutien de première ligne
- deux employés du groupe de soutien du système de front office
- deux employés du groupe de soutien des services bancaires par Internet et des services bancaires mobiles
- un employé du groupe de support des services d'information client (sms & push)
L'équipe s'est concentrée principalement sur 3 indicateurs:
- VITESSE - 70% des demandes reçues par l'équipe doivent être résolues en moins de 8 heures ouvrables
- QUANTITÉ - l'équipe ne peut pas acheminer plus de 20% des demandes vers la deuxième ligne d'assistance
- QUALITÉ - la proportion d'incidents redécouverts par les utilisateurs ne doit pas dépasser 3%
fig. 2 Processus de traitement des incidents de première ligne
La prochaine difficulté que nous avons rencontrée au début du pilote était le manque d'équipe dans notre compréhension initiale, le cas échéant.
Malgré le fait que les employés de Frontline se trouvaient à proximité dans la même pièce, il n'y a eu aucune tentative de passer à la fonctionnalité croisée, à l'échange d'expérience, à une interaction significative à l'intérieur. Chaque participant, comme auparavant, était concentré sur la résolution des demandes via son système, par conséquent - quelqu'un était «jonché» d'incidents, quelqu'un était clairement plus libre.
Il a été décidé de `` changer les systèmes '' au sein de l'équipe, par exemple, afin que le représentant du support bancaire Internet ne résout plus les incidents sur son système, mais commence à traiter les demandes pour le système front office, et le représentant du support système front office a commencé à résoudre les incidents sur les services de notification, etc. d.
Pourquoi?
- Essayez d'arriver à l'universalité afin que les employés puissent basculer entre les incidents de différents systèmes, répartissant ainsi uniformément la charge sur tous les participants;
- Fournir aux enfants une connaissance suffisante des systèmes connexes qui les aideront à identifier rapidement la cause de l'erreur d'intégration;
- Établir une communication au sein de l'équipe;
Création des comptes nécessaires, accès aux journaux d'application et de base de données, et plus encore! :)
Initialement, la résolution des incidents a été réduite. Il est clair que lorsque vous ne connaissez pas les subtilités du système et que vous devez également résoudre des incidents, ce n'est pas une tâche facile. Mais les gars ont commencé à se tourner les uns vers les autres pour obtenir de l'aide, étudier et mettre à jour la base de connaissances générales, et peu à peu les choses se sont passées.
De plus, chaque jour, nous avons commencé à organiser de petits stand-up au début de chaque journée de travail, près des feuilles de papier que nous avons collées aux murs et avec des indicateurs quotidiens. Nous avons discuté et terminé avec un marqueur, nous réjouissant de leur mise en œuvre ou discutant de la raison de l'échec, si nous ne pouvions pas les atteindre.
Par la suite, bien sûr, nous avons remplacé ces feuilles de papier par des tableaux de bord en ligne.
fig.3 Tableau de bord d'efficacité FrontlineIci, je dois remercier tout particulièrement le chef de l'équipe de soutien au système de front-office de la Banque, qui a assumé le rôle de leadership et a cultivé le développement de l'équipe de l'intérieur - Alexey, merci! :)
Au cours des deux premiers mois, l'équipe n'a pas pu atteindre les objectifs fixés, le processus de formation était en cours, la base de connaissances a été mise à jour.
À partir du troisième mois du projet pilote, nous avons commencé à nous adapter aux objectifs, et après 6 mois, nous avons même commencé à les dépasser.
Fig.4 Projet pilote de première ligne, premiers indicateursIl est vite devenu évident que le pilote avait «décollé» avec succès, et il était conseillé de faire évoluer le projet.
Progressivement, nous avons commencé à ajouter des compétences dans d'autres systèmes à l'équipe, à retirer des employés de deuxième ligne et à ajouter des employés de Service Desk.
Progressivement, nous sommes passés à «T - fonctionnalité croisée», lorsque chaque participant s'est vu attribuer un système principal et deux systèmes adjacents.
fig. 4 Statistiques comparatives pour 2018 sur le temps de résolution des demandes entre les équipes de suivi de première ligne et de deuxième ligneEn 2018, l'équipe de Frontline a clos plus d'incidents que toute autre unité d'escorte de la Banque. Les gars ont largement dépassé les objectifs fixés, montrant une fois de plus que le travail d'équipe et les compétences transversales peuvent obtenir des résultats significatifs.
Pour la deuxième ligne d'assistance, «Frontline» est aujourd'hui un «bouclier» fiable, qui réduit considérablement le flux d'appels qui leur parviennent.
Fig. 5 Nombre et proportion d'incidents résolus en première ligne (Fig. - Équipe1) par rapport aux incidents résolus sur la deuxième ligne pour tous les systèmes de la BanqueAujourd'hui, tous les participants de Frontline sont des employés du Service Desk qui résolvent les incidents sur les principaux systèmes frontaux de la Banque, atteignant les objectifs fixés.
De plus, «Frontline» est la prochaine étape pour les employés du Service Desk de notre carrière, avant de passer à la deuxième ligne de support.