Le feu dans lequel vous brûlez doit être maintenu.
V.O. Pelevin, «Generation P»

Bonjour, Habr! Je m’appelle Alexander Soloviev, je suis responsable du support technique pour les centres de données Miran.
Dites-moi, avez-vous essayé d'écrire des manuels scolaires? Non. Néanmoins, le texte ci-dessous est une sorte de manuel de formation pour l'organisation du support technique. Dans le cadre de l'article, je voudrais vous dire quel est le support technique des centres de données Miran: quel type de «vitesses» tournent et pourquoi ils tournent de cette façon, et pas autrement.
Pour la commodité du lecteur, je vais diviser cet article en plusieurs parties sémantiques.
- Dans le premier, nous parlerons des éléments de base du travail TP - dotation, cycle de vie des applications, priorisation.
- Dans la deuxième partie, nous aborderons les questions du maintien des connaissances des ingénieurs support technique à un niveau donné.
- Dans la troisième , dernière partie, nous parlerons de la façon de faire fonctionner tout ce qui précède.
Je parlerai de la motivation, en particulier, non financière, ainsi que de quelques conseils sur l'organisation des récompenses et des punitions d'entreprise.
Bases du support technique
Pour organiser le travail de support technique, vous devez répondre à quelques questions simples:
- Cela nécessite un support pour un produit (service) ou s'agit-il d'un support multi-produits, c'est-à-dire prendre en charge plusieurs produits complètement différents?
- Quel SLA est requis pour les appels au support technique?
- Une assistance 24h / 24 est-elle nécessaire?
D'abord
Le support des monoproduits nécessite un nombre minimum de spécialistes. Par exemple, si vous prévoyez une dizaine d'applications par quart de travail, vous pouvez essayer de transférer le support à un ingénieur spécialisé.
Le support multi-produits nécessite soit la sélection de spécialistes produits, soit la séparation du trafic d'appels par complexité, qui se traduit par l'organisation de plusieurs lignes de support.
Nous avons choisi de diviser les ingénieurs en fonction de leurs connaissances et compétences en trois composantes: la première, la seconde et la seconde ligne de support technique.
Deuxième
Plus le SLA est strict, plus l'entreprise devra se conformer aux ressources. Ce sont des ressources variées: ingénieurs qualifiés, systèmes d'information, équipements, documents réglementaires, etc. Considérez la question du personnel. Pour satisfaire aux exigences de SLA, le personnel doit être proportionnel au nombre moyen d'appels de support technique, en tenant compte des délais et des normes de qualité.
Sur la base de ce qui précède, le personnel de nos ingénieurs est le suivant:
• première ligne - 10 personnes;
• ligne supplémentaire - 4 personnes;
• deuxième ligne - 5 personnes.
Troisième
Le support technique 24h / 24 est un service coûteux. Les performances de haute qualité de ce service en mode 24x7x365 nécessiteront au moins 5 ingénieurs, et c'est dans le cas le plus simple, c'est-à-dire en cas de support produit unique. Si vous avez besoin d'organiser une assistance 24h / 24, n'hésitez pas à multiplier les coûts par 5. Mais, tout d'abord, pensez à si vous en avez besoin (pouvez-vous vous passer d'un portail en libre-service, etc.). Si vous en avez encore besoin, est-il possible de l'externaliser?

Que font tous ces gens
La tâche des ingénieurs de première ligne est de traiter rapidement et efficacement l'appel du client. Traiter signifie classer correctement et envoyer au travail.
Après le traitement, l'ingénieur de la première ligne résout l'application lui-même si elle provient de la section "faites-le rapidement, ici et maintenant", ou transfère l'application sur une autre ligne si elle "joue longtemps" ou s'il s'agit d'un "dysfonctionnement".
La tâche des ingénieurs de ligne supplémentaires est de travailler avec des applications qui prennent plus d'une journée.
La tâche des ingénieurs de deuxième ligne est de dépanner le plus rapidement possible et de résoudre des applications complexes «ici et maintenant».
Modes ingénieur
Première ligne : horaire - 2/2, quarts de 12 heures de 08h00 à 20h00.
Ligne supplémentaire : horaire - cinq jours, quarts de 8 heures à partir de 08h00 et à partir de 12h00.
Deuxième ligne : horaire - 2/2, quarts de 12 heures de 08h00 à 20h00.
Les horaires des équipes d'ingénieurs sont gérés via Google Agenda.

Cycle de vie et état des applications dans TP
Le moyen le plus simple de suivre le cycle de vie d'une application est de suivre ce schéma:

Je vais expliquer séparément chacun des points.
- Le statut nouveau est acquis par toute application reçue d'une source externe. La tâche de l'ingénieur de la première ligne est de traiter initialement la demande reçue et de la transférer à l'entrepreneur.
- Le statut ouvert est attribué à l'application lorsqu'un spécialiste est occupé par la décision.
- Si l'application a été identifiée comme spam, elle acquiert le statut supprimé .
- Si l'application n'est pas du spam, mais ne contient pas un appel essentiel au support technique, elle se voit attribuer le statut rejeté .
- Le statut résolu est attribué à l'application après avoir résolu le problème / problème selon l'intervenant.
- Le statut bloqué signifie que le travail sur l'application est temporairement suspendu à l'initiative du client ou en accord avec lui.
- Le statut clôturé est attribué une fois que le client considère que sa tâche a été résolue avec succès.
Typage d'application
Le type d'application est le critère le plus important. Il détermine la vitesse de réaction et le temps de résolution du problème indiqué dans le ticket. À Miran, selon ITIL, les demandes sont réparties dans les types suivants. Je les donne par ordre d'importance:
IncidentsLes incidents comprennent des dysfonctionnements et des dysfonctionnements de l'équipement, ainsi que tout autre événement ayant entraîné une détérioration significative de la qualité des services. Les applications de ce type sont exécutées par ordre de priorité et ont priorité sur les autres types d'applications. Seuls les incidents peuvent prévaloir sur le traitement.
Exemples d'incidents: indisponibilité du service, panne matérielle.RFS - Demande de serviceLe client a un besoin de service dans le cadre des services fournis. La demande n'est pas liée à une défaillance ou à une défaillance de l'infrastructure informatique. Elle s'effectue immédiatement dans la file d'attente générale en l'absence d'applications prioritaires.
Exemple: une demande de redémarrage du serveur.RFC - Demande de changementDemande de modification de la composition et / ou de l'étendue des services fournis au client. Le délai de traitement est déterminé par la direction de l'entreprise individuellement en accord avec le client.
Exemples: une demande de changement d'équipement.DDR - Demande d'informationsDes informations sur le service ont été demandées, notamment des rapports sur le volume de consommation d'énergie, des rapports de service, etc. Elle s'effectue immédiatement dans la file d'attente générale en l'absence d'applications prioritaires.
La priorité de la demande, affectant la rapidité de réaction et de décision, est calculée sur la base des informations reçues du client, en tenant compte d'un certain nombre de règles et ordonnances internes. Il y a deux priorités: initiale et finale. La priorité initiale est définie en fonction du client et détermine la vitesse de traitement des incidents. La priorité finale est fixée par l'ingénieur après l'achèvement des travaux et reflète le niveau réel de dégradation des services. Souvent, ces priorités ne sont pas égales.
Les priorités sont réparties comme suit:
- le fonctionnement du segment de réseau est rompu (le centre de communication n'est pas disponible, le commutateur de base est en panne) - 40;
- dégradation importante de plusieurs services fournis au client - 30;
- dégradation importante de l'un des services fournis au client - 20;
- dégradation des services, qui n'a pas d'impact significatif sur leur nature - 10;
- aucune influence sur les services clients - 0.
Je pense que cela peut finir en douceur l'analyse de la théorie. Dans les coulisses seront les délais de réponse aux incidents et aux demandes, les niveaux d'escalade, la motivation financière et d'autres informations, plus ou moins standard pour d'autres entreprises. Passons à des choses plus intéressantes.
Maintenir le niveau de connaissances requis
Dans le travail du service de support technique, nous nous efforçons de réglementer tout ce qui est réglementé, d'être transparent pour le client, ainsi que de formaliser et de numériser toute information qui pourrait s'avérer utile et applicable à l'avenir. Retour d'expérience des clients, niveau de connaissance de nos employés, leurs réalisations et leurs facettes - tout cela est méticuleusement numérisé, analysé et affecte ensuite les décisions de gestion.
Pendant plusieurs jours de repos, un ingénieur support technique peut modifier certaines réglementations, de nouvelles réglementations «introductives» apparaîtront, ce qui signifie qu'au début du quart de travail il faut veiller à vérifier la pertinence des connaissances des ingénieurs. Cela se fait à l'aide de la technologie de modélisation situationnelle, par une formation pour résoudre les situations dans lesquelles les connaissances spécifiées sont demandées. Nous appelons une situation un cas. Au début du quart de travail, l'ingénieur reçoit une partie de plusieurs cas d'utilisation. Cette approche permet aux ingénieurs de conserver les connaissances nécessaires dans leur esprit et de les mettre à jour en permanence. En conséquence, la qualité du travail augmente. Pour réduire le stress, le délai de résolution des cas d'utilisateurs est fixé à la fin du quart de travail, bien qu'en réalité, cela soit suffisant pour dix minutes pour un spécialiste.
En quoi consiste exactement un cas d'utilisation typique?
Il y a 4 blocs sémantiques au total:
- Bloc d'informations
Il contient des informations utiles qui doivent être apprises. - Lot de blocs
Ce bloc vous permet d'associer de nouvelles informations au "transport" de ces informations dans la mémoire humaine. - Options de réponse
En fait, c'est le "transport" d'informations en mémoire. - Lien de preuve
Un lien vers une source de confiance où vous pouvez apprendre ces informations.
Voici à quoi ressemble un cas d'utilisation standard sur l'exemple de matériel historiqueTous les blocs de la minuscule sont liés en termes de sens et de thème. Idéalement, le bloc d'informations devrait contenir un indice d'une option de réponse, et pour plus de précision, vous devez ouvrir le lien de preuve et étudier en détail la question qui y est examinée.
En introduisant cette pratique, je suis tombé sur un moment désagréable: il n'y a pas un seul outil à part entière sur le marché qui vous permettrait de stocker une base de connaissances, de distribuer «intelligemment» des cas d'utilisateurs par les employés et de vérifier leurs réponses.
Actuellement, nous utilisons plusieurs outils.
- Request Tracker (RT) - définit la logique de l'interaction des systèmes.
- Google Agenda par API «dévoile» la liste des employés et le nombre de cas d'utilisateurs pour chacun.
- Google Spreadsheets fournit des informations pour la formation d'un cas d'utilisateur.
En fait, le système fonctionne comme suit:
- Une liste des employés impliqués dans la formation des connaissances est établie.
- Pour chaque employé, des sujets de cas d'utilisateurs sont définis.
- Un cas d'utilisation est créé pour chaque thème et transféré à l'employé.
- Pendant la journée de travail, l'ingénieur doit résoudre tous les cas d'utilisation.
- Les réponses sont vérifiées et le résultat de la vérification de chaque cas d'utilisateur est stocké dans le système.
Un bon ingénieur résout un cas d'utilisation en une minute environ. Tricher et «compter» est assez problématique, nous avons pris soin de notre propre système anti-triche.
N'oubliez pas: n'essayez en aucun cas de gérer le niveau de connaissance des employés des services où vous ne contrôlez pas la motivation.Pistolet, perroquets et motivation
J'ai parlé suffisamment en détail du fonctionnement du service d'assistance technique. Reste à comprendre un autre point important: pourquoi ça marche même? :)
Tout repose sur deux piliers. Ces piliers sont la motivation non financière et financière.
Le célèbre gangster Al Capone a déclaré: "Avec un mot aimable et une arme à feu, vous pouvez réaliser bien plus qu'un simple mot aimable." Malheureusement, dans cette métaphore, la motivation financière est un bon mot, et le non-financier est déjà un «bon vieux» fusil.
Motivation non financière
Trois piliers de la motivation non financière: faim, froid et paix objectivité de l'évaluation, preuve de l'accumulation, facilité d'administrationToute personne réagit très négativement aux amendes exprimées en argent ... mais heureusement, il est beaucoup plus facile de s'inquiéter des amendes des "perroquets". Pendant ce temps, les perroquets, si vous pouvez les faire cuire, motivent très, très significativement les employés.
Nous avons choisi comme qualité.
le perroquet est éteint, mais théoriquement, vous pouvez choisir autre chose. Le temps de loisir est bon parce que nous le ressentons par tous les employés, il est demandé pour l'usage auquel il est destiné et il n'est pas nécessaire d'expliquer aux subordonnés ce qu'il est et à quoi il sert. Tout d'abord, lors du choix d'une unité de compte, il faut partir du fait qu'il ne doit pas s'agir d'un «cheval sphérique dans le vide». L'unité comptable doit être tangible pour l'employé.
Dans le cadre de la motivation non financière, les employés ne sont pas privés d'argent, mais de temps libre et, par conséquent, de la possibilité d'utiliser les avantages de la motivation non financière. C'est désagréable, mais pas comme une amende: il y a une incitation à croître et la fidélité d'une personne à l'entreprise n'en souffre pas. Les «exploits» sont encouragés par les congés. Un employé peut utiliser le jour de congé pour sa destination: par exemple, traîner à la maison, mais ce n'est pas si intéressant. Il est plus intéressant
d'aller dans un casino avec blackjack et mademoiselle pour payer un peu de temps libre pour des événements importants pour vous ou votre entreprise, par exemple: les services médicaux en dehors de la VHI, l'obtention de certificats professionnels, de forfaits de fitness ou d'excursions, enfin.
Seul inconvénient par rapport à l'argent - chaque cas d'utilisation, en termes directs ou monétaires, doit être vérifié séparément par les autorités, ce qui n'est pas toujours pratique. Le prix du temps libre est de 3000 roubles, vous pouvez en avoir plus ou moins. L'essentiel est le confort mutuel de l'utilisation d'une unité de motivation non financière.
Permettez-moi de vous donner un exemple vivant quand un travail spécifique est attribué de manière non financière.
L'élaboration de bons documents avec des cas d'utilisation pour la base de connaissances n'est pas tant une tâche qu'un processus. Chaque mois, quelque chose de nouveau apparaît: clients, équipements, logiciels. Tout cela, pour les raisons déjà mentionnées ci-dessus, nécessite une attention et une documentation minutieuses.
Si au tout début j'ai moi-même travaillé à la compilation de ces documents, le système de reconstitution de la base de connaissances fonctionne désormais de manière quasi autonome. Ma tâche est de guider les employés dans la bonne direction, de leur donner un vecteur de mouvement et d'effectuer un contrôle de sortie.
Mon expérience montre que le «prix» d'un bon document équipé d'un nombre suffisant de cas d'utilisateurs est de trois jours de congé.
Un ingénieur bénéficie de deux jours de congé pour un document qui ne nécessite pas de corrections importantes.
Une personne bénéficie d'un jour de congé si de nombreuses corrections sont nécessaires, et il est plus facile de les faire vous-même que d'expliquer comment le faire correctement.
Nous avons essayé de donner plus de temps libre pour ce travail - à partir de 10 jours ou plus. Mais la pratique a montré que trop de récompense fait peur et qu'il n'y a pratiquement personne qui veut la recevoir. Par conséquent, il est important de ne pas en faire trop avec la promotion des employés. Cela peut vous mettre de côté de la manière la plus inattendue. Expérimentez, mais faites-le soigneusement.
Motivation financière
Chaque candidature complétée par un ingénieur TP est récompensée par des bonus. La valeur de la prime est directement proportionnelle à la complexité de la demande et aux qualifications requises pour sa mise en œuvre. Le salaire final d'un ingénieur est déterminé par la somme de ces primes. Bien sûr, dans le cas d'une exécution «tordue» de la demande, le bonus pour celle-ci s'éteint.
Autre nuance: le salaire d'un ingénieur est toujours dans la fourchette déterminée par son poste. Au cours du mois le plus paresseux, une personne ne recevra pas moins que la limite inférieure de cette plage, ni plus que la limite supérieure dans la plus productive. Néanmoins, personne ne laissera offensé: tous les montants sont punis et le traitement est encouragé par une motivation non financière.
Pour résumer
L’article s’est avéré être volumineux de manière inattendue, mais cela n’est pas surprenant: nous avons examiné la vie du support technique de Miran presque entièrement, en omettant seulement les détails les plus ennuyeux ou généraux. Néanmoins, si j'ai néanmoins oublié d'écrire sur quelque chose d'intéressant pour vous ou lors de votre lecture vous avez eu des questions concernant l'organisation du service TP, je serai heureux d'y répondre dans les commentaires.
Matériel connexe