De la surveillance à la gestion des incidents. Rapport du Meetup DevOps Moscou

Le 16 mai, notre bureau a accueilli la deuxième réunion de la communauté DevOps de Moscou après une longue pause. Les conférenciers ont parlé des outils de surveillance individuelle et de la gestion des incidents en général. À en juger par les commentaires, ces sujets semblaient pertinents pour les invités et ils pourraient continuer à être abordés lors des prochaines réunions. Mais ce sont des plans pour l'avenir, mais pour l'instant nous partageons des vidéos, des photos et des présentations du dernier mitap.


image


Surveillance de l'infrastructure cloud. Mikhail Prokopchuk (Avito)


Michael a parlé de l'infrastructure cloud d'Avito: où nous avons commencé, où nous en sommes maintenant, comment fonctionne notre architecture du système de surveillance. Il s'est attardé en détail sur les mesures clés qui doivent être suivies et les outils qui aident dans l'analyse.



Présentation


Avis des auditeurs


  • Dans le cas, sans eau. Avec un atterrissage sur des cas d'utilisateurs spécifiques. J'ai vraiment aimé ça.
  • Le sujet du rapport est intéressant. Seuls les détails nécessaires sont exprimés, plus une photo en gros plan est donnée. Excellent rapport!


Découverte automatique dans la surveillance: comment garantir de manière fiable l'intégralité de la surveillance. Nikolay Sivko (okmeter.io)


La chose la plus importante dans la surveillance est la métrique. Nikolay a expliqué quelles mesures devaient être collectées en premier lieu, comment configurer leur collecte dans le système de surveillance, puis quoi en faire. Dans le même temps, ne compliquez pas beaucoup votre travail et évitez les erreurs fatales.



Présentation


Avis des auditeurs


  • Pas mal, j'ai aimé les instructions spécifiques sur ce qu'il faut surveiller.
  • Une excellente explication des mesures à surveiller et pourquoi.


Quand vous avez vraiment besoin d'une équipe de surveillance. Ilya Ableev (Badoo)


Il y a des situations où une entreprise a besoin d'une équipe de surveillance distincte et déplacer son implémentation, diagnostiquer les problèmes et transmettre correctement aux ingénieurs ou aux développeurs n'est pas efficace. Ilya a expliqué comment Badoo en est arrivé là, quels outils ils utilisent et pourquoi leur travail est bénéfique.



Présentation


Avis des auditeurs


  • L'orateur a parlé de la constitution d'une équipe de surveillance au sein de l'entreprise. Il est utile d'écouter si vous décidez d'externaliser ou non la surveillance.

Merci à tous ceux qui sont venus à la réunion, ont regardé la vidéo et les présentations. Photos de la réunion que nous avons publiées sur Facebook et Vkontakte .


Pour les événements DevOps suivants, visitez la page de la communauté DevOps Moscou dans Timepad . Dites-nous dans les commentaires sur quels autres sujets vous seriez intéressé à écouter les rapports - nous tiendrons compte de votre opinion lors de la planification des prochains événements.


A très bientôt!

Source: https://habr.com/ru/post/fr414071/


All Articles