Backend United 4: Okroshka. Vorfälle

Hallo! Wir setzen die Backap-Serie von Mitaps fort. Das vierte Treffen heißt Okroshka und ist Vorfällen gewidmet. Zusammen mit Kollegen von Tutu.Ru, Ozon und Avito werden wir über die Arbeit mit Vorfällen, über Tools zur Verbesserung der Reaktion auf Vorfälle und über den Wert technischer Schulden sprechen.


Die Sitzung findet am 10. August ab 12:00 Uhr statt. Registrieren Sie sich und laden Sie Kollegen ein. Unter der Zwischensequenz - Abstracts, Links zur Registrierung und Videoübertragung des Mitaps.



Berichte


Einfache Tools zur Verbesserung der Reaktion auf Vorfälle: Tutu-Erfahrung. Andrey Borzov (Tutu.ru)


Bild


Wir alle möchten, dass unsere Benutzer zufrieden sind und die Dienste nach Pannen funktionieren und schnell repariert werden. Je mehr Entwickler und Teams, je mehr unterschiedliche Dienste, desto mehr unterschiedliche Steuerungswerkzeuge funktioniert dies alles. Und noch mehr mögliche Maßnahmen, die zur Diagnose und Wiederherstellung ergriffen werden müssen.
Ich werde Ihnen sagen, wie einfache technische Lösungen uns geholfen haben, unser Leben bei Zwischenfällen zu erleichtern. Wie wir den Teams mithilfe der Chat-Funktionen fast ohne Magie ein anpassbares System zur Verfügung stellten, das die Diagnose für sie wichtiger macht, Warnungen von verschiedenen Systemen nützlicher sind und deren Weiterleitung einfacher ist.
Und als Bonus werde ich Ihnen sagen, wie Sie die geschätzten "Neun" der Verfügbarkeit Ihres Dienstes messen können und was mit uns passiert ist.



Arbeiten mit Produktionsexplosionen: Erkennung, Verlustschätzung, Incident Management. Dmitry Khimion (Avito)


Bild


Ist es in Ihrer Praxis vorgekommen, dass ein Fehler, der bis vor kurzem unbedeutend schien, dazu führte, dass das gesamte Essen gepflegt wurde? Oder haben Sie ein Problem behoben, das nicht besonders schwerwiegend war?
Wie kann man den tatsächlichen Effekt verstehen und eine Zeitbombe erkennen? Wie kann man den Fluss von Fehlern und Abstürzen verwalten und signifikante Fehler isolieren? In dem Bericht werde ich darüber sprechen, wie die Praxis in Avito angeordnet ist und welche Forschung und Automatisierung wir in unserer Arbeit verwenden.



AutoLSR - Automatisierte Datenerfassung für wichtige Vorfälle. Vladimir Kolobaev (Avito)


Bild


Manchmal treten Situationen auf, in denen alles zusammenbricht, alle Grafiken rot sind und alles in Flammen steht. Es scheint, dass mit einer detaillierten Analyse alles klar wird ... aber nein. Es ist nicht einfach, die Grundursache des Problems zu ermitteln, insbesondere wenn Sie kein vollständiges Bild davon haben, was im Monolithen, in Diensten, Mikrodiensten, Datenbanken, in den Köpfen von Entwicklern usw. geschieht.
Ich werde Ihnen erzählen, wie wir das gesamte geheime Wissen und die Fehlerszenarien verschiedener Systeme und Dienste gesammelt und all dies auf Code übertragen haben, um automatisierte Vorfälle automatisch zu erkennen und zu analysieren.


Wir haben es jetzt kaputt gemacht, aber wir werden es später reparieren. Tech-Schulden und ihr Wert. Boris Kaiser (Ozon)


Bild


Hohe Entwicklungsraten führen zu einer Beschleunigung der Akkumulationsrate technischer Schulden. Immer häufiger müssen wir Zugeständnisse an die Stabilität und Qualität der entwickelten Lösungen zugunsten neuer Funktionen und neuer Produktattribute machen. Ohne eine ordnungsgemäße Kontrolle des technischen Schuldenvolumens kann sich die Situation mit der Stabilität des Systems und infolgedessen mit der technischen Stabilität des Geschäfts verschlechtern. Ich werde darüber sprechen, was wir tun, um alles zu kontrollieren, was kaputt geht und schnell repariert wird, wie wir Teams dabei helfen, diese Versprechen nicht zu vergessen, und wir liefern dem Unternehmen vollständige und verständliche Informationen darüber, was passiert ist, wie es repariert wurde und was wir tun werden es ist nicht wieder passiert.


Zeitplan


12:30 - 13:15 - Einfache Tools zur Verbesserung der Reaktion auf Vorfälle: Tutu-Erfahrung . Andrey Borzov (Tutu.ru)
13:20 - 14:00 - Arbeiten mit Produktionsexplosionen: Erkennung, Verlustschätzung, Incident Management . Dmitry Khimion (Avito)
14:00 - 14:45 - Mittagessen
14:45 - 15:30 - AutoLSR - Automatisierte Datenerfassung für wichtige Vorfälle . Vladimir Kolobaev (Avito)
15:40 - 16:20 - Wir haben es jetzt kaputt gemacht, aber wir werden es später reparieren. Tech-Schulden und ihr Wert . Boris Kaiser (Ozon)
16:30 - Afterparty bei ONE MORE PUB


Passwörter und Erscheinungsbilder


Mitap beginnt am 10. August um 12:00 Uhr. Die Teilnahme an der Veranstaltung ist kostenlos, Sie müssen sich jedoch registrieren . Bitte geben Sie Ihren Nach- und Vornamen wie in Ihrem Reisepass an und vergessen Sie nicht, ihn (oder einen Führerschein) mitzunehmen, da Sie sonst nicht ins Büro dürfen.


Adresse: Büro Avito , Lesnaya 7 .


Sehen Sie sich die Live-Übertragung des Mitaps auf dem AvitoTech- YouTube-Kanal an .


Bis dann!

Source: https://habr.com/ru/post/de461739/


All Articles