Backend United 4: Okroshka. Incidentes

Hola Continuamos la serie de mitaps de Backend United. La cuarta reunión se llama Okroshka y estará dedicada a los incidentes. Junto con colegas de Tutu.Ru, Ozon y Avito, hablaremos sobre trabajar con incidentes, sobre herramientas para mejorar la respuesta a incidentes y sobre el valor de la deuda técnica.


La reunión se llevará a cabo el 10 de agosto, a partir de las 12:00. Regístrese e invite a colegas. Debajo de la escena: resúmenes, enlaces a registro y transmisión de video del mitap.



Informes


Herramientas simples para mejorar la respuesta a incidentes: experiencia Tutu. Andrey Borzov (Tutu.ru)


imagen


Todos queremos que nuestros usuarios sean felices y que los servicios funcionen y se reparen rápidamente después de fallas. Cuantos más desarrolladores y equipos, más servicios diferentes, más herramientas de control diferentes que todo esto funciona. Y más de las posibles acciones que deben tomarse para diagnosticar y recuperarse.
Les diré cómo las soluciones técnicas simples nos ayudaron a hacernos la vida más fácil durante los incidentes. Cómo, usando las funciones de chat, casi sin magia, le dimos a los equipos un sistema personalizable que hace que los diagnósticos sean más importantes para ellos, las alertas de diferentes sistemas son más útiles y su enrutamiento es más fácil.
Y como beneficio adicional, le diré cómo puede medir los atesorados "nueve" de la disponibilidad de su servicio y lo que sucedió con nosotros.



Trabajar con explosiones de producción: detección, estimación de pérdidas, gestión de incidentes. Dmitry Khimion (Avito)


imagen


¿Ha sucedido en su práctica que un fracaso, que hasta hace poco parecía insignificante, condujo al hecho de que se preparó toda la comida? ¿O solucionó un problema que no era particularmente grave?
¿Cómo entender el efecto real y reconocer una bomba de tiempo? ¿Cómo gestionar el flujo de errores y bloqueos y aislar los significativos? En el informe hablaré sobre cómo se organiza la práctica en Avito y qué investigación y automatización usamos en nuestro trabajo.



AutoLSR: recopilación automatizada de datos para incidentes significativos. Vladimir Kolobaev (Avito)


imagen


A veces surgen situaciones en las que todo se rompe, todas las gráficas son rojas y todo está en llamas. Parece que con un análisis detallado todo queda claro ... pero no. No es fácil captar la causa raíz del problema, especialmente cuando no tiene una imagen completa de lo que está sucediendo en el monolito, servicios, microservicios, bases de datos, en la cabeza de los desarrolladores, etc.
Le diré cómo recopilamos todo el conocimiento secreto, los escenarios de falla de varios sistemas y servicios y transferimos todo esto al código con el propósito de la detección automatizada y el análisis inicial de incidentes significativos.


Lo rompimos ahora, pero lo arreglaremos más adelante. Deuda tecnológica y su valor. Boris Kaiser (Ozon)


imagen


Las altas tasas de desarrollo conducen a una aceleración de la tasa de acumulación de deuda técnica. Cada vez más, tenemos que hacer concesiones a la estabilidad y la calidad de las soluciones desarrolladas a favor de nuevas funcionalidades y nuevos atributos del producto. Sin un control adecuado de los volúmenes de deuda técnica, la situación con la estabilidad del sistema y, como resultado, con la estabilidad técnica del negocio puede deteriorarse. Hablaré sobre lo que hacemos para controlar todo lo que se descompone y se repara rápidamente, cómo ayudamos a los equipos a no olvidarse de estas promesas y brindamos al negocio información completa y comprensible sobre lo que sucedió, cómo se reparó y qué haremos para No volvió a suceder.


Horario


12:30 - 13:15 - Herramientas simples para mejorar la respuesta a incidentes: experiencia Tutu . Andrey Borzov (Tutu.ru)
13:20 - 14:00 - Trabajar con explosiones de producción: detección, estimación de pérdidas, gestión de incidentes . Dmitry Khimion (Avito)
14:00 - 14:45 - Almuerzo
14:45 - 15:30 - AutoLSR - recopilación automatizada de datos para incidentes significativos . Vladimir Kolobaev (Avito)
15:40 - 16:20 - Lo rompimos ahora, pero lo arreglaremos más tarde. Deuda tecnológica y su valor . Boris Kaiser (Ozon)
16:30 - Afterparty en ONE MORE PUB


Contraseñas y apariencias


Mitap comenzará el 10 de agosto a las 12:00. La participación en el evento es gratuita, pero debe registrarse . Indique su apellido y nombre como en su pasaporte, y no olvide llevarlo (o una licencia de conducir) con usted, de lo contrario no podrá ingresar a la oficina.


Dirección: oficina Avito, Lesnaya 7 .


Vea la transmisión en vivo de mitap en el canal de YouTube AvitoTech.


Hasta pronto!

Source: https://habr.com/ru/post/461739/


All Articles