Back-end United 4: Okroshka. Incidentes

Oi Continuamos a série de mitaps do Backend United. A quarta reunião é chamada Okroshka e será dedicada a incidentes. Juntamente com colegas de Tutu.Ru, Ozon e Avito, falaremos sobre como trabalhar com incidentes, sobre ferramentas para melhorar a resposta a incidentes e sobre o valor da dívida técnica.


A reunião será realizada em 10 de agosto, a partir das 12:00. Registre-se e convide colegas. Sob a cena - resumos, links para registro e transmissão de vídeo do mitap.



Relatórios


Ferramentas simples para melhorar a resposta a incidentes: experiência do Tutu. Andrey Borzov (Tutu.ru)


imagem


Todos nós queremos que nossos usuários sejam felizes e que os serviços funcionem e sejam rapidamente reparados após falhas. Quanto mais desenvolvedores e equipes, mais serviços diferentes, mais ferramentas de controle diferentes tudo isso funciona. E mais ações possíveis que precisam ser tomadas para diagnosticar e recuperar.
Vou lhe dizer como soluções técnicas simples nos ajudaram a facilitar nossa vida durante incidentes. Como, usando os recursos de bate-papo, quase sem mágica, fornecemos às equipes um sistema personalizável que torna mais importante o diagnóstico para eles, alertas de diferentes sistemas são mais úteis e seu roteamento é mais fácil.
E como bônus, mostrarei como você pode medir os "nove" estimados da disponibilidade do seu serviço e o que aconteceu conosco.



Trabalhar com explosões de produção: detecção, estimativa de perdas, gerenciamento de incidentes. Dmitry Khimion (Avito)


imagem


Em sua prática, aconteceu que um fracasso, que até recentemente parecia insignificante, levou ao fato de toda a comida ter sido preparada? Ou você resolveu um problema que não era particularmente sério?
Como entender o efeito real e reconhecer uma bomba-relógio? Como gerenciar o fluxo de bugs e falhas e isolar os significativos? No relatório, mostrarei como a prática é organizada no Avito e que pesquisa e automação usamos em nosso trabalho.



AutoLSR - Coleta de dados automatizada para incidentes significativos. Vladimir Kolobaev (Avito)


imagem


Às vezes surgem situações em que tudo quebra, todos os gráficos são vermelhos e tudo está pegando fogo. Parece que com uma análise detalhada tudo fica claro ... mas não. Não é fácil descobrir a causa raiz do problema, especialmente quando você não tem uma imagem completa do que está acontecendo no monólito, serviços, microsserviços, bancos de dados, na cabeça dos desenvolvedores, etc.
Vou lhe contar como coletamos todo o conhecimento secreto, cenários de falha de vários sistemas e serviços e transferimos tudo isso para codificar com o objetivo de detecção automatizada e análise inicial de incidentes significativos.


Nós quebramos agora, mas vamos corrigi-lo mais tarde. Dívida tecnológica e seu valor. Boris Kaiser (Ozônio)


imagem


Altas taxas de desenvolvimento levam a uma aceleração da taxa de acumulação de dívida técnica. Cada vez mais temos que fazer concessões à estabilidade e qualidade das soluções desenvolvidas em favor de novas funcionalidades e novos atributos do produto. Sem o controle adequado dos volumes de dívida técnica, a situação com a estabilidade do sistema e, como resultado, com a estabilidade técnica do negócio pode se deteriorar. Falarei sobre o que fazemos para controlar tudo o que quebra e é reparado rapidamente, como ajudamos as equipes a não esquecer essas promessas e fornecemos aos negócios informações completas e compreensíveis sobre o que aconteceu, como foi reparado e o que faremos para isso não aconteceu novamente.


Horário


12:30 - 13:15 - Ferramentas simples para melhorar a resposta a incidentes: experiência com tutu . Andrey Borzov (Tutu.ru)
13:20 - 14:00 - Trabalho com explosões de produção: detecção, estimativa de perda, gerenciamento de incidentes . Dmitry Khimion (Avito)
14:00 - 14:45 - Almoço
14:45 - 15:30 - AutoLSR - coleta automatizada de dados para incidentes significativos . Vladimir Kolobaev (Avito)
15:40 - 16:20 - Nós quebramos agora, mas vamos consertar mais tarde. Dívida tecnológica e seu valor . Boris Kaiser (Ozônio)
16:30 - Afterparty em MAIS UM PUB


Senhas e aparências


O Mitap começará em 10 de agosto às 12:00. A participação no evento é gratuita, mas você precisa se registrar . Indique seu sobrenome e nome como no seu passaporte e não esqueça de levá-lo (ou uma carteira de motorista) com você, caso contrário você não poderá entrar no escritório.


Endereço: escritório Avito, Lesnaya 7 .


Assista à transmissão ao vivo da mitap no canal AvitoTech no YouTube .


Até breve!

Source: https://habr.com/ru/post/pt461739/


All Articles