后端联合4:奥克罗什卡。 突发事件

你好 我们继续Back United系列的mitaps。 第四次会议称为Okroshka,它将专门讨论事件。 我们将与来自Tutu.Ru,Ozon和Avito的同事一起讨论事件处理,改善事件响应的工具以及技术债务的价值。


会议将于8月10日12:00开始。 注册自己并邀请同事。 在过场动画下-摘要,链接到mitap的注册和视频广播。



报告书


改善事件响应的简单工具:兔兔体验。 安德烈(Andrey Borzov)(Tutu.ru)


图片


我们都希望我们的用户感到高兴,并希望服务能够正常工作并在发生故障后迅速得到修复。 开发人员和团队越多,服务越不同,所有这些起作用的控制工具就越不同。 还有更多可能需要采取的措施才能诊断和恢复。
我将告诉您简单的技术解决方案如何帮助我们在事件发生期间使我们的生活更轻松。 我们如何使用聊天功能,几乎没有魔术,为团队提供了一个可定制的系统,该系统使诊断对他们更重要,不同系统的警报更有用,并且路由更容易。
另外,我将告诉您如何衡量服务可用性中宝贵的“九”,以及我们发生了什么。



处理生产爆炸:检测,损失估计,事件管理。 德米特里·希姆永(Avito)


图片


在您的实践中是否发生过直到最近才显得微不足道的失败导致整个食物被修饰的事实? 还是您解决了不是很严重的问题?
如何理解实际效果并识别定时炸弹? 如何管理错误和崩溃的流程并隔离重大错误? 在报告中,我将告诉您该练习如何在Avito中安排以及我们在工作中使用了哪些研究和自动化方法。



AutoLSR-自动收集重大事件的数据。 弗拉基米尔·科洛博耶夫(阿维托)


图片


有时会出现一切崩溃的情况,所有图形均为红色,并且一切都着火。 经过详细的分析,似乎一切都变得清晰了……但是没有。 找出问题的根本原因并不容易,尤其是当您对整体,服务,微服务,数据库,开发人员负责人等情况没有完整的了解时。
我将告诉您,我们如何收集各种系统和服务的所有秘密知识,故障场景,并将所有这些知识转移到代码中,以便对重大事件进行自动检测和初步分析。


我们现在已将其破坏,但稍后将对其进行修复。 技术债务及其价值。 鲍里斯·凯泽(臭氧)


图片


高发展速度导致技术债务积累速度加快。 我们越来越必须对已开发解决方案的稳定性和质量做出让步,以支持新功能和新产品属性。 如果没有适当控制技术债务的数量,系统稳定性以及业务技术稳定性的局面可能会恶化。 我将讨论如何控制所有故障并迅速修复的问题,我们如何帮助团队不要忘记这些承诺,我们将为企业提供完整的,可理解的信息,包括发生了什么,如何修复以及我们将如何做。它没有再次发生。


日程安排


12:30-13 :15-改善事件响应的简单工具:Tutu体验 。 安德烈(Andrey Borzov)(Tutu.ru)
13:20-14:00- 处理生产爆炸:检测,损失估计,事件管理 。 德米特里·希姆永(Avito)
14:00-14:45-午餐
14:45-15:30- AutoLSR-自动收集重大事件的数据 。 弗拉基米尔·科洛博耶夫(阿维托)
15:40-16:20- 我们现在把它弄坏了,但是我们稍后会修复。 科技债务及其价值 。 鲍里斯·凯泽(臭氧)
16:30-一场聚会后的聚会


密码和外观


Mitap将于8月10日12:00开始。 参加活动是免费的,但是您需要注册 。 请在护照上注明您的姓氏和名字,并且不要忘记随身携带(或驾驶执照),否则您将被禁止进入办公室。


地址: Lesnaya 7 Avito办事处。


在AvitoTech YouTube频道上观看mitap的直播。


待会见!

Source: https://habr.com/ru/post/zh-CN461739/


All Articles