Slurm SRE-学习确保用户满意


2月3日在莫斯科开始Slurm SRE。


这是我们离开“教师重复”计划的第一阶段。 您会在SRE项目中找到尽可能接近实际情况的工作。


您将获得一个完善的工作项目,并将与他实时合作。 一个典型的SRE任务正等着您:处理不熟悉的代码,分布式系统同步问题,与同事之间的沟通困难。


您正在等待来自现实生活的非平凡的系统故障。 (我不时听到发言人的话:“同事,很抱歉,我将无法在接下来的两天参加会议,但是我们的计划已成为一个很好的案例”)。


考虑到每秒都是我们培训公司的利润损失这一事实,事件将迅速发展。


我们将参与者分成小组。 每个团队都有一位导师,一位课程讲师。 每个团队都对其后端负责。 随着事件的发展,您将需要组织团队中的工作并与其他团队互动。 我们按照得分进行比赛:评委将删除并增加得分,以便团队了解其行动的充分性和有效性。 最后,我们将宣布获胜者。


每次事件发生后,我们都会进行汇报,在此过程中我们将识别并修复系统问题。 指导者将实施事后无罪的文化。 在我们地区,非指责方法并不是很普遍,但这是实现SRE和DevOps的关键之一。


我们希望在三天内实现全球范式转变:教您以SRE工程师的身份思考,并以SRE工程师的身份看项目。


要参与,您将需要一台笔记本电脑,耳机和Kubernetes的基础知识。 如果没有最后一项,在剩余时间内您可以参加在线课程Slurm Kubernetes


在这里注册。

Source: https://habr.com/ru/post/zh-CN484370/


All Articles