
El 3 de febrero en Moscú comienza Slurm SRE.
Este es el primer intensivo donde dejamos el esquema "Repetir para el maestro". Encontrarás trabajo en un proyecto SRE lo más cerca posible de las condiciones de combate.
Obtendrá un proyecto de trabajo completo en sus manos y trabajará con él en tiempo real. Le espera una tarea típica de SRE: trabajar con código desconocido, problemas de sincronización de sistemas distribuidos, dificultades para comunicarse con colegas.
Está esperando fallas no triviales del sistema, tomadas de la vida real. (De vez en cuando escucho a los oradores: "Colegas, lo siento, no podré unirme a las reuniones en los próximos dos días, pero ha aparecido un excelente caso para nuestro programa").
Los incidentes se desarrollarán rápidamente, teniendo en cuenta el hecho de que cada segundo es el beneficio perdido de nuestra empresa de capacitación.
Dividiremos a los participantes en equipos. Cada equipo tendrá un mentor, uno de los oradores del curso. Cada equipo es responsable de su backend. A medida que se desarrollen los incidentes, deberá organizar el trabajo en su equipo e interactuar con otros equipos. Jugamos en el marcador: los jueces eliminarán y agregarán puntos para que el equipo vea cuán adecuadas y efectivas son sus acciones. Y al final anunciaremos el ganador.
Después de cada incidente, habrá un informe donde identificaremos y solucionaremos los problemas del sistema en los procesos. Los mentores harán cumplir la cultura sin culpa post-mortem. En nuestra área, el enfoque sin culpa no está muy extendido, pero esta es una de las claves para implementar SRE y DevOps.
Esperamos lograr un cambio de paradigma global en tres días: enseñarle a pensar como ingeniero SRE y mirar un proyecto como ingeniero SRE.
Para participar, necesitará una computadora portátil, auriculares y conocimientos básicos de Kubernetes. Si no hay un último elemento, durante el tiempo restante puede tomar el curso en línea Slurm Kubernetes .
Regístrese aquí