Le troisième et dernier jour du premier, mais pas le dernier Slurm DevOps est arrivé.
Nous ne nous attendions pas à pouvoir répéter les SlOm DevOps. Mais de manière inattendue pour nous, tous les intervenants ont accepté de venir à Slurm en février, et les commentaires ont montré comment finaliser le programme. Il y a une compréhension de la façon de rendre le programme intensif plus holistique et détaillé, et certains sujets plus pratiques. Donc en février, nous allons organiser le DevOps Slurm à Moscou. Les détails seront plus proches de décembre. L'annonce paraîtra certainement sur Habré.

Le 6 septembre, le troisième jour de Slurm, quatre orateurs ont pris la parole.
Vladimir Guryanov, ingénieur / chef d'équipe à Southbridge, dont les performances lors de la deuxième journée de Slurm DevOps ont vraiment plu aux participants de l'intensif. Vladimir soutient activement l'approche DevOps dans son travail, essayant de la mettre en œuvre partout.
Pavel Selivanov, une star reconnue de Slurm, le cerveau du premier Slurm de Kubernetes. Les étudiants ont écrit à son sujet «ce serait formidable s'il dirigeait l'ensemble du programme». Paul est un administrateur certifié Kubernetes. Il possède une vaste expérience pratique dans la mise en œuvre de Kubernetes - plus de 25 projets en équipe et individuellement.
Eduard Medvedev, CTO chez Tungsten Labs, a développé et implémenté ChatOps dans l'automatisation des centres de données. Après son discours sur Slurm, de nombreux participants ont pensé à implémenter ChatOps dans leur entreprise. Agit maintenant avec succès en tant que consultant en sécurité.
Ivan Kruglov, développeur principal chez Booking.com, une véritable star de la conférence. C'est pour le plaisir de sa performance que certains participants se sont inscrits au SlOm DevOps. Chez Booking.com, il était engagé dans des projets d'infrastructure tels que la distribution distribuée et le traitement des messages, les BigData et la pile Web, la recherche. Maintenant, sur la liste de ses tâches, il construit un cloud interne et un maillage de service.
Nous avons interviewé longuement Eduard Medvedev et Ivan Kruglov - nous le publierons sur Habré dès que possible.

Le public avec toute son apparence réfléchie a montré une légère fatigue. Les deux jours précédents de travail intensif ont été contraints de travailler à la limite, les têtes ont exigé du repos et des jours de congé. Mais les thèmes et les intervenants du troisième jour ont dispersé fatigue et somnolence. Surtout Site Reliability Engineering et Ivan Kruglov.
À l'issue du deuxième jour de Slurm , il a été décidé de reporter la surveillance des infrastructures de Prométhée à demain. L'intensité s'est avérée trop intense - tous les participants n'ont pas suivi le rythme.

Et donc le troisième jour a commencé par un discours de Vladimir Guryanov. Il explique brièvement pourquoi la surveillance est réellement nécessaire. Types de surveillance décrits et classés. Il a soulevé la question du suivi des notifications.
Les sujets «Comment construire un système de surveillance sain» et «Notifications lisibles par l'homme» ont été très animés et ont pénétré le public. Vladimir a conclu la présentation par le thème Bilan de santé, qui mérite une attention particulière et comment équiper l'automatisation sur la base des données de surveillance.

Afin d'attiser les participants endormis et d'activer leurs capacités d'apprentissage au maximum, à la suite de Vladimir Guryanov, Pavel Selivanov a attiré l'attention du public sur le thème «Journalisation des applications avec ELK». Il a montré à Slurm nos meilleures pratiques de journalisation et a examiné la pile ELK.
Après la première pause-café, pleine de communication et de cookies, les participants de Slerm ont pris place dans le public.
Les performances de Guryanov, Selivanov et l'alcalin de la série de caféine purine ont fait leur affaire insidieuse. La caféine a atteint les récepteurs de l'adénosine du cerveau et a remplacé l'adénosine, un nucléoside purique, responsable des processus d'inhibition, qui a simplement privé les participants de Slerm de la possibilité de «devenir trop paresseux» et de «faire une sieste». Tout le monde n'a pas compris ce qui s'est passé. Mais tout le monde s'est réjoui.
Ainsi, le public était à 100% prêt pour une formation continue et une absorption active des connaissances. Et au discours d'Eduard Medvedev.

Eduard a parlé du sujet de l'automatisation des infrastructures avec ChatOps, a parlé de l'intégration des messageries instantanées avec les pipelines.

La finale du troisième jour de Slurm et Slurm DevOps dans son ensemble a été la performance d'Ivan Kruglov, développeur principal sur Booking.com. Ivan a immédiatement attiré l'attention du public, avouant qu'il avait plus de 140 diapositives dans la présentation, laissant ainsi soigneusement entendre que les participants au Slerm ne feraient pas de plans pour vendredi ou le week-end.

Dans une présentation intense, longue et profonde, Ivan Kruglov a abordé le sujet des DevOps et SRE, qui ils sont les uns aux autres, comment ils se rapportent. Il a parlé de «termes effrayants du monde du SRE»: SLA, SLO, Error Budget et quelques autres.


Puis vint la pratique et encore plus de pratique - surveiller SLI et SLO, appliquer le budget d'erreur et gérer les interruptions et la charge de fonctionnement (apigateway, service mesh, circuit brackets). Et bien plus encore.


Prière secrète du développeur.
Étant donné que le sujet SRE est extrêmement vaste et que vous pouvez parler des nuances pendant au moins quelques jours, il a été décidé qu'en février, lors du prochain DevOps Slurm, nous consacrerons encore plus de temps au SRE et à son application pratique en tant que technologie la plus pertinente et la plus recherchée.
Sabbath, [6 . 2019 ., 18:25:30]: !! , :) aaa, [6 . 2019 ., 18:27:07]: UI\UX mr. Dmitry, [6 . 2019 ., 18:28:47]: , - , , . -
Après les discours, une série de questions s'est posée, à la fois hors ligne et dans le chat de travail Slurm:
, [6 . 2019 ., 23:24:54]: , items . , . : 297 432 Maksim Aleksandrov, [7 . 2019 ., 0:11:58]: . (nvps) ? prometheus ? , [7 . 2019 ., 0:24:15]: 2.21K prometheus? , - service discovery . zabbix , . docker k8s zabbix . , + , zabbix.
Les participants de Slerm ont partagé leurs impressions:
Alexander B, [6 . 2019 ., 21:11:03]: , "", . , ) - . Roman D, [6 . 2019 ., 20:49:05]: , . - , . , [6 . 2019 ., 20:49:30 (06.09.2019, 20:50:07)]: , - , , ,
Max Grechnev, [6 . 2019 ., 19:42:57]: ! ! ) Smith Wesson, [6 . 2019 ., 19:58:11]: ! ! Igor Averin, [6 . 2019 ., 19:58:12]: ! ! !
Après la conférence, nous avons demandé aux participants de laisser des commentaires sous la forme de Google Docs. Les résultats nous ont satisfaits et inspirés.



Merci à tous ceux qui étaient avec nous - hors ligne, dans la salle de conférence Selectel et en ligne. Et merci beaucoup aux lecteurs Habr. «Le slurm inspire !» ( C )