Slurm DevOps. 3. Tag. ELK, ChatOps, SRE. Und das geheime Gebet des Entwicklers

Der dritte und letzte Tag des ersten, aber nicht des letzten Slurm DevOps ist da.


Wir hatten nicht erwartet, die SlOm DevOps wiederholen zu können. Aber unerwartet für uns waren sich alle Redner einig, im Februar nach Slurm zu kommen, und die Rückmeldungen zeigten, wie das Programm abgeschlossen werden kann. Es besteht ein Verständnis dafür, wie das Intensivprogramm ganzheitlicher und detaillierter gestaltet werden kann, und einige Themen sind praktischer. Im Februar werden wir den DevOps Slurm in Moskau veranstalten. Details werden näher am Dezember sein. Die Ankündigung wird sicherlich auf Habré erscheinen.



Am 6. September, am dritten Tag von Slurm, sprachen vier Redner.


Vladimir Guryanov, Ingenieur / Teamleiter in Southbridge, dessen Auftritt am zweiten Tag von Slurm DevOps die Teilnehmer des Intensivkurses sehr mochte. Vladimir ist ein aktiver Befürworter des DevOps-Ansatzes in seiner Arbeit und versucht, ihn überall umzusetzen.


Pavel Selivanov, ein anerkannter Slurm-Star, Mastermind des ersten Slurm von Kubernetes. Die Studenten schrieben über ihn: "Es wäre großartig, wenn er das gesamte Programm leiten würde." Paul ist zertifizierter Kubernetes-Administrator. Er verfügt über umfangreiche praktische Erfahrung in der Implementierung von Kubernetes - mehr als 25 Projekte im Team und individuell.


Eduard Medvedev, CTO bei Tungsten Labs, entwickelte und implementierte ChatOps zur Automatisierung von Rechenzentren. Nach seiner Rede über Slurm dachten viele Teilnehmer darüber nach, ChatOps in ihren Unternehmen zu implementieren. Jetzt erfolgreich als Sicherheitsberater tätig.


Ivan Kruglov, Hauptentwickler bei Booking.com, ein echter Gaststar der Konferenz. Aufgrund seiner Leistung haben sich einige Teilnehmer für die SlOm DevOps angemeldet. Bei Booking.com war er an Infrastrukturprojekten wie verteilter Zustellung und Nachrichtenverarbeitung, BigData- und Web-Stack-Suche beteiligt. Auf der Liste seiner Aufgaben steht nun der Aufbau einer internen Cloud und eines Service Mesh.


Wir haben ausführliche Interviews mit Eduard Medwedew und Iwan Kruglow geführt - wir werden sie so bald wie möglich auf Habré veröffentlichen.



Das Publikum mit all seinem nachdenklichen Auftreten zeigte eine leichte Müdigkeit. Die letzten zwei Tage intensiver Arbeit waren gezwungen, bis an die Grenzen zu arbeiten, die Köpfe forderten Ruhe und freie Tage. Aber die Themen und Sprecher des dritten Tages zerstreuten Müdigkeit und Schläfrigkeit. Insbesondere Site Reliability Engineering und Ivan Kruglov.


Am Ende von Slurms zweitem Tag wurde beschlossen, die Überwachung der Infrastruktur von Prometheus auf morgen zu verschieben. Die Intensität erwies sich als zu intensiv - nicht alle Teilnehmer hielten Schritt.



Und so begann der dritte Tag mit einer Rede von Vladimir Guryanov. Er erklärte kurz, warum eine Überwachung tatsächlich erforderlich ist. Beschriebene und klassifizierte Überwachungstypen. Er sprach das Problem der Überwachungsbenachrichtigungen an.


Die Themen „Wie man ein gesundes Überwachungssystem aufbaut“ und „Von Menschen lesbare Benachrichtigungen“ kamen sehr lebhaft ins Publikum. Vladimir schloss die Präsentation mit dem Thema Gesundheitscheck ab, das es wert ist, beachtet zu werden und die Automatisierung anhand von Überwachungsdaten auszurüsten.



Um schläfrige Teilnehmer zu erregen und ihre Lernfähigkeiten nach Vladimir Guryanov maximal zu aktivieren, wurde die Aufmerksamkeit der Öffentlichkeit von Pavel Selivanov mit dem Thema „Application Logging with ELK“ auf sich gezogen. Er zeigte Slurm unsere besten Protokollierungsmethoden und überprüfte den ELK-Stapel.


Nach der ersten Kaffeepause voller Kommunikation und Kekse fanden die Slerm-Teilnehmer im Publikum statt.


Die Aufführungen von Guryanov, Selivanov und dem Alkali der Purin-Koffeinserie machten ihr heimtückisches Geschäft. Koffein erreichte die Adenosinrezeptoren des Gehirns und ersetzte dort das Purinnukleosid Adenosin, das für die Hemmungsprozesse verantwortlich ist - was den Teilnehmern von Slerm einfach die Chance nahm, „faul“ zu sein und „ein Nickerchen zu machen“. Nicht jeder hat verstanden, was passiert ist. Aber alle munterten auf.


Somit war das Publikum hundertprozentig bereit für Weiterbildung und aktive Aufnahme von Wissen. Und zur Rede von Eduard Medwedew.



Eduard sprach mit ChatOps über das Thema Infrastrukturautomatisierung und über die Integration von Instant Messenger in Pipelines.



Das Finale des dritten Tages von Slurm und Slurm DevOps als Ganzes war die Leistung von Ivan Kruglov, Hauptentwickler auf Booking.com. Ivan erregte sofort die Aufmerksamkeit des Publikums und gestand, dass er mehr als 140 Folien in der Präsentation hatte, und deutete damit sorgfältig an, dass die Slerm-Teilnehmer weder für Freitag noch für das Wochenende Pläne machen würden.



In einer intensiven, langwierigen und tiefgreifenden Präsentation ging Ivan Kruglov auf das Thema DevOps und SRE ein, wer sie zueinander sind und wie sie sich verhalten. Er sprach über „beängstigende Begriffe aus der Welt von SRE“: SLA, SLO, Fehlerbudget und einige andere.




Dann kam die Praxis und noch mehr Praxis - Überwachung von SLI und SLO, Anwenden des Fehlerbudgets und Verwalten von Interrupts und Betriebslast (Apigateway, Service Mesh, Circuit Brackers). Und vieles mehr.




Geheimes Gebet des Entwicklers.


Da das SRE-Thema äußerst umfangreich ist und Sie mindestens einige Tage über die Nuancen sprechen können, wurde beschlossen, dass wir im Februar beim nächsten DevOps Slurm noch mehr Zeit für SRE und seine praktische Anwendung als relevanteste und gefragteste Technologie verwenden werden.


Sabbath, [6 . 2019 ., 18:25:30]:  !!   ,        :) aaa, [6 . 2019 ., 18:27:07]:   UI\UX  mr. Dmitry, [6 . 2019 ., 18:28:47]: ,       -  ,  ,   .   -     

Nach den Reden tauchten eine Reihe von Fragen auf, sowohl offline als auch im Slurm-Arbeitschat:


  , [6 . 2019 ., 23:24:54]:   ,  items  .  , . : 297 432 Maksim Aleksandrov, [7 . 2019 ., 0:11:58]:  .       (nvps) ?     prometheus ?  , [7 . 2019 ., 0:24:15]: 2.21K  prometheus? ,   - service discovery      .  zabbix    ,         .   docker  k8s  zabbix   .   ,  +    ,          zabbix. 

Slerm-Teilnehmer teilten ihre Eindrücke:


 Alexander B, [6 . 2019 ., 21:11:03]:   ,  "",      .     ,        )                     -    . Roman D, [6 . 2019 ., 20:49:05]: ,   .      -                  ,    .  , [6 . 2019 ., 20:49:30 (06.09.2019, 20:50:07)]:   ,   -    ,   , ,    

 Max Grechnev, [6 . 2019 ., 19:42:57]: !   !   ) Smith Wesson, [6 . 2019 ., 19:58:11]:   !  ! Igor Averin, [6 . 2019 ., 19:58:12]: !   !  ! 

Nach der Konferenz haben wir die Teilnehmer gebeten, Feedback in Form von Google Text & Tabellen zu hinterlassen. Die Ergebnisse haben uns erfreut und inspiriert.





Vielen Dank an alle, die bei uns waren - offline, im Selectel-Konferenzraum und online. Und vielen Dank an die Habr-Leser. "Der Slurm inspiriert !" ( C )

Source: https://habr.com/ru/post/de466803/


All Articles