Slurm DevOps. 3º dia. ELK, ChatOps, SRE. E a oração secreta do desenvolvedor

Chegou o terceiro e o último dia do primeiro, mas não o último Slurm DevOps.


Não esperávamos poder repetir os SlOm DevOps. Mas, inesperadamente, para nós, todos os palestrantes concordaram em ir a Slurm em fevereiro, e o feedback mostrou como finalizar o programa. Há um entendimento de como tornar o programa intensivo mais holístico e detalhado, e alguns tópicos mais práticos. Então, em fevereiro, realizaremos o DevOps Slurm em Moscou. Os detalhes estarão mais próximos de dezembro. O anúncio certamente aparecerá em Habré.



Em 6 de setembro, no terceiro dia de Slurm, quatro oradores falaram.


Vladimir Guryanov, engenheiro / líder de equipe em Southbridge, cujo desempenho no segundo dia de Slurm DevOps realmente gostou dos participantes do intensivo. Vladimir é um defensor ativo da abordagem DevOps em seu trabalho, tentando implementá-la em qualquer lugar.


Pavel Selivanov, uma estrela reconhecida de Slurm, idealizador do primeiro Slurm de Kubernetes. Os alunos escreveram sobre ele que "seria ótimo se ele liderasse o programa inteiro". Paul é um administrador certificado do Kubernetes. Ele possui vasta experiência prática na implementação do Kubernetes - mais de 25 projetos em equipe e individualmente.


Eduard Medvedev, CTO da Tungsten Labs, desenvolveu e implementou o ChatOps na automação de data centers. Após seu discurso sobre Slurm, muitos participantes pensaram em implementar o ChatOps em suas empresas. Agora atua com sucesso como consultor de segurança.


Ivan Kruglov, desenvolvedor principal da Booking.com, uma verdadeira estrela convidada da conferência. Foi por sua performance que alguns participantes se inscreveram no SlOm DevOps. Na Booking.com, ele participou de projetos de infraestrutura como entrega distribuída e processamento de mensagens, BigData e web-stack, pesquisa. Agora, na lista de suas tarefas, está a construção de uma nuvem interna e do Service Mesh.


Fizemos extensas entrevistas com Eduard Medvedev e Ivan Kruglov - publicaremos no Habré o mais rápido possível.



A platéia com toda sua aparência pensativa mostrou um leve cansaço. Os dois dias anteriores de trabalho intensivo foram forçados a trabalhar até o limite, os chefes exigiram descanso e dias de folga. Mas os temas e oradores do terceiro dia dispersaram a fadiga e a sonolência. Especialmente Engenharia de Confiabilidade do Site e Ivan Kruglov.


No final do segundo dia de Slurm , foi decidido adiar o monitoramento da infraestrutura de Prometheus para amanhã. A intensidade acabou sendo muito intensa - nem todos os participantes acompanharam o ritmo.



E assim o terceiro dia começou com um discurso de Vladimir Guryanov. Ele explicou brevemente por que o monitoramento é realmente necessário. Tipos de monitoramento descritos e classificados. Ele levantou a questão das notificações de monitoramento.


Os tópicos “Como construir um sistema de monitoramento saudável” e “Notificações legíveis por humanos” entraram muito animados no público. Vladimir concluiu a apresentação com o tópico Health Check, que vale a pena prestar atenção e como equipar a automação com base nos dados de monitoramento.



A fim de despertar os participantes sonolentos e ativar ao máximo suas habilidades de aprendizado, seguindo Vladimir Guryanov, Pavel Selivanov chamou a atenção do público com o tema “Registro de Aplicativos com ELK”. Ele mostrou a Slurm nossas melhores práticas de registro e revisou a pilha ELK.


Após o primeiro coffee break, cheio de comunicação e biscoitos, os participantes do Slerm tomaram lugar na platéia.


Os desempenhos de Guryanov, Selivanov e o alcalino da série purina de cafeína fizeram seus negócios insidiosos. A cafeína chegou aos receptores de adenosina do cérebro e substituiu o nucleosídeo adenosina da purina, responsável pelos processos de inibição, que simplesmente privou os participantes da Slerm da chance de "ficar com preguiça" e "tirar uma soneca". Nem todo mundo entendeu o que aconteceu. Mas todos se animaram.


Assim, o público estava cem por cento pronto para treinamento adicional e absorção ativa de conhecimento. E ao discurso de Eduard Medvedev.



Eduard falou sobre o tema da automação de infraestrutura com o ChatOps, falou sobre a integração de mensageiros instantâneos com pipelines.



O último dia de Slurm e Slurm DevOps como um todo foi a apresentação de Ivan Kruglov, desenvolvedor principal na Booking.com. Ivan imediatamente chamou a atenção do público, confessando que tinha mais de 140 slides na apresentação, sugerindo com cuidado que os participantes do Slerm não planejariam nem sexta nem o fim de semana.



Em uma apresentação intensa, longa e profunda, Ivan Kruglov abordou o assunto de DevOps e SRE, quem são eles, como se relacionam. Ele falou sobre "termos assustadores do mundo da SRE": SLA, SLO, Error Budget e alguns outros.




Depois veio a prática e ainda mais prática - monitorando o SLI e o SLO, aplicando o orçamento de erros e gerenciando interrupções e carga operacional (passagem, malha de serviço, suportes de circuito). E muito, muito mais.




Oração secreta do desenvolvedor.


Como o tópico do SRE é extremamente extenso e você pode falar sobre as nuances por pelo menos alguns dias, foi decidido que em fevereiro, no próximo DevOps Slurm, dedicaremos ainda mais tempo ao SRE e sua aplicação prática, como a tecnologia mais relevante e procurada.


Sabbath, [6 . 2019 ., 18:25:30]:  !!   ,        :) aaa, [6 . 2019 ., 18:27:07]:   UI\UX  mr. Dmitry, [6 . 2019 ., 18:28:47]: ,       -  ,  ,   .   -     

Após os discursos, surgiu uma série de perguntas, tanto offline quanto no bate-papo de trabalho da Slurm:


  , [6 . 2019 ., 23:24:54]:   ,  items  .  , . : 297 432 Maksim Aleksandrov, [7 . 2019 ., 0:11:58]:  .       (nvps) ?     prometheus ?  , [7 . 2019 ., 0:24:15]: 2.21K  prometheus? ,   - service discovery      .  zabbix    ,         .   docker  k8s  zabbix   .   ,  +    ,          zabbix. 

Os participantes da Slerm compartilharam suas impressões:


 Alexander B, [6 . 2019 ., 21:11:03]:   ,  "",      .     ,        )                     -    . Roman D, [6 . 2019 ., 20:49:05]: ,   .      -                  ,    .  , [6 . 2019 ., 20:49:30 (06.09.2019, 20:50:07)]:   ,   -    ,   , ,    

 Max Grechnev, [6 . 2019 ., 19:42:57]: !   !   ) Smith Wesson, [6 . 2019 ., 19:58:11]:   !  ! Igor Averin, [6 . 2019 ., 19:58:12]: !   !  ! 

Após a conferência, pedimos aos participantes que deixassem comentários na forma do Google Docs. Os resultados nos agradaram e nos inspiraram.





Obrigado a todos que estiveram conosco - offline, na sala de conferências Selectel e online. E muito obrigado aos leitores da Habr. “O slurm inspira !” ( C )

Source: https://habr.com/ru/post/pt466803/


All Articles