Administradores de sistemas em todo o mundo, parabéns pelas suas férias profissionais!
Não temos mais administradores de sistema (quase). No entanto, a tradição deles ainda é nova. Em homenagem ao feriado, preparamos esse épico. Sente-se, queridos leitores.

Era uma vez, o mundo do Dodo IS estava pegando fogo. Naquela época, a principal tarefa dos administradores de sistema era sobreviver mais um dia e não chorar.
Era uma vez, os programadores escreviam o código um pouco e lentamente, e os expunham no prod apenas uma vez por semana. Portanto, os problemas surgiam apenas uma vez a cada sete dias. Mas então eles começaram a escrever mais código e espalhá-lo com mais frequência, os problemas começaram a aumentar, às vezes tudo começou a desmoronar e a reversão piorou. Os administradores de sistema sofreram, mas sofreram esse estande.
Sentavam-se em casa à noite com ansiedade em seus corações. E toda vez que acontecia, “nunca existia, e novamente o monitoramento envia um sinal de ajuda: Cara, o mundo está pegando fogo!”. Em seguida, nossos administradores de sistema vestiram suas capas de chuva vermelhas, shorts sobre leggings, fizeram cachos nas testas e voaram para salvar o mundo dos Dodós.
Atenção, uma pequena explicação. Os administradores de sistema clássicos que servem o hardware no Dodo nunca foram. Imediatamente tivemos o Azure avançado nas nuvens.
O que eles fizeram:
- se algo quebra, fazemos com que seja reparado;
- malabarismo com servidores no nível de especialista;
- Responsável pela rede virtual no Azure
- eles eram responsáveis por coisas de baixo nível, por exemplo, interações de componentes (* em um sussurro * em que às vezes não vasculhavam o nicrômio);
- reconexões de servidor;
- e muitos outros selvagens.
A vida da equipe de engenheiros de infraestrutura (como chamamos nossos administradores de sistema) consistiu em extinguir incêndios e bancadas de teste ininterruptas. Eles viveram e sofreram, e depois decidiram pensar: o que é tão ruim, talvez possamos fazer melhor? Por exemplo, não dividiremos as pessoas em programadores e administradores de sistema?
Tarefa
Dado: existe um administrador de sistema que possui servidores na zona de responsabilidade, uma rede que o conecta a outros servidores, programas no nível de infraestrutura (o servidor da web que hospeda o aplicativo, um sistema de gerenciamento de banco de dados etc.). E há um programador cuja área de responsabilidade está trabalhando com código.
E há coisas que estão na junção. De quem é a responsabilidade?
Geralmente, nesse ponto de junção, nossos administradores de sistema e programadores se encontravam e tudo começou:
- Cara, nada funciona, provavelmente por causa da infraestrutura.
- Cara, não, está no código.
Uma vez naquele momento, uma cerca começou a crescer entre eles, através da qual eles alegremente jogavam cocô. A tarefa, como um cocô, foi jogada de um lado da cerca para o outro. Nesse caso, ninguém chegou perto de resolver a situação. Sorriso triste.
Um raio de sol perfurou um céu nublado, quando, há vários anos, o Google surgiu com a idéia de não fazer as coisas, mas fazer uma coisa comum.
Mas e se você descrever tudo como código?
Em 2016, o Google lançou um livreto “Site Reliability Engineering” sobre a transformação do papel de administrador de sistemas: do Master of Magic a uma abordagem formal de engenharia para uso de software e automação. Eles mesmos passaram por todos os espinhos e obstáculos, pegaram o jeito e decidiram compartilhar isso com o mundo. O livro está em domínio público
aqui .
O livro contém verdades simples:
- fazer tudo como o código é bom;
- usar uma abordagem de engenharia é bom;
- fazer um bom monitoramento é bom;
- impedir que o serviço seja liberado se ele não tiver registro e monitoramento claros também é bom.
Essas práticas foram lidas pelo nosso Gleb (
entropia ), e lá vamos nós. Estamos apresentando! Estamos agora em uma fase de transição. A equipe do SRE foi formada (há 6 especialistas prontos, mais 6 estão integrados) e está pronta para mudar o mundo, consistindo completamente de código para melhor.
Criamos nossa infraestrutura de forma a permitir que os desenvolvedores gerenciem completamente seus ambientes e colaborem com o SRE.
Vangem em vez de conclusões
O administrador do sistema é uma profissão digna. Mas o conhecimento da parte do sistema também requer excelentes habilidades de engenharia de software.
Os sistemas estão se tornando cada vez mais simples, e o conhecimento super exclusivo da administração de servidores de ferro está se tornando menos popular a cada ano. A tecnologia de nuvem está suprindo a necessidade desse conhecimento.
Um bom administrador de sistemas em um futuro próximo precisará ter boas habilidades de engenharia de software. Melhor ainda, ele tem boas habilidades nessa área.
Ninguém sabe como prever o futuro até que ele chegue, mas acreditamos que, com o tempo, haverá cada vez menos empresas que desejam aumentar a equipe infinitamente inflada de administradores de sistemas. Embora, é claro, os amantes permaneçam. Hoje em dia, poucos andam a cavalo, principalmente carros, embora existam amantes ...
Tudo com um sysadmin de dia, todo o código!