La épica sobre los administradores del sistema como una especie en peligro de extinción.

Administradores de sistemas en todo el mundo, ¡felicidades por sus vacaciones profesionales!

No nos quedan administradores del sistema (bueno, casi). Sin embargo, la tradición de ellos todavía es fresca. En honor a las vacaciones, hemos preparado esta epopeya. Siéntense, queridos lectores.



Érase una vez, el mundo de Dodo IS estaba en llamas. En ese momento, la tarea principal de nuestros administradores de sistemas era sobrevivir otro día y no llorar.

Érase una vez, los programadores escribieron código un poco y lentamente, y lo presentaron en productos solo una vez por semana. Entonces los problemas surgieron solo una vez cada siete días. Pero luego comenzaron a escribir más código y a difundirlo más a menudo, los problemas comenzaron a aumentar, a veces todo comenzó a desmoronarse y la reversión empeoró. Los administradores del sistema sufrieron, pero sufrieron esta cabina.

Se sentaban en casa por las tardes con ansiedad en sus corazones. Y cada vez que sucedió, "nunca sucedió, y nuevamente el monitoreo envía una señal de ayuda: ¡Amigo, el mundo está en llamas!". Luego, los administradores de nuestro sistema se pusieron sus gabardinas rojas, bragas sobre calzas, hicieron rizos en sus frentes y volaron para salvar el mundo Dodo.

Atención, una pequeña explicación. Los administradores de sistemas clásicos que sirven el hardware en Dodo IS nunca lo han sido. Inmediatamente hicimos avanzar a Azure en las nubes.

¿Qué hicieron ellos?

  • si algo se rompe, lo hacemos para que se repare;
  • jugó con servidores a nivel experto;
  • Responsable de la red virtual en Azure
  • eran responsables de cosas de bajo nivel, por ejemplo, interacciones de componentes (* en un susurro * en las que a veces no hurgaban en nicromo);
  • el servidor se reconecta;
  • y muchos otros salvajes.

La vida del equipo de ingenieros de infraestructura (como llamamos a nuestros administradores de sistemas) consistió en la extinción de incendios y bancos de pruebas siempre en funcionamiento. Vivieron y se afligieron, y luego decidieron pensar: ¿qué es tan malo, tal vez podamos hacerlo mejor? Por ejemplo, ¿no dividiremos a las personas en programadores y administradores de sistemas?

Tarea


Dado: hay un administrador del sistema que tiene servidores en la zona de responsabilidad, una red que lo conecta con otros servidores, programas de nivel de infraestructura (el servidor web que aloja la aplicación, un sistema de administración de bases de datos, etc.). Y hay un programador cuya área de responsabilidad es el código de trabajo.

Y hay cosas que están en el cruce. ¿De quién es la responsabilidad?

Por lo general, en este cruce, nuestros administradores y programadores del sistema se reunieron y comenzó:

- Dudes, nada funciona, probablemente debido a la infraestructura.
- Dudes, no, está en el código.

Una vez en ese momento, una cerca comenzó a crecer entre ellos, a través de la cual arrojaron caca con alegría. La tarea, como una caca, fue lanzada de un lado a otro de la cerca. En este caso, nadie estuvo cerca de resolver la situación. Triste sonrisa

Un rayo de sol atravesó un cielo nublado, cuando hace varios años a Google se le ocurrió la idea de no hacer cosas, sino de hacer algo común.

Pero, ¿y si describe todo como código?


En 2016, Google lanzó un folleto titulado "Ingeniería de confiabilidad del sitio" sobre la transformación del rol de administrador del sistema: del Master of Magic a un enfoque formal de ingeniería para usar software y automatización. Ellos mismos atravesaron todas las espinas y obstáculos, entendieron y decidieron compartir esto con el mundo. El libro es de dominio público aquí .

El libro contiene verdades simples:

  • hacer todo como código es bueno;
  • usar un enfoque de ingeniería es bueno;
  • hacer un buen monitoreo es bueno;
  • evitar que se libere el servicio si no tiene un registro y monitoreo claros también es bueno.

Estas prácticas fueron leídas por nuestra Gleb ( entropía ), y nos vamos. Estamos presentando! Ahora estamos en una fase de transición. El equipo de SRE se ha formado (hay 6 especialistas ya preparados, 6 más están incorporando) y está listo para cambiar el mundo completamente, que consiste en código para mejor.

Creamos nuestra infraestructura de tal manera que permita a los desarrolladores administrar completamente sus entornos y colaborar con SRE.

Vangem en lugar de conclusiones


El administrador del sistema es una profesión digna. Pero el conocimiento de la parte del sistema también requiere excelentes habilidades de ingeniería de software.

Los sistemas se están volviendo cada vez más simples, y el conocimiento súper único de administrar servidores de hierro se está volviendo menos popular cada año. La tecnología en la nube está eliminando la necesidad de este conocimiento.

Un buen administrador del sistema en el futuro cercano tendrá que tener buenas habilidades de ingeniería de software. Mejor aún, él tiene buenas habilidades en esta área.

Nadie sabe cómo predecir el futuro hasta que llegue, pero creemos que con el tiempo habrá cada vez menos empresas que quieran aumentar el personal infinitamente inflado de los administradores de sistemas. Aunque, por supuesto, los amantes permanecerán. Pocos montan a caballo hoy, la mayoría usan autos, aunque hay amantes ...

Todo con un día administrador de sistemas, todo el código!

Source: https://habr.com/ru/post/461447/


All Articles