Slurm: la chenille s'est transformée en papillon


<TL; DR>


  1. Slurm vous permet vraiment d'entrer dans le thème Kubernetes ou d'améliorer vos connaissances.
  2. Les participants sont satisfaits. Ceux qui n'ont rien appris de nouveau ou qui n'ont pas résolu leurs tâches sont peu nombreux. Une seule personne a utilisé la tirelire inconditionnelle du premier jour («Si vous pensez que Slerm ne vous convient pas», nous vous rembourserons le prix total du billet), confirmant qu'il a surestimé ses forces.
  3. Le prochain Slurm aura lieu début septembre à Saint-Pétersbourg. Selectel, notre sponsor permanent, fournit non seulement un cloud pour les stands, mais aussi sa propre salle de conférence.
  4. Nous répétons le Slurm de base (9-11 septembre) et présentons un nouveau programme: DevOps Slurm (4-6 septembre).

Qu'est-ce que Slurm et comment a-t-il changé


Il y a un an, l'idée nous est venue d'organiser des cours Kubernetes. En août 18, Slurm-1 est passé: difficile, avec une presintation continue (quand la présentation est finie sur scène), avec un tas de problèmes quotidiens. Rallye de tests: les participants du premier Slurm, comme la Confrérie du Ring, communiquent toujours entre eux.



Alors regardé Slurm-1


Sur le premier Slurme, l'idée est née de tenir MegaSlerm. Nous avons demandé aux gens quels sujets les intéressaient et, en octobre, nous avons organisé un cours avancé «à la demande des participants». Il s'est avéré un événement intéressant, mais ponctuel. En mai 19, nous avons préparé un véritable cours avancé, avec sa propre logique et son histoire interne.


Au cours de l'année, Slurm et transformé organisationnellement:
- Docker et Anisble ont été supprimés du programme principal et ont fait des cours en ligne distincts.
- Support technique organisé qui aide les étudiants à résoudre les clusters d'apprentissage.
- Les intervenants ont reçu un soutien méthodologique.



L'équipe qui a fait Slurm-4


Avis des participants


Un autre record a été enregistré: 170 participants sur la base Slurm, 75 - sur MegaSlerm.



Slurm-4
Un formulaire de rétroaction a été rempli par 101 personnes sur 170.


Kubernetes est-il devenu clair?
41 - Je ne comprends pas encore les k8, mais je vois oĂą creuser.
36 - Je ne connaissais pas les k8 auparavant, maintenant je l'ai compris.
23 - Je connaissais les k8, maintenant je sais mieux.
1 - Je n'ai rien appris de nouveau.
0 - Je n'ai rien compris aux k8.


Comment aimez-vous l'intensité de Slurm?


16 personnes pensent que Slurm est trop simple et lent, et 14 - ce qui est trop difficile et rapide. Le reste est parfait.


Avez-vous résolu le problème avec lequel vous êtes allé à Slurm?


90 - Oui.
11 - Non.


MegaSlerm


40 personnes ont rempli un formulaire de feedback. 2 personnes ont dit que c'était trop simple et trop lent. 1 personne n'a pas résolu le problème avec lequel il se rendait au Mega. Le reste est OK.


Examen de Slurm sur https://serveradmin.ru


Avis des conférenciers



Alors qu'à Saint-Pétersbourg en février il y avait surtout des nouveaux arrivants, puis à Moscou, des gens en vrac ont déjà jugé à Kubernetes. De nombreuses questions avancées vous ont fait réfléchir.


Si à Saint-Pétersbourg, ils ont demandé quand nous publierions notre fourchette de kubespray, alors à Moscou, on nous a déjà demandé pourquoi nous proposons d'utiliser notre fourchette et de ne pas prendre la kubespray d'origine. Telle est la pensée critique des personnes âgées.


La pratique a été difficile, les gens ont fait beaucoup d’erreurs et c’est merveilleux: il faut se faire des bosses pendant les études et pas au combat.


Nous avons régulièrement été confrontés à des limites d'obtention de certificats, des limites de téléchargement depuis Github, etc. C'est la vie - nous avons déployé simultanément environ 200 clusters dans le cloud Selectel. Personne ne prépare ses ressources et ses limites pour cela.


Annonce Slurm sur Selectel


→ Inscription au Slerm-5
Prix: 25 000 â‚˝


Programme:

Sujet n ° 1: Présentation de Kubernetes, composants clés
- Introduction Ă  la technologie k8s. Description, application, concepts
- Pod, ReplicaSet, Déploiement, Service, Ingress, PV, PVC, ConfigMap, Secret


Thème №2: Dispositif de cluster, composants principaux, tolérance aux pannes, réseau k8s
- Dispositif de cluster, composants principaux, tolérance aux pannes
- réseau k8s


Sujet n ° 3: Kubespray, optimisation et optimisation d'un cluster Kubernetes
- Kubespray, optimisation et optimisation du cluster Kubernetes


Thème # 4: Abstractions avancées de Kubernetes
- DaemonSet, StatefulSet, RBAC, Job, CronJob, Pod Scheduling, InitContainer


Sujet n ° 5: Services et applications de publication
- Présentation des méthodes de publication de services: NodePort vs LoadBalancer vs Ingress
- Contrôleur d'entrée (Nginx): équilibrage du trafic entrant
- Cert-manager: recevez automatiquement les certificats SSL / TLS


Sujet n ° 6: Introduction à Helm


Sujet n ° 7: Installation de cert-manager


Sujet n ° 8: Ceph: installation Do-Me-Me


Thème №9: Journalisation et surveillance
- Cluster Monitoring, Prometheus
- Cluster Logging, Fluentd / Elastic / Kibana


Sujet n ° 10: mise à jour du cluster


Thème №11: Travaux pratiques, dockerisation de l'application et lancement dans le cluster


Les cours Docker et Ansible sur stepik.org sont inclus.


→ Inscrivez-vous à Slurm DevOps
Prix: 45 000 â‚˝


Programme:

Sujet n ° 1: Introduction à Git
- Les commandes de base git init, commit, add, diff, log, status, pull, push
- Mise en place de l'environnement local: recommandations pratiques
- Git flow, branches et tags, stratégies de fusion
- Travailler avec plusieurs repo Ă  distance


Sujet n ° 2: Travail d'équipe avec Git
- Flux GitHub
- Fork, remoute, pull request
- Conflits, releases, encore une fois sur Gitflow et autres flux en relation avec les équipes


Thème # 3: CI / CD Introduction à l'automatisation
- Automatisation dans git (bots, introduction au CI, hooks)
- Outils (bash, make, gradle)
- Lignes d'assemblage de convoyeurs d'usine et leur application en informatique


Sujet n ° 4: CI / CD: Travailler avec Gitlab
- Assemblage, test, déploiement
- Étapes, variables, contrôle d'exécution (seulement, quand, inclure)


Thème №5: Travailler avec l'application d'un point de vue de développement
- Nous écrivons un microservice en Python (y compris les tests)
- Application de docker-compose en développement


Sujet n ° 6: Infrastructure en tant que code
- IaC: approche de l'infrastructure comme code
- IaC sur l'exemple de Terraform
- IaC sur l'exemple d'Ansible
- Idempotence, déclarativité
- Entraînez-vous à créer des livres de jeu ansibles
- Stockage de configuration, collaboration, automatisation des applications


Sujet n ° 7: tester l'infrastructure
- Test et intégration continue avec Molecule et Gitlab CI


Sujet n ° 8: Automatisation du levage de serveur
- Nous collectons des images
- PXE et DHCP


Sujet n ° 9: Automatisation de l'infrastructure
- Un exemple de service d'infrastructure pour l'autorisation sur les serveurs
- ChatOps (intégration de messageries instantanées avec des pipelines)


Sujet n ° 10: Automatisation de la sécurité
- Artefacts Signature CI / CD
- Analyse de vulnérabilité


Thème 11: Surveillance
- Définition de SLA, SLO, Error Budget et autres termes effrayants du monde du SRE
- SRE: Pratiquer la surveillance SLI et SLO
- SRE: erreur de pratique budgétaire
- SRE: gestion des interruptions et de la charge opérationnelle (apigateway, service mesh, bracket brackets)
- Suivi des pipelines et métriques de développement

Source: https://habr.com/ru/post/fr455972/


All Articles