Kubernetes Intensive: Mendukung Pekerjaan

1-3 Februari akan menjadi Slurm-3, intensif di Kubernetes. Pengumuman dan program di sini.


Hari ini saya akan menceritakan sedikit tentang dapur bagian dalam: bagaimana kami membantu siswa mengatasi latihan dan apa yang terjadi. Pada saat yang sama, calon peserta akan memahami apa yang diharapkan dari dukungan.



Saya sendiri mengambil kursus berbayar 2-3 kali setahun, saya selalu mengambil opsi dengan latihan, dan sangat jarang menyelesaikannya sampai akhir. Bagi saya, situasinya terlihat seperti saya memesan steak kilogram di restoran: Saya makan sebanyak mungkin, meninggalkan sisanya di atas piring. Tetapi pada mereka yang pergi ke Slurm, saya ingin mengisi seluruh bagian.


Pada Slorme pertama, kami bereaksi dengan tenang terhadap latihan, kata mereka, kami memberikan tugas, dan para peserta mengatur sebaik mungkin. Dan ini akan menyebabkan bencana jika tidak ada inisiatif dan orang-orang berbakat di antara hadirin: "15 menit yang lalu saya menulis dalam obrolan tentang masalah tersebut, saya sudah menyelesaikannya sendiri dan membantu lima orang lagi."


Oleh karena itu, di SlΓΆrm kedua, selain tiga pembicara, selusin staf pendukung bekerja dengan siswa: administrator sistem dari tim Southbridge.


Di mana masalah dengan latihan?


Pendekatan Do It Yourself sendiri. Walkthrough dapat dilakukan: "salin konfigurasi, mulai playbook, voila, kluster Anda sudah siap." Itu akan sangat cepat, sangat sederhana dan sangat tidak berarti. Kami menempuh jalan yang sulit: untuk menyelesaikan tugas, Anda harus memahami topik dan secara manual memperbaiki konfigurasi, pengaturan, dll.


Bola salju Semua topik dan tugas saling terkait satu sama lain. Jika Anda tidak menggunakan kluster pada hari pertama, Anda tidak akan dapat menjalankan aplikasi pada hari kedua. Topik yang paling penting dan kompleks adalah Ceph.


Timah dan Fakap


Ceph adalah topik utama dan kompleks, dan Anda tidak dapat melanjutkan tanpanya, jadi penyumbatan besar-besaran pada Ceph dalam destruktifitas sebanding dengan fakap. Kemudian dukungan diletakkan dengan tulang.


Kesalahan pada slide. Kita semua adalah manusia, pembicara juga. Ada kesalahan pada slide, dan itu berarti bahwa semua 87 siswa akan menulis dalam obrolan sekarang, karena tidak ada yang berhasil untuk mereka.


Menyiarkan gangguan. Kami membeli saluran khusus dari penyedia dan menyimpan saluran cadangan dari megaphone, tetapi menurut hukum kekejaman, ini tidak menyelamatkan. Pada hari pertama Slurm, penyedia tulang punggung utama jatuh di mana saluran melewati ke layanan siaran Facecast. Kami memulai siaran di YouTube, tetapi selama waktu ini, speaker dengan siswa penuh waktu berlari ke depan, dan siswa online yang tertinggal membuat skandal, hingga dan termasuk memutuskan sambungan dari kelas. Keesokan harinya, Facecast mengubah skema koneksi penyedia, tetapi tidak semua pengguna segera mendapatkan sistem yang baik. Dan seluruh gelombang kemarahan jatuh pada dukungan kami.


(Masalah karena penyedia yang jatuh terpecahkan: mereka menghentikan kelas, menunggu kapasitas kerja penuh dan mengulangi semua materi yang terlewatkan. Kami harus menanggung kelambatan pada hari kedua).


Jadi, siswa meminta bantuan


Dukungan harus memilih garis perilaku:
- memberikan siswa untuk secara mandiri terlibat dalam penembakan masalah;
- temukan kesalahan siswa dan jelaskan;
- buat tahapan latihan untuk siswa.


Ada kesalahan yang tidak dapat terdeteksi: login yang salah, huruf I bukannya l (besar saya bukannya kecil L), dalam semangat itu.


Jika ada fakap, garis dibangun untuk mendukung. Tidak mungkin untuk dengan hati-hati membantu lima sekaligus dalam masalah waktu.


Tetapi tekanan waktu sangat serius: dalam obrolan dukungan teknis internal untuk hari itu beberapa ribu pesan meningkat. Layanan dukungan dimatikan setelah tengah malam, dan mulai bekerja pada jam 6 pagi (berkat dan dukungan, dan siswa tersebar di zona waktu yang berbeda).


Oleh karena itu, kadang-kadang alih-alih mem-parsing, peserta menerima jawaban: "Saya mengoreksi semuanya, sekarang cluster Anda berfungsi sebagaimana mestinya, lanjutkan." Ya, "Do It Youself" direbus, tapi itu mungkin untuk menghindari bola salju.


Sedikit kegembiraan sederhana


Tim pendukung mengumpulkan pertanyaan dari obrolan dan formulir khusus, disortir, dijawab, dan mengirim pertanyaan sulit kepada pembicara. Karena itu, tidak ada pertanyaan gantung.



Ternyata tidak nyaman bagi peserta daring untuk beralih antara penyiaran dan konsol, dan kami tidak memiliki file teks dengan perintah, hanya presentasi di laptop pembicara. Karena itu, salah satu pendukung yang duduk di aula memutar dan mengirim perintah dari slide ke telegram.


Secara umum, selusin pekerja keras berdiri di belakang pengeras suara yang cerah, berkat itu sebagian besar peserta mencapai akhir latihan. Untungnya, Southbridge terlibat dalam dukungan infrastruktur, semua orang dapat membantu kami.


Slurm-3 akan lebih baik daripada Slurm-2


Apa yang telah dilakukan secara spontan pada Slerm-2, kami mensistematisasikan dan mengoptimalkan:
- kami memperbaiki kelompok dukungan kami untuk setiap dukungan sehingga siswa mengetahui dukungan mereka secara langsung;
- menulis database kesalahan dan solusi tipikal;
- mempersiapkan jalan pintas "Jika Anda belum menguasai latihan, tetapi ingin melanjutkan";
- menyiapkan memo peserta dengan instruksi tentang organisasi tempat kerja dan interaksi dengan dukungan.


Slurm-3: Luncurkan Kubernetes Cluster

Source: https://habr.com/ru/post/id433922/


All Articles