Nama saya Sasha dan saya suka belajar mesin, serta mengajar orang. Sekarang saya mengawasi program pendidikan di Pusat Ilmu Komputer dan memimpin sarjana dalam analisis data di St. Petersburg State University. Sebelum itu, ia bekerja sebagai analis di Yandex, dan bahkan lebih awal sebagai ilmuwan: ia terlibat dalam pemodelan matematika di ICT SB RAS.
Dalam posting ini saya ingin memberi tahu Anda apa yang keluar dari ide peluncuran pelatihan pembelajaran mesin untuk siswa, lulusan Universitas Negeri Novosibirsk dan semua orang.

Saya sudah lama ingin menyelenggarakan kursus khusus untuk mempersiapkan kompetisi analisis data di Kaggle dan platform lainnya. Ini sepertinya ide yang bagus:
- Siswa dan semua pendatang akan mempraktikkan pengetahuan teoritis dan mendapatkan pengalaman dalam memecahkan masalah dalam kompetisi publik.
- Siswa yang menempati posisi teratas dalam kompetisi tersebut memiliki pengaruh yang baik pada daya tarik NSU untuk pelamar, siswa dan lulusan. Dengan latihan pemrograman olahraga, hal yang sama terjadi.
- Kursus khusus demikian sempurna melengkapi dan memperluas pengetahuan mendasar: peserta secara mandiri menerapkan model pembelajaran mesin, sering bersatu dalam tim yang bersaing di tingkat global.
- Universitas-universitas lain telah melakukan pelatihan seperti itu, jadi saya berharap untuk keberhasilan kursus khusus di NSU.
Luncurkan
Novosibirsk Academgorodok adalah tanah yang sangat subur untuk usaha seperti itu: siswa, lulusan dan guru dari Pusat Ilmu Komputer dan departemen teknis yang kuat, misalnya, FIT, MMF, FF, dukungan kuat dari administrasi NSU, komunitas ODS aktif, insinyur berpengalaman dan analis dari berbagai perusahaan IT. Sekitar waktu yang sama, kami belajar tentang program hibah dari
Botan Investments - dana mendukung tim yang menunjukkan hasil yang baik dalam kompetisi olahraga ML.
Kami menemukan audiensi di NSU untuk pertemuan mingguan, menciptakan ruang obrolan di Telegram, dan mulai 1 Oktober dimulai dengan siswa dan lulusan pusat CS. 19 orang datang ke pelajaran pertama. Enam dari mereka menjadi peserta reguler dalam pelatihan. Secara total, selama tahun akademik, 31 orang datang ke pertemuan setidaknya sekali.
Hasil pertama
Kami bertemu dengan orang-orang, bertukar pengalaman, mendiskusikan kompetisi dan rencana kasar untuk masa depan. Mereka dengan cepat menyadari bahwa perjuangan untuk mendapatkan tempat dalam kompetisi analisis data adalah pekerjaan yang sangat melelahkan, mirip dengan pekerjaan penuh waktu yang tidak dibayar, tetapi sangat menarik dan menyenangkan :) Salah satu peserta, Maxim Kaggle-master, menyarankan kita untuk maju secara individu dalam kompetisi , dan hanya beberapa minggu setelah tim itu, diberikan skor publik. Kami melakukannya! Dalam pelatihan penuh waktu, kami membahas model, artikel ilmiah, dan seluk-beluk perpustakaan Python, dan bersama-sama memecahkan masalah.
Semester musim gugur menghasilkan tiga medali perak di dua kompetisi Kaggle:
TGS Salt Identification dan
PLAsTiCC Astronomical Classification . Dan sepertiga tempat dalam kompetisi CFT untuk kesalahan pengetikan dengan uang pertama yang dimenangkan (dalam uang itu, seperti yang dikatakan oleh pengalih berpengalaman).
Hasil tidak langsung lain yang sangat penting dari kursus khusus ini adalah peluncuran dan konfigurasi gugus Universitas Negeri All-Rusia. Kekuatan komputasinya sangat meningkatkan daya saing kami: 40 CPU, 755Gb RAM, 8 GPU NVIDIA Tesla V100.

Sebelum itu, kami bertahan sebaik mungkin: mengandalkan laptop dan desktop pribadi, di Google Colab dan di kernel Kaggle. Satu tim bahkan memiliki skrip yang ditulis sendiri yang secara otomatis menyimpan model dan memulai kembali penghitungan, yang dihentikan oleh batas waktu.
Di semester musim semi, kami terus berkumpul, bertukar temuan yang berhasil, dan berbicara tentang keputusan kompetisi kami. Peserta baru yang berminat mulai mendatangi kami. Selama semester musim semi, ternyata sudah mengambil satu emas, tiga perak dan sembilan perunggu dalam delapan kompetisi di Kaggle:
PetFinder ,
Santander ,
resolusi kata ganti gender ,
Identifikasi Paus ,
Quora ,
Google Tengara dan lainnya, perunggu dalam
tantangan Recco , tempat ketiga di Piala Changellenge >> dan tempat pertama (sekali lagi dalam uang) dalam kompetisi pembelajaran mesin di
Kejuaraan Pemrograman Yandex.
Apa yang dikatakan peserta pelatihan?
Mikhail Karchevsky“Saya sangat senang bahwa kegiatan seperti itu dilakukan di negara kami di Siberia, karena saya percaya bahwa partisipasi dalam kompetisi adalah cara tercepat untuk menguasai ML. Untuk kontes seperti itu, besi cukup mahal untuk dibeli sendiri, tetapi di sini Anda dapat mencoba ide secara gratis. "
Kirill Broadt“Sebelum dimulainya pelatihan ml, saya tidak secara khusus berpartisipasi dalam kompetisi kecuali untuk pelatihan dan kompetisi Hindu: Saya tidak mengerti maksudnya, karena saya pernah bekerja di bidang MO, dan saya kenal. Semester pertama menjadi pendengar. Dan mulai dari semester kedua, begitu sumber daya komputasi muncul, saya pikir, mengapa tidak berpartisipasi. Dan itu menyedot saya. Tugas, data, dan metrik ditemukan dan disiapkan untuk Anda, ambil, dan gunakan semua kekuatan Wilayah Moskow, periksa model dan teknik canggih. Jika itu bukan untuk pelatihan dan, yang tidak kalah penting, sumber daya komputasi, saya tidak akan segera mulai berpartisipasi. "
Andrey Shevelev“Pelatihan ML secara langsung membantu saya menemukan orang-orang yang berpikiran sama, bersama dengan siapa saya dapat memperdalam pengetahuan saya di bidang pembelajaran mesin dan analisis data. Ini juga merupakan pilihan bagus bagi mereka yang tidak memiliki banyak waktu luang untuk menganalisis dan terjun secara mandiri ke dalam topik kontes, tetapi masih ingin menjadi subjek. "
Bergabunglah dengan kami
Kompetisi di Kaggle dan tempat lainnya mengasah keterampilan praktis dan dengan cepat berubah menjadi pekerjaan yang menarik di bidang ilmu data. Orang-orang yang berpartisipasi dalam kompetisi yang sulit bersama sering menjadi kolega dan terus berhasil menyelesaikan tugas pekerjaan. Ini terjadi pada kami: Mikhail Karchevsky, bersama dengan seorang teman dari tim, beralih untuk bekerja di perusahaan yang sama dengan sistem rekomendasi.
Seiring waktu, kami berencana untuk memperluas kegiatan ini dengan publikasi ilmiah dan partisipasi dalam konferensi pembelajaran mesin. Bergabunglah dengan kami sebagai peserta atau pakar di Novosibirsk - menulis kepada
saya atau
Kirill . Atur pelatihan serupa di kota dan universitas Anda.
Berikut ini adalah lembar contekan kecil yang akan membantu Anda mengambil langkah pertama:
- Pertimbangkan tempat dan waktu yang nyaman untuk kelas reguler. Optimal - 1-2 kali seminggu.
- Menulis ke pihak-pihak yang berminat tentang pertemuan pertama. Pertama-tama, ini adalah mahasiswa universitas teknik, peserta ODS.
- Dapatkan ruang obrolan untuk membahas urusan terkini: Telegram, VK, WhatsApp, atau messenger lainnya yang paling nyaman.
- Menyimpan rencana pelajaran umum, daftar kompetisi dan peserta, ikuti hasilnya.
- Di universitas terdekat, lembaga penelitian, atau perusahaan, temukan kekuatan komputasi gratis atau hibah untuk mereka.
- KEUNTUNGAN!