Je m'appelle Sasha et j'adore l'apprentissage automatique, ainsi que l'enseignement aux gens. Maintenant, je supervise des programmes éducatifs au Computer Science Center et dirige un baccalauréat en analyse de données à l'Université d'État de Saint-Pétersbourg. Avant cela, il a travaillé comme analyste chez Yandex, et même plus tôt en tant que scientifique: il était engagé dans la modélisation mathématique chez ICT SB RAS.
Dans cet article, je veux vous dire ce qui est né de l'idée de lancer des formations d'apprentissage automatique pour les étudiants, les diplômés de l'Université d'État de Novossibirsk et tout le monde.

Je souhaite depuis longtemps organiser un cours spécial pour préparer des concours d'analyse de données sur Kaggle et d'autres plateformes. Cela semblait être une excellente idée:
- Les étudiants et tous les arrivants mettront en pratique leurs connaissances théoriques et acquerront de l'expérience dans la résolution de problèmes lors de concours publics.
- Les étudiants qui occupent les premières places dans ces compétitions ont une bonne influence sur l'attrait de NSU pour les candidats, les étudiants et les diplômés. Avec les entraînements de programmation sportive, la même chose se produit.
- Un tel cours spécial complète et élargit parfaitement les connaissances fondamentales: les participants mettent en œuvre indépendamment des modèles d'apprentissage automatique, souvent réunis en équipes qui rivalisent au niveau mondial.
- D'autres universités ont déjà dispensé une telle formation, alors j'espérais le succès du cours spécial à NSU.
Lancement
Le Novosibirsk Academgorodok est un terrain très fertile pour de telles entreprises: étudiants, diplômés et enseignants du Centre d'informatique et de solides départements techniques, par exemple, FIT, MMF, FF, un soutien solide de l'administration NSU, une communauté ODS active, des ingénieurs et analystes expérimentés de diverses sociétés informatiques. À peu près à la même époque, nous avons entendu parler du programme de subventions de
Botan Investments - le fonds soutient des équipes qui affichent de bons résultats dans les compétitions sportives ML.
Nous avons trouvé un public à NSU pour des réunions hebdomadaires, créé un salon de discussion à Telegram et, à partir du 1er octobre, nous avons commencé avec les étudiants et les diplômés du centre CS. 19 personnes sont venues à la première leçon. Six d'entre eux sont devenus des participants réguliers à la formation. Au total, au cours de l'année académique, 31 personnes sont venues à la réunion au moins une fois.
Premiers résultats
Nous avons rencontré les gars, échangé des expériences, discuté des compétitions et d'un plan approximatif pour l'avenir. Ils ont rapidement réalisé que la lutte pour les places dans les concours d'analyse de données est un travail exténuant régulier, similaire au travail à temps plein non rémunéré, mais très intéressant et passionnant :) L'un des participants, Kaggle-master Maxim, nous a conseillé d'avancer individuellement dans les concours , et seulement quelques semaines après cette équipe, compte tenu du score du public. Nous l'avons fait! Au cours d'une formation à temps plein, nous avons discuté de modèles, d'articles scientifiques et des subtilités des bibliothèques Python, et avons résolu ensemble des problèmes.
Le semestre d'automne a donné lieu à trois médailles d'argent dans deux compétitions Kaggle:
TGS Salt Identification et
PLAsTiCC Astronomical Classification . Et une troisième place dans le concours CFT pour corriger les fautes de frappe avec le premier argent gagné (dans l'argent, comme disent les kegglers expérimentés).
Un autre résultat indirect très important du cours spécial a été le lancement et la configuration du cluster de l'Université d'État panrusse. Sa puissance de calcul a considérablement amélioré notre vie concurrentielle: 40 processeurs, 755 Go de RAM, 8 GPU NVIDIA Tesla V100.

Avant cela, nous avons survécu du mieux que nous pouvions: nous comptions sur les ordinateurs portables et de bureau personnels, dans Google Colab et dans Kaggle-kernels. Une équipe avait même un script auto-écrit qui sauvegardait automatiquement le modèle et recommençait le calcul, qui s'est arrêté par la limite de temps.
Au semestre de printemps, nous avons continué à nous rassembler, à échanger des découvertes réussies et à parler de nos décisions en matière de concours. De nouveaux participants intéressés ont commencé à nous rejoindre. Pour le semestre de printemps, il s'est avéré déjà remporter un or, trois argent et neuf bronzes dans huit compétitions à Kaggle:
PetFinder ,
Santander ,
Gendered pronom resolution ,
Whale Identification ,
Quora ,
Google Monuments et autres, bronze dans le
défi Recco , troisième place dans le Changellenge >> Cup et la première place (encore une fois dans l'argent) dans la compétition d'apprentissage automatique au championnat de
programmation Yandex.
Que disent les participants à la formation?
Mikhail Karchevsky«Je suis très heureux que de telles activités soient menées dans notre pays en Sibérie, car je pense que la participation à des compétitions est le moyen le plus rapide de maîtriser le ML. Pour de tels concours, le fer est assez cher à acheter seul, mais ici, vous pouvez essayer des idées gratuitement. »
Kirill Broadt«Avant l'avènement du ml-training, je ne participais pas particulièrement aux compétitions sauf à l'entraînement et aux compétitions hindoues: je n'y voyais pas l'intérêt, puisque j'avais du travail dans le domaine du MO, et je le connais bien. Le premier semestre s'est déroulé en tant qu'auditeur. Et à partir du deuxième semestre, dès que les ressources informatiques sont apparues, j'ai pensé, pourquoi ne pas participer. Et ça m'a sucé. La tâche, les données et les métriques ont été inventées et préparées pour vous, prenez-les et utilisez toute la puissance de la région de Moscou, vérifiez les modèles et les techniques de pointe. S'il n'y avait pas de formation et, non moins important, de ressources informatiques, je ne commencerais pas à participer bientôt. "
Andrey Shevelev«La formation en ML en personne m'a aidé à trouver des personnes partageant les mêmes idées, avec qui j'ai pu approfondir mes connaissances dans le domaine de l'apprentissage automatique et de l'analyse de données. C'est aussi une excellente option pour ceux qui n'ont pas beaucoup de temps libre pour analyser et plonger de manière indépendante dans le sujet des concours, mais qui veulent quand même être dans le sujet. "
Rejoignez-nous
Les compétitions à Kaggle et sur d'autres sites affinent les compétences pratiques et se transforment rapidement en travaux intéressants dans le domaine de la science des données. Les personnes qui ont participé ensemble à une compétition difficile deviennent souvent des collègues et continuent de résoudre avec succès des tâches professionnelles. Cela s'est produit avec nous: Mikhail Karchevsky, avec un ami de l'équipe, est passé travailler dans la même entreprise sur le système de recommandation.
Au fil du temps, nous prévoyons d'étendre cette activité avec des publications scientifiques et la participation à des conférences d'apprentissage automatique. Rejoignez-nous en tant que participants ou experts à Novossibirsk - écrivez-
moi ou
Kirill . Organisez une formation similaire dans vos villes et universités.
Voici une petite feuille de triche qui vous aidera à faire les premiers pas:
- Considérez un endroit et un temps convenables pour les cours réguliers. Optimal - 1-2 fois par semaine.
- Écrivez aux parties intéressées potentielles au sujet de la première réunion. Ce sont tout d'abord des étudiants d'universités techniques, des participants à l'ODS.
- Obtenez une salle de discussion pour discuter des affaires courantes: télégramme, VK, WhatsApp ou tout autre messager pratique pour la plupart.
- Gardez un plan de leçon public, une liste des compétitions et des participants, suivez les résultats.
- Dans les universités, les instituts de recherche ou les entreprises à proximité, trouvez de la puissance de calcul gratuite ou des subventions pour eux.
- PROFIT!