Wie ich das maschinelle Lernen an der NSU organisiert habe

Mein Name ist Sasha und ich liebe maschinelles Lernen und unterrichte Menschen. Jetzt betreue ich Bildungsprogramme am Computer Science Center und leite einen Bachelor in Datenanalyse an der St. Petersburg State University. Zuvor arbeitete er als Analyst bei Yandex und noch früher als Wissenschaftler: Er beschäftigte sich mit mathematischer Modellierung bei ICT SB RAS.

In diesem Beitrag möchte ich Ihnen sagen, was aus der Idee hervorgegangen ist, maschinelle Lernschulungen für Studenten, Absolventen der Staatlichen Universität Nowosibirsk und alle zu starten.

Bild


Ich wollte schon lange einen speziellen Kurs organisieren, um mich auf Wettbewerbe zur Datenanalyse auf Kaggle und anderen Plattformen vorzubereiten. Dies schien eine großartige Idee zu sein:

  • Studenten und alle Ankömmlinge werden theoretisches Wissen in die Praxis umsetzen und Erfahrungen bei der Lösung von Problemen bei öffentlichen Wettbewerben sammeln.
  • Studenten, die in solchen Wettbewerben Spitzenplätze belegen, haben einen guten Einfluss auf die Attraktivität der NSU für Bewerber, Studenten und Absolventen. Beim Sportprogrammieren passiert das Gleiche.
  • Ein solcher Spezialkurs ergänzt und erweitert das Grundwissen perfekt: Die Teilnehmer implementieren unabhängig voneinander Modelle des maschinellen Lernens, die sich häufig in Teams zusammenschließen, die auf globaler Ebene konkurrieren.
  • Andere Universitäten haben bereits eine solche Ausbildung durchgeführt, daher hoffte ich auf den Erfolg des Spezialkurses an der NSU.

Starten


Das Novosibirsk Academgorodok ist ein sehr fruchtbarer Boden für solche Unternehmungen: Studenten, Absolventen und Lehrer des Informatikzentrums und starke technische Abteilungen, zum Beispiel FIT, MMF, FF, starke Unterstützung durch die NSU-Administration, eine aktive ODS-Community, erfahrene Ingenieure und Analysten verschiedener IT-Unternehmen. Etwa zur gleichen Zeit erfuhren wir von Botan Investments von dem Förderprogramm - der Fonds unterstützt Teams, die bei ML-Sportwettkämpfen gute Ergebnisse erzielen.

Wir fanden ein Publikum an der NSU für wöchentliche Treffen, richteten einen Chatraum in Telegram ein und begannen ab dem 1. Oktober mit Studenten und Absolventen des CS-Zentrums. 19 Personen kamen zur ersten Stunde. Sechs von ihnen nahmen regelmäßig an Schulungen teil. Insgesamt kamen im akademischen Jahr mindestens einmal 31 Personen zu dem Treffen.

Erste Ergebnisse


Wir haben uns mit den Jungs getroffen, Erfahrungen ausgetauscht, Wettbewerbe und einen groben Plan für die Zukunft besprochen. Sie erkannten schnell, dass der Kampf um Plätze in Datenanalyse-Wettbewerben eine regelmäßige anstrengende Arbeit ist, ähnlich wie unbezahlte Vollzeitarbeit, aber sehr interessant und aufregend :) Einer der Teilnehmer, Maxim Kaggle-master, riet uns, bei den Wettbewerben individuell voranzukommen und nur wenige Wochen nach diesem Team, angesichts der öffentlichen Punktzahl. Wir haben es getan! In der Vollzeitausbildung diskutierten wir Modelle, wissenschaftliche Artikel und die Feinheiten von Python-Bibliotheken und lösten gemeinsam Probleme.

Das Herbstsemester führte zu drei Silbermedaillen in zwei Kaggle-Wettbewerben: TGS Salt Identification und PLAsTiCC Astronomical Classification . Und ein dritter Platz im CFT-Wettbewerb für Tippfehler mit dem ersten gewonnenen Geld (im Geld, wie erfahrene Kegler sagen).

Ein weiteres sehr wichtiges indirektes Ergebnis des Sonderkurses war der Start und die Konfiguration des Clusters der Allrussischen Staatlichen Universität. Die Rechenleistung hat unsere Wettbewerbsfähigkeit deutlich verbessert: 40 CPUs, 755 GB RAM, 8 NVIDIA Tesla V100-GPUs.

Bild

Davor haben wir so gut wir konnten überlebt: auf persönliche Laptops und Desktops, in Google Colab und in Kaggle-Kerneln. Ein Team hatte sogar ein selbst geschriebenes Skript, das das Modell automatisch speicherte und die Berechnung neu startete, die innerhalb des Zeitlimits stoppte.

Im Frühjahrssemester sammelten wir weiter, tauschten erfolgreiche Funde aus und sprachen über unsere Wettbewerbsentscheidungen. Neue interessierte Teilnehmer kamen zu uns. Für das Frühjahrssemester wurden in Kaggle bereits acht Gold-, drei Silber- und neun Bronzen in acht Wettbewerben vergeben: PetFinder , Santander , Gendered Pronomen Resolution , Whale Identification , Quora , Google Landmarks und andere, Bronze bei der Recco Challenge , dritter Platz im Changellenge >> Cup und erster Platz (wieder im Geld) im Wettbewerb für maschinelles Lernen bei der Yandex Programming Championship .

Was die Trainingsteilnehmer sagen


Mikhail Karchevsky
„Ich bin sehr froh, dass solche Aktivitäten in unserem Land in Sibirien durchgeführt werden, da ich glaube, dass die Teilnahme an Wettbewerben der schnellste Weg ist, um ML zu meistern. Für solche Wettbewerbe ist Eisen teuer genug, um es selbst zu kaufen, aber hier können Sie Ideen kostenlos ausprobieren. “

Kirill Broadt
„Vor dem Aufkommen des ml-Trainings habe ich nur an Trainingswettbewerben und Hindu-Wettbewerben teilgenommen. Ich habe den Punkt darin nicht gesehen, da ich auf dem Gebiet der MO gearbeitet habe und damit vertraut bin. Das erste Semester ging als Zuhörer. Und ab dem zweiten Semester, sobald Computerressourcen erschienen, dachte ich, warum nicht teilnehmen? Und es hat mich gelutscht. Die Aufgabe, Daten und Metriken wurden für Sie erfunden und vorbereitet. Nehmen Sie sie und nutzen Sie die gesamte Leistungsfähigkeit von MO. Überprüfen Sie die neuesten Modelle und Techniken. Ohne Schulungen und nicht weniger wichtige Computerressourcen würde ich nicht bald teilnehmen.

Andrey Shevelev
„Das persönliche ML-Training hat mir geholfen, Gleichgesinnte zu finden, mit denen ich mein Wissen auf dem Gebiet des maschinellen Lernens und der Datenanalyse vertiefen konnte. Es ist auch eine großartige Option für diejenigen, die nicht viel Freizeit haben, um unabhängig zu analysieren und sich mit dem Thema Wettbewerbe zu befassen, aber dennoch im Thema sein möchten. "

Mach mit


Wettbewerbe in Kaggle und anderen Veranstaltungsorten verbessern die praktischen Fähigkeiten und werden schnell zu interessanten Arbeiten auf dem Gebiet der Datenwissenschaft. Menschen, die gemeinsam an einem schwierigen Wettbewerb teilgenommen haben, werden oft zu Kollegen und lösen weiterhin erfolgreich Arbeitsaufgaben. Dies geschah bei uns: Mikhail Karchevsky wechselte zusammen mit einem Freund aus dem Team in die gleiche Firma, um am Empfehlungssystem zu arbeiten.

Im Laufe der Zeit planen wir, diese Aktivität durch wissenschaftliche Veröffentlichungen und die Teilnahme an Konferenzen zum maschinellen Lernen zu erweitern. Begleiten Sie uns als Teilnehmer oder Experten in Nowosibirsk - schreiben Sie mir oder Kirill . Organisieren Sie ähnliche Schulungen in Ihren Städten und Universitäten.

Hier ist ein kleiner Spickzettel, der Ihnen bei den ersten Schritten hilft:

  1. Betrachten Sie einen geeigneten Ort und eine geeignete Zeit für den regulären Unterricht. Optimal - 1-2 mal pro Woche.
  2. Schreiben Sie potenziellen Interessenten über das erste Treffen. Zuallererst sind dies Studenten technischer Universitäten, Teilnehmer von ODS.
  3. Holen Sie sich einen Chatraum, um aktuelle Angelegenheiten zu besprechen: Telegramm, VK, WhatsApp oder einen anderen Messenger, der für die meisten praktisch ist.
  4. Führen Sie einen öffentlichen Unterrichtsplan, eine Liste der Wettbewerbe und Teilnehmer, und folgen Sie den Ergebnissen.
  5. An nahe gelegenen Universitäten, Forschungsinstituten oder Unternehmen finden Sie kostenlose Rechenleistung oder Zuschüsse für diese.
  6. GEWINN!

Source: https://habr.com/ru/post/de458042/


All Articles