Kurs für maschinelles Lernen von Mail.Ru

Der 27. September beginnt einen maschinellen Lernkurs bei Mail.Ru Mail . Der Unterricht findet zweimal pro Woche für drei Monate im Büro der Mail.Ru Group statt. Die Anmeldung steht Studierenden der Moskauer Universitäten offen.

Während des Kurses werden Mail.Ru Mail- und Anti-Spam-Experten über ML-Technologien sprechen, mit denen Mail noch komfortabler und moderner wird. Unter dem Schnitt Kursdetails: Format, Programm, Autoren und Perspektiven für Absolventen.



Formatieren


Der Kurs besteht aus 20 Lektionen : 18 Vorlesungen und 2 Prüfungen (Mittelstufe und Abschluss). Jede Lektion enthält theoretische und praktische Teile; Während des praktischen Teils werden die Schüler mehrere Klassifikatoren entwickeln, gründlich mit dem Text arbeiten und grundlegende Algorithmen implementieren, deren Verständnis in der Arbeit erforderlich ist.

Außerdem warten die Teilnehmer auf 5 praktische Hausaufgaben. Laut den Autoren "wird die Schwierigkeit so gewählt, dass Sie sich über die Aufgabe Gedanken machen müssen, aber nicht zum Nachteil des Studiums an der Universität."

Das Programm


  1. Regression von einer Variablen und mehreren Variablen. Umschulung und Möglichkeiten, damit umzugehen.
  2. Logistische Regression. Binäre und Mehrklassenklassifizierung. Klassifikator kNN.
  3. Methode der Unterstützungsvektoren.
  4. Arbeiten mit Text: Vorverarbeitung und Vektordarstellung, Klassifizierungsaufgaben.
  5. Thematische Modellierung: pLSI, LDA.
  6. Vektortextdarstellung: word2vec, fastText.
  7. Dimension-Down-Algorithmen: PCA, LSH.
  8. EM-Algorithmus, k-Mittelwert- und s-Mittelwert-Algorithmus.
  9. Hierarchische Clustering-Algorithmen. Bewertungsmetriken für Clustering.
  10. Entscheidungsbäume. Baumensembles: zufälliger Wald.
  11. Gradientenschub über Bäumen: xgboost.
  12. AB-Test.
  13. Intervallbewertungen der Qualität von Klassifikatoren in der Produktion.

Der Unterricht findet vom 27. September bis 11. Dezember zweimal pro Woche (Dienstag, Donnerstag) von 18:00 bis 21:00 Uhr im Büro der Mail.Ru Group statt.

Der Kurs soll detaillierter erklären, wie maschinelles Lernen in realen Aufgaben eingesetzt wird. Im Gegensatz zu den meisten ML-Kursen konzentriert sich dieser auf die Praxis, nicht auf die akademische Komponente. Das Hauptziel der Autoren ist es, dass die Studierenden nach Abschluss des Kurses typische praktische Probleme lösen können.

Praktikum nach dem Training


Absolventen wird ein kostenpflichtiges Praktikum in den Teams für maschinelles Lernen von Mail und Antispam angeboten, in denen ML Probleme wie das Filtern unerwünschten Datenverkehrs, das Ermitteln von Hacks, das Trennen wichtiger von unwichtigen Nachrichten, das Klassifizieren der semantischen Richtung von Briefen und andere Videos über das Mail-Team lösen kann.

Praktikanten arbeiten an Kampfeinsätzen. Ihr einziger Unterschied zu erfahrenen Kollegen besteht in der Möglichkeit, einen flexiblen Zeitplan zu erstellen, der 20 Stunden pro Woche arbeitet. Sie können ein Praktikum erst nach Abschluss der Bildungsprojekte der Mail.Ru Group erhalten.

So melden Sie sich für einen Kurs an


Der Kurs richtet sich an Senioren und Doktoranden technischer Universitäten , die in mathematischer oder physikalisch-technischer Richtung studieren.

Um an dem Kurs teilzunehmen, müssen Sie sich bis zum 22. September um 10:00 Uhr (Moskauer Zeit) per Link anmelden und sich jederzeit vom 22. September bis zum 24. September um 10:00 Uhr online testen lassen. Ein Link zum Test führt zu der bei der Registrierung angegebenen E-Mail-Adresse und ist innerhalb von zwei Tagen verfügbar. Der Unterricht beginnt am 27. September .

Erforderliches Minimum für die Zulassung:

  • Kenntnisse der linearen Algebra und der Wahrscheinlichkeitstheorie;
  • Fähigkeit, in Python zu programmieren;
  • Bekanntschaft mit Numpy und Sklearn;
  • Plus ist die Kenntnis der Optimierungsmethoden.

Materialien für die Vorbereitung:

  1. Bücher: Zorich "Mathematische Analyse", Yu.V. Prokhorov, L.S. Ponomarenko „Vorlesungen über Wahrscheinlichkeitstheorie und mathematische Statistik“, A. Borovkov "Theory of Probabilities", Gmurman V.E. "Wahrscheinlichkeitstheorie und mathematische Statistik";
  2. Vorlesung „Neuronale Netze in ML“ auf dem Technostream-Trainingskanal ;
  3. nützliche Informationen zu Python .

Die erste Lektion findet nächste Woche statt. Melden Sie sich für den Kurs an, nehmen Sie an Schulungen teil und treten Sie der ML-Branche bei!

Source: https://habr.com/ru/post/de423269/


All Articles