
Am 1. September werden die Mail.Ru Group und die Open Data Science-Community das größte Moskauer Data Science Major-Meeting abhalten. Die Veranstaltung besteht aus fünf thematischen Berichtsblöcken, einem ML-Training und einer ganzen Halle zum Networking und Dating.
Machen Sie sich mit dem Programm vertraut und
registrieren Sie sich ! Der Eintritt zur Veranstaltung ist laut genehmigter Anmeldung frei.
Die Präsentationen im Moscow Data Science Major finden in zwei Streams statt. In der Tabelle finden Sie ein Raster mit einem Zeitplan und unten - Beschreibungen von Berichten.
Zeitplan:

Präsentationsbeschreibungen:
"Speaker Diarization Problem", Gregory Sterling, NeurodataLab LLCIch werde kurz auf die Sprachverarbeitung im Allgemeinen und auf die Aufgabe der Sprecherdiarisierung eingehen (indem Sie einen Dialog aufzeichnen, müssen Sie bestimmen, wer wann gesprochen hat). Ich erzähle Ihnen von der Geschichte des Problems, warum, warum, von dem Cocktailparty-Problem, wer hat entschieden, wie schwierig es ist. Der Hauptteil des Berichts widmet sich den Ergebnissen von 2017-2018, beispielsweise einem Google-Artikel, der die Lösung des Problems für Videos beschreibt (dort scheint das neuronale Netzwerk zu versuchen, die Lippen zu lesen). Ich werde am Ende tun, was passiert, wenn es kein Video gibt, aber nur Ton (z. B. telefonischer Dialog). Ich werde die Artikel und unseren Ansatz durchgehen.
Vocoder für neuronale Netze, Sergey Dukanov, Mail.Ru GroupZuerst wird es einen kleinen Exkurs in moderne Ansätze zur Lösung des Problems der Sprachsynthese geben, dann werden wir über Vocoder sprechen und uns dann auf einen der interessantesten konzentrieren (sowohl aus theoretischer als auch aus praktischer Sicht).
"Pizza a la semi-überwacht", Arthur Cousin, DbrainAm Beispiel der Produktkontrolle bei Dodo Pizza werde ich über Techniken zum Arbeiten mit Daten beim Training von Modellen sprechen. Insbesondere werde ich zeigen, wie Sideboxen durch semantische Segmentierung von Objekten gezogen werden, wie das Modell trainiert und das Markup des Datensatzes abgerufen wird, wobei nur einige Beispiele markiert werden.
"Architektur von OCR und TD bei der Erkennung von Fotografien gedruckter Dokumente", Alexey Goncharov, Ilya Zharikov, Nikitin Filipp, MIPT Machine Intelligence LaboratoryDer Bericht beschreibt die Struktur von OCR (Zeichenerkennung) und TD (Erkennung von Fenstern mit Text), die unser Team in Projekten zur Erkennung von Fotos gedruckter Dokumente verschiedener Typen verwendet. Lassen Sie uns sowohl über die Architektur als auch über das Training dieser Systeme sprechen.
"Wie man Domain-Anpassungen vornimmt und Ideen zur Verbesserung der Qualität", Renat Bashirov, Samsung AIDer Bericht ist eine Ansammlung von Ideen aus ein paar Dutzend Artikeln. Die Artikel wurden nach ihrem Grad an Nützlichkeit für die Implementierung der Domänenanpassung für Bilder ausgewählt: mit einem markierten Satz, wie man einen Markup auf einem anderen ähnlichen Satz erhält / verbessert.
Wird sein:
- viele GANs
- mehrere Architekturen mit einem Dutzend Verlustfunktionen,
- erzählt über
- dass solche unterschiedlichen Dinge in der Verlustfunktion dargestellt werden können,
- Stilübertragung
- Anwendung der Domänenanpassung für verschiedene Aufgaben: Klassifizierung, Segmentierung.
Denken Sie nicht, dass nichts klar wird, wenn Sie zum Beispiel verstehen:
- Was ist die Verlustfunktion
- wie backprop funktioniert,
- warum Batchnorm benötigt wird und wie es funktioniert
- Welche Größe Tensor wird nach dem globalen durchschnittlichen Pooling erhalten.
"Suche nach Waren - Arbeitsorganisation", Dmitry Dremov, Analyse von SchecksÜber die Aufgabe, die Herangehensweise an die Arbeitsorganisation und die Ergebnisse.
"Vitrinen in einem sozialen Netzwerk: wie und was zu zeigen ist", Sergey Boytsov, KlassenkameradenWir gehen den ganzen Weg vom Benutzer zu einem bestimmten Artikel in der Storefront, den er sieht. Datenerfassung, Vorverarbeitung, analytische Verarbeitung, A / B-Tests.
"Empfohlene Systeme für Transporttickets", Artyom Prosvetov und Konstantin Kotochigov, CleverDATAIn dem Bericht werden wir über den Einsatz von Empfehlungssystemen in einem für sie ungewöhnlichen Bereich sprechen: für den Verkauf von Transporttickets. Welche traditionellen Ansätze können zur Lösung dieses Problems beitragen, welche Heuristiken zeigen sich gut und welche Entdeckungen haben wir in diesem Projekt für uns gemacht.
"Tuning Jupyter Notebook", Alexander Lifanov, MarketGuardSo konfigurieren Sie Jupyter Notebook für produktives und bequemes Arbeiten.
"BigArtm - nicht nur für Text", Maxim Statsenko, Mail.Ru GroupViele sind daran gewöhnt, dass es beim Einbetten um Text geht: Wir binden Wörter, Sätze usw. ein. In gewissem Sinne ist auch die thematische Modellierung eingebettet. In meinem Bericht möchte ich zeigen, dass Sie mit Hilfe von Python und Einfallsreichtum die Ansätze der thematischen Modellierung und Einbettung in Aufgaben verwenden können, in denen es überhaupt keine Texte gibt, nämlich Benutzer nach Einkommensquelle und Interessen zu gruppieren.
"PID Controller Intro oder Wie man mit PyData Bier braut", Anton LebedevichEine schrittweise Einführung in die beliebteste automatische Steuerung am Beispiel von Biermalzpüree mit Animation und Python-Code. Zusätzlich zum grundlegenden PID-Regler gibt es einige Tricks, die die Arbeit im wirklichen Leben verbessern. In der Praxis ist häufig eine automatische Regelung erforderlich, und fast jede Implementierung enthält PID-Elemente sowie deren Mängel, die Sie kennen und reparieren müssen.
KinohalleNetzwerk- und Dating-Zone. In diesem Raum können Sie in einem kostenlosen Format mit Kollegen und anderen Teilnehmern der Veranstaltung kommunizieren.
Um teilnehmen zu können, müssen Sie sich
registrieren . Vergessen Sie nicht Ihren Reisepass oder Führerschein.
Teilnehmerversammlung und Anmeldung : 10:00 - 11:00 Uhr.
Beginn der Berichte : 11:00 Uhr.
Ungefähres Ende der Veranstaltung : 17:00 Uhr.
Adresse : Moskau, U-Bahn-Flughafen, Leningradsky Prospekt, 39, S. 79.
Sendungen