
Le 1er septembre, Mail.Ru Group et la communauté Open Data Science tiendront la plus grande réunion de Moscou Data Science Major. L'événement se compose de cinq blocs thématiques de rapports, d'une formation ML et d'une salle entière de réseautage et de rencontres.
Familiarisez-vous avec le programme et
inscrivez-vous ! L'entrée à l'événement est gratuite, selon l'inscription approuvée.
Les présentations à Moscou Data Science Major se dérouleront en deux volets. Dans le tableau, vous trouverez une grille avec un calendrier, et ci-dessous - des descriptions de rapports.
Horaire:

Description des présentations:
«Problème de diarisation des haut-parleurs», Gregory Sterling, NeurodataLab LLCJe vais brièvement parler du traitement de la parole en général et de la tâche de diarisation du locuteur (en enregistrant un dialogue, vous devez déterminer qui a parlé quand). Je vais vous parler de l’histoire du problème, pourquoi, pourquoi, du problème des cocktails, qui a décidé comment cela est difficile. La partie principale du rapport sera consacrée aux résultats de 2017-2018, par exemple, sur un article de Google qui décrit la solution au problème de la vidéo (là, le réseau neuronal semble essayer de lire sur les lèvres). Je finirai par faire quoi quand il n'y a pas de vidéo, mais il n'y a que du son (dialogue par téléphone par exemple), je vais parcourir les articles et notre approche.
Vocoders du réseau neuronal, Sergey Dukanov, Mail.Ru GroupTout d'abord, il y aura une petite digression dans les approches modernes pour résoudre le problème de la synthèse vocale, puis nous parlerons des vocodeurs, puis nous nous concentrerons sur l'un des plus intéressants (tant du point de vue de la théorie que de la pratique).
«Pizza à la semi-encadrée», Arthur Cousin, DbrainEn utilisant l'exemple du contrôle des produits chez Dodo Pizza, je vais parler des techniques de travail avec les données lors de la formation des modèles. En particulier, je montrerai comment les encadrés sont tirés par la segmentation sémantique des objets, ainsi que comment former le modèle et obtenir le balisage de l'ensemble de données, en ne marquant que quelques échantillons.
«Architecture de l'OCR et de la TD dans la reconnaissance des photographies de documents imprimés», Alexey Goncharov, Ilya Zharikov, Nikitin Filipp, MIPT Machine Intelligence LaboratoryLe rapport décrit la structure de l'OCR (reconnaissance de caractères) et TD (détection de fenêtres avec du texte), que notre équipe utilise dans des projets de reconnaissance de photographies de documents imprimés de différents types. Parlons à la fois de l'architecture et de la formation de ces systèmes.
«Comment faire l'adaptation d'un domaine et des idées pour améliorer sa qualité», Renat Bashirov, Samsung AILe rapport est une compression des idées de quelques dizaines d'articles. Les articles ont été sélectionnés en fonction de leur degré d'utilité pour la mise en œuvre de l'adaptation de domaine pour les images: avoir un ensemble balisé, comment obtenir / améliorer le balisage sur un autre ensemble similaire.
Sera:
- de nombreux GAN
- plusieurs architectures avec une dizaine de fonctions de perte,
- raconté
- que de telles choses différentes peuvent être présentées dans la fonction de perte,
- transfert de style
- application de l'adaptation de domaine pour différentes tâches: classification, segmentation.
Ne pensez pas que rien ne sera clair si vous comprenez, par exemple:
- quelle est la fonction de perte
- comment fonctionne backprop,
- pourquoi batchnorm est nécessaire et comment cela fonctionne
- quelle taille de tenseur est obtenue après regroupement moyen global.
«Recherche par biens - organisation du travail», Dmitry Dremov, Analyse des chèquesA propos de la tâche, l'approche de l'organisation du travail et les résultats.
"Vitrines sur un réseau social: comment et quoi montrer", Sergey Boytsov, camarades de classeNous irons de l'utilisateur à un élément spécifique de la vitrine qu'il verra. Collecte de données, prétraitement, traitement analytique, tests A / B.
«Systèmes recommandés pour les titres de transport», Artyom Prosvetov et Konstantin Kotochigov, CleverDATADans le rapport, nous parlerons de l'utilisation des systèmes de recommandation dans un domaine inhabituel pour eux: la vente de titres de transport. Quelles approches traditionnelles peuvent aider à résoudre ce problème, quelles heuristiques se montrent bien, et quelles découvertes nous avons faites pour nous-mêmes dans ce projet.
«Tuning Jupyter Notebook», Alexander Lifanov, MarketGuardComment configurer Jupyter Notebook pour un travail productif et pratique.
«BigArtm - pas seulement pour le texte», Maxim Statsenko, Mail.Ru GroupBeaucoup sont habitués au fait que l'incorporation concerne le texte: nous incorporons des mots, des phrases, etc. Dans un sens, la modélisation thématique est également intégrée. Dans mon rapport, je veux montrer qu'avec l'aide de Python et de l'ingéniosité, vous pouvez utiliser les approches de modélisation thématique et d'intégration dans des tâches où il n'y a pas de texte du tout, à savoir en regroupant les utilisateurs par source de revenus et par intérêts.
«Introduction au contrôleur PID, ou comment brasser de la bière avec PyData», Anton LebedevichUne introduction étape par étape au contrôleur automatique le plus populaire utilisant le brassage de malt de bière comme exemple, avec animation et code Python. En plus du contrôleur PID de base, il y aura quelques astuces qui amélioreront son travail dans la vie réelle. Dans la pratique, une régulation automatique est souvent nécessaire, et presque toute implémentation de celle-ci contient des éléments PID ainsi que leurs lacunes, que vous devez connaître et être en mesure de réparer.
Salle de cinémaZone de réseautage et de rencontres. Dans cette salle, vous pouvez communiquer avec des collègues et d'autres participants à l'événement dans un format gratuit.
Pour participer, vous devez vous
inscrire . N'oubliez pas votre passeport ou votre permis de conduire.
Rassemblement des participants et inscription : 10h00 - 11h00.
Le début des rapports : 11h00.
Fin approximative de l'événement : 17h00.
Adresse : Moscou, métro Aéroport, Leningradsky Prospekt, 39, p. 79.
Diffusions