
El 1 de septiembre, Mail.Ru Group y la comunidad de Open Data Science celebrarán la mayor reunión de Moscú de Data Science Major. El evento consta de cinco bloques temáticos de informes, un entrenamiento de ML y un salón completo para establecer contactos y citas.
¡Conozca el programa y
regístrese ! La entrada al evento es gratuita, según el registro aprobado.
Las presentaciones en el Data Science Major de Moscú se realizarán en dos transmisiones. En la tabla encontrará una cuadrícula con un cronograma y, a continuación, descripciones de informes.
Horario:

Descripciones de presentación:
"Problema de la diariarización del orador", Gregory Sterling, NeurodataLab LLCHablaré brevemente sobre el procesamiento del habla en general y sobre la tarea de diarización del hablante (al grabar un diálogo, debe determinar quién habló cuándo). Te contaré sobre la historia del problema, por qué, por qué, sobre el problema del cóctel, quién decidió cómo es difícil. La parte principal del informe estará dedicada a los resultados de 2017-2018, por ejemplo, sobre un artículo de Google que describe la solución al problema del video (allí la red neuronal parece estar tratando de leer los labios). Terminaré haciendo lo que cuando no hay video, pero solo hay sonido (diálogo por teléfono, por ejemplo), repasaré los artículos y nuestro enfoque.
Vocoders de redes neuronales, Sergey Dukanov, Mail.Ru GroupPrimero, habrá una pequeña excursión a los enfoques modernos para resolver el problema de la síntesis del habla, luego hablaremos sobre los vocoders y luego nos centraremos en uno de los más interesantes (tanto desde el punto de vista de la teoría como de la práctica).
"Pizza a la semi-supervisada", Arthur Cousin, DbrainUsando el ejemplo de control de producto en Dodo Pizza, hablaré sobre técnicas para trabajar con datos cuando entrenemos modelos. En particular, mostraré cómo las cajas laterales se extraen mediante la segmentación semántica de objetos, así como cómo entrenar el modelo y obtener el marcado del conjunto de datos, marcando solo unas pocas muestras.
"Arquitectura de OCR y TD en el reconocimiento de fotografías de documentos impresos", Alexey Goncharov, Ilya Zharikov, Nikitin Filipp, MIPT Machine Intelligence LaboratoryEl informe describe la estructura de OCR (reconocimiento de caracteres) y TD (detección de ventanas con texto), que nuestro equipo utiliza en proyectos para reconocer fotografías de documentos impresos de varios tipos. Hablemos tanto de la arquitectura como de la capacitación de estos sistemas.
"Cómo hacer la adaptación del dominio e ideas para mejorar su calidad", Renat Bashirov, Samsung AIEl informe es una muestra de ideas de un par de docenas de artículos. Los artículos se seleccionaron de acuerdo con su grado de utilidad para implementar la adaptación del dominio para las imágenes: tener un conjunto marcado, cómo obtener / mejorar el marcado en otro conjunto similar.
Será:
- muchas GAN
- varias arquitecturas con una docena de funciones de pérdida,
- hablado sobre
- que se pueden presentar cosas tan diferentes en la función de pérdida,
- transferencia de estilo
- Aplicación de la adaptación del dominio para diferentes tareas: clasificación, segmentación.
No piense que nada quedará claro si comprende, por ejemplo:
- ¿Cuál es la función de pérdida?
- cómo funciona backprop,
- por qué se necesita batchnorm y cómo funciona
- qué tamaño de tensor se obtiene después de la agrupación promedio global.
"Búsqueda por bienes - organización del trabajo", Dmitry Dremov, Análisis de chequesSobre la tarea, el enfoque de la organización del trabajo y los resultados.
"Exhibiciones en una red social: cómo y qué mostrar", Sergey Boytsov, compañeros de claseIremos desde el usuario a un artículo específico en el escaparate que vea. Recopilación de datos, preprocesamiento, procesamiento analítico, pruebas A / B.
"Sistemas recomendados para boletos de transporte", Artyom Prosvetov y Konstantin Kotochigov, CleverDATAEn el informe, hablaremos sobre el uso de sistemas de recomendación en un área inusual para ellos: para la venta de boletos de transporte. Qué enfoques tradicionales pueden ayudar a resolver este problema, qué heurísticas se muestran bien y qué descubrimientos hemos hecho por nosotros mismos en este proyecto.
"Tuning Jupyter Notebook", Alexander Lifanov, MarketGuardCómo configurar Jupyter Notebook para un trabajo productivo y conveniente.
"BigArtm - no solo para texto", Maxim Statsenko, Mail.Ru GroupMuchos están acostumbrados al hecho de que la incrustación se trata de texto: incrustamos palabras, oraciones, etc. En cierto sentido, el modelado temático también está incrustado. En mi informe, quiero mostrar que con la ayuda de Python y el ingenio, puede usar los enfoques de modelado temático e incrustaciones en tareas en las que no hay ningún texto, es decir, en la agrupación de usuarios por fuente de ingresos y por intereses.
"Introducción al controlador PID, o Cómo preparar cerveza con PyData", Anton LebedevichUna introducción paso a paso al controlador automático más popular que utiliza como ejemplo puré de malta de cerveza, con animación y código Python. Además del controlador PID básico, habrá un par de trucos que mejorarán su trabajo en la vida real. En la práctica, a menudo se necesita una regulación automática, y casi cualquier implementación contiene elementos PID junto con sus defectos, que debe conocer y poder reparar.
Sala de cineRedes y zona de citas. En esta sala, puede comunicarse con colegas y otros participantes en el evento en un formato gratuito.
Para participar, debes
registrarte . No olvides tu pasaporte o licencia de conducir.
Reunión de participantes e inscripción : 10:00 - 11:00.
El comienzo de los informes : 11:00.
Fin aproximado del evento : 17:00.
Dirección : Moscú, aeropuerto de metro, Leningradsky Prospekt, 39, p. 79.
Transmisiones