Moscú Data Science Major: anuncio y registro



El 1 de septiembre, Mail.Ru Group y la comunidad de Open Data Science celebrarán la mayor reunión de Moscú de Data Science Major. El evento consta de cinco bloques temáticos de informes, un entrenamiento de ML y un salón completo para establecer contactos y citas.

¡Conozca el programa y regístrese ! La entrada al evento es gratuita, según el registro aprobado.

Las presentaciones en el Data Science Major de Moscú se realizarán en dos transmisiones. En la tabla encontrará una cuadrícula con un cronograma y, a continuación, descripciones de informes.

Horario:



Descripciones de presentación:

"Problema de la diariarización del orador", Gregory Sterling, NeurodataLab LLC
Hablaré brevemente sobre el procesamiento del habla en general y sobre la tarea de diarización del hablante (al grabar un diálogo, debe determinar quién habló cuándo). Te contaré sobre la historia del problema, por qué, por qué, sobre el problema del cóctel, quién decidió cómo es difícil. La parte principal del informe estará dedicada a los resultados de 2017-2018, por ejemplo, sobre un artículo de Google que describe la solución al problema del video (allí la red neuronal parece estar tratando de leer los labios). Terminaré haciendo lo que cuando no hay video, pero solo hay sonido (diálogo por teléfono, por ejemplo), repasaré los artículos y nuestro enfoque.

Vocoders de redes neuronales, Sergey Dukanov, Mail.Ru Group
Primero, habrá una pequeña excursión a los enfoques modernos para resolver el problema de la síntesis del habla, luego hablaremos sobre los vocoders y luego nos centraremos en uno de los más interesantes (tanto desde el punto de vista de la teoría como de la práctica).

"Pizza a la semi-supervisada", Arthur Cousin, Dbrain
Usando el ejemplo de control de producto en Dodo Pizza, hablaré sobre técnicas para trabajar con datos cuando entrenemos modelos. En particular, mostraré cómo las cajas laterales se extraen mediante la segmentación semántica de objetos, así como cómo entrenar el modelo y obtener el marcado del conjunto de datos, marcando solo unas pocas muestras.

"Arquitectura de OCR y TD en el reconocimiento de fotografías de documentos impresos", Alexey Goncharov, Ilya Zharikov, Nikitin Filipp, MIPT Machine Intelligence Laboratory
El informe describe la estructura de OCR (reconocimiento de caracteres) y TD (detección de ventanas con texto), que nuestro equipo utiliza en proyectos para reconocer fotografías de documentos impresos de varios tipos. Hablemos tanto de la arquitectura como de la capacitación de estos sistemas.

"Cómo hacer la adaptación del dominio e ideas para mejorar su calidad", Renat Bashirov, Samsung AI
El informe es una muestra de ideas de un par de docenas de artículos. Los artículos se seleccionaron de acuerdo con su grado de utilidad para implementar la adaptación del dominio para las imágenes: tener un conjunto marcado, cómo obtener / mejorar el marcado en otro conjunto similar.

Será:

  • muchas GAN
  • varias arquitecturas con una docena de funciones de pérdida,
  • hablado sobre
    • que se pueden presentar cosas tan diferentes en la función de pérdida,
    • transferencia de estilo
    • Aplicación de la adaptación del dominio para diferentes tareas: clasificación, segmentación.

No piense que nada quedará claro si comprende, por ejemplo:

  • ¿Cuál es la función de pérdida?
  • cómo funciona backprop,
  • por qué se necesita batchnorm y cómo funciona
  • qué tamaño de tensor se obtiene después de la agrupación promedio global.

"Búsqueda por bienes - organización del trabajo", Dmitry Dremov, Análisis de cheques
Sobre la tarea, el enfoque de la organización del trabajo y los resultados.

"Exhibiciones en una red social: cómo y qué mostrar", Sergey Boytsov, compañeros de clase
Iremos desde el usuario a un artículo específico en el escaparate que vea. Recopilación de datos, preprocesamiento, procesamiento analítico, pruebas A / B.

"Sistemas recomendados para boletos de transporte", Artyom Prosvetov y Konstantin Kotochigov, CleverDATA
En el informe, hablaremos sobre el uso de sistemas de recomendación en un área inusual para ellos: para la venta de boletos de transporte. Qué enfoques tradicionales pueden ayudar a resolver este problema, qué heurísticas se muestran bien y qué descubrimientos hemos hecho por nosotros mismos en este proyecto.

"Tuning Jupyter Notebook", Alexander Lifanov, MarketGuard
Cómo configurar Jupyter Notebook para un trabajo productivo y conveniente.

"BigArtm - no solo para texto", Maxim Statsenko, Mail.Ru Group
Muchos están acostumbrados al hecho de que la incrustación se trata de texto: incrustamos palabras, oraciones, etc. En cierto sentido, el modelado temático también está incrustado. En mi informe, quiero mostrar que con la ayuda de Python y el ingenio, puede usar los enfoques de modelado temático e incrustaciones en tareas en las que no hay ningún texto, es decir, en la agrupación de usuarios por fuente de ingresos y por intereses.

"Introducción al controlador PID, o Cómo preparar cerveza con PyData", Anton Lebedevich
Una introducción paso a paso al controlador automático más popular que utiliza como ejemplo puré de malta de cerveza, con animación y código Python. Además del controlador PID básico, habrá un par de trucos que mejorarán su trabajo en la vida real. En la práctica, a menudo se necesita una regulación automática, y casi cualquier implementación contiene elementos PID junto con sus defectos, que debe conocer y poder reparar.

Sala de cine
Redes y zona de citas. En esta sala, puede comunicarse con colegas y otros participantes en el evento en un formato gratuito.

Para participar, debes registrarte . No olvides tu pasaporte o licencia de conducir.

Reunión de participantes e inscripción : 10:00 - 11:00.
El comienzo de los informes : 11:00.
Fin aproximado del evento : 17:00.
Dirección : Moscú, aeropuerto de metro, Leningradsky Prospekt, 39, p. 79.

Transmisiones

Source: https://habr.com/ru/post/es420711/


All Articles