Moscow Data Science Major: anúncio e registro



Em 1º de setembro, o Mail.Ru Group e a comunidade Open Data Science realizarão a maior reunião do Moscow Data Science Major. O evento consiste em cinco blocos temáticos de relatórios, um treinamento de ML e um salão inteiro para networking e namoro.

Familiarize-se com o programa e cadastre-se ! A entrada no evento é gratuita, de acordo com a inscrição aprovada.

As apresentações no Moscow Data Science Major serão realizadas em dois fluxos. Na tabela, você encontrará uma grade com uma programação e abaixo - descrições dos relatórios.

Horário:



Descrições da apresentação:

"Problema de Diarização do Orador", Gregory Sterling, NeurodataLab LLC
Vou falar brevemente sobre o processamento da fala em geral e sobre a tarefa de diarização do orador (gravando um diálogo, você precisa determinar quem falou quando). Vou falar sobre a história do problema, por que, por que, sobre o problema da festa, quem decidiu como é difícil. A parte principal do relatório será dedicada aos resultados de 2017-2018, por exemplo, sobre um artigo do Google que descreve a solução para o problema do vídeo (ali a rede neural parece estar tentando ler os lábios). Acabarei fazendo o que quando não houver vídeo, mas houver apenas som (diálogo por telefone, por exemplo), analisarei os artigos e nossa abordagem.

Coordenadores de Redes Neurais, Sergey Dukanov, Mail.Ru Group
Primeiro, haverá uma pequena digressão nas abordagens modernas para resolver o problema da síntese da fala, depois falaremos sobre vocodificadores e depois nos concentraremos em um dos mais interessantes deles (do ponto de vista da teoria e da prática).

“Pizza à la semi-supervisionada”, Arthur Cousin, Dbrain
Usando o exemplo de controle de produto da Dodo Pizza, falarei sobre técnicas para trabalhar com dados ao treinar modelos. Em particular, mostrarei como as caixas laterais são puxadas pela segmentação semântica de objetos, bem como treinar o modelo e obter a marcação do conjunto de dados, marcando apenas algumas amostras.

“Arquitetura de OCR e TD no reconhecimento de fotografias de documentos impressos”, Alexey Goncharov, Ilya Zharikov, Nikitin Filipp, MIPT Machine Intelligence Laboratory
O relatório descreve a estrutura de OCR (reconhecimento de caracteres) e TD (detecção de janelas com texto), que nossa equipe usa em projetos para reconhecer fotografias de documentos impressos de vários tipos. Vamos falar sobre a arquitetura e o treinamento desses sistemas.

“Como fazer a adaptação do domínio e idéias para melhorar sua qualidade”, Renat Bashirov, Samsung AI
O relatório é um aperto de idéias de algumas dúzias de artigos. Os artigos foram selecionados de acordo com seu grau de utilidade para implementar a adaptação de domínio para imagens: ter um conjunto marcado, como obter / melhorar a marcação em outro conjunto semelhante.

Será:

  • muitos GANs
  • várias arquiteturas com uma dúzia de funções de perda,
  • falou sobre
    • que coisas diferentes possam ser apresentadas na função de perda,
    • transferência de estilo
    • aplicação de adaptação de domínio para diferentes tarefas: classificação, segmentação.

Não pense que nada ficará claro se você entender, por exemplo:

  • qual é a função de perda
  • como o backprop funciona,
  • por que batchnorm é necessário e como funciona
  • qual tensor de tamanho é obtido após o agrupamento médio global.

“Pesquisa por mercadorias - organização do trabalho”, Dmitry Dremov, Análise de cheques
Sobre a tarefa, a abordagem para a organização do trabalho e os resultados.

"Vitrines em uma rede social: como e o que mostrar", Sergey Boytsov, Colegas de classe
Vamos desde o usuário até um item específico na loja que ele vê. Coleta de dados, pré-processamento, processamento analítico, teste A / B.

“Sistemas recomendados para passagens de transporte”, Artyom Prosvetov e Konstantin Kotochigov, CleverDATA
No relatório, falaremos sobre o uso de sistemas de recomendação em uma área incomum para eles: a venda de passagens de transporte. Quais abordagens tradicionais podem ajudar a resolver esse problema, quais heurísticas se mostram bem e que descobertas fizemos por nós neste projeto.

“Ajustando o Notebook Jupyter”, Alexander Lifanov, MarketGuard
Como configurar o Jupyter Notebook para um trabalho produtivo e conveniente.

“BigArtm - não apenas para texto”, Maxim Statsenko, Mail.Ru Group
Muitos estão acostumados com o fato de incorporar texto: incorporamos palavras, sentenças etc. Em certo sentido, a modelagem temática também está incorporada. No meu relatório, quero mostrar que, com a ajuda do Python e engenhosidade, você pode usar as abordagens de modelagem e incorporação temáticas em tarefas nas quais não há textos, nomeadamente agrupando usuários por fonte de renda e por interesses.

“Introdução ao Controlador PID ou Como preparar cerveja com PyData”, Anton Lebedevich
Uma introdução passo a passo ao controlador automático mais popular, usando o malte de cerveja como exemplo, com animação e código Python. Além do controlador PID básico, haverá alguns truques que melhoram seu trabalho na vida real. Na prática, a regulação automática é frequentemente necessária, e quase qualquer implementação dela contém elementos PID, juntamente com suas deficiências, que você precisa conhecer e poder reparar.

Sala de cinema
Zona de rede e namoro. Nesta sala, você pode se comunicar com colegas e outros participantes do evento em um formato gratuito.

Para participar, você deve se registrar . Não esqueça o seu passaporte ou carteira de motorista.

Encontro de participantes e inscrição : 10:00 - 11:00.
O início dos relatórios : 11:00.
Fim aproximado do evento : 17:00.
Endereço : Moscou, aeroporto do metrô, Leningradsky Prospekt, 39, p. 79.

Transmissões

Source: https://habr.com/ru/post/pt420711/


All Articles