Relatório do PyDaCon meetup no Mail.ru Group, 22 de junho



No final de junho, foi realizada uma reunião no escritório de Moscou, onde foram coletadas 2 seções: relatórios sobre o Python, cuja composição foi formada com base em uma lista geral de relatórios para o PyCon Rússia e a faixa PyData do PyData Moscou . Apresentações, gravações de relatórios e pequenos comentários foram reunidos sob o corte.


“Como usar o JupyterHub para 100% no exemplo da ML-escola DataGym e Lamoda”

Petr Ermakov, Senior Data Scientist na Lamoda e Data Coach na DataGym

Há mais de dois anos, falei sobre o uso do jupyter 100%. Mas e se você não estiver sozinho? Como se dar bem em uma máquina com 20 alunos que estudam ML ou com uma equipe de 15 da RND? Receitas prontas, recomendações e rake coletado.


Apresentação



"SQL botkneki: localizando e eliminando gargalos ao dimensionar"

Mikhail Novikov, Desenvolvedor Líder, Fasttrack (fstrk.io)

Você está iniciando um novo projeto. Instale a estrutura da web, estrutura do ORM, escreva modelos, faça consultas ao banco de dados. Tudo está indo bem. Em seguida, 100.000 usuários procuram você - e o projeto trava sob carga. Suas ações? Tivemos uma situação assim há seis meses. Vou contar como descobrimos uma maneira de mostrar isso, mostrar nossas abordagens para encontrar gargalos, serviços que ajudam nisso. E vou explicar por que o ORM de baunilha é ruim.


Apresentação



“Localização de conteúdo e elementos de interface”

Alina Krasavina, Desenvolvedor Líder, MAPS.ME, Mail.ru Group

Uma história sobre como a localização é organizada no site do servidor MAPS.ME. Uma pequena história comovente sobre a dor dos gerenciadores de conteúdo e da superação dos desenvolvedores de back-end no Django.


Apresentação



“Comparação de tecnologias aiopg e asyncpg”

Alexey Firsov lesha_firs , desenvolvedor líder do aio-libs / aiopg

Vamos ver como duas tecnologias completamente diferentes, aiopg e asyncpg, funcionam - vamos ver como elas funcionam. O que é importante, não vamos comparar a velocidade.


Apresentação



“Projeto de oleoduto no projeto da PNL”

Vitaliy Radchenko, cientista de dados, YouScan

No relatório, focaremos nas melhores práticas mundiais (AllenNLP) e em nossa própria experiência. Nós lhe diremos como estruturar seu pipeline e os recursos de cada um de seus componentes: como formatar dados recebidos, iteradores de acordo com o conjunto de dados, como deve ser o dicionário, preparação de dados etc. Exemplos de problemas reais serão apresentados e será mostrado como isso ajuda na reprodutibilidade e facilidade de use.


Apresentação



“Fluímos para baixo e Blendim. Analisando bibliotecas populares de Python »

Dmitry Buslov, arquiteto sênior de soluções de negócios, SAP CIS

No relatório, falaremos sobre as bibliotecas mais populares para a formação de conjuntos. Vamos começar com o conjunto simples no Sklearn-e, montar manualmente o empilhamento mais simples em algumas linhas de código e considerar as bibliotecas mais populares: Vecstack, Heamy, Pystacknet, Mlxtend, Mlens.


Apresentação



PyMC3 - Modelagem Estatística Bayesiana em Python

Maxim Kochurov, desenvolvedor PyMC / Samsung AI / Skoltech

As estatísticas bayesianas começaram recentemente a ser discutidas no contexto da aprendizagem profunda. Infelizmente, isso oculta sua principal vantagem sobre as abordagens padrão de aprendizado de máquina. Ao contrário dos modelos de caixa preta, a abordagem bayesiana da modelagem de caixa branca. A caixa branca é boa e ruim. O analista é obrigado a entender completamente a natureza do problema; somente então a abordagem bayesiana é usada em plena capacidade. Ele nos permite levar em consideração não apenas o que "os dados nos dizem", mas também o que o "senso comum nos diz". O relatório discutirá por que e quando tudo isso é necessário e como conduzir e interpretar essa análise em python.


Apresentação



“'Beije-kis, inspire-me com kes' ou o que os amantes do rap dizem: Python para modelagem temática dos comentários do VKontakte”

Dmitry Sergeev, Universidade de Aalto / DataGym

Mostraremos como coletar 10 milhões de comentários usando as APIs do VKontakte e do YouTube, ver do que os usuários estão ouvindo os diferentes gêneros musicais e dar respostas a perguntas importantes como:

  • A modelagem tópica pode ajudar com gêneros de cluster?
  • Existe algo em comum entre os ouvintes de chanson e jazz?
  • Como medir a proximidade de Kirkorov ao Antokha MS?


Apresentação

Fique atento aos próximos eventos aqui .

Source: https://habr.com/ru/post/pt460555/


All Articles