
22 de junho O Mail.ru Group realiza uma
reunião conjunta com os organizadores da conferência PyCon Russia e PyData Moscow meetup. Há duas seções esperando por você: relatórios sobre o Python, cuja composição foi formada com base em uma lista geral de relatórios para o PyCon Russia e a trilha PyData do PyData Moscow. O programa do evento: palestra, relatórios técnicos, questionário e muita comunicação útil.
Palestra: “Como usar o JupyterHub para 100% no exemplo da DataGym e da Lamoda da escola ML”
Petr Ermakov, Senior Data Scientist na Lamoda e Data Coach na DataGym
Há mais de dois anos,
falei sobre o uso do jupyter 100%. Mas e se você não estiver sozinho? Como se dar bem em uma máquina com 20 alunos que estudam ML ou com uma equipe de 15 da RND? Receitas prontas, recomendações e rake coletado.
Faixa Python:
"SQL botkneki: localizando e eliminando gargalos ao dimensionar"
Mikhail Novikov, Desenvolvedor Líder, Fasttrack (fstrk.io)
Você está iniciando um novo projeto. Instale a estrutura da web, estrutura do ORM, escreva modelos, faça consultas ao banco de dados. Tudo está indo bem. Em seguida, 100.000 usuários procuram você - e o projeto trava sob carga. Suas ações?
Tivemos uma situação assim há seis meses. Vou lhe contar como encontramos uma saída, mostrar nossas abordagens para encontrar gargalos, serviços que ajudam nisso. E vou explicar por que o ORM de baunilha é ruim.
“Comparação de tecnologias aiopg e asyncpg”
Alexey Firsov, desenvolvedor líder do aio-libs / aiopg
Vamos ver como duas tecnologias completamente diferentes, aiopg e asyncpg, funcionam - vamos ver como elas funcionam. O que é importante, não vamos comparar a velocidade.
Faixa de Meetup de PyData Moscow :
“Projeto de oleoduto no projeto da PNL”
Vitaliy Radchenko, cientista de dados, YouScan
No relatório, focaremos nas melhores práticas mundiais (AllenNLP) e em nossa própria experiência. Diremos a você como estruturar seu pipeline e os recursos de cada um de seus componentes: como formatar dados recebidos, iteradores de acordo com o conjunto de dados, como deve ser o dicionário, preparação de dados etc. Exemplos de problemas reais serão apresentados e será mostrado como isso ajuda na reprodutibilidade e facilidade de mais use.
“Fluímos para baixo e Blendim. Analisando bibliotecas populares de Python »
Dmitry Buslov
No relatório, falaremos sobre as bibliotecas mais populares para a formação de conjuntos. Vamos começar com o conjunto simples no Sklearn-e, montar manualmente o empilhamento mais simples em algumas linhas de código e considerar as bibliotecas mais populares: Vecstack, Heamy, Pystacknet, Mlxtend, Mlens.
PyMC3 - Modelagem Estatística Bayesiana em Python, Maxim Kochurov, PyMC Dev / Samsung AI / Skoltech
As estatísticas bayesianas começaram recentemente a ser discutidas no contexto da aprendizagem profunda. Infelizmente, isso oculta sua principal vantagem sobre as abordagens padrão de aprendizado de máquina. Ao contrário dos modelos de caixa preta, a abordagem bayesiana da modelagem de caixa branca. A caixa branca é boa e ruim. O analista é obrigado a entender completamente a natureza do problema; somente então a abordagem bayesiana é usada em plena capacidade. Ele nos permite levar em consideração não apenas o que "os dados nos dizem", mas também o que o "senso comum nos diz". O relatório discutirá por que e quando tudo isso é necessário e como conduzir e interpretar essa análise em python.
“'Beije-kis, inspire-me com kes' ou o que os amantes do rap dizem: Python para modelagem temática dos comentários do VKontakte”
Dmitry Sergeev, Universidade de Aalto / DataGym
Mostraremos como coletar 10 milhões de comentários usando as APIs do VKontakte e do YouTube, ver do que os usuários estão ouvindo os diferentes gêneros musicais e dar respostas a perguntas importantes como:
- A modelagem tópica pode ajudar com gêneros de cluster?
- Existe algo em comum entre os ouvintes de chanson e jazz?
- Como medir a proximidade de Kirkorov ao Antokha MS?
Siga e assine os eventos da comunidade
PyData.MoscowEncontro de participantes e inscrição: 11:00. O início dos relatórios: 12:00.
Endereço: Leningradsky Prospekt 39, p. 79.
No formulário de registro, indique para qual seção você planeja ir: faixa Python ou PyData. O registro em uma faixa não proíbe a visita a outra.