👨‍👩‍👧‍👦 👢 ⚜️ Meetup sobre PyDaCon no grupo Mail.ru: 22 de junho 👨🏼‍🤝‍👨🏻 💪🏾 🐾

22 de junho O Mail.ru Group realiza uma reunião conjunta com os organizadores da conferência PyCon Russia e PyData Moscow meetup. Há duas seções esperando por você: relatórios sobre o Python, cuja composição foi formada com base em uma lista geral de relatórios para o PyCon Russia e a trilha PyData do PyData Moscow. O programa do evento: palestra, relatórios técnicos, questionário e muita comunicação útil.

Palestra: “Como usar o JupyterHub para 100% no exemplo da DataGym e da Lamoda da escola ML”
Petr Ermakov, Senior Data Scientist na Lamoda e Data Coach na DataGym

Há mais de dois anos, falei sobre o uso do jupyter 100%. Mas e se você não estiver sozinho? Como se dar bem em uma máquina com 20 alunos que estudam ML ou com uma equipe de 15 da RND? Receitas prontas, recomendações e rake coletado.

Faixa Python:
"SQL botkneki: localizando e eliminando gargalos ao dimensionar"
Mikhail Novikov, Desenvolvedor Líder, Fasttrack (fstrk.io)

Você está iniciando um novo projeto. Instale a estrutura da web, estrutura do ORM, escreva modelos, faça consultas ao banco de dados. Tudo está indo bem. Em seguida, 100.000 usuários procuram você - e o projeto trava sob carga. Suas ações?

Tivemos uma situação assim há seis meses. Vou lhe contar como encontramos uma saída, mostrar nossas abordagens para encontrar gargalos, serviços que ajudam nisso. E vou explicar por que o ORM de baunilha é ruim.

“Comparação de tecnologias aiopg e asyncpg”
Alexey Firsov, desenvolvedor líder do aio-libs / aiopg

Vamos ver como duas tecnologias completamente diferentes, aiopg e asyncpg, funcionam - vamos ver como elas funcionam. O que é importante, não vamos comparar a velocidade.

Faixa de Meetup de PyData Moscow :
“Projeto de oleoduto no projeto da PNL”
Vitaliy Radchenko, cientista de dados, YouScan

No relatório, focaremos nas melhores práticas mundiais (AllenNLP) e em nossa própria experiência. Diremos a você como estruturar seu pipeline e os recursos de cada um de seus componentes: como formatar dados recebidos, iteradores de acordo com o conjunto de dados, como deve ser o dicionário, preparação de dados etc. Exemplos de problemas reais serão apresentados e será mostrado como isso ajuda na reprodutibilidade e facilidade de mais use.

“Fluímos para baixo e Blendim. Analisando bibliotecas populares de Python »
Dmitry Buslov

No relatório, falaremos sobre as bibliotecas mais populares para a formação de conjuntos. Vamos começar com o conjunto simples no Sklearn-e, montar manualmente o empilhamento mais simples em algumas linhas de código e considerar as bibliotecas mais populares: Vecstack, Heamy, Pystacknet, Mlxtend, Mlens.

PyMC3 - Modelagem Estatística Bayesiana em Python, Maxim Kochurov, PyMC Dev / Samsung AI / Skoltech

As estatísticas bayesianas começaram recentemente a ser discutidas no contexto da aprendizagem profunda. Infelizmente, isso oculta sua principal vantagem sobre as abordagens padrão de aprendizado de máquina. Ao contrário dos modelos de caixa preta, a abordagem bayesiana da modelagem de caixa branca. A caixa branca é boa e ruim. O analista é obrigado a entender completamente a natureza do problema; somente então a abordagem bayesiana é usada em plena capacidade. Ele nos permite levar em consideração não apenas o que "os dados nos dizem", mas também o que o "senso comum nos diz". O relatório discutirá por que e quando tudo isso é necessário e como conduzir e interpretar essa análise em python.

“'Beije-kis, inspire-me com kes' ou o que os amantes do rap dizem: Python para modelagem temática dos comentários do VKontakte”
Dmitry Sergeev, Universidade de Aalto / DataGym

Mostraremos como coletar 10 milhões de comentários usando as APIs do VKontakte e do YouTube, ver do que os usuários estão ouvindo os diferentes gêneros musicais e dar respostas a perguntas importantes como:

A modelagem tópica pode ajudar com gêneros de cluster?
Existe algo em comum entre os ouvintes de chanson e jazz?
Como medir a proximidade de Kirkorov ao Antokha MS?

Siga e assine os eventos da comunidade PyData.Moscow

Encontro de participantes e inscrição: 11:00. O início dos relatórios: 12:00.
Endereço: Leningradsky Prospekt 39, p. 79.

No formulário de registro, indique para qual seção você planeja ir: faixa Python ou PyData. O registro em uma faixa não proíbe a visita a outra.

Meetup sobre PyDaCon no grupo Mail.ru: 22 de junho

Palestra: “Como usar o JupyterHub para 100% no exemplo da DataGym e da Lamoda da escola ML”Petr Ermakov, Senior Data Scientist na Lamoda e Data Coach na DataGym

Faixa Python:"SQL botkneki: localizando e eliminando gargalos ao dimensionar"Mikhail Novikov, Desenvolvedor Líder, Fasttrack (fstrk.io)

“Comparação de tecnologias aiopg e asyncpg”Alexey Firsov, desenvolvedor líder do aio-libs / aiopg

Faixa de Meetup de PyData Moscow :“Projeto de oleoduto no projeto da PNL”Vitaliy Radchenko, cientista de dados, YouScan

“Fluímos para baixo e Blendim. Analisando bibliotecas populares de Python »Dmitry Buslov