Meetup PyDaCon au groupe Mail.ru: 22 juin



22 juin Mail.ru Group tient une réunion conjointe avec les organisateurs de la conférence PyCon Russia et PyData Moscow meetup. Il y a 2 sections qui vous attendent: des rapports sur Python, dont la composition a été formée sur la base d'une liste générale de rapports à PyCon Russie et le PyData-track de PyData Moscou meetup. Le programme de l'événement: keynote, rapports techniques, quiz et beaucoup de communication utile.

Keynote: "Comment utiliser JupyterHub à 100% sur l'exemple de ML-school DataGym et Lamoda"
Petr Ermakov, Senior Data Scientist chez Lamoda et Data Coach chez DataGym


Il y a plus de deux ans, j'ai parlé d'utiliser 100% jupyter. Mais que faire si vous n'êtes pas seul? Comment s'entendre sur une machine avec 20 étudiants en ML ou une équipe RND de 15 personnes? Recettes toutes faites, recommandations et râteau collecté.

Piste Python:
«SQL botkneki: trouver et éliminer les goulots d'étranglement lors de la mise à l'échelle»
Mikhail Novikov, développeur principal, Fasttrack (fstrk.io)


Vous démarrez un nouveau projet. Installez le framework web, le framework ORM, écrivez des modèles, faites des requêtes de base de données. Tout va bien. Ensuite, 100 000 utilisateurs viennent à vous - et le projet se bloque sous charge. Vos actions?

Nous avons eu une telle situation il y a six mois. Je vais vous dire comment nous avons trouvé un moyen de nous en sortir, montrer nos approches pour trouver des goulots d'étranglement, des services qui aident à cela. Et je vais expliquer pourquoi la vanille ORM est mauvaise.

«Comparaison des technologies aiopg et asyncpg»
Alexey Firsov, développeur principal d'aio-libs / aiopg


Voyons comment fonctionnent deux technologies complètement différentes aiopg et asyncpg - voyons comment elles fonctionnent. Ce qui est important, nous ne comparerons pas la vitesse.

Piste de rencontre PyData Moscou :
«Conception de pipeline dans le projet PNL»
Vitaliy Radchenko, Data Scientist, YouScan


Dans le rapport, nous nous concentrerons sur les meilleures pratiques mondiales (AllenNLP) et notre propre expérience. Nous vous expliquerons comment structurer votre pipeline et les fonctionnalités de chacun de ses composants: comment formater les données entrantes, les itérateurs en fonction du jeu de données, à quoi devrait ressembler le dictionnaire, la préparation des données, etc. utiliser.

«Nous coulons et Blendim. Analyser les bibliothèques Python populaires »
Dmitry Buslov


Dans le rapport, nous parlerons des bibliothèques les plus populaires pour la formation d'ensembles. Commençons par un ensemble simple dans Sklearn-e, puis assemblons manuellement l'empilement le plus simple en quelques lignes de code, puis considérons les bibliothèques les plus populaires: Vecstack, Heamy, Pystacknet, Mlxtend, Mlens.

PyMC3 - Modélisation statistique bayésienne en Python, Maxim Kochurov, PyMC Dev / Samsung AI / Skoltech


Les statistiques bayésiennes ont récemment commencé à être discutées dans le contexte de l'apprentissage en profondeur. Malheureusement, cela cache son principal avantage par rapport aux approches d'apprentissage automatique standard. Contrairement aux modèles à boîte noire, l'approche bayésienne de la modélisation à boîte blanche. La boîte blanche est à la fois bonne et mauvaise. L'analyste est tenu de bien comprendre la nature du problème, alors seulement l'approche bayésienne est utilisée à pleine capacité. Il nous permet de prendre en compte non seulement ce que «les données nous disent», mais aussi ce que «le bon sens nous dit». Le rapport expliquera pourquoi et quand tout cela est nécessaire et comment mener et interpréter une telle analyse en python.

"'Kiss-kis, inspirez-moi à travers kes' ou ce que disent les amateurs de rap: Python pour la modélisation thématique des commentaires VKontakte"
Dmitry Sergeev, Université Aalto / DataGym


Nous montrerons comment collecter 10 millions de commentaires à l'aide des API VKontakte et YouTube, verrons de quoi parlent les différents genres musicaux et répondrons à des questions importantes telles que:

  • La modélisation topique peut-elle aider à regrouper les genres?
  • Y a-t-il quelque chose en commun entre les auditeurs de chanson et de jazz?
  • Comment mesurer la proximité de Kirkorov avec Antokha MS?

Suivez et abonnez-vous aux événements de la communauté PyData.Moscow

Rassemblement des participants et inscription: 11h00. Les papiers commencent: 12:00.
Adresse: Leningradsky Prospekt 39, p. 79.

Dans le formulaire d' inscription, indiquez dans quelle section vous prévoyez d'aller: Python- ou PyData-track. L'inscription sur une piste n'interdit pas de visiter une autre.

Source: https://habr.com/ru/post/fr456076/


All Articles