PyDaCon聚会在Mail.ru集团的报告,6月22日



6月底,在莫斯科办公室举行了一次会议,收集了两个部分:有关Python的报告,其组成是根据向俄罗斯PyCon提交的报告的总清单和来自PyData Moscow聚会的PyData跟踪而形成的 。 切口下收集了演讲,报告记录和小评论。


“如何在ML学校的DataGym和Lamoda的示例中将JupyterHub的使用率提高到100%”

Lamoda的高级数据科学家和DataGym的数据教练Petr Ermakov

两年多以前, 我谈论过使用100%jupyter。 但是,如果您并不孤单怎么办? 如何在一台机器上与20名学习ML的学生或15名RND小组的学生相处? 现成的食谱,建议和收集的耙子。


简报



“ SQL botkneki:扩展时发现并消除瓶颈”

Fasttrack(fstrk.io)首席开发人员Mikhail Novikov

您正在开始一个新项目。 安装Web框架,ORM框架,编写模型,进行数据库查询。 一切进展顺利。 然后有100,000个用户来找您-该项目在负载下崩溃了。 你的举动? 六个月前,我们遇到了这样的情况。 我将告诉您我们如何找到解决之道,展示我们发现瓶颈的方法以及对此有所帮助的服务。 我将解释为什么原始ORM是邪恶的。


简报



“内容和界面元素的本地化”

Mail.ru Group MAPS.ME首席开发人员Alina Krasavina

有关如何在MAPS.ME服务器站点上安排本地化的故事。 关于内容管理器的痛苦以及克服Django后端开发人员的痛苦的一个小故事。


简报



“ aiopg和asyncpg技术的比较”

alio -libs / aiopg的首席开发人员Alexey Firsov lesha_firs

让我们看看两种完全不同的技术aiopg和asyncpg是如何工作的-让我们看看它们是如何工作的。 重要的是,我们不会比较速度。


简报



“自然语言处理项目中的管道设计”

Vitaliy Radchenko,YouScan数据科学家

在报告中,我们将重点关注世界最佳实践(AllenNLP)和我们自己的经验。 我们将告诉您如何构造管道及其每个组件的功能:如何格式化输入数据,根据数据集进行迭代器,字典应该是什么样的数据准备,数据准备等。将提供来自实际问题的示例,并说明如何帮助重现性和进一步简化使用。


简报



“我们顺其自然,来到Blendim。 解析流行的Python库»

Dmitry Buslov,SAP CIS高级业务解决方案架构师

在报告中,我们将讨论最流行的合奏库。 让我们从Sklearn-e中的简单合奏开始,然后以几行代码手动组装最简单的堆栈,然后考虑最受欢迎的库:Vecstack,Heamy,Pystacknet,Mlxtend,Mlens。


简报



PyMC3-Python中的贝叶斯统计建模

Maxim Kochurov,PyMC开发人员/三星AI / Skoltech

最近在深度学习的背景下开始讨论贝叶斯统计。 不幸的是,这隐藏了它与标准机器学习方法相比的主要优势。 与黑盒模型不同,贝叶斯方法进行白盒建模。 白盒是好是坏。 分析人员必须充分了解问题的性质,然后才能充分利用贝叶斯方法。 它使我们不仅可以考虑“数据告诉我们”,还可以考虑“常识告诉我们”。 该报告将讨论为什么以及何时需要所有这些信息,以及如何在python中进行和解释这种分析。


简报



“'Kiss-kis,通过ke吸我,'或说唱爱好者说:Python用于VKontakte评论的主题建模”

阿尔托大学Dmitry Sergeev / DataGym

我们将展示如何使用VKontakte和YouTube API收集1000万条评论,查看用户在听不同音乐流派谈论的话题,并给出以下重要问题的答案:

  • 主题建模可以帮助聚类类型吗?
  • 香颂和爵士的听众之间有共同点吗?
  • 如何测量Kirkorov到Antokha MS的距离?


简报

请继续关注这里即将发生的事件。

Source: https://habr.com/ru/post/zh-CN460555/


All Articles