
FunCorp最近参与了美好的机器学习体验。 我们的后端工程师教搜索引擎阅读模因。 在这种情况下,我们决定收集ML-mitap,以分享我们的最佳实践,并同时向其他公司的经验丰富的专家学习,而机器学习已经是其他业务的重要组成部分。 我们决定收集-收集。 我们将在2月9日度过。 该程序已被削减。
程序
“发现9000万用户的启动体验:针对ML开发人员的五项建议”,vk.com的Andrey Zakonov
关于报告
- 不仅模型很重要:我们正确地制定问题并选择度量。
- 优化负载解决方案的不同方法。
- 我们正确地评估实验:我们研究图形并使用反馈。
“用机器学习生产”,Mark Andreev,Conundrum.ai
关于报告
该报告将包括:
- 关于预测类型:实时,离线,实时+离线
- 如何从Jupyter笔记本中的原型到容器
- 关于扩展决策和质量控制。
“如何教搜索引擎阅读模因”,FunCorp的Grigory Kuzovnikov
关于报告
iFunny是带有有趣图片和视频的应用程序。 唯一的文本内容是用户评论,但是为了吸引搜索引擎的访问量,这还不够,因此决定从图片中提取文本并将其放置在页面上。 特别是为此,创建了一个服务,该服务:
- 查找图片中包含“主要笑话”的区域
- 从该区域提取文本
- 检查可识别文本的质量。
该服务使用tensorflow用Python编写。 团队中没有人具有开发ML服务的经验,因此我们经历了所有阶段:
- 任务说明。
- 我们尝试进行至少某种程度上可行的工作时的第一个实验,是对神经网络的体系结构进行实验。
- 草拟训练样本。
- 训练和选择模型系数。
- 使用我们训练有素的模型创建服务。 将其包装在docker容器中。
- 部署和服务绑定到我们的php monolith。 单次启动。
- 工作的初步结果和租金评论。
- 使用识别会导致战斗。
- 分析结果。
- 我们现在在这里。 我们仍然必须重做并重新训练模型,以增加正确识别的模因的数量。
Yandex.Taxi,Roman Khalkachev,Yandex.Taxi的机器学习
关于报告
该报告将讨论Yandex.Taxi设备。
将有一个详细的故事:
- 关于我们使用数据分析和机器学习技术解决的任务
- 关于我们用于生产中机器学习模型的开发,测试和发布的装配线
- 让我们经历所有阶段:从Jupyter Notebook的实验到成熟的ML生产。
“摆脱Sklearn诅咒:从头开始编写XGBoost”,Mail.ru集团Artyom Hapkin
关于报告
有关提升的故事。 您需要自己写些什么。 有哪些陷阱,如何改进其工作。
目前,很难想象没有使用用于增强决策树的集成算法的地方。 这些是搜索引擎,推荐排名算法,Kaggle竞赛等等。
该算法有许多现成的实现:Catboost,Lightgbm,Xgboost等。 但是,有时开箱即用的现成解决方案不是很好-丢失了对算法的理解,并且对于某些任务,此类实现也不是很合适。
在本报告中,我们将分析算法的原理,并从简单到复杂,我们将实现自己的Xgboosting算法,然后可以针对任何机器学习任务(分类,回归,排名等)对其进行调整。
电报中的更多信息
您可以在
Timepad上注册。 名额有限。
对于那些无法或没有时间注册的人,我们的
频道将播出一个
广播 。