FunTech ML会议



FunCorp最近参与了美好的机器学习体验。 我们的后端工程师教搜索引擎阅读模因。 在这种情况下,我们决定收集ML-mitap,以分享我们的最佳实践,并同时向其他公司的经验丰富的专家学习,而机器学习已经是其他业务的重要组成部分。 我们决定收集-收集。 我们将在2月9日度过。 该程序已被削减。

程序


“发现9000万用户的启动体验:针对ML开发人员的五项建议”,vk.com的Andrey Zakonov


关于报告


  • 不仅模型很重要:我们正确地制定问题并选择度量。
  • 优化负载解决方案的不同方法。
  • 我们正确地评估实验:我们研究图形并使用反馈。


“用机器学习生产”,Mark Andreev,Conundrum.ai


关于报告


该报告将包括:
  • 关于预测类型:实时,离线,实时+离线
  • 如何从Jupyter笔记本中的原型到容器
  • 关于扩展决策和质量控制。


“如何教搜索引擎阅读模因”,FunCorp的Grigory Kuzovnikov


关于报告


iFunny是带有有趣图片和视频的应用程序。 唯一的文本内容是用户评论,但是为了吸引搜索引擎的访问量,这还不够,因此决定从图片中提取文本并将其放置在页面上。 特别是为此,创建了一个服务,该服务:

  • 查找图片中包含“主要笑话”的区域
  • 从该区域提取文本
  • 检查可识别文本的质量。

该服务使用tensorflow用Python编写。 团队中没有人具有开发ML服务的经验,因此我们经历了所有阶段:

  1. 任务说明。
  2. 我们尝试进行至少某种程度上可行的工作时的第一个实验,是对神经网络的体系结构进行实验。
  3. 草拟训练样本。
  4. 训练和选择模型系数。
  5. 使用我们训练有素的模型创建服务。 将其包装在docker容器中。
  6. 部署和服务绑定到我们的php monolith。 单次启动。
  7. 工作的初步结果和租金评论。
  8. 使用识别会导致战斗。
  9. 分析结果。
  10. 我们现在在这里。 我们仍然必须重做并重新训练模型,以增加正确识别的模因的数量。


Yandex.Taxi,Roman Khalkachev,Yandex.Taxi的机器学习


关于报告


该报告将讨论Yandex.Taxi设备。

将有一个详细的故事:
  • 关于我们使用数据分析和机器学习技术解决的任务
  • 关于我们用于生产中机器学习模型的开发,测试和发布的装配线
  • 让我们经历所有阶段:从Jupyter Notebook的实验到成熟的ML生产。


“摆脱Sklearn诅咒:从头开始编写XGBoost”,Mail.ru集团Artyom Hapkin


关于报告


有关提升的故事。 您需要自己写些什么。 有哪些陷阱,如何改进其工作。

目前,很难想象没有使用用于增强决策树的集成算法的地方。 这些是搜索引擎,推荐排名算法,Kaggle竞赛等等。

该算法有许多现成的实现:Catboost,Lightgbm,Xgboost等。 但是,有时开箱即用的现成解决方案不是很好-丢失了对算法的理解,并且对于某些任务,此类实现也不是很合适。

在本报告中,我们将分析算法的原理,并从简单到复杂,我们将实现自己的Xgboosting算法,然后可以针对任何机器学习任务(分类,回归,排名等)对其进行调整。

电报中的更多信息
您可以在Timepad上注册。 名额有限。

对于那些无法或没有时间注册的人,我们的频道将播出一个广播

Source: https://habr.com/ru/post/zh-CN436900/


All Articles