👨‍🎓 🌈 〰️ FunTech ML会议 🐓 🎵 ⏹️

FunCorp最近参与了美好的机器学习体验。我们的后端工程师教搜索引擎阅读模因。在这种情况下，我们决定收集ML-mitap，以分享我们的最佳实践，并同时向其他公司的经验丰富的专家学习，而机器学习已经是其他业务的重要组成部分。我们决定收集-收集。我们将在2月9日度过。该程序已被削减。

程序

“发现9000万用户的启动体验：针对ML开发人员的五项建议”，vk.com的Andrey Zakonov

关于报告

不仅模型很重要：我们正确地制定问题并选择度量。
优化负载解决方案的不同方法。
我们正确地评估实验：我们研究图形并使用反馈。

“用机器学习生产”，Mark Andreev，Conundrum.ai

关于报告

该报告将包括：

关于预测类型：实时，离线，实时+离线
如何从Jupyter笔记本中的原型到容器
关于扩展决策和质量控制。

“如何教搜索引擎阅读模因”，FunCorp的Grigory Kuzovnikov

关于报告

iFunny是带有有趣图片和视频的应用程序。唯一的文本内容是用户评论，但是为了吸引搜索引擎的访问量，这还不够，因此决定从图片中提取文本并将其放置在页面上。特别是为此，创建了一个服务，该服务：

查找图片中包含“主要笑话”的区域
从该区域提取文本
检查可识别文本的质量。

该服务使用tensorflow用Python编写。团队中没有人具有开发ML服务的经验，因此我们经历了所有阶段：

任务说明。
我们尝试进行至少某种程度上可行的工作时的第一个实验，是对神经网络的体系结构进行实验。
草拟训练样本。
训练和选择模型系数。
使用我们训练有素的模型创建服务。将其包装在docker容器中。
部署和服务绑定到我们的php monolith。单次启动。
工作的初步结果和租金评论。
使用识别会导致战斗。
分析结果。
我们现在在这里。我们仍然必须重做并重新训练模型，以增加正确识别的模因的数量。

Yandex.Taxi，Roman Khalkachev，Yandex.Taxi的机器学习

关于报告

该报告将讨论Yandex.Taxi设备。

将有一个详细的故事：

关于我们使用数据分析和机器学习技术解决的任务
关于我们用于生产中机器学习模型的开发，测试和发布的装配线
让我们经历所有阶段：从Jupyter Notebook的实验到成熟的ML生产。

“摆脱Sklearn诅咒：从头开始编写XGBoost”，Mail.ru集团Artyom Hapkin

关于报告

有关提升的故事。您需要自己写些什么。有哪些陷阱，如何改进其工作。

目前，很难想象没有使用用于增强决策树的集成算法的地方。这些是搜索引擎，推荐排名算法，Kaggle竞赛等等。

该算法有许多现成的实现：Catboost，Lightgbm，Xgboost等。但是，有时开箱即用的现成解决方案不是很好-丢失了对算法的理解，并且对于某些任务，此类实现也不是很合适。

在本报告中，我们将分析算法的原理，并从简单到复杂，我们将实现自己的Xgboosting算法，然后可以针对任何机器学习任务（分类，回归，排名等）对其进行调整。

电报中的更多信息
您可以在Timepad上注册。名额有限。

对于那些无法或没有时间注册的人，我们的频道将播出一个广播。

FunTech ML会议

程序

“发现9000万用户的启动体验：针对ML开发人员的五项建议”，vk.com的Andrey Zakonov

关于报告

“用机器学习生产”，Mark Andreev，Conundrum.ai

关于报告

“如何教搜索引擎阅读模因”，FunCorp的Grigory Kuzovnikov

关于报告

Yandex.Taxi，Roman Khalkachev，Yandex.Taxi的机器学习

关于报告

“摆脱Sklearn诅咒：从头开始编写XGBoost”，Mail.ru集团Artyom Hapkin

关于报告

More articles: