
5月25日,
第二次Metaconf会议将在沃罗涅日举行,这次
会议专门讨论机器学习。 mitap程序中有五份报告,可
在此处免费注册。 尤其是,DataArt医疗保健领域AI项目专家Anton Dolgikh将谈论“自然语言的神经网络概率模型”。 今天,我们请安东谈论在DataArt中将机器学习知识系统化的经验。
机器学习的范围正在不断扩大(从医疗保健到旅游行业)。 在DataArt内部,在某个时候,机器学习开发请求的数量超过了临界值。 在此之前,我们能够通过公司工作的工程师解决此类问题。
当使用我们自己的资源进行管理变得困难时,两条发展道路就变得显而易见:雇用新员工或培训公司内部的专家。 在第一种情况下,我们面临的风险是,我们后来雇用的ML开发人员不会立即进入我们专业领域的新项目。 同时,狭machine地从事机器学习的人通常不准备参与例如全栈开发。 因此,我们依赖对ArtML感兴趣的DataArt工程师,但是他们能够在必要时恢复以前的工作。
准备过程需要系统化。 互联网似乎充斥着大量的在线和视频课程。 但是为了有效地发展,一个人需要一个发展载体-从随机听任何课程开始,这几乎没有用。
我们做了什么:- 首先,他们形成了核心-一群在机器学习各个领域拥有最丰富经验和专业知识的积极进取的同事。 他们准备了一系列演示文稿,概述了现有课程并提出了建议:您需要参加哪些课程才能获得与DataArt解决的任务相关的技能。
- 我们组织了数学课程。 显然,ML本质上是数学统计和优化方法。 为了理解和正确使用机器学习方法,需要一定的数学知识。 乍一看,接受过技术教育的专家总是对数学很了解。 但是实际上,事实证明,技能很快就被遗忘了。 这对课程设置了限制:与大学不同,公司不能提供基础知识,但是知识必须足够且足够深入。 我们从外面邀请一位老师阅读课程(我们的同事太忙了)。 该计划的重点是与机器学习直接相关的领域:线性代数,分析,概率论,优化方法。 通过定期的专家授课来补充本课程,在理论的基础上,我们考虑来自机器学习项目的实际问题。
- 每个月,我们的机器学习专家都会举办有关该领域最新成就的教育研讨会。 研讨会记录可供公司所有员工使用。
- 除研讨会外,DataArt ML专家还定期发布有趣的材料摘要(方法,文章,书籍),并附有简短的注释和评论。
该公司支持这些计划,并为购买文学作品和同事参加会议,铁和指导计划分配了预算。 个别指导培训的结果是一个现成的原型,可以在会议或与潜在客户的会议上使用。 例如,我们可以引用专家安德烈·索罗金(Andrei Sorokin)的工作结果-一种检测和分类皮肤病变的模型(
arxiv.org/pdf/1807.05979.pdf )。 为了优化在移动设备上使用的结果模型,员工只是在指导计划的框架中提供了帮助。 该模型在
ISIC 2018国际竞赛中排名第12位,不仅击败了个人参与者,还击败了大学团队。
上述流程的系统化使我们能够快速而专业地处理潜在客户对DataArt的所有来自机器学习领域的请求。 我们已经准备了营销材料,销售团队随时可以为您解答客户的问题。 几个项目已经成功完成。
像许多大型科技公司一样,DataArt可以将专业知识和教育计划扩展到外部受众。 5月25日,在沃罗涅日举行了一次公开的
机器学习聚会 ,与会者将学习
机器学习技术的趋势,可以在他们的帮助下解决的问题和任务,以及使用机器学习方法和人工智能的现实生活项目。