我如何在NSU组织机器学习培训

我叫Sasha,我喜欢机器学习,也喜欢教人。 现在,我在计算机科学中心监督教育计划,并在圣彼得堡国立大学领导数据分析学士学位。 在此之前,他曾在Yandex担任分析师,甚至更早是一名科学家:他曾在ICT SB RAS从事数学建模。

在这篇文章中,我想告诉您为学生,新西伯利亚国立大学的毕业生以及所有人发起机器学习培训的想法是什么。

图片


长期以来,我一直想组织一门特殊的课程,以准备在Kaggle和其他平台上进行数据分析比赛。 这似乎是个好主意:

  • 学生和所有参赛者将实践理论知识,并获得解决公共竞赛中问题的经验。
  • 在此类比赛中排名最高的学生会对NSU对申请人,学生和毕业生的吸引力产生很大影响。 通过体育编程锻炼,同样的事情也会发生。
  • 这样的特殊课程完美地补充和扩展了基础知识:参与者独立地实现机器学习模型,通常团结在全球范围内竞争的团队中。
  • 其他大学已经进行过此类培训,所以我希望NSU的特殊课程取得成功。

发射


新西伯利亚的Akademgorodok是从事此类活动的沃土:计算机科学中心和强大的技术部门(例如FIT,MMF,FF)的学生,毕业生和教师,得到了NSU政府的大力支持,活跃的ODS社区,经验丰富的工程师和来自各种IT公司的分析师。 大约在同一时间,我们从Botan Investments了解了赠款计划-该基金支持在ML体育竞赛中取得良好成绩的团队。

我们在NSU每周一次的会议上找到了观众,并在Telegram中创建了一个聊天室,从10月1日开始,CS中心的学生和毕业生开始了。 第一课有19人。 其中六个成为培训的常规参与者。 一学年中,共有31人至少参加了一次会议。

初步结果


我们会见了这些家伙,交流了经验,讨论了比赛以及对未来的粗略计划。 他们很快意识到,在数据分析比赛中争夺名额是一项艰巨的工作,类似于无偿全职工作,但非常有趣和令人兴奋:)参与者之一,Maxim Kaggle-master建议我们在比赛中逐一进步,并且在该团队成立后仅几周的时间就获得了公众评分。 我们做到了! 在全职培训中,我们讨论了模型,科学文章以及Python库的复杂性,并共同解决了问题。

秋季学期在两次Kaggle比赛中获得了三枚银牌: TGS盐识别PLAsTiCC天文分类 。 在CFT竞赛中,第一笔奖金赢得了错字比赛的第三名(这是有经验的开玩笑的人所说的)。

该特殊课程的另一个非常重要的间接结果是全俄罗斯国立大学集群的启动和配置。 它的计算能力显着改善了我们的竞争生活:40个CPU,755Gb RAM,8个GPU NVIDIA Tesla V100。

图片

在此之前,我们尽了最大的生存能力:依靠个人笔记本电脑和台式机,Google Colab和Kaggle内核。 一个团队甚至拥有一个自写的脚本,该脚本可以自动保存模型并重新开始计算,并在时间限制内停止。

在春季学期,我们继续收集,交流成功的发现并谈论我们的竞争决定。 感兴趣的新参与者开始来找我们。 在春季学期中,事实证明在Kaggle的八项比赛中已经获得了一枚金,三枚银和九枚铜。PetFinderSantander性别代词解析度Whale IdentificationQuoraGoogle Landmarks等,在Recco挑战中获得铜牌,在Changellenge >>杯中获得第三名并在Yandex 编程锦标赛的机器学习竞赛中再次获得第一名(再次获得奖金)。

培训参与者怎么说?


米哈伊尔(Mikhail Karchevsky)
“我很高兴在我们国家的西伯利亚开展此类活动,因为我相信参加比赛是掌握ML的最快方法。 对于这样的比赛,铁足够昂贵,可以自己购买,但是在这里您可以免费尝试创意。”

基里尔·布罗特
“在进行ml训练之前,除了教育和印度教比赛之外,我没有参加任何其他比赛:我没有意识到这一点,因为我曾在莫斯科国防部工作,而且我认识他。 第一学期去听。 从第二学期开始,我想为什么不参加计算资源。 它吸引了我。 任务,数据和度量标准是为您发明和准备的,可以使用并利用MO的所有功能,检查最新的模型和技术。 如果不是为了培训,而且同样重要的是计算资源,我将不会立即开始参与。”

安德烈·谢维列夫
“面对面的机器学习培训帮助我找到了志趣相投的人,并与他们一起加深了我在机器学习和数据分析领域的知识。 对于那些没有太多空闲时间来独立分析和研究比赛主题但仍然希望成为比赛主题的人来说,这也是一个不错的选择。”

加入我们


Kaggle和其他场馆的比赛磨练了实践技能,并迅速变成了数据科学领域的有趣工作。 一起参加艰苦比赛的人们经常成为同事,并继续成功地解决工作任务。 我们发生了这种情况:Mikhail Karchevsky与团队中的一位朋友一起,转而在同一公司的推荐系统上工作。

随着时间的流逝,我们计划通过科学出版物和参加机器学习会议来扩展此活动。 加入我们,成为新西伯利亚的参与者或专家-给基里尔写信。 在您的城市和大学中组织类似的培训。

这是一份简短的备忘单,可帮助您迈出第一步:

  1. 考虑常规课程的方便地点和时间。 最佳-每周1-2次。
  2. 写信给有兴趣的有关第一次会议的各方。 首先,这些是技术大学的学生,ODS的参与者。
  3. 获得一个聊天室来讨论时事:Telegram,VK,WhatsApp或最方便的其他任何Messenger。
  4. 保持公共课程计划,比赛和参与者名单,并跟踪结果。
  5. 在附近的大学,研究机构或公司中,可以为他们找到免费的计算能力或赠款。
  6. 赢利!

Source: https://habr.com/ru/post/zh-CN458042/


All Articles