计算机视觉夏令营-英特尔计算机视觉暑期学校



从7月3日至16日在UNN的基础上进行。 N.I. Lobachevsky通过了Intel Computer Vision暑期学校-Computer Vision Summer Camp,有100多名学生参加。 该学校的目标读者是下诺夫哥罗德大学的技术专业学生,他们对计算机视觉,深度学习,神经网络,英特尔OpenVINO和OpenCV感兴趣。

在本文中,我们将分享选拔学校的方式,我们的研究内容,实际操作中的家伙们所做的事情,并讨论国防部提出的一些项目。

选拔程序和参加表格


我们决定让孩子们选择两种形式的培训:全日制和非全日制。 学生没有通过全日制通讯的选择,而是立即注册。 他们只在工作日早上参加讲座。 他们也有机会完成实际任务并将其发送到GitHub进行教师测试。

为了全职工作,这些家伙必须来英特尔办公室接受该委员会的采访。 与兼职形式的区别在于,除讲座外,营地参与者还与策展人(UNN的老师和英特尔的工程师)一起整理了实际任务。 在第二周,完成了实际任务并开始了项目,参加者以3人为一组进行了研究。

在面试中,向学生询问了数学和程序设计方面的问题,并给出了需要当场解决的任务。 值得注意的是,该委员会由软件工程师,算法工程师和大学教授组成。 N.I. 洛巴切夫斯基(Lobachevsky),因此采访证明是多边且出色的。 从受访者的角度来看,找到适用于计算机视觉的学生的基本技术知识很有趣,因此提出了诸如C ++ / STL,OOP,基本算法和数据结构,线性代数,数学分析,离散数学等主题。 从任务中,学习学生的推理是当务之急。 该委员会还对他们学习的地方,在这所学校上学前的经历(例如科学活动)以及如何将其直接应用于计算机视觉领域感兴趣。

共有78名学生参加了全日制选拔,而有24个全日制名额,竞赛是每个名额3名学生。 您可以在下表中查看有关参与者的统计信息以及全职和兼职形式的参加者之间的视觉差异:



他们做了两个星期的工作?


理论和实践方面的学生都熟悉计算机视觉的主要任务:图像分类,物体检测及其伴奏。 通常,每个主题的讲授内容都包括对经典方法的历史考察,该经典方法用于解决计算机视觉问题,而现代方法则用于使用机器学习和神经网络解决问题。 该理论之后是一种实践,即学生在下载流行的神经网络模型之后,使用OpenCV库的DNC模块将其启动,从而创建用户应用程序。

所有讲座的介绍都发布在Github的公共资源库中,以便学生可以随时打开并查看必要的信息,包括放学后。 可以在Gitter现场或通过聊天与讲师,实践老师和英特尔工程师进行聊天。 项目周的时间也证明是成功的:从周三开始,这使我们得以度过周末没有讲座的时间,从而改善了团队决策。 最负责任的参与者在英特尔办公室度过了星期六的一半时间,当天他们因计划外的旅行而受到鼓舞。

如何保护项目?


每个团队有10分钟的时间来谈论他们在项目中所做的事情以及他们来到了哪里。 在这段时间之后,开始了5分钟,在那期间,公司的工程师向他们询问了问题,并给出了很少的建议,这些建议将有助于他们改善项目或防止将来出错。 每个人都以演讲者的身份进行了自我介绍,展示了他对计算机视觉的了解,并确认了他对项目创建的贡献,这有助于我们考虑并得出关于学校中每个参与者的结论。 辩护进行了3个小时,但我们照顾了这些家伙,并通过短暂的喝咖啡休息时间解决了这种情况,让他们可以喘口气,与领先的英特尔专家讨论问题。

最终,我们分配了一个第一名,两个第二名和三个第三名。 之所以很难选择,是因为每个团队,每个项目都有自己的风格,并且以演示文稿的独创性而著称。


全职简历营,项目保护,下诺夫哥罗德的英特尔办事处

提出的项目


智能手套




使用OpenCV将探测器和跟踪器用于空间视觉导航。 该团队还增加了使用两个摄像头确定深度的功能。 Microsoft Speech API用作管理界面。

受体




检测食物并选择完成菜的食谱,包括找到的食材。 伙计们不怕这项任务,他们花了一周的时间自己标记了足够数量的图像,使用TensorFlow对象检测API训练了检测器,并添加了查找配方的逻辑。 简单又有品位!

编辑器2.0




项目参与者使用了一组神经网络(面部搜索,通过关键点对面部图像进行归一化,面部图像描述符的计算)来识别面部,这是在存在特定人物的长视频中搜索片段的任务的一部分。 所开发的系统可以用作视频编辑的帮助系统,从而使人们不必亲自观看视频来寻找必要的片段。 利用OpenVINO模型库中的神经网络,该团队设法实现了很高的应用速度:在配备Intel Core i5处理器的笔记本电脑上,视频处理速度为每秒58帧。

匿名器




在人的脸上画眼镜和面具。 为了检测面部和关键点,使用了MTCNN网络。

无名氏




关于隐藏人格的另一项有趣的工作。 这个团队介绍了几种面部失真选项:模糊和像素化。 在一个星期内,这些家伙不仅弄清楚了任务,而且还为特定的人提供了匿名模式(具有面部识别功能)。

热身


“热身”项目的团队解决了为头倾斜运动创建运动助手的问题。 即使该应用程序的最终应用仍然存在争议,我们仍进行了广泛的研究,比较了各种面部检测算法:Haar级联,来自TensorFlow的网络,OpenCV和OpenVINO。 不仅在身体上,而且在精神上都热身!

下800




学校所在的下诺夫哥罗德(Nizhny Novgorod)在2年内将迎来800岁的历史,这意味着有足够的时间来实施一个有趣的项目。 我们建议这些家伙考虑创建指南的任务,该指南可以提供有关对象在图像中表示的内容以及从建筑物外立面图像中知道的有关事实的信息。 我们认为,此任务是最困难的任务之一,因为它与经典计算机视觉有关,但是该团队却取得了不错的成绩。

石头,剪刀,纸


尽管执行设计工作有严格的时间限制,但该团队也不害怕进行实验来训练自己的神经网络,以对著名游戏中的手部位置进行分类。

参加者评论


我们要求不同课程的学生分享他们对暑期学校的印象:

最近,我很幸运在Intel Computer Vision夏令营接受了培训,这是一次很棒的经历。 我们在CV,软件安装,调试领域获得了许多新知识和技能,还沉浸在工作环境中,面临实际问题,与学校的同事和老师讨论了可能的解决方案,这是一个神话,程序员的工作完全是与计算机通信。 但是,从字面上来看并非如此。 我们的创造性工作离不开与人的交流。 通过交流,可以获得独特的知识。 我最喜欢这所学校的这一部分。 但是,有一个负数...毕业后我想继续! 除了有关DL的理论知识和具有CV的实践技能外,我还了解了应该特别注意哪些数学领域,应该研究哪些技术。 英特尔工程师和研究人员的奉献精神,敬业精神和对工作的热爱影响了我对IT方向的选择。 为此,我要感谢学校的所有组织者。
克里斯蒂娜(Christina),1年,HSE

在这么短的时间内,学校能够提供有关计算机视觉的最大信息和实践。 尽管讲座是为基础知识而设计的,但讲座中包含许多技术资料,我想了解这些资料并花费更多时间进行学习。 学校的导师和讲师随时回答了所有问题,并与学生交谈。 好吧,在最终项目的实施过程中,我不得不投入开发现成应用程序的丛林,并且遇到了学习时并不总是会遇到的困难。 我们的团队最终提出了使用计算机玩“剪刀石头布”游戏的应用程序。 我们训练了模型,识别了网络摄像头上的图形,编写了逻辑,并基于opencv框架创建了一个界面。 这所学校提供了思考的食粮,并为进一步学习和发展提供了载体。 我很高兴参加。
谢尔盖(Sergey),3年,联合国

这所学校没有达到我的期望。 讲座由来自英特尔开发人员的经验丰富的人员主持。 与讲师的交流总是有趣而有用的,导师反应灵敏,随时准备提供帮助,讲座听得很愉快,主题很相关且内容丰富。 但是我已经知道了一些东西,而那些我不知道的东西并没有得到实践的支持,因此我没有完全理解和研究真正的好材料。 是的,大多数信息仅供参考,以便以后我可以在家中试用或仅凭想象来做,但我仍然想在经验丰富的老师的指导下自行实施一些现有算法,他们可以提供实用建议或帮助它不起作用。 结果,实践中使用了现成的解决方案,并且有人可能会说,该代码以前是为我们编写的,只需要对其稍加修改即可。 这些项目是最简单的,并且,如果您尝试以某种方式使任务复杂化,那么您就没有足够的时间将其实现为或多或少稳定的状态,就像我们遇到的那样。
通常,整个学校在开发人员看来都不太认真,这只是实践部分的错。 我认为有必要增加开办学校的时间,使练习的内容复杂化,以便您可以并且应该自己写点东西,一些真正复杂和必要的事情,而不要使用已完成的部分,使练习在增加复杂性,竞争性主题方面更加顺畅在早期就分发项目,以便可以将讲座和实践中的材料立即用于他们的项目中,从而有更多的实施时间。 然后,花在学校上的时间对于初学者来说将是一个很好的体验。
德米特里,一年制硕士课程,NSTU

英特尔的暑期学校是在这个暑假里做自己喜欢的事的绝好机会。 英特尔讲师与计算机视觉领域的编程相关的事实并未举办讲座,尽管有时有时很困难,但我还是希望从整个过程中获得最大的收获。 每天都过得很快,安静而富有成果。 实施自己的项目的机会使我能够与出色的策展人和其他学校参与者组成团队。 这两个星期可以简单地描述为有趣而短暂。
伊丽莎白,2年,UNN

在秋季(10月至11月),您将找到Delta教育计划,有关信息,您可以从我们的VKontakte组中找到相关信息。 敬请期待!

Source: https://habr.com/ru/post/zh-CN464579/


All Articles