掌握计算机视觉-8个基本步骤

您好读者。

对您来说,每个人都通过Face App尝试老化面膜的事实不再是新闻。 反过来,对于计算机视觉来说,还有比这更有趣的任务。 下面,我将介绍8个步骤,这些步骤将帮助您掌握计算机视觉的原理。

图片

在开始这些步骤之前,让我们了解您和我可以借助计算机视觉解决的任务 。 任务示例可能包括以下内容:


掌握计算机视觉所需的最低知识



现在让我们开始吧。

第1步-基本成像技术


此步骤是关于技术基础的。

观看约瑟夫·雷德蒙Joseph Redmon)撰写的 YouTube出色播放列表“计算机视觉的古老秘密”





阅读Richard Sheliski的书《计算机视觉:算法和应用程序》的第三章

图片

积累知识-尝试使用OpenCV 转换图像 。 该站点上有许多循序渐进的电子手册 ,通过它们您可以了解所有内容。

第2步-运动跟踪和光流分析


光流是通过相对于场景移动观察者或物体而获得的一系列物体图像。

参加本课程-Udacity的计算机视觉课程 ,尤其是第6课。
看看-YouTube列表上的第8个视频 ,以及关于光流和跟踪的讲座。


阅读-Sheliski教科书的 10.5和8.4节

图片

作为培训项目,请弄清楚如何使用OpenCV 跟踪视频帧中的对象。

第3步-基本细分


在计算机视觉中, 分段是将数字图像分为几个段(超像素)的过程。 分割的目的是简化和/或更改图像的呈现方式,以便于分析。

因此, 霍夫变换允许您查找圆和直线。

观看以下视频:





签出- 一个出色的项目,其类似任务对于自动驾驶电动汽车的计算机视觉极为重要。



步骤4-拟合


不同的数据需要特定的拟合方法和自己的算法。

观看视频:


阅读-Sheliski教科书的 4.3.2和5.1.1节

作为独立工作的任务,分析确定线在透视地平线上会聚的位置的坐标问题。

步骤5-合并从不同检查点获得的图像


查看YouTube播放列表


阅读求职信。

对于项目,您可以使用自己的数据。 例如,从不同侧面拍摄家具图片,然后在OpenCV中使用平面图像相册制作3D对象。

第6步-3D场景


能够从平面图像创建3D对象,您可以尝试创建三维现实。

拍摄- 立体视觉和跟踪课程

观看视频:




作为项目,请尝试在三维空间中 重建场景跟踪对象

步骤7-物体识别和图像分类


使用TensorFlow作为深度学习框架很方便。 这是最受欢迎的框架之一,因此您可以轻松找到足够的示例。 要开始使用TensorFlow中的图像,请阅读本教程

此外,使用链接,请考虑以下主题:


作为一个项目,在TensorFlow中创建一个神经网络,该神经网络根据图像确定汽车品牌品种

步骤8-现代深度学习


阅读- 斯坦福课程讲座

观看视频:




至此,我们在计算机视觉研究中的步骤告一段落。 希望您自己学到了一些新知识。 按照哈布雷(Habré)的习惯,我喜欢这个职位-加一个加号。 不要忘记与同事分享。 另外,如果您有什么可以分享的内容,请在评论中写。 有关Habré和电报频道Neuron (@neurondata)上有关机器学习和数据科学的更多信息。

所有的知识!

Source: https://habr.com/ru/post/zh-CN461365/


All Articles