4K视频中的快速轮廓检测:颜色和复杂形状

在上一部分“快速有效地训练视频集”中,我们讨论了将神经网络用于与稀有,异常或简单复杂对象相关的任何任务的复杂性。 请务必查看示例,它们是值得的。


事实证明,经典的计算机视觉算法可以极大地帮助您获得高质量的训练集。 当然,这种方法并不适用于所有需要了解的情况。

有什么困难?


前一部分所示,对集合进行详细的手动标记是一个非常耗时的过程,并且坦率地说,对于任何理智的人来说,通常都不是可选项。 自动标记,尤其是涉及轮廓时,看起来更有趣,但是如何快速而准确地获取感兴趣的轮廓呢?

会员功能


也许值得从会员功能入手。 假设我们感兴趣的对象的特征是明亮的颜色,此外,该颜色对于特定场景中的对象是唯一的:


考虑到方法的细节(即,需要易于“解析”这样的场景),很容易制定出选择示例以获取训练集的规则:将满足期望对象的颜色唯一性规则的场景将非常有用(请记住,在所有困难的情况下)您将不得不处理已使用生成的集成功训练的神经网络。

实际上,唯一性条件是必要的最低要求,因为颜色可以并且也应该在以下条件上进行处理:


色距


在这种情况下,使用颜色是整个方法中非常重要的一部分。 实际上,隶属度函数可以实现为具有设置的阈值的给定颜色的接近度的函数:



现有解决方案使用几种Delta E实现方式作为最准确的标准。 例如,LCH颜色空间(L * C * h)中的CIE94:



对于色差而言,阈值太大可能会“破坏”路径,从而捕获与所需对象无关的像素。 太小-仅选择所需对象的一部分。 在这方面,需要注意复杂的场景,例如:



照片中的鲸鱼仍然是肉眼可辨的(当然很难),但是轮廓线的建立不正确。 整个示例:


恢复电路


假设一切都很好用颜色,如何获得所需的轮廓? 这项任务并不简单,因为结果很可能很复杂,有空腔,次要元素等。 恢复单个对象轮廓的哪个选项正确?


照明很复杂,阴影,反射是三维世界不可或缺的一部分,等等。 我们使用一个更复杂的示例:


获得这种结果的算法如下:



  1. 源图像
  2. 扫描步骤选择(对性能至关重要)
  3. 水平扫描
  4. 垂直扫描和相交分析以查找孤立的“对象”
  5. 建立一个元像素阵列(以识别对象的形状和内部特征)并进行后处理(滤波,平滑等)
  6. 对象还原形状的“矢量化”

相交分析使定位独立的,不相关的区域变得容易。 通过打开扫描线显示模式,您可以轻松地看到方法本身以及扫描步骤对最终结果的影响。 注意带有边框的非常简单的技巧,可以显着改善您的印象:



可以使用以下示例轻松评估重建电路的精度:



期末考试


更多对象,更多轮廓,更好的精度,更好的头发和4K格式-如果您检查实施情况,那么可以欣赏歌曲和舞蹈。


直到下一次,其他同样有趣的细节。

其他结果





跟踪项目的发展


YouTube: RobotsCanSee
电报: RobotsCanSeeUs

Source: https://habr.com/ru/post/zh-CN473780/


All Articles