视频中的培训套件-快速高效

在几乎每次尝试使用神经网络解决实际问题的尝试中,任何(不是最琐碎的(或只是罕见的)对象)都可以轻松地产生很多问题。 显然,缺乏理智的训练集会使使用神经干方法的绝大多数情况变得复杂。

例如,如何处理一种稀有的蚱,,出于某种原因,识别其代表已成为一项非常重要的任务。


所有结果/示例均独立(快速)获得。

自定义对象


就像真实的任务一样,现实世界在颜色,形状,行为等方面绝大多数都是独特的,不寻常的,并且往往非常具体。


为了成功解决相应的问题,需要数据(在我们的例子中是训练集)。 由于并非每个人都在尝试构建“最正确的”自动驾驶仪或在照片中寻找微笑,因此创建必要的摄影机成为主要问题。

同意,为某些非常特定的着色样式找到现成的和高质量的布景的可能性趋于零:


顺便说一句,当涉及到彩绘的身体时,youtube算法似乎有点假。 至少返回的内容看起来有些争议。

常用的标记方式


好吧,假设手动标记看起来并不可怕-您不担心单调的工作或众包都适合结果的质量和成本。 但这是对的,只要它落在边界框上(使用示例说明的示例):


如果任务的细节要求找到确切的轮廓怎么办? Mask RCNN是一个很好的解决方案,但是需要高质量和准确的训练集。 如您所知,绘制轮廓并不是要标记的矩形,这样的工作将需要其他一些努力。

自动化方法


永恒的问题:“该怎么办?”。 答案同样不重要-自动化。 只要满足一些基本条件,计算机视觉的经典算法就可以实现可接受的结果。


实际上,由于施加了附加条件,因此不允许将这种方法用作主要解决方案。 但是,正确的标准算法可以使您快速获得高质量,多样化且易于扩展的集合。

如此高的质量,以至于所选区域中即使是通常的颜色变化也看起来几乎是现成的解决方案:


下次再详细了解该方法。

训练集示例


从视频生成训练集的方法很方便,因为最终结果仅包含“实时”和完全真实的示例,这些示例反映了现实世界的可变性和复杂性。 例如,嘴唇:



其他结果





跟踪项目的发展


YouTube: RobotsCanSee
电报: RobotsCanSeeUs

Source: https://habr.com/ru/post/zh-CN472520/


All Articles