我们还原对象的详细几何形状,以进行更准确的分类验证

在处理搜索质量问题时,迟早要面对视觉产品验证的任务。 我们忽略了普通分类器将要处理的简单任务,只关注需要或多或少准确的对象几何的情况:



假设您只需要选择某些对象的好照片,以便以后在电子商务中使用。 好的,我们的意思是没有主要细节的照片,没有不必要的细节。

为什么需要这个?


该产品的任何非标准图像都一定会引起注意。 但是潜在买家的反应既可以是正面的,也可以是负面的。 初步验证的任务是减少(最好是大幅减少)负面情况的可能性。

以下是测试商店类别之一的样式的“差异”



不用太复杂,如果T恤在照片中有点丢失,或者如果您考虑的细节对于您来说并不是完全必要的,则很可能会出错(或已经出错)。

因此,可以非常简单地提出初步验证的策略之一:具有优势产品的照片将获胜。 案件不大,就要给他们胜利。



早期结果看起来还不错,这使我们能够大大简化和自动化验证过程:



有什么不是边界框法呢?


主要问题是结果的准确性。 您知道,复杂的物体,非标准的照片,真实的生活。 因此,如果您有边界框-您仍然没有足够的信息。



该结论有些令人沮丧,因为它立即拒绝了行之有效的解决方案(或使解决方案变得更加困难)。 例如,使用神经网络获取任何精确的几何结构需要大量资源来准备训练集,而又不能保证必要的准确性。



但是拥有或多或少的精确几何形状,可以使用更复杂的分析和验证逻辑。 是的,可以在那里播放,也可以播放视频(选择必要的片段,自动裁剪等)



解决方案


由于足够多的限制和简化,当前的解决方案不能被称为通用解决方案。

简化1:对比


简化方法之一可以表示为:照片中的对象始终是对比的。 找到对比对象然后执行扫描(自适应,动态步长等)并不难:



自然,如有必要,可以增加对比度,使解决方案更稳定



顺便说一下,在上面的示例中,实现了对植入头发的搜索。 一个非常奇怪的任务出现在stackoverflow上,并在一个晚上成功“选定”。

简化二:只有一个对象是主要对象


在这种情况下,极少数具有明显设计决策的产品会受到影响,但其他情况却很容易解决:



困难案件


在研究了一段时间之后,我可以自信地说所有案例都是以自己的方式复杂的。 但是,动态场景或距离变化的场景会带来最大的问题。

跳舞




滑雪者




可选的:
奇数4K Mask RCNN COCO
YOLOv2 vs YOLOv3 vs Mask RCNN vs Deeplab Xception
电报: RobotsCanSee
Instagram的: RobotsCanSee

Source: https://habr.com/ru/post/zh-CN429540/


All Articles