نقوم باستعادة الشكل الهندسي المفصل للكائنات من أجل التحقق من دقة تشكيلة أكثر دقة

عند التعامل مع مشكلات جودة البحث ، علينا عاجلاً أم آجلاً أن نتعامل مع مهمة التحقق من صحة المنتج المرئي. نحذف المهام البسيطة التي سيتعامل معها المصنف العادي ، مع التركيز على الحالات التي تتطلب هندسة كائن أكثر أو أقل دقة:



افترض أنك تحتاج إلى تحديد صور جيدة فقط لكائنات معينة لاستخدامها لاحقًا في التجارة الإلكترونية. نعني بالخير الصور بدون تفاصيل غير ضرورية مع موضوع رئيسي مهيمن.

لماذا هذا مطلوب؟


أي صورة غير قياسية للمنتج ستجذب الانتباه بالتأكيد. لكن رد فعل المشتري المحتمل يمكن أن يكون إيجابيا وسلبيا. تتمثل مهمة التحقق الأولي في تقليل احتمالية السيناريو السلبي (يفضل بشكل كبير).

في ما يلي "تناقض" في الأنماط لإحدى فئات متجر الاختبار



بدون مزيد من التعقيد ، إذا كان القميص مفقودًا قليلاً في الصورة ، أو إذا كنت تفكر في تفاصيل ليست ضرورية تمامًا بالنسبة لك ، فمن المحتمل جدًا أن يحدث خطأ (أو حدث بالفعل).

وبالتالي ، يمكن صياغة واحدة من استراتيجيات التحقق الأولي بكل بساطة: فوز الصور مع المنتجات المهيمنة. القضية صغيرة ، من الضروري منحهم النصر.



بدت النتائج المبكرة جيدة جدًا وسمحت لنا بتبسيط وأتمتة التحقق بشكل ملحوظ:



ما هو نهج الصندوق المحيط؟


المشكلة الرئيسية هي دقة النتائج. الأشياء المعقدة ، والصور غير القياسية ، والحياة الواقعية ، كما تعلم. وبالتالي ، إذا كان لديك مربع محيط - فلا يزال لديك معلومات كافية.



الاستنتاج مزعج إلى حد ما ، لأنه يرفض على الفور الحلول المجربة والعمل الجيد (أو يجعلها أكثر صعوبة). على سبيل المثال ، يتطلب استخدام الشبكات العصبية للحصول على أي هندسة دقيقة الكثير من الموارد لإعداد مجموعة تدريب ، دون ضمان الدقة اللازمة.



ولكن مع وجود هندسة أكثر أو أقل دقة ، يمكن للمرء استخدام منطق أكثر تعقيدًا للتحليل والتحقق من الصحة. نعم ، ما يمكن أن يكون هناك ، يمكنك أيضًا التلويح بالفيديو (اختيار المقطع الضروري ، الاقتصاص التلقائي ، إلخ.)



الحل


لا يمكن تسمية الحل الحالي عالميًا نظرًا لعدد كبير بما فيه الكفاية من القيود والتبسيط.

التبسيط رقم 1: التباين


يمكن صياغة أحد التبسيطات على النحو التالي: سيكون الكائن في الصورة متباينًا دائمًا. ليس من الصعب العثور على كائن تباين ، ثم إجراء فحص (تكيفي ، مع خطوة ديناميكية ، وما إلى ذلك):



بطبيعة الحال ، إذا لزم الأمر ، يمكن زيادة التباين ، مما يجعل الحل أكثر استقرارًا



بالمناسبة ، في المثال أعلاه ، يتم تنفيذ البحث عن الشعر المزروع. مهمة غريبة جدًا ظهرت على تدفق المكدس وتم "اختيارها" بنجاح في إحدى الليالي.

التبسيط رقم 2: يجب أن يكون عنصر واحد فقط هو المسيطر


في هذه الحالة ، يعاني عدد قليل جدًا من المنتجات ذات قرارات التصميم الواضحة ، ولكن يتم التعامل مع الحالات الأخرى بسهولة تامة:



الحالات الصعبة


بعد دراسة هذا الموضوع لبعض الوقت ، يمكنني أن أقول بثقة أن جميع الحالات معقدة بطريقتهم الخاصة. ومع ذلك ، فإن المشاهد الديناميكية أو المشاهد ذات المسافات المتباينة تخلق أكبر المشاكل.

الرقص




متزلج




اختياري:
قناع الشذوذ 4K RCNN COCO
YOLOv2 مقابل YOLOv3 مقابل قناع RCNN مقابل Deeplab Xception
برقية: RobotsCanSee
انستقرام : RobotsCanSee

Source: https://habr.com/ru/post/ar429540/


All Articles