اكتشاف كفاف سريع في فيديو 4K: اللون والأشكال المعقدة

في الجزء السابق ، "مجموعات التدريب من الفيديو - بسرعة وكفاءة" ، تحدثنا عن مدى تعقيد استخدام الشبكات العصبية لأية مهمة مرتبطة بأشياء نادرة أو غير عادية أو ببساطة معقدة. تأكد من إلقاء نظرة على الأمثلة ، فهي تستحق العناء.


خوارزميات رؤية الكمبيوتر الكلاسيكية ، كما اتضح فيما بعد ، يمكن أن تساعد بشكل كبير في الحصول على مجموعات تدريب عالية الجودة. بطبيعة الحال ، هذا النهج لا ينطبق في جميع الحالات ، والتي من الضروري فهمها.

ما هي الصعوبة؟


كما هو موضح في الجزء السابق ، فإن وضع العلامات اليدوية المفصلة للمجموعات هو عملية تستغرق وقتًا كبيرًا ، وبصراحة ، لا يعد عمومًا خيارًا لأي شخص عاقل. تبدو العلامات التلقائية ، خاصة عندما يتعلق الأمر بالمناظير ، أكثر إثارة للاهتمام ، ولكن كيف تحصل على محيط الاهتمام بسرعة وبدقة؟

وظيفة العضوية


ربما يستحق الأمر بدء وظيفة العضوية. لنفترض أن الكائن الذي يهمنا يتميز بلون مشرق ، وهو علاوة على ذلك فريد بالنسبة للكائن في سياق مشهد معين:


بالنظر إلى تفاصيل النهج (أي الحاجة إلى مثل هذه المشاهد التي يسهل "تحليلها") ، من السهل جدًا صياغة قاعدة اختيار للحصول على أمثلة للحصول على مجموعة تدريب: المشاهد التي سيتم من خلالها تحقيق قاعدة تفرد اللون للكائن المرغوب (تذكر ، مع كل الحالات الصعبة سيكون عليك التعامل مع شبكة عصبية تم تدريبها بنجاح باستخدام المجموعة المولدة).

في الواقع ، تعتبر حالة التفرد الحد الأدنى الضروري ، نظرًا لأن اللون يمكن وينبغي أيضًا العمل عليه:


المسافة اللون


يعتبر العمل مع اللون ، في هذه الحالة ، جزءًا مهمًا جدًا من النهج بأكمله. في الواقع ، يمكن تنفيذ وظيفة العضوية كدالة بالقرب من لون معين مع قيمة عتبة محددة:



يستخدم الحل الحالي العديد من تطبيقات Delta E باعتبارها المعيار الأكثر دقة. على سبيل المثال ، CIE94 في مساحة اللون LCH (L * C * h):



عتبة كبيرة جدًا ، لمسافة اللون ، من المحتمل أن "تكسر" المسار ، وتلتقط وحدات البكسل غير المرتبطة بالكائن المرغوب. صغير جدًا - يختار جزءًا فقط من الكائن المطلوب. في هذا الصدد ، تتطلب المشاهد المعقدة الانتباه ، على سبيل المثال:



لا تزال الحوت الموجود في الصورة واضحة للعين (بصعوبة ، بالطبع) ، لكن المخطط التفصيلي تم بناؤه بالفعل بشكل غير صحيح. مثال كامل:


استعادة الدائرة


افترض أن كل شيء على ما يرام مع اللون ، وكيفية الحصول على المخطط المطلوب؟ المهمة ليست بسيطة ، لأن النتيجة من المحتمل أن تكون معقدة للغاية ، مع وجود تسوس ، وعناصر ثانوية ، إلخ. أي من خيارات كفاف المستعادة لكائن واحد هو الصحيح؟


الإضاءة معقدة ، والظلال ، وردود الفعل هي جزء لا يتجزأ من العالم ثلاثي الأبعاد ، إلخ. نستخدم مثالًا أكثر تعقيدًا:


الخوارزمية للحصول على مثل هذه النتيجة هي كما يلي:



  1. الصورة المصدر
  2. اختيار خطوة المسح (الأداء الحرج)
  3. المسح الأفقي
  4. المسح الرأسي وتحليل التقاطع للبحث عن "كائنات" معزولة
  5. بناء مجموعة من وحدات بكسل التعريف (لتحديد كل من الشكل والميزات الداخلية للكائن) والمعالجة اللاحقة (التصفية والتمهيد وما إلى ذلك)
  6. "تحويل" الشكل المستعاد للكائن

تحليل التقاطع يجعل من السهل توطين مناطق منفصلة غير ذات صلة. من خلال تشغيل وضع عرض خط المسح ، يمكنك بسهولة رؤية كل من النهج نفسه وتأثير خطوة المسح على النتيجة النهائية. انتبه إلى خدعة بسيطة للغاية ذات حدود تحسن بشكل كبير الانطباع الذي تصنعه:



من السهل تقييم دقة الدائرة التي أعيد بناؤها باستخدام المثال التالي:



الاختبار النهائي


المزيد من الكائنات ، والمزيد من المعالم ، ودقة أفضل ، والشعر وفي 4K - إذا قمت بفحص التنفيذ الخاص بك ، وذلك باستخدام الأغاني والرقصات.


حتى في المرة القادمة ، وغيرها من التفاصيل مثيرة للاهتمام على قدم المساواة.

نتائج أخرى





متابعة تطوير المشروع


يوتيوب: RobotsCanSee
Telegram: RobotsCanSeeUs

Source: https://habr.com/ru/post/ar473780/


All Articles