في الجزء السابق ،
"مجموعات التدريب من الفيديو - بسرعة وكفاءة" ، تحدثنا عن مدى تعقيد استخدام الشبكات العصبية لأية مهمة مرتبطة بأشياء نادرة أو غير عادية أو ببساطة معقدة. تأكد من إلقاء نظرة على الأمثلة ، فهي تستحق العناء.
خوارزميات رؤية الكمبيوتر الكلاسيكية ، كما اتضح فيما بعد ، يمكن أن تساعد بشكل كبير في الحصول على مجموعات تدريب عالية الجودة. بطبيعة الحال ، هذا النهج لا ينطبق في جميع الحالات ، والتي من الضروري فهمها.
ما هي الصعوبة؟
كما هو موضح في
الجزء السابق ، فإن وضع العلامات اليدوية المفصلة للمجموعات هو عملية تستغرق وقتًا كبيرًا ، وبصراحة ، لا يعد عمومًا خيارًا لأي شخص عاقل. تبدو العلامات التلقائية ، خاصة عندما يتعلق الأمر بالمناظير ، أكثر إثارة للاهتمام ، ولكن كيف تحصل على محيط الاهتمام بسرعة وبدقة؟
وظيفة العضوية
ربما يستحق الأمر بدء وظيفة العضوية. لنفترض أن الكائن الذي يهمنا يتميز بلون مشرق ، وهو علاوة على ذلك فريد بالنسبة للكائن في سياق مشهد معين:
بالنظر إلى تفاصيل النهج (أي الحاجة إلى مثل هذه المشاهد التي يسهل "تحليلها") ، من السهل جدًا صياغة قاعدة اختيار للحصول على أمثلة للحصول على مجموعة تدريب: المشاهد التي سيتم من خلالها تحقيق قاعدة تفرد اللون للكائن المرغوب (تذكر ، مع كل الحالات الصعبة سيكون عليك التعامل مع شبكة عصبية تم تدريبها بنجاح باستخدام المجموعة المولدة).
في الواقع ، تعتبر حالة التفرد الحد الأدنى الضروري ، نظرًا لأن اللون يمكن وينبغي أيضًا العمل عليه:
المسافة اللون
يعتبر العمل مع اللون ، في هذه الحالة ، جزءًا مهمًا جدًا من النهج بأكمله. في الواقع ، يمكن تنفيذ وظيفة العضوية كدالة بالقرب من لون معين مع قيمة عتبة محددة:

يستخدم الحل الحالي العديد من تطبيقات
Delta E باعتبارها المعيار الأكثر دقة. على سبيل المثال ، CIE94 في مساحة اللون LCH (L * C * h):

عتبة كبيرة جدًا ، لمسافة اللون ، من المحتمل أن "تكسر" المسار ، وتلتقط وحدات البكسل غير المرتبطة بالكائن المرغوب. صغير جدًا - يختار جزءًا فقط من الكائن المطلوب. في هذا الصدد ، تتطلب المشاهد المعقدة الانتباه ، على سبيل المثال:

لا تزال الحوت الموجود في الصورة واضحة للعين (بصعوبة ، بالطبع) ، لكن المخطط التفصيلي تم بناؤه بالفعل بشكل غير صحيح. مثال كامل:
استعادة الدائرة
افترض أن كل شيء على ما يرام مع اللون ، وكيفية الحصول على المخطط المطلوب؟ المهمة ليست بسيطة ، لأن النتيجة من المحتمل أن تكون معقدة للغاية ، مع وجود تسوس ، وعناصر ثانوية ، إلخ. أي من خيارات كفاف المستعادة لكائن واحد هو الصحيح؟
الإضاءة معقدة ، والظلال ، وردود الفعل هي جزء لا يتجزأ من العالم ثلاثي الأبعاد ، إلخ. نستخدم مثالًا أكثر تعقيدًا:
الخوارزمية للحصول على مثل هذه النتيجة هي كما يلي:

- الصورة المصدر
- اختيار خطوة المسح (الأداء الحرج)
- المسح الأفقي
- المسح الرأسي وتحليل التقاطع للبحث عن "كائنات" معزولة
- بناء مجموعة من وحدات بكسل التعريف (لتحديد كل من الشكل والميزات الداخلية للكائن) والمعالجة اللاحقة (التصفية والتمهيد وما إلى ذلك)
- "تحويل" الشكل المستعاد للكائن
تحليل التقاطع يجعل من السهل توطين مناطق منفصلة غير ذات صلة. من خلال تشغيل وضع عرض خط المسح ، يمكنك بسهولة رؤية كل من النهج نفسه وتأثير خطوة المسح على النتيجة النهائية. انتبه إلى خدعة بسيطة للغاية ذات حدود تحسن بشكل كبير الانطباع الذي تصنعه:

من السهل تقييم دقة الدائرة التي أعيد بناؤها باستخدام المثال التالي:

الاختبار النهائي
المزيد من الكائنات ، والمزيد من المعالم ، ودقة أفضل ، والشعر وفي 4K - إذا قمت بفحص التنفيذ الخاص بك ، وذلك باستخدام الأغاني والرقصات.
حتى في المرة القادمة ، وغيرها من التفاصيل مثيرة للاهتمام على قدم المساواة.
نتائج أخرى
متابعة تطوير المشروع
يوتيوب:
RobotsCanSeeTelegram:
RobotsCanSeeUs