برنامج التعرف على الصور للتعلم الذاتي من Disney Research



طور فريق من الباحثين من قسم بيتسبرغ لأبحاث ديزني نظامًا للرؤية الحاسوبية يستخدم بعض مبادئ الرؤية البشرية ( pdf ). على وجه الخصوص ، يحتوي على خوارزميات للتعلم الذاتي وقادر على تحسين التعرف على الكائنات بمرور الوقت.

مثل معظم أنظمة رؤية الكمبيوتر الأخرى ، فإن تطوير Disney Research يبني نموذجًا مفاهيميًا لكل كائن ، سواء كان طائرة أو موزع صابون. في هذه الحالة ، يتم استخدام خوارزمية مدربة تحلل الكثير من الصور الفوتوغرافية لكائن معين.

السمة المميزة لخوارزمية ديزني للأبحاث هي أنها تستخدم هذا النموذج لاحقًا للتعرف على الكائنات في الفيديو ، بينما تستخرج في نفس الوقت معلومات جديدة حول هذه الأشياء وتكملة النموذج المنصوص عليه أصلاً. يسمح لك هذا بالتعرف على الكائنات في نطاق أوسع ، حتى إذا كانت تبدو مختلفة عن العينات التي تم العثور عليها سابقًا.

توضح الرسوم التوضيحية (قابلة للنقر) نتيجة التعرف على الأنماط. في الصف العلوي توجد صور اختبار من قاعدة بيانات ImageNet ، والتي تم استخدامها لتدريب النموذج الأصلي. في الصف السفلي أمثلة على التعرف الصحيح على الكائنات من قبل برنامج IDE-LME. لاحظ الباحثون أن الأشياء المعترف بها في الصور تختلف اختلافًا كبيرًا في المظهر عن تلك المستخدمة لتدريب النظام. يقول ليونيد سيغال ، الزميل الرئيسي في Disney Research Pittsburgh: " تستمر عملية [التعلم الذاتي] ، إلى أجل غير مسمى ، طوال فترة نظام التعرف" . "هذا هو نظام التعلم الذاتي الذي يتطور باستمرار من خلال اكتساب الخبرة غير المنضبط ، مما يشكل نموذجًا كاملًا ومعقدًا بشكل متزايد للعالم."







يتوسع النموذج المفاهيمي لكل كائن تدريجياً ويتم تحسينه بينما يواجه النظام معلومات جديدة. من الناحية النظرية ، يمكن أن تؤدي هذه الطريقة إلى حقيقة أن العمل بدون إشراف ، سيعين النظام خصائص غير عادية بالنسبة إلى الكائن ، مما سيؤدي إلى أخطاء التعرف. لكن واضعي البرنامج يقولون أن مثل هذه المشكلة لم يتم ملاحظتها بعد.

بالإضافة إلى Sigal ، فإن مؤلفي العمل العلمي هم Alina Kuznetsova و Bodo Rosenhahn من جامعة Wilhelm Leibniz (هانوفر ، ألمانيا) ، وموظفة ديزني السابقة Sen Hwan Yu (تعمل الآن في المعهد الوطني للعلوم) والتكنولوجيا في أولسان (كوريا الجنوبية).

تم تقديم العمل العلمي في مؤتمر IEEE حول رؤية الكمبيوتر والتعرف على الأنماط في بوسطن (7-12 يونيو 2015).

Source: https://habr.com/ru/post/ar380363/


All Articles