التعرف على دبابات في دفق الفيديو باستخدام أساليب التعلم الآلي (+2 أشرطة الفيديو على منصات Elbrus و Baikal)


في عملية أنشطتنا ، نواجه يوميًا مشكلة تحديد أولويات التنمية. نظرًا للديناميات العالية لتطور صناعة تكنولوجيا المعلومات ، والطلب المتزايد باستمرار من جانب الأعمال والدولة على التكنولوجيات الجديدة ، في كل مرة ، وتحديد متجه التنمية واستثمار مواردنا ومواردنا في الإمكانات العلمية لشركتنا ، نتأكد من أن جميع أبحاثنا ومشروعاتنا أساسية ومتعددة التخصصات.


لذلك ، بتطوير تقنيتنا الرئيسية - إطار التعرف على البيانات HIEROGLYPH ، فإننا نهتم بتحسين جودة التعرف على المستندات (خط أعمالنا الرئيسي) وإمكانية تطبيق التكنولوجيا لحل مشاكل التعرف ذات الصلة. في مقال اليوم ، سنخبر كيف ، استنادًا إلى محرك التعرف (المستندات) ، جعلنا نتعرف على كائنات أكبر أهمية واستراتيجية في دفق الفيديو.


بيان المشكلة


باستخدام الخبرة الحالية ، قم ببناء نظام التعرف على الخزانات الذي يسمح لك بتصنيف الكائن ، وكذلك تحديد المعلمات الهندسية الأساسية (الاتجاه والمسافة) في ظروف سيئة التحكم دون استخدام معدات متخصصة.


قرار


كخوارزمية رئيسية لحل المشكلة ، اخترنا نهج التعلم الآلي الإحصائي. لكن إحدى المشكلات الرئيسية للتعلم الآلي هي الحاجة إلى كمية كافية من بيانات التعلم. من الواضح أن الصور العينية التي تم الحصول عليها من المشاهد الحقيقية التي تحتوي على الأشياء التي نحتاجها لا يمكن الوصول إليها. لذلك ، تقرر اللجوء إلى توليد البيانات اللازمة للتدريب ، نظرًا لأن لدينا الكثير من الخبرة في هذا المكان . ومع ذلك ، بدا من غير الطبيعي تجميع البيانات لهذه المهمة تمامًا ، لذلك تم إعداد تخطيط خاص لنمذجة المشاهد الحقيقية. يتم تثبيت كائنات مختلفة على غرار الريف على التخطيط: غطاء المناظر الطبيعية المميزة ، الشجيرات ، الأشجار ، الحواجز ، إلخ. تم التقاط الصور باستخدام كاميرا رقمية صغيرة الشكل. في عملية التقاط الصور ، تغيرت خلفية المشهد بشكل كبير لضمان استقرار أكبر للخوارزميات للتغيرات في الخلفية.


صورة


تم استخدام أربعة نماذج من دبابات القتال كهدف: T-90 (روسيا) ، M1A2 أبرامز (الولايات المتحدة الأمريكية) ، T-14 (روسيا) ، Merkava III (إسرائيل). كانت الكائنات موجودة في مواضع مختلفة من المضلع ، وبالتالي توسيع قائمة الزوايا المرئية المقبولة للكائن. لعبت دورا هاما من قبل الحواجز الهندسية والأشجار والشجيرات وغيرها من عناصر المناظر الطبيعية.


صورة


وهكذا ، في غضون يومين قمنا بتجميع مجموعة كافية للتدريب والتقييم اللاحق لجودة الخوارزمية (عدة عشرات الآلاف من الصور).


قرروا تقسيم التعرّف مباشرة إلى جزأين: توطين الكائنات وتصنيف الكائن. تم إجراء التعريب باستخدام المصنف المدرب فيولا وجونز (بعد كل شيء ، فإن الخزان عبارة عن جسم صلب طبيعي ، ليس أسوأ من الوجه ، وبالتالي فإن طريقة فيولا وجونز "تعميما مع التفاصيل" تقوم بترجمة الكائن الهدف بسرعة). لكننا تعهدنا بتصنيف وتعريف الزاوية للشبكة العصبية التلافيفية - في هذه المهمة من المهم بالنسبة لنا أن يختار الكاشف بنجاح تلك الميزات التي ، على سبيل المثال ، تميز T-90 عن Merkava. نتيجة لذلك ، كان من الممكن بناء تركيبة فعالة للخوارزميات التي نجحت في حل مشكلة توطين وتصنيف الكائنات من نفس النوع.


صورة


بعد ذلك ، أطلقنا البرنامج الناتج على جميع الأنظمة الأساسية التي لدينا (Intel و ARM و Elbrus و Baikal و COMDIV) ، خوارزميات محسوبة من الناحية الحسابية لتحسين الأداء (لقد كتبنا بالفعل عن هذا في مقالاتنا ، على سبيل المثال ، هنا https: // habr .com / ru / company / smartengines / blog / 438948 / أو https://habr.com/en/company/smartengines/blog/351134/ ) وحققت تشغيلًا مستقرًا للبرنامج على الجهاز في الوقت الفعلي.




نتيجة لجميع الإجراءات الموصوفة ، حصلنا على منتج برمجي متكامل يحتوي على خصائص تكتيكية وفنية كبيرة.


قارئ الدبابات الذكية


لذلك ، نقدم لك تطويرنا الجديد - برنامج للتعرف على صور الخزانات في دفق الفيديو Smart Tank Reader ، والذي:



  • يحل مشكلة "الصديق أو العدو" لمجموعة معينة من الأشياء في الوقت الفعلي ؛
  • يحدد المؤشرات الهندسية (المسافة إلى الكائن ، الاتجاه المفضل للكائن) ؛
  • يعمل في ظروف الطقس غير المنضبط ، وكذلك في حالة التداخل الجزئي للكائن من قبل كائنات غريبة ؛
  • تشغيل مستقل بالكامل على الجهاز المستهدف ، بما في ذلك في حالة عدم وجود اتصالات لاسلكية ؛
  • قائمة بنيات المعالج المدعومة: Elbrus ، و Baikal ، و COMDIV ، وكذلك x86 ، x86_64 ، ARM ؛
  • قائمة بأنظمة التشغيل المدعومة: Elbrus OS ، AstraLinux OS ، Atlix OS ، وكذلك MS Windows ، macOS ، توزيعات Linux المختلفة التي تدعم gcc 4.8 ، Android ، iOS ؛
  • التنمية المحلية تماما.

عادةً ، في الختام لمقالاتنا حول Habré ، نعطي رابطًا للسوق ، حيث يمكن لأي شخص يريد استخدام هواتفه المحمولة تنزيل نسخة تجريبية من التطبيق من أجل تقييم أداء التكنولوجيا فعليًا. هذه المرة ، مع الأخذ في الاعتبار تفاصيل التطبيق الناتج ، نتمنى لجميع قرائنا ألا يواجهوا مشكلة تحديد ما إذا كانت الدبابة تنتمي إلى جانب معين بسرعة.

Source: https://habr.com/ru/post/ar446176/


All Articles