رؤية الماكينة (الراديو) عبر الجدران

صورة

على اليسار ، يصافح شخصان أحدهما خلف الحائط من الكاميرا. على اليمين ، يرمي رجل في الظلام كائنًا إلى الشخص المتصل. أدناه هو نموذج الهيكل العظمي ولدت وتوقع الإجراءات.

تم بالفعل رؤية الرؤية الإذاعية لفريق CSAIL (علوم الحاسوب والذكاء الاصطناعي) على Habré ( مرة واحدة ومرتين ) ، واليوم هناك بعض التفاصيل الجديدة.

تستخدم الخوارزمية موجات الراديو بدلاً من الضوء المرئي لتحديد ما يفعله الأشخاص دون إظهار شكلهم.

رؤية الآلة لديها سجل حافل بالإعجاب. لديها قدرة خارقة على التعرف على الأشخاص والوجوه والأشياء. يمكن أن يتعرف حتى على أنواع مختلفة من الإجراءات ، على الرغم من أنها ليست كذلك مع البشر.

لكن أدائها محدود. تكون رؤية الماكينة صعبة بشكل خاص عندما يكون الأشخاص أو الوجوه أو الأشياء مغلقة جزئيًا. وعندما ينخفض ​​مستوى الضوء إلى 0 ، فإنهم ، مثلهم مثل الناس ، يكونون عمياء عملياً.

ولكن هناك جزء آخر من الطيف الكهرومغناطيسي غير محدود للغاية. موجات الراديو تملأ عالمنا ، سواء كان ليلا أو نهارا. أنها تمر بسهولة من خلال الجدران ، وينتقل وينعكس في الهيئات البشرية. بالفعل ، طور الباحثون طرقًا مختلفة لاستخدام إشارات راديو Wi-Fi لرؤية خلف الأبواب المغلقة.

لكن أنظمة الرؤية الراديوية هذه لها بعض العيوب. دقة وضوح منخفضة ، والصور مزعجة ومليئة بالأفكار المذهلة ، مما يجعل من الصعب فهم ما يحدث.

بهذا المعنى ، فإن صور الراديو والصور في الضوء المرئي لها مزاياها وعيوبها الإضافية. وهذا يزيد من احتمالية استخدام مواطن القوة للتغلب على أوجه القصور في الآخر.

قابل تيانهونغ لي وزملاؤه في معهد ماساتشوستس للتكنولوجيا ، الذين وجدوا طريقة لتعليم نظام الراديو للتعرف على تصرفات الناس من خلال تعليمه باستخدام الصور في الضوء المرئي. يتيح لك نظام الرؤية الراديوية الجديد رؤية ما يفعله الأشخاص في مجموعة واسعة من المواقف عندما يكون التصور في الضوء المرئي مستحيلًا. قال لي وشركاه: "إننا نقدم نموذجًا للشبكة العصبية يمكنه اكتشاف الأعمال البشرية من خلال الجدران والانسداد ، وكذلك في ظروف الإضاءة السيئة ".

صورة

تردد حرارة الراديو و صورة RGB المسجلة بالتوازي.

يستخدم الفريق خدعة صعبة. الفكرة الرئيسية هي تسجيل صور فيديو لنفس المشهد باستخدام الضوء المرئي وموجات الراديو. أنظمة رؤية الماكينة قادرة بالفعل على التعرف على الإجراءات البشرية من الصور في الضوء المرئي. لذلك ، فإن الخطوة التالية هي ربط هذه الصور بصور الراديو لنفس المشهد.

صورة

RF العمل العمارة. يحدد RF-Action الأنشطة البشرية بواسطة إشارة لاسلكية. يسترجع "الهيكل العظمي ثلاثي الأبعاد" لكل شخص من التدفق الخام للإشارة اللاسلكية (المربع الأصفر). ثم ، يتم الكشف عن الإجراءات من تسلسل "الهياكل العظمية" المستخرجة (الحقل الأخضر) والتعرف عليها. يمكن أن يقبل إطار اكتشاف العمل أيضًا هياكل عظمية ثلاثية الأبعاد تم إنشاؤها من البيانات المرئية كمدخلات (مستطيل أزرق) ، والذي يسمح لك بالتدريب على هياكل عظمية تم إنشاؤها بواسطة الترددات الراديوية ، وكذلك على قواعد البيانات الحالية مع الإجراءات المعترف بها.

ومع ذلك ، تكمن الصعوبة في التأكد من أن عملية التعلم تركز على الحركة البشرية ، وليس على أشياء أخرى ، مثل الخلفية. لذلك ، يقدم Lee والفريق مرحلة متوسطة يولِّد فيها الجهاز نماذج ثلاثية الأبعاد من الأشكال التي تعيد إنتاج تصرفات الأشخاص.

وقال لي والفريق: "من خلال ترجمة البيانات إلى تمثيل وسيط يعتمد على هيكل عظمي ، يمكن أن يتعلم نموذجنا من مجموعات البيانات الخاصة بالتردد المرئي والرادي ، ويسمح لكلتا المهمتين بمساعدة بعضهما البعض ".

وبالتالي ، يتعلم النظام التعرف على الإجراءات في الضوء المرئي ، ثم يتعرف على نفس الإجراءات التي تحدث في الظلام أو خلف الجدران باستخدام موجات الراديو. يقول الباحثون "لقد أظهرنا أن نموذجنا يحقق دقة مماثلة لأنظمة التعرف على الرؤية استنادًا إلى الرؤية في السيناريوهات المرئية ، ويواصل العمل بدقة عندما لا يكون الناس مرئيين".

هذا عمل مثير للاهتمام وله إمكانات كبيرة. يكون التطبيق الواضح في السيناريوهات عندما تكون الصور في الضوء المرئي مستحيلة - في ظروف الإضاءة المنخفضة وخلف الأبواب المغلقة.

ولكن هناك حالات أخرى. واحدة من المشاكل مع الصور المرئية هي أن الناس يمكن التعرف عليهم ، مما يسبب مشاكل الخصوصية.

لكن نظام الراديو لا يملك القدرة على التعرف على الوجوه. تحديد الإجراءات دون التعرف على الوجوه لا يثير نفس المخاوف المتعلقة بالسرية. يقول لي أند كو: "يمكن أن يجلب التكنولوجيا إلى منازل الناس ويدمجها في أنظمة المنزل الذكي ". يمكن استخدام ذلك ، على سبيل المثال ، لمراقبة منزل شخص مسن وإخطار الخدمات ذات الصلة بالسقوط. وهذا سيحدث دون الكثير من المخاطر على الخصوصية.

هذا يتجاوز قدرات النظم الحديثة القائمة على الرؤية.

النتائج


نتيجة العمل في سيناريوهات مختلفة. مشاهد مرئية:





تداخل جزئي أو كامل في مجال الرؤية وضعف الإضاءة. تظهر الهياكل العظمية في شكل إسقاطات ثنائية الأبعاد للنموذج ثلاثي الأبعاد الذي تم إنشاؤه:









صورة

حول ITELMA
نحن شركة كبيرة لصناعة السيارات . توظف الشركة حوالي 2500 موظف ، من بينهم 650 مهندسا.

ربما نكون أقوى مركز للكفاءة في روسيا لتطوير إلكترونيات السيارات في روسيا. الآن نحن ننمو بنشاط وفتحنا العديد من الوظائف الشاغرة (حوالي 30 ، بما في ذلك في المناطق) ، مثل مهندس البرمجيات ، مهندس التصميم ، مهندس التطوير الرئيسي (مبرمج DSP) ، إلخ.

لدينا العديد من التحديات المثيرة للاهتمام من شركات صناعة السيارات والمخاوف المتعلقة بقيادة الصناعة. إذا كنت ترغب في النمو كفريق متخصص وتعلم من الأفضل ، سنكون سعداء برؤيتك في فريقنا. نحن مستعدون أيضًا لتبادل الخبرات ، أهم شيء يحدث في صناعة السيارات. اسألنا أي أسئلة ، وسوف نجيب ، وسوف نناقش.

اقرأ المزيد من المقالات المفيدة:

Source: https://habr.com/ru/post/ar477642/


All Articles