لقد تعلمت شبكة عصبية قام بتطويرها علماء روس تحديد العمر من الفيديو بدرجة عالية من الدقة



منشور علمي موثوق نشرت مجلة الفيزياء مقالاً يصف نتائج العمل على إنشاء شبكة عصبية تحدد عمر الشخص ونوع جنسه.

قام المطورون المعنيون بتنفيذ مشروعهم في المدرسة العليا للاقتصاد تحت قيادة Andrei Savchenko. اقترح الفريق طريقة جديدة لتحليل البيانات البشرية من الفيديو ، وهذه الطريقة هي أساس عمل الشبكة العصبية التي تنتمي إلى فئة التلافيف .

تتألف الطريقة نفسها من تحليل الفيديو حسب الإطار تلو الآخر ، مع التركيز على الإطارات الفردية للشخص. مزيد من التحليل يذهب في اتجاهين. الأول يسمح لك بتحديد متوسط ​​عمر الشخص ، والثاني - جنسه. كالعادة ، تم تدريب الشبكة العصبية في الأصل ، وتضم قاعدة الفيديو ، التي كانت بمثابة التدريب الرئيسي ، 1165 مقطع فيديو.

يشير المؤلفون إلى أن شبكتهم العصبية يمكنها تحديد عمر الشخص بدقة 71٪ ، والجنس - 88٪. يخطط المؤلفون لاستخدام تطويرهم لإنشاء تطبيق جوال لنظام Android.

الابتكار في التطوير هو أن الشبكة العصبية كانت تدرس كيفية التعامل مع الفيديو. بالنسبة للصور ، تمكنت الشبكات العصبية منذ فترة طويلة من تحديد عمر ونوع الشخص - ودقة الأنظمة في هذه الحالة عالية جدًا. ولكن إذا كنت بحاجة إلى استخدام الفيديو ، فالمهمة معقدة ، لأنه ليس من السهل اختيار إطار واضح مع شخص يمكن رؤية وجهه فيه بوضوح.

يستخدم المخطط القياسي تقديراً لعمر الشخص من 0 إلى 100 عام ، ثم يحلل المقياس العمري بأكمله ، مما يشير إلى احتمال أن يكون الشخص الموجود في الصورة يبلغ من العمر عدة سنوات بالضبط. على سبيل المثال ، فإن احتمال انتمائه إلى الفئة العمرية 25-30 سنة هو 10 ٪ ، 30-35 - 35 ٪ ، ويقول ، 50-55 سنة - 60 ٪.



يتم تنفيذ الخوارزمية بناءً على Pycharm IDE مع Python 3.6. ليست هناك حاجة إلى العديد من موارد هذه الشبكة العصبية - فقد أجريت الاختبارات على جهاز كمبيوتر سطح مكتب عادي مزود بمعالج Intel Core i5-2400 CPU وبطاقة رسومات NVIDIA GeForce GT 440 ونظام التشغيل Windows 64 بت. بالإضافة إلى ذلك ، تم اختبار النظام على جهاز محمول يعمل بنظام Android OS (إصدار Android) لا يشار مواصفات الجهاز المحمول).


المقصود تطبيق الروبوت واجهة المستخدم الرسومية

بالنسبة لتطبيقات الهاتف المحمول ، فإن عنصرها الرئيسي هو نافذة مع عرض فيديو (التقاط من الكاميرا). تقوم الشبكة العصبية بتحليل الإطارات الفردية وتحاول الإشارة إلى عمر الشخص ونوع جنسه.

وفقًا للمطورين ، فإن المشكلة الرئيسية في التعرف على الخصائص المختلفة للشخص ، بما في ذلك عمره ونوعه ، هي أن تدريب الشبكات العصبية التي تتخصص في هذه المهمة محدود للغاية. قواعد بيانات مقاطع الفيديو والصور صغيرة نسبيًا ، ومع ذلك يختلف جميع الأشخاص اختلافًا كبيرًا ، بما في ذلك ممثلون عن نفس الجنس والعمر.

ومن المثير للاهتمام ، أن إحدى قواعد البيانات التي تم على أساسها تدريب الشبكة العصبية من المقال هي أن جميع مقاطع الفيديو تم اقتطاعها من الأفلام الهندية. في المجموع ، كان هناك 322 فيديو مختلف مع 34512 لقطة في قاعدة البيانات. احتوى الفيديو على مشاهد تضم مئات الممثلين الهنود. للراحة ، تم تقسيمهم إلى 4 فئات عمرية: "الأطفال" ، "الشباب" ، "منتصف العمر" ، "كبار السن". بالنسبة للجدول الزمني ، فهو يتراوح من سنة واحدة إلى 12 سنة ، من 13 إلى 30 ، ومن 31 إلى 50 ، 50+.

يمكن للشبكات العصبية تحديد جنس الشخص وعمره ليس فقط من الصور الفوتوغرافية أو مقاطع الفيديو الخاصة بالشخص أو الجسم. على سبيل المثال ، تعلمت الشبكة العصبية التي أنشأتها Google و Verily ليس فقط التعرف على الخصائص المشار إليها ، ولكن أيضًا متوسط ​​نسبة السكر في الدم HbA1c و BMI وضغط الدم الانقباضي الشرياني SBP والضغط الانبساطي الشرياني DBP. ويشير النظام إلى ما إذا كان الشخص يدخن أم لا. وكل هذا - وفقا ل fundus.



لتدريب هذه الشبكة العصبية ، استخدم المطورون قاعدة بيانات الصور ، والتي تحتوي على حوالي 300000 صورة. المعلومات المقدمة من EyePACS و UK Biobank. وفقًا للأطباء ، يمكن أن يساعد النهج الجديد للتشخيص الأطباء في إجراء التشخيص بسرعة. الذكاء الاصطناعى لا يمكن تسريع فقط ، ولكن أيضا زيادة دقة التشخيص. يحتاج الأطباء ببساطة إلى هذه المساعدة ، نظرًا لأن الطبيب البشري غير قادر دائمًا على العمل بسرعة وكفاءة ، خاصة في نهاية يوم العمل. ونتيجة لذلك ، تعاني دقة التشخيص وصحة المسار المحدد للعلاج.

Source: https://habr.com/ru/post/ar434082/


All Articles