تتنبأ الشبكة العصبية بانطباع أول شخص عن وجهه


نتيجة معالجة صور جوليان أسانج وبينيدكت كومبرباتش مع شبكة عصبية للتنبؤ بالانطباع الأول للشخص. هناك نقص طفيف في الذكاء الذاتي وهيمنة الممثل مقارنة بالبطل الذي لعبه في فيلم "القوة الخامسة". خلاف ذلك ، تم نقل صورة Assange بشكل صحيح تمامًا. صورة: جامعة نوتردام ، جامعة هارفارد

إن دماغنا قادر على تكوين انطباع غريب عن وجهه بسرعة. في بضع ثوان ، يتم تحديد الخصائص الرئيسية للشخص: جاذبيته وذكائه وعمره وموثوقيته ومركزه الاجتماعي (هيمنته) واجتماعه ومستواه الأخلاقي. من الواضح أن هذا الانطباع غير دقيق ، وأحيانًا خاطئ تمامًا. الدقة المطلقة غير مطلوبة هنا. السرعة مهمة. هذه آلية اجتماعية ضرورية للغاية ، والتي بدونها يصعب البقاء في المجتمع ، وهي مهارة حيوية. لذلك ، فإن الانطباع الأول قوي ومهم للغاية. تغييره لاحقًا أمر صعب للغاية.

إذا تركنا جانباً التحيز الواضح للانطباع الأول ، فمن المهم تعليم أجهزة الكمبيوتر كيفية تقييم الوجوه بنفس الطريقة التي يقوم بها الآخرون. وقد بذلت هذه المحاولات مرارا وتكرارا. حاول الباحثون خوارزميًا تصنيف المشاعر المختلفة وفقًا لوجه الشخص ، بما في ذلك استخدام الشبكات العصبية . الأعمال المنشورة حول التحديد التلقائي لجاذبية الشخص ، بالإضافة إلى وجود روح الدعابة والخصائص الشخصية الأخرى للشخص باستخدام الشبكات العصبية.

كل هذه الدراسات هي جزء ضروري للغاية من العمل لخلق ذكاء اصطناعي للمستوى البشري. يجب أن يكون الذكاء الاصطناعي قادرًا على قراءة الوجوه ليس أسوأ من البشر ، وإجراء تقييمات ذاتية للوجوه ليست أسوأ من البشر.

الآن قامت مجموعة من الباحثين من جامعة نوتردام (الولايات المتحدة) وجامعة هارفارد (الولايات المتحدة الأمريكية) بإجراء دراسة جديدة تكمل التطورات العلمية في مجال علم النفس الاجتماعي. عملهم مكرس للتجميع التلقائي للانطباع الأول الذي ينشأ عن شخص من الآخرين. يتم إجراء التحليل بواسطة شبكة عصبية مدربة على عينات الصور.

وفقا لعلماء النفس، التي تتخصص في دراسة نظام التقييمات الاجتماعية لدى الناس ، عند تقييم شخص غريب لأول مرة في وجه الشخص ، هناك صفتان رئيسيتان: الموثوقية والهيمنة. وفقا لألكسندر تودوروف ، يمكن اشتقاق جميع الخصائص الأخرى من هاتين الخاصيتين الرئيسيتين. جمع علماء النفس منذ فترة طويلة مجموعة من الخصائص الأساسية التي تظهر هيمنة الشخص على الآخرين ، بما في ذلك ميل الرأس وإيماءات الحاجبين والفم.

قام علماء من جامعة نوتردام وجامعة هارفارد بتدريب شبكة عصبية على عينة من 6300 صورة فوتوغرافية من المعالم العامة المشروحة للوجه في البرية . تم التعليق على هذه الصور بواسطة مستخدمي منصة التعهيد الجماعي TestMyBrain.orgوفقًا لثلاث سمات اجتماعية: الهيمنة والموثوقية وذكاء الذكاء ، بالإضافة إلى سمة إضافية - العمر.

تم استخدام 6000 صورة للتدريب ، و 200 أخرى للضبط الدقيق والضبط الدقيق ، والأخيرة 100 لفحص الشبكة العصبية.


المصادفة المثالية تقريبًا لملفات إدوارد سنودن والممثل جوزيف جوردون ليفيت الذي يلعبه في فيلم سنودن. صورة: جامعة نوتردام ، جامعة هارفارد

لاحظ العلماء أنه وفقًا لسمات معدل الذكاء والعمر ، يمكنهم عمل تعليقات توضيحية بخصائص حقيقية وليست ذاتية. ولكن بعد ذلك ستتعلم الشبكة العصبية تحديد معدل الذكاء الحقيقي وعمر الشخص من خلال وجهه. كما ذكرنا أعلاه ، كانت المهمة مختلفة تمامًا ، لذلك ، تم تعيين الشبكات العصبية وفئات الذكاء والعمر أيضًا باستخدام التعهيد الجماعي.

يُظهر الرسم التوضيحي صورًا فردية من القاعدة التي تم استخدامها للتدريب. يتم اختيار العينات من بين أصحاب الخصائص الدنيا والمتوسطة والحد الأقصى في جميع الفئات. كما ترون ، فإن الأطفال الصغار يحصلون على أقل الدرجات في فئات الذكاء والهيمنة والعمر. شخص ذو وجه مصبوغ - أحد أدنى درجات الموثوقية.



توزيع المؤشرات في مجموعة بيانات التدريب قريب من التوزيع الطبيعي.



يوضح الجدول متوسط ​​تقييمات الصور في أربع فئات ، تم تجميعها وفقًا لنتائج تقييمات المستخدم. يشار إلى الحد الأدنى والحد الأقصى من التقييمات ، وكذلك متوسط ​​عدد التقييمات المقدمة. حصل كل شخص ، في المتوسط ​​، على 32 تقييمًا للهيمنة والموثوقية ، بالإضافة إلى 15 تقييمًا للعمر وذكاء الذكاء.



بعد التدريب ، أظهرت الشبكة العصبية تقييمًا دقيقًا إلى حد ما للأفراد ، على مقربة من نتائج تقييمات مستخدمي الموقع.



يأمل المؤلفون أن تكون شبكتهم العصبية مفيدة في تطوير برامج رؤية الكمبيوتر. يمكن لمثل هذا النظام تحليل دفق الفيديو في الوقت الحقيقي. على سبيل المثال ، لتظهر على الشاشة في شكل رسم بياني كيف يتغير الذكاء المدرك بشكل شخصي لشخص البرنامج التلفزيوني الرائد بمرور الوقت. أي كيف يبدو وجهه ذكيًا في نقاط معينة في الوقت المناسب. تخيل أن البرنامج سيعمل على تلخيص اللحظات الأكثر إثارة للاهتمام في النقل ، عندما بدا وجه مقدم العرض الأكثر غباء.



عند معالجة الفيديو ، تعالج الشبكة العصبية كل إطار على حدة.

يمكنك ابتكار تطبيقات أخرى لهذه التقنية. على سبيل المثال ، لاختيار الممثلين الذين ينقلون بدقة أكبر الانطباع الذاتي عن مظهر أبطالهم في الحياة الحقيقية ، كما هو موضح في الأمثلة المذكورة سابقًا مع جوليان أسانج وإدوارد سنودن.

على الأرجح ، ستجد مثل هذه الشبكة العصبية تطبيقًا في برامج النمو الشخصي: من خلال تغيير تعبير الوجه أمام الكاميرا ، سيتدرب الشخص على كيفية أن يصبح أكثر صلابة وذكية في عيون الآخرين - مراقبة تقييم وجهه بواسطة شبكة عصبية.

يمكن للمرء أن يتصور أن بعض الشركات ستبدأ في توظيف الموظفين على أساس نتائج التقييم الذاتي لوجوه المرشحين. أي أنه عند تدريب شبكة عصبية ، يختار المدير عدة عشرات من الأشخاص الذين يعجبهم من حيث معدل الذكاء والموثوقية ، ويجد البرنامج مرشحين بنفس الخصائص التي يحتاجها الرئيس بالضبط.

يحذر الباحثون فقط من أن دقة الشبكة العصبية تعتمد بشكل مباشر على جودة البيانات المصدر ، أي تصنيفات الأفراد. من المهم أن يتم إجراء هذا التقييم من قبل ممثلي الجمهور المستهدف. والحقيقة هي أن انطباع الشخص يعتمد بشكل كبير على شخصية الشخص الذي يعطي التصنيف: ثقافته وجنسيته. بشكل تقريبي ، لن يُنظر إلى الشخص الموثوق والحكيم جدًا في قبيلة الزولو على أنه الزعيم المهيمن في مجتمع الأرستقراطيين في أكسفورد.

تم نشر العمل العلمي في 25 أكتوبر 2016 على موقع arXiv.org .

Source: https://habr.com/ru/post/ar398789/


All Articles