جعلت الشبكة العصبية أوباما وهمية


إن الأزواج الرقميين للسياسيين والممثلين المشهورين يخضعون للسيطرة الكاملة لـ "العرائس". صورة: جامعة واشنطن ، 2015

وصلت برامج الرسومات ثلاثية الأبعاد ، إلى جانب الشبكات العصبية ، إلى مثل هذه الجودة التي لا يمكن تمييزها عن الفيديو المزيف تقريبًا عن الحقيقي. سرعان ما لن يكون من الممكن القول على وجه اليقين أن الشخص على شاشة التلفزيون سياسي حقيقي ، وليس محاكاة كمبيوتر.

في ديسمبر 2015 ، قدم علماء من جامعة واشنطن تكنولوجيا "الزوجي الرقمي" : إنشاء نماذج ثلاثية الأبعاد "مباشرة" من مئات الصور ذات الطابع الواحد. تم تجميع أرشيف صور ضخم للمشاهير والسياسيين على الإنترنت. يقوم البرنامج بإنشاء نموذج ، وهذا هو مثل دمية على حبل - يمكن التحكم فيه كما تريد ، وإعطاء تعابير وجه مختلفة ، وإجراء أي خطاب بشفاهك.

الآن ، عشية مؤتمر رسومات الكمبيوتر SIGGRAPH 2017 ، نشرت نفس المجموعة من الباحثين عملًا علميًا جديدًا مع نسخة متقدمة من "النظراء الرقميين".

الآن عند تدريس البرنامج ، لا يتم استخدام الصور فقط ، ولكن أيضًا مقاطع الفيديو ، لذلك أصبح التدريب أكثر فعالية. لإثبات التكنولوجيا ، اختار العلماء شخصية مشهورة - الرئيس الأمريكي السابق باراك أوباما. هذا خيار جيد ، لأن الإنترنت يحتوي على كمية كبيرة من مواد الفيديو عالية الدقة. تتوفر الملايين من إطارات الفيديو لتدريب شبكة عصبية.

لقد درست الشبكة العصبية بالتفصيل ملامح تعابير وجه أوباما: حركات الشفاه عند كل صوت ، وظهور التجاعيد بالقرب من العينين ، والتغيرات في شكل الحاجبين وإمالة الرأس. ارتبط تعبير الوجه للشخصية التجريبية بالأصوات التي نطقها: لم تعالج الشبكة العصبية إطارات مقاطع الفيديو فحسب ، بل أيضًا المسارات الصوتية لها.



وهكذا ، تعلم الذكاء الاصطناعي الضعيف مزامنة تعابير الوجه وحركات الشفاه مع أي خطاب تعسفي يطعمه الباحثون لمدخلات الشبكة العصبية.

يقارن الإعلان التشويقي للعمل العلمي تسجيلات الفيديو الحقيقية لخطابات أوباما والنتيجة التي تم تجميعها بواسطة شبكة عصبية.


وتجدر الإشارة إلى أن النتيجة المركبة تختلف اختلافًا ملحوظًا عن الأصل ، لكنها لا تزال تبدو واقعية للغاية.

يشدد الباحثون على أنه في وقت سابق ، من أجل الحصول على "النظراء الرقميين" ، اضطر الناس إلى تكرار نفس العبارات بشكل متكرر أمام الكاميرات لتسجيل جميع مجموعات مورفي وتعبيرات الوجه. الآن يمكنك القيام بذلك على مقاطع الفيديو المتاحة للجمهور. صحيح ، ليس لدى كل شخص على الإنترنت مواد فيديو كافية لتزييف شخصيته ، ولكن بمرور الوقت ، يحل المستخدمون أنفسهم هذه المشكلة عن طريق تحميل غيغابايت من صورهم ومقاطع الفيديو الخاصة بهم على الشبكات الاجتماعية.

من الناحية العملية ، يمكن أيضًا استخدام هذه التكنولوجيا. على سبيل المثال ، تقول Ira Kemelmacher-Shlizerman ، أحد المؤلفين المشاركين في العمل العلمي ، إنها ستحسن جودة مؤتمرات الفيديو عن طريق تجميع الإطارات المفقودة إذا خرجت من دفق الفيديو. إذا كان الصوت بدون تدخل ، وتأخر الفيديو ، فإن هذا التوليف سيكمل الصورة أو يزيد من دقتها. بالطبع ، يمكن للتكنولوجيا العثور على تطبيق في ألعاب الكمبيوتر والواقع الافتراضي إذا كان اللاعب يتواصل مع شخصية افتراضية. الآن سيصبح خطاب الشخصية الافتراضية أكثر واقعية ، ويمكن أن يكون نسخة رقمية من شخص حقيقي. على سبيل المثال ، يمكنك "إحياء" بعض الشخصيات التاريخية من الماضي القريب فقط من خلال التسجيلات الصوتية. بالطبع ، سيتم تسهيل إنشاء مزيف لأغراض سياسية. إذا تم الآن تشكيلها في "Photoshop" وإلقائها في الشبكات الاجتماعية ، فسيتم عرض مقاطع الفيديو المزيفة في المستقبل على شاشة التلفزيون.

يعترف المؤلفون بأن التكنولوجيا حتى الآن ليست مثالية. على سبيل المثال ، إذا حول أوباما وجهه بعيدًا قليلاً عن الكاميرا ، فقد تنفصل أجزاء من فمه عن وجهه وتتداخل مع الخلفية. لكن هذه أخطاء بسيطة يمكن تصحيحها عن طريق تدريب إضافي للشبكة العصبية.

عيب آخر للنموذج الذي تم إنشاؤه هو أنه لا يصمم العواطف. تعابير الوجه محايدة تمامًا ودائمًا ما تكون هي نفسها. وهكذا ، في بعض الحالات ، يفقد المضاعف الرقمي الواقعي: يبدو تعبير وجهه خطيرًا جدًا على الكلمات التافهة التي ينطقها. أو العكس - تافه للغاية بالنسبة للخطب الجادة للغاية. ومع ذلك ، تحدث مثل هذه الحوادث مع السياسيين الحقيقيين في الحياة الحقيقية.



تشبه التكنولوجيا التي تم إنشاؤها من حيث المبدأ العمل على برنامج لإنشاء أزواج رقمية Face2Face ، حيث يتم نقل تعابير الوجه والكلام من شخص إلى وجه آخر. يقارن المؤلفون من واشنطن في عملهم العلمي نتائج شبكتهم العصبية مع Face2Face. يشرحون أنه في حالة Face2Face ، يلزم دائمًا محاكاة دفق الفيديو ، ويعمل نموذجهم فقط من خلال التسجيل الصوتي.

Source: https://habr.com/ru/post/ar405269/


All Articles