يتنبأ نظام رؤية آلة مقطورة الفيلم من سيأتي إلى السينما


رسم تخطيطي لنموذج توصية مختلط من Merlin Video لتحديد جماهير الأفلام. تجمع طبقة الانحدار اللوجستي بين نموذج ترشيح جماعي مع معلومات حول تكرار ومدة زيارة السينما لحساب احتمالية الرغبة في مشاهدة هذا الفيلم. يتم تدريب النموذج من البداية إلى النهاية (من طرف إلى طرف) ، ويتم توزيع وظيفة الخسارة على جميع المكونات المدربة

يعد إصدار المقطع الدعائي أهم عنصر في إعداد العرض الأول للفيلم. يزيد المقطع الدعائي المذهل من تصنيف توقعات الجمهور ، ويطلع الجمهور على المؤامرة ، ويمثل الشخصيات الرئيسية ، وينقل المزاج العام للصورة. في الوقت نفسه ، وفقًا لمراجعات على المقطع الدعائي ، يحصل صانعو الأفلام على فرصة لفهم جوانب الفيلم التي يحبها الجمهور أو لا يحبها - تصبح هذه المعلومات عادةً الأساس لحملة تسويقية أخرى. يرتبط المقطع الدعائي مباشرة بالرسوم في الأيام الأولى من العرض. بعد ذلك ، جذب عدد الرسوم الكبيرة في الأيام الأولى انتباه الجمهور الجماهيري ووسائل الإعلام ، مما يضمن إلى حد كبير النجاح التجاري العام للصورة.

بما أننا نتحدث عن مئات الملايين من الدولارات ، فإن أفضل العلماء يعملون على إنشاء مقاطع دعائية أكثر كفاءة. نشر أخصائيو التعلم الآلي من 20th Century Fox ورقة علمية تصف نظامًا يسمى Merlin Video. يقوم نظام رؤية الماكينة هذا بإنشاء رسم تخطيطي للتمثيل من المقطع الدعائي (في الصورة أعلاه). يتم استخدام بيانات التمثيل للتنبؤ باستجابة المشاهدين . وفقًا لمؤلفي العمل العلمي ، هذه هي المرة الأولى التي يستخدم فيها استوديو الأفلام نظام رؤية للكمبيوتر لحساب اهتمام المتفرج في الفيلم.

تعتمد الأداة على النموذج الهجين المبتكر لـ "التصفية الجماعية" (التصفية التعاونية ، CF) ، الذي يعزل الميزات المميزة عن مقطع الفيديو الدعائي: اللون والإضاءة والوجوه والأشياء والمناظر الطبيعية.

يتم دمج هذه المعلومات مع البيانات الديموغرافية ، ومعلومات عن حضور السينما (التردد ، وتاريخ آخر زيارة). نتيجة للتدريب ، يتيح لك النظام إجراء تنبؤات دقيقة وتقديم توصيات بناءً على المقطع الدعائي.

تم تدريب الشبكة العصبية على وحدات معالجة الرسومات Nvidia Tesla P100 في Google Cloud ، في إطار التعلم العميق TensorFlow ومكتبة cuDNN البدائية. كبيانات تدريب ، تم إصدار المئات من مقاطع دعائية للأفلام في السنوات الأخيرة ، بالإضافة إلى ملايين السجلات حول سلوك المشاهدين.

"بعد العثور على تمثيل مناسب لهذه العلامات وتحميلها في نموذج يمكنه الوصول إلى السجلات التاريخية لحضور الفيلم ، يمكنك العثور على ارتباطات غير تافهة بين علامات المقطع الدعائي واختيار الجمهور المستقبلي بعد إصدار الفيلم في دور السينما أو على خدمات البث" ، مؤلفو المقالة العلمية.

يتم عرض نتائج أنظمة Merlin Text (في النص) و Merlin Video (في الفيديو) للتنبؤ بجمهور فيلم "The Greatest Showman" في الجدول. في العمود الأيمن - الجمهور الفعلي في الواقع.



كما ترون ، توقع تحليل النص جمهور الفيلم بدقة تامة ، ولكن تحليل تسلسل الفيديو أضاف العديد من الأجزاء المفقودة. أظهرت التجارب أنه باستخدام كمية صغيرة من البيانات ، يُظهر نظام رؤية الكمبيوتر مع تحليل المقطورات نتيجة AUC أفضل بنسبة 6.5٪ (منطقة تحت منحنى ROC) من نظام تحليل النص ، أي نص برمجي.

بمساعدة مثل هذا الذكاء الاصطناعي الضعيف ، ستكون إدارات التسويق في استوديوهات الأفلام قادرة على فهم اهتمامات الجمهور بدقة أكبر. سيكونون قادرين على فهم أفضل لنوع الأشخاص المهتمين بالفيلم الجديد. الشيء الأكثر أهمية هو ما تتقاطع معه الأفلام السابقة. بهذه الطريقة ، يمكنك إجراء حملات تسويقية أكثر فعالية تستهدف جمهور محدد.

يعمل الباحثون الآن على الجمع بين نظام التنبؤ بالجمهور لتحليل السيناريو ولقطات المقطورات في نظام واحد. في هذه الحالة ، ستكون التوقعات دقيقة قدر الإمكان.

تم نشر المقالة العلمية في 12 يوليو 2018 على موقع ما قبل الطباعة arXiv.org (arXiv: 1807.04465v1).

Source: https://habr.com/ru/post/ar418803/


All Articles