Diagram model rekomendasi hibrid Video Merlin untuk menentukan pemirsa film. Lapisan regresi logistik menggabungkan model penyaringan kolektif dengan informasi tentang frekuensi dan durasi kunjungan bioskop untuk menghitung kemungkinan keinginan menonton film ini. Model dilatih dari awal hingga akhir (ujung ke ujung), dan fungsi kehilangan didistribusikan kembali ke semua komponen yang terlatihPelepasan trailer adalah elemen terpenting dalam mempersiapkan pemutaran perdana film. Trailer spektakuler meningkatkan peringkat ekspektasi audiens, memperkenalkan penonton dengan plot, mewakili karakter utama, menyampaikan suasana keseluruhan gambar. Pada saat yang sama, menurut ulasan di trailer, pembuat film mendapat kesempatan untuk memahami aspek film apa yang disukai atau tidak disukai penonton - informasi ini biasanya menjadi dasar untuk kampanye pemasaran lebih lanjut. Cuplikan langsung berkorelasi dengan biaya pada hari-hari awal pertunjukan. Kemudian, angka biaya yang besar di masa-masa awal menarik perhatian khalayak ramai dan media, yang sebagian besar memastikan keberhasilan komersial keseluruhan dari gambar tersebut.
Karena kita berbicara tentang ratusan juta dolar, para ilmuwan terbaik berupaya menciptakan trailer yang lebih efisien. Spesialis Pembelajaran Mesin dari 20th Century Fox menerbitkan
makalah ilmiah yang menggambarkan sistem yang disebut Merlin Video. Sistem visi mesin ini menghasilkan diagram representasi dari trailer (gambar di atas). Data representasi digunakan untuk
memprediksi respons pemirsa . Menurut penulis karya ilmiah, ini adalah pertama kalinya sebuah studio film menggunakan sistem visi komputer untuk menghitung minat penonton dalam sebuah film.
Alat ini didasarkan pada model hibrida inovatif "penyaringan kolektif" (Collaborative Filtering, CF), yang mengisolasi fitur karakteristik dari video trailer: warna, pencahayaan, wajah, objek, lanskap.
Informasi ini dikombinasikan dengan data demografis, informasi tentang kehadiran bioskop (frekuensi, tanggal kunjungan terakhir). Sebagai hasil dari pelatihan, sistem ini memungkinkan Anda untuk membuat prediksi yang akurat dan membuat rekomendasi berdasarkan trailer.
Jaringan saraf dilatih pada GPU GPU Nvidia Tesla P100 di Google Cloud, dalam kerangka kerja pembelajaran mendalam
TensorFlow dan
pustaka primitif
cuDNN . Sebagai data pelatihan, ratusan trailer film dirilis dalam beberapa tahun terakhir, serta jutaan catatan tentang perilaku penonton.
"Setelah menemukan representasi yang cocok dari tanda-tanda ini dan memuatnya ke dalam model yang memiliki akses ke catatan sejarah kehadiran film, Anda dapat menemukan asosiasi non-sepele antara tanda-tanda trailer dan pilihan penonton di masa depan setelah film dirilis di bioskop atau di layanan streaming," penulis artikel ilmiah menulis.
Hasil dari Merlin Text (in text) dan Merlin Video (in video) sistem untuk memprediksi penonton film "The Greatest Showman" ditampilkan di tabel. Di kolom kanan - sebenarnya audiens.

Seperti yang Anda lihat, analisis teks memperkirakan penonton film cukup akurat, tetapi analisis urutan video menambahkan beberapa fragmen yang hilang. Eksperimen menunjukkan bahwa dengan sejumlah kecil data, sistem visi komputer dengan analisis cuplikan menunjukkan hasil AUC 6,5% lebih baik (area di bawah kurva ROC) daripada sistem analisis teks, mis. Skrip.
Dengan bantuan Artificial Intelligence yang lemah, departemen pemasaran studio film akan dapat lebih akurat memahami minat penonton. Mereka akan dapat lebih memahami orang-orang seperti apa yang tertarik dengan film baru ini. Yang paling penting adalah film-film masa lalu yang bersinggungan dengan penonton ini. Dengan cara ini, Anda dapat melakukan kampanye pemasaran yang lebih efektif yang ditargetkan pada khalayak tertentu.
Para peneliti sekarang bekerja untuk menggabungkan sistem prediksi audiens untuk menganalisis skenario dan cuplikan cuplikan dalam satu sistem. Dalam hal ini, ramalan akan seakurat mungkin.
Artikel ilmiah ini
diterbitkan pada 12 Juli 2018 di situs pracetak arXiv.org (arXiv: 1807.04465v1).