Le système de vision industrielle de bandes-annonces de films prédit qui viendra au cinéma


Un diagramme de modèle de recommandation hybride Merlin Video pour définir les audiences des films. La couche de régression logistique combine un modèle de filtrage collectif avec des informations sur la fréquence et la durée d'une visite au cinéma pour calculer la probabilité d'un désir de regarder ce film. Le modèle est formé du début à la fin (de bout en bout) et la fonction de perte est redistribuée à tous les composants formés

La sortie de la bande-annonce est l'élément le plus important dans la préparation de la première du film. Une bande-annonce spectaculaire augmente la cote des attentes du public, familiarise le public avec l'intrigue, représente les personnages principaux, transmet l'ambiance générale de l'image. Dans le même temps, selon les critiques de la bande-annonce, les cinéastes ont la possibilité de comprendre quels aspects du film le public aime ou n'aime pas - ces informations deviennent généralement la base d'une nouvelle campagne de marketing. La bande-annonce est directement en corrélation avec les frais dans les premiers jours du spectacle. Ensuite, le chiffre des frais élevés dans les premiers jours a attiré l'attention du grand public et des médias, ce qui assure largement le succès commercial global de l'image.

Puisque nous parlons de centaines de millions de dollars, les meilleurs scientifiques travaillent à créer des remorques plus efficaces. Les spécialistes de l'apprentissage automatique de 20th Century Fox ont publié un article scientifique décrivant un système appelé Merlin Video. Ce système de vision industrielle génère un diagramme de représentation à partir de la remorque (photo ci-dessus). Les données de représentation sont utilisées pour prédire la réponse des téléspectateurs . Selon les auteurs des travaux scientifiques, c'est la première fois qu'un studio de cinéma utilise un système de vision par ordinateur pour calculer l'intérêt des spectateurs pour un film.

L'outil est basé sur le modèle hybride innovant de «filtrage collectif» (Filtrage collaboratif, CF), qui isole les traits caractéristiques de la vidéo de la bande-annonce: couleur, éclairage, visages, objets, paysages.

Ces informations sont combinées avec des données démographiques, des informations sur la fréquentation des salles de cinéma (fréquence, dates de la dernière visite). À la suite de la formation, le système vous permet de faire des prévisions précises et de faire des recommandations en fonction de la remorque.

Le réseau neuronal a été formé sur les GPU GPU Nvidia Tesla P100 dans le Google Cloud, dans le cadre d'apprentissage en profondeur TensorFlow et la bibliothèque primitive cuDNN . En tant que données de formation, des centaines de bandes-annonces de films ont été publiées ces dernières années, ainsi que des millions d'enregistrements sur le comportement des téléspectateurs.

"Après avoir trouvé une représentation appropriée de ces signes et les avoir chargés dans un modèle qui a accès aux enregistrements historiques de la fréquentation du film, vous pouvez trouver des associations non triviales entre les signes de la bande-annonce et le choix du futur public après la sortie du film dans les cinémas ou sur les services de streaming", écrivent les auteurs de l'article scientifique.

Les résultats des systèmes Merlin Text (en texte) et Merlin Video (en vidéo) pour prédire l'audience du film "The Greatest Showman" sont présentés dans le tableau. Dans la colonne de droite - le public réel en fait.



Comme vous pouvez le voir, l'analyse de texte a prédit l'audience du film assez précisément, mais l'analyse de la séquence vidéo a ajouté plusieurs fragments manquants. Des expériences ont montré qu'avec une petite quantité de données, un système de vision par ordinateur avec analyse de remorque montre un résultat AUC 6,5% meilleur (zone sous la courbe ROC) qu'un système d'analyse de texte, c'est-à-dire un script.

Avec l'aide d'une Intelligence Artificielle si faible, les services marketing des studios de cinéma pourront mieux comprendre les intérêts du public. Ils seront en mesure de mieux comprendre quel genre de personnes s'intéressent au nouveau film. La chose la plus importante est de savoir avec quels films passés ce public croise. De cette façon, vous pouvez mener des campagnes marketing plus efficaces ciblant un public spécifique.

Les chercheurs travaillent maintenant à combiner un système de prédiction d'audience pour analyser le scénario et les séquences vidéo dans un seul système. Dans ce cas, les prévisions seront aussi précises que possible.

L'article scientifique a été publié le 12 juillet 2018 sur le site de préimpression arXiv.org (arXiv: 1807.04465v1).

Source: https://habr.com/ru/post/fr418803/


All Articles