El sistema de visión artificial del avance de la película predice quién vendrá al cine


Diagrama del modelo de recomendación híbrido de Merlin Video para definir audiencias de películas. La capa de regresión logística combina un modelo de filtrado colectivo con información sobre la frecuencia y la duración de una visita al cine para calcular la probabilidad de un deseo de ver esta película. El modelo se entrena de principio a fin (de extremo a extremo), y la función de pérdida se distribuye a todos los componentes entrenados.

El lanzamiento del trailer es el elemento más importante en la preparación del estreno de la película. El espectacular avance aumenta la calificación de las expectativas de la audiencia, familiariza a la audiencia con la trama, representa a los personajes principales y transmite el estado de ánimo general de la imagen. Al mismo tiempo, según las reseñas en el avance, los cineastas tienen la oportunidad de comprender qué aspectos de la película le gustan o no le gustan al público: esta información generalmente se convierte en la base para una nueva campaña de marketing. El avance se correlaciona directamente con las tarifas en los primeros días del espectáculo. Luego, la cifra de las grandes tarifas en los primeros días atrajo la atención de la audiencia masiva y los medios de comunicación, lo que garantiza en gran medida el éxito comercial general de la imagen.

Como estamos hablando de cientos de millones de dólares, los mejores científicos están trabajando para crear trailers más eficientes. Los especialistas en aprendizaje automático de 20th Century Fox publicaron un artículo científico que describe un sistema llamado Merlin Video. Este sistema de visión artificial genera un diagrama de representación del trailer (en la foto de arriba). Los datos de representación se utilizan para predecir la respuesta de los espectadores . Según los autores del trabajo científico, esta es la primera vez que un estudio de cine utiliza un sistema de visión por computadora para calcular el interés del espectador en una película.

La herramienta se basa en el innovador modelo híbrido de "filtrado colectivo" (Collaborative Filtering, CF), que aísla los rasgos característicos del video del trailer: color, iluminación, caras, objetos, paisajes.

Esta información se combina con datos demográficos, información sobre asistencia al cine (frecuencia, fechas de la última visita). Como resultado de la capacitación, el sistema le permite hacer predicciones precisas y hacer recomendaciones basadas en el avance.

La red neuronal se entrenó en las GPU Nvidia Tesla P100 GPU en Google Cloud, en el marco de aprendizaje profundo TensorFlow y la biblioteca primitiva cuDNN . Como datos de capacitación, se lanzaron cientos de avances de películas en los últimos años, así como millones de registros sobre el comportamiento de los espectadores.

"Habiendo encontrado una representación adecuada de estos carteles y cargándolos en un modelo que tiene acceso a registros históricos de asistencia al cine, puede encontrar asociaciones no triviales entre los carteles del avance y la elección futura de la audiencia después de que la película se estrene en los cines o en los servicios de transmisión", escriben los autores del artículo científico.

Los resultados de los sistemas Merlin Text (en texto) y Merlin Video (en video) para predecir el público de la película "The Greatest Showman" se muestran en la tabla. En la columna de la derecha, la audiencia real de hecho.



Como puede ver, el análisis de texto predijo la audiencia de la película con bastante precisión, pero el análisis de la secuencia de video agregó varios fragmentos faltantes. Los experimentos han demostrado que con una pequeña cantidad de datos, un sistema de visión por computadora con análisis de avance muestra un resultado AUC 6.5% mejor (área bajo la curva ROC) que un sistema de análisis de texto, es decir, un script.

Con la ayuda de una Inteligencia Artificial tan débil, los departamentos de marketing de los estudios de cine podrán comprender con mayor precisión los intereses de la audiencia. Podrán comprender mejor qué tipo de personas están interesadas en la nueva película. Lo más importante es con qué películas pasadas se cruza esta audiencia. De esta manera, puede realizar campañas de marketing más efectivas dirigidas a un público específico.

Los investigadores ahora están trabajando para combinar un sistema de predicción de audiencia para analizar el escenario y el metraje del avance en un solo sistema. En este caso, el pronóstico será lo más preciso posible.

El artículo científico fue publicado el 12 de julio de 2018 en el sitio de preimpresión arXiv.org (arXiv: 1807.04465v1).

Source: https://habr.com/ru/post/es418803/


All Articles