Smart TV, que determina el canal más interesante o una solución inusual de Sudoku para contenido de video

¿Cómo cree que están relacionadas la monetización de canales de televisión, redes neuronales y sudoku? A primera vista, como programar con arte: posible, pero no muchos lo logran. Sin embargo, mirando de cerca, nuestro equipo encontró una respuesta inusual a esta pregunta. El producto, que fue desarrollado por ingenieros, permitió utilizar diferentes tipos de redes neuronales para determinar el comienzo y el final de los bloques de anuncios para que aparecieran en el momento adecuado. Ahora, ya se ha transformado en una herramienta universal para resolver una amplia gama de tareas. Y con gusto le diremos qué es qué.

Todo comenzó con el hecho de que la principal fuente de ganancias para las compañías de transmisión y los canales de televisión estadounidenses era la monetización del contenido a través de la publicidad. Los propietarios de los canales de televisión permitieron que los proveedores reemplazaran cierta parte del anuncio y mostraran el anuncio de sus clientes allí. Sin embargo, si los bloques de anuncios se superponen, los anunciantes dejan comentarios negativos. Como resultado, la publicidad en el canal se apagó y se perdieron ingresos.

Para resolver este problema, se utilizaron diferentes enfoques. Uno de los principales proveedores de contenido de video en los EE. UU., Que comenzó a trabajar con EPAM, también tenía su propio enfoque. Sin embargo, su precisión no superó el sesenta por ciento. Esto significa que en el cuarenta por ciento de los casos, los comerciales se superponen entre sí, lo que podría conducir a una desconexión completa de la publicidad en estos canales de televisión.



Según el gerente del proyecto, Vlad Bajovsky , “tan pronto como comenzó el proyecto, el ingeniero Lesha Druzhinin enfrentó este problema y tuvo una idea. Consistió en crear un producto que determinará el principio y el final de los bloques de anuncios. Francamente, al principio era escéptico, ya que la decisión era técnicamente difícil, es decir, implicaba el uso de redes neuronales y aprendizaje automático. Y en ese momento no teníamos la experiencia relevante en estas áreas.

En general, todos los chicos que lograron participar en este proyecto probaron diferentes tipos de redes neuronales y diferentes algoritmos, diferentes componentes conectados y sincronizados. A pesar de que la idea nació en California, logramos involucrar a 70 ingenieros de ubicaciones EPAM completamente diferentes.

Como resultado, obtuvimos un excelente producto, que ahora no solo determina el cambio en la publicidad, sino que es una solución universal para cualquier tarea relacionada con la determinación del cambio en el contenido de video, incluida una posible solución para la búsqueda de video. En otras palabras, su campo de aplicación no se limita solo a la publicidad: puede ser, por ejemplo, un programa de televisión que cambia de categoría y datos de cámaras de video o películas antiguas digitalizadas que no tienen metadatos sobre el contenido de la secuencia de video ".



Lesha Druzhinin , ingeniera de software sénior:
“Si no hiciéramos el proyecto, pero estableciéramos la jugada, ¡obtendríamos una jugada muy buena! Sus géneros cambian constantemente, tiene lugar un cambio cardinal y frecuente de acciones, hay intriga. Al principio tratamos de resolver el problema de una manera simple, sin redes neuronales, pero nada funcionó. Teníamos que comprender completamente el diseño de la mayoría de los tipos de redes neuronales y, desde cero, entrenarlos para realizar ciertas tareas. Para que quede claro, hay muchas arquitecturas de redes neuronales, pero estábamos interesados ​​en aquellas que procesan información visual.

Con el tiempo, notamos que nuestro proyecto se convirtió en un campeón en una empresa que usaba redes neuronales: teníamos más de cinco de ellas. Ahora nos decidimos por dos. Analizan cada cuadro y cada pieza de sonido. Cuando se produce un cambio dramático en el color de los cuadros o el tono del sonido, las redes reaccionan a esto, prediciendo el final del anuncio y luego la transición entre los bloques de anuncios. Hasta ahora, la red que determina la transición entre los videos, más precisamente la que predice el final del video.



Cada uno de ellos obtiene su propia copia de marcos y sonidos cortados, pero en conjunto proporcionan una precisión del 90 por ciento del resultado. Lanzamos esta solución en canales reales y funciona. Logramos crear un bot que pueda ver televisión. Hablando en sentido figurado, si después de este proyecto los clientes nos preguntan "y nos hacen un Smart TV mejorado", entonces estamos listos para tales tareas. Nuestra solución es este pequeño Smart TV, que ya es capaz de distinguir contenido de forma independiente, solo para un cierto nicho ".

Por cierto, sobre la experiencia de las empresas mundiales de TI. Mientras trabajaba en este proyecto, el equipo de EPAM llegó a la conclusión de que las corporaciones globales llevan mucho tiempo practicando: requisitos de código abierto. Dado que los cambios en el proyecto ocurrieron muy a menudo y los nuevos ingenieros se conectaban constantemente, el código solo debe ser flexible. Por lo tanto, se realizaron constantes controles de su legibilidad o, como dicen, carnoso (carnosidad).

Inicialmente, la tarea del equipo era "sorprender, sorprender y ganar la confianza del cliente". Sin embargo, en el proceso de trabajar en la solución, el concepto inicial mejoró hasta el punto de que resultó ser un producto universal que, después de un cierto refinamiento, se puede ofrecer a muchas empresas cuyo negocio está relacionado con el contenido de video.

Trabajó en el artículo: Daria Prokopovich, Olga Nechaeva

Source: https://habr.com/ru/post/es426065/


All Articles