Smart TV, qui détermine elle-même la chaîne la plus intéressante, ou une solution inhabituelle de Sudoku pour le contenu vidéo

Comment pensez-vous que la monétisation des chaînes de télévision, des réseaux de neurones et du sudoku est liée? À première vue - comme la programmation avec l'art: possible, mais peu le gèrent. Cependant, en y regardant de près, notre équipe a trouvé une réponse inhabituelle à cette question. Le produit, développé par des ingénieurs, a permis d'utiliser différents types de réseaux de neurones pour déterminer le début et la fin des blocs d'annonces afin qu'ils apparaissent au bon moment. Maintenant, il s'est déjà transformé en un outil universel pour résoudre un large éventail de tâches. Et nous nous ferons un plaisir de vous dire quoi.

Tout a commencé avec le fait que la principale source de profit pour les sociétés de streaming et les chaînes de télévision américaines était la monétisation du contenu via la publicité. Les propriétaires des chaînes de télévision ont autorisé les fournisseurs à remplacer une certaine partie de la publicité et à y montrer la publicité de leurs clients. Cependant, si les blocs d'annonces se superposaient, les annonceurs laissaient des avis négatifs. En conséquence, la publicité sur la chaîne a été désactivée et les revenus ont été perdus.

Pour résoudre ce problème, différentes approches ont été utilisées. L'un des principaux fournisseurs de contenu vidéo aux États-Unis, qui a commencé à travailler avec EPAM, avait également sa propre approche. Cependant, sa précision n'a pas dépassé soixante pour cent. Cela signifie que dans quarante pour cent des cas, les publicités se chevauchent, ce qui pourrait entraîner une déconnexion complète de la publicité sur ces chaînes de télévision.



Selon le chef de projet Vlad Bajovsky , «dès le début du projet, l'ingénieur Lesha Druzhinin a fait face à ce problème, et il a eu une idée. Elle consistait à créer un produit qui déterminera le début et la fin des blocs d'annonces. Pour être honnête, j'étais d'abord sceptique, car la solution était techniquement difficile, c'est-à-dire qu'elle impliquait l'utilisation de réseaux de neurones et l'apprentissage automatique. Et à cette époque, nous n'avions pas l'expertise pertinente dans ces domaines.

En général, tous les gars qui ont réussi à participer à ce projet ont testé différents types de réseaux de neurones et différents algorithmes, connecté et synchronisé différents composants. Malgré le fait que l'idée soit née en Californie, nous avons réussi à impliquer 70 ingénieurs provenant d'emplacements EPAM complètement différents.

En conséquence, nous avons obtenu un excellent produit, qui maintenant détermine non seulement le changement dans la publicité, mais est une solution universelle pour toutes les tâches liées à la détermination du changement dans le contenu vidéo, y compris une solution potentielle pour la recherche vidéo. En d'autres termes, son champ d'application ne se limite pas uniquement à la publicité - il peut s'agir, par exemple, d'une émission de télévision qui change de catégorie et des données de caméras vidéo ou de vieux films numérisés qui ne contiennent pas de métadonnées sur le contenu de la séquence vidéo. »



Lesha Druzhinin , ingénieur logiciel senior:
«Si nous ne faisions pas le projet, mais que nous préparions le jeu, nous obtiendrions un très bon jeu! Ses genres changent constamment, un changement d'action cardinal et fréquent a lieu, il y a de l'intrigue. Au début, nous avons essayé de résoudre le problème d'une manière simple, sans réseaux de neurones, mais rien n'a fonctionné. Nous devions comprendre pleinement la conception de la plupart des types de réseaux de neurones et les former à partir de zéro pour effectuer certaines tâches. Pour être clair, il existe de nombreuses architectures de réseaux de neurones, mais nous nous intéressions à celles qui traitent l'information visuelle.

Au fil du temps, nous avons remarqué que notre projet est devenu un champion dans une entreprise utilisant des réseaux de neurones: nous en avions plus de cinq. Maintenant, nous nous sommes installés sur deux. Ils analysent chaque image et chaque morceau de son. Lorsqu'un changement de couleur cardinal des images ou du ton du son se produit, les réseaux réagissent à cela, prédisant la fin de la publicité, puis la transition entre les blocs d'annonces. Jusqu'à présent, le réseau qui détermine la transition entre les vidéos, plus précisément celui qui prédit la fin de la vidéo.



Chacun d'eux obtient sa propre copie des images et des sons coupés, mais ensemble, ils fournissent une précision de 90% du résultat. Nous avons lancé cette solution sur de vrais canaux, et ça marche. Nous avons réussi à créer un bot capable de regarder la télévision. Au sens figuré, si après ce projet, les clients viennent nous demander «Et faites-nous une Smart TV améliorée», alors nous sommes prêts pour de telles tâches. Notre solution est cette petite Smart TV, qui est déjà capable de distinguer indépendamment le contenu, uniquement pour une certaine niche. »

Soit dit en passant, sur l'expérience des entreprises informatiques mondiales. Tout en travaillant sur ce projet, l'équipe EPAM est arrivée à la conclusion que les sociétés mondiales pratiquaient depuis longtemps - les exigences open source. Étant donné que les modifications apportées au projet se produisaient très souvent et que de nouveaux ingénieurs se connectaient constamment, le code doit simplement être flexible. Par conséquent, des vérifications constantes ont été faites de sa lisibilité ou, comme on dit, charnu (charnu).

Au départ, la tâche de l'équipe était de «surprendre, surprendre et gagner la confiance du client». Cependant, dans le processus de travail sur la solution, le concept de départ s'est amélioré à un point tel qu'il s'est avéré être un produit universel qui, après un certain raffinement, peut être proposé à de nombreuses entreprises dont l'activité est liée au contenu vidéo.

A travaillé sur l'article: Daria Prokopovich, Olga Nechaeva

Source: https://habr.com/ru/post/fr426065/


All Articles