Smart TV, que determina o canal mais interessante ou uma solução incomum de Sudoku para conteúdo de vídeo

Como você acha que a monetização de canais de TV, redes neurais e sudoku está relacionada? À primeira vista - como programar com arte: possível, mas poucos o gerenciam. No entanto, olhando atentamente, nossa equipe encontrou uma resposta incomum para essa pergunta. O produto, desenvolvido por engenheiros, permitiu o uso de diferentes tipos de redes neurais para determinar o início e o fim dos blocos de anúncios para que eles aparecessem no momento certo. Agora, ele já se transformou em uma ferramenta universal para resolver uma ampla gama de tarefas. E teremos o prazer de lhe dizer o que é o que.

Tudo começou com o fato de que a principal fonte de lucro para as empresas americanas de streaming e canais de TV era a monetização de conteúdo por meio de publicidade. Os proprietários dos canais de TV permitiram que os fornecedores substituíssem uma certa parte do anúncio e mostrassem o anúncio de seus clientes lá. No entanto, se os blocos de anúncios se sobreporem, os anunciantes deixarão comentários negativos. Como resultado, a publicidade no canal foi desativada e a receita foi perdida.

Para resolver esse problema, diferentes abordagens foram usadas. Um dos principais fornecedores de conteúdo de vídeo nos EUA, que começou a trabalhar com o EPAM, também teve sua própria abordagem. No entanto, sua precisão não excedeu sessenta por cento. Isso significa que, em quarenta por cento dos casos, os comerciais se sobrepunham, o que poderia levar a uma desconexão completa da publicidade nesses canais de TV.



Segundo o gerente de projeto Vlad Bajovsky , “assim que o projeto começou, o engenheiro Lesha Druzhinin enfrentou esse problema e ele teve uma ideia. Consistiu na criação de um produto que determinará o início e o fim dos blocos de anúncios. Francamente, no começo eu era cético, pois a decisão era tecnicamente difícil, ou seja, envolvia o uso de redes neurais e aprendizado de máquina. E naquela época não tínhamos a experiência relevante nessas áreas.

Em geral, todos os indivíduos que conseguiram participar deste projeto testaram diferentes tipos de redes neurais e algoritmos diferentes, conectaram e sincronizaram componentes diferentes. Apesar do fato de a idéia ter nascido na Califórnia, conseguimos envolver 70 engenheiros de locais EPAM completamente diferentes.

Como resultado, obtivemos um ótimo produto, que agora não apenas determina a alteração na publicidade, mas é uma solução universal para todas as tarefas relacionadas à determinação da alteração no conteúdo do vídeo, incluindo uma solução potencial para a pesquisa de vídeos. Em outras palavras, seu campo de aplicação não se limita apenas à publicidade - pode ser, por exemplo, um programa de TV que altera categorias e dados de câmeras de vídeo ou filmes antigos digitalizados que não possuem metadados sobre o conteúdo da sequência de vídeo. ”



Lesha Druzhinin , engenheira de software sênior:
“Se não fizéssemos o projeto, mas definíssemos a peça, teríamos uma peça muito boa! Seus gêneros estão mudando constantemente, uma mudança cardinal e frequente de ações ocorre, há intrigas. A princípio, tentamos resolver o problema de maneira simples, sem redes neurais, mas nada funcionou. Tivemos que entender completamente o design da maioria dos tipos de redes neurais e treiná-los do zero para executar determinadas tarefas. Para deixar claro, existem muitas arquiteturas de redes neurais, mas estávamos interessados ​​naquelas que processam informações visuais.

Com o tempo, percebemos que nosso projeto se tornou um campeão em uma empresa que utiliza redes neurais: tínhamos mais de cinco delas. Agora nos decidimos por dois. Eles analisam cada quadro e cada pedaço de som. Quando ocorre uma mudança drástica de cor nos quadros ou no tom do som, as redes reagem a isso, prevendo o final do anúncio e a transição entre os blocos de anúncios. Até o momento, a rede que determina a transição entre os vídeos, mais precisamente a que prevê o final do vídeo.



Cada um deles obtém sua própria cópia de quadros e sons cortados, mas juntos eles fornecem 90% de precisão do resultado. Lançamos esta solução em canais reais e funciona. Conseguimos criar um bot que pode assistir TV. Figurativamente falando, se depois desse projeto os clientes nos perguntam “E faça uma Smart TV aprimorada”, estamos prontos para essas tarefas. Nossa solução é essa pequena Smart TV, que já é capaz de distinguir conteúdo de forma independente, apenas para um determinado nicho. ”

A propósito, sobre a experiência das empresas mundiais de TI. Enquanto trabalhava nesse projeto, a equipe do EPAM chegou à conclusão de que as empresas globais praticam há muito tempo - requisitos de código aberto. Como as mudanças no projeto ocorreram com muita frequência e os novos engenheiros estavam constantemente se conectando, o código só precisa ser flexível. Portanto, foram feitas verificações constantes de sua legibilidade ou, como se costuma dizer, de carne (carnuda).

Inicialmente, a tarefa da equipe era "surpreender, surpreender e ganhar a confiança do cliente". No entanto, no processo de trabalhar na solução, o conceito inicial foi aprimorado a ponto de se tornar um produto universal que, após algum aperfeiçoamento, pode ser oferecido a muitas empresas cujos negócios estão relacionados ao conteúdo de vídeo.

Trabalhou no artigo: Daria Prokopovich, Olga Nechaeva

Source: https://habr.com/ru/post/pt426065/


All Articles