Smart TV, das selbst den interessantesten Kanal bestimmt, oder eine ungewöhnliche Sudoku-Lösung für Videoinhalte

Wie hängen Ihrer Meinung nach die Monetarisierung von Fernsehkanälen, neuronalen Netzen und Sudoku zusammen? Auf den ersten Blick - wie Programmieren mit Kunst: möglich, aber nicht viele schaffen es. Bei genauem Hinsehen fand unser Team jedoch eine ungewöhnliche Antwort auf diese Frage. Das von Ingenieuren entwickelte Produkt ermöglichte die Verwendung verschiedener Arten von neuronalen Netzen, um den Beginn und das Ende von Anzeigenblöcken so zu bestimmen, dass sie zum richtigen Zeitpunkt angezeigt wurden. Jetzt hat es sich bereits zu einem universellen Werkzeug zur Lösung einer Vielzahl von Aufgaben entwickelt. Und wir sagen Ihnen gerne, was was ist.

Alles begann mit der Tatsache, dass die Hauptgewinnquelle für amerikanische Streaming-Unternehmen und Fernsehkanäle die Monetarisierung von Inhalten durch Werbung war. Die Eigentümer der Fernsehkanäle erlaubten den Anbietern, einen bestimmten Teil der Werbung zu ersetzen und dort die Werbung ihrer Kunden zu zeigen. Wenn die Anzeigenblöcke jedoch übereinander liegen, haben die Werbetreibenden negative Bewertungen abgegeben. Infolgedessen wurde die Werbung auf dem Kanal deaktiviert und Einnahmen gingen verloren.

Um dieses Problem zu lösen, wurden verschiedene Ansätze verwendet. Einer der größten Anbieter von Videoinhalten in den USA, der mit EPAM zusammenarbeitete, hatte ebenfalls einen eigenen Ansatz. Seine Genauigkeit überschritt jedoch nicht sechzig Prozent. Dies bedeutet, dass sich in vierzig Prozent der Fälle Werbespots überlappen, was zu einer vollständigen Unterbrechung der Werbung auf diesen Fernsehkanälen führen kann.



Der Projektmanager Vlad Bajovsky erklärte: „Sobald das Projekt begann, war der Ingenieur Lesha Druzhinin mit diesem Problem konfrontiert und hatte eine Idee. Es bestand darin, ein Produkt zu erstellen, das den Anfang und das Ende von Anzeigenblöcken bestimmt. Um ehrlich zu sein, war ich zunächst skeptisch, da die Lösung technisch schwierig war, dh die Verwendung neuronaler Netze und maschinelles Lernen beinhaltete. Zu diesem Zeitpunkt verfügten wir nicht über das entsprechende Fachwissen in diesen Bereichen.

Im Allgemeinen haben alle Leute, die es geschafft haben, an diesem Projekt teilzunehmen, verschiedene Arten von neuronalen Netzen und verschiedene Algorithmen getestet, verschiedene Komponenten verbunden und synchronisiert. Trotz der Tatsache, dass die Idee in Kalifornien geboren wurde, konnten wir 70 Ingenieure aus völlig unterschiedlichen EPAM-Standorten einbeziehen.

Als Ergebnis haben wir ein großartiges Produkt erhalten, das jetzt nicht nur die Änderung der Werbung bestimmt, sondern auch eine universelle Lösung für alle Aufgaben im Zusammenhang mit der Bestimmung der Änderung des Videoinhalts darstellt, einschließlich einer möglichen Lösung für die Videosuche. Mit anderen Worten, sein Anwendungsbereich beschränkt sich nicht nur auf Werbung. Es kann sich beispielsweise um eine Fernsehsendung handeln, die Kategorien ändert, sowie um Daten von Videokameras oder digitalisierten alten Filmen, die keine Metadaten zum Inhalt der Videosequenz enthalten. “



Lesha Druzhinin , Senior Software Engineer:
„Wenn wir das Projekt nicht machen, sondern das Stück festlegen würden, würden wir ein sehr gutes Stück bekommen! Ihre Genres ändern sich ständig, es kommt zu einem Kardinal und häufigen Handlungswechsel, es gibt Intrigen. Zuerst haben wir versucht, das Problem auf einfache Weise ohne neuronale Netze zu lösen, aber nichts hat funktioniert. Wir mussten das Design der meisten Arten von neuronalen Netzen vollständig verstehen und sie von Grund auf trainieren, um bestimmte Aufgaben auszuführen. Um es klar zu machen, gibt es viele Architekturen neuronaler Netze, aber wir waren an solchen interessiert, die visuelle Informationen verarbeiten.

Im Laufe der Zeit stellten wir fest, dass unser Projekt in einem Unternehmen, das neuronale Netze verwendet, zum Champion wurde: Wir hatten mehr als fünf davon. Jetzt haben wir uns für zwei entschieden. Sie analysieren jedes Bild und jeden Klang. Wenn eine dramatische Farbänderung der Frames oder des Tons auftritt, reagieren die Netzwerke darauf und sagen das Ende der Werbung und dann den Übergang zwischen den Anzeigenblöcken voraus. Bisher das Netzwerk, das den Übergang zwischen den Videos bestimmt, genauer dasjenige, das das Ende des Videos vorhersagt.



Jeder von ihnen erhält eine eigene Kopie von gehackten Frames und Sounds, aber zusammen liefern sie eine 90-prozentige Genauigkeit des Ergebnisses. Wir haben diese Lösung auf realen Kanälen gestartet und sie funktioniert. Wir haben es geschafft, einen Bot zu erstellen, der fernsehen kann. Im übertragenen Sinne sind wir für solche Aufgaben bereit, wenn Kunden nach diesem Projekt zu uns kommen und fragen: „Und machen Sie uns ein verbessertes Smart-TV?“. Unsere Lösung ist dieser kleine Smart-TV, der bereits in der Lage ist, Inhalte nur für eine bestimmte Nische unabhängig voneinander zu unterscheiden. “

Übrigens über die Erfahrung von Welt-IT-Unternehmen. Während der Arbeit an diesem Projekt kam das EPAM-Team zu dem Schluss, dass globale Unternehmen seit langem Open-Source-Anforderungen praktizieren. Da Änderungen am Projekt sehr häufig vorkamen und ständig neue Ingenieure eine Verbindung herstellten, muss der Code nur flexibel sein. Daher wurde ständig die Lesbarkeit oder, wie sie sagen, fleischig (Fleischigkeit) überprüft.

Zunächst bestand die Aufgabe des Teams darin, „das Vertrauen des Kunden zu überraschen, zu überraschen und zu gewinnen“. Während der Arbeit an der Lösung verbesserte sich das Startkonzept jedoch so stark, dass es sich als universelles Produkt herausstellte, das nach einiger Verfeinerung vielen Unternehmen angeboten werden kann, deren Geschäft mit Videoinhalten zusammenhängt.

Arbeitete an dem Artikel: Daria Prokopovich, Olga Nechaeva

Source: https://habr.com/ru/post/de426065/


All Articles