🛴 ⬜️ 🤽🏾 12 baru kecerdasan buatan Layanan Media Azure ⭐️ 👩‍🎤 👨🏻‍🚀

Misi Microsoft adalah memberi setiap orang dan organisasi di planet ini kesempatan untuk mencapai lebih banyak. Industri media adalah contoh yang bagus untuk menerjemahkan misi ini menjadi kenyataan. Kita hidup di era ketika semakin banyak konten yang dibuat dan dikonsumsi, semuanya dengan cara luar biasa dan pada lebih banyak perangkat. Di IBC 2019, kami berbagi inovasi terbaru yang saat ini sedang kami kerjakan dan berbicara tentang bagaimana mereka dapat membantu mengubah proses media Anda.

Detail di bawah potongan!

Halaman ini ada di situs kami.

Video Indexer memperkenalkan dukungan untuk animasi dan konten multibahasa

Tahun lalu di IBC, kami membuat Pengindeks Video Layanan Media Azure pemenang penghargaan kami tersedia untuk umum, dan tahun ini menjadi lebih baik. Video Indexer secara otomatis mengekstrak informasi dan metadata dari file media, seperti kata-kata yang diucapkan, wajah, emosi, tema, dan merek, dan Anda tidak perlu menjadi ahli pembelajaran mesin untuk menggunakannya.

Penawaran terbaru kami meliputi versi awal dari dua fungsi yang sangat populer dan berbeda - pengenalan karakter animasi dan menyalin pidato multibahasa, serta beberapa tambahan untuk model yang ada saat ini tersedia di Video Indexer.

Pengakuan karakter animasi

Konten animasi, kartun adalah salah satu jenis konten yang paling populer, tetapi model visi mesin standar yang dibuat untuk mengenali wajah manusia tidak bekerja dengan baik dengannya, terutama jika ada karakter dalam konten tersebut tanpa fitur manusia. Dalam versi pratinjau baru, Video Indexer terintegrasi dengan layanan Azure Custom Vision Microsoft, menciptakan serangkaian model baru yang secara otomatis mendeteksi dan mengelompokkan karakter animasi dan membuatnya mudah untuk menandai dan mengenalinya menggunakan model visi mesin kustom terintegrasi.

Model diintegrasikan ke dalam konveyor tunggal, yang memungkinkan siapa saja untuk menggunakan layanan ini tanpa pengetahuan di bidang pembelajaran mesin. Hasil tersedia melalui portal Video Indexer, yang tidak memerlukan kode, atau melalui REST API untuk integrasi cepat ke aplikasi Anda sendiri.

Kami menciptakan model ini untuk bekerja dengan karakter animasi bersama dengan beberapa konsumen yang menyediakan konten animasi nyata untuk pelatihan dan pengujian. Nilai fungsionalitas baru dijelaskan dengan baik oleh Andy Gutteridge, direktur senior teknologi studio dan pasca-produksi Viacom International Media Networks, yang merupakan salah satu penyedia data: “Menambahkan fitur pendeteksian konten animasi berbasis AI yang kuat akan memungkinkan kami untuk dengan cepat dan efisien menemukan dan katalog metadata karakter dari perpustakaan kami. konten.

Yang paling penting, ini akan memberi tim kreatif kita peluang untuk secara instan menemukan konten yang tepat, meminimalkan waktu yang dihabiskan untuk mengelola media, dan memungkinkan kita untuk fokus pada kreativitas. ”

Anda dapat mulai menjelajahi pengenalan karakter animasi dari halaman dokumentasi .

Identifikasi dan transkripsi konten dalam beberapa bahasa

Beberapa sumber daya media, seperti berita, kronik acara, dan wawancara, berisi rekaman orang-orang yang berbicara bahasa yang berbeda. Sebagian besar opsi yang ada untuk menerjemahkan ucapan ke dalam teks memerlukan indikasi awal dari bahasa pengenalan suara, yang membuatnya sulit untuk menyalin video multibahasa.

Fitur baru kami untuk secara otomatis mengidentifikasi bahasa lisan untuk berbagai jenis konten menggunakan teknologi pembelajaran mesin untuk mengidentifikasi bahasa yang ditemukan dalam sumber daya media. Setelah terdeteksi, setiap segmen bahasa secara otomatis menjalani proses transkripsi dalam bahasa yang sesuai, dan kemudian semua segmen digabungkan menjadi satu file transkripsi yang terdiri dari beberapa bahasa.

Dekripsi yang dihasilkan tersedia sebagai bagian dari output JSON Video Indexer dan dalam bentuk file dengan subtitle. Dekripsi keluaran juga terintegrasi dengan Azure Search, yang memungkinkan Anda untuk segera mencari segmen bahasa yang berbeda dalam video. Selain itu, transkripsi multibahasa tersedia saat bekerja dengan portal Video Indexer, sehingga Anda dapat melihat transkrip dan bahasa yang diidentifikasi berdasarkan waktu atau pergi ke tempat-tempat tertentu dalam video untuk setiap bahasa dan melihat transkripsi multibahasa dalam bentuk tanda tangan selama pemutaran video. Anda juga dapat menerjemahkan teks yang dihasilkan ke salah satu dari 54 bahasa yang tersedia melalui portal dan API.

Baca lebih lanjut tentang fitur pengenalan konten multi-bahasa baru dan penggunaannya dalam Pengindeks Video dalam dokumentasi .

Model diperbarui dan ditingkatkan tambahan

Kami juga menambahkan model baru ke Video Indexer dan meningkatkan yang sudah ada, termasuk yang dijelaskan di bawah ini.

Mengambil Entitas Terkait dengan Orang dan Tempat

Kami telah memperluas kemampuan penemuan merek kami yang ada untuk memasukkan nama-nama dan lokasi terkenal, seperti Menara Eiffel di Paris dan Big Ben di London. Ketika mereka muncul di dekripsi yang dihasilkan atau di layar menggunakan optical character recognition (OCR), informasi yang sesuai ditambahkan. Dengan fitur baru ini, Anda dapat mencari semua orang, tempat, dan merek yang muncul di video dan melihat informasi tentang mereka, termasuk interval waktu, deskripsi, dan tautan ke mesin pencari Bing untuk informasi lebih lanjut.

Editor Model Deteksi

Fitur baru ini menambahkan satu set "tag" ke metadata yang dilampirkan ke masing-masing frame dalam detail JSON untuk mewakili jenis editorial mereka (misalnya, bingkai lebar, bingkai medium, close-up, sangat close-up, dua tembakan, beberapa orang, di luar ruangan, di dalam ruangan, dll.). Karakteristik jenis bingkai ini berguna saat mengedit video untuk klip dan trailer, serta saat mencari gaya bingkai tertentu untuk tujuan artistik.

Pelajari lebih lanjut tentang deteksi tipe bingkai di Video Indexer.

Detailing Pemetaan IPTC Lanjutan

Model pendeteksian tema kami mengidentifikasi subjek video berdasarkan transkripsi, pengenalan karakter optis (OCR), dan selebritas yang ditemukan, meskipun tema tersebut tidak dinyatakan secara eksplisit. Kami mencocokkan topik yang ditemukan ini dengan empat bidang klasifikasi: Wikipedia, Bing, IPTC, dan IAB. Peningkatan ini memungkinkan kita untuk memasukkan klasifikasi IPTC tingkat kedua.
Mengambil keuntungan dari peningkatan ini semudah mengindeks ulang pustaka Pengindeks Video Anda saat ini.

Fungsi Streaming Langsung Baru

Dalam versi pratinjau Layanan Media Azure, kami juga menawarkan dua fitur baru untuk streaming langsung.

Transkripsi waktu-nyata AI membawa siaran langsung ke tingkat selanjutnya

Menggunakan Layanan Media Azure untuk streaming langsung, Anda sekarang bisa mendapatkan aliran output yang mencakup trek teks yang dihasilkan secara otomatis selain konten audio dan video. Teks dibuat dengan menyalin audio real-time berdasarkan kecerdasan buatan. Metode khusus diterapkan sebelum dan sesudah mengonversi ucapan ke teks untuk meningkatkan hasil. Trek teks dikemas dalam IMSC1, TTML, atau WebVTT, tergantung pada apakah ia datang dalam DASH, HLS CMAF, atau HLS TS.

Pengodean linear waktu-nyata untuk saluran 24/7 OTT

Menggunakan API v3 kami, Anda dapat membuat saluran menggunakan teknologi OTT (over-the-top), mengelola dan mengelola siaran langsung padanya, dan menggunakan semua fitur Layanan Media Azure lainnya, seperti video langsung sesuai permintaan (VOD, video sesuai permintaan), pengemasan dan manajemen hak digital (DRM).
Untuk pratinjau fitur-fitur ini, kunjungi halaman komunitas Layanan Media Azure .

Fitur pembuatan paket baru

Dukungan Deskripsi Jalur Suara

Konten yang disiarkan di saluran siaran seringkali memiliki trek audio dengan penjelasan verbal tentang apa yang terjadi di layar selain sinyal audio normal. Hal ini membuat program lebih mudah diakses oleh pemirsa tunanetra, terutama jika kontennya sebagian besar visual. Fungsi deskripsi audio yang baru memungkinkan Anda untuk membubuhi keterangan salah satu trek audio sebagai trek deskripsi audio (AD, deskripsi audio), sehingga pemain dapat membuat trek AD dapat diakses oleh pemirsa.

Masukkan ID3 Metadata

Perusahaan penyiaran sering menggunakan metadata berbasis waktu yang tertanam dalam video untuk mengirimkan sinyal tentang penyisipan iklan atau peristiwa metadata yang dibuat pengguna ke pemutar klien. Selain mode pensinyalan SCTE-35, kami sekarang juga mendukung ID3v2 dan skema pengguna lain yang ditentukan oleh pengembang aplikasi untuk digunakan oleh aplikasi klien.

Mitra Microsoft Azure memamerkan solusi ujung ke ujung

Bitmovin Memperkenalkan Video Encoding Bitmovin dan Video Player Bitmovin untuk Microsoft Azure. Pelanggan sekarang dapat menggunakan solusi pengodean dan pemutaran ini pada Azure dan menggunakan fitur-fitur canggih seperti pengkodean tiga tahap, dukungan untuk AV1 / VC codec, subtitle multibahasa dan analitik video pra-terintegrasi untuk QoS, iklan dan pelacakan video.

Evergent menampilkan Platform Manajemen Siklus Hidup Pengguna di Azure. Sebagai penyedia terkemuka solusi pendapatan dan manajemen siklus hidup pelanggan, Evergent memanfaatkan Azure AI untuk membantu penyedia hiburan premium meningkatkan keterlibatan dan retensi pelanggan dengan menciptakan paket layanan yang ditargetkan dan menawarkan pada saat-saat kritis dalam siklus hidup mereka.

Haivision akan menampilkan layanan perutean multimedia berbasis cloud yang cerdas, SRT Hub, yang membantu pelanggan mengubah alur kerja dari awal hingga selesai menggunakan Azure Data Box Edge dan mengubah alur kerja menggunakan Hublets dari Avid, Telestream, Wowza, Cinegy dan Make.tv.

SES telah mengembangkan Suite Layanan Media Siaran Berbasis Azure untuk pelanggan layanan media berbasis satelit dan dikelola. SES akan menampilkan solusi untuk layanan pemutaran yang dikelola sepenuhnya, termasuk pemutaran master, pemutaran lokal, deteksi dan penggantian iklan, dan enkode multi-saluran 24 × 7 real-time berkualitas tinggi pada Azure.

SyncWords tersedia pada alat cloud Azure nyaman dan teknologi untuk membuat tanda tangan. Penawaran ini akan memudahkan organisasi media untuk secara otomatis menambahkan subtitle, termasuk dalam bahasa asing, ke proses kerja pemrosesan video secara real time dan offline di Azure.
Tata Elxsi , sebuah perusahaan layanan teknologi internasional, telah mengintegrasikan platform SaT TEPlay OTT-nya dengan Azure Media Services untuk mengirimkan konten OTT dari cloud. Tata Elxsi juga memigrasikan solusi QoE Falcon Eye, menyediakan analitik dan metrik keputusan, ke Microsoft Azure.

Verizon Media membuat platform streaming tersedia di Azure sebagai versi beta. Verizon Media Platform adalah solusi OTT tingkat perusahaan yang mencakup DRM, penyisipan iklan, sesi pribadi yang dipersonalisasi, penggantian konten dinamis, dan pengiriman video. Integrasi menyederhanakan alur kerja, dukungan global dan skalabilitas, dan memberi Anda akses ke sejumlah fitur unik di Azure.

12 baru kecerdasan buatan Layanan Media Azure