Tren dan Prakiraan dalam Pemrosesan Bahasa Alami

Tren dan Prakiraan di Bidang NLP (Pemrosesan Bahasa Alami)


Artikel ini adalah tentang tren dan perkiraan dari Almanak September "Kecerdasan Buatan" No. 2 kami, yang dikhususkan untuk tinjauan pasar teknologi dan perusahaan di bidang NLP dan sintesis pengenalan suara di Rusia.

Untuk studi ini, kami melakukan survei ahli industri dan, khususnya, bertanya tentang perkiraan perkembangan kedua teknologi dan penggunaan AI di berbagai bidang. Tidak ada begitu banyak jawaban, namun demikian, tren umum dapat dirumuskan. Dalam artikel ini, kami merangkum jawaban-jawaban ini dan menunjukkan tren utama.

Tren teknologi umum


Pemecahan Masalah NLP ujung-ke-ujung


Semakin banyak solusi akan didasarkan pada pendekatan ujung ke ujung, misalnya, model jaringan saraf menerima sinyal akustik (gelombang suara) pada input dan menghasilkan sinyal akustik pada output, tanpa fase teks sedang. Ini secara signifikan akan mempercepat pelaksanaan model dan kualitasnya, sementara memperburuk "transparansi" dan pemahaman kita tentang "apa yang ada di dalamnya."

Mendekati kualitas pengenalan suara dan generasi ke manusia


Di tahun-tahun mendatang, peningkatan signifikan dalam kualitas pengenalan ucapan akan dicapai. Jumlah kesalahan dalam pengakuan akan mendekati level manusia. Pengakuan ucapan campuran dari beberapa orang yang berbicara dengan aksen berbeda di lingkungan yang bising akan meningkat. Analisis adegan suara dengan mengenali jenis kelamin dan usia pembicara, pewarnaan emosional pidato mereka dan sifat lingkungan akan ditambahkan.

Ucapan yang disintesis tidak dapat dibedakan dari ucapan manusia, dan akan memungkinkan untuk mensintesis suara siapa pun.

Multilingualisme


Dalam waktu dekat, model terjemahan multibahasa akan muncul, termasuk karena penggunaan pembelajaran transfer dan karena penggunaan monocorpus yang secara signifikan lebih besar di samping kasus paralel. Akibatnya, kualitas terjemahan untuk bahasa sumber daya rendah akan meningkat secara signifikan (dengan array sampel pelatihan yang relatif kecil).

Terjemahan manual akan sepenuhnya digantikan oleh terjemahan mesin karena pemahaman mesin yang lebih dalam tentang konteks dan materi pelajaran dokumen. Dengan pertumbuhan teknologi pengenalan suara dan pidato, interpretasi simultan mesin akan muncul di cakrawala 5-10 tahun.

Memahami makna teks


Aplikasi lain berdasarkan pemahaman makna konteks-sensitif akan muncul di cakrawala yang sama dalam 5-10 tahun: berbagai jenis dialog dan layanan bantuan yang dapat memahami konteks dialog, menjawab pertanyaan pengguna secara cerdas dan mengarahkan dialog ke arah yang benar. Pemahaman yang lebih mendalam tentang bahasa akan membawa ke tingkat baru pemrosesan otomatis aliran teks di Internet dan di jejaring sosial: pengumpulan dan kompilasi fakta, analisis mereka untuk konsistensi dan keandalan.

Pembuatan Teks


Jaringan saraf ujung-ke-ujung secara universal akan menggantikan pipa NLG klasik. Penggunaan model level GPT2 sudah memungkinkan untuk membuat artikel yang cukup panjang tentang topik arbitrer di area tertentu dengan konten terkontrol. Pada cakrawala 5 tahun, model jaringan saraf akan dapat menghasilkan teks tidak lebih buruk dari manusia. Dan kemudian konten otomatis akan membanjiri dunia.

Platform dan Lintas-Platform


Banyak solusi akan menjadi standar, akan ada banyak platform untuk membangun aplikasi berdasarkan antarmuka suara. Platform Cloud akan meningkat dalam hal waktu respons, beban kerja, dan keamanan. Pertumbuhan investasi diperkirakan bukan dalam layanan interaktif terpisah (chatbots), tetapi pada platform multifungsi dan solusi lintas-platform, berkat bantuan suara yang dapat bekerja sama pada perangkat yang berbeda. Sebagai hasilnya, kita akan dapat memulai percakapan dengan asisten kita di "rumah pintar", melanjutkannya di jalan di mobil dan kemudian bekerja dengan komputer kita di tempat kerja, semua tanpa kehilangan konteks komunikasi.

Teknologi Data Kecil


Nilai metode pembelajaran mesin yang bekerja secara efektif dalam kondisi sejumlah kecil data mentah akan tumbuh: transfer pembelajaran, transfer pengetahuan. Dalam aplikasi seperti itu, penggunaan yang lebih luas dari GAN (jaringan permusuhan generatif) untuk menghasilkan data untuk pelatihan model juga diharapkan.

Arsitektur dengan persyaratan komputasi yang lebih sedikit


Dengan transisi model jaringan saraf dari dinding laboratorium ke pusat data komersial, persyaratan efisiensi energinya akan meningkat. Diharapkan arsitektur komputasi yang lebih baru dan lebih efisien. Misalnya, jaringan jarang yang menggabungkan kualitas terbaik dari perhitungan simbolik dan didistribusikan, yang model kompleksitasnya beradaptasi dengan jumlah data pelatihan.

Tren pasar


Implementasi antarmuka suara di mana-mana


Pengembangan teknologi bicara-ke-teks akan menjadi langkah pertama untuk menyederhanakan tugas-tugas kantor (misalnya, waktu manajer perencanaan, mencari dokumen, memproses informasi rahasia). Dengan meningkatnya akurasi pengenalan, kedalaman pemahaman dan kualitas sintesis bicara, antarmuka suara akan diintegrasikan ke dalam hampir semua perangkat: sistem dialog di rumah pintar, mobil, peralatan rumah tangga, bot avatar, asisten bot.

Pertumbuhan robot suara yang eksplosif


Kami menunggu pertumbuhan eksplosif dalam jumlah asisten cerdas di berbagai sektor bisnis, termasuk layanan komersial bank, pengecer, telekomunikasi dan perusahaan lain yang secara aktif berinteraksi dengan pelanggan. Semua komunikasi verbal dengan audiens massa di layanan paling populer akan dilakukan oleh robot. Robot akan belajar mengenali emosi secara sensitif, termasuk menggunakan penilaian emosi multimodal dan akan sendiri menggunakan komponen emosional dalam percakapan.

Pencarian Informasi Bahasa Alam


Ada peningkatan permintaan untuk pencarian cerdas dengan kemampuan untuk membuat pertanyaan dalam bahasa alami. Semakin banyak organisasi ingin dengan cepat menemukan data tidak terstruktur di semua sumber internal, secara otomatis menentukan konten mereka dan menyoroti fakta-fakta penting dalam teks hukum atau keuangan khusus. Karena pengembangan model mendalam untuk mengekstraksi fakta dari teks dan mengabstraksi isinya, kualitas pengambilan informasi akan meningkat secara signifikan.

Di rumah


Kemungkinan besar, perusahaan besar - bank, telekomunikasi, industri - akan mengembangkan dan meningkatkan keahlian mereka sendiri di bidang AI, termasuk percakapan dengan tim ahli bahasa mereka sendiri, ilmuwan data, insinyur NLP, dll. Contoh outsourcing tugas individu dalam waktu dekat akan tetap kecil. Kami melihat pertumbuhan pesat dalam tim AI dari banyak perusahaan besar. Baik atau buruk adalah topik untuk artikel terpisah, tetapi ini adalah tren yang jelas.

Tren Industri


Keuangan dan Asuransi


Dalam jangka pendek, bank akan fokus pada memaksimalkan manfaat data yang telah diakumulasikan oleh bank yang menggunakan AI pada umumnya dan NLP pada khususnya. Dalam jangka panjang, ada tren stabil menuju penyatuan dan penyederhanaan proses perbankan yang dapat dilakukan tanpa atau tanpa seseorang (membuka rekening, penilaian risiko, membuat berkas kredit, penilaian, dll.). NLP akan dikombinasikan dengan teknologi lain (visi komputer, RPA, identifikasi jarak jauh, dll.).

Industri dan Logistik


Berkat teknologi NLP, orang dapat mengharapkan generasi baru perancang dokumentasi proyek, serta munculnya sistem yang mengevaluasi konsistensi dokumen yang menggambarkan objek teknis yang kompleks. Selanjutnya, dimungkinkan untuk memprediksi munculnya sistem perencanaan kontrol otomatis berdasarkan analisis dokumentasi dan standar proyek menggunakan NLP.

Dengan munculnya sistem untuk memahami makna teks, pada cakrawala 5-10 tahun, solusi akhir untuk masalah normalisasi nomenklatur diharapkan.

Obat-obatan


Pengenalan luas antarmuka suara akan secara signifikan membebaskan dokter dari entri teks dan membuat catatan medis yang ditandai secara otomatis. Munculnya corpus teks besar yang ditandai akan memungkinkan munculnya SPPVR (sistem pendukung keputusan medis) dari kelas baru berdasarkan teknologi NLP.

TI dan telekomunikasi


Penggunaan luas teknologi biometrik suara (otentikasi dan otorisasi seseorang dengan suara) diharapkan untuk menyediakan layanan berdasarkan data yang dipersonalisasi. Operator telekomunikasi akan memiliki kesempatan untuk mengambil posisi unik dalam ekosistem layanan digital, memiliki saluran suara komunikasi dengan klien. Di sisi lain, pesan suara mengandalkan teknologi dasar yang sama untuk pengenalan dan sintesis suara. Kami sedang menunggu waktu yang menarik dari pertempuran para raksasa industri telekomunikasi dengan pengirim pesan instan melalui saluran suara dengan klien.

Praktik hukum


Dalam jangka waktu 3-5 tahun, kita dapat mengharapkan adopsi teknologi yang luas untuk verifikasi kontrak otomatis dan, lebih luas, otomatisasi pekerjaan kontraktual, termasuk verifikasi pemenuhan kewajiban, dll.

Dalam 5-10 tahun ke depan, kita dapat mengharapkan munculnya model-model pemahaman teks-teks hukum. Berdasarkan pada mereka, kami mengharapkan munculnya sistem yang mengeluarkan pertanyaan pengguna yang diajukan dalam bahasa alami, jawaban yang merupakan ringkasan singkat dari dokumentasi peraturan yang ada, termasuk inkonsistensi dan berbagai versi.

Komputer untuk pengacara tidak lagi menjadi referensi dan akan menjadi alat pendukung keputusan yang lengkap. Salah satu tugas utama komputer pengacara akan memprediksi hasil gugatan dengan membangun pohon keputusan probabilistik berdasarkan praktik yang ada. Sebagian besar pekerjaan ini mungkin akan berlangsung di cloud pada model terlatih dengan ukuran sangat besar.

Munculnya layanan titik besar, produk dan perusahaan yang memecahkan masalah tertentu di bidang hukum.

Kita dapat mengharapkan integrasi yang lebih dalam dari solusi RPA dengan teknologi NLP, yang akan mengarah pada transfer tugas rutin untuk memproses informasi dan memasukkan data ke robot perangkat lunak.
Dan akhirnya, prospek kontrak pintar pada blockchain, secara otomatis dihasilkan berdasarkan analisis dokumen yang mengikat secara hukum, seperti kontrak atau NDA, tampak benar-benar menyihir. Kombinasi teknologi semacam itu dapat menghidupkan dokumen-dokumen hukum yang dapat dieksekusi sendiri, yang sejauh ini terdengar seperti fiksi ilmiah, tetapi tidak jauh dari implementasi.

Media dan Periklanan


Kami menunggu pengenalan luas pemasaran yang dipersonalisasi berdasarkan analisis online jejak digital seseorang. Ini akan mencakup analisis mendalam dari teks manusia dan nada suara mereka: penilaian negatif, positif dari teks tersebut tidak secara umum, tetapi dalam kaitannya dengan produk atau merek tertentu.

Setiap orang akan memiliki asisten belanja pribadi yang akan mengambil hingga 90% dari pembelian rutin.

Akan ada layanan untuk pembuatan berita otomatis untuk perusahaan tertentu, berdasarkan sejarahnya, acara internal dan eksternal.

Sains dan pendidikan


Dalam 5-10 tahun ke depan, kita dapat mengharapkan munculnya model untuk memahami teks-teks ilmiah. Kami mengharapkan munculnya sistem yang memberikan jawaban untuk pertanyaan pengguna yang diajukan dalam bahasa alami, yang merupakan ringkasan singkat dari literatur ilmiah yang ada tentang masalah ini, termasuk kontradiksi yang ditemukan dan berbagai versi. Aplikasi lain dari model tersebut adalah sistem rekomendasi untuk penelitian atau analisis lanskap paten.

Sistem seperti itu akan secara radikal mengubah lanskap teknologi dan mempercepat transfer teknologi, dengan menganalisis dan mengidentifikasi para pakar dan komunitas pakar di area tertentu berdasarkan analisis sumber-sumber informasi ilmiah dan paten.

Juga di cakrawala 5-10 tahun, kami berharap munculnya Asisten Guru yang lengkap untuk setiap disiplin dan, secara umum, untuk lembaga pendidikan. Di sisi lain, asisten pribadi siswa akan muncul yang akan memimpin orang tersebut di sepanjang jalur pendidikan pribadi sepanjang hidup. Interaksi agen cerdas ini juga cenderung dalam bahasa alami.

Negara dan Keamanan


Negara semakin memindahkan kegiatan mereka ke ruang media dan jejaring sosial. Konsep "perang informasi", yang muncul dalam beberapa tahun terakhir, telah mengambil bentuk yang sepenuhnya konkret dan membutuhkan jenis "senjata" dan "perlindungan" yang baru. Tren yang kuat sedang diamati dan permintaan untuk deteksi berita palsu hanya akan tumbuh. Sayangnya, seseorang juga dapat dengan yakin memprediksi pertumbuhan permintaan untuk berbagai jenis berita palsu secara otomatis. Penggunaan AI akan berkembang baik untuk menciptakan bot di jejaring sosial dan untuk mengidentifikasi mereka.

Yang tidak kalah penting adalah kecerdasan. AI akan semakin sering digunakan untuk menganalisis sejumlah besar informasi tentang perusahaan, orang, dan transaksi dalam berbagai bentuk untuk menyelesaikan masalah yang diterapkan seperti menemukan afiliasi dan hubungan implisit antara perusahaan dan individu.

Dengan bertambahnya jumlah orang, tugas mengotomatisasi komunikasi dengan warga negara untuk memberinya layanan tertentu menjadi semakin mendesak bagi negara. AI, mungkin dalam bentuk agen cerdas, akan secara aktif digunakan untuk mempersonifikasikan dan mempersonalisasikan layanan negara bagian dan kota untuk setiap warga negara - yang disebut "kota kognitif" dan "negara sebagai layanan".

Almanac penuh "Kecerdasan Buatan" pada NLP dan pengenalan / sintesis ucapan dapat diunduh di sini.

Source: https://habr.com/ru/post/id469463/


All Articles