Google Translate terhubung ke jaringan saraf


Model arsitektur GNMT (Terjemahan Mesin Neural Google). Di sebelah kiri adalah jaringan encoder, di sebelah kanan adalah decoder, di tengah adalah modul perhatian. Lapisan bawah encoder adalah dua sisi: modul pink mengumpulkan informasi dari kiri ke kanan, dan hijau di arah yang berlawanan

. Google akan sepenuhnya mentransfer layanan Google Translate ke pembelajaran mendalam . Penjelasan terperinci dari algoritma jaringan saraf diterbitkan di arXiv.org.

Menurut perkiraan awal oleh Google, jaringan saraf memberikan kualitas terjemahan yang jauh lebih baik daripada metode statistik konvensional. Ini telah diuji pada pasangan bahasa Inggris-Cina yang paling sulit, dan jaringan saraf segera mengurangi jumlah kesalahan terjemahan sebesar 60%. Hasilnya mengesankan. Pasangan bahasa lain akan terhubung ke jaringan saraf selama beberapa bulan ke depan.


Struktur komunikasi dua arah di tingkat bawah encoder.

Keberhasilan dalam bidang terjemahan mesin adalah pencapaian AI lainnya, yang baru-baru ini banyak terakumulasi. Teknologi jaringan saraf terlatih jelas meningkat dan digunakan di berbagai bidang. Terutama keunggulan jelas di atas teknik komputer lainnya telah dicapai dalam pengenalan gambar dan permainan. Di beberapa daerah, jaringan saraf bekerja bahkan lebih efisien daripada otak manusia, misalnya, mereka mengalahkan seseorang dalam permainan papan yang terpisah.

Jaringan saraf Google untuk terjemahan mesin disebut Sistem Terjemahan Mesin Saraf (NMTS). Dari awal hingga akhir, terjemahan teks sekarang sepenuhnya memenuhi jaringan saraf. Secara tradisional, AI digunakan dalam Google Translate dalam mode terbatas, untuk beberapa tugas tambahan. Misalnya, membandingkan teks yang tersedia dalam beberapa bahasa, seperti dokumen resmi PBB atau Parlemen Eropa. Dalam mode ini, terjemahan setiap kata dalam teks dibandingkan.

Jaringan saraf NMTS beroperasi pada tingkat yang secara fundamental baru. Dia tidak hanya menganalisis pilihan terjemahan yang ada dalam proses pembelajaran, tetapi juga melakukan analisis intelektual terhadap kalimat, membaginya menjadi “segmen kamus”. Dalam representasi tertentu dalam jaringan, "segmen kamus" ini sesuai dengan makna kata-kata .


Google animasi menunjukkan bagaimana kalimat Cina dibagi menjadi beberapa bagian, dan kemudian jaringan saraf memilih terjemahan yang sesuai, dengan mempertimbangkan bobot masing-masing fragmen dalam teks

asli.Dalam arti, pendekatan ini menyerupai karya jaringan saraf dalam visi mesin. Sistem memproses piksel gambar demi piksel. Kemudian tingkat pemrosesan secara bertahap meningkat, mencapai fitur kompleks seperti batas objek, pola geometris, dll. Dalam NMTS, jaringan saraf yang sama yang menganalisis teks sumber, kemudian menawarkan terjemahannya.

Dalam hal ini, pengembang Google telah menerapkan perkembangan yang ada di bidang ini, serta beberapa "inovasi metodologis," komentarkarya ilmiah independen yang diterbitkan di arXiv.org. Menurut pendapat mereka, pengembangan Google menunjukkan hasil yang "menakjubkan" dan jelas menunjukkan bahwa terjemahan neural menggunakan AI dapat jauh melampaui kualitas metode klasik terjemahan mesin dalam kualitas. Jaringan saraf Google jelas meningkatkan kualitas terjemahan dalam banyak hal.

Untuk mengoptimalkan, NMTS diuji pada peralatan komputer yang dirancang khusus untuk menguji jaringan saraf. Di sanalah jaringan saraf AlphaGo dilatih pada saat itu, yang setelah itu mengalahkan Lee Sedol , salah satu pemain go terbaik di dunia.

Untuk mengevaluasi efektivitas sistem, para peneliti memilih serangkaian besar penawaran dari Wikipedia dan artikel berita di Internet. Teks-teks ini memberi makan NMTS, ke dalam sistem terjemahan mesin Google Translate lama, dan juga memberikannya kepada penerjemah manusia. Dalam kerangka pengujian buta, penerjemah manusia mengevaluasi kualitas terjemahan setiap fragmen (termasuk terjemahan manusia).

Contoh terjemahan teks dalam bahasa Cina, Spanyol, Prancis dan Inggris dengan sistem terjemahan mesin konvensional (biru), jaringan saraf (hijau) dan manusia (oranye)

Pasangan bahasa Inggris Inggris dikenal karena kompleksitasnya yang tinggi. Meskipun ada penurunan yang signifikan dalam jumlah kesalahan, kualitas terjemahan dalam pasangan bahasa ini masih kalah dengan kualitas terjemahan dari bahasa Indo-Eropa lainnya. Dalam beberapa pasangan bahasa, terjemahan NMTS hampir sama mutunya dengan terjemahan oleh orang-orang, tetapi para penulis karya ilmiah memperingatkan bahwa terlalu dini untuk menarik kesimpulan yang jauh jangkauannya, karena perbandingan dibuat pada serangkaian terbatas kalimat sederhana yang dipilih dengan cermat.



Hasil yang sama dalam bentuk yang lebih visual.



Menurut para ahli, komputer akan dapat mendekati atau mengelilingi seseorang dalam hal kualitas terjemahan hanya jika saluran tambahan dari informasi yang masuk terhubung ke sistem terjemahan mesin. Tidak hanya teks, tetapi juga video dan suara. "Di masa depan, robot akan dapat bergerak, memanipulasi objek, merasakan sakit melalui sensor nyeri - dan mengungkapkan perasaan mereka dalam teks," kata Jürgen Schmidhuber dari University of Lugano (Swiss).

Sistem Google Terjemahan saat ini memproses sekitar 10.000 pasangan bahasa untuk terjemahan mesin.

Source: https://habr.com/ru/post/id397959/


All Articles