Google menerjemahkan pendek

Program ini menggunakan teknologi AI canggih, tetapi tes paling sederhana menunjukkan bahwa itu masih jauh dari pemahaman yang sebenarnya




Penulis artikel ini adalah Douglas Richard Hofstadter - fisikawan dan ilmuwan komputer Amerika; putra peraih Nobel dalam fisika Robert Hofstadter. Ia memperoleh ketenaran di seluruh dunia berkat buku "Godel, Escher, Bach: Garland Tak Berujung" ini, yang diterbitkan pada 1979 dan pada 1980 menerima Penghargaan Pulitzer dalam kategori "Non-Fiksi".

Suatu hari Minggu di sesi salsa mingguan , teman saya Frank membawa seorang tamu dari Denmark bersamanya. Saya tahu bahwa Frank berbicara bahasa Denmark dengan baik, karena ibunya berasal dari sana dan dia hidup sebagai anak di Denmark. Pacarnya fasih berbahasa Inggris, yang dianggap norma untuk negara-negara Skandinavia. Namun, yang mengejutkan saya, dalam proses komunikasi ternyata pasangan ini biasanya bertukar email yang diterjemahkan oleh Google Translate (GT). Frank menulis pesan dalam bahasa Inggris, dijalankan melalui GT untuk mendapatkan teks Denmark; dia, sebaliknya, menulis dalam bahasa Denmark, dan kemudian memungkinkan GT untuk menerjemahkan teks ke dalam bahasa Inggris. Aneh sekali! Mengapa dua orang pintar yang berbicara satu sama lain melakukan hal ini? Pengalaman saya menggunakan perangkat lunak terjemahan mesin selalu membawa saya ke penilaian skeptis tentang kemampuannya. Tapi keduanya jelas tidak memiliki keraguan saya. Banyak orang cerdas terpesona oleh kemampuan program terjemahan, dan menemukan sedikit alasan untuk mengkritik mereka. Itu mengherankan saya.

Saya suka bahasa dan saya menerjemahkan dengan semua keinginan saya. Saya seorang spesialis dalam ilmu kognitif dan telah tertarik pada seluk-beluk kerja pikiran manusia sepanjang hidup saya, jadi selama beberapa dekade saya telah mengikuti mekanisasi terjemahan. Saya pertama kali tertarik pada masalah ini pada pertengahan 1970-an, ketika saya menemukan sebuah surat dari tahun 1947 yang ditulis oleh ahli matematika Warren Weaver , seorang pendukung awal terjemahan mesin, yang ditujukan kepada pendiri sibernetika, Norbert Wiener , di mana Weaver membuat pernyataan yang menarik, cukup terkenal saat ini:
Ketika saya melihat artikel Rusia, saya berkata: “Ini sebenarnya ditulis dalam bahasa Inggris, hanya dienkripsi dengan karakter aneh. Dan sekarang saya akan melanjutkan ke dekripsi. "
Beberapa tahun kemudian ia mengusulkan sudut pandang yang berbeda: “Tidak ada orang yang berakal yang akan percaya bahwa terjemahan mesin akan mampu mencapai keanggunan dan gaya. Pushkin tidak perlu takut. " Saya ingat satu tahun yang tak terlupakan dalam hidup saya dihabiskan untuk menerjemahkan sebuah novel brilian dalam puisi Alexander Pushkin "Eugene Onegin" ke dalam bahasa ibu saya (saya secara radikal mengolah kembali karya Rusia terbesar, mengubahnya menjadi cerita bahasa Inggris dalam puisi), dan saya menemukan komentar Weaver ini jauh lebih banyak. benar daripada pandangan pertama, anehnya disederhanakan bahasa. Namun, 1947 pandangannya tentang terjemahan sebagai decoding menjadi moto yang telah lama memandu bidang terjemahan mesin.

Sejak itu, terjemahan mesin secara bertahap ditingkatkan, dan baru-baru ini penggunaan yang disebut “Jejaring saraf dalam” bahkan membuat beberapa pengamat berpikir (lihat artikel “ Kebangkitan Hebat AI ” dan “ Terjemahan Mesin: Melampaui Babel ”) bahwa penerjemah manusia adalah spesies yang terancam punah. Dengan perkembangan acara ini, orang yang bekerja sebagai penerjemah akan berubah menjadi pengontrol kualitas sederhana dan pengoreksi kesalahan kecil dalam beberapa tahun, dan tidak akan menghasilkan teks baru secara keseluruhan.

Skenario seperti itu akan menyebabkan saya revolusi spiritual yang menghancurkan. Meskipun saya memahami keinginan untuk mengajarkan mesin bagaimana menerjemahkan teks dengan baik, saya tidak ingin melihat bagaimana orang mati akan menggantikan penerjemah manusia. Gagasan ini membuatku takut dan membuatku jijik. Menurut pendapat saya, terjemahan adalah seni yang luar biasa halus, terus-menerus membutuhkan pengalaman bertahun-tahun dan imajinasi kreatif. Jika pada suatu hari "baik", penerjemah manusia menjadi peninggalan masa lalu, rasa hormat saya terhadap pikiran manusia akan terguncang, dan keterkejutan ini akan membuat saya dalam kebingungan dan kesedihan yang luar biasa.

Setiap kali saya membaca sebuah artikel tentang bagaimana serikat penerjemah manusia akan segera dipaksa untuk menundukkan kepala mereka ke pedang teknologi yang sangat cepat, saya merasa perlu memeriksa pernyataan ini sendiri, khususnya karena takut mimpi buruk ini telah muncul dengan sangat cepat. dekat, dan juga karena harapan dan keinginan untuk meyakinkan diri sendiri bahwa dia tidak begitu dekat, dan, akhirnya, karena kepercayaan lama saya pada kebutuhan untuk memerangi berlebihan pencapaian prestasi AI. Karena itu, setelah membaca tentang bagaimana gagasan lama jaringan saraf tiruan, yang baru-baru ini diadopsi oleh divisi Google yang disebut Google Brain, dan meningkat dengan bantuan "pelatihan mendalam", menyebabkan munculnya jenis program baru yang konon membuat "revolusi" dalam terjemahan mesin, saya Saya menyadari bahwa saya perlu memeriksa versi terbaru GT. Benarkah dia mengubah bidang terjemahan dengan cara Deep Blue dan AlphaGo berhasil melakukan ini di bidang permainan terhormat seperti catur dan pergi?

Saya menemukan bahwa meskipun versi lama GT bekerja dengan bermacam-macam bahasa yang sangat besar, yang baru pertama kali bekerja dengan hanya sembilan - benar, kemudian memperluas set ke 96. Saya membatasi penelitian saya ke bahasa yang didukung seperti bahasa Inggris, Prancis, Jerman dan Cina [ kami akan menambahkan untuk bersenang-senang dan bahasa Rusia / kira-kira. perev. ]

Sebelum demonstrasi penemuan, ada baiknya menyebutkan ambiguitas kata "dalam." Ketika seseorang mendengar tentang bagaimana Google membeli perusahaan DeepMind, yang menghasilkan "jaringan saraf yang dalam" dengan "pembelajaran yang mendalam", ia langsung merasakan nama-nama ini dalam arti "luar biasa", "mampu banyak", "berwawasan", "bijaksana". Selain itu, kata "dalam" hanya berarti fakta bahwa jaringan saraf ini memiliki lebih banyak lapisan (katakanlah, 12) daripada versi yang lebih lama, yang bisa memiliki dua atau tiga. Apakah ini mengikuti dari kedalaman sedemikian rupa sehingga jaringan semacam itu memiliki kebijaksanaan? Hampir tidak. Ini adalah PR verbal.

Saya sangat curiga terhadap GT, terutama karena hype di sekitarnya. Tetapi, meskipun ada permusuhan, saya mengakui adanya fakta-fakta luar biasa terkait dengan produk ini yang tidak saya sukai. Ini tersedia untuk siapa saja di Bumi secara gratis, dan dapat mengkonversi teks dalam hampir seratus bahasa menjadi teks dalam bahasa lain. Itu layak dihargai. Jika saya dengan bangga menyebut diri saya "pi-lingual" (yaitu, jumlah total bahasa yang saya tahu sedikit lebih dari tiga adalah cara lucu saya untuk menjawab pertanyaan, "Berapa banyak bahasa yang Anda tahu"), maka berapa banyak lagi yang bisa dibanggakan oleh GT itu sendiri, jika dia dapat menyebut dirinya “beli-bahasa” (“beli” dalam bahasa Mandarin berarti 100). Orang kafir sangat terkesan dengan bayazianisme. Terlebih lagi, jika saya menyalin halaman dalam bahasa A ke GT, maka hanya perlu beberapa detik untuk mendapatkan halaman dari kata-kata dalam bahasa B. Dan semua ini terjadi setiap saat, di layar di sekitar planet ini, dalam banyak bahasa.

Manfaat praktis dari GT dan teknologi serupa tidak dapat disangkal, dan pada prinsipnya, mereka menguntungkan kita, tetapi dalam pendekatan ini, sesuatu jelas tidak cukup, dan ini dapat dijelaskan dalam satu kata: pemahaman. Terjemahan mesin tidak pernah fokus pada pemahaman bahasa. Sebaliknya, mereka selalu mencoba melakukan "dekripsi" di bidang ini - yaitu, untuk mengatasi tugas, tidak peduli dengan apa pengertian dan makna. Mungkinkah pemahaman itu tidak diperlukan untuk terjemahan yang baik? Dapatkah seseorang, seseorang atau sebuah mesin, mengeluarkan terjemahan berkualitas tinggi tanpa memperhatikan arti dari bahasa tersebut? Untuk menjelaskan masalah ini, kita beralih ke eksperimen yang telah saya lakukan.

* * *

Saya akan memulai penelitian saya dengan contoh-contoh sederhana - dengan komentar singkat, yang segera menyebabkan ide yang jelas dalam diri seseorang:
Di rumah mereka, semuanya berpasangan. Ada mobilnya dan mobilnya, handuknya dan handuknya, dan perpustakaannya dan miliknya.

Terjemahan GT:
Di rumah mereka, semuanya berpasangan. Ada mobilnya dan mobilnya, handuk dan handuk, juga perpustakaannya dan miliknya.

Terjemahan Manusia:
Di rumah mereka, semuanya memiliki pasangan sendiri. Ada mobilnya, dan mobilnya, handuk dan handuknya, perpustakaannya dan dia.
Tugas penerjemahan tampaknya tidak ambigu, tetapi dalam bahasa Prancis (dan bahasa Romawi lainnya) kata "dia" dan "dia", menunjukkan hal-hal, tidak dimasukkan dalam jenis pemiliknya, tetapi dalam jenis hal itu sendiri. Inilah yang diberikan GT kepada saya:
Dans leur maison, tout vient en paires. Anda juga dapat melihat lebih banyak tentang ini, melakukan serviettes dan ses serviettes, dan membaca dan menulis.
Program itu jatuh ke dalam jebakan saya, tidak mengerti bagaimana orang akan mengerti bahwa saya menggambarkan pasangan yang memiliki barang untuk setiap barangnya. Misalnya, jaringan saraf pembelajaran yang dalam menggunakan kata sa untuk mesin dan mesinnya, jadi kami tidak bisa mengatakan apa-apa tentang bidang pemilik mesin. Dengan cara yang sama, dia menggunakan kata aseksual untuk jamak dari "handuknya" dan "handuknya," dan dalam kasus terakhir, dengan perpustakaan, dia bingung dengan huruf terakhir dalam miliknya, dan entah bagaimana dia memutuskan apa singkatan dari jamak (les siennes). Proposal, yang diterjemahkan oleh GT ke dalam bahasa Prancis, kehilangan artinya.

Kemudian saya sendiri menerjemahkan frasa ini ke dalam bahasa Prancis, sehingga tetap memiliki makna aslinya. Ini versi saya:
Chez eux, ils ont tout en double. Anda juga dapat menambahkan à elle et sa voiture à lui, ses serviettes à elle et ses serviettes à lui, sa bibliothèque à elle et sa bibliothèque à lui.
Ungkapan sa voiture à elle berarti "mobilnya", dan sa voiture à lui berarti mobilnya. Setelah itu, saya memutuskan bahwa itu akan menjadi tugas sepele bagi GT untuk menerjemahkan terjemahan bahasa Prancis saya kembali ke Bahasa Inggris dan mendapatkan versi bahasa Inggris yang benar - tetapi saya benar-benar salah. Inilah yang dia berikan kepada saya:
Di rumah, mereka memiliki segalanya dalam dobel. Ada mobilnya sendiri dan mobilnya sendiri, handuknya sendiri dan handuknya sendiri, perpustakaannya sendiri dan perpustakaannya sendiri.
Apa maaf Meskipun kalimat entri secara eksplisit menyatakan jenis kelamin pemilik, mesin penerjemah mengabaikan klaim ini dan menghubungkan semuanya dengan jenis kelamin laki-laki. Mengapa dia membuang informasi paling penting dari proposal?

Orang-orang tahu banyak hal tentang pasangan, rumah, barang-barang pribadi, kebanggaan, persaingan, kecemburuan, kehidupan pribadi, dan banyak hal tak berwujud lainnya yang mengarah pada keanehan seperti handuk dengan sulaman "dia" dan "dia". Ketajaman seperti GT tidak diketahui. GT secara umum tidak diketahui kehalusannya. Dia tahu hanya garis-garis yang terdiri dari kata-kata yang terdiri dari huruf. Ia terlibat dalam pemrosesan potongan teks yang sangat cepat, ia tidak berpikir, tidak mewakili, tidak ingat, tidak mengerti. Dia bahkan tidak tahu bahwa kata-kata itu bermakna. Saya segera menyatakan bahwa, pada prinsipnya, sebuah program komputer dapat mengetahui mengapa suatu bahasa diperlukan, dan ia dapat memiliki gagasan, memori, dan pengalaman, dan dapat menggunakannya - tetapi GT tidak dirancang untuk itu. Tujuan seperti itu tidak ada dalam rencana pengembangnya.

Secara umum, saya menertawakan hasilnya, lega melihat bahwa kami belum mendekati mengganti penerjemah dengan mesin. Tapi menurut saya masih ada gunanya mempelajari mobil secara lebih detail. Satu tegukan haus tidak padam.

Dan omong-omong, bagaimana dengan kalimat ini - "satu haus untuk tidak memuaskan dahaga seseorang" (mengisyaratkan, tentu saja, dengan pepatah " satu menelan tidak membuat musim panas" - kata menelan juga diterjemahkan sebagai "seteguk", dan seperti "menelan." Dalam versi bahasa Inggris, satu menelan tidak membuat musim panas. / kira-kira diterjemahkan. ] Saya tidak bisa tidak memeriksanya. Dan inilah yang GT berikan kepada saya: "Une hirondelle n'aspire pas la soif" [ GT memberi bahasa Rusia "satu tegukan tidak memuaskan dahaga" / sekitar. Terjemahan. ] Secara tata bahasa kalimat ini adalah bahasa Prancis, tetapi sulit untuk dipahami. Pertama, ia menyebutkan seekor burung (une hirondelle - menelan) a), maka dikatakan bahwa burung itu tidak menghirup atau tidak mengisap (n'aspire pas), dan akhirnya, diindikasikan bahwa apa yang tidak disedot oleh burung itu haus (la soif). GT jelas tidak mengerti arti dari frasa - itu hanya dikeluarkan banyak omong kosong. "Penyederhanaan yang sederhana dan sederhana." "Dia baru saja keluar dengan setumpuk sapi." "Il vient de sortir yang sederhana." Maafkan bahasa Prancis saya - atau lebih tepatnya, pseudo-Prancis GT

* * *

Dari api Prancis, kita melompat ke api Jerman. Baru-baru ini, saya tenggelam dalam buku Sie nannten sich der Wiener Kreis (Mereka menyebut diri mereka Lingkaran Wina) dari ahli matematika Austria Karl Sigmund. Dia menggambarkan sekelompok intelektual idealis dari Wina pada 1920-an dan 1930-an yang secara serius mempengaruhi filsafat dan sains di paruh kedua abad ke-20. Saya memilih satu kalimat kecil dari buku Sigmund dan memberikannya kepada GT. Ini dia, pertama dalam bahasa Jerman, lalu terjemahan saya, lalu GT. (Omong-omong, saya memeriksa terjemahan saya dengan dua penutur asli Jerman, termasuk Karl Sigmund - sehingga dapat dianggap akurat).
Sigmund:

Tidak ada catatan untuk Krieg sahen es viele deutschnationale Professor, inzwischen die Mehrheit in der Fakultät, gewissermaßen dan lain-lain Pflicht an, die Hochschulen vor den “Ungeraden” zu bewahren; am schutzlosesten waren junge Wissenschaftler vor ihrer Habilitation. Und wissenschaftlerinnen kamen sowieso nicht in frage; über wenig war man sich einiger.

Hofstadter:

Setelah kekalahan itu, banyak profesor dengan kecenderungan Pan-Germanistik, yang pada saat itu menjadi mayoritas fakultas, menganggap tugas mereka adalah untuk melindungi institusi-institusi pendidikan tinggi dari "yang tidak diinginkan." Yang paling mungkin diberhentikan adalah cendekiawan muda yang belum mendapatkan hak untuk mengajar kelas-kelas universitas. Adapun cendekiawan perempuan, mereka tidak memiliki tempat dalam sistem sama sekali; tidak ada yang lebih jelas dari itu.

Google Terjemahan:

Setelah perang yang hilang, banyak profesor Jerman-Nasional, sementara mayoritas di fakultas, melihat diri mereka sebagai tugas mereka untuk menjaga universitas dari yang “ganjil”; Ilmuwan muda paling rentan sebelum habilitasi mereka. Lagi pula, para ilmuwan tidak mempertanyakan; Ada beberapa dari mereka.

GT, Rusia:

Setelah perang yang hilang, banyak profesor Jerman-nasional, sekarang mayoritas di fakultas, menganggap tugas mereka untuk melindungi universitas dari "aneh"; yang paling rentan adalah ilmuwan muda sebelum habilitasi mereka. Dan para ilmuwan wanita masih tidak ragu; ada beberapa dari mereka.

Manusia Rusia:

Setelah kekalahan, banyak profesor cenderung nasionalisme Jerman (dan pada saat itu ada mayoritas dalam kepemimpinan fakultas) menganggap tugas mereka untuk melindungi institusi pendidikan tinggi dari "elemen yang tidak diinginkan". Kemungkinan besar, ilmuwan muda yang belum mendapatkan hak untuk mengajar bisa ditolak. Bagi para ilmuwan wanita, sama sekali tidak ada tempat dalam sistem ini; itu lebih jelas daripada jelas.
Terjemahan GT terdiri dari kata-kata bahasa Inggris (untuk beberapa alasan yang tidak diketahui, beberapa dari mereka untuk beberapa alasan dimulai dengan huruf kapital). Sejauh ini bagus! Namun segera seluruh terjemahan mulai kabur, dan semakin jauh, semakin buram jadinya.

Pertama ambil "aneh" aneh - aneh, aneh, tidak berpasangan]. Ini sesuai dengan Jerman mati 'Ungeraden', yang berarti "orang yang tidak diinginkan karena alasan politik." Tapi GT punya alasan - statistik murni - untuk menggunakan kata "aneh". Yaitu: dalam basis data dwibahasa yang besar, kata ungerade hampir selalu diterjemahkan sebagai ganjil. Meskipun mobil tidak mengerti mengapa demikian, saya bisa menjelaskan. Ini karena ungerade - secara harfiah berarti "tidak langsung" atau "tidak rata" - hampir selalu berarti "aneh." Dan pilihan saya untuk kata yang tidak diinginkan tidak ada hubungannya dengan statistik kata, tetapi berasal dari pemahaman saya tentang situasi - memahami ide yang tidak secara langsung ditunjukkan dalam teks dan tidak ada dalam daftar opsi terjemahan untuk ungerade di salah satu kamus Jerman.

Mari kita beralih ke Habilitasi, yang menunjukkan status seorang guru, mirip dengan anggota staf lembaga. Bahasa Inggris tracing habilitasi kertas [memenuhi syarat] ada, tetapi jarang digunakan, dan tentu saja tidak mengingatkan karyawan penuh waktu. Karena itu, saya menjelaskan ide ini secara singkat, dan tidak hanya menggunakan kata yang jarang, karena pendekatan mekanis seperti itu tidak akan memberikan apa pun kepada pembaca berbahasa Inggris. Tentu saja, GT tidak akan pernah melakukan itu, ia tidak memiliki model pengetahuan bagi para pembacanya.

Dua kalimat terakhir jelas menunjukkan pentingnya pemahaman untuk terjemahan yang tepat. Kata Jerman 15-huruf Wissenschaftler berarti "ilmuwan" atau "ilmuwan" ["ilmuwan" / "sarjana"]. Saya memilih opsi yang terakhir, karena menunjukkan semua intelektual secara umum. GT tidak mengenali seluk-beluk ini. Kata 17-kata Wissenschaftlerin yang terkait dalam kalimat terakhir, jamak, Wissenschaftlerinnen adalah konsekuensi dari penggunaan persalinan dalam kata benda Jerman. Sebuah kata benda pendek secara tata bahasa merujuk pada gender maskulin, oleh karena itu itu berarti seorang ilmuwan pria, dan sebuah kata benda panjang mengacu pada wanita, dan hanya berlaku untuk wanita. Karena itu, saya menulis "ilmuwan wanita." Sementara itu, GT tidak mengerti bahwa sufiks perempuan -in adalah yang utama dalam kalimat. Karena dia tidak mengerti bahwa wanita dikecualikan dari pertimbangan, mesin hanya sekali lagi menggunakan kata "ilmuwan", benar-benar kehilangan seluruh inti kalimat [ menarik bahwa GT menerjemahkannya ke dalam bahasa Rusia lebih benar / kira-kira. perev. ] Seperti halnya dengan Perancis, GT tidak tahu bahwa satu-satunya tujuan proposal Jerman adalah untuk menunjukkan perbedaan antara pria dan wanita.

Nah, selain kesalahan ini, sisa kalimat terakhir adalah mimpi buruk. Ambil bagian pertama. Apakah "ilmuwan tidak mempertanyakan" benar-benar terjemahan dari "Wissenschaftlerinnen kamen sowieso nicht in frage"? Mereka sama sekali tidak sesuai dengan makna. Kalimat tersebut hanya terdiri dari kata-kata bahasa Inggris yang dikuasai berdasarkan bahasa Jerman. Dan apa, apakah ini cukup untuk menggambarkan teks keluaran tertentu sebagai “terjemahan”? [ dalam versi terjemahan ke dalam bahasa Rusia, mimpi buruk tetap ada / kira-kira. perev. ]

Bagian kedua juga salah. Enam kata terakhir dalam bahasa Jerman secara harfiah berarti "sedikit lebih bersatu", atau, lebih lancar, "ada beberapa yang persetujuan orang lebih kuat" ["sedikit lebih satu lebih bersatu" / "ada sedikit tentang di mana orang lebih setuju ”] - namun, GT mengubah ide yang jelas ini menjadi“ ada beberapa ”[ kira-kira sama dalam bahasa Inggris dan Rusia / kira-kira. perev. ] Orang yang bingung mungkin bertanya "siapa yang beberapa?", Tetapi bagi seorang pendengar mekanik, pertanyaan ini tidak masuk akal. GT tidak tahu apa yang terjadi di balik layar, dan dia tidak mungkin menjawab pertanyaan yang tampaknya sederhana.Program penerjemahan tidak membayangkan jumlah atau angka atau hal-hal besar atau kecil. Dia hanya melempar simbol, tanpa gagasan sedikit pun bahwa mereka bisa melambangkan sesuatu.

* * *

Sangat sulit bagi seseorang yang telah mendapatkan pengalaman, pemahaman, dan menggunakan kata-kata yang bermakna sepanjang hidupnya untuk memahami bagaimana tanpa isi kata yang dilemparkan ke layar oleh mesin GT. Hampir tidak mungkin bagi orang untuk menolak asumsi bahwa perangkat lunak yang bekerja sangat baik dengan kata-kata harus memahami maknanya. Ilusi klasik yang berhubungan dengan AI ini disebut " efek Eliza, " karena salah satu program pertama yang membuat orang percaya bahwa tampaknya memahami bahasa Inggris adalah manipulator frase ELIZA yang tidak berguna yang berpura-pura menjadi psikoterapis di tahun 1960-an. Banyak orang yang berinteraksi dengan program ini menciptakan perasaan supernatural bahwa dia memahami perasaan mereka yang mendalam.

Selama beberapa dekade, orang-orang pintar - bahkan peneliti AI - telah berada di bawah pengaruh efek Eliza. Untuk mencegah pembaca saya jatuh ke dalam perangkap ini, izinkan saya mengutip beberapa frasa dari teks di atas - "GT tidak mengerti," "tidak menyadari," "GT tidak tahu." Sungguh ironis bahwa, walaupun frasa-frasa ini menuntut kurangnya pemahaman, mereka hampir menyinggung fakta bahwa GT dapat, paling tidak kadang-kadang, memahami arti kata, frasa atau kalimat. Tapi ini tidak benar. GT hanya mem-bypass pertanyaan untuk memahami bahasa.

Bagi saya, kata "terjemahan" memiliki aura misterius yang membangkitkan ingatan. Ini menunjukkan bentuk seni yang sangat manusiawi yang dengan anggun mengubah ide-ide yang jelas dari bahasa A menjadi ide-ide yang jelas dari bahasa B. Jejaring ini tidak hanya mempertahankan kejelasan, tetapi juga menyampaikan corak, nuansa dan fitur khas gaya penulisan penulis asli. Ketika saya menerjemahkan, pertama-tama saya dengan hati-hati membaca teks aslinya, mempelajari ide-ide sejelas mungkin, dan membiarkannya menggantung di pikiran saya. Bukan kata-kata yang melayang di pikiran - ide yang membangkitkan semua jenis ide terkait, menciptakan lingkaran cahaya yang kaya dari skenario yang menyertai di kepala saya. Sebagian besar halo ini, tentu saja, ada di alam bawah sadar. Hanya ketika halo dalam kesadaran saya terbangun dengan cukup, saya mulai mencoba untuk mengekspresikannya - “hilangkan” - dalam bahasa kedua.Saya mencoba mengatakan dalam bahasa B apa yang menurut saya alami untuk bahasa B berbicara tentang situasi seperti itu yang membentuk lingkaran makna yang sedang dibahas.

Secara umum, saya tidak beralih dari kata dan frasa bahasa A ke kata-kata dan frasa bahasa B. Sebaliknya, saya secara tidak sadar memanggil gambar, adegan, ide, pengalaman saya (atau pengalaman yang saya baca, lihat di film, mendengar dari teman-teman) ), dan hanya ketika itu merupakan "halo" mental non-verbal, figuratif, berpengalaman, - hanya saat itulah saya memulai proses merumuskan kata dan frasa dalam bahasa target, lalu mengedit, mengedit, dan mengedit. Proses ini, yang dimediasi oleh makna, mungkin tampak lambat - dan, tentu saja, dibandingkan dengan dua detik per halaman di GT, ini adalah apa itu - tetapi itu adalah penerjemah serius yang menggunakannya. Saya membayangkan sesuatu seperti ini ketika saya mendengar ungkapan "pikiran yang dalam".

* * *

Dengan semua ini, saya akan beralih ke bahasa Mandarin, bahasa yang jauh lebih menyebalkan dengan perangkat lunak pembelajaran mendalam daripada kedua bahasa Eropa. Untuk verifikasi, saya memilih memoar yang menyentuh Women Sa ("The Three of Us") - dramawan dan penerjemah Cina Yang Jiang , yang baru-baru ini meninggal pada usia 104. Dalam buku itu, dia mengenang jalinan kehidupan dirinya sendiri, suaminya Qian Zhongshu (juga seorang penulis dan penerjemah) dan putri mereka. Ini tidak ditulis dengan sangat rumit, tetapi menggunakan bahasa Mandarin yang hidup dan berpendidikan tinggi. Saya memilih bagian kecil dan mengatur GT di atasnya. Inilah hasilnya, bersama dengan terjemahan saya:
:

锺书到清华工作一年后,调任毛选翻译委员会的工作,住在城里,周末回校。 他仍兼管研究生。
毛选翻译委员会的领导是徐永煐同志。介绍锺书做这份工作的是清华同学乔冠华同志。
事定之日,晚饭后,有一位旧友特雇黄包车从城里赶来祝贺。客去后,锺书惶恐地对我说:

他以为我要做“南书房行走”了。这件事不是好做的,不求有功,但求无过。

:

After Zhongshu had worked at Tsinghua University for a year, he was transferred to the committee that was translating selected works of Chairman Mao. He lived in the city, but each weekend he would return to school. He also was still supervising his graduate students.
The leader of the translation committee of Mao's works was Comrade Xu Yongying, and the person who had arranged for Zhongshu to do this work was his old Tsinghua schoolmate, Comrade Qiao Guanhua.
On the day this appointment was decided, after dinner, an old friend specially hired a rickshaw and came all the way from the city just to congratulate Zhongshu. After our guest had left, Zhongshu turned to me uneasily and said:
“He thought I was going to become a 'South Study special aide.' This kind of work is not easy. You can't hope for glory; all you can hope for is to do it without errors.”

Google Translate:

After a year of work at Tsinghua, he was transferred to the Mao Translating Committee to live in the city and back to school on weekends. He is still a graduate student.
The leadership of the Mao Tse Translation Committee is Comrade Xu Yongjian. Introduction to the book to do this work is Tsinghua students Qiao Guanhua comrades.
On the day of the event, after dinner, an old friend hired a rickshaw from the city to congratulate. Guest to go, the book of fear in the book said to me:
He thought I had to do “South study walking.” This is not a good thing to do, not for meritorious service, but for nothing.

GT, :

, . - .
. , , .
, , , , . , , :
, « ». .

:

, , . , . , .
, , .
, , , . , :
, « ». . ; .
Jelaskan secara singkat keanehannya. Pertama, GT tidak pernah menyebut nama Zhongshu, meskipun namanya ("锺 书") muncul tiga kali dalam aslinya. Pertama, mesin menggunakan kata ganti "dia," yang kedua kali menulis buku [buku], dan yang ketiga buku ketakutan di dalam buku [buku ketakutan dalam buku]. Tebak saja! [ dalam versi Rusia "buku" misterius muncul sekali / kira-kira. perev. ]

Keanehan kedua - pada paragraf pertama jelas ditunjukkan bahwa Zhongshu mengawasi mahasiswa pascasarjana, tetapi GT sendiri menjadikannya seorang mahasiswa pascasarjana.

Keanehan ketiga adalah bahwa dalam frasa Komite Penerjemahan Mao Tse, sepertiga dari nama Ketua Mao [Tse ​​Tung] jatuh di suatu tempat.

Keanehan keempat - nama Yongying digantikan oleh Yongjian.

Keanehan kelima - setelah tamu kami pergi [setelah meninggalkan tamu kami], mereka hanya menggantinya dengan tamu untuk pergi [tamu pergi].

Keanehan keenam - kalimat terakhir sama sekali tidak berarti.

Enam dari keanehan ini sudah cukup untuk mempermalukan GT, tetapi maafkan mereka dan lupakan. Lebih baik fokus pada frasa membingungkan yang saya temui dalam teks - frasa lima karakter yang terlampir dalam tanda kutip dari paragraf terakhir ("南 书房 行走"). Ini dapat diterjemahkan secara simbolis sebagai "ruang buku selatan untuk berjalan-jalan," tetapi ini jelas tidak dapat diterima, terutama karena itu harus menjadi kata benda dalam konteks. GT menemukan "kantor selatan berjalan," dan itu tidak membantu.

Saya akui bahwa frasa bahasa Mandarin sama sekali tidak dapat dipahami oleh saya. Secara harfiah, itu berarti sesuatu seperti berjalan di kantor di sisi selatan sebuah bangunan, tetapi saya tahu itu salah - dalam konteks itu tidak masuk akal. Untuk menerjemahkan, saya perlu menemukan sesuatu yang tidak saya ketahui dalam budaya Tiongkok. Dan kemana saya pergi mencari bantuan? Buka google! (Tetapi tidak ke Google Translate). Saya memasukkan karakter Cina, dikelilingi oleh tanda kutip, meluncurkan pencarian untuk kecocokan persis. Dan sekelompok halaman web China muncul dengan cepat ke layar, setelah itu saya dengan susah payah mengarungi paragraf pertama dari beberapa situs pertama, mencoba memahami arti dari frasa tersebut.

Saya menemukan bahwa istilah ini berasal dari Dinasti Qing(1644–1911), dan menunjukkan pekerja mental yang membantu kaisar menyusun komunikasi resmi yang penuh gaya, dan bekerja di kantor selatan istana kekaisaran. Dua karakter, yang seharusnya menunjukkan "jalan-jalan," sebenarnya berarti asisten. Karena itu, menggunakan informasi dari pencarian Google, saya muncul dengan frasa "asisten khusus dari kantor selatan."

Sayang sekali bahwa GT itu sendiri tidak dapat menggunakan layanan Google Penelusuran, seperti yang saya lakukan. Tetapi sekali lagi, GT tidak dapat memahami halaman web, meskipun dapat menerjemahkannya menjadi sekejap mata. Atau mungkin? Selanjutnya, saya memberikan teks yang luar biasa yang langsung dilemparkan GT di layar saya setelah saya memberinya awal situs web tempat saya mendapatkan informasi yang diperlukan:
"Berjalan belajar di selatan" bukanlah posisi resmi, sebelum era Qing ini hanyalah "utusan", umumnya oleh para intelektual kekaisaran Hanlin untuk dijadikan sebagai. Studi selatan di pejabat Hanlin di "pilih barang chencai saja dan sangat baik" menjadi nilai, yang disebut "studi berjalan Selatan." Karena dekat dengan kaisar, keputusan kaisar memiliki pengaruh tertentu. Yongzheng kemudian mendirikan "pesawat militer," Menteri mesin militer, penuh waktu, meskipun penelitian masih Hanlin ke dalam nilai, tetapi tidak memiliki partisipasi dalam urusan pemerintah. Para sarjana di Dinasti Qing menjadi nilai bangga studi Selatan. Banyak cendekiawan dan cendekiawan di awal Dinasti Qing ke selatan melalui penelitian.
Apakah umumnya dalam bahasa Inggris? Tentu saja, kita semua dapat setuju bahwa teks tersebut terdiri dari kata-kata bahasa Inggris (sebagian besar), tetapi apakah ini berarti bahwa ini adalah teks bahasa Inggris? Menurut pendapat saya, karena paragraf ini tidak masuk akal, itu bukan bahasa Inggris; itu hanya bahan-bahan Inggris yang ditempatkan secara acak - salad kata-kata acak, hash yang bertele-tele.

Jika Anda tertarik, ini adalah versi saya dari bagian ini (saya membacanya selama beberapa jam):
Posisi Nan Shu Fan Xiaon Zu (asisten khusus dari Kabinet Selatan) tidak resmi, tetapi pada awal Dinasti Qing itu adalah peran khusus yang biasanya dimainkan oleh sarjana pengadilan saat ini. Sekelompok ilmuwan yang bekerja di kantor selatan istana kekaisaran memilih dari antara orang-orang mereka talenta hebat dan reputasi yang baik, sehingga ia menulis pidato untuk kaisar dan selalu berada di tempatnya; karena itu, peran ini disebut "asisten khusus dari Kabinet Selatan." Asisten, yang dekat dengan kaisar, jelas mampu memengaruhi keputusan politiknya. Namun, setelah Kaisar Yongzheng mendirikan Kementerian Perang, dengan Menteri dan berbagai bawahannya, asisten Kabinet Selatan, meskipun melayani kaisar, berhenti memainkan peran utama dalam membuat keputusan pemerintah. Namun, para sarjana dari Dinasti Qing berjuang untuk kemuliaan pos ini, dan pada tahun-tahun awal dinasti beberapa sarjana terkenal adalah asisten khusus.
Beberapa pembaca mungkin curiga bahwa, untuk mengkritik keras GT, saya secara khusus memilih bagian-bagian yang secara aktif dia temui, dan bahwa sebenarnya dia mengatasi sebagian besar teks jauh lebih baik. Kedengarannya bisa dipercaya, tapi ternyata tidak. Hampir setiap paragraf yang saya pilih dari buku-buku yang saya baca sekarang menyebabkan kesalahan terjemahan dari semua jenis dan garis, termasuk frasa yang tidak berarti dan tidak dapat dipahami seperti yang diberikan di atas.

Tentu saja, saya akui bahwa kadang-kadang GT mengeluarkan beberapa kalimat yang terdengar cukup bagus (walaupun bisa menyesatkan atau salah). Bahkan dapat terjadi bahwa satu atau dua paragraf akan berjalan dengan sempurna, menciptakan ilusi bahwa GT memahami apa yang dilakukannya, memahami apa artinya membaca. Dalam kasus seperti itu, GT terlihat mengesankan - hampir manusiawi! Dan semua pujian jelas berhubungan dengan penciptanya dan kerja keras mereka. Tetapi pada saat yang sama, jangan lupa apa yang GT lakukan dengan dua bagian bahasa Mandarin ini, dan sebelumnya dengan bahasa Prancis dan Jerman. Untuk memahami kesalahan ini, jangan lupa tentang "efek Eliza". Mesin berbahasa Bayan tidak membaca apa pun - tidak dalam arti manusiawi kata kerja "baca." Dia memproses teks. Karakter yang diproses tidak terkait dengan pengalaman duniawi. Dia tidak memiliki memori untuk menggambar apa pun, atau imajinasi, atau pemahaman, atau makna yang tersembunyi di balik kata-kata yang dengannya dia beroperasi begitu cepat.

* * *

Seorang teman bertanya kepada saya apakah keterampilan GT dapat dianggap sebagai fungsi basis data sederhana. Dia memperkirakan bahwa jika Anda meningkatkan basis data satu juta atau satu miliar kali, pada akhirnya, pada prinsipnya, itu akan dapat menerjemahkan semua yang mereka berikan, dan pada dasarnya ideal. Saya kira tidak. Menambah jumlah "data besar" tidak akan membawa Anda lebih dekat ke pemahaman, karena pemahaman tergantung pada ketersediaan ide, dan tidak adanya ide adalah akar dari semua masalah terjemahan mesin modern. Jadi saya yakin bahwa basis data yang lebih besar - bahkan yang lebih besar - tidak akan membantu di sini.

Pertanyaan alami lainnya: apakah penggunaan jaringan saraf di GT - imitasi otak - akan membawa kita lebih dekat ke pemahaman nyata oleh mesin bahasa. Pada awalnya ini terdengar masuk akal, tetapi sejauh ini tidak ada yang melakukan upaya untuk melampaui tingkat kata dan frasa yang dangkal. Semua jenis statistik tentang database besar tertanam dalam jaringan saraf, tetapi statistik ini hanya menghubungkan beberapa kata dengan yang lain, bukan ide. Tidak ada upaya untuk membuat struktur internal yang akan mewakili ide, gambar, ingatan atau pengalaman. Konstruksi mental seperti itu terlalu sulit dipahami untuk metode komputasi, dan karenanya, alih-alih mereka, algoritma yang cepat dan kompleks untuk akumulasi statistik kata-kata digunakan. Tetapi hasil dari teknik semacam itu tidak dapat dibandingkan dengan ide yang benar-benar muncul ketika seseorang membaca, memahami, menciptakan, memodifikasi, dan menilai teks.

Tetapi meskipun saya negatif, GT menyediakan layanan yang dihargai oleh banyak orang: GT dengan cepat mengubah kalimat bermakna yang ditulis dalam bahasa alami A menjadi kalimat kata yang tidak berarti dalam bahasa B. Dan sementara teks dalam bahasa B kurang lebih dapat dimengerti, banyak orang benar-benar puas dengan hasilnya. Jika mereka bisa mendapatkan "ide dasar" dari proposal yang ditulis dalam bahasa asing, mereka senang. Bagi saya, ini sama sekali bukan apa arti kata "terjemahan", tetapi bagi sebagian orang itu adalah layanan yang hebat, dan bagi mereka itu adalah terjemahan. Yah, saya bisa mengerti apa yang mereka butuhkan dan apa yang mereka sukai. Beruntung mereka!

Saya baru-baru ini menyaksikan grafik batang yang digambar oleh para teknofil yang mengklaim mewakili kualitas terjemahan yang dibuat oleh orang-orang dan komputer, dan bahwa grafik ini menunjukkan seberapa dekat terjemahan mesin dengan manusia. Dari sudut pandang saya, suatu kuantifikasi konsep yang tidak dapat diekspresikan secara kuantitatif sama sekali dengan ilmu semu, atau, jika Anda mau, para kutu buku mencoba membawa ke matematika hal-hal yang sifatnya yang tak kasat mata, halus, dan artistik menghindarinya. Menurut pendapat saya, kesimpulan hari ini dari GT berkisar dari sangat baik hingga aneh, tapi saya tidak bisa mengevaluasi perasaan saya tentang ini secara numerik. Ingat contoh pertama saya, menggunakan konsep "dia" dan "dia." Program tanpa berpikir menerjemahkan hampir semua kata dengan benar, tetapi terlepas dari keberhasilan ini, itu benar-benar tidak mengerti artinya. Lalu bagaimana cara mengekspresikan kualitas pekerjaan secara numerik? Menggunakan grafik pseudo-columnar untuk mewakili kualitas terjemahan hanyalah penyalahgunaan atribut eksternal sains.

Mari kita kembali ke gambaran sedih, di mana orang-penerjemah akan segera ditinggalkan, akan menjadi kuno, dan pada akhirnya akan terlibat dalam proofreading. Dalam kasus terbaik, hasilnya akan menjadi biasa-biasa saja. Seorang seniman yang serius tidak mulai bekerja dengan sampah kitsch penuh dengan kesalahan untuk membuat karya seni dengan membuat beberapa perubahan. Ini bukan sifat seni. Dan terjemahan adalah seni.

Dalam tulisan-tulisan saya selama bertahun-tahun, saya selalu mendukung pandangan bahwa otak manusia adalah sebuah mesin; mobil yang sangat kompleks; dan saya dengan penuh semangat berdebat dengan mereka yang mengatakan bahwa mesin pada dasarnya tidak mampu memahami. Bahkan ada sekolah filsafat yang menyatakan bahwa komputer tidak akan pernah "memiliki semantik" karena mereka terdiri dari "bahan yang salah" (silikon). Bagi saya, ini adalah omong kosong yang dangkal. Di sini saya tidak akan berdebat, tetapi saya tidak ingin mengesankan pembaca bahwa saya percaya bahwa kecerdasan dan pemahaman tidak akan pernah tersedia untuk komputer. Jika esai ini mendorong pemikiran seperti itu, maka itu hanya karena teknologi yang saya diskusikan tidak membuat upaya untuk mereproduksi kecerdasan manusia. Sebaliknya: mereka mencoba untuk menghindari kecerdasan, dan bagian-bagian yang dihasilkan menunjukkan kesenjangan yang menganga ini.

Dari sudut pandang saya, tidak ada larangan mendasar bahwa mesin, pada prinsipnya, suatu hari mulai berpikir, menjadi kreatif, lucu, bernostalgia, gembira, takut, antusias, patuh, tunduk, penuh harapan, dan sebagai hasilnya, bisa membuat yang baik terjemahan antar bahasa. Tidak ada alasan mendasar mengapa suatu hari nanti mereka tidak akan berhasil menerjemahkan lelucon, permainan kata-kata, skrip, novel, puisi, dan esai seperti ini. Tetapi semua ini hanya akan muncul ketika mobil dipenuhi dengan ide, emosi dan pengalaman, seperti orang. Tapi ini belum terlihat. Saya percaya bahwa ini masih sangat jauh. Setidaknya, orang ini sangat berharap untuk ini, sepanjang hidupnya mengagumi kedalaman pikiran manusia.

Ketika, suatu hari, seorang penerjemah mekanis menyusun sebuah novel syair yang terampil dalam bahasa Inggris, menggunakan iambik empat kaki yang jelas, berirama, kaya akan pikiran, sensualitas, dan kalimat yang hidup, saya akan mengerti bahwa inilah saatnya bagi saya untuk pergi.

Source: https://habr.com/ru/post/id410185/


All Articles