
Di sini kami baru-baru ini berbisik bahwa dalam waktu lima tahun penerjemah dan guru bahasa tidak akan dibutuhkan. Dan masalahnya adalah bahwa sistem saraf kecerdasan buatan berkembang sangat aktif.
Seperti, mereka akan menerjemahkan teks dan ucapan dengan sangat kualitatif dan cepat sehingga kebutuhan akan spesialis yang masih hidup akan hilang begitu saja.
Tentu saja, kami tertawa, tetapi memikirkannya. Dan mereka memutuskan untuk mempelajari topik ini lebih dalam dan mencari tahu apa yang ada dengan kecerdasan buatan dan apakah itu benar-benar akan meninggalkan kita tanpa kerja.
Apa itu jaringan saraf tiruan
Singkatnya, jaringan saraf tiruan dibuat dalam upaya untuk mensimulasikan fungsi otak manusia menggunakan algoritma matematika.
Fitur utama dari jaringan saraf adalah kemampuan untuk belajar. Dari sudut pandang matematikawan, proses ini terlihat seperti masalah optimasi nonlinier, yang menggunakan analisis diskriminan dan metode pengelompokan.
Jika untuk humaniora, maka jaringan saraf tiruan mampu menganalisis data menggunakan algoritma yang kompleks dan melakukan operasi dengan sistem matematika dan sistem bahasa fuzzy yang terdefinisi dengan baik.
Dua contoh yang akan kita analisis.
Sistem matematika yang didefinisikan dengan baik adalah catur . Permainan memiliki sejumlah aturan yang jelas yang mutlak untuk dipenuhi. Ada tujuan khusus - untuk skakmat lawan.
Dan ada sejumlah besar langkah yang mungkin, di antaranya Anda harus memilih yang akan membawa kemenangan.
Kesulitan menganalisis permainan catur adalah bahwa jumlah permainan catur unik mendekati 10 ^ 120. Ya, ya, 10 hingga 120 derajat. Sebagai perbandingan, jumlah atom di alam semesta yang dapat diamati adalah sekitar 10 ^ 79.
Untuk menganalisis semua posisi secara fisik tidak realistis. Oleh karena itu, sistem dipaksa untuk memilih gerakan dan teknik yang mengarah pada keuntungan langsung atau penguatan posisi strategis.
Contoh kedua menggunakan jaringan saraf adalah terjemahan dari satu bahasa ke bahasa lain . Ini adalah sistem pemrosesan data yang sangat berbeda, karena ada ratusan aturan dan ribuan nuansa bahasa yang perlu dipertimbangkan ketika menerjemahkan.
Selain itu, sistem perlu memahami konteks untuk menerjemahkan kata atau permainan kata yang tidak dapat diterjemahkan. Jika tidak, bagaimana Anda bisa menemukan terjemahan kalimat yang benar dengan kata kerja "set", yang hanya memiliki 44 nilai yang dikenali?
Atau tugas yang lebih sulit adalah menyampaikan humor bahasa Inggris yang halus sehingga orang Rusia dapat menertawakannya. Atau yang lebih sulit adalah menerjemahkan ayat itu. Atau ... yah, Anda mengerti maksudnya.
Sekarang secara singkat tentang cara kerja jaringan saraf.
Sistem pertama menguraikan data menjadi komponen-komponen dasar. Dan kemudian satu atau lebih lapisan tersembunyi dari algoritma menganalisis data dan melakukan transformasi.

Dalam jaringan saraf yang dalam, ada beberapa lapisan algoritma yang berhubungan dengan analisis. Seringkali mereka mengalir di alam, di mana informasi dari lapisan bawah ditransfer ke lapisan yang ada di hierarki di atas dan memproses informasi di tingkat yang berbeda.

Selain itu, jika algoritma menemukan ketergantungan yang jelas dalam data, maka algoritma baru dibuat berdasarkan mereka.
Dalam catur, misalnya, sebuah mesin dengan sangat cepat “menciptakan” taktik untuk mengembangkan benda-benda dengan cepat dan menangkap bidang-bidang utama.
Dan semua karena manuver semacam itu hampir selalu memberi keuntungan dalam pembukaan.
Perhatikan bahwa dalam aturan permainan ini bahkan tidak dekat, tetapi sebagian besar permainan yang dimainkan mengkonfirmasi hipotesis, sehingga mesin mulai menggunakannya sendiri.
***
Hal yang sama berlaku untuk terjemahan arti kata, yang dalam berbagai bahasa bisa sangat berbeda.
Misalnya, ambil kata busur. Ia memiliki dua varian makna yang mendasar tetapi sangat berbeda - sayuran ("bawang") dan senjata kecil ("busur"). Ada lagi sepertiga dari slang - "bawang" mengacu pada kombinasi pakaian atau gambar yang modis (kertas kalkir dari "tampilan" bahasa Inggris). Ini jarang digunakan, tetapi jaringan saraf juga harus "tahu" itu.
Untuk mengetahui opsi terjemahan mana yang akan digunakan, sistem saraf menetapkan parameter sendiri untuk setiap nilai, yang juga bergantung pada kata-kata yang digunakan di dekatnya dalam kalimat.
Jadi, dalam kalimat "Sayang, beli satu kilogram bawang dan kentang" sistem akan menerjemahkan "bawang" sebagai "bawang". Dan semua karena ada "kilogram" di dekatnya, yang tidak digunakan dengan senjata kecil, dan "kentang", yang juga mengacu pada parameter "sayur".

Demikian pula dengan kalimat "Penembak menarik busurnya dan menembakkan panah ke arah musuh." Anda dapat "menarik" hanya busur sebagai senjata. Plus ada kata "penembak." Oleh karena itu, kami mendapatkan terjemahan - "busur".

Menarik. Kata "panah" dalam hal ini tidak akan dianggap signifikan dalam menentukan arti kata "busur". Dan semua itu karena "panah" juga bisa berarti batang hijau bawang sebagai sayuran. Oleh karena itu, cepat atau lambat pengecualian akan ditambahkan ke sistem yang tidak akan memperhitungkan kata "panah" dalam konteks haluan.
Ketika sistem belajar, jumlah algoritma dan parameter bertambah. Beberapa dari mereka membaik dan menjadi lebih rumit, beberapa dari mereka digantikan oleh opsi yang lebih ringkas.
Dan hasilnya adalah fenomena ketika, menurut kesimpulannya, mesin menjadi dekat dengan seseorang. Dan ini terlepas dari kenyataan bahwa masih ada sistem algoritma yang digunakan, bahkan kompleks dan multi-level.
Biarkan sibernetika dan matematikawan tidak bersumpah. Jika ada, maka kita adalah humanis dalam arti kata yang baik, dan kita menulis sebuah artikel untuk diri kita sendiri dari humanoids serupa.
Beberapa kata tentang Alpha Zero dan catur

Pada 2017, DeepMind, anak perusahaan Google, merilis program yang diperbarui untuk jaringan saraf. Para pengembang memutuskan untuk menguji program pada permainan strategis paling populer dengan aturan yang jelas: catur, pergi, dan shogi.
Proses belajar program catur hanya memakan waktu 24 jam. Hanya aturan permainan yang dimasukkan ke dalam sistem - itu saja. Tidak ada perpustakaan atau database pesta debut. Hanya aturannya. Dan 24 jam program dimainkan dengan sendirinya.
Di game pertama, langkah mutlak dilakukan. Benar, itu tidak dapat dilihat di mana saja - informasi tersebut diambil dari kata-kata para pengembang. Akibatnya, satu pihak kalah, dan sistem menganggap bahwa tindakan pihak kedua lebih baik untuk menang.
Setelah 24 jam dan 44 juta game dimainkan dengan sendirinya, AlphaZero menjadi pemain catur terkuat dalam sejarah permainan. Peringkat AlphaZero Elo adalah sekitar 3.500 poin, meskipun menurut berbagai sumber mencapai 5.000.
Sebagai perbandingan, peringkat amatir rata-rata adalah 1200 Elo, master olahraga dalam catur adalah 2200-2400 Elo. Peringkat maksimum yang diterima Elo oleh manusia adalah Magnus Carlsen, juara dunia yang berkuasa. Pada 21 April 2014, ia mencapai nilai 2889,2 poin Elo.

Alpha Zero memainkan sekitar 600 poin lebih kuat (dalam versi paling optimis). Ini seperti master olahraga yang bermain dengan pemain kelas dua. Dan pemain kelas dua di sini hanyalah pemain manusia terkuat.
Bagi para pecinta catur. Berikut ini adalah analisis dari
beberapa game Alpha Zero melawan Stockfish dari grandmaster Rusia Sergey Shipov. Dan jujur ​​saja, kami terkesan.
Alpha Zero dan Stockfish: apa bedanya
Stockfish adalah program catur komputer terkuat sampai Alpha Zero mempermalukannya.
Patut dicatat bahwa Stockfish menganalisis 70 juta posisi per detik, dan Alpha Zero - hanya 40.000, yang dianggap menjanjikan menurut metode Monte Carlo.
Yaitu, jaringan saraf tidak mengevaluasi setiap gerakan individu, tetapi jumlah dari hasil undian bergerak, memotong undian yang mengarah pada posisi kalah.
Akibatnya, Alpha Zero menghabiskan 99,99% lebih sedikit sumber daya untuk analisis.
Hasilnya, dari 100 pertandingan, Alpha Zero menang 28, 72 terikat dan tidak kehilangan satu pun.
Adapun catur, kecerdasan buatan saraf telah melampaui manusia dan rekan-rekan mesin yang lebih tua.
Tapi ini sebenarnya berlaku untuk sistem tertutup dengan seperangkat aturan awal tertentu.
Sekarang mari kita berurusan dengan sistem bahasa.
Kecerdasan Buatan Terjemahan dan Terjemahan

Kami sangat mengenal gagasan Google di bidang terjemahan - Google Translate.
Jadi, Google Translate dengan terjemahan bekerja sedikit berbeda dari Alpha Zero dengan catur. Dalam catur, sistem menganalisis set gerakan individu yang mengarah pada hasil yang paling menguntungkan. Untuk transfer, jaringan dua arah digunakan. Satu aliran membagi kalimat asli menjadi elemen semantik, dan aliran kedua mereproduksinya dalam urutan yang benar dalam bahasa lain.
Sesuatu seperti ini terjadi. Proposal dibagi menjadi beberapa komponen. Apalagi kata tersebut bukan komponen terkecil, karena makna kata tersebut dianggap level yang lebih dalam.Unsur-unsur penyusun yang dihasilkan dianalisis dalam makna menggunakan algoritma - lapisan tersembunyi belajar mandiri yang sama. Proposal dianalisis pertama dalam beberapa bagian, kemudian - semua bersama-sama dan bahkan dalam arah yang berlawanan. Misalnya, dalam bahasa Jerman, partikel “nicht” di akhir kalimat secara radikal mengubah keseluruhan maknanya.
Representasi skematis dari proses. Setiap lapisan algoritma menganalisis kalimat dalam konfigurasi yang berbeda, dan kemudian “mengumpulkan” kalimat dari makna yang diterima dalam bahasa lain, dengan mempertimbangkan fitur gramatikalnya.Tetapi jika semuanya jelas dengan catur, maka bahasa adalah sistem yang lebih fleksibel dalam aturan, yang juga memungkinkan terjemahan kalimat yang akurat tidak hanya "dalam huruf", tetapi juga "dalam semangat". Artinya, penerjemah dapat secara sadar mengorbankan keakuratan terjemahan literal untuk menyampaikan maknanya lebih dalam.
Terjemahan puisi fiksi
Contoh umum adalah terjemahan ayat-ayat. Lagipula, hampir tidak mungkin untuk menerjemahkan bahkan satu quatrain untuk mempertahankan ritme, dan susunan kata, dan makna penuhnya.
Tidak mungkin ada algoritma yang seragam, karena seringkali Anda harus secara radikal mengulang sebuah ayat untuk menyampaikan makna sebenarnya.
Tentu saja, terjemahan ayat adalah salah satu bidang linguistik yang paling sulit, tetapi jaringan saraf telah menunjukkan diri sebagai yang terbaik dalam perhitungan yang akurat, jadi kita akan mulai dengan yang paling sulit.

Misalnya, ambil soneta Shakespeare yang kedua. Sebagai alternatif, kami mengutip teks asli, terjemahan oleh S. Trukhtanov (kami memilih opsi ini dari banyak yang murni subyektif) dan terjemahan dari Google Translate.
Asli:
Ketika empat puluh musim dingin akan mengepung alismu,
Dan gali parit yang dalam di ladang wanita cantikmu,
Livery bangga pemuda Anda, jadi menatap sekarang,
Akan menjadi gulma compang-camping, bernilai kecil dipegang:
Kemudian ditanya di mana letak semua kecantikanmu,
Di mana semua harta hari-hari sehatmu,
Untuk mengatakan, di dalam matamu sendiri tenggelam dalam,
Adalah rasa malu yang serba makan dan pujian hemat.
Betapa lebih banyak pujian yang pantas digunakan oleh kecantikanmu,
Jika kau bisa menjawab, "Anakku yang cantik ini
Hitung jumlah saya dan buat alasan lama saya, "
Membuktikan kecantikannya dengan suksesi Anda!
Ini harus dibuat baru ketika kamu tua,
Dan lihatlah darahmu hangat ketika kamu merasakannya dingin.
Seperti yang Anda lihat, bahasa Inggris jelas ketinggalan jaman di sini - bahkan ada orang kedua tunggal yang tidak digunakan dalam bahasa Inggris modern. Dan ini semakin menyulitkan terjemahan.
Secara umum, kami tidak akan menarik dan hanya melihat perbedaan antara terjemahan manusia dan mesin:

Dan jujur ​​saja, ini jauh dari kinerja Google terbaik. Mungkin itu sebabnya penganut terjemahan mesin malu ketika ditanya apakah algoritma mereka dengan ayat akan bekerja. Lagipula, bahkan Google Translate yang dibanggakan bahkan tidak bisa mengatasinya.
Terjemahan prosa fiksi
Jika demikian, coba sesuatu yang lebih sederhana. Prosa artistik. The Great Gatsby Fitzgerald.

Asli:
“Di tahun-tahun yang lebih muda dan lebih rentan, ayah memberi saya beberapa saran yang telah saya pikirkan sejak saat itu.
"Kapan pun Anda merasa ingin mengkritik siapa pun," katanya kepada saya, "ingatlah bahwa semua orang di dunia ini tidak memiliki kelebihan yang Anda miliki."
Sekarang bandingkan terjemahan manusia dan mesin. Sebagai pembela kemanusiaan, kami mengambil terjemahan N. Lavrov.

Terjemahan Lavrov tidak persis sesuai dengan aslinya. Ada perubahan dalam pengaturan frasa, kalimat agak lebih diperluas daripada dalam bahasa Inggris. Tetapi secara umum, kesan itu harmonis, makna dan suasana hati sepenuhnya ditransmisikan.
Terjemahan mesin lebih akurat dalam hal mekanika - kalimat diterjemahkan persis seperti yang ditulis dalam aslinya. Maknanya disampaikan dengan cukup baik, tetapi ada masalah dengan "kamu-kamu" dan semuanya terdengar canggung.
Dalam terjemahan sastra seseorang dapat mengorbankan sedikit keakuratan demi keharmonisan atau keharmonisan frasa. Penerjemah manusia menggunakan ini, bahkan sering tidak perlu, tetapi mesin tidak.
Jadi apa selanjutnya?
Benar, demi keadilan, harus disebutkan bahwa Google Translate menerjemahkan teks teknis, di mana keakuratan terjemahan secara literal penting, sempurna dan praktis tanpa kesalahan. Tetapi karakter-karakter yang mengklaim bahwa penerjemah akan dibiarkan tanpa kerja dalam 5-10 tahun dengan aman dapat dikirim dalam perjalanan berjalan kaki yang panjang.
Prosesor dan algoritma pemrosesan data yang ada dapat mengatasi sistem yang memiliki seperangkat aturan terbatas. Catur atau pergi hanya itu. Tetapi dengan varietas fleksibel sistem seperti bahasa, di mana batas-batas aturan kabur, program harus menambahkan algoritma rumit yang tidak perlu yang bekerja jauh dari sempurna.
Ada kemungkinan bahwa algoritma hanya perlu lebih banyak waktu untuk belajar bekerja dengan bahasa secara akurat. Nah, kami akan melakukan pekerjaan kami lebih jauh dan setengah melacak keberhasilan jaringan saraf di bidang ini.
Tetapi jangan mengandalkan jaringan saraf tiruan untuk saat ini - belajar bahasa Inggris dan kembangkan sendiri.
EnglishDom.com - platform pembelajaran bahasa Inggris online

Belajar bahasa Inggris di kursus online dari EnglishDom.com. Dengan
referensi - 2 bulan berlangganan ke semua program sebagai hadiah.
Dan untuk komunikasi langsung, pilih pelatihan Skype dengan seorang guru. Pelajaran uji coba pertama gratis, daftar di sini. Dengan kode promo
goodhabr2 - 2 pelajaran sebagai hadiah saat membeli dari 10 pelajaran. Bonus ini berlaku hingga 05/31/19.