Pahami saya jika Anda bisa



Minggu lalu, kami menerima surat dari salah satu kandidat yang tidak lulus wawancara dalam bahasa Inggris. Ternyata kolega kami menjadi peserta dalam eksperimen teknis yang terjadi bersamaan dengan wawancara. Kami memberikan surat dengan perubahan minimal dan berterima kasih kepada penulis untuk ide dan keberanian yang menarik dalam penerapannya.

β€œKurasa aku tidak cocok untukmu, karena aku gagal tes bahasa Inggris, sayangnya. Ya, saya tidak memiliki praktik berbahasa Inggris yang baik, tetapi ini tidak mengganggu saya dari membaca lembar data dan berkomunikasi dengan dukungan asing melalui surat. Sebenarnya sekarang bukan tentang itu, mengetahui sebelumnya bahwa saya tidak akan lulus tes kemahiran bahasa, saya tidak bisa membantu tetapi mengambil kesempatan untuk mengambil pendekatan teknis untuk masalah ini. Meskipun saya tidak memiliki kesempatan untuk menguji metode saya di muka, terutama dalam berurusan dengan seseorang yang fasih berbahasa Inggris dan yang tahu fitur pengucapan, saya memutuskan untuk mencobanya.

Saya harus minta maaf atas percobaan kepada karyawan yang melakukan tes, dan untuk kualitas suara yang tidak begitu baik terkait dengan fitur teknis dari kompleks "saya".

Sebagai kompensasi untuk berpartisipasi dalam percobaan, saya akan menceritakan idenya. Meskipun ini bukan hal baru, saya pikir ini akan menarik bagi spesialis teknis Anda, dan dengan tingkat pelatihan dan pendekatan tim yang tepat, ini dapat digunakan untuk mendapatkan hasil yang menarik dan bahkan produk komersial.

Saya akan menjelaskan intinya: Saya menggunakan dua komputer yang terhubung ke Internet, dan Google Translate dengan pengenalan suara dan synthesizer. Untuk melakukan ini, saya menghubungkan jalur analog ponsel saya ke kartu audio dua unit sistem.

Satu unit sistem dikonfigurasikan untuk menerjemahkan dari Bahasa Inggris ke Bahasa Rusia, secara berurutan, keluaran audio dari telepon dihubungkan ke input garis dari kartu audio. Dalam pengaturan kartu suara, mode duplikasi sinyal dari input baris ke output headphone headset saya telah diatur, jadi saya mendengar ucapan orisinal dan melihat kebenaran dari pengenalan suara Google Translate.

Unit sistem kedua dikonfigurasi untuk menerjemahkan dari Bahasa Rusia ke Bahasa Inggris, input mikrofonnya terhubung ke mikrofon headset yang ada di saya. Saya menghubungkan output audio unit sistem ke jalur analog telepon.

Jadi, saya melihat teks bahasa Inggris dan mendengar yang asli, melihat terjemahannya, dan ketika saya mengatakan jawaban untuk komputer kedua, saya mensintesisnya ke dalam pidato. Karena Google berbicara dengan suara perempuan, saya menggunakan filter digital Fruity Loops untuk memberikan nada rendah maskulin dan mengirimkan suara yang sudah diproses ke jalur analog telepon.

Meskipun saya gagal dalam tes bahasa Inggris, alasannya bukan karena pengakuan yang salah. Saya dikecewakan oleh leher sempit dari sistem, yaitu koneksi Internet 3G - sayangnya, saya tidak memiliki jalur kecepatan lain. Di pagi hari, seperti yang saya pahami, base station kurang dimuat dan bandwidth saya cukup. Tetapi setelah makan siang, jaringan tenggelam pada saat yang paling tidak tepat.

Hasil percobaan adalah bahwa saya dapat bertahan pada beberapa kalimat pertama, kemudian kecepatan sintesis bicara tidak lagi cukup, saya beralih ke jawaban independen dan gagal. Meskipun saya melihat terjemahan yang benar, saya tidak dapat dengan cepat membangun kalimat. Lucu bahwa lawan bicaranya tidak memperhatikan peralihan dari robot ke seseorang, hanya menyoroti penghentian generator kebisingan kenyamanan, karena itu, dalam jeda, teman bicara saya berpikir bahwa koneksi terputus dengan erat.

Sistem perlu ditingkatkan - untuk pra-proses sinyal dari mikrofon, memotong kebisingan yang tidak memberikan efek keheningan, penting bagi Google. Kemudian dia akan dapat mengganggu pemrosesan dan mengalokasikan komponen suara, yang akan mengurangi lalu lintas keluar, meningkatkan kecepatan koneksi dan tidak kehilangan paket UDP. Dalam hal ini, sistemnya cukup bertarung. Kami mentransfer ini ke dua Raspberry PI dan mendapatkan penerjemah secara langsung.

Saya sendiri tidak dapat mewujudkan ide ini - saya perlu DSP untuk preprocessing, saya perlu melakukan sirkuit, membiakkan topologi papan sirkuit, menulis algoritma pemrosesan untuk DSP (walaupun mereka berada dalam domain publik), kemudian menulis sebuah program untuk Raspberry PI dengan fungsionalitas yang nyaman dan interaksi yang tepat dengan API. Google Tugas ini berada dalam kekuasaan saya, tetapi lebih cocok untuk tim pengembangan. Namun, masih terlalu banyak subtugas.

Saya pikir idenya menarik dan akan menemukan pembeli, perusahaan akan mudah direalisasikan, dan saya tidak akan mengumpulkan debu di rak-rak antusiasme sendiri.

Terima kasih telah mempertimbangkan pencalonan saya! "

Source: https://habr.com/ru/post/id398561/


All Articles