Wawancara dengan "Kepala Otak Alice"

RUVDS bersama Habr memulai sebuah proyek yang terdiri dari serangkaian wawancara dengan menarik, menurut pendapat kami, orang-orang di lingkungan TI. Hari ini kami menghadirkan wawancara dengan kepala pengembangan sistem interaktif di Yandex, Boris Yangel.

Mengapa Alice, bukan Max, apa yang mantan Menteri Komunikasi Nikifirov salah, mengapa meluncurkan Tesla ke luar angkasa. Jawaban dalam video dan teks di bawah potongan.

Wawancara disiapkan oleh Lera Negra dan editor Habr Nikolai Zemlyansky.



Hai Saya Lera Negra, dan hari ini tamu kami adalah Boris Yangel, kepala kelompok pengembangan sistem dialog di Yandex. Tentu saja, kami akan mulai dengan pekerjaan Anda, apa yang Anda lakukan sekarang di Yandex?

- Sekarang di Yandex, proyek utama saya adalah Alice, asisten suara yang diluncurkan Yandex Oktober lalu, dan grup saya bertanggung jawab atas apa yang bisa secara sewenang-wenang disebut otak Alice. Kami menafsirkan apa yang dikatakan pengguna dalam bahasa alami dan mengubahnya menjadi representasi terstruktur. Ini adalah tugas pertama kami, dan yang kedua adalah ketika kami sudah tahu apa yang perlu dijawab oleh pengguna, ubahlah itu menjadi jawaban dalam bahasa alami juga.

" Kamu telah berada di posisi ini selama dua tahun sekarang." Selama ini Anda terlibat dalam pengembangan. Apakah pelepasan asisten suara terlambat karena pesaing merilisnya lebih awal?

"Tidak, tentu saja, belum terlambat." Jika kita melihat pesaing, siapa pesaing sebenarnya? Ada Siri, satu-satunya asisten suara yang juga mengerti bahasa Rusia, tetapi hanya berfungsi di iOS dan MacOS, itu bukan platform paling populer di Rusia, dan ada pertanyaan tertentu tentang Siri sebagai produk. Lebih jauh, katakanlah Google sudah akan meluncurkan asisten Google-nya dalam bahasa Rusia, apakah layak untuk terlibat? Yah, mungkin itu memang sepadan, karena Anda dapat mencoba bersaing dengan Google di wilayah Anda untuk pemirsa, terutama karena dengan pencarian kami kurang lebih berhasil. Ya, dan mungkin, poin terakhir di sini penting: apa yang kita lihat sekarang adalah awal dari era sistem dialog, dan pada kenyataannya, baik Google, maupun Apple, atau, mungkin, kita masih tahu bagaimana membuatnya menjadi normal. Jika dibandingkan dengan mesin pencari, dengan apa yang terjadi di awal tahun 2000-an, ini adalah kondisi zaman Altavists, ketika ada beberapa produk, tetapi mereka masih bekerja pada beberapa prinsip aneh dan bekerja begitu-begitu, dan kapan saja datang bersyarat google dan ubah industri sepenuhnya. Oleh karena itu, tentu saja, masih layak untuk masuk ke dalamnya sekarang. Banyak tantangan dan masalah teknologi yang belum terselesaikan. Seorang pemain baru dapat datang dan membalikkan segalanya, dan kami sebenarnya berada dalam posisi yang sedikit lebih menguntungkan, karena kami mulai nanti, yang berarti kami memiliki tumpukan legacy yang lebih sedikit, yaitu, kami dapat segera bekerja dengan teknologi baru. Dan Siri, misalnya, yang Tuhan tahu kapan melakukannya, memiliki banyak kode lama yang sudah sulit diubah, dan karena ini mereka menghadapi banyak masalah.

- Dalam pidatonya di Akademi Yandex, Anda mengatakan bahwa Anda menangkap kereta hype tertentu. Bagaimana itu berhasil dan kereta ini pergi sekarang?

- Mungkin itu mungkin pertama-tama berkat keputusan yang sangat berani yang dibuat dalam produk kami. Semua pesaing memiliki sejumlah skenario yang dijabarkan secara kaku dalam produk-produk ini: β€œkita dapat menjawab pertanyaan ini dan itu, berbicara tentang cuaca atau sesuatu yang lain, dan jika apa yang dikatakan pengguna tidak termasuk dalam salah satu dari skenario ini, maka kami merespons dengan semacam rintisan seperti "Maaf, saya tidak mengerti Anda." Kami memutuskan untuk bertindak secara berbeda dan membuat modul jaringan saraf yang dalam situasi seperti itu dapat merespons dengan sesuatu yang mungkin sesuai dalam konteks dialog sebelumnya, dan pada kenyataannya dapat berkomunikasi dengan pengguna pada topik apa pun. Mungkin tidak selalu 100% sesuai, tetapi dalam lebih dari setengah kasus ia tentu bisa mengatakan beberapa hal yang perlu dikatakan pada saat itu. Dan modul kami mengatakan banyak hal yang disukai pengguna. Jawaban konyol Alice, yang tidak kami masukkan ke sana, tetapi yang ia hasilkan sendiri, langsung menyebar ke jejaring sosial, ini menciptakan kereta yang sangat hype. Tentu saja, dia pergi sedikit, ini tidak bisa dihindari, semua lelucon ini membosankan, tetapi kami mencoba mengembangkan produk lebih lanjut dan menangkap sensasi sedikit demi sedikit di mana kami bisa.

- Anda mencoba membuat Alice semenarik mungkin bagi pengguna Rusia. Bagaimana suara itu dipilih, dan mengapa dia Alice?

- Jujur, saya tidak berpartisipasi dalam proses memilih suara dan saya tidak tahu dengan prinsip apa itu diterapkan, kecuali bahwa itu adalah suara keren dari aktris Rusia Tatyana Shitova, yang disukai semua orang, cukup dikenali.

Saya dapat berbicara tentang nama Alice dan tentang karakteristiknya. Kami memikirkan dan menulis sejumlah properti yang kami ingin memiliki asisten. Misalnya, dia tidak boleh sombong, membantu seseorang, bersikap ramah, menjadi cerdas, yaitu, beberapa sifat positif dan negatif. Dan kemudian kami bertanya pada orang-orang tentang pertanyaan platform crowdsourcing kami, misalnya, apakah nama ini dikaitkan dengan properti ini atau tidak? Kami melihat nama mana yang sebelumnya kami pilih dari beberapa prinsip yang lebih berkorelasi dengan sifat positif daripada dengan yang negatif, dan dengan kriteria ini nama Alice menghancurkan semua pesaing lain dari daftar pendek. Ini mungkin disebabkan oleh fakta bahwa nama ini dalam budaya Rusia memiliki beberapa penjelasan positif, misalnya, Alice in Wonderland, Alice Selezneva, contoh klasik. Dan ini juga berlaku untuk sifat fonetis nama tersebut. Karena ini adalah nama yang akan ditujukan kepada Alice, maka tidak perlu ada suara yang sulit diucapkan oleh beberapa orang. Misalnya, huruf "P" pastinya tidak ada di sana, mendesis juga tidak boleh. Nama Alice memenuhi sifat-sifat ini.

- Kenapa Alice, bukan Max, kenapa dia bukan pria?

- Faktanya, banyak penelitian telah dilakukan, dan seorang wanita adalah pilihan yang lebih aman. Evolusi membuat kami sangat bahagia bahwa seorang wanita adalah seorang ibu, sesuatu yang aman, sayang, dan seorang pria adalah seorang pejuang yang hanya akan datang dengan tombak dan membunuhmu. Oleh karena itu, asisten wanita adalah normal untuk wanita dan pria, tetapi jika asistennya adalah pria, maka produk seperti itu akan lebih sedikit digunakan.

- Beberapa tahun yang lalu ada cerita yang tidak terlalu menyenangkan ketika bot obrolan Microsoft berperilaku sepenuhnya salah. Apakah ada risiko yang serupa dengan Alice, atau mungkin situasi serupa terjadi?

- Tentu saja, dan kami banyak memikirkan kisah ini ketika Alice diluncurkan. Seperti yang saya katakan sebelumnya, kami memiliki modul jaringan saraf yang merespons dalam situasi apa pun, dan tidak hanya dalam kerangka skenario. Dan dia memiliki kebebasan absolut. Dalam batasan beberapa batasan yang kami tetapkan, ia memiliki kebebasan untuk berbicara, dan dalam beberapa situasi ia dapat mengatakan hal-hal yang kami tidak ingin dia katakan. Bahasa kita sangat kuat dan kaya, ada satu miliar cara untuk setuju atau tidak, kita tidak akan pernah menghitung semuanya. Bagaimana mencegahnya agar tidak setuju ketika ditanya tentang sesuatu yang berbahaya sudah merupakan tugas penelitian yang sangat sulit.

- Apakah itu terkait dengan fakta bahwa dia sering berkata: "Saya tidak ingin membicarakannya"?

- Dia mengatakan "Saya tidak ingin membicarakan hal ini" ketika kami memahami bahwa situasinya terlalu berbahaya bagi modul jaringan saraf untuk memberikan jawaban. Bahkan, jika Anda mengizinkan Alice untuk mengatakan ya atau tidak, itu sudah cukup untuk menyinggung siapa pun. Cukup bertanya padanya: "Apakah Anda mendukung X" di mana X adalah fasisme, genosida, apa pun. Jika dia bilang ya, semuanya, tulis sudah hilang.

- Setelah lulus, Anda segera mulai bekerja di Yandex, itu adalah departemen yang bergerak dalam pencarian gambar melalui permintaan teks. Setelah itu, apakah tiba-tiba diputuskan untuk bekerja di Microsoft Research di Cambridge?

- Ya, tidak tiba-tiba, itu wajar. Saya bekerja di Yandex, saya ingin berkembang lebih jauh, untuk melakukan beberapa hal yang lebih kompleks.

- Apakah itu tidak berfungsi di Yandex?

- Di Yandex, di satu sisi, ternyata, di sisi lain, saya sudah mulai memimpin grup di Yandex yang bertanggung jawab atas kualitas pencarian dalam gambar. Saya mungkin tidak terlalu siap untuk pekerjaan seorang pemimpin, dan saya tidak benar-benar menyukainya, saya menyukainya dan sekarang saya suka memprogram, dan pekerjaan hanya menyisakan sedikit peluang untuk ini, kecuali jika Anda ingin bekerja 16 jam sehari. Saya tidak terlalu menyukainya, saya ingin berkembang hanya sebagai seorang programmer, spesialis analisis data, dan di sini saya menemukan pilihan yang bagus, lowongan di Microsoft, seolah-olah, sangat relevan dengan latar belakang saya.

- Apa yang kamu lakukan disana?

- Ada area seperti itu dalam pembelajaran mesin, demikian kesimpulan Bayesian. Ini adalah tentang bagaimana membuat keputusan yang benar-benar rasional dalam kondisi informasi yang tidak lengkap, sehingga orang dapat membuktikan bahwa keputusan yang lebih rasional tidak dapat dibuat dalam situasi ini. Saya bekerja di tim yang membuat perpustakaan perangkat lunak, dengan bantuan yang memungkinkan untuk menggunakan kekuatan penuh dari aparatus matematika ini untuk membuat keputusan dalam beberapa situasi. Bahkan, ini adalah perpustakaan untuk pembelajaran mesin, hanya berdasarkan beberapa prinsip tertentu, tidak konvensional.

- Dan pekerjaan di sana disiapkan untuk posisi kepemimpinan?

- Tidak, ketika saya kembali dari Cambridge kembali ke Yandex, saya dengan jujur ​​meminta saya untuk tidak memimpin siapa pun, mengatakan jika mungkin saya akan menulis kode, saya sangat suka menulis kode. Pada saat yang sama, saya tidak terlibat dalam proyek paling penting bagi perusahaan dan tidak sepenuhnya mengungkapkan fungsionalitas saya. Pada awalnya saya mengembangkan backend untuk beberapa aplikasi mobile eksperimental, kemudian saya mengembangkan metode klasifikasi teks dalam sekelompok jaringan saraf, dan pada titik tertentu manajemen memutuskan: mengapa Anda tidak melakukan sesuatu yang berguna, lakukan Alice.

- Dua tahun lalu, pers secara aktif membahas fakta bahwa pendidikan dasar IT, setidaknya di negara kita, tidak cukup berkembang. Seberapa siapkah Anda? Apa yang membantu Anda? Apakah ini sekolah Yandex, atau apakah Anda merasa cukup percaya diri setelah universitas?

- Saya dapat memprogram karena saya baru saja banyak memprogram. Sebagai seorang anak, saya duduk di depan komputer dan diprogram, di universitas juga. Di sana semua orang pergi ke suatu tempat untuk minum dan saya pergi untuk minum atau duduk pemrograman dan dari tahun pertama saya bekerja di perusahaan nyata hampir sedikit, memperoleh pengalaman di industri. Pengetahuan mendasar ini cukup untuk memahami hal-hal lain yang diperlukan secara langsung untuk bekerja sendiri. Sekolah analisis data , tentu saja, membantu, ini adalah inisiatif keren yang memberikan pengetahuan yang saat ini kurang pada saat keluar dari universitas. Benar, saya hanya belajar di sana selama satu tahun, karena butuh banyak waktu, ada begitu banyak tugas, yang sulit. Saya sudah bekerja di Yandex, saya tidak punya waktu. Tetapi secara umum, saya akan merekomendasikan semua orang untuk pergi ke sana.

- Menurut mantan Menteri Komunikasi Nikiforov, di negara kita sudah ada terlalu banyak programmer, terlalu banyak spesialis di bidang IT. Benarkah begitu? Apakah benar ada banyak spesialis yang benar-benar baik?

- Saya tidak tahu bagaimana pendapat Pak Nikiforov, tetapi sebagai orang yang perlu merekrut spesialis langsung ke timnya, saya memiliki masalah besar dengan perekrutan. Kami memiliki tugas yang agak sulit, dan diperlukan spesialis dengan level di atas rata-rata. Praktis tidak ada spesialis yang saya butuhkan di pasar, semua orang yang kemungkinan besar sudah bekerja di Yandex, yah, di sejumlah kecil tempat lain. Saya tidak tahu siapa yang dianggapnya programmer, tetapi ada sangat sedikit spesialis yang berkualifikasi tinggi, terutama di bidang jaringan saraf, pelatihan mendalam.

- Apa yang Anda lihat poin dari pekerjaan Anda, baik di perusahaan yang terpisah, dan secara umum di industri?

- Mungkin, jika Anda melihat hal-hal secara global, akan lebih baik untuk datang dengan sesuatu yang keren, teknologi atau ide sehingga orang-orang yang datang ke industri setelah saya akan membangun perkembangan mereka sendiri pada teknologi ini. Artinya, itu akan memasuki fondasi, seolah-olah, di mana semuanya dibangun secara bertahap. Saya tidak tahu apa yang akan terjadi, tetapi saya ingin meninggalkan setidaknya beberapa jejak, dan lebih mudah untuk melakukannya, mungkin jika Anda berkembang sebagai seorang pemimpin, karena dengan demikian ada lebih banyak sumber daya, Anda dapat mencoba beberapa ide yang lebih global dan ambisius . Tetapi jika saya meletakkan tangan saya di dalam hati yang lurus, saya tidak dapat mengatakan bahwa saya benar-benar suka memimpin orang, ini adalah kerja keras, itu membutuhkan banyak waktu, kekuatan moral dan tidak memungkinkan saya untuk melakukan apa yang saya sukai - untuk memprogram. Oleh karena itu, saya ingin mengembangkan ke arah yang memungkinkan saya menemukan keseimbangan optimal antara skala hal yang dapat saya lakukan dan yang dapat saya pengaruhi, dan kemampuan untuk langsung melakukan hal-hal ini dengan tangan saya sendiri. Bagi industri secara keseluruhan, ini adalah pertanyaan yang lebih menarik. Tampaknya bagi saya bahwa hal yang sama terjadi dengan antarmuka suara yang terjadi dengan antarmuka grafis, ketika mereka baru saja mulai muncul, ketika monitor warna pertama muncul, dan kami beralih dari konsol di mana perlu untuk memasukkan perintah, ke beberapa tombol yang memungkinkan untuk menekan. Dan ketika mereka pertama kali muncul, tidak ada yang tahu cara membuatnya secara normal, tidak ada paradigma, pola arsitektur, kerangka kerja, semua orang melakukan apa yang mereka inginkan, dan antarmuka bengkok, celaka, sangat sulit untuk membuatnya, tidak mungkin untuk membaca kode, tetapi orang-orang Kami memikirkannya, dan beberapa konsep yang indah secara bertahap muncul tentang cara membuat antarmuka ini, alat yang mudah muncul, dan sekarang seorang profesional di bidang ini dapat membuat situs web dengan beberapa antarmuka yang agak rumit dengan sangat cepat. Kami berpikir bagaimana melakukan hal yang sama dengan antarmuka suara. Alat apa yang seharusnya, sehingga bisa dilakukan dengan nyaman dan hasilnya bagus. Bahkan jika kita tiba-tiba tidak mendapatkan produk yang bagus, mungkin kita akan menguntungkan seluruh industri secara keseluruhan dengan menciptakan sesuatu ke arah ini.

- Apa yang bisa menggantikan Alice?

- Saya tidak tahu akan seperti apa. Antarmuka mana yang bisa lebih nyaman daripada suara ... Mungkin mengendalikan kekuatan pikiran, sesuatu seperti itu.

" Jika Alice mati, apakah kamu akan sedih?"

- Saya akan dibiarkan tanpa pekerjaan, ya, saya akan sedih.

- Perusahaan besar, proyek besar, apa kandidat pertama untuk keberangkatan menurut Anda?

"Yah, aku mungkin tidak akan memberikan nama, itu salah." Saya tidak bisa mengatakan bahwa seseorang adalah kandidat untuk penerbangan, karena dia membuat produk yang buruk. Di mana saya mengharapkan kegagalan, disinilah subsidi diperlukan untuk pengembangan bisnis. Misalnya, pasar taksi, atau semacam pengiriman makanan bersyarat - Food Fox, Deliveru Club. Di satu sisi, ini adalah proyek TI, di sisi lain, mereka berinteraksi dengan dunia nyata. Untuk pergi ke sana, Anda sekarang perlu mensubsidi banyak, membuang pesaing untuk membuat harga yang sangat kompetitif, menekan semua orang keluar dari pasar dan kemudian menaikkan harga. Ini mengarah pada fakta bahwa banyak orang datang dan membakar di sana hanya karena mereka kehabisan uang. Mereka tidak punya waktu untuk memeras siapa pun, dan mastodon seperti taksi Yandex di beberapa pasar Uber menghancurkan semua orang.

- Cryptocurrency. Anda berinvestasi, tidak, berinvestasi, apa, mengapa.

- Saya bukan investor crypto yang paling sukses, saya salah satu dari orang-orang yang memutuskan untuk berinvestasi sedikit di saat yang paling tidak menguntungkan, tentu saja, dan sekarang mereka duduk dan berharap bahwa bagaimanapun juga, Bitcoin akan tumbuh kembali. Jangan seperti saya.

- Apakah pesaing mencoba memikat Anda?

- Ya, saya biasanya menjawab bahwa sekarang saya tidak mencari pekerjaan lain.

- Jika bukan karena IT, lalu apa?

- Saya tidak tahu, saya suka terjun payung, mungkin saya akan menjadi instruktur terjun payung.

- Mengapa meluncurkan Tesla ke luar angkasa?

- Karena itu keren.

- Terima kasih banyak, Boris. Tamu kita hari ini Nikolay Zemlyansky, editor Habr, akan menanyakan beberapa pertanyaan lagi.

- Halo Boris. Saya ingin mengingat film yang baru dirilis, Blade Runner 2049, di mana Agent K memiliki asisten Android. Saya tidak ingat namanya, biarkan Masha. Ketika mereka berbicara dan dia tidak menyukai sesuatu, dia bisa mengatakan: "Masha, bitchiness minus three" atau "Masha sexuality plus lima". Bergantung pada ini, komunikasi dengan asisten disesuaikan. Menurut Anda apa yang nyata di masa mendatang, dan apakah ada artinya sama sekali?

- Saya sudah bicara sedikit tentang bagaimana kita menangani jawaban Alice yang menghina. Ini semua benar-benar satu cerita besar dan itu sebabnya. Agar Alice tidak menyinggung lawan bicaranya, kami benar-benar mengajarkan beberapa model untuk memprediksi apakah jawaban ini atau itu menyinggung, dan jika demikian, sampai sejauh mana. Sekarang kita menggunakan model-model ini sesuai dengan prinsip yang sangat sederhana: jika model mengatakan bahwa jawabannya tidak sopan, kita tidak memberinya jawaban. Dalam istilah yang Anda katakan, kami memutar hinaan menjadi nol. Faktanya, kita sudah memiliki model yang mengevaluasi gradasi dari penghinaan ini, dan jika suatu produk muncul, kita sudah dapat membuat slider yang membuat jawaban lebih atau kurang berani. Pendekatan yang kami gunakan untuk ini dapat diterapkan pada karakteristik lain dari perilaku sistem. Ini, tentu saja, akan memerlukan beberapa pekerjaan khusus untuk setiap karakteristik spesifik, tetapi untuk membuat asisten seperti itu, karakteristik yang dapat disesuaikan dengan slider, tidak akan mungkin dalam 20 tahun, tetapi lebih cepat, seperti yang terlihat oleh saya.

β€” , , , , , «». , . . , , ?

β€” , , , . . . , , . , . - , , . , , , . , , , . , : , - , , . , - , .

, Β« Β» -, , , , - β€” - , β€” , . Β« Β», . .

β€” , . , , , - ?

β€” , , , , , - , - , β€” , , . , , . , , , , . , , - , - . β€” , , , .

β€” , .

β€” , , , , .

β€” , , , , .

β€” , -.

β€” . ? , , , . , ?

β€” . Google, , Google- , . , , , . , , .

β€” , , ?

β€” . . , , , . Google, , . , .

β€” , Siri. ?

β€” , -, , . , , , , , , . . , , - , . , , , . . , , , . , - . , β€” , -, . , , .

β€” , , , , ?

β€” , , . , , . , - β€” , . - , . β€” , , , . , Google .

- Terima kasih Boris, senang berbicara dengan Anda.

- Sama-sama.

Source: https://habr.com/ru/post/id412535/


All Articles