Tindakan Ideal untuk Asisten Google - 8 pelajaran dari Moscow Hackathon



Pada akhir Juli, Google mengadakan hackathon tertutup di kantornya di Moskow (yang berseberangan dengan Kremlin). Temanya adalah pengembangan Tindakan untuk asisten suara . Kami ( Just AI ) dan selusin tim lainnya menghadiri acara ini dan membawa tidak hanya ransel merah dengan Google nishtyaks, tetapi juga banyak pengetahuan yang berguna tentang cara membuat antarmuka suara berkualitas tinggi.

Selama beberapa hari hackathon, semua orang mencoba mengembangkan aplikasi suara untuk asisten, dan seseorang bahkan menerbitkan karya mereka di direktori Tindakan Google. Pada contoh aplikasi kita , kita akan berbicara tentang cara membuat Aksi sempurna dan mudahnya google moderasi.

Apa itu Tindakan di Google?


Google Assistant tidak hanya dapat melakukan perintah suara standar. Anda dapat membuat add-on Anda sendiri untuknya, yang akan menambah fungsionalitas ke asisten. Google menyebut tindakan add-on ini. Dan dalam bahasa Rusia ini diterjemahkan sebagai "aplikasi". Baca lebih lanjut tentang Tindakan di Google di sini .

Mengapa buat Action Anda sendiri


Jika Anda membuat semacam aplikasi seluler, atau jika Anda memiliki situs web yang menyediakan layanan bermanfaat bagi pelanggan, maka Google Assistant adalah saluran keren lain untuk berinteraksi dengan konsumen Anda. Lagi pula, asisten suara diinstal pada lebih dari 500 juta perangkat! Dan ini tidak hanya smartphone, tetapi juga speaker pintar, mobil, jam tangan, TV. Karena itu, jika Anda menambah situs web atau aplikasi Anda dengan keterampilan asisten suara, kemungkinan besar Anda akan menemukan pelanggan dan pengguna baru karena mereka sudah berbicara dengan asisten di semua perangkat ini. Dan mereka lebih cenderung memberi tahu teman dan kenalan Anda tentang layanan Anda.

Cara melakukan Tindakan dengan benar


Tetapi jangan berpikir bahwa aplikasi untuk asisten suara sama dengan situs. Ini adalah pengalaman pengguna yang berbeda secara mendasar (UX), yang sudah memiliki panduannya sendiri. Pengguna berbicara dengan asisten, sehingga aplikasi asisten Anda harus berbicara kepada pengguna dalam bahasa alami.



Di hackathon, kami menggunakan perancang antarmuka percakapan Aimylogic kami sendiri, tempat kami mengimplementasikan aplikasi pertama kami untuk Google Assistant. Dan pada contohnya, sekarang kita akan berbicara tentang pelajaran paling berharga yang kita pelajari selama ini.


Ini adalah bagaimana Aksi selesai kami terlihat di konstruktor Aimylogic.

Pelajaran nomor 1. Aksi adalah suara


Asisten adalah antarmuka suara. Pengguna berbicara dengan asisten ketika lebih mudah untuk mengatakan, daripada membuka aplikasi atau situs.


Sangat penting untuk memahami dengan jelas mengapa fungsi layanan Anda ini atau itu dapat bermanfaat bagi pengguna melalui antarmuka suara.

Suara adalah saat Anda harus cepat, dan terkadang tanpa melihat layar sama sekali. Suara itu adalah ketika pertanyaan dan jawabannya pendek dan jelas untuk pertama kalinya. Dan jika untuk kepentingan ini pengguna tidak perlu membuat lima klik, maka ia pasti akan memanfaatkan peluang ini.

Dalam aplikasi kami "Yoga untuk mata" ada fungsi seperti itu. Ini sebenarnya latihan untuk penglihatan. Pengguna tidak boleh terganggu oleh layar selama kelas. Itu sebabnya kami menggunakan antarmuka suara.

Pelajaran nomor 2. Tindakan harus benar-benar bermanfaat


Asisten menyelesaikan tugas pengguna, dan tidak hanya membuka browser


Jangan membuat aplikasi asisten yang tidak bermanfaat bagi pengguna. Tindakan bisa sangat sederhana dan hanya melakukan satu fungsi layanan Anda, tetapi itu harus benar-benar bermanfaat. Kalau tidak, itu tidak masuk akal.

"Yoga untuk mata" bermanfaat karena pengguna tidak perlu mengingat latihan dan urutannya di kompleks yang berbeda. Itu hanya memanggil Aksi, yang membaca latihan satu per satu, dan pengguna mengeksekusi mereka.

Untuk melakukan ini, kami memilih beberapa kompleks yang berbeda dan menempatkan latihan dalam spreadsheet Google biasa pada lembar yang berbeda. Aplikasi kita menggunakan tabel ini sebagai basis data , memilih daftar latihan dari lembar yang diinginkan menggunakan permintaan HTTP, dan kemudian membacakannya kepada pengguna dalam satu siklus. Segera setelah pengguna menyelesaikan latihan berikutnya, dia berkata "Ayo," dan Action membaca yang berikut.



Pelajaran nomor 3. Tindakan harus jelas dan dapat diprediksi.


Asisten selalu menjelaskan apa yang dia harapkan dari pengguna. Dan pengguna selalu tahu apa yang akan dilakukan asisten sekarang.


Tindakan adalah dialog antara asisten dan pengguna. Ketika Action menunggu replika berikutnya, pengguna harus mengerti apa yang bisa ia katakan sekarang, dan bagaimana asisten akan merespons. Kalau tidak, asisten akan tampak bagi pengguna tidak memadai dan tidak bisa dimengerti. Dan Anda tidak akan mau menggunakannya.

Aplikasi "Yoga untuk mata" secara singkat tetapi jelas menjelaskan kepada pengguna bahwa ia harus mengatakan "Ayo" setiap kali ia menyelesaikan latihan berikutnya. Setelah itu, asisten membaca latihan selanjutnya dan menunggu lagi. Jadi pengguna mengerti apa yang harus ia lakukan dan apa yang asisten harapkan darinya. Dialognya sederhana tetapi secara mengejutkan efektif.

Di bagian Frasa, kami menambahkan sinonim untuk frasa “Ayo,” sehingga asisten merespons secara memadai terhadap formulasi lain. Dan kami juga menambahkan tombol dengan tips - sehingga pengguna pertama kali memahami cara kerja aplikasi kami. Kami juga menggunakan variabilitas dalam jawaban agar tidak mengulangi frasa yang sama setiap kali pengguna memulai pelajaran.



Pelajaran nomor 4. Tindakan harus berbicara singkat, tetapi secara alami


Mendengarkan teks panjang dari robot itu sulit. Dan jika teks terdengar tidak wajar, itu akan menjadi lebih buruk.


Asisten adalah robot yang ingin menjadi seperti manusia. Dalam praktiknya, ini berarti fakta bahwa semua replika asisten harus dapat dimengerti, tetapi tidak boleh terlalu robot.

Sintesis ucapan adalah hal yang rumit. Teksnya sedikit lebih panjang - dan pengguna tidak mendengarkannya sampai akhir. Dan jika asisten itu seperti robot akan mengenkripsi pesan secara singkat, maka pengguna tidak akan memahaminya sama sekali. Ya, atau dia akan membutuhkan lebih banyak upaya untuk memahami apa yang dituntut darinya.

Jadi kerjakan jawaban Anda . Buat mereka pendek di satu sisi, dan tambahkan pidato percakapan di sisi lain.

Ketika kami memilih serangkaian latihan untuk dilihat dari Internet, kami melihat bahwa mereka cocok untuk situs, dan bukan untuk antarmuka interaktif. Oleh karena itu, kami mengerjakan ulang setiap latihan agar lebih pendek dan lebih mudah dimengerti pada saat yang sama. Misalnya, di situs dengan latihan ada teks seperti itu

"Tutup matamu. Kemudian gosok telapak tangan dan tempelkan ke mata Anda. Tetap dalam posisi ini sampai tangan Anda mengeluarkan panas. Kemudian, tanpa membuka mata Anda, gosok telapak tangan Anda kembali dan letakkan di mata Anda lagi. Lakukan latihan tiga kali. "


Kami mengubahnya seperti itu

"Tutup matamu. Gosok telapak tangan Anda dengan keras, bawa ke mata Anda dan duduk seperti itu sebentar. ”


Dan pecah menjadi dua baris. Ketika pengguna mengatakan "Silakan," asisten akan menjawab, "Sekarang ulangi ini dua kali lagi . "

Anda tidak bisa hanya menyalin teks dari situs dan menggunakannya untuk asisten suara . Kita perlu bekerja pada teks-teks sehingga mereka dapat dimengerti oleh telinga.

Pelajaran nomor 5. Tindakan harus berinteraksi dengan pengguna


Asisten adalah asisten pribadi. Seharusnya membantu pengguna mendapatkan hasilnya, dan tidak hanya menunggu tindakan darinya.


Di situs web atau di aplikasi seluler, kami membuat antarmuka dengan tombol, daftar, gambar, dll. Asisten suara juga dapat melakukan semua ini, tetapi perbedaan utamanya adalah dia berbicara dan memungkinkan pengguna untuk mengatakan kalimat apa pun. Dan ini mengubah pendekatan ke UI.

Pengguna mungkin tidak mendengar apa yang dikatakan asistennya. Atau tidak mengerti pertama kali. Asisten harus selalu siap untuk mengulang jika ditanya. Atau susun ulang jawaban Anda jika pengguna tidak memahaminya. Tempatkan diri Anda pada posisi asisten. Anda berbicara dengan orang lain, dan penting bagi Anda untuk memahami Anda, dan belum tentu pertama kali. Anda tidak hanya menunjukkan kepada lawan bicara selembar kertas dengan item menu, tetapi membantu untuk membuat pilihan.

Dalam "Yoga untuk mata," kami membuatnya sehingga asisten selalu dapat mengulangi latihan jika pengguna bertanya. Selain itu, tidak hanya menampilkan teks latihan lagi, tetapi secara sehari-hari, menawarkan untuk melakukan latihan sekali lagi. Untuk melakukan ini, kami menggunakan beberapa variasi frasa “Ulangi” di blok Frasa dan atur gelembung lain dengan teks sebelum mengulangi teks latihan.



Pelajaran nomor 6. Tindakan tidak memiliki hak untuk istirahat


Asisten harus merespons dengan memadai bahkan untuk frasa pengguna yang tidak dapat dipahami


Asisten tidak memiliki "layar biru" atau jendela kesalahan dan tombol OK. Dan pengguna, pada gilirannya, dapat mengatakan apa saja, dan sama sekali tidak apa yang Anda latih. Dalam hal ini, aplikasi tidak boleh "menyalahkan" pengguna karena "tidak mengatakannya". Penting untuk entah bagaimana menanggapi perintah yang tidak bisa dimengerti dan sekali lagi menjelaskan kepada pengguna apa yang diharapkan darinya.

Hanya mengatakan, "Oh, saya tidak mengerti Anda" tidak cukup. Ini sama dengan menampilkan jendela favorit semua orang dengan kesalahan. "Dan apa yang harus aku lakukan selanjutnya?" - pengguna akan bertanya.

“Yoga for the eye” bereaksi terhadap frasa yang tidak dapat dipahami dengan sangat sederhana - ini menjelaskan kepada pengguna apakah ia menyelesaikan latihan saat ini. Dan jika dalam hal ini dia menjawab sesuatu yang tidak dapat dipahami, dia akan bertanya apakah dia ingin menyelesaikan studinya sama sekali. Untuk melakukan ini, kami menggunakan cabang "Frasa lain" di blok Frasa untuk menanggapi perintah yang tidak bisa dipahami. Kebetulan bahwa jika pengguna tidak dikonfigurasi untuk melanjutkan pelajaran, maka asisten dengan santai mengajaknya untuk menyelesaikan.



Berikan lebih banyak frasa perhatian yang tidak bisa dimengerti . Bagaimanapun, ini adalah "fungsi yang paling sering digunakan" dari Action Anda.

Pelajaran nomor 7. Tindakan harus mengenali pengguna


Asisten adalah asisten yang mengetahui penggunanya dan mengubah perilakunya dari waktu ke waktu.


Jika pengguna meluncurkan Tindakan Anda untuk pertama kalinya, maka aplikasi harus berbicara tentang apa itu untuk dan bagaimana menggunakannya. Tetapi jika pengguna memanggil aplikasi setiap hari, maka tidak masuk akal untuk memuatnya dengan bantuan yang sama setiap waktu. Anda perlu mengubah perilaku aplikasi, seperti yang dilakukan asisten, yang setiap hari mengenal penggunanya dengan lebih baik.

Aimylogic memiliki informasi tentang berapa lama pengguna mengakses aplikasi terakhir kali. Yoga for the Eyes menggunakan ini untuk menyambut pengguna secara berbeda pada saat startup. Dan karena pengisian perlu dilakukan setiap hari, aplikasi kami mengingatkan Anda tentang hal ini jika pengguna belum memulai aplikasi untuk waktu yang lama. Untuk melakukan ini, kami menggunakan blok Ketentuan, di mana kami memeriksa berapa lama yang lalu kami menerima permintaan sebelumnya. Bergantung pada ini, Aksi melewati berbagai cabang dialog.



Pelajaran nomor 8. Tindakan harus diakhiri


Anda harus memutuskan koneksi dari mikrofon ketika aplikasi selesai bekerja.


Jika ini tidak dilakukan, maka Google akan menolak aplikasi Anda saat menerbitkan dalam direktori. Karena itu, aplikasi Anda harus memiliki setidaknya satu cabang dialog, yang mengarah ke jalan keluar dari aplikasi. Dalam hal ini, Anda harus "menutup" mikrofon.

Dalam "Yoga for the eyes," pengguna selalu dapat mengatakan "Cukup" atau "Saya lelah" untuk menyelesaikan kelas. Aimylogic memiliki blok penyelesaian skrip - kami menggunakannya dalam dialog kami untuk mengucapkan selamat tinggal kepada pengguna dan menyelesaikan Tindakan kami.



Dan beberapa tips lagi dari kami


Jangan mencoba memasukkan semua fungsi layanan Anda ke aplikasi suara untuk asisten. Dialog adalah tentang kesederhanaan, bukan tentang multifungsi. Tindakan Anda hanya dapat melakukan satu fungsi, tetapi sangat mudah dilakukan sehingga pengguna akan mengakses aplikasi Anda persis setiap hari.

Jangan lakukan IVR lain dari asisten . Asisten tidak boleh mendaftar jawaban yang mungkin - ini tidak wajar. Ketika Anda masuk ke menu suara, itu adalah kesengsaraan. Tidak perlu melakukan hal yang sama dari asisten. Dia bisa mengenali ucapan, jadi kerjakan naskah Anda sehingga itu wajar. Dalam Aimylogic yang sama ada semua alat untuk ini, dan pada saat yang sama, Anda tidak perlu menulis kode sama sekali.

Tombol adalah petunjuk, bukan elemen utama dari UI suara . Asisten bukan antarmuka tombol, tetapi antarmuka suara. Karena itu, tombol-tombol itu hanya boleh digunakan sebagai petunjuk. Dialog Anda harus sedemikian rupa sehingga pengguna berupaya tanpa tombol.

Tulis kebijakan privasi singkat dan sertakan nama aplikasi Anda di dalamnya. Tanpa ini, aplikasi Anda tidak akan dimoderasi oleh Google. Lihatlah versi final kami , agar tidak membuat kesalahan yang sama seperti yang kami lakukan :)

Kesimpulannya


Google Assistant baru-baru ini mulai mengerti bahasa Rusia. Dan masih tidak banyak dari apa yang ada di Barat (suara dingin, speaker pintar, dll.). Tapi semua ini masalah waktu. Tetapi sekarang Anda dapat mencoba mengembangkan saluran baru ini untuk layanan Anda, menggunakan pengalaman yang ada yang dibagikan oleh Google dan pengembang lainnya.



PS . Beberapa saat kemudian kami akan mempublikasikan dalam tutorial kami petunjuk langkah demi langkah tentang cara melakukan Yoga untuk Mata di Aimylogic. Datang ke obrolan Telegram kami agar pengembang tidak ketinggalan publikasi.

Source: https://habr.com/ru/post/id420083/


All Articles