Terhadap semua orang: asisten suara dalam aplikasi


Apakah Anda menggunakan asisten suara setiap hari? Saya tidak . Meskipun saya telah mengembangkannya selama lebih dari 7 tahun!
Dengan kata-kata ini, sesi pengembangan konferensi kami tentang teknologi percakapan di Moskow dibuka.

Dan apa, sebenarnya, yang salah dengan semua "Alice", "Maroussia" dan "Asisten Google" ini? Mengapa pengguna tidak nyaman dengan mereka, tetapi tidak bisa dipahami untuk bisnis? Dan apa alternatif open source untuk semua ini?



Masalah asisten suara seluler


Semua asisten suara seluler saat ini bekerja sesuai dengan prinsip "pemanen" - ratusan dan ribuan fungsi disembunyikan di bawah satu tombol mikrofon. Tampaknya - mana yang lebih nyaman? Anda tidak perlu menyimpan lusinan atau dua ikon aplikasi pihak ketiga. Cukup klik pada mikrofon, katakan - dan itu tidak berfungsi.

Tapi di sini ada masalah yang akan Anda temui baik sebagai pengguna dan sebagai pengembang fungsi suara untuk "asisten" tersebut.



1. Nama unik


Setiap suara "skill" (Alice - "skill") harus memiliki nama yang unik . Memang, jika tidak, "pemanen" satu tombol tidak dapat membedakan antara mereka! Dan semakin banyak fungsi yang dimiliki oleh asisten suara, semakin sulit untuk memilih nama tersebut sehingga pengguna dapat mengingatnya.

2. Penemuan canggih


"Alice, luncurkan skill Toko favoritku." Atau "Oke Google, bicaralah dengan Pizza Papa Johns." Apakah itu familier? Pengguna masih perlu diajari cara meluncurkan layanan suara Anda.

3. Keterbatasan UI, UX dan API


Asisten Suara adalah aplikasi pihak ketiga dengan keterbatasannya. Anda, sebagai pengembang, tidak dapat menambahkan kontrol dan widget yang Anda butuhkan ke antarmuka-nya. Akibatnya, Anda hanya perlu bekerja dengan apa yang Anda miliki, meskipun fungsionalitas Anda bisa jauh lebih luas!

Dan masih banyak lagi


Selain itu, ada batasan yang diberlakukan oleh pengenalan ucapan dan teknologi sintesis ucapan, sulit untuk mengotorisasi pengguna dalam layanan Anda dan banyak lagi .

Akibatnya, pengguna seringkali tidak dapat menemukan layanan suara Anda, tidak tahu bagaimana berbicara dengannya, dan dihadapkan dengan fungsionalitas yang terbatas. Dan Anda, sebagai pengembang, tidak mengerti cara membawa pengguna Anda ke saluran baru yang menjanjikan pemirsa sejuta .

Konsep asisten dalam aplikasi


Bisnis Anda kemungkinan besar sudah memiliki aplikasi seluler dengan fungsionalitas yang jelas, pengembangan, promosi, dan alat analisis.



Anda mengerti dari mana pengguna berasal dan siapa dia. Fungsi apa yang dia gunakan, bagaimana meningkatkannya, mengembangkannya, dan bagaimana itu memengaruhi bisnis. Di belakang semua ini adalah tim pengembangan ponsel Anda, desainer, spesialis UX, departemen QA dan produk.

Dan pengguna memahami fungsionalitas apa yang dimiliki aplikasi Anda.
Ketika saya perlu mentransfer uang kepada seseorang, saya meluncurkan aplikasi bank saya, di mana akun saya ditautkan. Ketika Anda perlu memesan produk - saya meluncurkan aplikasi toko, di mana saya biasanya membeli barang.

Pengguna selalu bertindak sesuai dengan situasi dan meluncurkan aplikasi seluler yang tepat akan memuaskan kebutuhannya di sini dan sekarang. Tidak ada alasan untuk percaya bahwa pengguna pasti akan menekan tombol mikrofon dengan harapan bahwa asisten suara memiliki fungsi yang ia butuhkan dan akan memenuhi permintaannya!

Jadi konsep asisten dalam aplikasi muncul - konsep asisten suara yang sudah berfungsi di dalam aplikasi seluler Anda sebagai antarmuka pengguna tambahan . Dalam hal ini, semua batasan asisten pemanen diratakan, dan pengguna memahami fungsi asisten berdasarkan konteks aplikasi seluler.

Asisten dalam aplikasi kasus


Fungsi suara sama situasionalnya dengan peluncuran aplikasi seluler. Mungkin nyaman bagi pengguna untuk memulai beberapa fungsi dengan suara, jika

  • Ini adalah pengguna baru, dan dia belum menemukan struktur UI aplikasi Anda.
  • Pengguna tidak ingat di mana menu atau tombol yang diinginkan disembunyikan
  • Jika dia hanya perlu mengulangi tindakan sebelumnya
  • Jika Anda dapat mengucapkan dua kata, bukannya 5 kaset dan gulir
  • Ketika lebih mudah untuk menjelaskan masalah daripada mencari solusi di dalam aplikasi

Lihatlah beberapa kasus sederhana.


Misalnya, dalam aplikasi perbankan, Anda dapat mentransfer dana ke orang-orang dari daftar kontak Anda. Asisten dalam aplikasi dapat memahami siapa yang dimaksud pengguna saat ia mengatakan "Transfer 500 rubel ke ibu." Dan pengguna tidak perlu mencari tombol yang diinginkan, mencari kontak dan memasukkan jumlahnya.


Dalam aplikasi pengecer, pengguna dapat memanggil asisten untuk menjelaskan masalahnya, dan asisten akan menawarkan produk yang tepat.



Penting untuk dipahami di sini bahwa antarmuka suara semacam itu hanya melengkapi UI yang ada. Seperti yang telah disebutkan di atas, nilai hanya akan muncul jika asisten bertindak sebagai "navigator" atau sistem rekomendasi.

Dan karena ini adalah asisten Anda sendiri di dalam aplikasi Anda, itu tidak terbatas pada semua yang kami sebutkan di atas dalam artikel ini: Anda tidak perlu membuat nama yang unik, UI dapat berupa apa saja, asisten dapat berinteraksi dengan fungsi aplikasi secara langsung dan sebagainya.

Bagaimana cara menambahkan suara ke aplikasi Anda




Ya, pengembang seluler Anda harus berurusan dengan berbagai teknologi segera untuk mengintegrasikan antarmuka suara. Dan terlepas dari kenyataan bahwa ini adalah tambahan yang bagus, dan bukan fungsi utama ... Yaitu: terhubung ke sistem pengenalan ucapan, sintesis ucapan, ke mesin pengolah bahasa, simpan asisten suara Anda sendiri UI, implementasikan arsitektur dan tutupi dengan tes.

Tetapi ada solusi open source yang akan membantu membuat semua ini lebih cepat dan lebih efisien!

Aimybox


Baru-baru ini, kami telah menulis sedikit tentang asisten suara open source Aimybox , yang dirancang khusus untuk memfasilitasi implementasi fungsi suara dalam aplikasi seluler yang ada. Di sini kita akan berbicara tentang dia dalam hal konsep asisten dalam aplikasi.



Sekarang Anda tidak akan mengejutkan siapa pun dengan kehadiran tombol obrolan online di situs, yang memungkinkan untuk dengan cepat menghubungi operator dan mengajukan pertanyaan tentang barang dan layanan. Ini adalah fitur tambahan, yang, bagaimanapun, meningkatkan konversi bila digunakan dengan benar. Selain itu, untuk memulai obrolan online di situs Anda, sebagai aturan, Anda hanya perlu menambahkan satu tag skrip ke kode HTML Anda.

Aimybox berjalan di jalur yang sama, tetapi sehubungan dengan asisten suara. Yang perlu Anda lakukan adalah menambahkan beberapa dependensi ke proyek aplikasi seluler Anda dan beberapa baris kode sehingga tombol mikrofon muncul di sudut kanan bawah.

Di sini Anda dapat melihat bagaimana ini dilakukan.



Di luar kotak, Aimybox memberikan UI yang ringkas dan dapat disesuaikan (yang, jika diinginkan, dapat diubah sama sekali) dan asisten SDK itu sendiri. Selain itu, sebagai mesin pengenalan , sintesis , dan NLP , Anda dapat memilih dari yang sudah ada atau membuat modul Anda sendiri.

Intinya, Aimybox mengimplementasikan arsitektur asisten suara, menstandarisasi antarmuka semua modul ini, dan mengatur interaksi mereka dengan benar. Dengan demikian, dengan memperkenalkan solusi ini, Anda dapat secara signifikan mengurangi waktu untuk mengembangkan antarmuka suara dalam aplikasi Anda.



Pada akhirnya


Asisten suara tentu saja hebat. Tetapi perasaannya adalah bahwa jalan yang mereka ambil sekarang hanya mengarahkan pengguna dan bisnis menjauh dari teknologi yang nyaman. Dan seringkali ini juga disebabkan oleh fakta bahwa pengembang belum tahu cara membuat UX suara berkualitas tinggi. Kami juga menulis baru-baru ini tentang cara memperbaikinya.

Pada artikel ini, kami mencoba untuk berbicara secara singkat tentang konsep asisten in-app yang benar-benar baru - yaitu, tentang asisten suara sebagai fungsi internal aplikasi seluler. Dalam hal ini, nilai suara sebagai UI tambahan menjadi jelas bagi pengguna dan pengembang.

Tautan yang bermanfaat


Source: https://habr.com/ru/post/id479554/


All Articles