Contre tout le monde: assistants vocaux intégrés à l'application


Utilisez-vous des assistants vocaux tous les jours? Non . Bien que je les développe depuis plus de 7 ans!
Avec ces mots, la session de développement de notre conférence sur les technologies conversationnelles à Moscou s'est ouverte.

Et qu'est-ce qui ne va pas avec tous ces «Alice», «Maroussia» et «Google Assistants»? Pourquoi les utilisateurs sont-ils mal à l'aise avec eux, mais incompréhensibles pour les entreprises? Et quelle est l'alternative open source à tout cela?



Problèmes des assistants vocaux mobiles


Tous les assistants vocaux mobiles fonctionnent aujourd'hui selon le principe de la «moissonneuse» - des centaines et des milliers de fonctions sont cachées sous un seul bouton de microphone. Il semblerait - ce qui est plus pratique? Vous n'avez pas besoin de garder des dizaines ou deux des icônes d'applications tierces à portée de main. Je viens de cliquer sur le microphone, dit - et ça ne fonctionne pas .

Mais voici les problèmes que vous rencontrerez à la fois en tant qu'utilisateur et en tant que développeur d'une fonction vocale pour de tels "assistants".



1. Nom unique


Chaque voix "compétence" (Alice - "compétence") doit avoir un nom unique . En effet, sinon une «moissonneuse» à un bouton ne pourra pas les distinguer! Et plus l'assistant vocal a de fonctions, plus il est difficile de choisir un tel nom pour que les utilisateurs s'en souviennent.

2. Découverte sophistiquée


"Alice, lance la compétence Mon magasin préféré." Ou "Ok Google, parle à Pizza Papa Johns." Est-ce familier? L'utilisateur doit encore apprendre à lancer votre service vocal.

3. Limitations de l'interface utilisateur, UX et API


Voice Assistant est une application tierce avec ses limites. En tant que développeur, vous ne pouvez pas ajouter les contrôles et widgets dont vous avez besoin à son interface. En conséquence, vous devez simplement travailler avec ce que vous avez, bien que votre fonctionnalité puisse être beaucoup plus large!

Et bien plus


De plus, il existe des limitations imposées par les technologies de reconnaissance et de synthèse de la parole, il est difficile d'autoriser un utilisateur dans votre service et bien plus encore .

Par conséquent, l'utilisateur ne peut tout simplement pas trouver votre service vocal, ne sait pas comment lui parler et est confronté à des fonctionnalités limitées. Et vous, en tant que développeur, ne comprenez pas comment amener votre utilisateur sur une nouvelle chaîne qui promet un millionième public .

Assistant concept in-app


Votre entreprise possède probablement déjà une application mobile avec des fonctionnalités claires, des outils de développement, de promotion et d'analyse.



Vous comprenez d'où vient l'utilisateur et qui il est. Quelles fonctions il utilise, comment les améliorer, les développer et comment cela affecte l'entreprise. Derrière tout cela, il y a votre équipe de développement mobile, les concepteurs, les spécialistes UX, le département QA et les produits.

Et l'utilisateur comprend les fonctionnalités de votre application.
Lorsque j'ai besoin de transférer de l'argent à quelqu'un, je lance l'application de ma banque, où mes comptes sont liés. Lorsque vous devez commander des produits - je lance l'application de magasin, dans laquelle j'achète habituellement des marchandises.

L'utilisateur agit toujours en fonction de la situation et lance l'application mobile qui satisfera précisément son besoin ici et maintenant. Il n'y a aucune raison de croire que l'utilisateur va définitivement appuyer sur le bouton du microphone dans l'espoir que l'assistant vocal a la fonction dont il a besoin et qu'il satisfera sa demande!

Ainsi, le concept d'un assistant intégré à l'application est apparu - le concept d'un assistant vocal qui fonctionne déjà à l'intérieur de votre application mobile en tant qu'interface utilisateur supplémentaire . Dans ce cas, toutes les limitations de l'assistant moissonneuses sont nivelées, et l'utilisateur comprend la fonctionnalité de l'assistant en fonction du contexte de l'application mobile.

Cas d'assistance in-app


La fonction vocale est tout aussi situationnelle que le lancement d'une application mobile. Il peut être pratique pour l'utilisateur de démarrer une fonction par la voix, si

  • Il s'agit d'un nouvel utilisateur et il n'a pas encore compris la structure de l'interface utilisateur de votre application.
  • L'utilisateur ne se souvient pas où le menu ou le bouton souhaité est caché
  • S'il a juste besoin de répéter l'action précédente
  • Si vous pouvez dire deux mots au lieu de 5 bandes et rouleaux
  • Quand il est plus facile d'expliquer un problème que de chercher une solution dans l'application

Regardez quelques cas simples.


Par exemple, dans une application bancaire, vous pouvez transférer des fonds à des personnes de votre liste de contacts. L'assistant intégré à l'application peut comprendre qui veut dire l'utilisateur lorsqu'il dit «Transférer 500 roubles à maman». Et l'utilisateur n'a pas besoin de rechercher le bouton souhaité, de rechercher le contact et d'entrer le montant.


Dans l'application du détaillant, l'utilisateur peut appeler un assistant pour décrire simplement le problème, et l'assistant proposera le bon produit.



Il est important de comprendre ici qu'une telle interface vocale n'est que complémentaire à une interface utilisateur existante. Comme déjà mentionné ci-dessus, la valeur n'apparaîtra que lorsque l'assistant agit comme un «navigateur» ou un système de recommandation.

Et comme il s'agit de votre propre assistant dans votre application, il ne se limite pas à tout ce que nous avons énuméré ci-dessus dans cet article: vous n'avez pas besoin de trouver un nom unique, l'interface utilisateur peut être n'importe quoi, l'assistant peut interagir directement avec les fonctions de l'application, etc.

Comment ajouter de la voix à votre application




Oui, vos développeurs mobiles devront faire face à une variété de technologies tout de suite pour intégrer l'interface vocale. Et cela malgré le fait que c'est une sorte d'ajout sympa, et non la fonctionnalité principale ... À savoir: se connecter à un système de reconnaissance vocale, à la synthèse vocale, au moteur de traitement du langage, déposer votre propre interface utilisateur de l'assistant vocal, implémenter l'architecture et la couvrir de tests.

Mais il existe une solution open source qui contribuera à rendre tout cela beaucoup plus rapide et plus efficace!

Aimybox


Récemment, nous avons déjà écrit un peu sur l'assistant vocal open source Aimybox , qui est précisément conçu pour faciliter la mise en œuvre des fonctions vocales dans une application mobile existante. Ici, nous parlerons de lui en termes de concept d'assistants intégrés.



Désormais, vous ne surprendrez personne avec la présence d'un bouton de chat en ligne sur le site, ce qui permet de contacter rapidement l'opérateur et de poser des questions sur les biens et services. Il s'agit d'une fonctionnalité supplémentaire qui, cependant, augmente les conversions lorsqu'elle est utilisée correctement. De plus, pour démarrer le chat en ligne sur votre site, en règle générale, il vous suffit d'ajouter une balise de script à votre code HTML.

Aimybox va dans le même sens, mais en ce qui concerne l'assistant vocal. Tout ce que vous avez à faire est d'ajouter quelques dépendances à votre projet d'application mobile et quelques lignes de code pour que le bouton du microphone apparaisse dans le coin inférieur droit.

Ici, vous pouvez voir comment cela se fait.



Hors de la boîte, Aimybox donne une interface utilisateur concise et personnalisable (qui, si vous le souhaitez, peut être complètement modifiée) et l'assistant SDK lui-même. De plus, en tant que moteurs de reconnaissance , de synthèse et de PNL , vous pouvez choisir parmi ceux existants ou créer votre propre module.

Essentiellement, Aimybox implémente l'architecture de l'assistant vocal, normalisant les interfaces de tous ces modules et organisant correctement leur interaction. Ainsi, en introduisant cette solution, vous pouvez considérablement réduire le temps de développement d'une interface vocale au sein de votre application.



En fin de compte


Les assistants vocaux sont bien sûr excellents. Mais le sentiment est que le chemin qu'ils empruntent maintenant ne fait qu'éloigner l'utilisateur et l'entreprise d'une technologie pratique. Et souvent, cela est également dû au fait que les développeurs ne savent pas encore comment créer une UX vocale de haute qualité. Nous avons également récemment écrit comment résoudre ce problème.

Dans cet article, nous avons essayé de parler brièvement du concept complètement nouveau des assistants intégrés à l'application, c'est-à-dire des assistants vocaux en tant que fonction interne d'une application mobile. Dans ce cas, la valeur de la voix en tant qu'interface utilisateur supplémentaire devient claire pour l'utilisateur et le développeur.

Liens utiles


Source: https://habr.com/ru/post/fr479554/


All Articles