Action idéale pour Google Assistant - 8 leçons du Hackathon de Moscou



Fin juillet, Google a organisé un hackathon fermé dans son bureau de Moscou (celui en face du Kremlin). Le thème était le développement d' actions pour un assistant vocal . Nous ( Just AI ) et une douzaine d'autres équipes avons participé à cet événement et avons sorti non seulement des sacs à dos rouges avec Google nishtyaks, mais également beaucoup de connaissances utiles sur la façon de créer des interfaces vocales de haute qualité.

Pendant quelques jours de hackathon, tout le monde a essayé de développer une application vocale pour un assistant, et quelqu'un a même publié ses travaux dans le répertoire Google Actions. Sur l'exemple de notre application, nous parlerons de la façon de créer l'action parfaite et facilement de la modération google.

Qu'est-ce que les actions sur Google


L'Assistant Google peut non seulement exécuter des commandes vocales standard. Vous pouvez créer vos propres modules complémentaires pour lui, ce qui ajoutera des fonctionnalités à l'assistant. Google appelle ces modules complémentaires Actions. Et en russe, cela se traduit par une «application». En savoir plus sur les actions sur Google ici .

Pourquoi créer votre propre action


Si vous créez une sorte d'application mobile ou si vous avez un site Web qui fournit à vos clients des services utiles, Google Assistant est un autre canal intéressant pour interagir avec votre consommateur. Après tout, l'assistant vocal est installé sur plus de 500 millions d'appareils! Et ce ne sont pas seulement des smartphones, mais aussi des haut-parleurs intelligents, des voitures, des montres, des téléviseurs. Par conséquent, si vous complétez votre site Web ou votre application avec une compétence d'assistant vocal, vous trouverez très probablement de nouveaux clients et utilisateurs, car ils parlent déjà à l'assistant sur tous ces appareils. Et ils sont plus susceptibles de parler de vos services à vos amis et connaissances.

Comment faire l'action correctement


Mais ne pensez pas que la demande d'assistant vocal soit la même que le site. Il s'agit d'une expérience utilisateur fondamentalement différente (UX), qui a déjà ses propres directives . L'utilisateur parle avec l'assistant, donc votre application d'assistant doit parler l'utilisateur dans un langage naturel.



Lors du hackathon, nous avons utilisé notre propre concepteur d'interface conversationnelle Aimylogic , sur lequel nous avons implémenté notre première application pour Google Assistant. Et sur son exemple, nous allons maintenant parler des leçons les plus précieuses que nous avons apprises pendant cette période.


Voici à quoi ressemble notre action terminée dans le constructeur Aimylogic.

Leçon numéro 1. L'action c'est la voix


Assistant est une interface vocale. Les utilisateurs parlent avec un assistant quand c'est plus pratique de le dire, plutôt que d'ouvrir une application ou un site.


Il est absolument nécessaire de bien comprendre pourquoi telle ou telle fonction de votre service peut être utile à l'utilisateur via l'interface vocale.

La voix, c'est quand vous en avez besoin rapidement, et parfois sans regarder l'écran du tout. La voix est lorsque la question et la réponse sont courtes et claires la première fois. Et si pour cela, l'utilisateur n'a pas besoin de faire cinq clics, il profitera certainement de cette opportunité.

Dans notre application «Yoga pour les yeux», il existe une telle fonction. Ce sont en fait des exercices de vision. L'utilisateur ne doit pas être distrait par l'écran pendant les cours. C'est pourquoi nous utilisons l'interface vocale.

Leçon numéro 2. L'action devrait être vraiment utile


L'assistant résout les tâches de l'utilisateur et n'ouvre pas seulement le navigateur


Ne faites pas une application assistant qui ne fait rien d'utile à l'utilisateur. L'action peut être très simple et n'effectuer qu'une seule fonction de votre service, mais elle devrait être complètement utile. Sinon, cela n'a aucun sens.

Le «yoga pour les yeux» est utile dans la mesure où l'utilisateur n'a pas besoin de mémoriser les exercices et leur ordre dans différents complexes. Il appelle simplement une action, qui lit l'exercice un par un, et l'utilisateur les exécute.

Pour ce faire, nous avons sélectionné plusieurs complexes différents et placé les exercices dans une feuille de calcul Google régulière sur différentes feuilles. Notre application utilise ce tableau comme base de données , sélectionne une liste d'exercices à partir de la feuille souhaitée à l'aide d'une requête HTTP, puis les lit à l'utilisateur dans un cycle. Dès que l'utilisateur a terminé l'exercice suivant, il dit «Allez» et Action lit ce qui suit.



Leçon numéro 3. L'action doit être claire et prévisible.


L'assistant explique toujours ce qu'il attend de l'utilisateur. Et l'utilisateur sait toujours ce que l'assistant va faire maintenant.


L'action est un dialogue entre un assistant et un utilisateur. Lorsque Action attend la prochaine réplique, l'utilisateur doit comprendre ce qu'il peut dire maintenant et comment l'assistant va répondre. Sinon, l'assistant paraîtra insuffisant et incompréhensible à l'utilisateur. Et vous ne voudrez pas l'utiliser.

L'application «Yoga pour les yeux» explique brièvement mais clairement à l'utilisateur qu'il doit dire «Allez» chaque fois qu'il termine le prochain exercice. Après cela, l'assistant lit l'exercice suivant et attend à nouveau. L'utilisateur comprend donc ce qu'il doit faire et ce que l'assistant attend de lui. Le dialogue est simple mais étonnamment efficace.

Dans la section Phrases, nous avons ajouté des synonymes pour l'expression «Come on», afin que l'assistant réponde adéquatement aux autres formulations. Et nous avons également ajouté des boutons avec des conseils - pour que l'utilisateur, la première fois, comprenne comment fonctionne notre application. Nous avons également utilisé la variabilité dans les réponses afin de ne pas répéter la même phrase chaque fois que l'utilisateur commence la leçon.



Leçon numéro 4. L'action devrait parler brièvement, mais naturellement


Écouter un texte long à partir d'un robot est difficile. Et si le texte ne semble pas naturel, ce sera encore pire.


Un assistant est un robot qui veut être comme un humain. En pratique, cela se traduit par le fait que toutes les répliques de l'assistant doivent être compréhensibles, mais pas trop robotiques.

La synthèse vocale est une chose compliquée. Le texte est un peu plus long - et l'utilisateur ne l'écoute pas jusqu'au bout. Et si l'assistant est comme un robot qui crypte le message en un mot, l'utilisateur ne le comprendra pas du tout. Eh bien, ou il aura besoin de plus d'efforts pour comprendre ce qu'on attend de lui.

Alors travaillez sur vos réponses . Faites-les courts d'une part et ajoutez-leur de la conversation de l'autre.

Lorsque nous avons sélectionné des ensembles d'exercices pour la vue sur Internet, nous avons vu qu'ils étaient bien adaptés au site, et non à l'interface interactive. Par conséquent, nous avons retravaillé chaque exercice pour le rendre plus court et plus compréhensible en même temps. Par exemple, sur un site avec des exercices, il y avait un tel texte

«Fermez les yeux. Frottez ensuite vos paumes et attachez-les à vos yeux. Restez dans cette position jusqu'à ce que vos mains dégagent de la chaleur. Ensuite, sans ouvrir les yeux, frottez vos paumes en arrière et remettez-les dans vos yeux. Effectuez l'exercice trois fois. "


Nous l'avons changé comme ça

«Fermez les yeux. Frottez vos paumes durement, portez-les à vos yeux et asseyez-vous comme ça pendant une minute. »


Et a éclaté en deux lignes. Lorsque l'utilisateur dit «Allez-y», l' assistant répondra: «Maintenant, répétez encore deux fois . »

Vous ne pouvez pas simplement copier du texte à partir du site et l'utiliser pour l'assistant vocal . Nous devons travailler sur les textes pour qu'ils soient compréhensibles à l'oreille.

Leçon numéro 5. L'action doit interagir avec l'utilisateur


Assistant est un assistant personnel. Cela devrait aider l'utilisateur à obtenir le résultat, et pas seulement attendre des actions de sa part.


Sur le site ou dans l'application mobile, nous réalisons une interface avec des boutons, des listes, des photos, etc. L'assistant vocal peut également faire tout cela, mais la principale différence est qu'il parle et permet à l'utilisateur de dire n'importe quelle phrase. Et cela change l'approche de l'interface utilisateur.

L'utilisateur peut ne pas entendre ce que l'assistant lui a dit. Ou ne comprends pas la première fois. L'assistant doit toujours être prêt à répéter sur demande. Ou reformulez votre réponse si l'utilisateur ne la comprend pas. Mettez-vous à la place d'un assistant. Vous parlez à une autre personne, et il est important que vous vous compreniez, et pas nécessairement la première fois. Vous ne montrez pas seulement à l'interlocuteur une feuille de papier avec des éléments de menu, mais vous aidez à faire un choix.

Dans «Yoga pour les yeux», nous avons fait en sorte que l'assistant puisse toujours répéter l'exercice si l'utilisateur le demande. De plus, non seulement affichez à nouveau le texte de l'exercice, mais de manière familière, proposez de refaire l'exercice. Pour ce faire, nous avons utilisé plusieurs variantes de l'expression «Répéter» dans le bloc Phrases et placé une autre bulle avec le texte avant de répéter le texte de l'exercice.



Leçon numéro 6. L'action n'a pas le droit d'interrompre


L'assistant doit répondre de manière adéquate même aux phrases utilisateur incompréhensibles


L'assistant ne possède ni «écran bleu» ni fenêtre d'erreur ni bouton OK. Et l'utilisateur, à son tour, peut dire n'importe quoi, et pas du tout ce que votre action est formée. Dans ce cas, l'application ne doit pas «blâmer» l'utilisateur pour «ne pas le dire». Il faut en quelque sorte répondre à une commande incompréhensible et expliquer à nouveau à l'utilisateur ce qu'on attend de lui.

Il ne suffit pas de dire: "Oh, je ne te comprends pas" . Cela revient à afficher la fenêtre préférée de tous avec une erreur. "Et que dois-je faire ensuite?" - l'utilisateur demandera.

«Yoga pour les yeux» réagit très simplement aux phrases incompréhensibles - il précise à l'utilisateur s'il a terminé l'exercice en cours. Et si dans ce cas il répond à quelque chose d'incompréhensible, il lui demandera s'il veut terminer ses études. Pour ce faire, nous avons utilisé la branche «Toute autre phrase» du bloc Phrases pour répondre à des commandes incompréhensibles. Il se trouve que si l'utilisateur n'est pas configuré pour continuer la leçon, l'assistant l'invite de manière détendue à terminer.



Accordez plus d'attention aux phrases incompréhensibles . Après tout, c'est la «fonction la plus utilisée» de votre action.

Leçon numéro 7. L'action doit reconnaître l'utilisateur


Un assistant est un assistant qui connaît son utilisateur et change son comportement au fil du temps.


Si l'utilisateur a lancé votre action pour la toute première fois, l'application doit expliquer à quoi elle sert et comment l'utiliser. Mais si l'utilisateur appelle l'application tous les jours, cela n'a aucun sens de la charger avec la même aide à chaque fois. Vous devez changer le comportement de l'application, comme le fait l'assistant, qui apprend chaque jour à mieux connaître son utilisateur.

Aimylogic a des informations sur la date à laquelle un utilisateur a accédé à l'application la dernière fois. Yoga for the Eyes l'utilise pour accueillir l'utilisateur différemment au démarrage. Et comme la recharge doit être effectuée tous les jours, notre application vous le rappelle si l'utilisateur n'a pas démarré l'application depuis longtemps. Pour ce faire, nous utilisons le bloc Conditions, dans lequel nous vérifions depuis combien de temps nous avons reçu la demande précédente. En fonction de cela, Action passe par différentes branches de la boîte de dialogue.



Leçon numéro 8. L'action doit se terminer


Vous devez vous déconnecter du microphone lorsque l'application termine son travail.


Si cela n'est pas fait, Google rejettera votre candidature lors de la publication dans l'annuaire. Par conséquent, votre application doit avoir au moins une branche du dialogue, ce qui conduit à la sortie de l'application. Dans ce cas, vous devez «fermer» le microphone.

Dans «Yoga pour les yeux», l'utilisateur peut toujours dire «Assez» ou «Je suis fatigué» pour terminer les cours. Aimylogic a un bloc de fin de script - nous l'avons utilisé dans notre boîte de dialogue pour dire au revoir à l'utilisateur et terminer notre action.



Et quelques conseils supplémentaires de notre part


N'essayez pas de pousser toutes les fonctions de votre service dans l'application vocale de l'assistant. Le dialogue est une question de simplicité, pas de multifonctionnalité. Votre action ne peut exécuter qu'une seule fonction, mais il est si pratique de le faire que l'utilisateur accède à votre application exactement tous les jours.

Ne faites pas d'autre IVR à partir d'un assistant . L'assistant ne doit pas lister les réponses possibles - ce n'est pas naturel. Quand vous arrivez au menu vocal, c'est de la misère. Pas besoin de faire de même depuis un assistant. Il peut reconnaître la parole, alors travaillez sur votre script pour qu'il soit naturel. Dans le même Aimylogic, il y a tous les outils pour cela, et en même temps, vous n'avez pas du tout à écrire de code.

Les boutons sont des indices, pas l'élément principal de l'interface utilisateur vocale . Assistant n'est pas une interface de bouton, mais une interface vocale. Par conséquent, les boutons ne doivent être utilisés que comme conseils. Votre dialogue doit être tel que l'utilisateur copie sans boutons.

Rédigez une courte politique de confidentialité et insérez-y le nom de votre application. Sans cela, votre application ne sera pas modérée par Google. Regardez notre version finale , afin de ne pas faire les mêmes erreurs que nous :)

En conclusion


Google Assistant a récemment commencé à comprendre le russe. Et il n'y a toujours pas grand-chose de ce qui se passe en Occident (voix cool, haut-parleur intelligent, etc.). Mais tout cela est une question de temps. Mais maintenant, vous pouvez essayer de développer ce nouveau canal pour vos services, en utilisant l'expérience existante partagée par Google et d'autres développeurs.



PS . Un peu plus tard, nous publierons dans nos tutoriels des instructions étape par étape sur la façon de faire du yoga pour les yeux sur Aimylogic. Venez sur notre chat Telegram pour que les développeurs ne manquent pas la publication.

Source: https://habr.com/ru/post/fr420083/


All Articles