Ação ideal para o Google Assistant - 8 lições da Hackathon de Moscou



No final de julho, o Google realizou uma hackathon fechada em seu escritório em Moscou (o oposto ao Kremlin). O tema foi o desenvolvimento de ações para um assistente de voz . Nós ( apenas IA ) e mais uma dúzia de equipes assistimos a esse evento e tiramos não apenas mochilas vermelhas com os nishtyaks do Google, mas também muito conhecimento útil sobre como criar interfaces de voz de alta qualidade.

Durante alguns dias de hackathon, todos tentaram desenvolver um aplicativo de voz para um assistente, e alguém até publicou seus trabalhos no diretório Google Actions. No exemplo de nosso aplicativo, falaremos sobre como criar a Ação perfeita e facilmente a moderação do Google.

O que é ações no Google


O Google Assistant não pode apenas executar comandos de voz padrão. Você pode criar seus próprios complementos para ele, o que adicionará funcionalidade ao assistente. O Google chama esses extras de Ações. E, em russo, isso se traduz como um "aplicativo". Leia mais sobre ações no Google aqui .

Por que criar sua própria ação


Se você estiver criando algum tipo de aplicativo para celular ou se tiver um site que ofereça aos seus clientes alguns serviços úteis, o Google Assistant é outro canal interessante para interagir com seu consumidor. Afinal, o assistente de voz está instalado em mais de 500 milhões de dispositivos! E estes não são apenas smartphones, mas também alto-falantes inteligentes, carros, relógios, TVs. Portanto, se você suplementar seu site ou aplicativo com a habilidade de assistente de voz, provavelmente encontrará novos clientes e usuários, porque eles já estão conversando com o assistente em todos esses dispositivos. E é mais provável que eles digam a seus amigos e conhecidos sobre o seu serviço.

Como executar a ação corretamente


Mas não pense que o pedido de assistente de voz é o mesmo do site. Essa é uma experiência do usuário fundamentalmente diferente (UX), que já possui suas próprias diretrizes . O usuário fala com o assistente, portanto, seu aplicativo assistente deve falar o usuário em um idioma natural.



No hackathon, usamos nosso próprio designer de interface de conversação Aimylogic , no qual implementamos nosso primeiro aplicativo para o Google Assistant. E no seu exemplo, agora falaremos sobre as lições mais valiosas que aprendemos durante esse período.


É assim que nossa Action finalizada parece no construtor Aimylogic.

Lição número 1. Ação é voz


Assistant é uma interface de voz. Os usuários conversam com um assistente quando é mais conveniente dizer, em vez de abrir um aplicativo ou site.


É absolutamente necessário entender claramente por que essa ou aquela função do seu serviço pode ser útil ao usuário através da interface de voz.

Voz é quando você precisa rapidamente, e às vezes sem olhar para a tela. A voz é quando a pergunta e a resposta são curtas e claras na primeira vez. E se, para isso, o usuário não precisar fazer cinco cliques, ele certamente aproveitará essa oportunidade.

Em nossa aplicação "Yoga para os olhos", existe essa função. Estes são realmente exercícios para a visão. O usuário não deve se distrair com a tela durante as aulas. É por isso que usamos a interface de voz.

Lição número 2. A ação deve ser realmente útil


O assistente resolve as tarefas do usuário e não apenas abre o navegador


Não faça um aplicativo assistente que não seja útil para o usuário. A ação pode ser muito simples e executar apenas uma função do seu serviço, mas deve ser completamente útil. Caso contrário, não faz sentido.

O "yoga para os olhos" é útil, pois o usuário não precisa memorizar os exercícios e sua ordem em diferentes complexos. Simplesmente chama uma Ação, que lê o exercício um por um e o usuário os executa.

Para fazer isso, selecionamos vários complexos diferentes e colocamos os exercícios em uma planilha regular do Google em diferentes folhas. Nosso aplicativo usa essa tabela como um banco de dados , seleciona uma lista de exercícios da planilha desejada usando uma solicitação HTTP e os lê para o usuário em um ciclo. Assim que o usuário termina o próximo exercício, ele diz "Vamos lá" e Action lê o seguinte.



Lição número 3. A ação deve ser clara e previsível.


O assistente sempre explica o que ele espera do usuário. E o usuário sempre sabe o que o assistente fará agora.


Ação é um diálogo entre um assistente e um usuário. Quando a Ação aguarda a próxima réplica, o usuário deve entender o que pode dizer agora e como o assistente responderá. Caso contrário, o assistente parecerá inadequado e incompreensível para o usuário. E você não vai querer usá-lo.

O aplicativo “Yoga para os olhos” explica de forma breve, mas clara, ao usuário que ele deve dizer “Vamos lá” sempre que concluir o próximo exercício. Depois disso, o assistente lê o próximo exercício e aguarda novamente. Assim, o usuário entende o que deve fazer e o que o assistente espera dele. O diálogo é simples, mas surpreendentemente eficaz.

Na seção Frases, adicionamos sinônimos para a frase "Vamos lá", para que o assistente responda adequadamente a outras formulações. E também adicionamos botões com dicas - para que o usuário entenda pela primeira vez como nosso aplicativo funciona. Também usamos variabilidade nas respostas para não repetir a mesma frase toda vez que o usuário inicia a lição.



Lição número 4. A ação deve falar brevemente, mas naturalmente


Ouvir texto longo de um robô é difícil. E se o texto não parecer natural, será ainda pior.


Um assistente é um robô que quer ser como um humano. Na prática, isso se traduz no fato de que todas as réplicas do assistente devem ser compreensíveis, mas não devem ser muito robóticas.

A síntese da fala é uma coisa complicada. O texto é um pouco mais longo - e o usuário não o escuta até o fim. E se o assistente for como um robô criptografar a mensagem em poucas palavras, o usuário não entenderá nada. Bem, ou ele precisará de mais esforço para entender o que é exigido dele.

Então trabalhe em suas respostas . Faça-os curtos, por um lado, e adicione conversas de conversação com eles, por outro.

Quando selecionamos conjuntos de exercícios para visualização na Internet, vimos que eles são adequados para o site, e não para a interface interativa. Portanto, reformulamos cada exercício para torná-lo mais curto e compreensível ao mesmo tempo. Por exemplo, em um site com exercícios, havia esse texto

Feche os olhos. Em seguida, esfregue as palmas das mãos e prenda-as nos olhos. Mantenha-se nessa posição até que suas mãos liberem calor. Então, sem abrir os olhos, esfregue as palmas das mãos para trás e coloque-as nos olhos novamente. Faça o exercício três vezes.


Nós mudamos assim

Feche os olhos. Esfregue as palmas das mãos com força, leve-as aos olhos e sente-se assim por um minuto.


E quebrou em duas linhas. Quando o usuário diz "Vá em frente", o assistente responderá: "Agora repita isso mais duas vezes" .

Você não pode simplesmente copiar o texto do site e usá-lo como assistente de voz . Precisamos trabalhar nos textos para que sejam compreensíveis de ouvido.

Lição número 5. A ação deve interagir com o usuário


Assistant é um assistente pessoal. Isso deve ajudar o usuário a obter o resultado, e não apenas esperar por ações dele.


No site ou no aplicativo móvel, fazemos uma interface com botões, listas, imagens, etc. O assistente de voz também pode fazer tudo isso, mas a principal diferença é que ele fala e permite que o usuário diga qualquer frase. E isso muda a abordagem da interface do usuário.

O usuário pode não ouvir o que o assistente disse a ele. Ou não entendo pela primeira vez. O assistente deve estar sempre pronto para repetir, se solicitado. Ou reformule sua resposta se o usuário não a entender. Coloque-se no lugar de um assistente. Você está conversando com outra pessoa e é importante que você entenda, e não necessariamente da primeira vez. Você não apenas mostra ao interlocutor uma folha de papel com itens de menu, mas ajuda a fazer uma escolha.

Em "Yoga para os olhos", fizemos isso para que o assistente sempre possa repetir o exercício, se o usuário perguntar. Além disso, não apenas exiba o texto do exercício novamente, mas de maneira coloquial, ofereça-o para fazer o exercício mais uma vez. Para fazer isso, usamos várias variações da frase “Repetir” no bloco Frases e definimos outro balão com o texto antes de repetir o texto do exercício.



Lição número 6. A ação não tem o direito de interromper


O assistente deve responder adequadamente mesmo a frases incompreensíveis do usuário


O assistente não possui uma “tela azul” ou uma janela de erro e um botão OK. E o usuário, por sua vez, pode dizer qualquer coisa, e nada sobre o que sua Ação é treinada. Nesse caso, o aplicativo não deve "culpar" o usuário por "não dizer isso". É necessário, de alguma forma, responder a um comando incompreensível e, mais uma vez, explicar ao usuário o que se espera dele.

Apenas dizer: "Oh, eu não te entendo" não é suficiente. É o mesmo que exibir a janela favorita de todos com um erro. "E o que devo fazer a seguir?" - o usuário perguntará.

"Yoga para os olhos" reage a frases incompreensíveis com muita simplicidade - esclarece com o usuário se ele completou o exercício atual. E se, nesse caso, ele responder a algo incompreensível, ele perguntará se deseja terminar seus estudos. Para fazer isso, usamos o ramo “Qualquer outra frase” no bloco Frases para responder a comandos incompreensíveis. Aconteceu que, se o usuário não estiver configurado para continuar a lição, o assistente de maneira descontraída o convida a terminar.



Dê mais atenção às frases incompreensíveis . Afinal, esta é a “função mais usada” da sua ação.

Lição número 7. A ação deve reconhecer o usuário


Um assistente é um assistente que conhece seu usuário e altera seu comportamento ao longo do tempo.


Se o usuário lançou sua Ação pela primeira vez, o aplicativo deve falar sobre o que é e como usá-la. Mas se o usuário chama o aplicativo todos os dias, não faz sentido carregá-lo com a mesma ajuda todas as vezes. Você precisa alterar o comportamento do aplicativo, como faz o assistente, que todos os dias conhece melhor seu usuário.

Aimylogic tem informações sobre há quanto tempo um usuário acessou o aplicativo pela última vez. O Yoga for the Eyes usa isso para cumprimentar o usuário de maneira diferente na inicialização. E como o carregamento precisa ser feito todos os dias, nosso aplicativo o lembra disso se o usuário não iniciar o aplicativo há muito tempo. Para fazer isso, usamos o bloco Condições, no qual verificamos há quanto tempo recebemos a solicitação anterior. Dependendo disso, o Action passa por diferentes ramos da caixa de diálogo.



Lição número 8. A ação deve terminar


Você precisa se desconectar do microfone quando o aplicativo terminar seu trabalho.


Se isso não for feito, o Google rejeitará seu aplicativo ao publicar no diretório. Portanto, seu aplicativo deve ter pelo menos um ramo da caixa de diálogo, o que leva à saída do aplicativo. Nesse caso, você deve "fechar" o microfone.

No "Yoga para os olhos", o usuário sempre pode dizer "Chega" ou "Estou cansado" para concluir as aulas. O Aimylogic possui um bloco de conclusão de script - usamos no nosso diálogo para nos despedir do usuário e concluir nossa Ação.



E mais algumas dicas de nós


Não tente inserir todas as funções do seu serviço no aplicativo de voz do assistente. O diálogo é sobre simplicidade, não sobre multifuncionalidade. Sua ação pode executar apenas uma função, mas é tão conveniente que o usuário acesse seu aplicativo exatamente todos os dias.

Não faça outra URA de um assistente . O assistente não deve listar respostas possíveis - isso não é natural. Quando você chega ao menu de voz, é uma miséria. Não há necessidade de fazer o mesmo com um assistente. Ele pode reconhecer a fala, então trabalhe no seu roteiro para que seja natural. No mesmo Aimylogic, existem todas as ferramentas para isso e, ao mesmo tempo, você não precisa escrever nenhum código.

Os botões são dicas, não o elemento principal da interface do usuário de voz . O Assistente não é uma interface de botão, mas uma interface de voz. Portanto, os botões devem ser usados ​​apenas como dicas. Seu diálogo deve ser tal que o usuário lide sem botões.

Escreva uma política de privacidade curta e inclua o nome do seu aplicativo. Sem isso, seu aplicativo não será moderado pelo Google. Veja a nossa versão final , para não cometer os mesmos erros que nós :)

Em conclusão


O Google Assistant recentemente começou a entender russo. E ainda não há muito do que existe no Ocidente (voz legal, alto-falante inteligente etc.). Mas tudo isso é questão de tempo. Mas agora você pode tentar desenvolver esse novo canal para seus serviços, usando a experiência existente compartilhada pelo Google e outros desenvolvedores.



PS . Um pouco mais tarde publicaremos em nossos tutoriais instruções passo a passo sobre como fazer Yoga para os Olhos no Aimylogic. Venha ao nosso bate-papo no Telegram para que os desenvolvedores não percam a publicação.

Source: https://habr.com/ru/post/pt420083/


All Articles