A primeira experiência com os Diálogos Yandex. Estamos aguardando inovações

Comecei a criar habilidades de voz no início de 2017 - o dispositivo Echo da Amazon com o assistente Alexa. Naquela época, as ferramentas para desenvolvedores estavam disponíveis há um ano e meio, embora não se comparassem ao que a Amazon e o Google oferecem hoje. Tendo aberto o painel Yandex Dialogs, lembrei-me do começo e de quanto tudo mudou até hoje.

Gostaria de compartilhar com você a primeira experiência e impressões de criar a habilidade em russo para o Yandex Alice (Yandex Dialogs) após a experiência com o Alexa Skills Kit e o Amazon Lex.

imagem
A maneira mais fácil de como o assistente de voz funciona.

Todas as diferenças entre as plataformas estão no meio - uma plataforma que reconhece fala, processa solicitações de entrada e exibe uma resposta ao usuário e, dependendo de sua simplicidade / complexidade, o trabalho do desenvolvedor é simplificado / complicado, talvez não seja necessário para uma habilidade muito simples (por exemplo, Dialogflow).

Depois de abrir os Diálogos do Yandex, fiquei imediatamente confuso com a interface simples, muito simples - onde está tudo e como gerenciá-lo? Descobriu-se que isso é tudo o que a Yandex oferece atualmente.

Objetivos ou "intenções"


A primeira coisa que eu esperava ver nos Diálogos era "intenções", que literalmente se traduz como "intenções" ou "objetivos". Cada uma dessas "intenções" contém exemplos de solicitações de usuários. A criação de tais conjuntos deixa claro para o desenvolvedor o que o usuário deseja dele. Por exemplo, poderíamos criar esses "objetivos" ("intenções"):

"Encomende Pelmeni" com pedidos de amostra:
"Encomende a entrega de bolinhos"
"Quero bolinhos, faça um pedido"
"Bolinhos de massa com frango, mais queijo"

Ajuda com exemplos de solicitação:
Estou preso
"Ajuda"
"Como usar"

Com a ajuda de tais exemplos, é fácil entendermos o usuário e suas expectativas - o usuário disse: "Quero bolinhos, faça um pedido", então nossa "intenção" é "Bolinhos de pedido" e, então, trabalhamos com essa solicitação. Idealmente, a plataforma deve aprender e entender frases semelhantes. O Yandex atualmente não oferece a função "intents", embora eu tenha certeza que esse recurso será adicionado no próximo ano.

Entidades ou "entidades"


Em seguida, vêm as "entidades" (entidades (Google) ou slots (Amazon)) - palavras-chave ou frases. Felizmente, o Yandex Dialogs atualmente reconhece 4 tipos de entidades - esta é a data (incluindo “amanhã”, “ano que vem”), números, dados geográficos (no momento em que uso ativamente países e cidades) e nomes. Isso simplifica bastante a vida do desenvolvedor, eles facilitam e dão flexibilidade durante o desenvolvimento da habilidade.

Se você olhar para os big brother, eles permitem que o desenvolvedor crie "entidades" ele mesmo e também ofereça uma ampla seleção de "entidades" integradas, como AMAZON.Food (food) e AMAZON.Airports (nomes de aeroportos).

imagem
Interface Alexa Kit de habilidades. Mesmo no ano passado, tudo mudou em um campo de texto simples, hoje é uma interface rica com recursos avançados, que são atualizados constantemente. Esperamos ansiosamente as atualizações do Yandex.

No momento, estou desenvolvendo uma habilidade em que a “essência” das estações do ano, uma lista com nomes de esportes e eventos não faria mal. Para "pegar" as palavras certas, você precisa alterar o código.

Teste


Tudo é triste aqui. O teste baseia-se em um bate-papo e em uma janela JSON de solicitação e saída. Somente o teclado, sem entrada ou saída por voz, e também sem a capacidade de testar outros usuários. Simplificando, não há ferramentas de teste aqui.

Idioma russo


Vale ressaltar - a criação de habilidades de voz em russo é um pouco complicada pelas propriedades do idioma. Por exemplo, se em inglês dizemos "para a França", "da França" e "com a França", colocando as mesmas palavras em casos em russo, eles dizem "para a França", "da França" e "com a França". Pequenas funções ajudarão a resolver problemas semelhantes e semelhantes.

Então


O que é bom:

  • Entidades Integradas.
  • Capacidade de conectar o webhook. Como sem ele.
  • Atendimento ao cliente. Enviei pedidos no fim de semana, na segunda-feira recebi uma resposta.


O que estamos esperando: (o diálogo tem vários meses, por isso não vou destacá-lo como contras.)

  • Criação de suas entidades.
  • Entidades mais integradas (nome de aeroportos, restaurantes, etc.).
  • Objetivos (intenções) - coleções de frases.
  • Capacidade de usar a linha de comando (CLI).
  • Teste de voz e escuta de saída.
  • Tudo relacionado ao teste (testes beta, capacidade de adicionar usuários etc.)

Concorrentes


Como no mundo dos mecanismos de busca, existe apenas um concorrente - o Google com seu Dialogflow.

No momento, o idioma russo no Dialogflow é suportado apenas em uma direção de fala para texto, portanto o Yandex está na liderança aqui.

Também é bom que, tendo lidado com uma plataforma, o desenvolvedor possa facilmente dominar todas as outras.

Estamos aguardando inovações


Durante o desenvolvimento da habilidade, por várias semanas, o Yandex mais de uma vez introduziu alterações nos Diálogos, o principal é manter o ritmo. Alice e seus instrumentos ainda são jovens, como todo o mercado mundial de dispositivos de voz.

Source: https://habr.com/ru/post/pt432674/


All Articles