Comecei a criar habilidades de voz no início de 2017 - o dispositivo Echo da Amazon com o assistente Alexa. Naquela época, as ferramentas para desenvolvedores estavam disponíveis há um ano e meio, embora não se comparassem ao que a Amazon e o Google oferecem hoje. Tendo aberto o painel Yandex Dialogs, lembrei-me do começo e de quanto tudo mudou até hoje.
Gostaria de compartilhar com você a primeira experiência e impressões de criar a habilidade em russo para o Yandex Alice (Yandex Dialogs) após a experiência com o Alexa Skills Kit e o Amazon Lex.
A maneira mais fácil de como o assistente de voz funciona. Todas as diferenças entre as plataformas estão no meio - uma plataforma que reconhece fala, processa solicitações de entrada e exibe uma resposta ao usuário e, dependendo de sua simplicidade / complexidade, o trabalho do desenvolvedor é simplificado / complicado, talvez não seja necessário para uma habilidade muito simples (por exemplo, Dialogflow).
Depois de abrir os Diálogos do Yandex, fiquei imediatamente confuso com a interface simples, muito simples - onde está tudo e como gerenciá-lo? Descobriu-se que isso é tudo o que a Yandex oferece atualmente.
Objetivos ou "intenções"
A primeira coisa que eu esperava ver nos Diálogos era "intenções", que literalmente se traduz como "intenções" ou "objetivos". Cada uma dessas "intenções" contém exemplos de solicitações de usuários. A criação de tais conjuntos deixa claro para o desenvolvedor o que o usuário deseja dele. Por exemplo, poderíamos criar esses "objetivos" ("intenções"):
"Encomende Pelmeni" com pedidos de amostra:
"Encomende a entrega de bolinhos"
"Quero bolinhos, faça um pedido"
"Bolinhos de massa com frango, mais queijo"
Ajuda com exemplos de solicitação:
Estou preso
"Ajuda"
"Como usar"
Com a ajuda de tais exemplos, é fácil entendermos o usuário e suas expectativas - o usuário disse: "Quero bolinhos, faça um pedido", então nossa "intenção" é "Bolinhos de pedido" e, então, trabalhamos com essa solicitação. Idealmente, a plataforma deve aprender e entender frases semelhantes. O Yandex atualmente não oferece a função "intents", embora eu tenha certeza que esse recurso será adicionado no próximo ano.
Entidades ou "entidades"
Em seguida, vêm as "entidades" (entidades (Google) ou slots (Amazon)) - palavras-chave ou frases. Felizmente, o Yandex Dialogs atualmente reconhece 4 tipos de entidades - esta é a data (incluindo “amanhã”, “ano que vem”), números, dados geográficos (no momento em que uso ativamente países e cidades) e nomes. Isso simplifica bastante a vida do desenvolvedor, eles facilitam e dão flexibilidade durante o desenvolvimento da habilidade.
Se você olhar para os big brother, eles permitem que o desenvolvedor crie "entidades" ele mesmo e também ofereça uma ampla seleção de "entidades" integradas, como AMAZON.Food (food) e AMAZON.Airports (nomes de aeroportos).
Interface Alexa Kit de habilidades. Mesmo no ano passado, tudo mudou em um campo de texto simples, hoje é uma interface rica com recursos avançados, que são atualizados constantemente. Esperamos ansiosamente as atualizações do Yandex.No momento, estou desenvolvendo uma habilidade em que a “essência” das estações do ano, uma lista com nomes de esportes e eventos não faria mal. Para "pegar" as palavras certas, você precisa alterar o código.
Teste
Tudo é triste aqui. O teste baseia-se em um bate-papo e em uma janela JSON de solicitação e saída. Somente o teclado, sem entrada ou saída por voz, e também sem a capacidade de testar outros usuários. Simplificando, não há ferramentas de teste aqui.
Idioma russo
Vale ressaltar - a criação de habilidades de voz em russo é um pouco complicada pelas propriedades do idioma. Por exemplo, se em inglês dizemos "para a França", "da França" e "com a França", colocando as mesmas palavras em casos em russo, eles dizem "para a França", "da França" e "com a França". Pequenas funções ajudarão a resolver problemas semelhantes e semelhantes.
Então
O que é bom:- Entidades Integradas.
- Capacidade de conectar o webhook. Como sem ele.
- Atendimento ao cliente. Enviei pedidos no fim de semana, na segunda-feira recebi uma resposta.
O que estamos esperando: (o diálogo tem vários meses, por isso não vou destacá-lo como contras.)
- Criação de suas entidades.
- Entidades mais integradas (nome de aeroportos, restaurantes, etc.).
- Objetivos (intenções) - coleções de frases.
- Capacidade de usar a linha de comando (CLI).
- Teste de voz e escuta de saída.
- Tudo relacionado ao teste (testes beta, capacidade de adicionar usuários etc.)
Concorrentes
Como no mundo dos mecanismos de busca, existe apenas um concorrente - o Google com seu Dialogflow.
No momento, o idioma russo no Dialogflow é suportado apenas em uma direção de fala para texto, portanto o Yandex está na liderança aqui.
Também é bom que, tendo lidado com uma plataforma, o desenvolvedor possa facilmente dominar todas as outras.
Estamos aguardando inovações
Durante o desenvolvimento da habilidade, por várias semanas, o Yandex mais de uma vez introduziu alterações nos Diálogos, o principal é manter o ritmo. Alice e seus instrumentos ainda são jovens, como todo o mercado mundial de dispositivos de voz.