La primera experiencia con Yandex Dialogs. Estamos esperando innovaciones

Comencé a crear habilidades de voz a principios de 2017: el dispositivo Echo de Amazon con el asistente de Alexa. En ese momento, las herramientas para desarrolladores han estado disponibles durante un año y medio, aunque no se comparaban con lo que Amazon y Google ofrecen hoy. Después de abrir el panel de Diálogos de Yandex, acabo de recordar el comienzo y cuánto ha cambiado todo hasta el día de hoy.

Me gustaría compartir con ustedes la primera experiencia e impresiones de crear la habilidad en ruso para Yandex Alice (Yandex Dialogs) después de la experiencia con Alexa Skills Kit y Amazon Lex.

imagen
La forma más fácil de cómo funciona el asistente de voz.

Todas las diferencias entre las plataformas están en el medio: una plataforma que reconoce el habla, procesa las solicitudes de entrada y muestra una respuesta al usuario, y dependiendo de su simplicidad / complejidad, el trabajo del desarrollador se simplifica / complica, tal vez no sea necesario para una habilidad muy simple (por ejemplo, usando Dialogflow).

Después de abrir los cuadros de diálogo de Yandex, la interfaz simple me confundió de inmediato, demasiado simple: ¿dónde está todo y cómo administrarlo? Resultó que esto es todo lo que Yandex ofrece actualmente.

Objetivos o "intenciones"


Lo primero que esperaba ver en los Diálogos fue "intenciones", que literalmente se traduce como "intenciones" o "objetivos". Cada una de estas "intenciones" contiene ejemplos de solicitudes de usuarios. La creación de tales conjuntos deja en claro al desarrollador lo que el usuario quiere de él. Por ejemplo, podríamos crear tales "objetivos" ("intentos"):

"Orden Pelmeni" con solicitudes de muestra:
"Ordenar la entrega de albóndigas"
"Quiero albóndigas, haz un pedido"
"Albóndigas con pollo, más queso"

Ayuda con ejemplos de solicitud:
Estoy atrapado
"Ayuda"
"Cómo usarlo"

Con la ayuda de tales ejemplos, es fácil para nosotros entender al usuario y sus expectativas: el usuario dijo "Quiero albóndigas, hacer un pedido", luego nuestra "intención" es "Albóndigas de pedido", luego trabajamos dentro de esta solicitud. Idealmente, la plataforma debería aprender y comprender frases similares. Actualmente, Yandex no ofrece la función de "intenciones", aunque estoy seguro de que esta función se agregará el próximo año.

Entidades o "Entidades"


Luego vienen las "entidades" (entidades (Google) o tragamonedas (Amazon)) - palabras clave o frases. Afortunadamente, los cuadros de diálogo de Yandex actualmente reconocen 4 tipos de entidades: esta es la fecha (incluidos "mañana", "próximo año"), números, datos geográficos (en este momento uso activamente países y ciudades) y nombres. Esto simplifica enormemente la vida del desarrollador, facilitan y dan flexibilidad durante el desarrollo de la habilidad.

Si nos fijamos en los hermanos mayores, permiten que el desarrollador cree "entidades" él mismo, y también ofrecen una amplia selección de "entidades" integradas, por ejemplo AMAZON.Food (alimentos) y AMAZON.Airports (nombres de aeropuertos).

imagen
Interfaz Alexa Skills Kit. Incluso el año pasado, todo cambió en un campo de texto simple, hoy es una interfaz rica con funciones avanzadas, que se actualiza constantemente. Esperamos las actualizaciones de Yandex.

En este momento estoy desarrollando una habilidad donde la "esencia" de las estaciones, una lista con nombres de deportes y eventos no estaría de más. Para "recoger" las palabras correctas, debe cambiar el código.

Prueba


Aquí todo está triste. La prueba se basa en un chat y una ventana de solicitud y salida JSON. Solo el teclado, sin entrada o salida por voz, y también sin la capacidad de probar a otros usuarios. En pocas palabras, no hay herramientas de prueba aquí.

Idioma ruso


Vale la pena mencionar: la creación de habilidades de voz en ruso es un poco complicada por las propiedades del idioma. Por ejemplo, si en inglés decimos "a Francia", "de Francia" y "con Francia", poniendo las mismas palabras en casos en ruso, dicen "a Francia", "de Francia" y "con Francia". Las funciones pequeñas ayudarán a resolver problemas similares.

Entonces


Lo cual es bueno:

  • Entidades integradas.
  • Posibilidad de conectar webhook. Como sin él.
  • Servicio al cliente Envié solicitudes el fin de semana, el lunes recibí una respuesta.


Qué estamos esperando: (el diálogo tiene varios meses, así que no lo resaltaré como inconvenientes).

  • Creación de sus entidades.
  • Entidades más integradas (nombre de aeropuertos, restaurantes, etc.).
  • Objetivos (intenciones): colecciones de frases.
  • Posibilidad de usar la línea de comando (CLI).
  • Prueba de voz y escucha de salida.
  • Todo lo relacionado con las pruebas (pruebas beta, la capacidad de agregar usuarios, etc.)

Competidores


Como en el mundo de los motores de búsqueda, solo hay un competidor: Google con su Dialogflow.

Por el momento, el idioma ruso en Dialogflow solo se admite en una dirección de voz a texto, por lo que Yandex está a la cabeza aquí.

También es bueno que, habiendo lidiado con una plataforma, el desarrollador podrá dominar fácilmente todas las demás.

Estamos esperando innovaciones


Durante el desarrollo de la habilidad, durante varias semanas, Yandex introdujo más de una vez cambios en los Diálogos, lo principal es mantener el ritmo. Alice y sus instrumentos aún son jóvenes, como todo el mercado mundial de dispositivos de voz.

Source: https://habr.com/ru/post/es432674/


All Articles