Secretos, consejos, trucos: c贸mo crear una acci贸n genial para el Asistente de Google

El ecosistema alrededor del Asistente de Google est谩 creciendo r谩pidamente. En abril de 2017, solo 165 acciones estaban disponibles para los usuarios, y hoy solo en ingl茅s hay m谩s de 4,500. La diversidad y el inter茅s del rinc贸n de este universo en ruso depender谩 de los desarrolladores. Dmitry Chechetkin, director de proyectos estrat茅gicos de Just AI y autor de "S铆, mi se帽or", uno de los juegos m谩s populares para el Asistente no solo en Rusia sino tambi茅n en el mundo (m谩s de 240 mil personas ya lo han jugado), comparte importantes trucos para crear juegos de acci贸n para Asistente de Google 驴Por qu茅 separar el c贸digo y el contenido del script? 驴Qu茅 se debe recordar al trabajar en una interfaz conversacional? En general, entendemos c贸mo cortar una acci贸n de un sue帽o.



Agitar pero no mezclar: el rol del script, el contenido y el c贸digo


Cualquier aplicaci贸n de voz consta de tres componentes: un gui贸n interactivo, contenido con el que interact煤a la acci贸n y l贸gica programable, es decir. c贸digo

El escenario es quiz谩s lo principal. Describe qu茅 frases puede hablar un usuario, c贸mo debe reaccionar una acci贸n ante ellas, en qu茅 estados entra y c贸mo responde exactamente. He estado programando durante 12 a帽os, pero cuando se trata de crear una interfaz de conversaci贸n, recurro a varias herramientas visuales.

Para empezar, no est谩 de m谩s dibujar un esquema simple del gui贸n en papel. Entonces usted decide qu茅 y qu茅 sigue en el di谩logo. Luego puede transferir el script a alg煤n producto para visualizarlo. Uso nuestro constructor visual con NLU Aimylogic ( c贸mo crear una acci贸n para el Asistente de Google en Aimylogic ) para ver c贸mo funcionar谩n todas las transiciones en mi di谩logo, verificar y validar la hip贸tesis en s铆 y la idea de lo que quiero implementar. En Aimylogic, puede crear un script sin habilidades de programaci贸n en profundidad, y puede probar de inmediato la acci贸n. El propio Google propone crear un di谩logo de Dialogflow personalizado, y para scripts simples y cortos que no requieren una comprensi贸n amplia del lenguaje, Actions SDK .



La l贸gica programable a menudo se requiere. Por ejemplo, su sitio puede verse bien, pero para que "sepa c贸mo", tendr谩 que hacer referencia al c贸digo en el servidor y el c贸digo podr谩 calcular algo, guardar y devolver el resultado. Lo mismo con el script de acci贸n. El c贸digo deber铆a ejecutarse sin problemas, y mejor si es completamente gratis. Hoy no hay necesidad de pagar miles de d贸lares para que un c贸digo de 50, 100, 1000 l铆neas est茅 disponible para su acci贸n 24/7. Utilizo varios servicios para esto a la vez: Cloud Functions, Heroku, Webtask.io, Amazon Lambda. Las instancias gratuitas est谩n disponibles en Google Cloud Platform.

El script puede acceder al c贸digo utilizando las llamadas http m谩s simples a las que todos estamos acostumbrados. Pero al mismo tiempo, el c贸digo y el script no se mezclan. Y esto es bueno, porque puede mantener ambos componentes actualizados, expandirlos a su gusto, sin complicar el trabajo en la acci贸n.



El tercer componente es el contenido. Estos son datos que pueden cambiar todo el tiempo, sin afectar la estructura del script en s铆. Por ejemplo, preguntas de preguntas o episodios en nuestro juego S铆 S铆 . Si el contenido viviera con el script o con el c贸digo, dicho script se volver铆a m谩s engorroso. Y en este caso, no importa qu茅 herramienta use para crear una acci贸n, trabajar con ella seguir谩 siendo un inconveniente para usted. Por lo tanto, recomiendo almacenar el contenido por separado: en la base de datos, en un archivo en el almacenamiento en la nube o en una tabla a la que el script tambi茅n pueda acceder a trav茅s de la API para recibir datos sobre la marcha. Separando el contenido del gui贸n y el c贸digo, puede atraer a otras personas para que trabajen en la acci贸n: podr谩n reponer el contenido independientemente de usted. Y el desarrollo del contenido es muy importante, porque el usuario espera de la acci贸n, a la que regresa una y otra vez, contenido fresco y diverso.



驴C贸mo usar tablas ordinarias en la nube para no almacenar todo el contenido en el script mismo? Por ejemplo, en el juego "Primero o Segundo" utilizamos una hoja de c谩lculo Excel basada en la nube donde cualquiera de los participantes del proyecto podr铆a agregar nuevas preguntas y respuestas para la acci贸n. El script de Aimylogic accede a esta tabla utilizando una 煤nica solicitud http a trav茅s de una API especial. Como puede ver, el script en s铆 es peque帽o, porque no almacena todos los datos de la tabla, que se actualiza todos los d铆as. Por lo tanto, separamos la secuencia de comandos interactiva del contenido, lo que nos permite trabajar con el contenido de forma independiente y reponer colectivamente la secuencia de comandos con datos nuevos. Por cierto, 80 mil personas ya han jugado este juego.

Lista de verificaci贸n: cosas para recordar al crear una interfaz conversacional


Cualquier interfaz tiene componentes con los que el usuario interact煤a: listas, botones, im谩genes y m谩s. La interfaz conversacional existe de acuerdo con las mismas leyes, pero la diferencia fundamental es que una persona se comunica con el programa por voz. A partir de esto debemos construir, creando nuestra propia acci贸n.

La acci贸n correcta no deber铆a ser capaz de hacer todo en el mundo. Cuando una persona habla con un programa, no puede mantener mucha informaci贸n en su cabeza (recuerde c贸mo escucha las ofertas personales de varios pisos de un banco u operador de telefon铆a m贸vil por tel茅fono). Renunciar a lo superfluo y centrarse en una sola, pero la funci贸n m谩s importante de su servicio, que se realizar谩 m谩s convenientemente con su voz, sin tocar la pantalla.
Por ejemplo, tiene un servicio de tickets. No debe esperar que el cliente ponga en escena el escenario habitual con una voz: busque un boleto de acuerdo con cinco o seis criterios, elija entre transportistas, compare y pague. Pero una aplicaci贸n que le indica el precio m铆nimo en la direcci贸n elegida puede ser 煤til: esta es una operaci贸n muy r谩pida, y es conveniente realizarla por voz sin abrir el sitio, sin tener que pasar por el gui贸n de "llenado de formularios" cada vez (cuando completa los campos y selecciona filtros )

La acci贸n se trata de la voz, no del servicio en su conjunto. El usuario no debe arrepentirse de haber lanzado la acci贸n en el Asistente, y no fue, por ejemplo, a la aplicaci贸n o al sitio. Pero, 驴c贸mo entender que no se puede prescindir de una voz? Para comenzar, prueba la idea de la acci贸n en ti mismo. Si puede realizar f谩cilmente la misma acci贸n sin voz, no tendr谩 sentido. Una de mis primeras aplicaciones de Asistente fue Yoga para los ojos . Este es un entrenador personal virtual que ayuda a hacer ejercicios para la visi贸n. No hay duda de que se necesita una voz aqu铆: sus ojos est谩n ocupados con ejercicios, est谩 relajado y concentrado en las recomendaciones orales. Asomarse al memorando, distray茅ndose del entrenamiento, ser铆a inconveniente e ineficaz.

O aqu铆 hay un ejemplo de un script fallido para una aplicaci贸n de voz. A menudo escucho sobre c贸mo otra tienda en l铆nea quiere vender algo a trav茅s de un asistente virtual. Pero llenar la canasta con voz es inconveniente y poco pr谩ctico. Y es poco probable que el cliente entienda por qu茅 lo necesita. Pero la capacidad de repetir el 煤ltimo pedido por voz o lanzar algo sobre la marcha en la lista de compras es otra cuesti贸n.

Recuerda sobre UX. La acci贸n debe ser junto con el usuario: acompa帽arlo y guiarlo en el curso del di谩logo para que comprenda f谩cilmente lo que se debe decir. Si una persona se detiene, comienza a pensar: "驴Y qu茅 sigue?" Es un fracaso. No hay necesidad de esperar que su usuario siempre consulte la ayuda. Los puntos muertos deben ser monitoreados y ayudar al usuario con preguntas o consejos importantes. En el caso de la acci贸n de voz, la previsibilidad no es un vicio. Por ejemplo, en nuestro juego "S铆, mi se帽or", cada frase termina para que el participante pueda responder "s铆" o "no". No est谩 obligado a inventar algo por su cuenta. Y no es que este sea un juego tan elemental. Es solo que las reglas est谩n organizadas para que todo sea extremadamente claro para el usuario.


"隆脡l habla bien!" La acci贸n "escucha" bien gracias al Asistente, y bien "habla", gracias al desarrollador del script. Una actualizaci贸n reciente le dio al Asistente de Google nuevas opciones de voz y una pronunciaci贸n m谩s realista. Todo es genial, pero el desarrollador debe reflexionar sobre la frase, su estructura, sonido, para que el usuario pueda entender todo la primera vez. Organice el estr茅s, use pausas para hacer que las frases de acci贸n suenen humanas.

Nunca cargue al usuario. Para los juegos de acci贸n que expresan noticias o leen cuentos de hadas a los ni帽os, esto no es un problema. Pero escuchar el discurso de un asistente de voz sin parar cuando quieres pedir pizza es dif铆cil. Intente hacer r茅plicas concisas, pero no monosil谩bicas y variadas (por ejemplo, pensar en varias opciones para saludos, despedidas e incluso frases en caso de que el asistente no haya entendido algo). El di谩logo debe sonar natural y amigable, para esto puede agregar elementos de habla coloquial, emociones, interjecci贸n a las frases.

El usuario no perdona la estupidez. La gente suele culpar a los asistentes de voz por la estupidez. Y, b谩sicamente, esto sucede cuando un asistente o una aplicaci贸n para 茅l no pueden reconocer diferentes variaciones de la misma frase. Deje que su acci贸n sea tan simple como configurar una alarma, es importante que 茅l todav铆a comprenda sin贸nimos, diferentes formas de palabras que son id茅nticas en significado y que no fallan si el usuario responde de manera impredecible.

驴C贸mo salir de situaciones cuando una acci贸n se niega a entender? En primer lugar, puede diversificar las respuestas en la intenci贸n de reserva predeterminada: use no solo el est谩ndar proporcionado, sino tambi茅n los personalizados. Y en segundo lugar, puedes entrenar la intenci贸n alternativa con todo tipo de frases de spam que no est谩n relacionadas con el juego. Esto ense帽ar谩 a la aplicaci贸n no solo a responder adecuadamente a solicitudes irrelevantes, sino que tambi茅n aumentar谩 la precisi贸n de la clasificaci贸n de otros tipos de solicitudes.



Y un consejo m谩s. Nunca, nunca haga un men煤 de botones fuera de su acci贸n para facilitar la vida del usuario: es molesto, distrae el di谩logo y le hace dudar de la necesidad de usar la voz.

Ense帽ar la acci贸n de cortes铆a. Incluso la acci贸n m谩s genial deber铆a terminar. Idealmente, adi贸s, despu茅s de lo cual quieres volver a 茅l nuevamente. Por cierto, recuerde que si la acci贸n no hace una pregunta, sino que simplemente responde a la pregunta del usuario, debe "cerrar el micr贸fono" (de lo contrario, la aplicaci贸n no se moderar谩 y no se publicar谩). En el caso de Aimylogic, solo necesita agregar el bloque "Finalizaci贸n del script" al script.
Y si cuenta con la retenci贸n, es importante proporcionar otras reglas de buen tono en el gui贸n: la acci贸n debe funcionar en un contexto: recuerde el nombre y el g茅nero del usuario y no vuelva a preguntar qu茅 se ha especificado.

C贸mo trabajar con calificaciones y rese帽as


Los usuarios de Google Assistant pueden calificar los juegos de acci贸n y, por lo tanto, influir en su calificaci贸n. Por lo tanto, es importante aprender a usar el sistema de calificaci贸n para su ventaja. Parece que solo necesita darle al usuario un enlace a una p谩gina con su acci贸n y pedirle que deje una rese帽a. Pero hay reglas. Por ejemplo, no ofrezca evaluar la acci贸n en el primer mensaje: el usuario debe comprender lo que est谩 calificando. Espere hasta que la aplicaci贸n realmente cumpla con alguna misi贸n de usuario 煤til o interesante, y solo entonces ofrezca dejar una revisi贸n.



Y es mejor no intentar expresar esta solicitud con su voz, con la ayuda de la s铆ntesis de voz: solo pasa el tiempo del usuario. Adem谩s, puede que no siga el enlace, pero diga "Apuesto cinco", y esto no es lo que necesita en este caso.

En el juego "S铆, mi se帽or", mostramos el enlace para recibir comentarios solo despu茅s de que el usuario haya jugado la siguiente ronda. Y al mismo tiempo, no expresamos la solicitud, sino que simplemente mostramos un enlace a la pantalla y ofrecemos volver a jugar. Volver茅 a prestar atenci贸n: ofrezca este enlace cuando se garantice que el usuario recibir谩 alg煤n beneficio o placer. Si hace esto en el momento equivocado, cuando la acci贸n no comprende algo o se ralentiza, puede recibir comentarios negativos.

Tres secretos del asistente de Google


  1. El uso de la m煤sica. De los asistentes de voz en ruso, solo el Asistente de Google te permite usar m煤sica directamente en el gui贸n de acci贸n. La disposici贸n musical suena muy bien en los juegos de acci贸n, y desde el yoga hasta la m煤sica hay sensaciones completamente diferentes.

  2. Opciones de pago dentro de la acci贸n. Para compras en la aplicaci贸n, el Asistente de Google utiliza la plataforma Google Play. Las condiciones para trabajar con la plataforma para creadores de acci贸n de juego son las mismas que para los desarrolladores de aplicaciones m贸viles: el 70% de la transacci贸n se deduce al desarrollador.
  3. Moderaci贸n Para una moderaci贸n exitosa, la acci贸n debe tener una Pol铆tica de procesamiento de datos personales. Debe colocarlo en sites.google.com , indicar el nombre de su acci贸n y correo electr贸nico, el mismo que el del desarrollador en la consola del desarrollador, y escribir que la aplicaci贸n no utiliza los datos del usuario. La moderaci贸n de una acci贸n sin transacciones dura de 2 a 3 d铆as, pero la moderaci贸n de una aplicaci贸n con pagos integrados puede demorar de 4 a 6 semanas. M谩s sobre el procedimiento de revisi贸n

En general, pruebe nuestras acciones Yoga para los ojos , los juegos Primero o Segundo y s铆, mi se帽or (隆y pronto aparecer谩n transacciones en 茅l, y ser谩 m谩s f谩cil para mi se帽or mantener su poder y riqueza!).

Y tambi茅n desarrollamos el "Lovecraft World" de Voice Quest para Google Assistant, pero no se cre贸 en Aimylogic, sino en Just AI Conversational Platform, una soluci贸n empresarial profesional, por lo que le informaremos sobre esta acci贸n por separado. Este es un drama interactivo en el estilo m铆stico de "Call of Cthulhu", donde las escenas son expresadas por actores profesionales, la trama se puede controlar con la voz y hacer pagos en el juego.

Source: https://habr.com/ru/post/462301/


All Articles