C贸mo crear una acci贸n genial para el Asistente de Google. Lifehacks de Just AI

imagen

El ecosistema alrededor del Asistente de Google est谩 creciendo incre铆blemente r谩pido. En abril de 2017, solo 165 acciones estaban disponibles para los usuarios, y hoy solo en ingl茅s hay m谩s de 4,500. La diversidad y el inter茅s del rinc贸n de habla rusa del universo de Google Assistant depender谩 de los desarrolladores. 驴Existe una f贸rmula de acci贸n ideal? 驴Por qu茅 separar el c贸digo y el contenido del script? 驴Qu茅 se debe recordar al trabajar en una interfaz conversacional? Le pedimos al equipo de Just AI, los desarrolladores de tecnolog铆as de IA conversacional, que compartieran trucos para crear aplicaciones para el Asistente de Google. En la plataforma Aimylogic de Just AI, se han creado varios cientos de juegos de acci贸n, entre los cuales hay juegos muy populares: m谩s de 140 mil personas ya han jugado al juego "S铆, mi se帽or" . C贸mo construir adecuadamente el trabajo en la acci贸n so帽ada, dice Dmitry Chechetkin, jefe de proyectos estrat茅gicos de Just AI.

Agitar pero no mezclar: el rol del script, el contenido y el c贸digo


Cualquier aplicaci贸n de voz consta de tres componentes: un gui贸n interactivo, contenido con el que interact煤a la acci贸n y l贸gica programable, es decir. c贸digo

El escenario es quiz谩s lo principal. Describe qu茅 frases puede hablar un usuario, c贸mo debe reaccionar una acci贸n ante ellas, en qu茅 estados entra y c贸mo responde exactamente. He estado programando durante 12 a帽os, pero cuando se trata de crear una interfaz de conversaci贸n, recurro a varias herramientas visuales.

Para empezar, no est谩 de m谩s dibujar un esquema simple del gui贸n en papel. Entonces usted decide qu茅 y qu茅 sigue en el di谩logo. Luego puede transferir el script a alg煤n producto para visualizarlo. Google ofrece crear un di谩logo de Dialogflow totalmente personalizado, y para los escenarios m谩s simples y cortos que no requieren una comprensi贸n amplia del lenguaje, Actions SDK . Otra opci贸n es un dise帽ador visual con Aimylogic NLU ( c贸mo crear una acci贸n para el Asistente de Google en Aimylogic ), en el que puede crear un script sin ninguna habilidad de programaci贸n en profundidad, y tambi茅n probar inmediatamente la acci贸n. Utilizo Aimylogic para ver c贸mo funcionar谩n todas las transiciones en mi di谩logo, para probar y validar la hip贸tesis en s铆 y la idea de lo que quiero implementar.



La l贸gica programable a menudo se requiere. Por ejemplo, su sitio puede verse bien, pero para que "sepa c贸mo", tendr谩 que hacer referencia al c贸digo en el servidor y el c贸digo podr谩 calcular algo, guardar y devolver el resultado. Lo mismo con el script de acci贸n. El c贸digo deber铆a ejecutarse sin problemas, y mejor si es completamente gratis. Hoy no hay necesidad de pagar miles de d贸lares para que un c贸digo de 50, 100, 1000 l铆neas est茅 disponible para su acci贸n 24/7. Utilizo varios servicios para esto a la vez: Google Cloud Functions , Heroku, Webtask.io, Amazon Lambda. Google Cloud Platform ofrece una gama bastante amplia de servicios de forma gratuita en su nivel gratuito .

El script puede acceder al c贸digo utilizando las llamadas http m谩s simples a las que todos estamos acostumbrados. Pero al mismo tiempo, el c贸digo y el script no se mezclan. Y esto es bueno, porque puede mantener ambos componentes actualizados, expandirlos a su gusto, sin complicar el trabajo en la acci贸n.



El tercer componente es el contenido. Estos son datos que pueden cambiar todo el tiempo, sin afectar la estructura del script en s铆. Por ejemplo, preguntas de preguntas o episodios en nuestro juego S铆 S铆 . Si el contenido viviera con el script o con el c贸digo, dicho script se volver铆a m谩s engorroso. Y en este caso, no importa qu茅 herramienta use para crear una acci贸n, trabajar con ella seguir谩 siendo un inconveniente para usted. Por lo tanto, recomiendo almacenar el contenido por separado: en una base de datos, en un archivo en el almacenamiento en la nube o en una tabla a la que el script tambi茅n pueda acceder a trav茅s de la API para recibir datos sobre la marcha. Separando el contenido del gui贸n y el c贸digo, puede atraer a otras personas para que trabajen en la acci贸n: podr谩n reponer el contenido independientemente de usted. Y el desarrollo del contenido es muy importante, porque el usuario espera de la acci贸n, a la que regresa una y otra vez, contenido fresco y diverso.



驴C贸mo usar tablas ordinarias en la nube para no almacenar todo el contenido en el script mismo? Por ejemplo, en el juego "Primero o Segundo" utilizamos una hoja de c谩lculo Excel basada en la nube donde cualquiera de los participantes del proyecto podr铆a agregar nuevas preguntas y respuestas para la acci贸n. El script de Aimylogic accede a esta tabla utilizando una 煤nica solicitud http a trav茅s de una API especial. Como puede ver, el script en s铆 es peque帽o, porque no almacena todos los datos de la tabla, que se actualiza todos los d铆as. Por lo tanto, separamos la secuencia de comandos interactiva del contenido, lo que nos permite trabajar con el contenido de forma independiente y reponer colectivamente la secuencia de comandos con datos nuevos. Por cierto, 50 mil personas ya han jugado este juego.

Lista de verificaci贸n: cosas para recordar al crear una interfaz conversacional


Cualquier interfaz tiene componentes con los que el usuario interact煤a: listas, botones, im谩genes y m谩s. La interfaz conversacional existe de acuerdo con las mismas leyes, pero la diferencia fundamental es que una persona se comunica con el programa por voz. A partir de esto debemos construir, creando nuestra propia acci贸n.

La acci贸n correcta no deber铆a ser capaz de hacer todo en el mundo. Cuando una persona habla con un programa, no puede mantener mucha informaci贸n en su cabeza (recuerde c贸mo escucha las ofertas personales de varios pisos de un banco u operador de telefon铆a m贸vil por tel茅fono). Renunciar a lo superfluo y centrarse en una sola, pero la funci贸n m谩s importante de su servicio, que se realizar谩 m谩s convenientemente con su voz, sin tocar la pantalla.

Por ejemplo, tiene un servicio de tickets. No debe esperar que el cliente ponga en escena el escenario habitual con una voz: busque un boleto de acuerdo con cinco o seis criterios, elija entre transportistas, compare y pague. Pero una aplicaci贸n que le indica el precio m铆nimo en la direcci贸n elegida puede ser 煤til: esta es una operaci贸n muy r谩pida, y es conveniente realizarla por voz sin abrir el sitio, sin tener que pasar por el gui贸n de "llenado de formularios" cada vez (cuando completa los campos y selecciona filtros )

La acci贸n se trata de la voz, no del servicio en su conjunto. El usuario no debe arrepentirse de haber lanzado la acci贸n en el Asistente, y no fue, por ejemplo, a la aplicaci贸n o al sitio. Pero, 驴c贸mo entender que no se puede prescindir de una voz? Para comenzar, prueba la idea de la acci贸n en ti mismo. Si puede realizar f谩cilmente la misma acci贸n sin voz, no tendr谩 sentido. Una de mis primeras aplicaciones de Asistente fue Yoga para los ojos . Este es un entrenador personal virtual que ayuda a hacer ejercicios para la visi贸n. No hay duda de que se necesita una voz aqu铆: sus ojos est谩n ocupados con ejercicios, est谩 relajado y concentrado en las recomendaciones orales. Asomarse al memorando, distray茅ndose del entrenamiento, ser铆a inconveniente e ineficaz.

O aqu铆 hay un ejemplo de un script fallido para una aplicaci贸n de voz. A menudo escucho sobre c贸mo otra tienda en l铆nea quiere vender algo a trav茅s de un asistente virtual. Pero llenar la canasta con voz es inconveniente y poco pr谩ctico. Y es poco probable que el cliente entienda por qu茅 lo necesita. Pero la capacidad de repetir el 煤ltimo pedido por voz o lanzar algo sobre la marcha en la lista de compras es otra cuesti贸n.

Recuerda sobre UX. La acci贸n debe ser junto con el usuario: acompa帽arlo y guiarlo en el curso del di谩logo para que comprenda f谩cilmente lo que se debe decir. Si una persona se detiene, comienza a pensar: "驴Y qu茅 sigue?" Es un fracaso. No hay necesidad de esperar que su usuario siempre consulte la ayuda. Los "callejones sin salida" deben ser monitoreados (por ejemplo, en an谩lisis en la Consola de acciones ), y el usuario debe recibir ayuda con preguntas o sugerencias sugerentes. En el caso de la acci贸n de voz, la previsibilidad no es un vicio. Por ejemplo, en nuestro juego "S铆, mi se帽or", cada frase termina para que el participante pueda responder "s铆" o "no". No est谩 obligado a inventar algo por su cuenta. Y no es que este sea un juego tan elemental. Es solo que las reglas est谩n organizadas para que el usuario sea muy claro.


"隆脡l habla bien!" La acci贸n "escucha" bien gracias al Asistente, y bien "habla", gracias al desarrollador del script. Una actualizaci贸n reciente le dio al Asistente de Google nuevas opciones de voz y una pronunciaci贸n m谩s realista. Todo es genial, pero el desarrollador debe reflexionar sobre la frase, su estructura, sonido, para que el usuario pueda entender todo la primera vez. Organice el estr茅s, use pausas para hacer que las frases de acci贸n suenen humanas.

Nunca cargue al usuario. Para los juegos de acci贸n que expresan noticias o leen cuentos de hadas a los ni帽os, esto no es un problema. Pero escuchar el discurso de un asistente de voz sin parar cuando quieres pedir pizza es dif铆cil. Intente hacer r茅plicas concisas, pero no monosil谩bicas y variadas (por ejemplo, pensar en varias opciones para saludos, despedidas e incluso frases en caso de que el asistente no haya entendido algo). El di谩logo debe sonar natural y amigable, para esto puede agregar elementos de habla coloquial, emociones, interjecci贸n a las frases.

El usuario no perdona la estupidez. La gente suele culpar a los asistentes de voz por la estupidez. Y, b谩sicamente, esto sucede cuando un asistente o una aplicaci贸n para 茅l no pueden reconocer diferentes variaciones de la misma frase. Deje que su acci贸n sea tan simple como configurar una alarma, es importante que a煤n comprenda sin贸nimos, diferentes formas de palabras que tienen un significado id茅ntico y que no fallan si el usuario responde de manera impredecible.

驴C贸mo salir de situaciones cuando una acci贸n se niega a entender? En primer lugar, puede diversificar las respuestas en la intenci贸n de reserva predeterminada: use no solo el est谩ndar proporcionado, sino tambi茅n los personalizados. Y en segundo lugar, puedes entrenar la intenci贸n alternativa con todo tipo de frases de spam que no est谩n relacionadas con el juego. Esto ense帽ar谩 a la aplicaci贸n no solo a responder adecuadamente a solicitudes irrelevantes, sino que tambi茅n aumentar谩 la precisi贸n de la clasificaci贸n de otros tipos de solicitudes.

imagen

Y un consejo m谩s. Nunca, nunca haga un men煤 de botones de su acci贸n para facilitar la vida del usuario: molesta, distrae del di谩logo y le hace dudar de la necesidad de usar la voz.

Ense帽ar la acci贸n de cortes铆a. Incluso la acci贸n m谩s genial deber铆a terminar. Idealmente, adi贸s, despu茅s de lo cual quieres volver a 茅l nuevamente. Por cierto, recuerde que si la acci贸n no hace una pregunta, sino que simplemente responde a la pregunta del usuario, debe "cerrar el micr贸fono" (de lo contrario, la aplicaci贸n no se moderar谩 y no se publicar谩). En el caso de Aimylogic, solo necesita agregar el bloque "Finalizaci贸n del script" al script.

Y si cuenta con la retenci贸n, es importante proporcionar otras reglas de buen tono en el gui贸n: la acci贸n debe funcionar en un contexto: recuerde el nombre y el g茅nero del usuario y no vuelva a preguntar qu茅 se ha especificado.

C贸mo trabajar con calificaciones y rese帽as


Los usuarios de Google Assistant pueden calificar los juegos de acci贸n y, por lo tanto, influir en su calificaci贸n. Por lo tanto, es importante aprender a usar el sistema de calificaci贸n para su ventaja. Parece que solo necesita darle al usuario un enlace a una p谩gina con su acci贸n y pedirle que deje una rese帽a. Pero hay reglas. Por ejemplo, no ofrezca evaluar la acci贸n en el primer mensaje: el usuario debe comprender lo que est谩 calificando. Espere hasta que la aplicaci贸n realmente cumpla con alguna misi贸n de usuario 煤til o interesante, y solo entonces ofrezca dejar una revisi贸n.



Y es mejor no intentar expresar esta solicitud con su voz, con la ayuda de la s铆ntesis de voz: solo pasa su tiempo. Adem谩s, puede que no siga el enlace, pero diga "Apuesto cinco", y esto no es lo que necesita en este caso.

En el juego "S铆, mi se帽or", mostramos el enlace para recibir comentarios solo despu茅s de que el usuario haya jugado la siguiente ronda. Y al mismo tiempo, no expresamos la solicitud, sino que simplemente mostramos un enlace a la pantalla y ofrecemos volver a jugar. Volver茅 a prestar atenci贸n: ofrezca este enlace cuando se garantice que el usuario recibir谩 alg煤n beneficio o placer. Si hace esto en el momento equivocado, cuando la acci贸n no comprende algo o se ralentiza, puede recibir comentarios negativos.

En general, pruebe nuestras acciones de Aimylogic "Yoga para los ojos" , los juegos "Primero o Segundo" y "S铆, mi se帽or" (y pronto aparecer谩n transacciones en 茅l, 隆y ser谩 m谩s f谩cil para mi se帽or mantener su poder y riqueza!). Y recientemente, lanzamos la primera b煤squeda de voz para el Asistente de Google "Lovecraft World" , un drama interactivo en el estilo m铆stico "Call of Cthulhu", donde las escenas son expresadas por actores profesionales, la trama se puede controlar por voz y hacer pagos en el juego. Esta acci贸n ya est谩 desarrollada en Just AI Conversational Platform, una soluci贸n empresarial profesional.

Tres secretos del asistente de Google


  1. El uso de la m煤sica. De los asistentes de voz en ruso, solo el Asistente de Google te permite usar m煤sica directamente en el gui贸n de acci贸n. La disposici贸n musical suena muy bien en los juegos de acci贸n, y desde el yoga hasta la m煤sica hay sensaciones completamente diferentes.

  2. Opciones de pago dentro de la acci贸n. Para compras en la aplicaci贸n, el Asistente de Google utiliza la plataforma Google Play. Las condiciones para trabajar con la plataforma para creadores de acci贸n de juego son las mismas que para los desarrolladores de aplicaciones m贸viles: el 70% de la transacci贸n se deduce al desarrollador.
  3. Moderaci贸n Para una moderaci贸n exitosa, la acci贸n debe tener una Pol铆tica de procesamiento de datos personales. Debe colocarlo en sites.google.com , indicar el nombre de su acci贸n y correo electr贸nico, el mismo que el del desarrollador en la consola del desarrollador, y escribir que la aplicaci贸n no utiliza los datos del usuario. La moderaci贸n de una acci贸n sin transacciones dura de 2 a 3 d铆as, pero la moderaci贸n de una aplicaci贸n con pagos integrados puede demorar de 4 a 6 semanas. M谩s sobre el procedimiento de revisi贸n



M谩s trucos para la vida, m谩s casos y 茅picas instructivas esperan a los desarrolladores en la conferencia sobre conversaciones de AI conversacionales , que se realizar谩 del 27 al 28 de junio en San Petersburgo. Andrey Lipatsev, Gerente de Desarrollo de Socios Estrat茅gicos de Google, hablar谩 sobre la experiencia internacional y los detalles rusos del Asistente de Google. Y en el D铆a del Desarrollador, Tanya Lando, una ling眉ista l铆der de Google, hablar谩 con los participantes sobre cuadros de di谩logo, se帽ales y metodolog铆as y c贸mo elegirlos para sus tareas; y los propios desarrolladores compartir谩n su experiencia personal en la creaci贸n de aplicaciones de voz para asistentes, desde una secretaria virtual para Google Home hasta juegos de voz y acciones B2B que pueden funcionar con la infraestructura cerrada de la compa帽铆a.

Y, por cierto, el 28 de junio, como parte de la conferencia, Google y Just AI realizar谩n un hackathon abierto para desarrolladores profesionales y novatos: 隆puedes trabajar en acciones para el Asistente, experimentar con UX conversacional, s铆ntesis de voz y herramientas NLU y competir por premios en efectivo! Reg铆strese - 隆el n煤mero de asientos es limitado!

imagen

Source: https://habr.com/ru/post/455816/


All Articles