如何为Google Assistant创建酷炫的动作。 Just AI的Lifehacks

图片

Google Assistant周围的生态系统正在以惊人的速度增长。 在2017年4月,只有165个操作可供用户使用,今天只有英文操作的操作超过4,500个。GoogleAssistant的俄语区将变得多么有趣,取决于开发人员。 有理想的行动配方吗? 为什么要将代码和内容与脚本分开? 在对话界面上工作时应记住什么? 我们要求对话式AI技术的开发者Just AI团队分享生活中的技巧,以便为Google Assistant创建应用程序。 在Just AI的Aimylogic平台上,创建了数百种动作游戏,其中有非常受欢迎的动作游戏-已有14万多人在玩“是的,我的主人”游戏。 Just AI战略项目负责人Dmitry Chechetkin说,如何在梦dream以求的工作中正确开展工作。

摇但不可混:脚本,内容和代码的作用


任何语音应用程序都由三个组件组成-交互式脚本,动作与之交互的内容以及可编程逻辑,即 代码。

该场景可能是主要问题。 它描述了用户可以说的短语,动作应如何对他们作出反应,动作所处的状态以及动作的准确程度。 我从事编程已有12年了,但是在创建对话界面时,我会使用各种可视化工具。

对于初学者来说,在纸上画一个简单的脚本轮廓并没有什么坏处。 因此,您可以决定对话中的内容和后续内容。 然后,您可以将脚本传输到某些产品以使其可视化。 Google提供了创建完全自定义的Dialogflow对话框的功能,对于不需要广泛理解该语言的最简单和最短的场景,您可以使用Actions SDK 。 另一个选择是使用Aimylogic NLU如何在Aimylogic中为Google Assistant创建动作 )的视觉设计器,您可以在其中构建脚本而无需任何深入的编程技能,并立即测试动作。 我使用Aimylogic来查看对话框中所有转换的工作方式,以测试和验证假设本身以及要实现的想法。



通常需要可编程逻辑。 例如,您的站点可能看起来很酷,但是为了使其“知道如何”,它必须引用服务器上的代码-并且该代码将能够计算,保存并返回结果。 与动作脚本相同。 该代码应运行平稳,如果完全免费,则更好。 今天,您无需支付数千美元,就可以在您的行动24/7中使用50、100、1000行的代码。 我一次使用了多种服务: Google Cloud Functions ,Heroku,Webtask.io,Amazon Lambda。 Google Cloud Platform的免费套餐免费提供了相当广泛的服务。

该脚本可以使用我们都习惯的最简单的http调用来访问代码。 但是同时,代码和脚本不会混合在一起。 这很好,因为您可以使这两个组件保持最新状态,并根据需要扩展它们,而不会使操作复杂化。



第三部分是内容。 这些数据可以随时更改,而不会影响脚本本身的结构。 例如,在我们的Yes Yes游戏中测验问题或情节。 如果内容与脚本或代码一起使用,则这样的脚本将变得更加麻烦。 在这种情况下,无论您使用什么工具来创建动作,使用它对于您来说仍然是不便的。 因此,我建议单独存储内容:在数据库中,在云存储中的文件中或在脚本也可以通过API访问的表中,以便即时接收数据。 将内容与脚本和代码分开,您可以吸引其他人进行操作-他们将能够独立于您补充内容。 内容的开发非常重要,因为用户希望从动作中获得期望,他会不时地返回新鲜多样的内容。



如何在云中使用普通表以免将所有内容存储在脚本本身中? 例如,在“第一或第二”游戏中,我们使用了基于云的Excel电子表格,其中任何项目参与者都可以为操作添加新的问题和答案。 Aimylogic脚本通过特殊的API使用单个http请求访问此表。 如您所见,脚本本身很小-因为它不会存储表中的所有数据,该表每天都会更新。 因此,我们将交互式脚本与内容分离开来,这使我们能够独立处理内容,并集体为脚本补充新的数据。 顺便说一下,已经有5万人玩了这个游戏。

清单:创建对话界面时要记住的事情


任何界面都具有用户与之交互的组件:列表,按钮,图片等。 对话界面是根据相同的规律存在的,但是根本的区别在于,人与人通过语音与程序进行通信。 我们必须以此为基础,创造自己的行动。

正确的行动不应该做世界上的一切。 当一个人在讲程序时,他的脑海中无法保存很多信息(记住您如何通过电话收听银行或移动运营商提供的多层个人报价)。 放弃多余的内容,只专注于一项最重要但最重要的服务功能,即可以最方便地使用语音执行操作,而无需触摸屏幕。

例如,您有票务服务。 您不希望客户用声音解决通常的情况-根据五或六个条件寻找机票,在承运人之间选择,比较并付款。 但是,一个告诉您所选择方向的最低价格的应用程序可能会派上用场:这是一个非常快速的操作,无需打开站点即可通过语音轻松执行,而不必每次都经过“表单填写”脚本(当您填写字段并选择过滤器时) )

行动是关于声音,而不是整个服务。 用户不应后悔自己在助手中启动了操作,也没有进入例如应用程序或网站。 但是如何理解一个人不能没有声音呢? 首先,尝试自己采取行动的想法。 如果您可以轻松地执行相同的操作而没有声音,那将毫无意义。 我的第一个助手应用程序之一是Yoga for the Eyes 。 这是一个虚拟的私人教练,有助于进行视觉锻炼。 毫无疑问,这里需要一个声音:您的眼睛忙于练习,放松并专注于口头推荐。 偷偷看备忘录,分散了培训的注意力,将是不便和无效的。

或者这是语音应用程序失败脚本的示例。 我经常听到另一家网上商店希望通过虚拟助手出售商品的信息。 但是,在篮子里装满声音是不便和不切实际的。 客户不太可能理解他为什么需要它。 但是,通过语音重复最后一次订购或在购物清单上随意放置商品的能力是另一回事。

记住关于UX。 动作应该与用户一起:在对话过程中陪伴并指导他,以便他轻松理解需要说的内容。 如果一个人陷入僵局,他就会开始思考:“接下来是什么?” 是失败的。 无需希望您的用户将始终参考帮助。 需要监控“死胡同”(例如,在Actions Console中的分析中),并且应该向用户提供提示性问题或提示。 就语音行动而言,可预测性不是坏处。 例如,在我们的游戏“是,我的主人”中,每个短语都结束了,因此参与者可以回答“是”或“否”。 不需要他自己发明一些东西。 并不是说这是一个基本的游戏。 只是规则是有条理的,以便用户对所有内容都非常清楚。


“他说得很好!” 多亏了助手,动作“听”得很好,多亏了脚本开发者,动作也“说话了”。 最近的更新为Google Assistant提供了新的语音选项和更逼真的发音。 一切都很酷,但是开发人员应该反思短语,其结构,声音,以便用户可以在第一时间了解一切。 安排压力,使用暂停让动作短语听起来像人一样。

切勿加载用户。 对于动作游戏来说,为儿童提供新闻或为孩子们读童话故事,这不是问题。 但是,当您要订购披萨时,要无休止地聆听语音助手的讲话是很困难的。 尝试使复制品简明扼要,但不要使单音节变化多变(例如,考虑几个问候,告别甚至短语的选项,以防助手误解某些东西)。 对话听起来自然而友好,为此,您可以在口语中添加口语,情感和感叹等元素。

用户不会原谅愚蠢。 人们常常将语音助手的愚蠢归咎于语音助手。 基本上,当助手或助手的应用程序无法识别同一短语的不同变体时,就会发生这种情况。 让您的操作像发出警报一样简单,重要的是他仍然可以理解同义词,含义相同的不同形式的单词,并且如果用户做出不可预测的响应,也不会失败。

当行动拒绝理解时,如何摆脱困境? 首先,您可以在“默认后备意图”中分散答案-不仅使用提供的标准,还可以使用自定义的标准。 其次,您可以使用与游戏无关的各种垃圾邮件短语来训练“后备意图”。 这将教导该应用程序不仅可以充分响应不相关的请求,而且可以提高其他类型请求的分类准确性。

图片

还有一个提示。 永远不要从操作中退出按钮菜单,以使用户的生活更轻松-它烦人,分散对话的注意力,并让您怀疑使用语音的必要性。

讲礼貌的动作。 即使最酷的动作也应该结束。 理想情况下,再见,之后您想再次回到他身边。 顺便说一句,请记住,如果操作不问问题,而只是回答用户的问题,则他必须“关闭麦克风”(否则应用程序将不会被审核,也不会被发布)。 对于Aimylogic,您只需要在脚本中添加“脚本完成”块。

而且,如果您希望保留,那么在脚本中提供其他良好的规则也很重要:操作应在上下文中起作用-记住用户的姓名和性别,而不要再问已经澄清的内容。

如何使用评分和评论


Google Assistant用户可以为动作游戏评分,从而影响他们的评分。 因此,重要的是要学习如何利用评级系统来发挥自己的优势。 似乎您只需要给用户一个带有您操作的页面的链接,并请他留下评论即可。 但是有规则。 例如,不要在第一条消息中提供对操作的评估:用户必须了解他的评分。 等待应用程序真正完成一些有用或有趣的用户任务,然后才提出评论。



而且最好不要在语音合成的帮助下尝试用您的声音来表达此请求-您只需花费用户的时间即可。 而且,他可能不会跟随该链接,而是说“我打赌五个”,在这种情况下,这根本不是您所需要的。

在游戏“是的,我的主人”中,我们仅在用户玩了下一轮之后才显示反馈链接。 同时,我们不发出请求的声音,而只是在屏幕上显示链接并愿意再次播放。 我会再次关注-当确保用户可以从中获得收益或乐趣时,请提供此链接。 如果您在错误的时间执行此操作,则当操作不了解或放慢速度时,您将获得负面反馈。

一般而言,尝试我们的Aimylogic动作“眼睛瑜伽” ,游戏“第一或第二”“是的,我的主人” (很快就会出现交易,而我的主人更容易保持自己的力量和财富!)。 最近,我们发布了针对Google助手“ Lovecraft World”的第一个语音任务,这是一种神秘的“克苏鲁的召唤”式互动戏剧,场景由专业演员配音,剧情可以通过语音控制并进行游戏内支付。 该动作已经在专业企业解决方案Just AI Conversational Platform上开发。

Google Assistant的三个秘密


  1. 使用音乐。 在俄语语音助手中,只有Google Assistant允许您直接在动作脚本中使用音乐。 在游戏中,音乐的安排听起来很棒,从瑜伽到音乐,都有完全不同的感觉。

  2. 行动中的付款方式。 对于应用内购买,Google Assistant使用Google Play平台。 游戏动作创建者使用平台的条件与移动应用程序开发者的条件相同-交易的70%会扣除给开发者。
  3. 适度 。 为了成功进行审核,操作必须具有个人数据处理策略。 您需要将其放置在sites.google.com上 ,在Action Developer中指定操作和电子邮件的名称(与开发人员的名称相同),并写明该应用程序不使用用户数据。 不进行交易的审核活动持续2-3天,但是使用内置付款的应用程序审核则可能需要4-6周。 有关审核程序的更多信息



在6月27日至28日于圣彼得堡举行的对话式AI 对话会议上,更多的生活技巧,更多的案例和具有启发性的史诗等待着开发人员。 Google战略合作伙伴开发经理Andrey Lipatsev将讨论国际经验和Google Assistant的俄语细节。 在开发人员日,Google的主要语言专家Tanya Lando将与参与者讨论对话框,信号和方法论以及如何为任务选择它们。 开发人员自己将分享他们为助手创建语音应用程序的个人经验-从Google Home的虚拟秘书到可以与公司封闭式基础架构配合使用的语音游戏和B2B操作。

顺便说一下,作为会议的一部分,Google和Just AI将在6月28日举行一次面向专业人士和新手开发人员的公开黑客马拉松 -您可以为Assistant进行操作,尝试使用对话UX,语音合成和NLU工具并争夺现金奖励! 注册 -座位数有限!

图片

Source: https://habr.com/ru/post/zh-CN455816/


All Articles