Google Assistant周围的生态系统发展迅速。 在2017年4月,只有165个操作可供用户使用,今天仅英语提供的操作已超过4,500个。该领域的俄语语言一角的多样性和趣味性取决于开发人员。 Just AI战略项目负责人Dmitry Chechetkin和
《是的,我的主人》(Yes,my Lord)的作者
,这不仅是俄罗斯乃至世界上最受欢迎的《 Assistant》游戏之一(已经有超过24万人玩过),他分享了一些重要的生活技巧,可以为Google助手。 为什么要将代码和内容与脚本分开? 在对话界面上工作时应记住什么? 总的来说,我们了解如何为梦想做准备。

摇但不可混:脚本,内容和代码的作用
任何语音应用程序都由三个组件组成-交互式脚本,动作与之交互的内容以及可编程逻辑,即 代码。
该场景可能是主要问题。 它描述了用户可以说的短语,动作应如何对他们作出反应,动作所处的状态以及动作的准确程度。 我从事编程已有12年了,但是在创建对话界面时,我会使用各种可视化工具。
对于初学者来说,在纸上画一个简单的脚本轮廓并没有什么坏处。 因此,您可以决定对话中的内容和后续内容。 然后,您可以将脚本传输到某些产品以使其可视化。 我将视觉构造函数与NLU
Aimylogic (
如何在Aimylogic中为Google Assistant创建动作 )一起使用,以查看对话框中的所有转换如何工作,测试和验证假设本身以及我想要实现的想法。 在Aimylogic中,您可以构建不具有深入编程技能的脚本,并且可以立即测试操作。 Google本身提供了
Dialogflow,用于创建自定义的对话框以及不需要广泛了解该语言的简单脚本和短脚本
Actions SDK 。

通常需要可编程逻辑。 例如,您的站点可能看起来很酷,但是为了使其“知道如何”,它必须引用服务器上的代码-并且该代码将能够计算某些内容,保存并返回结果。 与动作脚本相同。 该代码应运行平稳,如果完全免费,则更好。 今天,您无需支付数千美元,就可以在您的行动24/7中使用50、100、1000行的代码。 我一次使用了多种服务:Cloud Functions,Heroku,Webtask.io,Amazon Lambda。 Google云端平台上提供了免费实例。
该脚本可以使用我们都习惯的最简单的http调用来访问代码。 但是同时,代码和脚本不会混合在一起。 这很好,因为您可以使这两个组件保持最新状态,并根据需要扩展它们,而不会使操作复杂化。

第三部分是内容。 这些数据可以随时更改,而不会影响脚本本身的结构。 例如,在我们的
Yes Yes游戏中测验问题或情节。 如果内容与脚本或代码一起使用,则这样的脚本将变得更加麻烦。 在这种情况下,无论您使用什么工具来创建动作,使用它对于您来说仍然是不便的。 因此,我建议将内容分别存储:在数据库中,在云存储中的文件中或在脚本也可以通过API访问的表中,以便即时接收数据。 将内容与脚本和代码分开,您可以吸引其他人进行操作-他们将能够独立于您补充内容。 内容的开发非常重要,因为用户希望从动作中获得期望,他会不时地返回新鲜多样的内容。

如何在云中使用普通表以免将所有内容存储在脚本本身中? 例如,在
“第一或第二”游戏中,我们使用了基于云的Excel电子表格,其中任何项目参与者都可以为操作添加新的问题和答案。 Aimylogic脚本通过特殊的API使用单个http请求访问此表。 如您所见,脚本本身很小-因为它不会存储表中的所有数据,该表每天都会更新。 因此,我们将交互式脚本与内容分离开来,这使我们能够独立处理内容,并集体为脚本补充新的数据。 顺便说一句,已经有8万人玩了这个游戏。
清单:创建对话界面时要记住的事情
任何界面都具有用户与之交互的组件:列表,按钮,图片等。 对话界面是根据相同的规律存在的,但是根本的区别在于,人与人通过语音与程序进行通信。 我们必须以此为基础,创造自己的行动。
正确的行动不应该做世界上的一切。 当一个人在讲程序时,他的脑海中无法保存很多信息(记住您如何通过电话收听银行或移动运营商提供的多层个人报价)。 放弃多余的内容,只专注于一项最重要但最重要的服务功能,即可以最方便地使用语音执行操作,而无需触摸屏幕。
例如,您有票务服务。 您不希望客户用声音解决通常的情况-根据五或六个条件寻找机票,在承运人之间选择,比较并付款。 但是,一个告诉您所选择方向的最低价格的应用程序可能会派上用场:这是一个非常快速的操作,无需打开站点即可通过语音轻松执行,而不必每次都经过“表单填写”脚本(当您填写字段并选择过滤器时) )
行动是关于声音,而不是整个服务。 用户不应后悔自己在助手中启动了操作,也没有进入例如应用程序或网站。 但是如何理解一个人不能没有声音呢? 首先,尝试对自己采取行动的想法。 如果您可以轻松地执行相同的操作而没有声音,那将毫无意义。 我的第一个助手应用程序之一是
Yoga for the Eyes 。 这是一个虚拟的私人教练,有助于进行视觉锻炼。 毫无疑问,这里需要一个声音:您的眼睛忙于练习,放松并专注于口头推荐。 偷偷看备忘录,分散了培训的注意力,将是不便和无效的。
或者这是语音应用程序失败脚本的示例。 我经常听到另一家网上商店希望通过虚拟助手出售商品的信息。 但是,在篮子里装满声音是不便和不切实际的。 客户不太可能理解他为什么需要它。 但是,通过语音重复最后一次订购或在购物清单上随意放置商品的能力是另一回事。
记住关于UX。 动作应该与用户一起:在对话过程中陪伴并指导他,以便他轻松理解需要说的内容。 如果一个人陷入僵局,他就会开始思考:“接下来是什么?” 是失败的。 无需希望您的用户将始终参考帮助。 死锁需要进行监控,并帮助用户解决主要问题或提示。 就语音行动而言,可预测性不是坏处。 例如,在我们的游戏“是,我的主人”中,每个短语都结束了,因此参与者可以回答“是”或“否”。 不需要他自己发明一些东西。 并不是说这是一个基本的游戏。 只是规则的组织方式对用户来说一切都非常清晰。
“他说得很好!” 多亏了助手,动作“听”得很好,多亏了脚本开发者,动作也“说话了”。 最近的更新为Google Assistant提供了新的语音选项和更逼真的发音。 一切都很酷,但是开发人员应该反思短语,其结构,声音,以便用户可以在第一时间了解一切。 安排压力,使用暂停让动作短语听起来像人一样。
切勿加载用户。 对于动作游戏来说,为儿童提供新闻或为孩子们读童话故事,这不是问题。 但是,当您要订购披萨时,要无休止地聆听语音助手的讲话非常困难。 尝试使复制品简明扼要,而不是单音节式的变化(例如,考虑几个问候,告别甚至短语的选项,以防助手误解某些东西)。 对话听起来自然而友好,为此,您可以在口语中添加口语,情感和感叹等元素。
用户不会原谅愚蠢。 人们常常将语音助理的愚蠢归咎于他们。 基本上,当助手或助手的应用程序无法识别同一短语的不同变体时,就会发生这种情况。 让您的操作像发出警报一样简单,重要的是他仍然可以理解同义词,含义相同的不同形式的单词,并且如果用户做出不可预测的响应也不会失败。
当行动拒绝理解时,如何摆脱困境? 首先,您可以在“默认后备意图”中分散答案-不仅使用提供的标准,还可以使用自定义的标准。 其次,您可以使用与游戏无关的各种垃圾邮件短语来训练“后备意图”。 这将教导该应用程序不仅可以充分响应不相关的请求,还可以提高其他类型请求的分类准确性。

还有一个提示。 永远不要从操作中做出一个按钮菜单,以使用户的生活更轻松-它烦人,分散对话的注意力,并使您怀疑使用语音的必要性。
讲礼貌的动作。 即使最酷的动作也应该结束。 理想情况下,再见,之后您想再次回到他身边。 顺便说一句,请记住,如果该操作不问问题,而只是回答用户的问题,则他必须“关闭麦克风”(否则该应用程序将不会被审核,也不会被发布)。 对于Aimylogic,您只需要在脚本中添加“脚本完成”块。
而且,如果您希望保留,则在脚本中提供其他良好的规则很重要:该操作应在上下文中起作用-记住用户的姓名和性别,而不要再问已指定的内容。
如何使用评分和评论
Google Assistant用户可以为动作游戏评分,从而影响他们的评分。 因此,重要的是要学习如何使用评级系统以使自己受益。 似乎您只需要给用户一个带有您操作的页面的链接,并请他留下评论即可。 但是有规则。 例如,不要在第一条消息中提供对操作的评估:用户必须了解他的评分。 等待应用程序真正完成一些有用或有趣的用户任务,然后才提出评论。

最好不要在语音合成的帮助下尝试用您的声音来表达此请求-您只需花费用户的时间即可。 而且,他可能不会跟随该链接,而是说“我打赌五个”,在这种情况下,这根本不是您所需要的。
在游戏“是的,我的主人”中,我们仅在用户玩了下一轮之后才显示反馈链接。 同时,我们不发出请求的声音,而只是在屏幕上显示链接并愿意再次播放。 我会再次关注-当确保用户可以从中获得收益或乐趣时,请提供此链接。 如果您在错误的时间执行此操作,则当操作不了解或放慢速度时,您将获得负面反馈。
Google Assistant的三个秘密
- 使用音乐。 在俄语语音助手中,只有Google Assistant允许您直接在动作脚本中使用音乐。 在游戏中,音乐的安排听起来很棒,从瑜伽到音乐,都有完全不同的感觉。
- 行动中的付款方式。 对于应用内购买,Google Assistant使用Google Play平台。 游戏动作创建者使用平台的条件与移动应用程序开发者的条件相同-交易的70%会扣除给开发者。
- 适度 。 为了成功进行审核,操作必须具有个人数据处理策略。 您需要将其放置在sites.google.com上 ,在Action Developer中指定操作和电子邮件的名称(与开发人员的名称相同),并写明该应用程序不使用用户数据。 不进行交易的审核活动持续2-3天,但是使用内置付款的应用程序审核则可能需要4-6周。 有关审核程序的更多信息
总的来说,尝试我们自己
做的运动“瑜伽之眼” ,游戏“
第一或第二” ,
是的,我的主人 (很快交易就会出现在其中,而
我的主人更容易保持自己的力量和财富!)。
我们还为Google Assistant开发了Voice Quest
“ Lovecraft World” -但它不是在Aimylogic中创建的,而是在专业企业解决方案Just AI Conversational Platform上创建的,因此我们将分别介绍此操作。 这是一部具有神秘色彩的“克苏鲁的召唤”式互动戏剧,场景由专业演员配音,剧情可以通过语音控制并进行游戏内支付。