Google Assistant的理想选择-莫斯科Hackathon的8课



7月下旬,Google在其莫斯科办公室(克里姆林宫对面的办公室)举行了一次封闭的黑客马拉松。 主题是为语音助手开发动作 。 我们( Just AI )和其他十几个团队参加了此活动,不仅带来了带有Google nishtyak的红色背包,而且还带出了许多有关如何创建高质量语音界面的有用知识。

在为期两天的黑客马拉松中,每个人都试图为助手开发语音应用程序,甚至有人将其作品发布到Google Actions目录中。 在我们的应用程序示例中我们将讨论如何创建完美的Action并轻松进行Google审核。

什么是Google上的操作


Google助手不仅可以执行标准的语音命令。 您可以为他创建自己的加载项,这将为助手添加功能。 Google称这些附加组件为Actions。 俄语翻译为“应用程序”。 在此处阅读有关Google Actions的更多信息。

为什么要创建自己的动作


如果您正在制作某种移动应用程序,或者您拥有一个可以为客户提供一些有用服务的网站,那么Google助手是与用户互动的另一个不错的渠道。 毕竟,语音助手已安装在超过5亿个设备上! 这些不仅是智能手机,而且是智能扬声器,汽车,手表,电视。 因此,如果您在网站或应用程序中添加了语音助手功能,那么您很可能会找到新的客户和用户,因为他们已经在所有这些设备上与助手交谈。 而且他们更有可能向您的朋友和熟人介绍您的服务。

如何正确执行动作


但是不要以为语音助手的应用程序与站点相同。 这是完全不同的用户体验(UX),已经具有自己的准则 。 用户与助手交谈,因此您的助手应用程序必须以自然语言与用户交谈。



在黑客马拉松比赛中 ,我们使用了自己的Aimylogic对话界面设计器 ,在该工具上我们实现 Google Assistant的第一个应用程序 。 在他的榜样上,现在我们将讨论这段时间所学到的最有价值的教训。


这就是我们完成的Action在Aimylogic构造函数中的外观。

第1课。行动就是声音


助手是语音界面。 说话更方便时,用户可以与助手交谈,而不是打开应用程序或网站。


绝对有必要通过语音界面清楚地了解您的服务的这种功能为什么对用户有用。

语音是您需要快速但有时根本不需要看屏幕的时候。 发出声音是指问题和答案都简短且第一次清晰时。 并且如果为此用户不需要单击五次,那么他一定会利用这一机会。

在我们的“眼睛瑜伽”应用程序中,就有这样的功能。 这些实际上是视觉练习。 在上课时,屏幕不应分散用户的注意力。 这就是为什么我们使用语音界面。

第2课。行动应该真的很有用


助手可以解决用户的任务,而不仅仅是打开浏览器


不要制作对用户无用的助手应用程序。 操作可能非常简单,仅执行服务的一项功能,但它应该完全有用。 否则,这没有任何意义。

“眼睛瑜伽”是有用的,因为用户不需要记住运动和它们在不同复合体中的顺序。 它只是调用一个动作,该动作一个接一个地读取练习,然后用户执行它们。

为此,我们选择了几种不同的复合体并将这些练习放在不同的工作表上的常规Google电子表格中。 我们的应用程序将此表用作数据库 ,使用HTTP请求从所需的工作表中选择一个练习列表然后按周期将其读取给用户。 用户完成下一个练习后,他说“加油”,Action将读取以下内容。



第3课。行动应该清晰且可预测。


助手总是会说明他对用户的期望。 用户始终知道助手现在将要做什么。


动作是助手和用户之间的对话。 当Action等待下一个副本时,用户必须了解他现在可以说什么以及助手将如何响应。 否则,助手在用户看来将是不足和难以理解的。 而且您将不想使用它。

应用程序“眼睛的瑜伽”会简短但清晰地向用户说明,他在完成下一个练习时应说“加油”。 之后,助手将阅读下一个练习并再次等待。 因此,用户了解他应该做什么以及助手对他的期望。 对话很简单,但却非常有效。

短语部分,我们为短语“加油”添加了同义词以便助手对其他表述做出适当的响应。 此外,我们还添加了带有提示的按钮-以便用户首次了解我们的应用程序的工作方式。 我们还在答案中使用了可变性,以免用户每次上课时都重复相同的短语。



第4课。行动应该简短而自然地讲


从机器人听长文本很困难。 而且,如果文字听起来不自然,那会更糟。


助手是一个想要像人类一样的机器人。 在实践中,这转化为以下事实:助手的所有副本应该是可以理解的,但又不能过于机器人化。

语音合成是一件复杂的事情。 文本会更长一些-用户不会听完它。 而且,如果助手就像机器人会简单地对消息进行加密,那么用户将根本无法理解消息。 好吧,否则他将需要更多的努力来了解他的要求。

因此,请根据您的答案进行工作 。 一方面使它们简短,另一方面使他们对话。

当我们从Internet中选择练习集时,我们发现它们非常适合该站点,而不适合交互式界面。 因此,我们对每个练习进行了重新设计,以使其更短,更易于理解。 例如,在一个有练习的网站上有这样的文字

“闭上你的眼睛。 然后揉搓手掌,然后将其放在眼睛上。 保持这个姿势,直到双手放热。 然后,不要睁开眼睛,将手掌向后擦,然后再次将它们放在您的眼睛中。 进行三遍练习。”


我们这样改变了

“闭上你的眼睛。 用力擦手掌,将它们放在眼睛上,然后静坐一分钟。”


并分成两行。 当用户说“继续”时,助手将回答: “现在再重复两次

您不仅可以从网站复制文本并将其用作语音助手 。 我们需要研究这些文本,以使它们易于被人们理解。

第5课。操作必须与用户互动


助理是私人助理。 它应该可以帮助用户获得结果,而不仅仅是等待用户采取行动。


在网站上或在移动应用程序中,我们创建一个带有按钮,列表,图片等的界面。 语音助手也可以完成所有这些操作,但是主要区别在于他可以讲话并允许用户说任何短语。 这改变了UI的方法。

用户可能听不到助手告诉他的内容。 还是第一次不懂。 询问时,助手应始终准备好重复。 或者,如果用户不理解您的答案,请重新制定答案。 让自己穿上助手的鞋。 您正在与另一个人交谈,这对您来说很重要,但不一定是第一次。 您不仅会向对话者显示一张带有菜单项的纸,而且还会帮助您做出选择。

在“眼睛瑜伽”中,我们做到了这一点,以便助手可以根据用户的要求随时重复练习。 而且,不仅要再次显示练习文本,而且要以通俗易懂的方式,提供一次更多的练习时间。 为此,我们在短语框中使用了短语“重复”的几种变体,并在重复练习文本之前在文本中设置了另一个气泡。



第6课。行动无权中断


助手甚至必须对难以理解的用户短语做出适当的响应


助手没有“蓝屏”或错误窗口和“确定”按钮。 而用户又可以说任何话,而根本不说您的操作训练了什么。 在这种情况下,应用程序不应“责怪”用户“不这样说”。 有必要以某种方式响应一个难以理解的命令,并再次向用户解释对他的期望。

仅仅说“哦,我不明白你”是不够的。 这与错误显示每个人的收藏夹窗口相同。 “接下来我该怎么办?” -用户会问。

“眼睛瑜伽”对不明白的短语的反应非常简单-可以向用户说明他是否完成了当前练习。 如果在这种情况下他回答了一些难以理解的事情,他会问他是否完全想完成学业。 为此,我们使用了短语部分中的“任何其他短语”分支来响应难以理解的命令。 碰巧的是,如果未配置用户继续上课,则助手会以轻松的方式邀请他结束课程。



给予难以理解的短语更多的注意 。 毕竟,这是Action的“最常用功能”。

第7课。动作应能识别用户


助手是了解其用户并随时间改变其行为的助手。


如果用户是第一次启动您的动作,则应用程序应该讨论其用途以及如何使用它。 但是,如果用户每天都调用该应用程序,那么每次都使用相同的帮助来加载该应用程序是没有意义的。 您需要像助手一样更改应用程序的行为,这每天都可以更好地了解其用户。

Aimylogic拥有有关用户上一次访问该应用程序多长时间的信息。 Yoga for the Eyes在启动时使用它来迎接用户。 而且由于需要每天进行充电,因此,如果用户长时间没有启动应用程序,我们的应用程序会提醒您。 为此,我们使用“条件”块,在其中检查我们之前收到请求的时间。 依赖于此,Action会通过对话框的不同分支。



第8课。行动必须结束


应用程序完成工作后,您需要与麦克风断开连接。


如果不这样做,那么Google在目录中发布时将拒绝您的申请 。 因此,您的应用程序必须至少具有该对话框的一个分支,这导致退出该应用程序。 在这种情况下,您必须“关闭”麦克风。

在“眼睛瑜伽”中,用户可以始终说“足够”或“我很累”来完成课程。 Aimylogic有一个脚本完成块-我们在对话框中使用了它来与用户说再见并完成我们的操作。



还有我们的一些提示


不要尝试将服务的所有功能推入助手的语音应用程序。 对话是关于简单性,而不是多功能性。 您的操作只能执行一个功能,但是这样做非常方便,以至于用户每天都可以访问您的应用程序。

请勿从助手处执行另一个IVR 。 助手不应列出可能的答案-这是不自然的。 当您进入语音菜单时,这很痛苦。 无需助手帮您做同样的事情。 他可以识别语音,因此可以自然地处理您的脚本。 在同一个Aimylogic中,拥有用于此目的的所有工具,同时,您根本不必编写任何代码。

按钮是提示,不是语音UI的主要元素 。 助手不是按钮界面,而是语音界面。 因此,这些按钮仅应用作提示。 您的对话应使用户无需按钮即可应付。

编写简短的隐私权政策,并在其中包含您的应用程序名称。 否则,Google将不会审核您的应用程序。 查看我们的最终版本 ,以免出错,就像我们所做的一样:)

总结


Google助理最近开始了解俄语。 而且在西方仍然没有太多东西(酷声音,智能扬声器等)。 但这一切都是时间问题。 但是现在,您可以尝试利用Google和其他开发人员共享的现有经验为您的服务开发这个新渠道。



PS 稍后,我们将在教程中逐步发布有关如何在Aimylogic上进行瑜伽瑜伽的分步指导。 来我们的Telegram聊天室,让开发人员不要错过该出版物。

Source: https://habr.com/ru/post/zh-CN420083/


All Articles