针对所有人:应用内语音助手


您每天都使用语音助手吗? 我没有 。 尽管我已经开发了7年多了!
用这些话, 我们在莫斯科举行的对话技术会议的发展会议开幕了。

那么,所有这些“爱丽丝”,“ Maroussia”和“ Google助手”到底出了什么问题? 为什么用户对他们不满意,而对业务却不理解? 而所有这一切的开源替代方案是什么?



移动语音助手的问题


如今,所有移动语音助手都按照“收割机”原理工作-数百个功能隐藏在一个麦克风按钮下。 看起来-哪个更方便? 您无需手头上保留数十个或两个第三方应用程序图标。 只需点击麦克风,说-它不起作用。

但是,这是作为此类“助手”的语音功能的用户和开发人员都将遇到的问题。



1.唯一名称


每个语音“技能”(爱丽丝-“技能”)应有一个唯一的名称 。 的确,否则,一键式“收割机”无法区分它们! 语音助手的功能越多,选择这样一个名称以使用户记住它就越困难。

2.复杂的发现


“爱丽丝,推出这项技能我最喜欢的商店。” 或“好吧Google,与Pizza Papa Johns交谈。” 熟悉吗? 仍然需要教会用户如何启动语音服务。

3. UI,UX和API的局限性


语音助手是具有局限性的第三方应用程序。 作为开发人员,您不能将所需的控件和小部件添加到其界面中。 因此,尽管功能可能更广泛,但您只需要使用已有的东西即可!

还有更多


此外,语音识别和语音合成技术还存在一些局限性,很难授权用户使用您的服务等等

结果,用户常常根本找不到您的语音服务,不知道如何与他交谈,并且面临有限的功能。 作为开发人员,您不了解如何将您的用户带入一个可以吸引百万分之一受众的新渠道。

辅助应用内概念


您的企业很可能已经拥有具有清晰功能,开发,促销和分析工具的移动应用程序。



您了解用户来自何处以及他是谁。 他使用什么功能,如何改进,开发它们以及如何影响业务。 这一切的背后是您的移动开发团队,设计师,UX专家,QA部门和产品。

并且用户了解您的应用程序具有什么功能。
当我需要将资金转移给某人时,我启动银行的应用程序,将我的帐户链接到该应用程序。 当您需要订购产品时-我启动商店应用程序,通常在其中购买商品。

用户始终根据情况采取行动,并启动可精确满足其现在和现在需求的移动应用程序。 没有理由相信用户一定会按下麦克风按钮,以希望语音助手具有他所需的功能并将满足他的要求!

因此, 出现应用程序内助手的概念-语音助手的概念已作为附加的用户界面在您的移动应用程序内部运行 。 在这种情况下,辅助收割机的所有限制都得到了平衡,并且用户基于移动应用程序的上下文了解了辅助功能。

辅助应用内案例


语音功能就像启动移动应用程序一样。 如果通过语音启动某些功能,可能会方便用户

  • 这是一个新用户,他还没有弄清楚应用程序的UI的结构。
  • 用户不记得所需菜单或按钮的隐藏位置
  • 如果他只需要重复上一个动作
  • 如果您能说两个字而不是5条录音带和卷轴
  • 当比在应用程序内寻找解决方案更容易解释问题时

看几个简单的案例。


例如,在银行应用程序中,您可以从联系人列表中向他人转移资金。 应用内助手会在用户说“将500卢布转给妈妈”时理解用户的意思。 而且用户不需要搜索所需的按钮,搜索联系人并输入金额。


在零售商的应用程序中,用户可以呼叫助理以简单地描述问题,然后助理将提供正确的产品。



在此重要的是要了解,这种语音界面仅是现有UI的补充 。 如上所述,只有在助手充当“导航员”或推荐系统时,价值才会出现。

由于这是您自己的应用程序内部助手,因此它不仅限于本文上面列出的所有内容:您不需要提供唯一的名称,UI可以是任何东西,助手可以直接与应用程序功能进行交互等等。

如何向您的应用程序添加声音




是的,您的移动开发人员必须立即处理多种技术以集成语音接口。 尽管它是一种不错的添加,而不是主要功能,但实际上...即:连接到语音识别系统,语音合成,语言处理引擎,归档您的语音助手UI,实现体系结构并进行测试。

但是,有一个开源解决方案可以帮助您更快,更高效地完成所有工作!

瞄准盒


最近,我们已经写了一些有关开源语音助手Aimybox的文章 ,该助手正是为方便在现有移动应用程序中实现语音功能而设计的。 在这里,我们将以应用内助手的概念来谈论他。



现在,您只要在站点上出现在线聊天按钮,就不会感到惊讶,这使得可以快速联系运营商并询问有关商品和服务的问题。 这是一项附加功能,但是,如果使用得当,可以增加转化次数。 此外,通常,要在您的站点上开始在线聊天,您只需要在HTML代码中添加一个脚本标签即可。

Aimybox遵循相同的原则,但相对于语音助手而言。 您需要做的就是向您的移动应用程序项目中添加几个依赖关系,并添加几行代码,以便麦克风按钮出现在右下角。

在这里,您可以看到此操作的完成方式。



开箱即用,Aimybox提供了一个简洁且可自定义的UI (如果需要,可以完全更改)和助手SDK本身。 此外,作为识别综合NLP引擎,您可以从现有引擎中进行选择或创建自己的模块。

本质上,Aimybox实现了语音助手体系结构,标准化了所有这些模块的接口,并适当地组织了它们的交互。 因此,引入此解决方案,您可以大大减少在应用程序中开发语音界面的时间。



最后


语音助手当然很棒。 但是感觉是,他们现在所走的道路只会使用户和企业远离便捷的技术。 通常这也是由于开发人员尚不知道如何创建高质量语音UX所致。 我们最近写了有关如何解决此问题的文章。

在本文中,我们试图简要地讨论应用程序内助手的全新概念,即将语音助手作为移动应用程序的内部功能。 在这种情况下,用户和开发人员都可以清楚地看到语音作为附加UI的价值。

有用的链接


Source: https://habr.com/ru/post/zh-CN479554/


All Articles