聊天机器人应该是下一个突破:出了什么问题?

新闻出版物泛滥成灾:“与过去十年从网络到应用程序的过渡相比,2016年向机器人范式的过渡将带来更深远和有趣的后果。”

聊天机器人是趋势中的下一个。


我们的希望在高高的天空中飙升。 业界期待着发光的眼睛和排气管的创新新时代:是时候与机器对话了。 看来合乎逻辑。 所有迹象表明疯狂成功。 消息交换已达到顶峰! 互动营销已成为一个新名词! 还有微信! 还有中国!

而且,很明显,在这些愚蠢的应用程序的艰苦开发中,市场报价大大超过了需求。

在2017年世界移动大会上,聊天机器人占据了所有头版。 会议的组织者提到“普遍同意,将来品牌和公司的注意力将不可避免地转移到聊天机器人上。” 实际上,唯一严重的问题是谁完全垄断了市场。 聊天机器人“起飞”的事实毋庸置疑:

“是否会有一个平台将主导聊天机器人和个人助手的生态系统?”

一年后,我们收到了这个问题的答案:不。 因为甚至没有生态系统本身可以在其中占主导地位。

欺骗炒作周期




聊天机器人并不是第一种被赞誉为天空的技术 ,后来又大为失败。 作为一个世界古代,炒作周期在这里保留了其通常的过程。

  • 在TechCrunch撰写的崇敬文章
  • 克里斯·墨西拿(Chris Messina)等具有前瞻性的意见领袖发表讲话
  • 在硅谷,每个人都因与智能计算机聊天的迫切机会而流口水
  • Messenger泛滥的漫游器
  • Slack迅速发展,甚至建立了专门的聊天机器人开发投资基金

期望越来越高……然后一切都一下子消失了。 每个人都预料到的范式转变从未发生过。 而且具有特色的应用程序仍然有效。 回顾我们令人窒息的乐观情绪,我们有些困惑地看着对方:“就这些吗? 那是承诺的革命吗?”

Digan Ethan Bloch这样表达了普遍的看法:

“我什至不知道是否有可能谈论聊天机器人的死亡,因为我不确定它们是否还活着。”

根据 Heap产品设计副总监Dave Feldman的说法 ,聊天机器人不仅解决了一项艰巨的任务,而且没有扩展它,它们同时承担了多项复杂的任务,无法应对其中的任何一项。

文字vs.语音vs.GUI:简史




机器人可以通过多种方式与用户互动。 这里的主要对比是文本和语音。 在开始(计算机接口时代)时,有一个(印刷的)词。 用户必须手动将命令驱动到机器中才能从中获得任何收益。

然后图形界面到达并保存了所有人。 他们以窗户,鼠标单击和图标着迷我们。 为什么,过了一会儿,所有这些甚至都变成彩色了!

同时,一大群研究人员孜孜不倦地致力于将自然语言实现到界面中,从而使人们不再需要学习数据库查询的困惑语言。 另一支军队正在开发语音识别软件,以便您无需键入即可直接与计算机对话。 事实证明,它比起初每个人都看起来要复杂得多。 有很多口音,people不休或伸张单词的人,含糊不清的杂音,各种各样的“ mmmm”和“ uhhhhh ...”。您怎么说“识别语音”或“只是打破炉灶”?

计划的下一点是与机器保持双向对话。 这是一个与VCR 设置系统可能进行对话的示例(最初是90年代):

用户:下午好。
特工:下午好,您叫什么名字?
用户:糖果。
中介:你好,糖果!
用户:让我们设置时钟。
特工:现在几点了?
使用者:上午11点
代理设置时间:11小时。

真的很酷吗? 该系统以双向方式与用户一起工作,并巧妙地读取所需内容。 但是她经过了精心调适,以适应与VCR操作有关的对话,并且仅在这些定义明确的框架内起作用。

现代的聊天机器人,包括文本和语音,都面临所有这些困难,此外,它们应该易于扩展并在各种平台上保持效率。 实际上,我们仍在尝试实现与30年前相同的创新。 在我看来,问题就在下面。

反对应用程序和机器人


有一个大胆的假设,即“申请时间已经过去”, 它们将被机器人取代 。 面对这两个截然不同的概念(而不是将它们视为为不同目的而创建的两个独立实体),我们自己为机器人的开发创造了障碍。

也许您仍然记得十年前应用程序才刚刚开始进入市场时发生的类似战斗之声。 但是您还记得应用程序如何取代互联网吗?

有人说,新产品或技术必须满足三个条件中的两个:更好,更便宜或更快。 聊天机器人比应用程序快吗? 不-至少目前不是这样。 他们是否可以被认为是“更好”是一个有争议的问题,但是,在我看来,今天,最优质的聊天机器人已经不如最优质的应用程序。

此外,没有人认真地认为Lyft会让一切变得混乱,或者通过该应用程序订购食物或购买衣服极其困难。 真正困难的是,如果机器人不了解您,则尝试使用该机器人执行这些操作。



知道了 在购物车中添加其他东西吗?
加4个苹果
即4根香蕉
好的,我在篮子里加了4个苹果和4个香蕉。

一流的bot现在与普通应用程序一样多。 如果我们谈论具有丰富,多层,复杂功能的应用程序,那么它们就没有什么可反对的。

原因在于,计算机使我们能够访问庞大而复杂的信息系统,而具有图形界面的第一个系统是这些系统开发中的革命性一步 。 现代应用程序建立在多年研究和实验的基础上。 为什么要放弃所有这一切?

如果用“补充”代替“替代”,那么一切都会变得更加有趣。 如今,那些遵循混合方法的机器人提供了最成功的体验,它们将聊天嵌入了涵盖传统元素的更广泛的策略中。



Penny轻松地与用户交谈,发送提示和通知,还提供了控制面板和交易列表的标准视图。

HubSpot Conversations结合了Facebook Messenger,本地聊天,社交平台,电子邮件和其他消息传递系统-所有功能都集成在一个盒子中。

Layer为开发人员提供了在移动和桌面Web应用程序以及本机解决方案中创建个性化消息传递体验的工具。

下一个浪潮将是具有多个mod的应用程序 :使用它们,您可以发出请求的声音(例如使用Siri)并获得不同格式的答案-以地图,文本或语音形式。

为了机器人而机器人


我的产品中需要机器人吗? 现有平台是否能够支持其功能? 我是否有足够的耐心来创建可以应对我为其设置的任务的机器人? 普遍热情的另一个消极方面是,在其影响下,此类问题通常会绕开。

对于许多公司来说,机器人根本不是正确的解决方案。 在过去的两年中,有很多情况是随意使用它们而根本不需要它们的。 如果您只是“按原样”制造机器人,请赋予其完全的行动自由并希望获得最好的机器人,那么它肯定不会以任何好的结果而告终:



Chatbot Maroon 5在行动; 确定他急需

绝大多数漫游器都使用基于决策树的逻辑,该逻辑假定漫游器将根据其在输入的文本中标识的关键字来产生准备好的答案之一。 这种方法的优势在于,编译针对该机器人而设计的脚本的完整列表非常简单。 这也是它的主要缺点。

那是因为该机器人无非是对创建它的人的能力,热情和耐心的反映,以及他设法覆盖了多少用户需求和可能的副本。 当现实拒绝适应给定的框架时,问题就开始了。


请从列表中选择一个项目。
显示主菜单
请从列表中选择一个项目。
显示以前的选项
请从列表中选择一个项目。
返回所有选项
请从列表中选择一个项目。
笨机器人

根据最新报告 ,即使是最简单的用户请求,Facebook Messenger上的机器人总数的70%(超过100,000个)也无法满足。 部分原因是由于开发人员没有选择狭窄的范围来使机器人专注于它并以各种方式增强它。 创建GrowhBot的过程中 ,我们决定将其转移到销售和市场需求上,而不是将其转移到“所有问题”模型上,尽管屈服于兴奋并充分利用潜在机会的诱惑很大。

不要忘记:一个只做一件事情的机器人比一个执行许多任务的机器人有用很多倍。

低可用性




为什么投票?
我会澄清。 我可以帮忙吗?
为什么投票?
我会寻找答案。 还有其他问题吗?
希拉里·克林顿是谁?
我正在寻找信息。 告诉你其他吗?

胜任的开发人员可以在几分钟内创建最原始的聊天机器人-但是,如果我们谈论可以支持对话的机器人,这是另一回事了。 实际上,无论围绕AI进行多少宣传,我们都离遥远地类似于人类思维的事物还差得远。

在理想的现实中,自然语言处理技术应允许机器人理解发送给它的消息。 但是他们仍处于起步阶段,只是离开研究实验室。 某些平台提供某种处理,但即使是最好的样本也仍然以非常初级的形式呈现(例如,您可以回想起Siri,他理解单个词,但不能理解其中的一般含义)。

马特·埃泽(Matt Ezey)概述了另一个相关问题:他们不会引起开发人员投资于他们的工作和创造性思维的愿望:

“虽然人工智能还没有达到人类的水平,但是我们没有机会引起消费者的兴趣。 这些AI技术将吸引用户的兴趣,这些AI技术将使机器人真正适合进行通信。”

会话结构复杂,不是线性的。 话题彼此重叠,突然改变方向,一段时间后突然结束并再次弹出。 基于规则手册的现代对话系统太脆弱,无法应对这种不可预测性,并且使用机器学习的统计方法也有严重的局限性。 现在无法访问模拟与真实人的对话所需的AI级别。

同时,已经有一些高质量创新机器人的例子,这些机器人决定了其余机器人的发展道路。 正如Dave Feldman指出的那样:

“ Slack,Facebook,Google,Microsoft,Kik和其他公司是否应该创建自己的内置机器人以供开发人员关注? 他们是否应该更积极地建立基金会和孵化器,聘请可以将知识转移给进入Bot Way的参与者的导师,以及提供工程和设计资源? 他们是否应该投资Bot战略计划并将研究人员与知名合作伙伴联系在一起?

我的答案是肯定的。 说到平台,开发人员本质上是相同的用户。 而且,我们不允许用户弄清楚自己如何以及为什么使用我们的产品。 他们需要证明这一点。”

图形界面不容忽视


曾几何时,与计算机通信是唯一的方法-在终端中键入加密命令。 使用窗口,图标或鼠标的可视界面已经成为处理信息的真正革命。 由于某种原因,计算机科学已从文本界面切换到计算机界面。 如果我们谈论数据输入,则单击比键入要快。 即使自动完成(通常会失败),按按钮或从列表中选择显然比手动输入文本更可取。 如果我们谈论阅读信息,那么通常一次阅读一次确实比阅读一百次更好。

我们喜欢信息的视觉呈现,因为从原则上讲,我们非常专注于视觉感知。 孩子们如此爱触摸屏绝非偶然。 提出图形界面概念的先驱者受到认知心理学和关于我们的大脑如何建立交流的研究的启发。

根据该想法,对话界面应模仿最接近人的交流类型,但实际上,它们只会增加认知负担。 实际上,我们正在将一些非常简单的事情更改为更复杂的选择。 当然,我们只能用自然语言表达一些想法(“向我展示如何以2000个步骤,但在35分钟之内到达博物馆的所有选择”),但是图形界面中的大多数任务可以更高效地执行,并且比使用对话更直观。

人们喜欢与人交流。


将人的维度添加到业务通信中的愿望是很合逻辑的。 目前, 销售市场营销的坏处在于人们的存在感:品牌隐藏在编号的请求,反馈框和标有“请勿回复此信”的电子邮件,自动发送回复和表格发送消息的电子邮件后面一种方式。”

Facebook的目标是创建能够通过所谓的图灵测试的机器人,即与对话中的人没有区别。 但是,机器人仍然不是一个人,而且永远不会。

交流不仅涉及文字。 人们可以在截止日期之间阅读,从上下文中提取信息以及解密多级消息-例如,阅读讽刺。 僵尸机器人很快就忘记了他们在说什么-最后,似乎您正在尝试与遭受严重短期记忆障碍的人进行对话。

HubSpot团队对此提出了明确的观点

机器人提供了一种与客户进行单独沟通的方式,可以轻松地大规模应用。 但是,它们无法给人们带来那种愉快的,富有成效的体验,而即时通讯工具中与他们的对话在语义结构上很复杂,因此可以与其他人进行对话。”

愚弄人们并不容易,因此任何企图以人为机器人的行为都会对利润产生不良影响(更不用说欺骗用户了)。 即使是那些使用最先进技术构建的机器人,也无法达到这一水平。



周末的天气如何?
你在船上吗? 然后我找不到该位置的信息。
周末在布鲁克林的天气如何?
显然,在纽约布鲁克林,现在是华氏46度。
在周末吗?
不好意思
周末
对不起,打do睡了。 你说什么

还有一件事。 对话界面倾向于模仿人们喜欢在与他人交流时遵循的模式。 但是他们是否想以相同的方式与机器建立交互? 不是事实

最终,没有机智的言论和对人类行为的模仿将使机器人免受通信故障的困扰。

接下来我们要去哪里?


在某些方面,早期的追随者仍然是正确的。 人们真正要求Google Home交付自己喜欢的歌曲,从Domino机器人订购披萨,并在Sephora机器人的指导下学习化妆。 但是,从消费者的反应和开发人员的活动角度来看,聊天机器人并没有达到他们在2015-2016年的巨大期望。 真实的画面还不远。

计算机擅长完成任务:寻找信息,进行计算, 分析观点并以紧凑的形式呈现所有这些数据。 但是计算机不能理解人类的情感。 在目前的处理技术水平下,他们甚至不了解我们想要的东西,更不用说我们的感受了。

因此,如果没有一个会带来同理心和情商的人的参与,仍然无法想象有效的用户支持。 如今,机器人只能帮助我们完成单调,机械,低级的任务,在更大,更复杂的系统中发挥作用。 我们伤害了自己和他们自己,要求太多,没有给时间。

但这还不是故事的结局。 是的,我们的行业极大地高估了机器人最初会产生的影响。 但是,这里的关键词是“最初”。 正如比尔·盖茨曾经说过的:

“我们总是高估了未来两年内将发生的变化的规模,而低估了未来十年内将发生的变化的规模。 不要让冷静吸引你,要保持活跃。”

激动已经过去了,这是对的。 现在,我们可以从热烈的夸张和黑白思维的阶段过渡到适度的方法和对灰色区域的透彻研究。

我相信我们现在正接近快速增长的阶段。 对于带来重大变化的技术,高潮的这种转变是很典型的 。 即时消息将继续得到普及聊天机器人不会去任何地方. , . , .

Source: https://habr.com/ru/post/zh-CN416911/


All Articles