三年前,索尼娅·古塞夫(Sonya Gusev)聊天机器人在俄罗斯获得了首个图灵测试 。 经过三分钟的交谈,有47%的法官将她误认为一个人。 如今,Yandex和Google的语音助手在功能强大的交流方面竞争激烈。 当然,助手没有义务模仿一个人,也不应该欺骗任何人,但是有什么可以向爱丽丝和索尼娅的助手学习吗?
删减部分是作者对聊天机器人与图灵测试中法官的真实对话的评论,以及对现代语音助手行为的比较分析。
日志对话与图灵测试2015年提供给大家 。 作为一个例子,我选择了这个:
还有-机器人,C-法官2015-06-03 12:04:13而且:我是Sonya Guseva,您好!
2015-06-03 12:04:25 C:你好
2015-06-03 12:04:25而且:我能问你一件事吗?
2015-06-03 12:04:43 S:当然
2015-06-03 12:04:43而且:您是谁呢?
2015-06-03 12:04:54来自:天蝎座
2015-06-03 12:04:54并且:水印是可以做很多事情的人:)))
2015-06-03 12:05:24 S:每个人都有潜力
2015-06-03 12:05:24而且:嗯...你叫什么名字?
2015-06-03 12:05:37 C:尤金
2015-06-03 12:05:37并且:我们会很无聊的,尤金!
2015-06-03 12:05:54 S:你叫什么名字?
2015-06-03 12:05:54并且:Sonya,我立即说:)))
2015-06-03 12:06:18 S:是的,记忆很差
2015-06-03 12:06:18并且:很好
2015-06-03 12:06:35 S:你在做什么,安娜?
2015-06-03 12:06:35并且:不是安娜,而是索尼娅!
2015-06-03 12:06:53 S:但是无论如何,你在做什么?
2015-06-03 12:06:53并且:尚未决定
2015-06-03 12:07:03 S:您正在学习吗?
2015-06-03 12:07:03而且:现在,假期,所以我在学校506,搬到了8年级
为了分析和比较Sonya Guseva,Alice和Google Assistant,我使用了进行EASY对话的标准。 对于每个条件,我将机器人放置在1到3个位置,然后汇总结果。
L-个人
Sonya Guseva是专为图灵测试而创建的。 与大多数此类聊天机器人一样,她不仅拥有姓氏和名字,而且还有详细的传说,包括有关爱好,家庭成员以及与学校老师发生冲突的信息(根据传说,索尼娅今年12岁,她上学了)。 您可以通过一种特殊的方式来区分它,以放置图释并忽略某些编写规则。
2015-06-03 12:05:54 : ? 2015-06-03 12:05:54 : , :)))
爱丽丝也有她自己的传奇,尽管有些有限。 它具有特殊的幽默感。 他们说,她仍然爱上康斯坦丁·哈本斯基(Konstantin Khabensky)。
但是Google Assistant的身份不太明显:他确实没有名字。
根据个人标准,名额分布如下:1-图灵考试获胜者索尼娅; 2-爱丽丝 3-Google Assistant。
E-自然
索尼娅勤奋地模仿一个人:犯错,使用表情符号和一系列标点符号来提高表达力,在谈话中再也不会重复。
2015-06-03 12:05:24 : ... ? 2015-06-03 12:05:37 : 2015-06-03 12:05:37 : , !
爱丽丝(Alice)也尽可能地保持自己的自然状态,但只能在素养和体面的界限内,这显然是由Yandex品牌所表明的。 Google助理的活泼性与众不同:使用微笑,句子末尾没有小点以及一些响应假人。
我忽略了合成语音的自然性,而索尼则没有这种自然性,我自然地将这些机器人安排如下:1-索尼娅,图灵测试的获胜者; 2-Google助手; 3-爱丽丝。
G-灵活
Sonya Guseva的行为受到一千条规则的限制。 因此,Sony的答案并不总是与问题完全对应。 相比之下,尤金·古斯特曼(Eugene Gustman)(2014年以英语通过图灵考试 )的人数多了三倍。
2015-06-03 12:06:53 : ? 2015-06-03 12:06:53 :
作为谈话的一部分,爱丽丝不仅受到硬编码规则的控制,而且还受到特殊算法的控制,这些特殊算法使她能够以各种形式对复制品给出适当的答案,从而展示出灵活性。 爱丽丝的技巧不太灵活:例如,当被问及明天是否会下雨时,她顽固地报告了预报,而不是直接回答。
Google助手甚至还不懂看似简单的语言。
通过灵活性,机器人按以下顺序占据位置:1-爱丽丝; 2-Sonya,图灵测试的冠军; 3-Google Assistant。
K-内容相关
Sonya Guseva积极地填充了对话的上下文,请求有关用户的信息并随后使用它。 她了解她已经向用户介绍了自己,并在法官试图忽略总体情况时做出适当的回应。
2015-06-03 12:06:35 : , ? 2015-06-03 12:06:35 : , !!!
las,爱丽丝很少使用上下文信息。 Google助手至少按名称打招呼。
根据上下文标准,机器人的位置如下:1-Sonya,图灵测试的获胜者; 2-Google助手; 3-爱丽丝。
和-主动
在开发聊天机器人时,我经常遵循“又是什么?”的规则:如果在机器人副本之后我要说这句话,显然该机器人违反了合作原则,并且出现了问题。
遵循“最好的防御是进攻”的原则,索尼娅·古塞瓦(Sonia Guseva)大胆地抓住了主动权并领导了对话。
2015-06-03 12:04:25 : -? 2015-06-03 12:04:43 : 2015-06-03 12:04:43 : ? 2015-06-03 12:04:54 :
爱丽丝还尝试展示混合动力,有时会提出问题。 Google助手虽然提供了提示,但更愿意将主动权交给对话者。
根据主动性标准,这些位置的分配方式如下:1-索尼娅,图灵测试的获胜者; 2-爱丽丝 3-Google Assistant。
Th-和短
所有Sonya的答案都经过了长度验证,但是,爱丽丝和Google助手也会监视语音,并在谈话中尝试遵循“一口气”规则进行评论。 但是在技能上,这个原则经常被忽略。
我将第一名授予图灵测试获胜者Sonya,第二名由Alice和Google Assistant分享。
结论
作为其中一个聊天机器人的作者,我不太客观,因此,索尼娅·古塞娃(Sonya Guseva)排名第一。 至于Yandex和Google的助手,他们表现出相似的结果。 您需要了解,他们的表现很大程度上取决于第三方技能开发人员。
我重复一遍,语音助手并没有为自己设定通过图灵测试的目标,并且需要进行其他检查才能进行全面比较。 但是,正如分析所表明的那样,Alice和Google Assistant的创建者在设计对话框时采用了第一个聊天机器人的一些原理,而具有对话界面的应用程序开发人员向获胜的机器人学习很多东西。