采访“爱丽丝的首席大脑”

RUVDS与Habr一起启动了一个项目,该项目由一系列访谈组成,在我们看来,这是对IT环境中有趣的人的采访。 今天,我们将与Yandex交互系统开发负责人Boris Yangel进行访谈。

为什么爱丽丝(而不是马克斯),前通信部长尼基菲罗夫(Nikifirov)错了,为什么将特斯拉(Tesla)发射到太空。 视频和文字下方的答案。

采访由Lera Negra和Habr编辑Nikolai Zemlyansky进行。



你好 我是Lera Negra,今天我们的客人是Yandex对话系统开发小组负责人Boris Yangel。 当然,我们将从您的工作开始,您现在在Yandex中正在做什么?

-现在在Yandex中,我的主要项目是Alice,这是Yandex于去年10月推出的语音助手,我的小组负责可被随意称为Alice的大脑。 我们用自然语言解释用户所说的内容,并将其转变为某种结构化的表示形式。 这是我们的第一个任务,第二个是当我们已经知道用户需要回答什么时,也将其转换为自然语言的回答。

您已经担任这个职位已有两年了。” 所有这些时间,您一直在从事开发工作。 语音助手的发布时间是否早于竞争对手发布的发布时间?

“当然,还不算太晚。” 如果我们看竞争对手,谁才是真正的竞争对手? 有唯一的语音助手Siri,他也能听懂俄语,但是它只能在iOS和MacOS上运行,它不是俄罗斯最受欢迎的平台,并且对Siri作为产品存在一些疑问。 此外,假设Google已经推出了俄语版Google助手,值得参与吗? 嗯,也许还是值得的,因为您可以尝试在自己的地区与Google竞争以吸引受众,尤其是通过搜索,我们或多或少都取得了成功。 好吧,也许,这里的最后一点很重要:我们现在所看到的是对话系统时代的曙光,实际上,谷歌,苹果,或者也许我们仍然不知道如何使其正常化。 与搜索引擎相比(发生在2000年代初期),这是有条件的Altavists时代,虽然有一些产品,但它们仍然按照某些奇怪的原理工作,并且在任何时候都可以正常工作。来有条件的谷歌,彻底改变行业。 因此,当然,现在仍然值得进行研究。 许多技术挑战和问题尚未解决。 一个新的参与者可能会出现并扭转一切,而实际上我们处于稍有利的位置,因为我们后来才开始,这意味着我们的遗留堆栈更少,也就是说,我们可以立即使用新技术。 例如,上帝知道什么时候做的Siri,有很多旧代码已经很难修改,因此,它们遇到了很多问题。

- 在Yandex学院的演讲中,您说自己赶上了一场炒作。 它是如何成功的,这列火车现在离开了吗?

-首先,有可能要归功于我们产品中做出的非常大胆的决定。 所有竞争对手都有在这些产品中严格阐明的某些场景:“我们可以回答这样的问题,谈论天气或其他事情,以及用户所说的内容是否属于任何情况”在这些情况下,我们将以诸如“对不起,我不理解您”之类的存根进行响应。 我们决定采取不同的行动,并制作了一个神经网络模块,在这种情况下,该模块可以在上一次对话的上下文中以适当的方式进行响应,并且实际上可以与用户就任何主题进行交流。 不一定总是100%合适,但在一半以上的情况下,他当然可以说出当时需要说的一些话。 我们的模块说了很多用户喜欢的内容。 爱丽丝的荒谬答案,我们没有放在那儿,而是她自己产生的,立即分散在社交网络中,这创造了非常宣传的火车。 当然,他留下了一点,这是不可避免的,所有这些笑话都很无聊,但是我们尝试进一步开发产品,并在可能的地方一点一点地进行炒作。

- 您试图使Alice对俄罗斯用户尽可能有趣。 声音是如何选择的,为什么她是爱丽丝?

-老实说,我没有参与选择声音的过程,我不知道它的实施原则是什么,只是它是众所周知的俄罗斯女演员塔蒂亚娜·希托娃(Tatyana Shitova)很酷的声音,众所周知。

我可以谈谈爱丽丝的名字和特点。 我们考虑并写出了一些我们希望有助手的属性。 例如,他不应该自大,帮助一个人,友好,聪明,即具有一些积极和消极的特性。 然后,我们在众包平台上问人们一些问题,例如,这个名称是否与此属性相关联? 我们查看了先前从某些原则中选择的名称与正面属性的相关性大于与负面属性的相关性,根据这个标准,爱丽丝这个名字简单地从入围名单中销毁了所有其他竞争对手。 这可能是由于该名称在俄罗斯文化中具有一些积极的注解,例如爱丽丝梦游仙境,爱丽丝·塞勒兹涅娃等经典例子。 这也适用于名称的语音属性。 由于这是给爱丽丝(Alice)的名字,因此有必要不要让某些人听起来很难发音。 例如,字母“ P”绝对不应该存在,嘶嘶声也不应该存在。 爱丽丝这个名字满足了这些特性。

- 为什么爱丽丝而不是麦克斯,为什么她不是男人?

-实际上,已经进行了很多研究,而女性是一个更安全的选择。 进化让我们非常高兴,一个女人是母亲,一个安全,亲爱的人,而一个男人是一个战士,他们只会带着矛杀死你。 因此,女性助手对于男人和女人来说都是正常的,但是如果助手是男人,那么这种产品的使用量就会减少。

- 几年前,当一个Microsoft聊天机器人的行为完全不正确时,出现了一个不太愉快的故事。 爱丽丝是否有类似的风险,或者甚至发生过类似的情况?

-是的,当爱丽丝(Alice)发行时,我们对这个故事进行了很多思考。 如前所述,我们有一个神经网络模块,可以在任何情况下做出响应,而不仅仅是在场景的框架内做出响应。 实际上,他拥有绝对的自由。 在我们设定的某些限制范围内,他有发言权,在某些情况下,他可以说我们不希望他说的话。 我们的语言非常强大和丰富,有十亿种同意或不同意的方式,我们永远不会把它们全部计算在内。 当被问及有危险的事情时,如何阻止她达成共识已经是一项非常艰巨的研究任务。

- 她经常说:“我不想谈论这件事”吗?

-当我们了解到神经网络模块无法给出答案的情况非常危险时,她说“我不想谈论这一点”。 实际上,如果您允许爱丽丝只说是或不是,那就足以冒犯任何人。 问她就足够了:“您支持X吗?” X是法西斯主义,种族灭绝之类的东西。 如果她说“是”,一切都写完了。

- 毕业后,您立即开始在Yandex中工作,该部门从事按文本请求搜索图像的工作。 在那之后,是否突然决定在剑桥的Microsoft Research工作?

-好吧,那不是自然而然的。 我在Yandex工作,我想进一步发展,做一些更复杂的事情。

- 在Yandex中不起作用吗?

-事实证明,在Yandex中,另一方面,我已经开始在Yandex中领导一个小组,负责图片搜索的质量。 我可能对领导者的工作还没有做好充分的准备,而且我真的不喜欢它,我喜欢它,现在我喜欢编程,工作的机会很少,除非您想每天工作16个小时。 我不太喜欢它,我想以程序员,数据分析专家的身份进行开发,在这里我找到了一个不错的选择,即微软的职位空缺,这与我的背景非常相关。

- 你在那里做什么?

-机器学习中有一个这样的领域,即贝叶斯结论。 这是关于如何在信息不完整的情况下做出绝对理性的决策,从而可以证明在这种情况下无法做出更加理性的决策。 我在一个创建软件库的团队中工作,在这个软件库的帮助下,可以在某些情况下使用这种数学工具的全部功能来进行决策。 实际上,这是一个仅基于一些非常规原则的机器学习库。

- 那里的工作准备好担任领导职务了吗?

-不,当我从剑桥回到Yandex时,我诚实地问我不要带领任何人,说如果可能的话,我会写代码,我真的很喜欢写代码。 同时,我没有参与公司最重要的项目,也没有充分披露我的功能。 首先,我为一些实验性的移动应用程序开发了一个后端,然后,我在一组神经网络中开发了文本分类方法,然后管理层决定:为什么不做一些有用的事情,去做Alice。

- 两年前,媒体积极地讨论了这样一个事实,即至少在我们的国家中,基础IT教育尚未得到充分发展。 你准备好了吗? 是什么帮助了您? 这是Yandex学校吗?还是大学毕业后您感到足够自信?

-我可以编程,因为我刚编程很多。 小时候,我也在大学里坐在电脑旁编程。 在那里,每个人都去某个地方喝酒,而我要么去喝酒,要么参加编程,从第一年开始,我在真实公司工作了几乎一点,就获得了该行业的经验。 这些基本知识足以理解自己直接工作所需的其他内容。 数据分析学院当然对此有所帮助,这是一项很酷的举措,它可以提供大学退出时目前所缺乏的知识。 没错,我在那儿只学习了一年,因为花了很多时间,有很多任务,如此艰巨。 那时我已经在Yandex工作,我只是没有时间。 但总的来说,我建议大家去那里。

- 根据前通讯部长Nikiforov的说法,在我国,已经有太多的程序员和IT领域的专家。 是这样吗 真的有很多非常好的专家吗?

-我不知道Nikiforov先生的想法,但是作为一个需要直接向其团队聘请专家的人,我在招聘方面遇到了很多问题。 我们的任务相当艰巨,需要水平高于平均水平的专家。 市场上几乎没有我需要的专家,所有这些人很可能已经在Yandex中其他一些地方工作了。 我不知道他认为谁是程序员,但是很少有高素质的专家,特别是在神经网络,深入培训领域。

- 在单独的公司和整个行业中,您如何看待工作的重点?

-也许,如果您从全球的角度看待,最好提出一些很酷的东西,一项技术或一个想法,以便那些跟随我进入这个行业的人们可以在这项技术上建立自己的发展。 也就是说,它将像过去一样进入基础,逐步构建所有基础。 我不知道它会是什么,但我想至少留下一点痕迹,而且做起来比较容易,可能如果您成为领导者,因为那时有更多的资源,您可以尝试一些更全球化和雄心勃勃的想法。 但是,如果我伸直双手,我不能说我真的很想领导人们,这真的很辛苦,需要很多时间,道德上的力量,并且不允许我做我想做的事-编程。 因此,我想朝着一个方向发展,使我能够在我可以做的事情和可以影响的事情的规模以及用自己的双手直接做这些事情的能力之间找到最佳的平衡。 对于整个行业来说,这是一个更有趣的问题。 在我看来,语音界面和图形界面都发生了相同的事情,当它们刚开始出现时,当第一个彩色监视器出现时,我们从需要输入命令的控制台切换到了一些可能的按钮上按。 当它们第一次出现时,没有人知道如何正常制作它们,没有范式,架构模式,框架,每个人都在按自己的意愿做,并且接口弯曲,可怜,制作起来非常困难,无法阅读代码,但是人们我们经过深思熟虑,在如何制作这些界面时出现了一些精美的概念,出现了便捷的工具,现在该领域的专业人员可以很快制作出一个界面非常复杂的网站。 我们正在考虑如何使用语音界面执行相同操作。 应该使用什么样的工具,以便可以方便地完成它们,并且效果很好。 即使我们突然没有得到好的产品,也许我们也可以通过朝着这个方向发明一些东西来使整个行业受益。

- 什么可以取代爱丽丝?

-我不知道会是什么。 哪个界面甚至比语音更方便。。。大概可以控制思想的力量。

如果爱丽丝死了,你会难过吗?”

-我会失业,是的,我会很难过。

- 大型公司,大型项目,您认为最先离开的人是谁?

“好吧,我可能不会给出任何名字,那是错误的。” 我不能说某人是这次飞行的候选人,因为他的产品不好。 在我预计失败的地方,这是业务发展需要任何补贴的地方。 例如,出租车市场或某种有条件的送餐服务-Food Fox,Deliveru Club。 一方面,这些是IT项目,另一方面,它们与现实世界互动。 要去那里,您现在需要大量补贴,倾倒竞争对手以取得非常具有竞争力的价格,将所有人挤出市场,然后提高价格。 这导致了一个事实,许多人仅仅是因为他们快没钱了而来那里烧钱。 他们没有时间将任何人赶出市场,在某些Uber市场中,像Yandex出租车这样的鞭打人压垮了所有人。

- 加密货币。 你投资,不投资,什么,为什么。

-我不是最成功的加密货币投资者,我是那些决定在最不合时宜的时候投资一点的人之一,现在,他们坐下来,希望毕竟,比特币会长回来。 不喜欢我。

- 竞争对手是否试图吸引您?

-是的,我通常会回答,现在我不在寻找任何其他工作。

- 如果不是IT部门,那又如何?

-我不知道,我喜欢跳伞,也许那时我会成为跳伞的教练。

- 为什么将特斯拉发射到太空?

-因为很酷。

- 非常感谢,鲍里斯。 我们今天的来宾Habr编辑Nikolay Zemlyansky将再问您几个问题。

- 你好,鲍里斯。 我想回想一下最近发行的电影《银翼杀手2049》,其中特工K有一个Android助手。 我不记得她的名字,让玛莎成为。 当他们交谈时,他不喜欢某事时,他会说:“马莎,bit子减3”或“马莎性爱加5”。 以此为基础,调整了与助手的通信。 您认为在可预见的将来是真实的,有什么意义吗?

-我已经谈了一些关于我们如何处理爱丽丝侮辱性回答的问题。 这确实是一个大故事,这就是原因。 为了使Alice不会冒犯对话者,我们实际上教了一些模型来预测这个或那个答案是否令人反感,如果可以,则预测到什么程度。 现在,我们根据一个非常简单的原则使用这些模型:如果模型说答案令人反感,我们就不给她答案。 用您所说的话,我们将侮辱加为零。 实际上,我们已经有了一个模型来评估这种侮辱的等级,如果需要增加产品,我们可以制作一个滑块,使答案或多或少地大胆。 我们用于此目的的方法可以应用于系统行为的其他特征。 当然,这将需要针对每个特定特征的一些特定工作,但是要使这样的助手(其特征可以使用滑块进行调整)将在20年后无法实现,但在我看来是很快。

, , , , , «». , . . , , ?

— , , , . . . , , . , . - , , . , , , . , , , . , : , - , , . , - , .

, « » -, , , , - — - , — , . « », . .

, . , , , - ?

— , , , , , - , - , — , , . , , . , , , , . , , - , - . — , , , .

, .

— , , , , .

, , , , .

— , -.

. ? , , , . , ?

— . Google, , Google- , . , , , . , , .

, , ?

— . . , , , . Google, , . , .

, Siri. ?

— , -, , . , , , , , , . . , , - , . , , , . . , , , . , - . , — , -, . , , .

, , , , ?

— , , . , , . , - — , . - , . — , , , . , Google .

, .

— .

Source: https://habr.com/ru/post/zh-CN412535/


All Articles