
从5月29日至6月1日,第25届计算机语言学和智能技术国际科学会议“
对话 ”将在俄罗斯国立人道主义大学(RSUH)举行。 关于“对话”是什么以及ABBYY是其主要组织者的原因,我们已经
在Habré上发表了讲话 。 在这篇文章中,我们将讨论会议的主要主题,主要发言人,他们的报告以及四个在“
对话评估 ”框架内创建自动文本分析系统的竞赛。
今年,对话将有几个关键主题:
- 神经网络在语言分析中的应用 。 众所周知,深度学习是将原始数据转换为结果(所谓的端到端),在这种结果中,很难以有意义的语言概念来解释其接收的“逻辑”。 但是,为什么不使用神经网络来获得语言本身的知识呢?
- 在深度学习中使用更复杂的语言模型 。 对话的另一个重要趋势是:分布模型( 嵌入 )显然正在从“ 中医院 ”获取方法演变为使用上下文,句法和语义信息。
- 大数据分析方法在数据少的任务中的应用 。 2019年被宣布为国际土著语言年 ,因此,其中一场对话会议的参与者将讨论使用机器学习来描述和保留“低资源”语言(例如Evenki或Selkup)的方法。
- 多渠道军团 :如今,有一种趋势是要全面研究一种言语行为,包括言语部分,语调,面部表情,手势。 在培训机器人,智能助手和聊天机器人时,此类研究尤其重要。
传统上,
国际著名的计算机语言学专家应邀参加对话。 今年的会议有:
汉堡大学的
克里斯·比曼 (
Chris Beeman) 。 计算机语义学领域的领先分析师之一。 他将讨论考虑到个人经验的自适应机器学习技术。 5月31日(星期五),下午3点-下午4点
来自阿姆斯特丹自由大学的
Peak Vossen ,全球WordNet协会的创始人兼主席。 他主要感兴趣的领域是人与计算机的语言交互。 沃森峰(Peak Vossen)将作题为“研究人与世界的交流机器人”的演讲。 他将讨论一种机器人模型,该机器人通过自然语言交流学习有关世界及其对话者的信息。 机器人学习人们告诉他的所有内容,在不同情况下观察到的内容以及在Internet上找到的所有内容。 5月30日(星期四),下午3点-下午4点
总共,“对话”将呈现102条主要曲目的报告和大约20条学生的报告。
会议的第一天,5月29日,以下
发言人将作专题演讲 :
俄罗斯科学院语言研究所所长
Andrey Kibrik 。 他将介绍由他的研究小组创建的用于修复交流中语音和手势元素的新语料库方法。 5月29日(星期三)10:30-11:50。
马德里科技大学教授
Igor Boguslavsky和他的同事将讨论如何训练计算机以正确分析所谓的 “ Vinograd方案”是一种新的方法,比传统的Turing测试更为复杂,这是一种评估人工智能系统理解该语言的能力的方法。 5月29日,12:20-13:30。
HSE语言学院教授
Valentina Apresyan 。 她的报告着重于
含义 :没有明确表述,而是从文本中得出的含义和假设。 对含意,特别是虚假含意的研究,例如,可以确定媒体上的不公平出版物。 5月29日,12:20-13:30。
其他日子会有很多有趣的事情。 按照传统,对话非常重视语言的新表达能力。 例如,哈佛大学的
玛丽亚·波林斯卡娅 (
Maria Polinskaya)和OJ学院的
伊琳娜 ·莱文蒂娜 (
Irina Levontina)将分析其语音中流行的情感表达,例如“他们必须使用不定式”(顺便说一下,这就是报告的名称。您可以在5月30日10:00-13:30收听此报告)。 ) 普希金学院(Pushkin Institute)的
安东尼娜·拉波希娜 (
Antonina Laposhina)在她的报告“您认为这很冷吗?” 从现代语料库语言学家的角度(5月29日,15:00-18:30)分析了小学俄语课本的词汇构成。
当然,许多工作致力于将神经网络应用到语言分析问题中。 例如,在5月31日,该对话的一个特殊部分专门研究了重要的研究领域,例如深度学习中的语言模型,迁移学习等。
- 5月30日19:00,将举行圆桌会议,讨论模拟人与计算机交互中的言语行为的前景。 这个方向正在迅速发展,分析多峰语言学要跟上现代分析大量视听信息阵列的现代方法所允许的步伐,并非易事。
- 5月31日19:00,我们邀请您参加圆桌会议“ Brave New DL Word:NLP的位置在哪里? ”。 小组成员将讨论“具有启发性”的论点,即当今的NLP已“溶解”在深度机器学习技术中,并且正在失去独立科学学科的地位。 当然,许多研究人员不会同意这一说法,我们希望对手能令人兴奋。
对话的关键事件之一是总结文本语言分析系统的开发商之间的技术竞争
对话评估 。 今年的比赛有四个任务:
- 自动生成新闻头条;
- 自动分析低资源语言(当机器学习的数据很少时);
- 回指的自动解决和参考链的确定(文本中对同一对象的各种参考),
- 通过上下文自动恢复单词(某些省略号)。
为了进行此类比赛,通常需要创建专门准备的数据(数据集)以训练经过测试的算法。 这不是
ABBYY技术首次参与创建此类数据集,这是
自然语言文本分析竞赛的一部分。 由于计算机要进行大量的预处理,因此可以使机箱更大。 我们将在哈布雷(Habré)上更详细地介绍这一点。 对话评估的结果将汇总在“对话”中:
- 5月30日10:00-13:30,基于椭圆省略号映射的自动处理系统测试结果的特别会议。
- 5月31日,10:00-13:30,基于测试照应分析系统的结果的特别会议和基于新闻标题生成系统的测试的结果特别会议
- 6月1日,00:00-13:30,基于描述低资源语言的测试系统的特别会议。
会议的工作语言为俄语和英语。
此处提供
了详细的会议计划。
会议论文集将发表在《
计算机语言学与智能技术 》年鉴中,该年鉴是国际引文系统
Scopus的一部分 。
您可以
在此处注册,注册运行至5月28日。
参与条款 。
Elizaveta Titarenko,企业博客ABBYY的编辑
在ABBYY语言研究总监Vladimir Selegey的参与下