自然语言处理的趋势和预测

NLP(自然语言处理)领域的趋势和预测


本文是有关我们9月年鉴“人工智能”第2期的趋势和预测的内容,该文章专门介绍了俄罗斯自然语言处理和语音识别合成领域的技术和公司市场。

在这项研究中,我们对行业进行了专家调查,尤其是询问了有关技术发展以及AI在各个领域的使用情况的预测。 答案虽然不多,但是可以形成一个总体趋势。 在本文中,我们总结了这些答案并显示了主要趋势。

总体技术趋势


端到端NLP问题解决


越来越多的解决方案将基于端到端方法,例如,神经网络模型在输入时接收声音信号(声波),在输出时产生声音信号,而没有中间文本阶段。 这将显着加快模型的执行速度和模型的质量,同时恶化“透明度”和我们对“内部要素”的理解。

接近人类的语音识别和生成质量


在未来几年中,语音识别的质量将得到显着改善。 识别错误的数量将接近人类的水平。 在嘈杂的环境中,以不同口音讲话的几个人的混合语音识别将得到改善。 将添加对声音场景的分析,识别出说话者的性别和年龄,说话者的情绪色彩和环境性质。

合成语音将与人类语音没有区别,并且有可能合成任何人的语音。

多种语言


在不久的将来,将出现多语言翻译模型,这包括由于使用了迁移学习,以及由于使用了平行案例之外还使用了更大的单体。 结果,低资源语言的翻译质量将大大提高(使用相对较少的训练样本数组)。

由于对文档上下文和主题有更深入的机器理解,因此手动翻译将完全被机器翻译所取代。 随着语音识别和语音合成技术的发展,机器同声传译将出现5-10年。

了解文本的含义


基于理解上下文特定含义的其他应用程序将在5到10年内出现在同一领域:各种对话和帮助服务,可以理解对话的上下文,智能地回答用户问题并引导对话朝正确的方向发展。 对语言的更深入的机器理解将把Internet和社交网络上文本流的自动处理提高到一个新的水平:事实的收集和汇编,对其一致性和可靠性的分析。

文字产生


端到端神经网络将普遍取代传统的NLG管道。 使用GPT2级别的模型已经可以在具有受控内容的给定区域中针对任意主题创建相当长的文章。 在5年的时间范围内,神经网络模型将能够生成不比人类差的文本。 然后,自动内容将泛滥世界。

平台和跨平台


许多解决方案将成为标准,将有许多基于语音接口构建应用程序的平台。 云平台将在响应时间,工作负载和安全性方面有所改善。 预计投资增长将不会在单独的交互式服务(聊天机器人)中实现,而是会在多功能平台和跨平台解决方案中实现,因此语音助手将能够在不同设备上均等地工作。 结果,我们将能够与“智能家居”中的助手开始对话,在汽车行驶的道路上继续对话,然后在工作场所使用我们的计算机工作,而不会丢失交流环境。

小数据技术


在少量原始数据的情况下有效工作的机器学习方法的价值将不断增长:转移学习,知识转移。 在这样的应用中,还期望将GAN(生成对抗网络)更广泛地用于生成用于模型训练的数据。

计算需求更少的架构


随着神经网络模型从实验室的壁垒向商业数据中心的转变,对其能源效率的要求将会增加。 期待新的,更高效的计算架构。 例如,稀疏网络结合了分布式计算和符号计算的最佳质量,其复杂性模型可适应训练数据的数量。

市场趋势


语音接口的普遍实现


语音转文本技术的发展将是简化办公任务的第一步(例如,计划经理的时间,搜索文档,处理机密信息)。 随着识别准确性,理解深度和语音合成质量的提高,语音接口将被集成到几乎所有设备中:智能家居,汽车,家用电器,化身机器人,助手机器人中的对话系统。

语音机器人的爆炸式增长


我们正在等待各种业务领域中智能助手的爆炸式增长,包括银行,零售商,电信和其他与客户互动的公司的商业服务。 机器人将与大众进行最受欢迎的服务中的所有口头交流。 机器人将学会敏感地识别情绪,包括使用情绪的多模态评估,并将自己在对话中使用情绪成分。

自然语言信息搜索


能够以自然语言进行查询的智能搜索需求不断增长。 越来越多的组织希望在所有内部来源中快速找到非结构化数据,自动确定其内容并在专门的法律或财务文本中突出显示重要事实。 由于开发了从文本中提取事实并对其内容进行抽象的深层模型,信息检索的质量将大大提高。

在家里


大型公司(银行,电信,工业)很可能会发展和增加自己在AI领域的专业知识,包括与自己的语言学家,数据科学家,NLP工程师等进行对话。 在不久的将来将个别任务外包的例子仍然很少。 我们看到许多大公司的AI团队都在快速增长。 好与坏是另一篇文章的主题,但这是一个明显的趋势。

行业趋势


金融保险


在短期内,银行将专注于最大程度地提高银行通常使用AI尤其是NLP已积累的数据的收益。 从长远来看,存在着统一和简化银行业务流程的稳定趋势,可以在没有参与或参与最少的情况下进行(开设帐户,风险评估,创建信用档案,评分等)。 NLP将与其他技术(计算机视觉,RPA,远程识别等)相结合。

工业和物流


借助NLP技术,可以期待新一代项目文档设计人员,以及可以评估描述复杂技术对象的文档一致性的系统的出现。 此外,可以基于对使用NLP的项目文档和标准的分析来预测自动化控制计划系统的出现。

随着用于理解文本含义的系统的出现,在5至10年的时间范围内,有望最终解决术语标准化的问题。


语音接口的广泛引入将使医生从文本输入中解放出来,并自动创建带有标记的病历。 大量标记文本的出现将使基于NLP技术的新类SPPVR(医疗决策支持系统)的出现成为可能。

IT和电信


语音生物识别技术的广泛使用(通过语音进行身份验证和授权)有望提供基于个性化数据的服务。 电信运营商将有机会在数字服务生态系统中占据独特的位置,并与客户进行语音交流。 另一方面,语音信使依靠相同的基本技术进行语音识别和合成。 我们正在等待一个有趣的时刻,即电信业巨头与客户通过语音通道通过即时通讯程序进行战斗。

法律实务


在3-5年的时间范围内,我们可以预期技术将被广泛采用,这些技术可用于合同的自动验证,更广泛地讲,可用于合同工作的自动化,包括对义务履行的验证等。

在未来的5-10年中,我们可以期待法律文本理解模型的出现。 基于这些内容,我们期望出现以自然语言提出用户问题的系统,该问题的答案是对现有法规文件的简要概述,包括不一致之处和各种版本。

用于律师的计算机将不再是参考,而将成为功能强大的决策支持工具。 律师计算机的主要任务之一将是根据现有的惯例,通过构建概率决策树来预测诉讼的结果。 大部分工作可能会在云中经过大规模训练的模型上进行。

解决法律层面特定问题的定点服务,产品和公司的大量涌现。

我们可以期待RPA解决方案与NLP技术的更深入集成,这将导致将日常任务转移到处理信息并将数据输入到软件机器人。
最后,在对具有法律约束力的文档(例如合同或NDA)进行分析的基础上自动生成的区块链智能合约的前景绝对令人着迷。 这种技术的结合可以使自我执行的法律文件栩栩如生,到目前为止,它本身听起来像是科幻小说,但距离实现并不远。

媒体与广告


我们正在等待基于对人的数字足迹的在线分析的个性化营销的广泛引入。 它将包括对人类文本及其调性的深入分析:对文本的负面,正面评价通常不是针对而是与特定产品或品牌有关。

每个人都将有一个私人购物助手,他们将负责日常购物的90%。

根据特定公司的历史,内部和外部事件,将提供用于自动生成新闻的服务。

科学与教育


在未来的5-10年中,我们可以预期会出现用于理解科学文献的模型。 我们期望出现以自然语言回答用户问题的系统,这是有关该问题的现有科学文献的简短摘要,包括发现的矛盾和各种版本。 这种模型的另一个应用是用于研究或专利态势分析的推荐系统。

这样的系统将通过对科学和专利信息来源的分析来分析和确定给定领域的专家和专家群体,从而从根本上改变技术格局并加速技术转让。

同样在5到10年的时间里,我们期望针对各个学科以及一般而言针对教育机构的成熟的教师助手的出现。 另一方面,学生的私人助理将出现,他们将带领该人终生进行个人教育。 这些智能代理的交互也可能是自然语言。

国家与安全


各国越来越多地将其活动转移到媒体空间和社交网络中。 近年来出现的“信息战争”概念已经采取了完全具体的形式,并需要新型的“武器”和“保护”。 已经观察到一种强大的趋势,对假新闻检测的需求只会增长。 不幸的是,人们还可以自信地预测自动生成各种假新闻的需求的增长。 人工智能的使用将发展为在社交网络中创建机器人并对其进行识别。

智力同样重要。 人工智能将越来越多地用于分析各种形式的有关公司,人员和交易的大量信息,以解决应用问题,例如查找公司与个人之间的从属关系和隐式关系。

随着人数的增加,与公民自动通信以向其提供某些服务的任务对于国家来说变得越来越紧迫。 人工智能(可能以智能代理的形式)将被积极地用于个性化和个性化为每个公民提供的州和市政服务-所谓的“认知城市”和“状态即服务”。

可以在此处下载有关NLP和语音识别/合成的完整年鉴“人工智能”。

Source: https://habr.com/ru/post/zh-CN469463/


All Articles