Google翻译已连接到神经网络


GNMT(Google的神经机器翻译)架构模型。左边是编码器网络,右边是解码器,中间是注意模块。编码器的底层是两面的:粉红色的模块从左到右收集信息,绿色的模块从相反的方向收集信息

。Google 将会完全将 Google Translate服务转移深度学习在arXiv.org 发布了神经网络算法的详细说明

根据Google的初步估计,与传统的统计方法相比,神经网络提供了更好的翻译质量。它已经在最困难的英汉语言对中进行了测试,并且神经网络立即将翻译错误的数量减少了60%。结果令人印象深刻。其他语言对将在未来几个月内连接到神经网络。


编码器底层的双向通信结构

机器翻译领域的成功是AI的另一项成就,近来已经积累了很多。训练有素的神经网络技术显然正在兴起,并已用于各个领域。在图像识别和游戏中,已经取得了优于其他计算机技术的明显优势。在某些地区,神经网络比人脑更有效地工作,例如,它们在单独的棋盘游戏中击败了一个人。

Google用于机器翻译的神经网络称为神经机器翻译系统(NMTS)。从一开始到最后,文本的翻译现在完全满足了神经网络的要求。传统上,人工智能在Google Translate中以受限模式使用,用于某些辅助任务。例如,比较几种官方语言提供的文本,例如联合国正式文件或欧洲议会。在这种模式下,比较了文本中每个单词的翻译。

NMTS神经网络在根本上处于新的水平。她不仅分析了学习过程中现有的翻译选项,还对句子进行了智力分析,将其划分为“词典部分”。在网络中的某种表示形式中,这些“字典段”对应于单词含义


Google动画显示了如何将一个中文句子分成多个部分,然后神经网络会考虑原始文本中每个片段的权重来选择合适的翻译,从

某种意义上讲,这种方法类似于机器视觉中神经网络的工作。系统逐像素处理图像。然后处理水平逐渐提高,达到诸如对象边界,几何图案等复杂特征。在NMTS中,使用相同的神经网络分析源文本,然后提供其翻译。

在这种情况下,谷歌的开发人员已经使用在该领域已有的研究,以及一些“方法创新,” 评论在arXiv.org上发表的独立学术著作。他们认为,Google的发展显示出“惊人”的结果,并清楚地表明,使用AI进行神经翻译的质量可以远远超过传统机器翻译方法的质量。 Google的神经网络可以从许多方面明显改善翻译质量。

为了优化,NMTS在专门设计用于测试神经网络的计算机设备上进行了测试。当时在那里训练了AlphaGo神经网络,此后击败了世界上最好的围棋手之一Lee Sedol

为了评估该系统的有效性,研究人员从Wikipedia和Internet上的新闻文章中选择了大量优惠。这些文字将NMTS输入到旧的Google Translate机器翻译系统中,并且还提供给人工翻译人员。在盲测的框架中,人工翻译人员评估了每个片段的翻译质量(包括人工翻译)。

使用常规机器翻译系统(蓝色),神经网络(绿色)和人(橙色)的中文,西班牙文,法文和英文文本翻译示例

英语对中国语言对以其高度复杂性而闻名。尽管错误数量大大减少,但该语言对的翻译质量仍然不及其他印欧语言的翻译质量。在某些语言对中,NMTS的翻译质量与人们的翻译相近,但是科学著作的作者警告说,得出深远的结论为时过早,因为比较是基于有限的一组精心挑选的简单句子进行的。



相同的结果使外观更直观。



根据专家的说法,只有将输入信息的其他通道连接到机器翻译系统后,计算机才能在翻译质量上接近或绕过一个人。不仅是文字,还有视频和声音。“将来,机器人将能够移动,操纵物体,通过疼痛传感器感觉疼痛-并在文本中表达他们的感受,” 卢加诺大学(瑞士)的JürgenSchmidhuber

Google翻译系统目前可处理大约10,000种语言对以进行机器翻译。

Source: https://habr.com/ru/post/zh-CN397959/


All Articles