
在这里,我们最近低声说,五年之内根本不需要翻译和语言老师。 事实是,人工智能的神经系统正在非常积极地发展。
就像,他们将定性且快速地翻译文本和语音,以至于对生活专家的需求将完全消失。
当然,我们笑了,但考虑了一下。 他们决定更深入地研究该主题,并找出人工智能的意义以及它是否真的会让我们不用工作。
什么是人工神经网络
简而言之,创建了一个人工神经网络,试图使用数学算法来模拟人脑的功能。
神经网络的主要特征是学习能力。 从数学家的角度来看,此过程看起来像一个非线性优化问题,它使用判别分析和聚类方法。
如果是人文学科,则人工神经网络能够使用复杂的算法分析数据,并使用定义明确的数学系统和模糊语言系统进行操作。
我们将分析两个示例。
定义明确的数学系统是国际象棋 。 游戏中有许多明确的规则是绝对可以实现的。 有一个特定的目标-杀死对手。
并且有很多可能的举动,其中您需要选择那些将导致胜利的举动。
分析国际象棋游戏的困难在于,独特的国际象棋游戏数量接近10 ^ 120。 是的,是10到120度。 相比之下,可观察宇宙中的原子数约为10 ^ 79。
分析所有位置在物理上是不现实的。 因此,系统被迫选择可以立即获利或战略性地巩固该职位的举动和技术。
使用神经网络的第二个示例是从一种语言到另一种语言的翻译 。 这是一个完全不同的数据处理系统,因为在翻译时需要考虑数百种规则和数千种语言的细微差别。
另外,系统需要理解上下文以便翻译不可翻译的单词或双关语。 否则,您如何才能找到动词“ set”只有正确的44个识别值的句子的正确翻译?
或者,甚至更艰巨的任务是传达微妙的英语幽默,以使俄罗斯人可以嘲笑它。 甚至更难的是翻译诗歌。 或者...好吧,您明白了。
现在简要介绍一下神经网络的工作原理。
系统首先将数据分解为基本成分。 然后,算法中的一个或多个隐藏层会分析数据并进行转换。

在深度神经网络中,有几层算法可以处理分析。 通常,它们本质上是级联的,其中将来自较低层的信息传输到上方层次结构中的层,并在不同级别处理信息。

此外,如果算法在数据中找到明确的依存关系,则将基于它们创建新算法。
例如,在国际象棋中,一台机器很快就“发明”了战术,以快速开发棋子并占领中心区域。
所有这些都是因为这样的演习几乎总是在开场中占据优势。
请注意,在游戏规则中这还不是很接近,但是大多数玩过的游戏都证实了这一假设,因此机器开始自行使用它。
***
单词含义的翻译也是如此,这在不同的语言中可能是非常不同的。
例如,拿弓这个词。 他有两种基本但截然不同的含义变体:一种蔬菜(“洋葱”)和一种小型武器(“弓”)。 s语还有另外三分之一-“洋葱”是指衣服或时髦形象的组合(英语“ look”中的描图纸)。 它很少使用,但是神经网络也应该“知道”它。
为了找出要使用的翻译选项,神经系统为每个值分配了自己的参数,该参数还取决于句子附近使用的单词。
因此,在“亲爱的,买一公斤洋葱和土豆”一句中,系统会将“洋葱”翻译为“洋葱”。 都是因为附近有一个“公斤”(不带小武器)和一个“马铃薯”(potato),它也指“蔬菜”参数。

同样,句子“射手拉弓向敌人开箭”。 您只能“拉”一把弓作为武器。 再加上“射击”一词。 因此,我们得到了翻译-“弓”。

有趣 在这种情况下,单词“箭头”在确定单词“弓”的含义时不会被认为是重要的。 所有这些都是因为“箭头”还可以表示洋葱的绿色茎杆,可以作为一种蔬菜。 因此,迟早会向系统中添加一个例外,该例外在鞠躬的情况下不会考虑单词“箭头”。
随着系统的学习,算法和参数的数量也在增加。 其中一些正在改进并且变得越来越复杂,其中一些已被更紧凑的选项所取代。
根据其结论,结果就是当机器靠近人时的现象。 尽管存在这样的事实,即仍然使用了一套算法系统,甚至是复杂的多级算法。
让控制论者和数学家不要发誓。 如果有的话,那么我们在这个词的意义上就是人道主义者,并且我们为自己写了一篇类似人形生物的文章。
关于零零和国际象棋的几句话

2017年,谷歌的子公司DeepMind发布了神经网络的更新程序。 开发人员决定按照明确规定的规则在最受欢迎的战略游戏上测试该程序:国际象棋,围棋和将棋。
学习象棋程序的过程仅花费了24个小时。 仅游戏规则已输入系统-仅此而已。 没有首次亮相的图书馆或聚会数据库。 只有规则。 并在24小时内自动播放该程序。
在第一局中,绝对是随机动作。 的确,在任何地方都看不到它-信息摘自开发人员的话。 结果,一方输了,系统认为另一方的行动更有利于获胜。
经过24小时和4400万场比赛,AlphaZero成为了游戏历史上最强大的棋手。 Elo的AlphaZero评分约为3500点,尽管根据各种消息来源,它的评分为5,000。
相比之下,业余爱好者的平均评分为1200 Elo,国际象棋运动大师的评分为2200-2400 Elo。 埃洛人获得的最高评价是卫冕世界冠军马格努斯·卡尔森。 在2014年4月21日,它的价值达到2889.2点Elo。

零号Alpha Zero的作用要强大约600点(在最乐观的版本中)。 就像体育大师和二流球员一起比赛。 而这里的二流球员只是最强的人类球员。
对于国际象棋鉴赏家。 这是
对俄罗斯大师Sergey Shipov
对Alpha Zero进行的
一些游戏分析。 老实说,我们印象深刻。
Alpha Zero和Stockfish:有什么区别
Stockfish是最强大的计算机国际象棋程序,直到Alpha Zero对其羞辱为止。
值得注意的是,Stockfish每秒分析7000万个职位,而Alpha Zero仅分析40,000个职位,根据蒙特卡洛方法,它认为这很有希望。
也就是说,神经网络不评估每个单独的动作,而是评估动作平局结果的总和,从而切断导致失去位置的平局。
结果,Alpha Zero在分析上花费的资源减少了99.99%。
结果,在100场比赛中,零号阿尔法零赢了28和72,并没有输掉任何一场。
至于国际象棋,神经人工智能已经超越了人类及其较老的机器。
但这实际上适用于具有少量特定初始规则集的封闭系统。
现在让我们处理语言系统。
神经人工智能与翻译

我们非常了解Google在翻译领域的创意-Google Translate。
因此,带有翻译功能的Google Translate与带有国际象棋的Alpha Zero有点不同。 在国际象棋中,系统分析导致最有利可图的结果的单个动作集。 对于传输,使用双向网络。 一个流将原始句子分为语义元素,第二个流以另一种语言以正确的顺序重现它们。
这样的事情发生了。 该提案分为多个部分。 此外,单词不是最小的组成部分,因为单词的含义被认为是更深层次的。使用算法-相同的自学习隐藏层,对所得的构成元素进行了意义分析。 首先将对提案进行部分分析,然后再进行分析,甚至是相反的方向。 确实,例如,在德语中,句子结尾的质点“ nicht”从根本上改变了其整体含义。
过程的示意图。 算法的每一层都以不同的配置分析句子,然后考虑语法特征,从另一种语言的接收含义中“收集”句子。但是,如果象棋一切都清晰明了,则该语言在规则中将是一种更为灵活的系统,它还允许翻译不仅在“字母上”而且在“精神上”都准确的句子。 即,翻译者可以有意识地牺牲文字翻译的准确性,以便更深地传达含义。
诗歌的小说翻译
一个常见的例子是经文的翻译。 毕竟,几乎不可能翻译一个四行诗以立即保留节奏,单词排列和全部含义。
根本不可能有统一的算法,因为通常您必须彻底地重做一句经文才能传达其真实含义。
当然,经文的翻译是语言学中最困难的领域之一,但是神经网络已经证明自己在精确计算中是最好的,因此我们将从最困难的方面入手。

例如,以莎士比亚的第二十四行诗为例。 或者,我们引用原始文本,S。Trukhtanov的翻译(我们从许多主观角度中选择了此选项)以及Google Translate的翻译。
原件:
四十个冬天要围住你的额头,
在你美丽的领域挖深沟,
你的青年骄傲的制服,现在凝视着,
将是一头散乱的杂草,价值不高:
然后被问到你所有的美丽在哪里,
在您光辉岁月的所有宝藏中,
可以说,在你自己沉沉的双眼中,
简直是全民的耻辱和节俭的赞美。
你的美丽应该得到多少赞美,
如果您能回答“我这个公平的孩子
应该加总我的数量,并成为我的老借口,”
通过继承证明他的美丽!
当你老的时候,这是新的,
当你感到冷的时候,看看你的血液温暖。
如您所见,这里的英语显然已经过时了-甚至还有一个单数的第二人称,在现代英语中并没有使用。 这使翻译更加复杂。
通常,我们不会只看人与机器翻译之间的区别:

老实说,这远不是Google最好的表现。 也许这就是为什么当询问机器翻译的遵守者的经文算法是否可行时,他们感到尴尬的原因。 毕竟,即使是自吹自Google的Google翻译也无法对此进行严密的应对。
散文的小说翻译
如果是这样,请尝试一些更简单的方法。 艺术散文。 大盖茨比·菲茨杰拉德。

原件:
“在我更年轻,更脆弱的岁月中,父亲给了我一些建议,从那以后我就一直在思考。
他告诉我:“只要您想批评任何人,只要记住,这个世界上的所有人都没有拥有您所拥有的优势。”
现在比较一下人机翻译。 作为人类的捍卫者,我们翻译了N. Lavrov。

拉夫罗夫的译本与原文不完全一致。 短语的安排有所变化,句子的扩展程度比英语要大。 但总的来说,印象是和谐的,意义和情绪得以充分传递。
机器翻译在机制上更准确-句子的翻译与原文完全一样。 含义传达得很好,但是“ you-you”存在问题,一切听起来都很笨拙。
在文学翻译中,为了和声或短语和声,可以牺牲一点准确性。 人工翻译甚至不必要地经常使用它,但是机器不使用。
那接下来呢?
的确,为了公平起见,必须提到Google Translate会翻译技术文本,在这种情况下,翻译的字面意义非常重要,完美且实用且没有错误。 但是那些声称翻译员将在5到10年内没有工作的角色可以安全地经过漫长的徒步旅行。
现有的处理器和数据处理算法可以处理具有有限规则集的系统。 下象棋还是走。 但是对于诸如语言之类的灵活多样的系统,规则的边界是模糊的,该程序必须添加不必要的复杂算法,而这些算法远非完美。
算法可能只需要更多时间来学习准确地使用语言。 好吧,我们将做进一步的工作,半步追踪神经网络在该领域的成功。
但是暂时不要依赖人工神经网络-学习英语并发展自己的语言。
EnglishDom.com-在线英语学习平台

在EnglishDom.com的在线课程中学习英语。 通过
引用 -订阅2个月作为礼物赠送的所有课程。
为了进行实时交流,请选择与老师一起进行Skype培训。 第一堂免费课程,请在此处注册。 通过
goodhabr2促销代码-从10节课中购买时,将赠送2节课作为礼物。 奖金有效期至05/31/19。