谷歌翻译短

该程序使用了先进的AI技术,但最简单的测试表明它仍然与真正的理解相去甚远




本文作者是美国物理学家和计算机科学家道格拉斯·理查德·霍夫斯塔特(Douglas Richard Hofstadter)。 诺贝尔物理学奖得主罗伯特·霍夫施塔特(Robert Hofstadter)的儿子。 凭借1979年出版的《哥德尔,埃舍尔,巴赫:这片无尽的花环》一书,他获得了全球声誉,并在1980年获得了“非小说类”普利策奖。

在每周一次的萨尔萨舞会上的一个星期天我的朋友弗兰克带来了一位来自丹麦的客人。 我知道弗兰克的丹麦语说得很好,因为他的母亲来自丹麦,他还是个孩子,住在丹麦。 他的女友英语流利,这被认为是斯堪的纳维亚国家的规范。 但是,令我惊讶的是,在沟通过程中,这对夫妇通常会交换Google翻译(GT)翻译的电子邮件。 弗兰克用英语写一条消息,通过GT运行以获得丹麦文本; 相反,她用丹麦语写作,然后允许GT将文字翻译成英语。 真奇怪! 为什么两个会说对方语言的聪明人会做这些事情? 我使用机器翻译软件的经验一直使我对其功能产生怀疑。 但是这两个显然并没有引起我的怀疑。 许多有才华的人都对翻译程序的功能着迷,几乎没有理由批评它们。 令我惊讶

我热爱语言,并且全力以赴进行翻译。 我是认知科学领域的专家,并且一生都对人类大脑复杂的工作感兴趣,因此数十年来,我一直在关注翻译的机械化。 我第一次对这个问题感兴趣是在1970年代中期,当时我遇到了数学家沃伦·韦弗Warren Weaver)于1947年写的一封信,这封信是机器翻译的早期支持者,写给控制论的创始人诺伯特·维纳Norbert Wiener )。
当我看俄语文章时,我说:“它实际上是用英文写的,只是用奇怪的字符加密了。 现在我将继续解密。”
几年后,他提出了另一种观点:“没有一个理性的人会相信机器翻译将能够实现优雅和风格。 普希金不应该害怕。” 我回想起我一生中难忘的一年,他将亚历山大·普希金的诗作《尤金·奥涅金》(Eugene Onegin)的一部精彩小说翻译成我的母语(我彻底改写了俄罗斯最伟大的作品,将其转变为诗歌中的英语故事),并且我发现韦弗的这句话更多比第一个奇怪的简化语言视图更真实。 然而,他在1947年将翻译视为解码的观点成为长期指导机器翻译领域的座右铭。

从那时起,机器翻译得到了逐步改进,最近使用了所谓的 “深度神经网络”甚至使一些观察者认为(请参见文章“ 人工智能大觉醒 ”和“ 机器翻译:在巴比伦之外 ”),人类翻译者是濒临灭绝的物种。 随着事件的发展,在几年内,从事翻译工作的人们将变成简单的质量控制者和小错误的校对者,并且不会整体上产生新的文本。

这种情况会使我精神崩溃。 尽管我了解教机器如何很好地翻译文本的愿望,但我不想看到死人将如何代替人工翻译。 这个主意吓坏了我。 在我看来,翻译是一种令人难以置信的精致艺术,不断需要多年的经验和创造性的想象力。 如果在某个“美好”的日子里,人类翻译成为过去的遗物,我对人类思想的尊重将会动摇,这种震惊将使我陷入难以置信的困惑和悲伤中。

每次我读到一篇文章,讲述翻译人员的行会如何很快被迫屈服于新技术的快速剑时,我感到有必要亲自检查这些陈述,尤其是因为担心这种噩梦已经非常严重亲密无间,也因为希望和渴望使自己相信自己并非如此亲密,最后,因为我长期以来坚信有必要与夸张的AI成就作斗争。 因此,在了解了Google部门最近称为Google Brain的人工神经网络的旧思想如何在“深度培训”的帮助下进行了改进之后,出现了一种新型的程序,该程序据称在机器翻译中引起了“革命”,我意识到我需要检查GT的最新版本。 难道她以Deep Blue和AlphaGo设法在象棋和围棋这样的古老游戏领域做到了这一点来改变了翻译领域吗?

我发现,尽管旧版GT可以使用多种语言,但是新版GT最初只能使用9种语言-正确,然后将其扩展到96种。我将研究范围限制为英语,法语,德语和中文等受支持的语言[ 我们会很有趣地添加和俄语/大约 佩雷夫 ]

在发现发现之前,值得一提的是“深层”一词的含混性。 当有人听到谷歌如何收购DeepMind公司时,该公司通过“深度学习”产生了“深度神经网络”,他立即就以“杰出”,“能力强”,“有见识”,“明智”的含义领悟了这些名字。 此外,“深层”一词仅表示以下事实:这些神经网络比可能具有两个或三个的旧版本具有更多的层(例如12个)。 它是从这样一个网络具有任何智慧的深度出发的吗? 几乎没有 这是口头公关。

我对GT非常怀疑,尤其是因为它周围的炒作。 但是,尽管存在敌意,我还是承认存在与我不喜欢的产品相关的惊人事实。 它对地球上的任何人都是免费的,并且可以将几乎一百种语言中的任何一种转换为其他语言中的文本。 值得尊重。 如果我自豪地称自己为“双语”(也就是说,我所知道的语言总数略多于三种,这是我幽默地回答“您知道多少种语言”的问题),那么GT可以为自己感到骄傲得多,如果他可以称自己为“购买语言”(普通话中的“购买”表示100)。 这位异教徒对巴耶赞主义印象深刻。 此外,如果我将语言A的页面复制到GT中,那么仅需几秒钟即可从语言B的单词中获取页面。 所有这一切一直在地球上以数十种语言显示在屏幕上。

GT和类似技术的实际好处是不能否认的,从原理上讲,它们使我们受益。但是,采用这种方法,显然还不够,可以用一个词来形容:理解。 机器翻译从未专注于理解语言。 取而代之的是,他们一直试图在这一领域进行“解密”-即应付任务,而不理会什么是理解和含义。 难道对一个好的翻译来说不需要理解吗? 某人,某人或一台机器可以在不关注语言含义的情况下发布高质量的翻译吗? 为了阐明这个问题,我们转向我所做的实验。

* * *

我将以适度的示例开始我的研究-简短地讲一下,这会立即引起一个清晰的想法:
在他们的房子里,一切都是成对出现的。 有他的汽车和她的汽车,他的毛巾和她的毛巾,还有他的图书馆和她的。

GT翻译:
在他们的房子里,一切都是成对出现的。 有他的汽车和她的汽车,毛巾和毛巾,还有他的图书馆和她的。

人工翻译:
在他们的房子里,一切都有自己的一对。 有他的车,她的车,他的毛巾和毛巾,他的图书馆和她。
翻译任务似乎很明确,但是在法语(和其他罗马语言 )中,表示事物的“他”和“她”一词不是所有者的意思,而是事物本身的意思。 这是GT给我的:
Dans leur maison,互相赞美。 无论是餐车还是餐车,还是餐车,还是参考书目,都可以。
该程序陷入了我的陷阱,不了解任何人会怎么理解我描述了一对夫妇,每个人都有她的东西。 例如,深度学习神经网络在机器及其机器上都使用了单词sa,因此我们无法说出机器所有者领域的任何信息。 同样,她使用无性的单词ses来表示“他的毛巾”和“她的毛巾”的复数形式;在后一种情况下,在图书馆中,她对她的最后一个字母s感到困惑,并且她以某种方式决定了s代表什么。复数(les siennes)。 该提案被GT翻译成法语,但失去了意义。

然后我本人将此短语翻译成法语,以便保留其原始含义。 这是我的版本:
Chez eux,不能再加倍。 您可以在``夜总会''和``夜总会''中选择自己的餐单,并在``夜总会''中选择自己的餐单。
sa voitureàelle的意思是“她的车”,而sa voitureàlui的意思是他的车。 在那之后,我决定将GT的法语翻译回英语并获得正确的英语版本对于GT来说是一件微不足道的任务-但我犯了个严重的错误。 这是他给我的:
在家里,他们拥有双倍的一切。 有他自己的汽车和他自己的汽车,他自己的毛巾和他自己的毛巾,他自己的图书馆和他自己的图书馆。
什么不好意思 即使进入句子明确指出了所有者的性别,翻译机器也忽略了这些主张,并将一切归因于男性。 她为什么要丢弃提案中最重要的信息?

人们对夫妇,房屋,个人财产,自豪感,竞争,嫉妒,个人生活以及许多其他无形的事物都了解很多,这些无形的事情会导致毛巾,绣有“他”和“她”的东西变幻莫测。 GT这样的微妙之处还未知。 GT一般不为人知的微妙之处。 他只知道由字母组成的单词组成的行。 他从事文本的超快速处理,他不认为,不代表,不记得,不理解。 他甚至不知道单词是什么意思。 我必须声明,原则上,计算机程序可以找出为什么需要一种语言,并且可以具有思想,记忆和经验,并且可以使用它们-但是GT并不是为此而设计的。 这些目标不在开发人员的计划中。

总的来说,我为结果感到高兴,欣慰地看到我们还没有接近用机器替换翻译器。 但是,在我看来,仍然值得对汽车进行更详细的研究。 一口渴不止。

顺便说一句,“不渴不渴”这个词又如何呢?(当然,这句话说的是“ 一个燕子不是夏天做的”),燕子这个词也被翻译成“ a一口”,在英语版本中,一只燕子没有夏天。/我不禁检查一下。这就是GT给我的:“ Une hirondelle n'aspire pas la soif” [ GT给俄语“一只燕子不能解渴” /大约翻译。 ]从语法上来说这句话是法语,但很难理解。首先,它提到了一只鸟(une hirondelle-swallow) a),然后说那只鸟不吸气或不吮吸(n'aspire pas),最后表明那只鸟不吸吮是口渴(la soif)。GT显然不理解该词组的含义-它只是发出一堆牛逼。“他只是和一堆公牛出去了。”“ GT。

* * *

从法国大火中我们跳进了德国大火。 最近,我沉浸在奥地利数学家卡尔·西格蒙德(Karl Sigmund)的著作Sie nannten sich der Wiener Kreis(他们自称为维也纳圈子)中。 她描述了一群来自1920年代和1930年代维也纳的理想主义知识分子 ,他们在20世纪下半叶对哲学和科学产生了重大影响。 我从西格蒙德的书中选了一个小句子,交给了GT。 首先是德语,然后是我的翻译,然后是GT。 (顺便说一句,我与包括德语的Karl Sigmund在内的两名德语母语人士进行了翻译检查,因此可以认为它是准确的)。
西格蒙德:

Nach dem verlorenen Krieg sahen es viele deutschnationale教授,在Fflult的Fakultät的Inzwischen die Mehrheit,在Pflicht an的Gewissermaßen死于Hochschulen vor den“ Ungeraden” zu bewahren; 我很高兴能适应训练。 假面中的假面和假面; überwenig军人sich einiger。

霍夫施塔特:

失败之后,当时具有泛德语主义倾向的许多教授已占据教职人员的大多数,他们认为保护高等院校免受“不良影响”几乎是他们的职责。 最有可能被解雇的是尚未获得教授大学课程的权利的年轻学者。 对于女学者来说,他们在体系中根本没有地位。 没有比这更清楚的了。

Google翻译:

在失败的战争之后,许多德国民族教授(同时也是该学院的大多数教授)将自己视为保持大学不受“奇特”影响的责任。 年轻的科学家在适应之前最脆弱。 而且科学家们也没有质疑。 他们很少。

GT,俄语:

战败后,许多德国国家教授(现在是该学院的大多数教授)认为,保护大学免受“奇怪”的侵害是他们的职责。 最易受伤害的是年轻的科学家,他们没有能力适应。 女科学家仍然毫无疑问。 有几个。

人类俄语:

失败之后,许多倾向于德国民族主义的教授(当时在他们的教职领导中占多数)认为保护高等教育机构免受“不良因素”的侵害是他们的职责。 最有可能被拒绝获得尚未获得教学权的年轻科学家。 对于女科学家来说,这个系统根本没有位置。 这比清楚还清晰。
GT翻译由英文单词组成(出于某种未知的原因,其中的某些出于某种原因以大写字母开头)。 到目前为止一切顺利! 但是很快整个翻译开始变得模糊,并且它进行得越远,它变得越模糊。

首先拿“奇数” 奇怪-奇怪,奇怪,不成对]。 这对应于德国的“ Ungeraden”死亡,意思是“出于政治原因而无用的人”。 但是GT有一个理由-纯统计资料-使用“奇数”一词。 即:在其庞大的双语数据库中,ungerade一词几乎总是翻译为奇数。 虽然汽车不明白为什么会这样,但我可以解释。 这是因为ungerade(字面意思是“间接”或“不均匀”)几乎总是表示“奇数”。 我对不希望的单词的选择与单词的统计无关,而是基于我对情况的理解-了解一种想法,该想法未在文本中直接表明,也未出现在任何德语词典的翻译选项列表中。

让我们继续进行“适应训练”,它表示教师的身份,类似于该学院的一名职员。 英语描图纸的适应性[合格]存在,但很少使用,并且肯定不会使全职员工想起。 因此,我简要地解释了这个想法,并没有使用一个罕见的词,因为这种机械的方法不会给讲英语的读者任何帮助。 当然,GT永远不会那样做;它没有面向读者的知识模型。

最后两句话清楚地表明了理解对于正确翻译的至关重要性。 15个字母的德语单词Wissenschaftler的意思是“科学家”或“科学家” [“ scientist” /“ scholar”]。 我选择了后者,因为它表示所有知识分子。 GT没有意识到这些微妙之处。 最后一句话中的相关联的17个字母的单词Wissenschaftlerinn是Wissenschaftlerinnen,是德国名词中使用分娩的结果。 短名词在语法上指的是男性,因此它意味着男性科学工作者,而长名词指的是女性,并且仅适用于女性。 因此,我写了《女科学家》。 同时,GT不理解女性后缀-in是句子中的主要词缀。 由于他不明白女人不在考虑范围之内,因此机器仅再次使用了“科学家”一词,完全忽略了句子的全部要点[ 有趣的是,GT更正确/大约将其翻译成俄语。 佩雷夫 ]。 就像法国人一样,GT不知道德国提案的唯一目的是展现男女之间的对比。

好吧,除了这个错误,最后一句话的其余部分是一场噩梦。 参加第一部分。 “科学家们仍然没有质疑”是否真的是“ Wissenschaftlerinnen kamen sowieso nicht in frage”的译本? 它们的含义绝对不一致。该句子仅包含以德语为基础的英语单词。而且,这足以将某个输出文本描述为“翻译”吗?[ 在翻译成俄文的版本中,噩梦依然存在/大约。佩雷夫 ]

第二部分同样是错误的。德语中的最后六个词的字面意思是“一点点更加团结”,或者更顺畅地说,“很少有人得到人们的同意。” ”;但是,GT将这个明确的想法变成了“有几个” [ 英文和俄文大致相同/大约相同。佩雷夫]。困惑的人可能会问“谁是几个?”,但是对于机械听众来说,这个问题是没有道理的。 GT不知道幕后发生了什么,他也无法回答一个看似简单的问题。翻译程序没有想象大量或少量的数量,数量或事物。她只是丢了符号,丝毫没有想到它们可以象征某些东西。

* * *

对于一个已经积累了经验,理解并一生有意义地使用单词的人来说,很难理解GT机如何将单词的内容扔到屏幕上。人们几乎无法抗拒这样一种假设,即能够很好地与文字配合使用的软件应该理解其含义。这种与AI相关的经典错觉被称为“ 伊丽莎效应 ”,因为最早使人们相信它似乎理解英语的程序之一就是无用的ELIZA短语操纵器,该操纵器在1960年代假装是心理治疗师。与该程序进行交互的许多人都产生了一种超自然的感觉,她理解了他们的深刻感受。

几十年来,聪明的人-甚至是AI研究人员-都受到Eliza效应的影响。为了防止读者陷入陷阱,请允许我在上面的文本中引用一些短语:“ GT不理解”,“没有意识到”,“ GT不知道”。具有讽刺意味的是,尽管这些短语坚持缺乏理解,但它们几乎暗示了GT至少在某些时候可以理解单词,短语或句子的含义这一事实。但是事实并非如此。 GT只是绕过了理解语言的问题。

对我而言,“翻译”一词具有神秘的气氛,让人回想起过去。它表示一种极其人文的艺术形式,可以将语言A的清晰概念优雅地转换为语言B的清晰概念。这种网络不仅应保持清晰度,还应传达原始作者的写作风格的阴影,细微差别和鲜明特征。在翻译时,我首先会仔细阅读原文,尽可能清晰地了解其构想,然后让它们挂在我的脑海中。这不是言语在脑海中盘旋,而是唤起各种相关思想的思想,从脑海中伴随的情景中创造出丰富的光环。当然,大多数这种光环是在无意识中。只有当我的意识中的光环被充分唤醒时,我才开始尝试用第二种语言来表达它-“挤出”。我想用语言B来说,语言B谈论构成正在讨论的意义光环的这种情况对我来说似乎很自然。

通常,我不会将语言A的单词和短语传递给语言B的单词和短语。相反,我会不自觉地调出图片,场景,想法,我的经历(或我阅读,在电影中看到的经历,从朋友那里听到的经历) ),并且只有当它是非语言的,具有比喻性的,经验丰富的,心理的“光环”时,才可以开始以目标语言来表达单词和短语的过程,然后进行编辑,编辑和编辑。这个过程是由意思来介导的,可能看起来很慢-当然,与GT上每页两秒钟的时间相比,这是事实-但是使用它的是任何认真的翻译者。当我听到“深切的头脑”这句话时,我想像这样的事情。

* * *

考虑到所有这些,我将转向中文,这是一种深度学习软件比两种欧洲语言更令人讨厌的语言。为了进行验证,我选择了《女性萨》(“我们三个”)的感人回忆录-中国剧作家兼翻译家杨江,她最近去世了,享年104岁。在书中,她回想起自己,丈夫钱钟书(也是作家兼翻译)和女儿的生活交织在一起。它的编写不是很复杂,但是使用了一种活泼且受过高等教育的中文。我选择了一个小通道,并在上面设置了GT。以下是结果以及我的翻译:
:

锺书到清华工作一年后,调任毛选翻译委员会的工作,住在城里,周末回校。 他仍兼管研究生。
毛选翻译委员会的领导是徐永煐同志。介绍锺书做这份工作的是清华同学乔冠华同志。
事定之日,晚饭后,有一位旧友特雇黄包车从城里赶来祝贺。客去后,锺书惶恐地对我说:

他以为我要做“南书房行走”了。这件事不是好做的,不求有功,但求无过。

:

After Zhongshu had worked at Tsinghua University for a year, he was transferred to the committee that was translating selected works of Chairman Mao. He lived in the city, but each weekend he would return to school. He also was still supervising his graduate students.
The leader of the translation committee of Mao's works was Comrade Xu Yongying, and the person who had arranged for Zhongshu to do this work was his old Tsinghua schoolmate, Comrade Qiao Guanhua.
On the day this appointment was decided, after dinner, an old friend specially hired a rickshaw and came all the way from the city just to congratulate Zhongshu. After our guest had left, Zhongshu turned to me uneasily and said:
“He thought I was going to become a 'South Study special aide.' This kind of work is not easy. You can't hope for glory; all you can hope for is to do it without errors.”

Google Translate:

After a year of work at Tsinghua, he was transferred to the Mao Translating Committee to live in the city and back to school on weekends. He is still a graduate student.
The leadership of the Mao Tse Translation Committee is Comrade Xu Yongjian. Introduction to the book to do this work is Tsinghua students Qiao Guanhua comrades.
On the day of the event, after dinner, an old friend hired a rickshaw from the city to congratulate. Guest to go, the book of fear in the book said to me:
He thought I had to do “South study walking.” This is not a good thing to do, not for meritorious service, but for nothing.

GT, :

, . - .
. , , .
, , , , . , , :
, « ». .

:

, , . , . , .
, , .
约会被批准的那天,晚餐后,一个老朋友专门雇了一辆人力车,从城里来只是为了祝贺中书。客人离开后,中枢转向我,关切地说道:
他以为我会成为“南内阁的特别助理”。这是艰苦的工作。希望没有名望;一个人只能希望没有错误。
简要描述怪异之处。首先,尽管它的名字(“锺书”)在原文中出现过3次,但GT从未提及中书。首先,机器使用代词“ he”,第二次使用代词“ he”,第三次使用代词“ he”。去猜吧![ 在俄语版本中,神秘的“书”出现一次/大约。佩雷夫 ]

第二个奇怪之处-在第一段中清楚地表明,中枢带领研究生,但是GT自己让他成为了研究生。

第三个奇怪之处是,在毛泽东翻译委员会(毛泽东翻译委员会)中,毛主席(毛泽东)的名字的三分之一掉到了某个地方。

第四怪-永建被永建所取代。

第五点奇怪-我们的客人离开[离开我们的客人]之后,他们简单地用来宾[去的客人]代替了它。

第六怪-最后一句话完全没有意义。

这些怪异中有六个已经足以让GT感到羞耻,但请原谅他们并忘记。最好集中注意我在文本中遇到的令人困惑的词组-上段(“南书房行走”)中用引号引起来的五个字符的词组。可以将其象征性地翻译为“散步的南方书房”,但这显然是不可接受的,特别是因为在上下文中它应该是一个名词。 GT发明了“步行南办公室”,但这没有帮助。

我承认中文短语对我来说是完全不可理解的。从字面上看,这意味着要走在建筑物南侧的办公室中,但我知道这是错误的-在上下文中这是没有意义的。要翻译,我需要找到中国文化中我不了解的东西。我在哪里寻求帮助?去谷歌! (但不是Google翻译)。我输入了中文字符,并用引号将其括起来,然后进行了精确匹配的搜索。一堆中文网页突然弹出到屏幕上,此后,我痛苦地跋涉了几个最初站点的前几段,试图理解该词组的含义。

我发现这个词可以追溯到清朝(1644–1911),是指帮助皇帝撰写时尚的官方通讯并在皇宫南面的办公室工作的脑力工作者。两个字符,据说是“散步”,实际上是一个助手。因此,利用Google搜索中的信息,我想到了“来自南方办公室的特别助理”一词。

很遗憾,GT本身无法像我一样使用Google搜索服务。但是同样,GT无法理解网页,尽管它可以使它们转瞬之间。也许吧?接下来,我给出了一段很棒的文字,在我把网站的开头提供给GT后,GT立刻将其扔到了我的屏幕上,从该网站我可以获得必要的信息:
“南学游走”并不是官方的立场,在清代以前这只是“信使”,一般由当时的帝国主义知识分子翰林担任。 南汉书房在翰林官员中把“选陈才唯品优”的价值,称为“南汉书房游走”。 由于接近皇帝,皇帝的决定具有一定的影响力。 后来雍正成立“军机”军工部部长,专职,虽然仍为翰林学有所成,但并未参与政府事务。 清代进士对南学的价值感到自豪。 清初许多学者和学者通过考察进入南方。
一般是英文吗? 当然,我们都可以同意文本由英语单词组成(大多数情况下),但是由此得出的结论是英语文本吗? 我认为,由于该段没有意义,因此它不是英语。 它只是随机放置的英语食材-随机的文字沙拉,杂乱无章的哈希。

如果您有兴趣,这是此文章的我版本(我仔细研究了几个小时):
南Shu范小姑祖职位(南内阁特别助理)虽然没有正式任命,但在清朝初期,这是现任法院学者通常扮演的特殊角色。 一群在皇宫南端办公室工作的科学家从他们的人民中选拔了杰出的才干和良好的声誉,以便他为皇帝撰写演讲,并一直在他的住所里。 因此,这个角色被称为“南方内阁的特别助理”。 这位助手接近皇帝,显然能够影响他的政治决定。 然而,在雍正皇帝成立战争部,部长和他的各个下属之后,南内阁的助手尽管为皇帝服务,但在决策中不再发挥重要作用。 然而,清朝的学者们为这个职位的荣耀而奋斗,在朝代初期,几位著名的学者是特别的助手。
一些读者可能会怀疑,为了严厉批评GT,我特意选择了他积极偶然发现的段落,实际上他对大多数文字的处理要好得多。 听起来令人信服,但事实并非如此。 我现在从阅读的书中选择的几乎每个段落都会导致各种类型和条纹的翻译错误,包括上面给出的无意义和难以理解的短语。

当然,我承认有时候GT会给出一些听起来不错的句子(尽管它们可能会引起误解或错误)。 甚至有可能一两个段落会完美地结合在一起,产生一种错觉,即GT理解自己在做什么,理解了阅读的含义。 在这种情况下,GT看起来令人印象深刻-几乎是人类! 所有的赞美显然都与其创造者及其辛勤工作有关。 但同时,不要忘了GT对这两个中文段落,以及较早的法语和德语做了什么。 要了解这些错误,您不应忘记“伊丽莎效应”。 Bayan语言机器不读取任何内容-不是人类动词“ read”的意思。 她处理文本。 处理过的字符与世俗经验无关。 她没有记忆可以画出任何东西,也没有想象力,也没有理解力,也没有她如此迅速的操作背后隐藏的含义。

* * *

一个朋友问我,是否可以将GT技能视为简单的数据库功能。 他认为,如果您将数据库增加一百万或十亿次,则从原则上讲,它最终将能够翻译它们提供的所有内容,从本质上讲是理想的。 我不这么认为。 增加“大数据”的数量不会使您更接近理解,因为理解取决于思想的可用性,而思想的缺乏是现代机器翻译所有问题的根源。 因此,我确信较大的数据库-甚至更大的数据库-在这里都无济于事。

另一个自然的问题:在GT中使用神经网络-模仿大脑-将使我们更接近语言机器的真正理解。 乍一看,这似乎是合理的,但到目前为止,还没有任何人尝试超越单词和短语的肤浅程度。 关于大型数据库的各种统计信息都嵌入在神经网络中,但是这些统计信息只是将某些单词与其他单词而不是思想联系在一起。 没有尝试创建代表想法,图像,记忆或经验的内部结构。 这种思维构造对于计算方法来说太难以捉摸,因此,代替它们,使用了快速且复杂的单词统计累加算法。 但是,这种技术的结果与当某人阅读,理解,创建,修改和判断文本时出现的想法并不相称。

但是,尽管我很消极,但GT提供了许多人赞赏的服务:它迅速将以自然语言A编写的有意义的句子转换为语言B中不一定有意义的单词行。并且虽然语言B的文本或多或少可以理解,人们对结果完全满意。 如果他们能够以一种不熟悉的语言获得提案的“基本思想”,那么他们会感到高兴。 对我而言,这根本不是“翻译”一词的含义,但对某些人来说,这是一项很棒的服务,对他们而言,这是一种翻译。 好吧,我可以理解他们的需求和满意。 幸运的他们!

我最近观看了技术爱好者绘制的条形图,这些条形图代表了人和计算机进行翻译的质量,并且这些图显示了机器翻译与人类之间的接近程度。 从我的角度来看,这种无法量化表达的概念量化是伪科学,或者,如果您愿意的话,书呆子试图将那些无形,微妙,艺术性质无法实现的东西带入数学。 我认为,今天对GT的结论从优秀到怪诞不等,但我无法从数字上评估我的感受。 记住我的第一个例子,使用“他”和“她”的概念。 这个没经过深思熟虑的程序正确地翻译了几乎所有单词,但是尽管取得了成功,但它完全不理解其含义。 然后如何用数字表达工作质量? 用伪柱形图表示翻译质量仅仅是对科学外部属性的滥用。

让我们回到悲惨的景象,在那幅画中,译者很快就会被抛在后面,变得过时,最后将进行校对。 在最好的情况下,结果将是平庸的。 认真的艺术家不会开始处理充满错误的媚俗垃圾,而是通过进行一些更改来制作艺术品。 这不是艺术的本质。 翻译是一门艺术。

这些年来,我一直支持人类大脑是机器的观点。 非常复杂的汽车; 我与那些坚决反对机器的人进行了激烈的争论。 甚至有一所哲学流派指出,计算机永远不会“拥有语义”,因为它们由“错误的材料”(硅)组成。 对于我来说,这是肤浅的胡说。 在这里,我不会进行辩论,但是我不想给读者留下深刻的印象,我相信智力和理解永远不会对计算机有用。 如果本文引起了这样的思考,那仅仅是因为我所讨论的技术并未尝试重现人类的智慧。 相反:他们试图绕开智力,而由此产生的段落证明了这些差距。

从我的观点来看,原则上没有一天会禁止机器变得富有创造力,有趣,怀旧,快乐,害怕,热情,顺从,充满希望并因此可以成为好东西语言之间的翻译。 没有根本的原因使他们有一天无法成功地翻译这样的笑话,双关语,剧本,小说,诗歌和散文。 但是,只有当汽车像人一样充满想法,情感和经验时,所有这些都会出现。 但这还不可见。 我相信这仍然很遥远。 至少,这个人一生都热切希望,因为他的一生都钦佩着人类心灵的深处。

有一天,当机械翻译用清晰,富有节奏感的四足i昧,富有思想,感性和活泼线条的英文翻译一部技巧娴熟的诗歌小说时,我会明白现在该离开了。

Source: https://habr.com/ru/post/zh-CN410185/


All Articles