😧 🐳 🚥 Google translate short 🧕🏼 🤷🏻 👩🏼‍💻

O programa usa tecnologias avançadas de IA, mas os testes mais simples indicam que ainda está longe de ser um entendimento real

O autor do artigo é Douglas Richard Hofstadter - físico americano e cientista da computação; filho do Prêmio Nobel de Física Robert Hofstadter. Ele ganhou fama mundial graças ao livro "Godel, Escher, Bach: This Endless Garland", publicado em 1979 e em 1980, recebeu o Prêmio Pulitzer na categoria "Não-ficção".

Certo domingo, em uma sessão semanal de salsa, meu amigo Frank trouxe um hóspede da Dinamarca com ele. Eu sabia que Frank fala bem dinamarquês, porque sua mãe é de lá e ele viveu quando criança na Dinamarca. Sua namorada falava inglês fluentemente, o que é considerado a norma para os países escandinavos. No entanto, para minha surpresa, no processo de comunicação, esse casal geralmente troca e-mails traduzidos pelo Google Translate (GT). Frank escreve uma mensagem em inglês, percorre o GT para obter texto em dinamarquês; ela, pelo contrário, escreve em dinamarquês e depois permite que o GT traduza o texto para o inglês. Que estranho! Por que duas pessoas inteligentes que falam o idioma uma da outra fazem essas coisas? Minha experiência no uso de software de tradução automática sempre me levou a avaliações céticas de suas capacidades. Mas esses dois claramente não compartilhavam do meu ceticismo. Muitas pessoas inteligentes são fascinadas pelas capacidades dos programas de tradução e encontram poucas razões para criticá-las. Isso me surpreende.

Adoro idiomas e faço traduções com toda a minha paixão. Sou especialista em ciência cognitiva e tenho me interessado nos meandros do trabalho da mente humana durante toda a minha vida, então, durante décadas, acompanho a mecanização das traduções. A primeira vez que me interessei por esse assunto foi em meados da década de 1970, quando me deparei com uma carta de 1947, escrita pelo matemático Warren Weaver , um dos primeiros defensores de traduções de máquinas, endereçada ao fundador da cibernética, Norbert Wiener , no qual Weaver fez uma declaração interessante hoje bastante famosa:

Quando olho para um artigo russo, digo: “Ele está realmente escrito em inglês, apenas criptografado com caracteres estranhos. E agora vou proceder à descriptografia ".

Alguns anos depois, ele propôs um ponto de vista diferente: “Nenhuma pessoa razoável acreditará que a tradução automática será capaz de obter elegância e estilo. Pushkin não deve ter medo. Lembro-me de um ano inesquecível da minha vida na tradução de um romance brilhante dos poemas de Alexander Pushkin “Eugene Onegin” para minha língua nativa (reformulei radicalmente a maior obra russa, transformando-a em uma história em inglês em poemas), e acho essa observação de Weaver muito mais verdadeira do que a primeira visão estranhamente simplificada de idiomas. No entanto, sua visão de 1947 da tradução como decodificação se tornou o lema que há muito guia o campo da tradução automática.

Desde então, as traduções automáticas foram gradualmente aprimoradas e, recentemente, o uso dos chamados As “redes neurais profundas” levaram alguns observadores a pensar (veja os artigos “O Grande Despertar da IA ” e “ Tradução Automática: Além da Babilônia ”) que tradutores humanos são uma espécie em extinção. Com esse desenvolvimento de eventos, as pessoas que trabalham como tradutores se transformarão em controladores de qualidade simples e revisores de pequenos erros em alguns anos, e não produzirão novos textos na íntegra.

Tal cenário teria me causado uma revolução espiritual esmagadora. Embora eu compreenda o desejo de ensinar às máquinas como traduzir bem textos, não quero ver como as pessoas mortas substituirão tradutores humanos. Essa ideia me assusta e me dá nojo. Na minha opinião, a tradução é uma arte incrivelmente refinada, exigindo constantemente muitos anos de experiência e imaginação criativa. Se em um dia "bom", tradutores humanos se tornarem relíquias do passado, meu respeito pela mente humana será abalado e esse choque me deixará em incrível confusão e tristeza.

Toda vez que leio um artigo sobre como a guilda de tradutores humanos em breve será forçada a inclinar a cabeça para a espada terrivelmente rápida de uma nova tecnologia, sinto a necessidade de verificar essas declarações pessoalmente, principalmente por causa do medo de que esse pesadelo já tenha surgido muito. próximo e também por causa da esperança e desejo de me convencer de que ele não está tão próximo e, finalmente, por causa de minha crença de longa data na necessidade de combater o exagero das realizações da IA. Portanto, depois de ler sobre como a velha ideia de redes neurais artificiais, adotada recentemente pela divisão do Google chamada Google Brain, e melhorada com a ajuda de "treinamento aprofundado", levou ao surgimento de um novo tipo de programa que supostamente fez uma "revolução" nas traduções automáticas. Percebi que precisava verificar a versão mais recente do GT. É verdade que ela mudou o campo das traduções da maneira como Deep Blue e AlphaGo conseguiram fazer isso no campo de jogos tão veneráveis como o xadrez e a partida?

Eu descobri que, embora a versão antiga do GT trabalhasse com uma variedade muito grande de idiomas, a nova funcionava primeiro com apenas nove - verdadeiro, depois expandi o conjunto para 96. Limitei minha pesquisa a idiomas suportados como inglês, francês, alemão e chinês [ vamos adicionar por diversão e idioma russo / aprox. perev. ]

Antes da demonstração das descobertas, vale a pena mencionar a ambiguidade da palavra "profundo". Quando uma pessoa ouve sobre como o Google comprou a empresa DeepMind, que produziu "redes neurais profundas" com "aprendizado profundo", imediatamente percebeu esses nomes nos significados "excepcional", "capaz de muito", "perspicaz" e "sábio". Além disso, a palavra “profundo” significa apenas o fato de que essas redes neurais têm mais camadas (digamos, 12) do que as versões mais antigas, que poderiam ter duas ou três. Segue-se de tal profundidade que tal rede tenha algum tipo de sabedoria? Dificilmente. Isso é RP verbal.

Eu desconfio muito do GT, especialmente por causa do hype em torno dele. Mas, apesar da hostilidade, admito que não gosto de fatos surpreendentes relacionados a esse produto. Está disponível gratuitamente para qualquer pessoa na Terra e pode converter texto em quase uma centena de idiomas em texto em qualquer outro idioma. É digno de respeito. Se eu me orgulho em chamar de "pi-lingual" (ou seja, o número total de idiomas que conheço é um pouco mais do que três é a minha maneira bem-humorada de responder à pergunta "quantas línguas você conhece"), quanto mais um GT pode se orgulhar de si mesmo, se ele pode se chamar "buy-lingual" ("buy" em mandarim significa 100). O homem pagão está muito impressionado com o bayazianismo. Além disso, se eu copiar uma página no idioma A para o GT, leva apenas alguns segundos para obter uma página das palavras no idioma B. E tudo isso acontece o tempo todo, em telas ao redor do planeta, em dezenas de idiomas.

Os benefícios práticos do GT e de tecnologias semelhantes não podem ser negados e, em princípio, eles nos beneficiam, mas nessa abordagem, algo claramente não é suficiente, e isso pode ser descrito em uma palavra: compreensão. A tradução automática nunca se concentrou em entender o idioma. Em vez disso, eles sempre tentaram “descriptografar” nessa área - ou seja, lidar com a tarefa, sem se preocupar com o que são compreensão e significado. Será que o entendimento não é necessário para uma boa tradução? Alguém, uma pessoa ou uma máquina, pode emitir uma tradução de alta qualidade sem prestar atenção ao significado do idioma? Para esclarecer essa questão, voltamos às experiências que fiz.

* * *

Iniciarei minha pesquisa com exemplos modestos - com uma breve observação, que imediatamente causa uma ideia clara em uma pessoa:

Na casa deles, tudo vem em pares. Há o carro dele e o carro dela, as toalhas e as toalhas dela, e a biblioteca dele e a dela.

Tradução GT:
Na casa deles, tudo vem em pares. Há o carro dele e o carro dela, toalhas e toalhas, assim como a biblioteca dele e a dela.

Tradução Humana:
Na casa deles, tudo tem seu próprio casal. Lá está o carro dele, o carro dela, as toalhas dele e as toalhas dela, a biblioteca dele e ela.

A tarefa de tradução parece inequívoca, mas em francês (e em outras línguas românicas ) as palavras "ele" e "ela", indicando coisas, são colocadas não no tipo do proprietário, mas no tipo de coisa em si. Aqui está o que o GT me deu:

Em mais de uma vez, todos os pares e pares. Você está aqui: Serviços e Serviços, Serviços de Bibliotecas e Serviços.

O programa caiu na minha armadilha, sem entender como alguém entenderia que eu descrevi um casal que gostava de cada uma das coisas dele. Por exemplo, uma rede neural de aprendizado profundo usou a palavra sa tanto para sua máquina quanto para sua máquina; portanto, não podemos dizer nada sobre o campo do proprietário da máquina. Da mesma forma, ela usou a palavra assexuada ses para o plural de “toalhas dele” e “toalhas dela” e, no último caso, com bibliotecas, ela ficou confusa com a última letra s na dela e de alguma forma decidiu o que significa plural (les siennes). A proposta, traduzida por GT para o francês, perdeu o sentido.

Então eu mesmo traduzi esta frase para o francês, para que ela retenha seu significado original. Aqui está a minha versão:

Chez eux, é ont tout en double. Você está com uma conta no elle e uma com o lui, esses serviços para elle e esses serviços para lui, na bibliotecária à elle e na bibliotecária à lui.

A frase sa voiture à elle significa "seu carro" e sa voiture à lui significa seu carro. Depois disso, decidi que seria uma tarefa trivial para o GT traduzir minha tradução em francês de volta para o inglês e obter a versão correta em inglês - mas estava seriamente enganado. Aqui está o que ele me deu:

Em casa, eles têm tudo em dobro. Há seu próprio carro e seu próprio carro, suas próprias toalhas e suas próprias toalhas, sua própria biblioteca e sua própria biblioteca.

Desculpe? Mesmo que a frase de entrada indique explicitamente o sexo dos proprietários, a máquina de tradução ignorou essas alegações e atribuiu tudo ao sexo masculino. Por que ela jogou fora as informações mais importantes da proposta?

As pessoas sabem muitas coisas sobre casais, casas, pertences pessoais, orgulho, rivalidade, ciúme, vida pessoal e muitas outras coisas intangíveis que levam a caprichos como toalhas com bordados de "ele" e "ela". GT tais sutilezas são desconhecidas. GT sutilezas geralmente desconhecidas. Ele conhece apenas linhas compostas de palavras compostas de letras. Ele está envolvido no processamento ultra-rápido de partes de texto, ele não pensa, não representa, não se lembra, não entende. Ele nem sabe que palavras significam coisas. Apresso-me a declarar que, em princípio, um programa de computador pode descobrir por que uma linguagem é necessária, e pode ter idéias, memória e experiência, e usá-las - mas o GT não foi projetado para isso. Tais objetivos não estavam nos planos de seus desenvolvedores.

De modo geral, ri dos resultados, aliviado ao ver que não tínhamos chegado perto de substituir tradutores por máquinas. Mas ainda assim me pareceu que valia a pena estudar o carro com mais detalhes. Um gole de sede não se apaga.

E, a propósito, e essa frase - "uma sede para não matar a sede" (sugerindo, é claro, o ditado " uma andorinha não faz verão") - a palavra andorinha também é traduzida como "um gole" e como uma "andorinha". Na versão em inglês, uma andorinha não produz verão. / aprox. transl. ] Eu não pude deixar de verificar. E aqui está o que GT me deu: "Une hirondelle n'aspire pas la soif" [ GT deu ao russo "uma andorinha não sacia a sede" / aprox. Transl. ]. Gramaticalmente, esta frase é francesa, mas é difícil de entender. Primeiro, ela menciona um pássaro (une hirondelle - andorinha) a), então diz-se que o pássaro não inspira ou não aspira (n'aspire pas) e, finalmente, indica-se que o que o pássaro não aspira é sede (la soif). GT claramente não entendeu o significado da frase - simplesmente emitiu um monte de merda. ”“ Um pouco mais simples com um tour de touros. ”“ Ele acabou de sair com uma pilha de touros. ”“ Um passeio de classificação com um tour de touros. ”Perdoe meu francês - ou melhor, pseudo-francês GT.

* * *

Do fogo francês, saltamos para o fogo alemão. Recentemente, estou imerso no livro Sie nannten sich der Wiener Kreis (eles se chamavam Círculo de Viena) do matemático austríaco Karl Sigmund. Ela descreve um grupo de intelectuais idealistas de Viena nas décadas de 1920 e 1930 que influenciaram seriamente a filosofia e a ciência na segunda metade do século XX. Selecionei uma pequena frase do livro de Sigmund e entreguei a GT. Aqui está, primeiro em alemão, depois vem minha tradução, depois GT. (A propósito, verifiquei minha tradução com dois falantes nativos de alemão, incluindo Karl Sigmund - para que possa ser considerada precisa).

Sigmund:

Nach dem verlorenen Krieg sahen es viele deutschnationale Professoren, inglaterra for the Mehrheit in der Fakultät, gewissermaßen als ihre Pflicht an, die Hochschulen vor den "Ungeraden" zu bewahren; sou schutzlosesten waren junge Wissenschaftler vor ihrer Habilitation. Und wissenschaftlerinnen kamen sowieso nicht in frage; über wenig homem de guerra sich einiger.

Hofstadter:

Após a derrota, muitos professores com tendências pan-germânicas, que na época constituíam a maioria do corpo docente, consideravam praticamente seu dever proteger as instituições de ensino superior dos “indesejáveis”. Os mais propensos a serem demitidos foram os jovens acadêmicos que ainda não tinham o direito de dar aulas na universidade. Quanto às acadêmicas, bem, elas não tinham lugar no sistema; nada era mais claro que isso.

Google Translate:

Após a guerra perdida, muitos professores nacionais alemães, enquanto a maioria no corpo docente, consideravam-se seu dever de manter as universidades fora do "estranho"; Os jovens cientistas eram os mais vulneráveis antes de sua habilitação. E os cientistas não questionaram de qualquer maneira; Havia poucos deles.

GT, russo:

Após a guerra perdida, muitos professores de nacionalidade alemã, agora a maioria na faculdade, consideraram seu dever proteger as universidades do "estranho"; os mais vulneráveis eram jovens cientistas antes de sua habilitação. E as mulheres cientistas ainda não tinham dúvida; havia vários deles.

Russo humano:

Após a derrota, muitos professores propensos ao nacionalismo alemão (e na época havia a maioria na liderança do corpo docente) consideravam seu dever proteger as instituições de ensino superior de "elementos indesejáveis". Provavelmente, jovens cientistas que ainda não tinham o direito de ensinar poderiam ser recusados. Para as mulheres cientistas, não havia lugar nesse sistema; era mais claro que claro.

A tradução GT consiste em palavras em inglês (por algum motivo desconhecido, algumas delas, por algum motivo, começam com uma letra maiúscula). Até aí tudo bem! Mas logo toda a tradução começa a ficar embaçada, e quanto mais ela avança, mais embaçada ela se torna.

Primeiro pegue o "estranho" estranho - estranho, estranho, não emparelhado]. Isso corresponde ao dado alemão 'Ungeraden', que significa "pessoas indesejadas por razões políticas". Mas o GT tinha um motivo - pura estatística - para usar a palavra "ímpar". Nomeadamente: em seu enorme banco de dados bilíngue, a palavra ungerade quase sempre se traduz como estranha. Embora o carro não entenda o porquê, eu posso explicar. Isso ocorre porque ungerade - literalmente significa "indireto" ou "desigual" - quase sempre significa "estranho". E minha escolha da palavra indesejável [elementos indesejados] não tem nada a ver com as estatísticas das palavras, mas vem do meu entendimento da situação - entender uma ideia que não está diretamente indicada no texto e não está presente na lista de opções de tradução para a palavra ungerade em nenhum dos dicionários alemães.

Passemos à Habilitação, que denota o status de um professor, semelhante a um membro da equipe do instituto. A habilitação em papel vegetal inglesa [qualificada] existe, mas raramente é usada e certamente não lembra funcionários em período integral. Portanto, expliquei brevemente essa idéia e não usei apenas uma palavra rara, porque essa abordagem mecânica não daria nada aos leitores de língua inglesa. Obviamente, o GT nunca fará isso; não possui modelo de conhecimento para seus leitores.

As duas últimas frases demonstram claramente a importância crítica da compreensão para uma tradução adequada. A palavra alemã de 15 letras Wissenschaftler significa "cientista" ou "cientista" ["cientista" / "estudioso"]. Eu escolhi a última opção, pois denota todos os intelectuais em geral. O GT não reconheceu essas sutilezas. A palavra associada de 17 letras Wissenschaftlerin na frase final, plural, Wissenschaftlerinnen é uma conseqüência do uso do parto em substantivos alemães. Um substantivo curto refere-se gramaticalmente ao gênero masculino, portanto, significa um cientista masculino, e um substantivo longo refere-se a uma mulher e é aplicável apenas a mulheres. Por isso, escrevi "mulheres cientistas". GT, enquanto isso, não entendeu que o sufixo feminino -in era o principal da frase. Como ele não entendeu que as mulheres foram excluídas da consideração, a máquina simplesmente mais uma vez usou a palavra “cientista”, perdendo completamente todo o sentido da frase [é interessante que o GT a tenha traduzido para o russo mais corretamente / aprox. perev. ] Como foi o caso dos franceses, o GT não fazia ideia de que o único objetivo da proposta alemã era trazer à tona o contraste entre homens e mulheres.

Bem, além desse erro, o restante da última frase é um pesadelo completo. Pegue a primeira parte. Será que “os cientistas não questionaram mesmo” realmente a tradução de “Wissenschaftlerinnen kamen sowieso nicht in frage”? Eles absolutamente não coincidem em significado. A frase consiste simplesmente em palavras em inglês, dominadas com base no alemão. E o que é suficiente para descrever um determinado texto de saída como uma "tradução"? [ na versão da tradução para o russo, o pesadelo persiste / aprox. perev. ]

A segunda parte é igualmente errônea. As últimas seis palavras em alemão significam literalmente "pouco estava mais unido", ou, mais suavemente, "havia poucas para as quais o consentimento das pessoas era mais forte" ["pouco mais era uma mais unida" / "havia pouco quais pessoas estavam mais de acordo ”] - no entanto, o GT transformou essa ideia clara em“ havia várias ”[ aproximadamente a mesma em inglês e russo / aprox. perev. ] Pessoas perplexas podem perguntar "quem eram várias?", Mas para um ouvinte mecânico, essa pergunta não faria sentido. O GT não tem idéia do que está acontecendo nos bastidores, e ele não poderia ter respondido a uma pergunta aparentemente simples.O programa de tradução não imaginava grandes ou pequenas quantidades, números ou coisas. Ela apenas jogou símbolos, sem a menor idéia de que eles poderiam simbolizar alguma coisa.

* * *

É muito difícil para uma pessoa que tem adquirido experiência, entendimento e uso significativo de palavras por toda a vida entender como o conteúdo da palavra é desprovido pela máquina GT. É quase impossível para as pessoas resistirem à suposição de que software que funciona tão bem com palavras deve entender seu significado. Essa ilusão clássica relacionada à IA é chamada de " efeito Eliza " , porque um dos primeiros programas que fez as pessoas acreditarem que parecia entender o inglês era o inútil manipulador de frases da ELIZA que fingia ser psicoterapeuta nos anos 1960. Muitas pessoas que interagiram com o programa criaram um sentimento sobrenatural de que ela entendia seus sentimentos profundos.

Durante décadas, pessoas inteligentes - até mesmo pesquisadores de IA - ficaram sob a influência do efeito Eliza. Para impedir que meus leitores caiam nessa armadilha, deixe-me citar algumas frases do texto acima - "GT não entendeu", "não percebeu", "GT não fazia ideia". É irônico que, embora essas frases insistem em uma falta de entendimento, elas quase aludem ao fato de que o GT pode, pelo menos algumas vezes, entender o significado de uma palavra, frase ou frase. Mas isso não é verdade. O GT simplesmente ignora a questão de entender o idioma.

Para mim, a palavra "tradução" tem uma aura misteriosa que evoca memórias. Denota uma forma de arte extremamente humana que graciosamente transforma idéias claras da linguagem A em idéias claras da linguagem B. Essa rede não deve apenas manter a clareza, mas também transmitir as tonalidades, nuances e características distintivas do estilo de escrita do autor original. Quando faço a tradução, primeiro leio cuidadosamente o texto original, aprendo as idéias o mais claramente possível e as deixo na minha mente. Não são palavras trêmulas na mente - idéias que evocam todos os tipos de idéias relacionadas, criando uma auréola rica a partir dos cenários que acompanham minha cabeça. A maior parte desse halo, é claro, está no inconsciente. Somente quando a auréola em minha consciência é despertada o suficiente, começo a tentar expressá-la - "espremer" - em um segundo idioma.Estou tentando dizer na linguagem B o que me parece natural para a linguagem B falar sobre situações que compõem a auréola de significado que está sendo discutida.

Em geral, não passo de palavras e frases da linguagem A para palavras e frases da linguagem B. Em vez disso, invoco inconscientemente imagens, cenas, idéias, minha experiência (ou a experiência que li, vi nos filmes, ouvi de amigos ) e somente quando é um "halo" mental, não-verbal, figurativo, experiente e mental - só então inicio o processo de formulação de palavras e frases no idioma de destino e edito, edito e edito. Esse processo, que é mediado por significado, pode parecer lento - e, é claro, comparado a dois segundos por página no GT, é o que é - mas é qualquer tradutor sério que o usa. Eu imagino algo assim quando ouço a frase "mente profunda".

* * *

Diante de tudo isso, voltarei ao chinês, um idioma que é muito mais irritante com o software de aprendizado profundo do que os dois idiomas europeus. Para os testes, escolhi as comoventes memórias de Women Sa ("Os três de nós") - dramaturgo e tradutor chinês Yang Jiang , que morreu recentemente aos 104 anos. No livro, ela se lembra do entrelaçamento da vida de si mesma, do marido Qian Zhongshu (também escritor e tradutor) e da filha deles. Não é escrito de maneira muito complexa, mas usa uma língua chinesa animada e altamente educada. Eu escolhi uma pequena passagem e coloquei um GT nela. Aqui estão os resultados, juntamente com a minha tradução:

:

锺书到清华工作一年后，调任毛选翻译委员会的工作，住在城里，周末回校。他仍兼管研究生。
毛选翻译委员会的领导是徐永煐同志。介绍锺书做这份工作的是清华同学乔冠华同志。
事定之日，晚饭后，有一位旧友特雇黄包车从城里赶来祝贺。客去后，锺书惶恐地对我说：

他以为我要做“南书房行走”了。这件事不是好做的，不求有功，但求无过。

:

After Zhongshu had worked at Tsinghua University for a year, he was transferred to the committee that was translating selected works of Chairman Mao. He lived in the city, but each weekend he would return to school. He also was still supervising his graduate students.
The leader of the translation committee of Mao's works was Comrade Xu Yongying, and the person who had arranged for Zhongshu to do this work was his old Tsinghua schoolmate, Comrade Qiao Guanhua.
On the day this appointment was decided, after dinner, an old friend specially hired a rickshaw and came all the way from the city just to congratulate Zhongshu. After our guest had left, Zhongshu turned to me uneasily and said:
“He thought I was going to become a 'South Study special aide.' This kind of work is not easy. You can't hope for glory; all you can hope for is to do it without errors.”

Google Translate:

After a year of work at Tsinghua, he was transferred to the Mao Translating Committee to live in the city and back to school on weekends. He is still a graduate student.
The leadership of the Mao Tse Translation Committee is Comrade Xu Yongjian. Introduction to the book to do this work is Tsinghua students Qiao Guanhua comrades.
On the day of the event, after dinner, an old friend hired a rickshaw from the city to congratulate. Guest to go, the book of fear in the book said to me:
He thought I had to do “South study walking.” This is not a good thing to do, not for meritorious service, but for nothing.

GT, :

, . - .
. , , .
, , , , . , , :
, « ». .

:

, , . , . , .
, , .
, , , . , :
, « ». . ; .

Descreva brevemente as esquisitices. Em primeiro lugar, o GT nunca mencionou Zhongshu pelo nome, embora seu nome (“锺书”) apareça três vezes no original. Primeiro, a máquina usa o pronome "ele", na segunda vez em que escreve o livro [livro] e na terceira vez o livro do medo no livro [livro do medo em um livro]. Vá adivinhar! [ na versão russa, o misterioso “livro” aparece uma vez / aprox. perev. ]

A segunda esquisitice - no primeiro parágrafo, é claramente indicado que Zhongshu supervisiona estudantes de pós-graduação, mas o próprio GT fez dele um estudante de pós-graduação.

A terceira peculiaridade é que, na frase Comitê de Tradução Mao Tse, um terço do nome do Presidente Mao [Tse Tung] caiu em algum lugar.

Quarta estranheza - o nome Yongying é substituído por Yongjian.

Quinta estranheza - depois que nosso hóspede partiu [depois de deixar o hóspede], ele simplesmente o substituiu por convidado para ir [convidado para ir].

Sexta estranheza - a última frase é completamente sem sentido.

Seis dessas esquisitices já são suficientes para envergonhar o GT, mas perdoe-o e esqueça. É melhor focar na frase confusa que encontrei no texto - uma frase de cinco caracteres entre aspas do último parágrafo ("南书房行走"). Pode ser traduzido simbolicamente como “a sala de livros do sul para passear”, mas isso é claramente inaceitável, especialmente porque deve ser um substantivo no contexto. A GT inventou o “escritório sul andando” e isso não ajudou.

Admito que a frase chinesa era completamente incompreensível para mim. Literalmente, isso significava algo como andar em um escritório no lado sul de um prédio, mas eu sabia que isso estava errado - no contexto, não fazia sentido. Para traduzir, eu precisava encontrar algo desconhecido para mim na cultura chinesa. E onde eu fui buscar ajuda? Vá para o google! (Mas não para o Google Translate). Digitei caracteres chineses, cercados por aspas, lancei uma busca por uma correspondência exata. E um monte de páginas da web chinesas apareceu de cabeça para baixo na tela, depois das quais eu passei dolorosamente pelos primeiros parágrafos de alguns dos primeiros sites, tentando entender o significado da frase.

Descobri que esse termo remonta à dinastia Qing(1644-1911) e denota um trabalhador mental que ajudou o imperador a compor comunicações oficiais elegantes e trabalhou no escritório do sul do palácio imperial. Dois caracteres, supostamente indicando "dar um passeio", na verdade significam um assistente. Portanto, usando as informações de uma pesquisa no Google, criei a frase "assistente especial do escritório do sul".

É uma pena que o próprio GT não possa usar o serviço de Pesquisa do Google, como eu fiz. Mas, novamente, o GT não é capaz de entender páginas da Web, embora possa traduzi-las em um piscar de olhos. Ou talvez? Em seguida, forneço uma parte incrível do texto que o GT lançou instantaneamente na minha tela depois que eu o alimentei no início do site no qual obtive as informações necessárias:

“Caminhar pelos estudos do sul” não é uma posição oficial; antes da era Qing, isso é apenas um “mensageiro”, geralmente pelos intelectuais imperiais de Hanlin como então imperiais. Estudo sul nas autoridades de Hanlin no "selecione apenas bens de chencai e excelente" para o valor, chamado "estudo sul de caminhada". Por causa da proximidade do imperador, a decisão do imperador de ter uma certa influência. Mais tarde, Yongzheng montou "aeronaves militares", o ministro da máquina militar, em período integral, embora o estudo ainda seja o valor de Hanlin, mas não tenha participação nos assuntos do governo. Estudiosos da dinastia Qing sobre o valor do estudo sul orgulhoso. Muitos estudiosos e estudiosos da dinastia Qing no sul, através do estudo.

É geralmente em inglês? Obviamente, todos podemos concordar que o texto consiste em palavras em inglês (na maior parte), mas segue-se disso que é um texto em inglês? Na minha opinião, como este parágrafo não faz sentido, não é inglês; são apenas ingredientes ingleses colocados aleatoriamente - uma salada aleatória de palavras, um hash desmedido.

Caso você esteja interessado, aqui está a minha versão desta passagem (examinei-a por várias horas):

A posição de Nan Shu Fan Xiaon Zu (assistente especial do Gabinete do Sul) não era oficial, mas no início da Dinastia Qing era um papel especial que o atual estudioso da corte geralmente desempenhava. Um grupo de cientistas que trabalhava no escritório do sul do palácio imperial escolheu entre seu povo grandes talentos e uma boa reputação, de modo que ele escrevia discursos para o imperador e estava sempre em suas instalações; portanto, esse papel foi chamado de "assistente especial do Gabinete do Sul". O assistente, estando próximo do imperador, obviamente conseguiu influenciar suas decisões políticas. No entanto, depois que o imperador Yongzheng fundou o Ministério da Guerra, com o ministro e seus vários subordinados, o assistente do gabinete sul, apesar de servir ao imperador, deixou de desempenhar um papel importante nas decisões do governo. No entanto, os estudiosos da dinastia Qing lutaram para a glória deste cargo e, nos primeiros anos da dinastia, vários estudiosos famosos eram assistentes especiais.

Alguns leitores podem suspeitar que, para criticar duramente o GT, selecionei especialmente passagens que ele tropeçou ativamente e que, de fato, ele lida com a maioria dos textos muito melhor. Parece crível, mas não é. Quase todos os parágrafos que eu selecionei dos livros que estou lendo agora levavam a erros de tradução de todos os tipos e faixas, incluindo frases sem sentido e incompreensíveis, como foram dadas acima.

Obviamente, admito que, às vezes, o GT emite algumas frases que parecem muito boas (embora possam ser enganosas ou simplesmente erradas). Pode até acontecer que um ou dois parágrafos funcionem perfeitamente, criando a ilusão de que o GT entende o que está fazendo, entende o que significa ler. Nesses casos, o GT parece impressionante - quase humano! E todos os elogios estão claramente relacionados aos seus criadores e ao seu trabalho árduo. Mas, ao mesmo tempo, não esqueça o que o GT fez com essas duas passagens chinesas, e antes com os franceses e os alemães. Para entender esses erros, você não deve esquecer o "efeito Eliza". A máquina da língua bayan não lê nada - não no sentido humano do verbo "ler". Ela processa o texto. Personagens processados não estão relacionados à experiência mundana. Ela não tem memória da qual extrair algo, nem imaginação, nem entendimento, nem o significado oculto por trás das palavras com as quais opera tão rapidamente.

* * *

Um amigo me perguntou se as habilidades de GT podem ser consideradas uma simples função de banco de dados. Ele imaginou que, se você aumentar o banco de dados um milhão ou um bilhão de vezes, no final, em princípio, ele será capaz de traduzir tudo o que eles dão e, em essência, é ideal. Eu acho que não. Aumentar a quantidade de "big data" não o aproximará mais do entendimento, pois o entendimento depende da disponibilidade de idéias e a ausência de idéias é a raiz de todos os problemas da tradução automática moderna. Portanto, tenho certeza de que bancos de dados maiores - até mesmo muito maiores - não ajudarão aqui.

Outra questão natural: o uso de redes neurais no GT - imitação do cérebro - nos aproximará da compreensão real pelas máquinas da linguagem. A princípio, isso parece plausível, mas até agora ninguém fez qualquer tentativa de ultrapassar o nível superficial de palavras e frases. Todo tipo de estatística sobre grandes bancos de dados está embutida na rede neural, mas essas estatísticas simplesmente conectam algumas palavras com outras, não com idéias. Não há tentativas de criar estruturas internas que representem idéias, imagens, memórias ou experiências. Tais construções mentais são muito ilusórias para métodos computacionais e, portanto, em vez deles, são utilizados algoritmos rápidos e complexos para o acúmulo estatístico de palavras. Mas os resultados de tais técnicas não se comparam com as idéias que aparecem quando alguém lê, entende, cria, modifica e julga o texto.

Mas, apesar da minha negatividade, o GT fornece um serviço apreciado por muitos: converte rapidamente sentenças significativas escritas na linguagem natural A em linhas de palavras não necessariamente significativas na linguagem B. E enquanto o texto na linguagem B é mais ou menos compreensível, muitas pessoas completamente satisfeitas com o resultado. Se eles conseguem ter a "idéia básica" de uma proposta escrita em um idioma desconhecido, ficam felizes. Para mim, isso não é de modo algum o que a palavra "tradução" significa, mas para algumas pessoas é um ótimo serviço, e para elas é uma tradução. Bem, eu posso entender o que eles precisam e com o que estão felizes. Sorte a eles!

Recentemente, assisti a gráficos de barras desenhados por tecnófilos que alegavam representar a qualidade de uma tradução feita por pessoas e computadores, e que esses gráficos mostram quão próxima a tradução automática está do ser humano. Do meu ponto de vista, essa quantificação de conceitos que não podem ser expressos cheira quantitativamente à pseudociência, ou, se você preferir, aos nerds que tentam trazer para a matemática coisas cuja natureza intangível, sutil e artística os ilude. Na minha opinião, a conclusão atual do GT varia de excelente a grotesco, mas não posso avaliar meus sentimentos sobre isso numericamente. Lembre-se do meu primeiro exemplo, usando os conceitos de "ele" e "ela". O programa impensado traduziu quase todas as palavras corretamente, mas, apesar desse sucesso, não entendeu completamente o significado. E como expressar a qualidade do trabalho numericamente? Usar gráficos pseudo-colunares para representar a qualidade da tradução é simplesmente um abuso dos atributos externos da ciência.

Voltemos ao quadro triste, no qual as pessoas-tradutores serão deixadas para trás em breve, ficarão antiquadas e, no final, se envolverão na revisão. Na melhor das hipóteses, o resultado será um pouco de mediocridade. Um artista sério não começa a trabalhar com o lixo kitsch cheio de erros para fazer uma obra de arte fazendo algumas alterações. Essa não é a natureza da arte. E tradução é uma arte.

Nos meus escritos ao longo dos anos, sempre apoiei a visão de que o cérebro humano é uma máquina; carro muito complexo; e argumentei vigorosamente com aqueles que diziam que as máquinas eram essencialmente incapazes de entender. Existe até uma escola de filosofia que afirma que os computadores nunca "possuirão semântica" porque consistem no "material errado" (silício). Quanto a mim, isso é um absurdo superficial. Aqui não vou entrar em debate, mas não quero impressionar o leitor que acredito que a inteligência e a compreensão nunca estarão disponíveis para os computadores. Se este ensaio suscita tais pensamentos, é apenas porque as tecnologias que discuto não fazem nenhuma tentativa de reproduzir a inteligência humana. Pelo contrário: eles tentam contornar o intelecto, e as passagens resultantes demonstram essas lacunas.

Do meu ponto de vista, não há proibição fundamental de que as máquinas, em princípio, um dia comecem a pensar, se tornem criativas, engraçadas, nostálgicas, alegres, assustadas, entusiasmadas, submissas, cheias de esperança e, como resultado, possam fazer o bem traduções entre idiomas. Não há razões fundamentais para que algum dia eles não consigam traduzir com sucesso piadas, trocadilhos, roteiros, romances, poemas e ensaios como esse. Mas tudo isso aparecerá apenas quando os carros estiverem cheios de idéias, emoções e experiências, como as pessoas. Mas isso ainda não é visível. Eu acredito que isso ainda está muito longe. Pelo menos, essa pessoa espera ardentemente por isso, toda a sua vida admirando as profundezas da mente humana.

Quando, um belo dia, um tradutor mecânico compõe um verso hábil em inglês, usando um iâmbico rítmico de quatro pés, rico em pensamentos, sensualidade e linhas vivas, entendo que é hora de partir.

Google translate short

O programa usa tecnologias avançadas de IA, mas os testes mais simples indicam que ainda está longe de ser um entendimento real

More articles: