📏 🐇 📎 Google traduire court 😀 👩‍🎓 🗳️

Le programme utilise des technologies avancées d'IA, mais les tests les plus simples indiquent qu'il est encore loin d'une réelle compréhension

L'auteur de l'article est Douglas Richard Hofstadter - physicien et informaticien américain; fils du prix Nobel de physique Robert Hofstadter. Il a acquis une renommée mondiale grâce au livre "Godel, Escher, Bach: This Endless Garland", publié en 1979 et en 1980 a reçu le prix Pulitzer dans la catégorie "Non-Fiction".

Un dimanche lors d'une session hebdomadaire de salsa, mon ami Frank a amené un invité du Danemark avec lui. Je savais que Frank parle bien le danois, car sa mère est de là-bas et il vivait enfant au Danemark. Sa petite amie parlait couramment l'anglais, ce qui est considéré comme la norme pour les pays scandinaves. Cependant, à ma grande surprise, dans le processus de communication, il s'est avéré que ce couple échange généralement des e-mails traduits par Google Translate (GT). Frank écrit un message en anglais, parcourt GT pour obtenir du texte danois; elle, au contraire, écrit en danois, puis autorise le GT à traduire le texte en anglais. Comme c'est étrange! Pourquoi deux personnes intelligentes qui parlent la langue de l'autre devraient-elles faire ces choses? Mon expérience de l'utilisation de logiciels de traduction automatique m'a toujours conduit à des évaluations sceptiques de ses capacités. Mais ces deux-là ne partageaient clairement pas mon scepticisme. De nombreuses personnes intelligentes sont fascinées par les capacités des programmes de traduction et trouvent peu de raisons de les critiquer. Ça m'étonne.

J'adore les langues et je fais des traductions avec toute ma passion. Je suis un spécialiste des sciences cognitives et je me suis intéressé aux subtilités du travail de l'esprit humain toute ma vie, donc depuis des décennies j'ai suivi la mécanisation des traductions. J'ai commencé à m'intéresser à cette question au milieu des années 1970, lorsque je suis tombé sur une lettre de 1947 écrite par le mathématicien Warren Weaver , l'un des premiers partisans de la traduction automatique, adressée au fondateur de la cybernétique, Norbert Wiener , dans laquelle Weaver a fait une déclaration intéressante, assez célèbre aujourd'hui:

Quand je regarde un article russe, je dis: «Il est en fait écrit en anglais, juste crypté avec des caractères étranges. Et maintenant, je vais procéder au décryptage. "

Quelques années plus tard, il a proposé un point de vue différent: «Aucune personne raisonnable ne croira que la traduction automatique pourra jamais atteindre l'élégance et le style. Pouchkine ne devrait pas avoir peur. Je me souviens d'une année inoubliable de ma vie consacrée à la traduction d'un brillant roman des poèmes d'Alexandre Pouchkine «Eugene Onegin» dans ma langue maternelle (j'ai radicalement retravaillé le plus grand travail russe, en le transformant en une histoire anglaise dans des poèmes), et je trouve cette remarque de Weaver beaucoup plus vrai que la première vue étrangement simplifiée des langues. Cependant, sa vision de la traduction en 1947 comme décodage est devenue la devise qui a longtemps guidé le domaine de la traduction automatique.

Depuis lors, les traductions automatiques se sont progressivement améliorées et, récemment, l'utilisation de Les «réseaux de neurones profonds» ont même amené certains observateurs à penser (voir les articles «Le grand réveil de l'IA » et « Traduction automatique: au-delà de Babylone ») que les traducteurs humains sont une espèce menacée. Avec cette évolution des événements, les personnes travaillant comme traducteurs se transformeront en simples contrôleurs de qualité et relecteurs de petites erreurs en quelques années, et ne produiront pas de nouveaux textes dans leur intégralité.

Un tel scénario m'aurait provoqué une révolution spirituelle écrasante. Bien que je comprenne le désir d'apprendre aux machines à bien traduire les textes, je ne veux pas voir comment les morts remplaceront les traducteurs humains. Cette idée me fait peur et me dégoûte. À mon avis, la traduction est un art incroyablement raffiné, nécessitant constamment de nombreuses années d'expérience et d'imagination créative. Si un «beau» jour, les traducteurs humains deviennent des reliques du passé, mon respect pour l'esprit humain sera ébranlé, et ce choc me laissera dans une confusion et une tristesse incroyables.

Chaque fois que je lis un article sur la façon dont la guilde des traducteurs humains sera bientôt obligée de baisser la tête devant l'épée terriblement rapide d'une nouvelle technologie, je ressens le besoin de vérifier ces déclarations moi-même, en particulier par crainte que ce cauchemar ne soit déjà venu très proche, et aussi en raison de l'espoir et du désir de me convaincre qu'il n'est pas si proche, et, enfin, en raison de ma croyance de longue date dans la nécessité de lutter contre l'exagération des réalisations de l'IA. Par conséquent, après avoir lu comment l'ancienne idée des réseaux de neurones artificiels, récemment adoptée par la division de Google appelée Google Brain, et améliorée à l'aide d'une «formation approfondie», a conduit à l'émergence d'un nouveau type de programme qui aurait fait une «révolution» dans les traductions automatiques, je J'ai réalisé que je devais vérifier la dernière version de GT. Est-il vrai qu'elle a changé le domaine des traductions dans la façon dont Deep Blue et AlphaGo ont réussi à le faire dans le domaine de jeux vénérables comme les échecs et le go?

J'ai découvert que même si l'ancienne version de GT fonctionnait avec un très large éventail de langues, la nouvelle fonctionnait d'abord avec seulement neuf - vrai, puis a étendu l'ensemble à 96. J'ai limité mes recherches à des langues prises en charge comme l'anglais, le français, l'allemand et le chinois [ nous ajouterons pour le plaisir et langue russe / env. perev. ]

Avant la démonstration des découvertes, il convient de mentionner l'ambiguïté du mot «profond». Lorsqu'une personne apprend comment Google a acheté DeepMind, qui a produit des «réseaux de neurones profonds» avec un «apprentissage profond», il perçoit immédiatement ces noms en termes de «remarquable», «capable de beaucoup», «perspicace», «sage». De plus, le mot «profond» signifie seulement le fait que ces réseaux de neurones ont plus de couches (disons, 12) que les versions plus anciennes, qui pouvaient en avoir deux ou trois. S'agit-il d'une telle profondeur qu'un tel réseau a une sorte de sagesse? À peine. Il s'agit d'un PR verbal.

Je me méfie beaucoup de la GT, surtout à cause du battage médiatique qui l'entoure. Mais, malgré l'hostilité, j'avoue l'existence de faits étonnants liés à ce produit que je n'aime pas. Il est disponible gratuitement pour tous sur Terre et peut convertir du texte dans l'une des presque cent langues en texte dans n'importe quelle autre langue. C'est digne de respect. Si je m'appelle fièrement «pi-lingual» (c'est-à-dire que le nombre total de langues que je connais est légèrement supérieur à trois, c'est ma façon humoristique de répondre à la question «combien de langues connaissez-vous»), alors combien plus un GT peut-il être fier de lui-même, s'il peut se faire appeler «acheter-lingual» («acheter» en mandarin signifie 100). Le païen est très impressionné par le bayazianisme. De plus, si je copie une page dans la langue A dans GT, il ne faut que quelques secondes pour obtenir une page à partir de mots dans la langue B. Et tout cela se produit tout le temps, sur des écrans du monde entier, dans des dizaines de langues.

Les avantages pratiques du GT et des technologies similaires ne peuvent être niés, et en principe, ils nous profitent, mais dans cette approche, quelque chose ne suffit clairement pas, et cela peut être décrit en un mot: comprendre. La traduction automatique ne s'est jamais concentrée sur la compréhension de la langue. Au lieu de cela, ils ont toujours essayé de faire du «décryptage» dans ce domaine - c'est-à-dire de faire face à la tâche, sans se soucier de ce que sont la compréhension et la signification. Se pourrait-il que la compréhension ne soit pas nécessaire pour une bonne traduction? Quelqu'un, une personne ou une machine peut-il produire une traduction de haute qualité sans prêter attention au sens de la langue? Pour faire la lumière sur cette question, nous nous tournons vers les expériences que j'ai faites.

* * *

Je commencerai ma recherche par des exemples modestes - par une courte remarque, qui provoque immédiatement une idée claire chez une personne:

Dans leur maison, tout vient par paires. Il y a sa voiture et sa voiture, ses serviettes et ses serviettes, et sa bibliothèque et la sienne.

Traduction GT:
Dans leur maison, tout vient par paires. Il y a sa voiture et sa voiture, des serviettes et des serviettes, ainsi que sa bibliothèque et la sienne.

Traduction humaine:
Dans leur maison, tout a son propre couple. Il y a sa voiture, et sa voiture, ses serviettes et ses serviettes, sa bibliothèque et elle.

La tâche de traduction semble sans ambiguïté, mais en français (et dans d’autres langues romanes ) les mots «lui» et «elle», indiquant des choses, ne sont pas mis dans le genre du propriétaire, mais dans le genre de chose lui-même. Voici ce que GT m'a donné:

Dans leur maison, tout vient en paires. Il y a sa voiture et sa voiture, ses serviettes et ses serviettes, sa bibliothèque et les siennes.

Le programme est tombé dans mon piège, ne comprenant pas comment une personne aurait compris que j'ai décrit un couple qui avait son truc pour chacun de ses trucs. Par exemple, un réseau neuronal d'apprentissage en profondeur a utilisé le mot sa à la fois pour sa machine et pour sa machine, nous ne pouvons donc rien dire sur le domaine du propriétaire de la machine. De la même manière, elle a utilisé le mot asexué ses pour le pluriel de «ses serviettes» et «ses serviettes», et dans ce dernier cas, avec les bibliothèques, elle a été confondue par la dernière lettre s dans la sienne, et elle a en quelque sorte décidé ce que signifie s pluriel (les siennes). La proposition, traduite par GT en français, a perdu son sens.

J'ai ensuite moi-même traduit cette phrase en français, afin qu'elle conserve son sens d'origine. Voici ma version:

Chez eux, ils ont tout en double. Il y a sa voiture à elle et sa voiture à lui, ses serviettes à elle et ses serviettes à lui, sa bibliothèque à elle et sa bibliothèque à lui.

L'expression sa voiture à elle signifie «sa voiture» et sa voiture à lui signifie sa voiture. Après cela, j'ai décidé que ce serait une tâche triviale pour GT de traduire ma traduction française en anglais et d'obtenir la bonne version anglaise - mais je me suis sérieusement trompé. Voici ce qu'il m'a donné:

Chez eux, ils ont tout en double. Il y a sa propre voiture et sa propre voiture, ses propres serviettes et ses propres serviettes, sa propre bibliothèque et sa propre bibliothèque.

Quoi, désolé? Même si la phrase d’entrée indique explicitement le sexe des propriétaires, la machine à traduire a ignoré ces affirmations et a tout attribué au sexe masculin. Pourquoi a-t-elle jeté les informations les plus importantes de la proposition?

Les gens savent beaucoup de choses sur les couples, les maisons, les effets personnels, la fierté, la rivalité, la jalousie, la vie personnelle et bien d'autres choses intangibles qui conduisent à des caprices tels que des serviettes avec «lui» et «elle» brodés. GT de telles subtilités sont inconnues. GT subtilités généralement inconnues. Il ne connaît que des lignes composées de mots composés de lettres. Il est engagé dans le traitement ultra-rapide de morceaux de texte, il ne pense pas, ne représente pas, ne se souvient pas, ne comprend pas. Il ne sait même pas que les mots signifient des choses. Je m'empresse de déclarer qu'en principe, un programme informatique pourrait découvrir pourquoi un langage est nécessaire, et qu'il pourrait avoir des idées, de la mémoire et de l'expérience, et qu'il pourrait les utiliser - mais GT n'a pas été conçu pour cela. De tels objectifs n'étaient pas dans les plans de ses développeurs.

En général, j'ai ri des résultats, soulagé de voir que nous n'avions pas failli remplacer les traducteurs par des machines. Mais il me semblait encore que cela valait la peine d'étudier la voiture plus en détail. Une gorgée de soif ne s'éteint pas.

Et au fait, qu'en est-il de cette phrase - «on a soif de ne pas étancher sa soif» (faisant allusion, bien sûr, au dicton « une hirondelle ne fait pas un été» - le mot hirondelle est également traduit par «une gorgée», et comme une "hirondelle". Dans la version anglaise, une hirondelle ne fait pas l'été. / traduction approximative. ] Je n'ai pas pu m'empêcher de le vérifier. Et voici ce que GT m'a donné: "Une hirondelle n'aspire pas la soif" [ GT a donné au russe "une hirondelle ne désaltère pas" / traduction approximative. ]. Grammaticalement cette phrase est française, mais elle est difficile à comprendre. Premièrement, elle mentionne un oiseau (une hirondelle - hirondelle) a), alors il est dit que l'oiseau n'inspire pas ou ne suce pas (n'aspire pas), et enfin, il est indiqué que ce que l'oiseau n'aspire pas c'est la soif (la soif). GT n'a clairement pas compris le sens de la phrase - elle a simplement émis un tas de merde de taureau. "Il sortait simplement avec un tas de taureaux." "Il vient de sortir avec un tas de taureaux." "Il vient de sortir avec un tas de taureaux." Pardonnez mon français - ou plutôt, pseudo-français GT.

* * *

Du feu français, nous sautons dans le feu allemand. Récemment, je suis plongé dans le livre Sie nannten sich der Wiener Kreis (Ils s'appelaient le cercle de Vienne) du mathématicien autrichien Karl Sigmund. Elle décrit un groupe d'intellectuels idéalistes de Vienne dans les années 1920 et 1930 qui ont sérieusement influencé la philosophie et la science dans la seconde moitié du XXe siècle. J'ai sélectionné une petite phrase du livre de Sigmund et l'ai donnée à GT. La voici, d'abord en allemand, puis vient ma traduction, puis GT. (Au fait, j'ai vérifié ma traduction avec deux locuteurs natifs allemands, dont Karl Sigmund - afin qu'elle puisse être considérée comme exacte).

Sigmund:

Nach dem verlorenen Krieg sahen es viele deutschnationale Professoren, inzwischen die Mehrheit in der Fakultät, gewissermaßen als ihre Pflicht an, die Hochschulen vor den «Ungeraden» zu bewahren; suis schutzlosesten waren junge Wissenschaftler vor ihrer Habilitation. Und wissenschaftlerinnen kamen sowieso nicht in frage; über wenig homme de guerre sich einiger.

Hofstadter:

Après la défaite, de nombreux professeurs de tendance pan-germanique, qui constituaient à l'époque la majorité des professeurs, considéraient qu'il était à peu près de leur devoir de protéger les établissements d'enseignement supérieur contre les «indésirables». Les plus susceptibles d'être licenciés étaient les jeunes universitaires qui n'avaient pas encore obtenu le droit d'enseigner à l'université. Quant aux femmes universitaires, eh bien, elles n'avaient aucune place dans le système; rien de plus clair que ça.

Google Translate:

Après la guerre perdue, de nombreux professeurs de nationalité allemande, alors que la majorité de la faculté, se considéraient comme leur devoir de garder les universités de «l'étrange»; Les jeunes scientifiques étaient les plus vulnérables avant leur habilitation. Et les scientifiques n'ont pas remis en question de toute façon; Il y en avait peu.

GT, russe:

Après la guerre perdue, de nombreux professeurs de nationalité allemande, désormais majoritaires à la faculté, ont jugé de leur devoir de protéger les universités de "l'étrange"; les plus vulnérables étaient les jeunes scientifiques avant leur habilitation. Et les femmes scientifiques n'avaient aucun doute; il y en avait plusieurs.

Russe humain:

Après la défaite, de nombreux professeurs enclins au nationalisme allemand (et à cette époque, ils étaient majoritaires dans la direction de la faculté) ont estimé qu'il était de leur devoir de protéger les établissements d'enseignement supérieur contre les «éléments indésirables». Très probablement, les jeunes scientifiques qui n'avaient pas encore obtenu le droit d'enseigner pourraient être refusés. Pour les femmes scientifiques, il n'y avait aucune place dans ce système; c'était plus clair que clair.

La traduction GT se compose de mots anglais (pour une raison inconnue, quelques-uns pour une raison quelconque commencent par une majuscule). Jusqu'ici tout va bien! Mais bientôt toute la traduction commence à devenir floue, et plus elle va loin, plus elle devient floue.

Prenez d'abord le "impair" impair - étrange, impair, non apparié]. Cela correspond au dé allemand "Ungeraden", qui signifie "personnes indésirables pour des raisons politiques". Mais la GT avait une raison - pure statistique - d'utiliser le mot "impair". À savoir: dans son énorme base de données bilingue, le mot ungerade se traduit presque toujours comme étrange. Bien que la voiture ne comprenne pas pourquoi, je peux expliquer. En effet, ungerade - qui signifie littéralement «indirect» ou «inégal» - signifie presque toujours «étrange». Et mon choix du mot indésirables n'a rien à voir avec les statistiques de mots, mais vient de ma compréhension de la situation - comprendre une idée qui n'est pas directement indiquée dans le texte et qui n'est présente dans la liste des options de traduction pour ungerade dans aucun des dictionnaires allemands.

Passons à Habilitation, qui dénote le statut d'un enseignant, ressemblant à un membre du personnel de l'institut. L'habilitation en papier calque anglais [qualifié] existe, mais est rarement utilisée et ne rappelle certainement pas les employés à temps plein. Par conséquent, j'ai brièvement expliqué cette idée et je n'ai pas utilisé un mot rare, car une telle approche mécanique ne donnerait rien aux lecteurs anglophones. Bien sûr, GT ne le fera jamais; il n'a pas de modèle de connaissance pour ses lecteurs.

Les deux dernières phrases démontrent clairement l'importance cruciale de la compréhension pour une traduction correcte. Le mot allemand de 15 lettres Wissenschaftler signifie «scientifique» ou «scientifique» [«scientifique» / «savant»]. J'ai choisi cette dernière option, car elle désigne tous les intellectuels en général. GT n'a pas reconnu ces subtilités. Le mot Wissenschaftlerin associé à 17 lettres dans la dernière phrase, au pluriel, Wissenschaftlerinnen est une conséquence de l'utilisation de l'accouchement dans les noms allemands. Un nom court se réfère grammaticalement au genre masculin, donc il signifie un scientifique masculin, et un nom long se réfère à une femme, et n'est applicable qu'aux femmes. Par conséquent, j'ai écrit "des femmes scientifiques". GT, quant à lui, ne comprenait pas que le suffixe féminin -in était le principal de la phrase. Comme il ne comprenait pas que les femmes étaient exclues de la considération, la machine a simplement utilisé une fois de plus le mot «scientifique», manquant complètement le point de la phrase [il est intéressant que GT l'ait traduit plus correctement en russe / env. perev. ]. Comme pour les Français, GT ne savait pas que le seul but de la proposition allemande était de faire ressortir le contraste entre hommes et femmes.

Eh bien, outre cette erreur, le reste de la dernière phrase est un cauchemar complet. Prenez la première partie. Est-ce que «les scientifiques n'ont pas remis en question de toute façon» est vraiment la traduction de «Wissenschaftlerinnen kamen sowieso nicht in frage»? Ils ne coïncident absolument pas dans leur sens. La phrase se compose simplement de mots anglais maîtrisés sur la base de l'allemand. Et quoi, est-ce suffisant pour décrire un certain texte de sortie comme une «traduction»? [ dans la version de traduction en russe, le cauchemar persiste / env. perev. ]

La deuxième partie est tout aussi erronée. Les six derniers mots en allemand signifient littéralement «peu était plus uni» ou, plus facilement, «il y en avait peu pour lesquels le consentement des gens était plus fort» [«plus peu était un plus uni» / «il y avait peu quelles personnes étaient plus d'accord »] - cependant, GT a transformé cette idée claire en« il y en avait plusieurs »[à peu près les mêmes en anglais et en russe / env. perev. ]. Les personnes perplexes peuvent demander «qui étaient plusieurs?», Mais pour un auditeur mécanique, cette question n'aurait pas de sens. La GT n'a aucune idée de ce qui se passe dans les coulisses et il n'aurait pas pu répondre à une question apparemment simple.Le programme de traduction n'imaginait pas de grandes ou petites quantités ou nombres ou choses. Elle a juste jeté des symboles, sans la moindre idée qu'ils pouvaient symboliser quelque chose.

* * *

Il est très difficile pour une personne qui a acquis de l'expérience, de la compréhension et de l'utilisation de mots de manière significative toute sa vie de comprendre à quel point le contenu du mot est jeté à l'écran par la machine GT. Il est presque impossible pour les gens de résister à l'hypothèse que les logiciels qui fonctionnent si bien avec les mots devraient comprendre leur signification. Cette illusion classique liée à l'IA est appelée « effet Eliza», car l'un des premiers programmes qui a fait croire aux gens qu'il semblait comprendre l'anglais était l'inutile manipulateur de phrases ELIZA qui prétendait être psychothérapeute dans les années 1960. Beaucoup de gens qui ont interagi avec le programme ont créé un sentiment surnaturel qu'elle comprenait leurs sentiments profonds.

Pendant des décennies, les gens intelligents - même les chercheurs en IA - sont tombés sous l'influence de l'effet Eliza. Pour empêcher mes lecteurs de tomber dans ce piège, permettez-moi de citer quelques phrases du texte ci-dessus - "GT n'a pas compris", "ne s'est pas rendu compte", "GT n'avait aucune idée." Il est ironique que, bien que ces phrases insistent sur un manque de compréhension, elles font presque allusion au fait que le GT peut, au moins parfois, comprendre le sens d'un mot, d'une phrase ou d'une phrase. Mais ce n'est pas le cas. GT contourne simplement la question de la compréhension de la langue.

Pour moi, le mot "traduction" a une aura mystérieuse qui évoque des souvenirs. Il dénote une forme d'art extrêmement humaine qui transforme gracieusement des idées claires du langage A en des idées claires du langage B.Ce réseautage devrait non seulement maintenir la clarté, mais aussi transmettre les nuances, les nuances et les caractéristiques distinctives du style d'écriture de l'auteur original. Lorsque je fais de la traduction, je lis d'abord attentivement le texte original, j'apprends les idées aussi clairement que possible et je les laisse traîner dans mon esprit. Ce ne sont pas des mots qui pataugent dans l’esprit - des idées qui évoquent toutes sortes d’idées connexes, créant un halo riche à partir des scénarios qui les accompagnent dans ma tête. La majeure partie de ce halo, bien sûr, est dans l'inconscient. Ce n'est que lorsque le halo dans ma conscience est suffisamment éveillé que je commence à essayer de l'exprimer - «évincer» - dans une deuxième langue.J'essaie de dire dans la langue B ce qui me semble naturel pour la langue B de parler de telles situations qui constituent le halo de sens qui est en discussion.

En général, je ne passe pas des mots et des phrases du langage A aux mots et aux phrases du langage B. Au lieu de cela, j'appelle inconsciemment des images, des scènes, des idées, mon expérience (ou l'expérience que j'ai lue, vue dans les films, entendue par des amis ), et seulement lorsqu'il s'agit d'un «halo» mental non verbal, figuratif, expérimenté - c'est seulement alors que je commence le processus de formulation de mots et d'expressions dans la langue cible, puis que je modifie, modifie et modifie. Ce processus, qui est médiatisé par le sens, peut sembler lent - et, bien sûr, par rapport à deux secondes par page sur GT, c'est ce qu'il est - mais c'est précisément tout traducteur sérieux qui l'utilise. J'imagine quelque chose comme ça quand j'entends l'expression «esprit profond».

* * *

Compte tenu de tout cela, je vais me tourner vers le chinois, une langue qui est beaucoup plus agaçante avec les logiciels d'apprentissage en profondeur que les deux langues européennes. Pour vérification, j'ai choisi les mémoires émouvantes de Women Sa ("Les trois d'entre nous") - dramaturge et traductrice chinoise Yang Jiang , récemment décédée à l'âge de 104 ans. Dans le livre, elle rappelle l'imbrication de la vie d'elle-même, de son mari Qian Zhongshu (également écrivain et traducteur) et de leur fille. Il n'est pas écrit de manière très complexe, mais utilise une langue chinoise vivante et très instruite. J'ai choisi un petit passage et mis une GT dessus. Voici les résultats, ainsi que ma traduction:

:

锺书到清华工作一年后，调任毛选翻译委员会的工作，住在城里，周末回校。他仍兼管研究生。
毛选翻译委员会的领导是徐永煐同志。介绍锺书做这份工作的是清华同学乔冠华同志。
事定之日，晚饭后，有一位旧友特雇黄包车从城里赶来祝贺。客去后，锺书惶恐地对我说：

他以为我要做“南书房行走”了。这件事不是好做的，不求有功，但求无过。

:

After Zhongshu had worked at Tsinghua University for a year, he was transferred to the committee that was translating selected works of Chairman Mao. He lived in the city, but each weekend he would return to school. He also was still supervising his graduate students.
The leader of the translation committee of Mao's works was Comrade Xu Yongying, and the person who had arranged for Zhongshu to do this work was his old Tsinghua schoolmate, Comrade Qiao Guanhua.
On the day this appointment was decided, after dinner, an old friend specially hired a rickshaw and came all the way from the city just to congratulate Zhongshu. After our guest had left, Zhongshu turned to me uneasily and said:
“He thought I was going to become a 'South Study special aide.' This kind of work is not easy. You can't hope for glory; all you can hope for is to do it without errors.”

Google Translate:

After a year of work at Tsinghua, he was transferred to the Mao Translating Committee to live in the city and back to school on weekends. He is still a graduate student.
The leadership of the Mao Tse Translation Committee is Comrade Xu Yongjian. Introduction to the book to do this work is Tsinghua students Qiao Guanhua comrades.
On the day of the event, after dinner, an old friend hired a rickshaw from the city to congratulate. Guest to go, the book of fear in the book said to me:
He thought I had to do “South study walking.” This is not a good thing to do, not for meritorious service, but for nothing.

GT, :

, . - .
. , , .
, , , , . , , :
, « ». .

:

, , . , . , .
, , .
Le jour où ce rendez-vous a été approuvé, après le dîner, un vieil ami a spécialement loué un pousse-pousse et n'est venu de la ville que pour féliciter personnellement Zhongshu. Après le départ de l'invité, Zhongshu s'est tourné vers moi et m'a dit avec inquiétude:
Il pensait que je deviendrais «un assistant spécial du Cabinet Sud». C'est un travail difficile. Espérer la gloire n'est pas nécessaire; On ne peut qu'espérer l'absence d'erreurs.

Décrivez brièvement les bizarreries. Premièrement, GT n'a jamais mentionné Zhongshu par son nom, bien que son nom («锺书») apparaisse trois fois dans l'original. Premièrement, la machine utilise le pronom «il», la deuxième fois qu'elle écrit le livre [livre], et la troisième fois le livre de peur dans le livre [livre de peur dans un livre]. Allez devinez! [ dans la version russe, le mystérieux «livre» apparaît une fois / env. perev. ]

Deuxième bizarrerie - dans le premier paragraphe, il est clairement indiqué que Zhongshu dirige les étudiants diplômés, mais GT lui-même en a fait un étudiant diplômé.

La troisième bizarrerie est que dans l'expression Comité de traduction de Mao Tse, un tiers du nom du président Mao [Tse Tung] est tombé quelque part.

Quatrième étrangeté - le nom Yongying est remplacé par Yongjian.

Cinquième bizarrerie - après le départ de notre invité [après avoir quitté notre invité], il l'a simplement remplacé par l'invité pour aller [l'invité pour aller].

Sixième étrangeté - la dernière phrase n'a aucun sens.

Six de ces bizarreries suffisent déjà pour faire honte à la GT, mais pardonnez-leur et oubliez. Il vaut mieux se concentrer sur la phrase déroutante que j'ai rencontrée dans le texte - une phrase de cinq caractères entourée de guillemets du dernier paragraphe ("南书房行走"). Il peut être traduit symboliquement par «la salle sud des livres pour se promener», mais cela est clairement inacceptable, d'autant plus que ce devrait être un nom dans son contexte. GT a inventé le «bureau qui marche vers le sud», et cela n'a pas aidé.

J'avoue que la phrase chinoise était complètement incompréhensible pour moi. Littéralement, cela signifiait quelque chose comme marcher dans un bureau du côté sud d'un immeuble, mais je savais que c'était faux - dans le contexte, cela n'avait aucun sens. Pour traduire, j'avais besoin de trouver quelque chose qui m'était inconnu dans la culture chinoise. Et où suis-je allé chercher de l'aide? Allez sur google! (Mais pas sur Google Translate). J'ai saisi des caractères chinois, entourés de guillemets, lancé une recherche d'une correspondance exacte. Et un tas de pages Web chinoises a surgi tête baissée dans l'écran, après quoi j'ai pataugé péniblement à travers les premiers paragraphes de quelques premiers sites, essayant de comprendre le sens de l'expression.

J'ai découvert que ce terme remonte à la dynastie Qing(1644-1911), et dénote un travailleur mental qui a aidé l'empereur à composer des communications officielles élégantes, et a travaillé dans le bureau sud du palais impérial. Deux personnages, censés indiquer «allez vous promener», signifient en fait un assistant. Par conséquent, en utilisant les informations d'une recherche Google, j'ai trouvé l'expression "assistant spécial du bureau sud".

Il est dommage que la GT elle-même ne puisse pas utiliser le service de recherche Google, comme je l'ai fait. Mais encore une fois, GT n'est pas en mesure de comprendre les pages Web, bien qu'il puisse les traduire en un clin d'œil. Ou peut-être? Ensuite, je donne un morceau de texte incroyable que GT a instantanément jeté sur mon écran après l'avoir alimenté au début du site Web à partir duquel j'ai obtenu les informations nécessaires:

«La marche d'étude du Sud» n'est pas une position officielle, avant l'ère Qing, ce n'est qu'un «messager», généralement utilisé par les intellectuels impériaux de l'époque, Hanlin. Étude du sud dans les fonctionnaires de Hanlin dans la «sélection de biens chencai uniquement et excellente» dans la valeur, appelée «marche d'étude sud». En raison de la proximité de l'empereur, la décision de l'empereur d'avoir une certaine influence. Yongzheng a ensuite mis en place un «avion militaire», le ministre de la machine militaire, à plein temps, bien que l'étude porte toujours sur la valeur de Hanlin, mais n'a aucune participation aux affaires gouvernementales. Les érudits de la dynastie Qing dans la valeur de l'étude du Sud sont fiers. De nombreux érudits et érudits du début de la dynastie Qing dans le sud grâce à l'étude.

Est-ce généralement en anglais? Bien sûr, nous pouvons tous convenir que le texte est composé de mots anglais (pour la plupart), mais en résulte-t-il qu'il s'agit d'un texte anglais? À mon avis, puisque ce paragraphe n'a pas de sens, il n'est pas en anglais; c'est juste des ingrédients anglais placés au hasard - une salade de mots au hasard, un hachage décousu.

Au cas où vous seriez intéressé, voici ma version de ce passage (je l'ai parcouru pendant plusieurs heures):

Le poste de Nan Shu Fan Xiaon Zu (assistant spécial du Cabinet Sud) n'était pas officiel, mais au début de la dynastie Qing, c'était un rôle spécial que l'érudit actuel de la cour jouait habituellement. Un groupe de scientifiques travaillant dans le bureau sud du palais impérial a choisi parmi leur peuple de grands talents et une bonne réputation, de sorte qu'il a écrit des discours pour l'empereur et était toujours chez lui; par conséquent, ce rôle a été appelé «l'assistant spécial du Cabinet Sud». L'assistant, étant proche de l'empereur, a évidemment pu influencer ses décisions politiques. Cependant, après que l' empereur Yongzheng a fondé le ministère de la Guerre, avec le ministre et ses divers subordonnés, l'assistant du cabinet du Sud, en dépit de servir l'empereur, a cessé de jouer un rôle majeur dans la prise de décisions gouvernementales. Cependant, les érudits de la dynastie Qing ont lutté pour la gloire de ce poste, et dans les premières années de la dynastie, plusieurs érudits célèbres étaient des assistants spéciaux.

Certains lecteurs peuvent soupçonner que, afin de critiquer sévèrement la GT, j'ai spécialement sélectionné de tels passages sur lesquels il est activement tombé et qu'en fait il résiste beaucoup mieux à la plupart des textes. Cela semble crédible, mais ce n'est pas le cas. Presque chaque paragraphe que j'ai sélectionné dans les livres que je lis maintenant a conduit à des erreurs de traduction de toutes sortes et de toutes sortes, y compris des phrases dénuées de sens et incompréhensibles comme celles données ci-dessus.

Bien sûr, j'avoue que parfois la GT émet quelques phrases qui sonnent plutôt bien (même si elles peuvent être trompeuses ou tout simplement erronées). Il peut même arriver qu'un ou deux paragraphes fonctionnent parfaitement, créant l'illusion que le GT comprend ce qu'il fait, comprend ce que signifie lire. Dans de tels cas, la GT a l'air impressionnante - presque humaine! Et tous les éloges se rapportent clairement à ses créateurs et à leur travail acharné. Mais en même temps, n'oubliez pas ce que GT a fait avec ces deux passages chinois, et plus tôt avec le français et l'allemand. Pour comprendre ces erreurs, il ne faut pas oublier «l'effet Eliza». La machine en langue bayan ne lit rien - pas au sens humain du verbe "lire". Elle traite le texte. Les personnages traités ne sont pas liés à l'expérience du monde. Elle n'a ni mémoire d'où puiser quoi que ce soit, ni imagination, ni compréhension, ni le sens caché derrière les mots avec lesquels elle opère si vite.

* * *

Un ami m'a demandé si les compétences GT pouvaient être considérées comme une simple fonction de base de données. Il a pensé que si vous augmentez la base de données un million ou un milliard de fois, à la fin, en principe, il sera capable de traduire tout ce qu'ils donnent, et en substance, c'est l'idéal. Je ne pense pas. Augmenter la quantité de «big data» ne vous rapprochera pas de la compréhension, car la compréhension dépend de la disponibilité des idées, et l'absence d'idées est à l'origine de tous les problèmes de la traduction automatique moderne. Je suis donc sûr que de plus grandes bases de données - même beaucoup plus grandes - ne seront pas utiles ici.

Autre question naturelle: l'utilisation des réseaux de neurones en GT - imitation du cerveau - nous rapprochera-t-elle d'une réelle compréhension par les machines du langage. Au début, cela semble plausible, mais jusqu'à présent, personne n'a tenté de dépasser le niveau superficiel des mots et des phrases. Toutes sortes de statistiques sur d'énormes bases de données sont intégrées dans le réseau neuronal, mais ces statistiques relient simplement certains mots à d'autres, pas des idées. Il n'y a aucune tentative de créer des structures internes qui représenteraient des idées, des images, des souvenirs ou de l'expérience. De telles constructions mentales sont trop insaisissables pour les méthodes de calcul et, par conséquent, au lieu d'elles, des algorithmes rapides et complexes pour l'accumulation statistique de mots sont utilisés. Mais les résultats de ces techniques ne sont pas comparables à l'idée d'avoir des idées qui apparaissent lorsque quelqu'un lit, comprend, crée, modifie et juge le texte.

Mais malgré ma négativité, GT fournit un service apprécié par beaucoup: il convertit rapidement des phrases significatives écrites en langage naturel A en lignes de mots pas nécessairement significatives en langage B. Et tandis que le texte en langue B est plus ou moins compréhensible, beaucoup les gens sont entièrement satisfaits du résultat. S'ils peuvent obtenir «l'idée de base» d'une proposition rédigée dans une langue inconnue, ils sont heureux. Pour moi, ce n'est pas du tout ce que signifie le mot "traduction", mais pour certaines personnes, c'est un excellent service, et pour elles, c'est une traduction. Eh bien, je peux comprendre ce dont ils ont besoin et ce dont ils sont satisfaits. Heureusement!

J'ai récemment regardé des graphiques à barres dessinés par des technophiles prétendant représenter la qualité d'une traduction faite par des personnes et des ordinateurs, et que ces graphiques montrent à quel point la traduction automatique est proche de l'homme. De mon point de vue, une telle quantification de concepts qui ne peuvent pas être exprimés quantitativement sent la pseudoscience, ou, si vous voulez, les nerds essayant d'apporter aux mathématiques ces choses dont la nature artistique intangible, subtile leur échappe. À mon avis, la conclusion d'aujourd'hui de GT va de l'excellent au grotesque, mais je ne peux pas évaluer mes sentiments à ce sujet numériquement. Rappelez-vous mon premier exemple, en utilisant les concepts de «lui» et «elle». Le programme irréfléchi a traduit presque tous les mots correctement, mais malgré ce succès, il n'a pas complètement compris le sens. Et comment exprimer numériquement la qualité du travail? L'utilisation de pseudo-colonnes pour représenter la qualité de la traduction est tout simplement un abus des attributs externes de la science.

Revenons à la triste image, dans laquelle les traducteurs seront bientôt laissés pour compte, deviendront démodés et, finalement, seront engagés dans la relecture. Dans le meilleur des cas, le résultat sera un peu de médiocrité. Un artiste sérieux ne commence pas à travailler avec des ordures kitsch pleines d'erreurs afin de faire une œuvre d'art en faisant quelques changements. Ce n'est pas la nature de l'art. Et la traduction est un art.

Dans mes écrits au fil des ans, j'ai toujours soutenu l'idée que le cerveau humain est une machine; voiture très complexe; et j'ai discuté vigoureusement avec ceux qui ont dit que les machines étaient essentiellement incapables de comprendre. Il existe même une école de philosophie qui déclare que les ordinateurs ne «posséderont jamais de sémantique» car ils sont constitués de «mauvais matériau» (silicium). Pour moi, c'est un non-sens superficiel. Ici, je n'entrerai pas dans le débat, mais je ne veux pas impressionner le lecteur que je pense que l'intelligence et la compréhension ne seront jamais disponibles pour les ordinateurs. Si cet essai suscite de telles réflexions, c'est uniquement parce que les technologies dont je parle ne tentent pas de reproduire l'intelligence humaine. Au contraire: ils essaient de contourner l'intellect, et les passages qui en résultent démontrent ces lacunes béantes.

De mon point de vue, il n'y a aucune interdiction fondamentale que les machines, en principe, commencent un jour à penser, deviennent créatives, drôles, nostalgiques, joyeuses, effrayées, enthousiastes, soumises, pleines d'espoir et, par conséquent, pourraient faire du bien traductions entre langues. Il n'y a aucune raison fondamentale pour laquelle un jour ils ne seraient pas en mesure de traduire avec succès des blagues, des jeux de mots, des scripts, des romans, des poèmes et des essais comme celui-ci. Mais tout cela n'apparaîtra que lorsque les voitures seront remplies d'idées, d'émotions et d'expérience, comme les gens. Mais ce n'est pas encore visible. Je pense que c'est encore très loin. Au moins, cette personne espère ardemment cela, toute sa vie en admirant les profondeurs de l'esprit humain.

Quand, un beau jour, un traducteur mécanique compose un roman de vers habile en anglais, en utilisant un iambique clair et rythmique de quatre pieds riche en pensées, sensualité et lignes vives, je comprendrai qu'il est temps pour moi de partir.

Google traduire court

Le programme utilise des technologies avancées d'IA, mais les tests les plus simples indiquent qu'il est encore loin d'une réelle compréhension

More articles: