Google übersetzt kurz

Das Programm verwendet fortschrittliche KI-Technologien, aber die einfachsten Tests zeigen, dass es noch weit von einem wirklichen Verständnis entfernt ist




Der Autor des Artikels ist Douglas Richard Hofstadter - amerikanischer Physiker und Informatiker; Sohn des Nobelpreisträgers für Physik Robert Hofstadter. Weltweit bekannt wurde er durch das 1979 erschienene Buch "Godel, Escher, Bach: Diese endlose Girlande", das 1980 den Pulitzer-Preis in der Kategorie "Sachbücher" erhielt.

An einem Sonntag bei einer wöchentlichen Salsa-Session brachte mein Freund Frank einen Gast aus Dänemark mit. Ich wusste, dass Frank gut Dänisch spricht, weil seine Mutter von dort stammt und er als Kind in Dänemark lebte. Seine Freundin sprach fließend Englisch, was in den skandinavischen Ländern als Norm gilt. Zu meiner Überraschung stellte sich jedoch bei der Kommunikation heraus, dass dieses Paar normalerweise E-Mails austauscht, die von Google Translate (GT) übersetzt wurden. Frank schreibt eine Nachricht auf Englisch, durchläuft GT, um dänischen Text zu erhalten. Im Gegenteil, sie schreibt auf Dänisch und erlaubt dann der GT, den Text ins Englische zu übersetzen. Wie seltsam! Warum sollten zwei kluge Leute, die die Sprache des anderen sprechen, diese Dinge tun? Meine Erfahrung mit maschineller Übersetzungssoftware hat mich immer zu skeptischen Einschätzungen ihrer Fähigkeiten geführt. Aber diese beiden teilten eindeutig nicht meine Skepsis. Viele intelligente Menschen sind fasziniert von den Fähigkeiten von Übersetzungsprogrammen und finden wenig Grund, sie zu kritisieren. Es wundert mich.

Ich liebe Sprachen und übersetze mit all meiner Leidenschaft. Ich bin ein Spezialist für Kognitionswissenschaft und habe mich mein ganzes Leben lang für die Feinheiten der Arbeit des menschlichen Geistes interessiert. Deshalb verfolge ich seit Jahrzehnten die Mechanisierung von Übersetzungen. Ich habe mich Mitte der 1970er Jahre zum ersten Mal für diese Ausgabe interessiert, als ich auf einen Brief des Mathematikers Warren Weaver aus dem Jahr 1947 stieß, der an den Begründer der Kybernetik, Norbert Wiener , gerichtet war und in dem Weaver eine interessante Aussage machte, die heute ziemlich berühmt ist:
Wenn ich mir einen russischen Artikel ansehe, sage ich: „Er ist tatsächlich in Englisch geschrieben und nur mit seltsamen Zeichen verschlüsselt. Und jetzt werde ich mit der Entschlüsselung fortfahren. "
Einige Jahre später schlug er einen anderen Standpunkt vor: „Kein vernünftiger Mensch wird glauben, dass maschinelle Übersetzung jemals in der Lage sein wird, Eleganz und Stil zu erreichen. Puschkin sollte keine Angst haben. " Ich erinnere mich an ein unvergessliches Jahr meines Lebens, in dem ich einen brillanten Roman in Alexander Puschkins Gedichten „Eugene Onegin“ in meine Muttersprache übersetzt habe (ich habe das größte russische Werk radikal überarbeitet und es in Gedichten in eine englische Geschichte verwandelt), und ich finde diese Bemerkung von Weaver viel mehr wahr als die erste, seltsam vereinfachte Sicht der Sprachen. Seine Sicht der Übersetzung als Dekodierung von 1947 wurde jedoch zum Motto, das das Gebiet der maschinellen Übersetzung seit langem bestimmt.

Seitdem wurden maschinelle Übersetzungen schrittweise verbessert und in jüngster Zeit auch sogenannte "Tiefe neuronale Netze" veranlassten sogar einige Beobachter zu der Annahme (siehe die Artikel "Das große Erwachen der KI " und " Maschinelle Übersetzung: Jenseits von Babylon "), dass menschliche Übersetzer eine gefährdete Spezies sind. Mit dieser Entwicklung von Veranstaltungen werden Menschen, die als Übersetzer arbeiten, in wenigen Jahren zu einfachen Qualitätsprüfern und Korrekturlesern kleiner Fehler und produzieren keine neuen Texte in ihrer Gesamtheit.

Ein solches Szenario hätte mir eine vernichtende spirituelle Revolution beschert. Obwohl ich den Wunsch verstehe, Maschinen das gute Übersetzen von Texten beizubringen, möchte ich nicht sehen, wie tote Menschen menschliche Übersetzer ersetzen. Diese Idee macht mir Angst und ekelt mich an. Meiner Meinung nach ist Übersetzung eine unglaublich raffinierte Kunst, die ständig langjährige Erfahrung und kreative Fantasie erfordert. Wenn an einem „schönen“ Tag menschliche Übersetzer zu Relikten der Vergangenheit werden, wird mein Respekt vor dem menschlichen Geist erschüttert, und dieser Schock wird mich in unglaublicher Verwirrung und Traurigkeit zurücklassen.

Jedes Mal, wenn ich einen Artikel darüber lese, wie die Gilde der menschlichen Übersetzer bald gezwungen sein wird, den Kopf vor dem furchtbar schnellen Schwert einer neuen Technologie zu beugen, habe ich das Bedürfnis, diese Aussagen selbst zu überprüfen, insbesondere aus Angst, dass dieser Albtraum bereits sehr aufgetaucht ist eng, und auch wegen der Hoffnung und des Wunsches, mich davon zu überzeugen, dass er nicht so nah ist, und schließlich wegen meines langjährigen Glaubens an die Notwendigkeit, die Übertreibung der Errungenschaften der KI zu bekämpfen. Nachdem ich gelesen hatte, wie die alte Idee der künstlichen neuronalen Netze, die kürzlich von der Google-Abteilung namens Google Brain übernommen und mithilfe von "eingehendem Training" verbessert wurde, zur Entstehung eines neuen Programmtyps führte, der angeblich eine "Revolution" bei maschinellen Übersetzungen auslöste, I. Mir wurde klar, dass ich die neueste Version von GT überprüfen muss. Stimmt es, dass sie das Übersetzungsfeld so verändert hat, wie es Deep Blue und AlphaGo im Bereich ehrwürdiger Spiele wie Schach und Los geschafft haben?

Ich fand heraus, dass die alte Version von GT zwar mit einer sehr großen Auswahl an Sprachen arbeitete, die neue jedoch zuerst mit nur neun - wahr, dann erweiterte ich das Set auf 96. Ich beschränkte meine Forschung auf unterstützte Sprachen wie Englisch, Französisch, Deutsch und Chinesisch [ wir werden zum Spaß hinzufügen und russische Sprache / ca. perev. ]]

Vor der Demonstration von Entdeckungen ist die Mehrdeutigkeit des Wortes "tief" zu erwähnen. Wenn eine Person erfährt, wie Google die Firma DeepMind gekauft hat, die "Deep Neural Networks" mit "Deep Learning" produziert hat, nimmt sie diese Namen sofort in den Bedeutungen "herausragend", "zu viel fähig", "aufschlussreich", "weise" wahr. Darüber hinaus bedeutet das Wort "tief" nur die Tatsache, dass diese neuronalen Netze mehr Schichten (z. B. 12) haben als ältere Versionen, die zwei oder drei haben könnten. Folgt es aus einer solchen Tiefe, dass ein solches Netzwerk irgendeine Art von Weisheit hat? Kaum. Dies ist verbale PR.

Ich bin dem GT gegenüber sehr misstrauisch, besonders wegen des Hype, der ihn umgibt. Aber trotz der Feindseligkeit gebe ich zu, dass es erstaunliche Fakten zu diesem Produkt gibt, die ich nicht mag. Es steht jedem auf der Erde kostenlos zur Verfügung und kann Text in einer von fast hundert Sprachen in Text in einer anderen Sprache konvertieren. Es verdient Respekt. Wenn ich mich stolz als "mehrsprachig" bezeichne (das heißt, die Gesamtzahl der Sprachen, die ich kenne, ist etwas mehr als drei, ist meine humorvolle Art, die Frage "Wie viele Sprachen kennen Sie" zu beantworten), wie viel mehr kann ein GT stolz auf sich selbst sein? wenn er sich "buy-lingual" nennen kann ("buy" in Mandarin bedeutet 100). Der heidnische Mann ist sehr beeindruckt vom Bayazianismus. Wenn ich eine Seite in Sprache A in GT kopiere, dauert es außerdem nur wenige Sekunden, um eine Seite aus Wörtern in Sprache B zu erhalten. Und das alles geschieht ständig auf Bildschirmen rund um den Planeten in Dutzenden von Sprachen.

Die praktischen Vorteile von GT und ähnlichen Technologien können nicht geleugnet werden, und im Prinzip kommen sie uns zugute, aber bei diesem Ansatz reicht etwas eindeutig nicht aus, und dies kann mit einem Wort beschrieben werden: Verständnis. Die maschinelle Übersetzung konzentrierte sich nie darauf, die Sprache zu verstehen. Stattdessen haben sie immer versucht, in diesem Bereich eine „Entschlüsselung“ durchzuführen - das heißt, um die Aufgabe zu bewältigen, ohne sich um das Verständnis und die Bedeutung zu kümmern. Könnte es sein, dass für eine gute Übersetzung kein Verständnis erforderlich ist? Kann jemand, eine Person oder eine Maschine eine qualitativ hochwertige Übersetzung herausgeben, ohne auf die Bedeutung der Sprache zu achten? Um dieses Problem zu beleuchten, wenden wir uns den Experimenten zu, die ich durchgeführt habe.

* * *

Ich werde meine Forschung mit bescheidenen Beispielen beginnen - mit einer kurzen Bemerkung, die bei einer Person sofort eine klare Vorstellung hervorruft:
In ihrem Haus kommt alles paarweise. Es gibt sein Auto und ihr Auto, seine Handtücher und ihre Handtücher und seine Bibliothek und ihre.

GT Übersetzung:
In ihrem Haus kommt alles paarweise. Es gibt sein Auto und ihr Auto, Handtücher und Handtücher sowie seine Bibliothek und ihre.

Menschliche Übersetzung:
In ihrem Haus hat alles sein eigenes Paar. Da ist sein Auto und ihr Auto, seine Handtücher und ihre Handtücher, seine Bibliothek und sie.
Die Übersetzungsaufgabe scheint eindeutig zu sein, aber in Französisch (und anderen romanischen Sprachen ) werden die Wörter "er" und "sie", die auf Dinge hinweisen, nicht in die Art des Besitzers, sondern in die Art der Sache selbst gestellt. Folgendes hat mir GT gegeben:
Dans leur maison, tout vient en paires. Il ya sa voiture et sa voiture, ses serviettes et ses serviettes, sa bibliothèque et les siennes.
Das Programm geriet in meine Falle und verstand nicht, wie jemand verstanden hätte, dass ich ein Paar beschrieb, das ihr Ding für jedes seiner Dinge hatte. Zum Beispiel hat ein tief lernendes neuronales Netzwerk das Wort sa sowohl für seine Maschine als auch für seine Maschine verwendet, sodass wir nichts über das Feld des Besitzers der Maschine sagen können. Auf die gleiche Weise benutzte sie das asexuelle Wort ses für den Plural von „seinen Handtüchern“ und „ihren Handtüchern“, und im letzteren Fall war sie bei den Bibliotheken durch die letzten Buchstaben in ihren verwirrt, und sie entschied irgendwie, wofür s steht Plural (les siennes). Der von GT ins Französische übersetzte Vorschlag verlor seine Bedeutung.

Dann habe ich diesen Satz selbst ins Französische übersetzt, damit er seine ursprüngliche Bedeutung behält. Hier ist meine Version:
Chez eux, ils ont tout en double. Il ya sa voiture à elle et sa voiture à lui, ses serviettes à elle et ses serviettes à lui, sa bibliothèque à elle et sa bibliothèque à lui.
Der Ausdruck sa voiture à elle bedeutet "ihr Auto", und sa voiture à lui bedeutet sein Auto. Danach entschied ich, dass es für GT eine triviale Aufgabe sein würde, meine französische Übersetzung wieder ins Englische zu übersetzen und die richtige englische Version zu erhalten - aber ich habe mich ernsthaft geirrt. Folgendes gab er mir:
Zu Hause haben sie alles doppelt. Es gibt sein eigenes Auto und sein eigenes Auto, seine eigenen Handtücher und seine eigenen Handtücher, seine eigene Bibliothek und seine eigene Bibliothek.
Wie bitte? Obwohl der Eingabesatz ausdrücklich das Geschlecht der Eigentümer angibt, ignorierte die Übersetzungsmaschine diese Behauptungen und schrieb alles dem männlichen Geschlecht zu. Warum hat sie die wichtigsten Informationen aus dem Vorschlag weggeworfen?

Die Menschen wissen viel über Paare, Häuser, persönliche Gegenstände, Stolz, Rivalität, Eifersucht, persönliches Leben und viele andere immaterielle Dinge, die zu Unwägbarkeiten wie Handtüchern mit gestickten „ihm“ und „ihr“ führen. GT solche Feinheiten sind unbekannt. GT allgemein unbekannte Feinheiten. Er kennt nur Zeilen, die aus Wörtern bestehen, die aus Buchstaben bestehen. Er beschäftigt sich mit der ultraschnellen Verarbeitung von Textstücken, er denkt nicht, repräsentiert nicht, erinnert sich nicht, versteht nicht. Er weiß nicht einmal, dass Worte Dinge bedeuten. Ich beeile mich zu erklären, dass ein Computerprogramm im Prinzip herausfinden könnte, warum eine Sprache benötigt wird, Ideen, Gedächtnis und Erfahrung haben und diese verwenden könnte - aber GT wurde nicht dafür entwickelt. Solche Ziele standen nicht in den Plänen der Entwickler.

Im Allgemeinen lachte ich über die Ergebnisse und war erleichtert zu sehen, dass wir nicht annähernd Übersetzer durch Maschinen ersetzt hatten. Trotzdem schien es mir, dass es sich lohnte, das Auto genauer zu studieren. Ein Schluck Durst löscht nicht.

Übrigens, was ist mit diesem Satz - "ein Durst, um seinen Durst nicht zu stillen" (was natürlich auf das Sprichwort " eine Schwalbe macht keinen Sommer" hinweist ) - das Wort " Schwalbe macht nicht" wird auch als "ein Schluck" übersetzt. und wie eine "Schwalbe". In der englischen Version macht eine Schwalbe keinen Sommer. / ungefähr übersetzt. ] Ich konnte nicht anders, als es zu überprüfen. Und hier ist, was GT mir gab: "Une hirondelle n'aspire pas la soif" [ GT gab Russisch "eine Schwalbe löscht keinen Durst" / ca. übersetzt. ] Grammatisch ist dieser Satz französisch, aber schwer zu verstehen. Erstens erwähnt er einen Vogel (une hirondelle - Schwalbe) a), dann wird gesagt, dass der Vogel nicht einatmet oder nicht saugt (n'aspire pas), und schließlich wird angezeigt, dass das, was der Vogel nicht ansaugt, Durst ist (la soif). GT hat die Bedeutung des Ausdrucks eindeutig nicht verstanden - er hat einfach ausgegeben ein Haufen Bullenscheiße. »Il sortait simplement avec un tas de taureaux.« »Er ist nur mit einem Haufen Bullen ausgegangen.« »Il vient de sortir a tc de taureaux.« Verzeihen Sie mein Französisch - oder besser gesagt Pseudo-Französisch GT.

* * *

Vom französischen Feuer springen wir ins deutsche Feuer. Kürzlich tauche ich in das Buch Sie nannte sich der Wiener Kreis des österreichischen Mathematikers Karl Sigmund ein. Sie beschreibt eine Gruppe idealistischer Intellektueller aus Wien in den 1920er und 1930er Jahren, die in der zweiten Hälfte des 20. Jahrhunderts Philosophie und Wissenschaft ernsthaft beeinflussten. Ich wählte einen kleinen Satz aus Sigmunds Buch und gab ihn GT. Hier ist es, zuerst auf Deutsch, dann kommt meine Übersetzung, dann GT. (Übrigens habe ich meine Übersetzung mit zwei deutschen Muttersprachlern überprüft, darunter Karl Sigmund - damit sie als korrekt angesehen werden kann).
Sigmund:

Nach dem verlorenen Krieg gehört es viele deutschnationale Professoren, die die in der Fakultät, die Gleichheit als ihre Pflicht, die Hochschulen vor den Ungeraden zu haben; am schutzlosesten waren junge junge vor ihrer Habilitation. Und wissenschaftlerinnen kamen gehört nicht in frage; über wenig war man sich gehört.

Hofstadter:

Nach der Niederlage betrachteten es viele Professoren mit pan-germanistischen Neigungen, die zu dieser Zeit die Mehrheit der Fakultät bildeten, als ihre Pflicht, die Hochschulen vor „unerwünschten“ Aktivitäten zu schützen. Am wahrscheinlichsten wurden junge Wissenschaftler entlassen, die noch nicht das Recht hatten, Universitätsklassen zu unterrichten. Wissenschaftlerinnen hatten überhaupt keinen Platz im System; nichts war klarer als das.

Google Translate:

Nach dem verlorenen Krieg sahen sich viele deutsch-nationale Professoren, inzwischen die Mehrheit an der Fakultät, als ihre Pflicht, die Universitäten von den „Ungeraden“ fernzuhalten. Junge Wissenschaftler waren vor ihrer Habilitation am anfälligsten. Und Wissenschaftler stellten sowieso keine Fragen; Es gab nur wenige von ihnen.

GT, russisch:

Nach dem verlorenen Krieg betrachteten es viele deutsch-nationale Professoren, inzwischen die Mehrheit an der Fakultät, als ihre Pflicht, die Universitäten vor dem "Fremden" zu schützen. Am anfälligsten waren junge Wissenschaftler vor ihrer Habilitation. Und die Wissenschaftlerinnen hatten immer noch keinen Zweifel; es gab mehrere von ihnen.

Menschliches Russisch:

Nach der Niederlage betrachteten es viele Professoren, die für den deutschen Nationalismus anfällig waren (und zu diesem Zeitpunkt gab es die Mehrheit in der Fakultätsleitung), als ihre Pflicht, Hochschuleinrichtungen vor „unerwünschten Elementen“ zu schützen. Höchstwahrscheinlich konnten junge Wissenschaftler, die noch kein Lehrrecht erworben hatten, abgelehnt werden. Für Wissenschaftlerinnen gab es überhaupt keinen Platz in diesem System; es war klarer als klar.
Die GT-Übersetzung besteht aus englischen Wörtern (aus einem unbekannten Grund beginnen einige aus irgendeinem Grund mit einem Großbuchstaben). So weit so gut! Aber bald beginnt die gesamte Übersetzung zu verschwimmen, und je weiter sie geht, desto verschwommener wird sie.

Nehmen Sie zuerst die "ungerade" seltsam - seltsam, seltsam, ungepaart]. Dies entspricht dem deutschen Würfel "Ungeraden", was "aus politischen Gründen unerwünschte Menschen" bedeutet. Aber der GT hatte einen Grund - reine Statistik - das Wort "ungerade" zu verwenden. Nämlich: In seiner riesigen zweisprachigen Datenbank wird das Wort ungerade fast immer als seltsam übersetzt. Obwohl das Auto nicht versteht warum, kann ich erklären. Dies liegt daran, dass Ungerade - wörtlich übersetzt "indirekt" oder "ungleichmäßig" - fast immer "ungerade" bedeutet. Und meine Wahl des Wortes unerwünscht hat nichts mit Wortstatistik zu tun, sondern beruht auf meinem Verständnis der Situation - dem Verständnis einer Idee, die nicht direkt im Text angegeben ist und in der Liste der Übersetzungsoptionen für Ungerade in keinem der deutschen Wörterbücher enthalten ist.

Fahren wir mit der Habilitation fort, die den Status eines Lehrers bezeichnet, der einem Mitarbeiter des Instituts ähnelt. Die Habilitation von englischem Transparentpapier [qualifiziert] ist vorhanden, wird jedoch nur selten verwendet und erinnert sicherlich nicht an Vollzeitbeschäftigte. Deshalb habe ich diese Idee kurz erklärt und nicht nur ein seltenes Wort verwendet, da ein solcher mechanischer Ansatz den englischsprachigen Lesern nichts geben würde. Natürlich wird GT das niemals tun, es hat kein Wissensmodell für seine Leser.

Die letzten beiden Sätze zeigen deutlich, wie wichtig das Verständnis für eine korrekte Übersetzung ist. Das aus 15 Buchstaben bestehende deutsche Wort Wissenschaftler bedeutet "Wissenschaftler" oder "Wissenschaftler". Ich habe die letztere Option gewählt, da sie alle Intellektuellen im Allgemeinen bezeichnet. GT hat diese Feinheiten nicht erkannt. Das zugehörige 17-Buchstaben-Wort Wissenschaftlerin im letzten Satz, Plural, Wissenschaftlerinnen, ist eine Folge der Verwendung der Geburt in deutschen Substantiven. Ein kurzes Substantiv bezieht sich grammatikalisch auf das männliche Geschlecht, bedeutet also einen männlichen Wissenschaftler, und ein langes Substantiv bezieht sich auf eine Frau und gilt nur für Frauen. Deshalb schrieb ich "Wissenschaftlerinnen". GT verstand unterdessen nicht, dass das weibliche Suffix -in das wichtigste im Satz war. Da er nicht verstand, dass Frauen von der Betrachtung ausgeschlossen waren, verwendete die Maschine einfach noch einmal das Wort „Wissenschaftlerin“, wobei der ganze Punkt des Satzes völlig verfehlt wurde [es ist interessant, dass GT ihn korrekter ins Russische übersetzte / ca. perev. ]. Wie bei den Franzosen hatte GT keine Ahnung, dass der einzige Zweck des deutschen Vorschlags darin bestand, den Kontrast zwischen Männern und Frauen hervorzuheben.

Abgesehen von diesem Fehler ist der Rest des letzten Satzes ein Albtraum. Nimm den ersten Teil. Ist "Wissenschaftler haben sowieso nicht in Frage gestellt" wirklich die Übersetzung von "Wissenschaftlerinnen kamen nicht in Frage"? Sie stimmen in ihrer Bedeutung absolut nicht überein. Der Satz besteht einfach aus englischen Wörtern, die auf Deutsch beherrscht werden. Und was, reicht dies aus, um einen bestimmten Ausgabetext als „Übersetzung“ zu beschreiben? [ In der Version der Übersetzung ins Russische bleibt der Albtraum bestehen / ca. perev. ]]

Der zweite Teil ist genauso falsch. Die letzten sechs Wörter auf Deutsch bedeuten wörtlich "wenig war mehr vereint" oder, glatter gesagt, "es gab wenige, für die die Zustimmung der Menschen stärker war" ["über wenig war eins mehr vereint" / "es gab wenig über welche Leute waren sich mehr einig “] - GT verwandelte diese klare Idee jedoch in„ es gab mehrere “[ ungefähr gleich auf Englisch und Russisch / ca. perev. ]. Verblüffte Menschen mögen fragen: "Wer waren mehrere?", Aber für einen mechanischen Zuhörer wäre diese Frage nicht sinnvoll. Der GT hat keine Ahnung, was sich hinter den Kulissen abspielt, und er hätte eine scheinbar einfache Frage nicht beantworten können.Das Übersetzungsprogramm stellte sich keine großen oder kleinen Mengen oder Zahlen oder Dinge vor. Sie warf nur Symbole, ohne die geringste Ahnung zu haben, dass sie etwas symbolisieren könnten.

* * *

Es ist sehr schwierig für eine Person, die ihr ganzes Leben lang Erfahrung gesammelt, verstanden und Wörter sinnvoll verwendet hat, zu verstehen, wie leer der Inhalt des Wortes von der GT-Maschine auf den Bildschirm geworfen wird. Es ist fast unmöglich für Menschen, der Annahme zu widerstehen, dass Software, die so gut mit Wörtern funktioniert, ihre Bedeutung verstehen sollte. Diese klassische KI-bezogene Illusion wird als „ Eliza-Effekt “ bezeichnet, da eines der ersten Programme, bei denen die Leute glaubten, Englisch zu verstehen, der nutzlose ELIZA-Phrasenmanipulator war, der sich in den 1960er Jahren als Psychotherapeut ausgab. Viele Menschen, die mit dem Programm interagierten, erzeugten ein übernatürliches Gefühl, dass sie ihre tiefen Gefühle verstand.

Seit Jahrzehnten stehen kluge Köpfe - sogar KI-Forscher - unter dem Einfluss des Eliza-Effekts. Um zu verhindern, dass meine Leser in diese Falle tappen, möchte ich einige Sätze aus dem obigen Text zitieren: „GT hat nicht verstanden“, „hat nicht erkannt“, „GT hatte keine Ahnung.“ Es ist ironisch, dass diese Sätze, obwohl sie auf einem Mangel an Verständnis bestehen, fast auf die Tatsache hinweisen, dass der GT zumindest manchmal die Bedeutung eines Wortes, einer Phrase oder eines Satzes verstehen kann. Aber das ist nicht so. GT umgeht einfach die Frage des Sprachverständnisses.

Für mich hat das Wort "Übersetzung" eine mysteriöse Aura, die Erinnerungen hervorruft. Es bezeichnet eine äußerst menschliche Kunstform, die klare Vorstellungen von Sprache A in klare Vorstellungen von Sprache B verwandelt. Diese Vernetzung sollte nicht nur Klarheit bewahren, sondern auch die Schattierungen, Nuancen und Besonderheiten des Schreibstils des ursprünglichen Autors vermitteln. Wenn ich übersetze, lese ich zuerst sorgfältig den Originaltext, lerne die Ideen so klar wie möglich und lasse sie in meinem Kopf hängen. Es sind keine Worte, die im Kopf zappeln - Ideen, die alle möglichen verwandten Ideen hervorrufen und aus den begleitenden Szenarien in meinem Kopf einen reichen Heiligenschein erzeugen. Der größte Teil dieses Heiligenscheines befindet sich natürlich im Unbewussten. Erst wenn der Heiligenschein in meinem Bewusstsein ausreichend geweckt ist, versuche ich, ihn in einer zweiten Sprache auszudrücken - „herausdrücken“.Ich versuche in Sprache B zu sagen, was mir für Sprache B natürlich erscheint, über solche Situationen zu sprechen, die den Halo der Bedeutung ausmachen, über den diskutiert wird.

Im Allgemeinen gehe ich nicht von Wörtern und Phrasen der Sprache A zu Wörtern und Phrasen der Sprache B über. Stattdessen rufe ich unbewusst Bilder, Szenen, Ideen, meine Erfahrung (oder die Erfahrung, die ich gelesen, in Filmen gesehen und von Freunden gehört habe) auf ) und nur dann, wenn es sich um einen nonverbalen, figurativen, erfahrenen, mentalen „Heiligenschein“ handelt - erst dann beginne ich mit der Formulierung von Wörtern und Phrasen in der Zielsprache und bearbeite, bearbeite und bearbeite. Dieser Prozess, der durch Bedeutung vermittelt wird, mag langsam erscheinen - und im Vergleich zu zwei Sekunden pro Seite bei GT ist dies natürlich das, was er ist -, aber genau jeder ernsthafte Übersetzer verwendet ihn. Ich stelle mir so etwas vor, wenn ich den Satz „Deep Mind“ höre.

* * *

Angesichts all dessen werde ich mich dem Chinesischen zuwenden, einer Sprache, die mit Deep-Learning-Software viel ärgerlicher ist als die beiden europäischen Sprachen. Zur Überprüfung habe ich die berührenden Memoiren von Women Sa ("Die drei von uns") ausgewählt - der chinesischen Dramatikerin und Übersetzerin Yang Jiang , die kürzlich im Alter von 104 Jahren verstorben ist. In dem Buch erinnert sie sich an die Verflechtung ihres Lebens, ihres Mannes Qian Zhongshu (ebenfalls Schriftsteller und Übersetzer) und ihrer Tochter. Es ist nicht sehr kompliziert geschrieben, sondern verwendet eine lebendige und gut ausgebildete chinesische Sprache. Ich wählte eine kleine Passage und setzte einen GT darauf. Hier sind die Ergebnisse zusammen mit meiner Übersetzung:
:

锺书到清华工作一年后,调任毛选翻译委员会的工作,住在城里,周末回校。 他仍兼管研究生。
毛选翻译委员会的领导是徐永煐同志。介绍锺书做这份工作的是清华同学乔冠华同志。
事定之日,晚饭后,有一位旧友特雇黄包车从城里赶来祝贺。客去后,锺书惶恐地对我说:

他以为我要做“南书房行走”了。这件事不是好做的,不求有功,但求无过。

:

After Zhongshu had worked at Tsinghua University for a year, he was transferred to the committee that was translating selected works of Chairman Mao. He lived in the city, but each weekend he would return to school. He also was still supervising his graduate students.
The leader of the translation committee of Mao's works was Comrade Xu Yongying, and the person who had arranged for Zhongshu to do this work was his old Tsinghua schoolmate, Comrade Qiao Guanhua.
On the day this appointment was decided, after dinner, an old friend specially hired a rickshaw and came all the way from the city just to congratulate Zhongshu. After our guest had left, Zhongshu turned to me uneasily and said:
“He thought I was going to become a 'South Study special aide.' This kind of work is not easy. You can't hope for glory; all you can hope for is to do it without errors.”

Google Translate:

After a year of work at Tsinghua, he was transferred to the Mao Translating Committee to live in the city and back to school on weekends. He is still a graduate student.
The leadership of the Mao Tse Translation Committee is Comrade Xu Yongjian. Introduction to the book to do this work is Tsinghua students Qiao Guanhua comrades.
On the day of the event, after dinner, an old friend hired a rickshaw from the city to congratulate. Guest to go, the book of fear in the book said to me:
He thought I had to do “South study walking.” This is not a good thing to do, not for meritorious service, but for nothing.

GT, :

, . - .
. , , .
, , , , . , , :
, « ». .

:

, , . , . , .
, , .
An dem Tag, an dem dieser Termin genehmigt wurde, stellte ein alter Freund nach dem Abendessen speziell eine Rikscha ein und kam aus der Stadt, um Zhongshu persönlich zu gratulieren. Nachdem der Gast gegangen war, wandte sich Zhongshu an mich und sagte besorgt:
Er dachte, ich würde "ein besonderer Assistent des Südkabinetts" werden. Das ist harte Arbeit. Auf Ruhm zu hoffen ist nicht notwendig; Man kann nur auf die Abwesenheit von Fehlern hoffen.
Beschreiben Sie kurz die Kuriositäten. Erstens hat GT Zhongshu nie namentlich erwähnt, obwohl sein Name („锺 书“) im Original dreimal vorkommt. Erstens verwendet die Maschine das Pronomen „er“, das zweite Mal schreibt sie das Buch [Buch] und das dritte Mal das Buch der Angst im Buch [Buch der Angst in einem Buch]. Ratet mal! [ In der russischen Fassung erscheint das mysteriöse „Buch“ einmal / ca. perev. ]]

Die zweite Kuriosität - im ersten Absatz wird deutlich, dass Zhongshu die Doktoranden führt, aber GT selbst hat ihn zu einem Doktoranden gemacht.

Die dritte Kuriosität - in der Formulierung Mao Tse Translation Committee [Übersetzungskomitee von Mao Zedong] fiel ein Drittel des Namens des Vorsitzenden Mao [Mao Tse Tung] irgendwo ab.

Vierte Seltsamkeit - der Name Yongying wird durch Yongjian ersetzt.

Fünfte Kuriosität - nachdem unser Gast gegangen war [nachdem er unseren Gast verlassen hatte], ersetzten sie ihn einfach durch Gast zu gehen [Gast zu gehen].

Sechste Fremdheit - der letzte Satz ist völlig bedeutungslos.

Sechs dieser Kuriositäten reichen bereits aus, um den GT zu beschämen, aber verzeihen Sie sie und vergessen Sie sie. Es ist besser, sich auf die verwirrende Phrase zu konzentrieren, auf die ich im Text gestoßen bin - eine fünfstellige Phrase, die in Anführungszeichen aus dem letzten Absatz ("南 书房 行走") eingeschlossen ist. Es kann symbolisch übersetzt werden als „der südliche Raum der Bücher, in dem man spazieren gehen kann“, aber dies ist eindeutig inakzeptabel, zumal es im Kontext ein Substantiv sein sollte. GT hat das "Walking South Office" erfunden, und das hat nicht geholfen.

Ich gebe zu, dass der chinesische Ausdruck für mich völlig unverständlich war. Wörtlich bedeutete es so etwas wie ein Spaziergang in einem Büro an der Südseite eines Gebäudes, aber ich wusste, dass dies falsch war - in dem Zusammenhang ergab es keinen Sinn. Um zu übersetzen, musste ich etwas finden, das mir in der chinesischen Kultur unbekannt war. Und wo habe ich Hilfe gesucht? Gehe zu Google! (Aber nicht zu Google Translate). Ich gab chinesische Schriftzeichen ein, umgeben von Anführungszeichen, und startete eine Suche nach einer genauen Übereinstimmung. Und ein paar chinesische Webseiten tauchten kopfüber auf dem Bildschirm auf. Danach blätterte ich schmerzhaft durch die ersten Absätze einiger der ersten Websites und versuchte, die Bedeutung des Ausdrucks zu verstehen.

Ich entdeckte, dass dieser Begriff aus der Qing-Dynastie stammt(1644–1911) und bezeichnet einen Geistesarbeiter, der dem Kaiser beim Verfassen stilvoller offizieller Mitteilungen half und im südlichen Büro des Kaiserpalastes arbeitete. Zwei Zeichen, die angeblich "spazieren gehen" bedeuten, bedeuten tatsächlich einen Assistenten. Aus diesem Grund habe ich anhand von Informationen aus einer Google-Suche den Ausdruck "Spezialassistent aus dem südlichen Büro" gefunden.

Schade, dass der GT selbst den Google-Suchdienst nicht wie ich nutzen kann. Aber auch hier kann GT Webseiten nicht verstehen, obwohl es sie in einen Augenblick übersetzen kann. Oder vielleicht? Als nächstes gebe ich einen erstaunlichen Text, den GT sofort auf meinen Bildschirm warf, nachdem ich ihm den Anfang der Website gegeben hatte, von der ich die notwendigen Informationen erhielt:
"South Study Walking" ist keine offizielle Position, vor der Qing-Ära ist dies nur ein "Bote", als den die damaligen kaiserlichen Intellektuellen Hanlin dienen. Südstudie in den Hanlin-Beamten in der "ausgewählten Chencai nur Waren und ausgezeichnet" in den Wert, genannt "Südstudie Gehen". Wegen der Nähe zum Kaiser, der Entscheidung des Kaisers, einen gewissen Einfluss zu haben. Yongzheng richtete später "Militärflugzeuge", den Minister der Militärmaschine, in Vollzeit ein, obwohl die Studie noch Hanlin in den Wert ist, aber keine Beteiligung an Regierungsangelegenheiten hat. Gelehrte der Qing-Dynastie über den Wert des Südens studieren stolz. Viele Gelehrte und Gelehrte der frühen Qing-Dynastie in den Süden durch die Studie.
Ist es allgemein in Englisch? Natürlich können wir uns alle einig sein, dass der Text (größtenteils) aus englischen Wörtern besteht, aber folgt daraus, dass es sich um einen englischen Text handelt? Meiner Meinung nach ist dieser Absatz nicht englisch, da er keinen Sinn ergibt. Es sind nur zufällig platzierte englische Zutaten - ein zufälliger Wortsalat, ein weitläufiger Hasch.

Falls Sie interessiert sind, hier ist meine Version dieser Passage (ich habe einige Stunden darüber nachgedacht):
Die Position des Nan Shu-Fans Xiaon Zu (Sonderassistent des Südkabinetts) war nicht offiziell, aber in der frühen Qing-Dynastie war es eine besondere Rolle, die der derzeitige Hofgelehrte normalerweise spielte. Eine Gruppe von Wissenschaftlern, die im südlichen Büro des Kaiserpalastes arbeiteten, wählte unter ihren Leuten große Talente und einen guten Ruf aus, so dass er Reden für den Kaiser schrieb und immer in seinen Räumlichkeiten war; Daher wurde diese Rolle als "Sonderassistent des Südkabinetts" bezeichnet. Der dem Kaiser nahe stehende Assistent konnte offensichtlich seine politischen Entscheidungen beeinflussen. Nachdem Kaiser Yongzheng zusammen mit dem Minister und seinen verschiedenen Untergebenen das Kriegsministerium gegründet hatte, spielte der Assistent des Südkabinetts trotz seines Dienstes am Kaiser keine wichtige Rolle mehr bei Regierungsentscheidungen. Die Gelehrten der Qing-Dynastie kämpften jedoch um den Ruhm dieses Postens, und in den frühen Jahren der Dynastie waren mehrere berühmte Gelehrte besondere Assistenten.
Einige Leser könnten vermuten, dass ich, um den GT scharf zu kritisieren, speziell solche Passagen ausgewählt habe, über die er aktiv gestolpert ist, und dass er tatsächlich mit den meisten Texten viel besser zurechtkommt. Es klingt glaubwürdig, ist es aber nicht. Fast jeder Absatz, den ich aus den Büchern ausgewählt habe, die ich gerade lese, führt jetzt zu Übersetzungsfehlern aller Art und Farben, einschließlich der oben angegebenen bedeutungslosen und unverständlichen Sätze.

Natürlich gebe ich zu, dass der GT manchmal ein paar Sätze herausgibt, die ziemlich gut klingen (obwohl sie irreführend oder einfach falsch sein können). Es kann sogar vorkommen, dass ein oder zwei Absätze perfekt funktionieren und die Illusion entstehen, dass der GT versteht, was er tut, versteht, was es bedeutet, zu lesen. In solchen Fällen sieht der GT beeindruckend aus - fast menschlich! Und alle Lobeshymnen beziehen sich eindeutig auf seine Schöpfer und ihre harte Arbeit. Vergessen Sie aber nicht, was GT mit diesen beiden chinesischen Passagen und früher mit Französisch und Deutsch gemacht hat. Um diese Fehler zu verstehen, sollten Sie den „Eliza-Effekt“ nicht vergessen. Die Maschine in Bayan-Sprache liest nichts - nicht im menschlichen Sinne des Verbs "lesen". Sie verarbeitet den Text. Verarbeitete Charaktere haben nichts mit weltlicher Erfahrung zu tun. Sie hat kein Gedächtnis, aus dem sie etwas schöpfen kann, weder Vorstellungskraft noch Verständnis, noch die Bedeutung, die hinter den Worten verborgen ist, mit denen sie so schnell arbeitet.

* * *

Ein Freund fragte mich, ob GT-Kenntnisse als einfache Datenbankfunktion angesehen werden können. Er stellte fest, dass eine Datenbank, die am Ende millionenfach oder milliardenfach vergrößert wird, im Prinzip alles übersetzen kann, was sie bietet, und im Wesentlichen ideal ist. Ich glaube nicht. Wenn Sie die Menge an "Big Data" erhöhen, kommen Sie dem Verständnis nicht näher, da das Verständnis von der Verfügbarkeit von Ideen abhängt und das Fehlen von Ideen die Wurzel aller Probleme der modernen maschinellen Übersetzung ist. Ich bin mir also sicher, dass größere Datenbanken - auch viel größere - hier nicht helfen werden.

Eine weitere natürliche Frage: Wird die Verwendung neuronaler Netze in der GT - Nachahmung des Gehirns - uns dem tatsächlichen Verständnis durch Sprachmaschinen näher bringen? Das klingt zunächst plausibel, aber bisher hat niemand versucht, über die oberflächliche Ebene von Wörtern und Phrasen hinauszukommen. Alle Arten von Statistiken über riesige Datenbanken sind in das neuronale Netzwerk eingebettet, aber diese Statistiken verbinden einfach einige Wörter mit anderen, nicht mit Ideen. Es gibt keine Versuche, interne Strukturen zu schaffen, die Ideen, Bilder, Erinnerungen oder Erfahrungen darstellen. Solche mentalen Konstruktionen sind für Berechnungsmethoden zu schwer fassbar, und daher werden stattdessen schnelle und komplexe Algorithmen für die statistische Akkumulation von Wörtern verwendet. Die Ergebnisse solcher Techniken lassen sich jedoch nicht mit tatsächlichen Ideen vergleichen, die auftreten, wenn jemand den Text liest, versteht, erstellt, modifiziert und beurteilt.

Trotz meiner Negativität bietet GT einen Service, der von vielen geschätzt wird: Es wandelt schnell bedeutungsvolle Sätze in natürlicher Sprache A in nicht unbedingt bedeutungsvolle Wortzeilen in Sprache B um. Und während der Text in Sprache B mehr oder weniger verständlich ist, viele Menschen mit dem Ergebnis völlig zufrieden. Wenn sie die „Grundidee“ eines Vorschlags in einer unbekannten Sprache bekommen können, sind sie glücklich. Für mich ist das überhaupt nicht das, was das Wort "Übersetzung" bedeutet, aber für manche Menschen ist es ein großartiger Service, und für sie ist es eine Übersetzung. Nun, ich kann verstehen, was sie brauchen und womit sie zufrieden sind. Glück sie!

Ich habe kürzlich Balkendiagramme von Technophilen gesehen, die behaupten, die Qualität einer von Menschen und Computern erstellten Übersetzung darzustellen, und dass diese Grafiken zeigen, wie nah die maschinelle Übersetzung am Menschen ist. Aus meiner Sicht riecht eine solche Quantifizierung von Konzepten, die nicht quantitativ ausgedrückt werden können, nach Pseudowissenschaften oder, wenn Sie so wollen, nach Nerds, die versuchen, jene Dinge in die Mathematik zu bringen, deren immaterielle, subtile, künstlerische Natur ihnen entgeht. Meiner Meinung nach reicht die heutige Schlussfolgerung von GT von ausgezeichnet bis grotesk, aber ich kann meine Gefühle dazu nicht numerisch bewerten. Erinnern Sie sich an mein erstes Beispiel mit den Konzepten "er" und "sie". Das gedankenlose Programm übersetzte fast alle Wörter richtig, aber trotz dieses Erfolgs verstand es die Bedeutung nicht vollständig. Und wie kann man dann die Qualität der Arbeit numerisch ausdrücken? Die Verwendung von pseudosäulendiagrammen zur Darstellung der Übersetzungsqualität ist einfach ein Missbrauch der externen Attribute der Wissenschaft.

Kehren wir zu dem traurigen Bild zurück, in dem Menschenübersetzer bald zurückgelassen werden, altmodisch werden und sich am Ende mit dem Korrekturlesen beschäftigen werden. Im besten Fall wird das Ergebnis eine gewisse Mittelmäßigkeit sein. Ein seriöser Künstler beginnt nicht mit kitschigem Müll voller Fehler zu arbeiten, um durch ein paar Änderungen ein Kunstwerk zu schaffen. Dies ist nicht die Natur der Kunst. Und Übersetzung ist eine Kunst.

In meinen Schriften über die Jahre habe ich immer die Ansicht unterstützt, dass das menschliche Gehirn eine Maschine ist; sehr komplexes Auto; und ich argumentierte heftig mit denen, die sagten, dass Maschinen im Wesentlichen nicht verständlich seien. Es gibt sogar eine Philosophieschule, die besagt, dass Computer niemals „Semantik besitzen“ werden, weil sie aus „dem falschen Material“ (Silizium) bestehen. Für mich ist das oberflächlicher Unsinn. Hier werde ich nicht zur Debatte gehen, aber ich möchte den Leser nicht beeindrucken, dass ich glaube, dass Intelligenz und Verständnis Computern niemals zur Verfügung stehen werden. Wenn dieser Aufsatz solche Gedanken anregt, dann nur, weil die von mir diskutierten Technologien keine Versuche unternehmen, die menschliche Intelligenz zu reproduzieren. Im Gegenteil: Sie versuchen, den Intellekt zu umgehen, und die daraus resultierenden Passagen zeigen diese klaffenden Lücken.

Aus meiner Sicht gibt es kein grundlegendes Verbot, dass Maschinen im Prinzip eines Tages anfangen zu denken, kreativ, lustig, nostalgisch, freudig, ängstlich, enthusiastisch, bescheiden, voller Hoffnung zu werden und infolgedessen Gutes zu tun Übersetzungen zwischen Sprachen. Es gibt keine fundamentalen Gründe, warum sie eines Tages solche Witze, Wortspiele, Skripte, Romane, Gedichte und Essays nicht erfolgreich übersetzen könnten. All dies wird jedoch nur dann auftreten, wenn Autos wie Menschen mit Ideen, Emotionen und Erfahrungen gefüllt sind. Dies ist aber noch nicht sichtbar. Ich glaube, dass dies noch sehr weit weg ist. Zumindest hofft dieser Mensch leidenschaftlich darauf und bewundert sein ganzes Leben lang die Tiefen des menschlichen Geistes.

Wenn ein mechanischer Übersetzer eines schönen Tages einen geschickten Versroman auf Englisch verfasst, der ein klares, rhythmisches 4-Fuß-Iambic verwendet, das reich an Gedanken, Sinnlichkeit und lebhaften Linien ist, werde ich verstehen, dass es Zeit für mich ist, zu gehen.

Source: https://habr.com/ru/post/de410185/


All Articles