Traductor de Google corto

El programa utiliza tecnologías avanzadas de inteligencia artificial, pero las pruebas más simples indican que todavía está lejos de ser una verdadera comprensión.




El autor del artículo es Douglas Richard Hofstadter, físico e informático estadounidense; hijo del premio Nobel de física Robert Hofstadter. Ganó fama mundial gracias al libro "Godel, Escher, Bach: This Endless Garland", publicado en 1979 y en 1980 recibió el Premio Pulitzer en la categoría de "No ficción".

Un domingo en una sesión semanal de salsa, mi amigo Frank trajo un invitado de Dinamarca con él. Sabía que Frank habla bien danés, porque su madre es de allí y vivió de niño en Dinamarca. Su novia hablaba inglés fluido, lo que se considera la norma para los países escandinavos. Sin embargo, para mi sorpresa, en el proceso de comunicación resultó que esta pareja generalmente intercambia correos electrónicos traducidos por Google Translate (GT). Frank escribe un mensaje en inglés, corre a través de GT para obtener texto danés; ella, por el contrario, escribe en danés y luego permite que el GT traduzca el texto al inglés. Que extraño ¿Por qué dos personas inteligentes que hablan el idioma del otro deben hacer estas cosas? Mi experiencia en el uso de software de traducción automática siempre me ha llevado a evaluaciones escépticas de sus capacidades. Pero estos dos claramente no compartían mi escepticismo. Muchas personas inteligentes están fascinados por las capacidades de los programas de traducción y encuentran pocas razones para criticarlos. Me sorprende

Amo los idiomas y hago traducciones con toda mi pasión. Soy especialista en ciencias cognitivas y he estado interesado en las complejidades del trabajo de la mente humana toda mi vida, por lo que durante décadas he estado siguiendo la mecanización de las traducciones. Me interesé por primera vez en este tema a mediados de la década de 1970, cuando me encontré con una carta de 1947 escrita por el matemático Warren Weaver , uno de los primeros defensores de las traducciones automáticas, dirigida al fundador de la cibernética, Norbert Wiener , en la que Weaver hizo una declaración interesante, bastante famosa hoy:
Cuando miro un artículo ruso, digo: “En realidad está escrito en inglés, solo encriptado con caracteres extraños. Y ahora procederé al descifrado ".
Unos años más tarde, propuso un punto de vista diferente: “Ninguna persona razonable creerá que la traducción automática podrá lograr elegancia y estilo. Pushkin no debería tener miedo. Recuerdo un año inolvidable de mi vida dedicado a traducir la brillante novela de los poemas de Eugenio Onekin "Eugene Onegin" a mi lengua materna (reelaboré radicalmente el mejor trabajo ruso, convirtiéndolo en una historia inglesa en poemas), y encuentro este comentario de Weaver mucho más cierto que la primera, extrañamente simplificada vista de idiomas. Sin embargo, su visión de 1947 de la traducción como decodificación se convirtió en el lema que ha guiado durante mucho tiempo el campo de la traducción automática.

Desde entonces, las traducciones automáticas se han mejorado gradualmente, y recientemente el uso de las llamadas Las “redes neuronales profundas” incluso llevaron a algunos observadores a pensar (ver los artículos “El gran despertar de la IA ” y “ Traducción automática: más allá de Babilonia ”) que los traductores humanos son una especie en peligro de extinción. Con este desarrollo de eventos, las personas que trabajan como traductores se convertirán en simples controladores de calidad y correctores de errores pequeños en unos pocos años, y no producirán textos nuevos en su totalidad.

Tal escenario me habría causado una revolución espiritual aplastante. Aunque entiendo el deseo de enseñar a las máquinas cómo traducir bien los textos, no quiero ver cómo las personas muertas reemplazarán a los traductores humanos. Esta idea me asusta y me da asco. En mi opinión, la traducción es un arte increíblemente refinado, que requiere constantemente muchos años de experiencia e imaginación creativa. Si en un "buen" día, los traductores humanos se convierten en reliquias del pasado, mi respeto por la mente humana se verá sacudido, y este shock me dejará en una increíble confusión y tristeza.

Cada vez que leo un artículo sobre cómo el gremio de traductores humanos pronto se verá obligado a inclinar la cabeza ante la espada terriblemente rápida de una nueva tecnología, siento la necesidad de verificar estas declaraciones yo mismo, en particular por el temor de que esta pesadilla ya haya surgido. cerca, y también por la esperanza y el deseo de convencerme de que no está tan cerca, y, finalmente, por mi creencia de larga data en la necesidad de combatir la exageración de los logros de la IA. Por lo tanto, después de leer acerca de cómo la vieja idea de las redes neuronales artificiales, recientemente adoptada por la división de Google llamada Google Brain, y mejorada con la ayuda de un "entrenamiento en profundidad", condujo a la aparición de un nuevo tipo de programa que supuestamente hizo una "revolución" en las traducciones automáticas. Me di cuenta de que necesito verificar la última versión de GT. ¿Es cierto que ella cambió el campo de las traducciones de la manera en que Deep Blue y AlphaGo lograron hacer esto en el campo de juegos tan venerables como el ajedrez y el ir?

Descubrí que, aunque la versión anterior de GT funcionaba con una gran variedad de idiomas, la nueva funcionó primero con solo nueve, cierto, luego amplió el conjunto a 96. Limité mi investigación a idiomas compatibles como inglés, francés, alemán y chino [ añadiremos por diversión y idioma ruso / aprox. perev. ]

Antes de la demostración de descubrimientos, vale la pena mencionar la ambigüedad de la palabra "profundo". Cuando una persona se entera de cómo Google compró DeepMind, que produjo "redes neuronales profundas" con "aprendizaje profundo", inmediatamente percibe estos nombres en términos de "sobresaliente", "capaz de mucho", "perspicaz", "sabio". Además, la palabra "profundo" solo significa el hecho de que estas redes neuronales tienen más capas (digamos, 12) que las versiones anteriores, que podrían tener dos o tres. ¿Se deduce de tal profundidad que dicha red tiene algún tipo de sabiduría? Apenas Esto es PR verbal.

Sospecho mucho del GT, especialmente debido a la exageración que lo rodea. Pero, a pesar de la hostilidad, admito la existencia de hechos sorprendentes relacionados con este producto que no me gustan. Está disponible para cualquier persona en la Tierra de forma gratuita y puede convertir texto en cualquiera de los casi cien idiomas a texto en cualquier otro idioma. Es digno de respeto. Si me llamo orgullosamente "pi-lingual" (es decir, el número total de idiomas que conozco es un poco más de tres es mi forma humorística de responder la pregunta, "¿Cuántos idiomas sabes?"), Entonces, ¿cuánto más puede un GT estar orgulloso de sí mismo? si puede llamarse a sí mismo "comprar-lingual" ("comprar" en mandarín significa 100). El hombre pagano está muy impresionado con el bayazianismo. Además, si copio una página en el lenguaje A en GT, entonces solo toma unos segundos obtener una página de palabras en el lenguaje B. Y todo esto sucede todo el tiempo, en pantallas de todo el planeta, en docenas de idiomas.

Los beneficios prácticos de GT y tecnologías similares no se pueden negar, y en principio, nos benefician, pero en este enfoque, algo claramente no es suficiente, y esto se puede describir en una palabra: comprensión. La traducción automática nunca se centró en comprender el idioma. En cambio, siempre han tratado de hacer "descifrado" en esta área, es decir, hacer frente a la tarea, sin preocuparse por lo que son la comprensión y el significado. ¿Podría ser que la comprensión no es necesaria para una buena traducción? ¿Puede alguien, una persona o una máquina, emitir una traducción de alta calidad sin prestar atención al significado del idioma? Para arrojar luz sobre este tema, pasamos a los experimentos que he realizado.

* * *

Comenzaré mi investigación con ejemplos modestos, con una breve observación, que inmediatamente causa una idea clara en una persona:
En su casa, todo viene en pares. Están su auto y el de ella, sus toallas y sus toallas, y su biblioteca y la de ella.

Traducción GT:
En su casa, todo viene en pares. Está su auto y el de ella, toallas y toallas, así como su biblioteca y la de ella.

Traducción Humana
En su casa, todo tiene su propia pareja. Está su auto, y su auto, sus toallas y sus toallas, su biblioteca y ella.
La tarea de traducción parece inequívoca, pero en francés (y otras lenguas romances ) las palabras "él" y "ella", que indican cosas, no se ponen en el tipo del propietario, sino en el tipo de cosas en sí. Esto es lo que GT me dio:
Dans leur maison, tout vient en paires. Il ya sa voiture et sa voiture, ses serviettes et ses serviettes, sa bibliothèque et les siennes.
El programa cayó en mi trampa, sin comprender cómo una persona hubiera entendido que describí a una pareja que tenía lo suyo para cada una de sus cosas. Por ejemplo, una red neuronal de aprendizaje profundo utilizó la palabra sa tanto para su máquina como para su máquina, por lo que no podemos decir nada sobre el campo del propietario de la máquina. De la misma manera, ella usó la palabra asexual ses para el plural de "sus toallas" y "sus toallas", y en el último caso, con las bibliotecas, la última letra s en la de ella la confundió, y de alguna manera decidió qué significaba. plural (les siennes) La propuesta, traducida por GT al francés, perdió su significado.

Entonces yo mismo traduje esta frase al francés, para que conserve su significado original. Aquí está mi versión:
Chez eux, no es doble. Il ya sa voiture à elle et sa voiture à lui, ses serviettes à elle et ses serviettes à lui, sa bibliothèque à elle et sa bibliothèque à lui.
La frase sa voiture à elle significa "su automóvil", y sa voiture à lui significa su automóvil. Después de eso, decidí que sería una tarea trivial para GT traducir mi traducción al francés de nuevo al inglés y obtener la versión correcta en inglés, pero estaba muy equivocado. Esto es lo que me dio:
En casa, tienen todo en doble. Hay su propio automóvil y su propio automóvil, sus propias toallas y sus propias toallas, su propia biblioteca y su propia biblioteca.
Que, perdon? A pesar de que la oración de entrada establece explícitamente el género de los propietarios, la máquina de traducción ignoró estas afirmaciones y atribuyó todo al género masculino. ¿Por qué descartó la información más importante de la propuesta?

La gente sabe muchas cosas sobre parejas, casas, pertenencias personales, orgullo, rivalidad, celos, vida personal y muchas otras cosas intangibles que conducen a caprichos tales como toallas con bordados de "él" y "ella". GT tales sutilezas son desconocidas. GT generalmente sutilezas desconocidas. Solo conoce líneas formadas por palabras formadas por letras. Está involucrado en el procesamiento ultrarrápido de fragmentos de texto, no piensa, no representa, no recuerda, no comprende. Ni siquiera sabe que las palabras significan cosas. Me apresuro a declarar que, en principio, un programa de computadora podría descubrir por qué se necesita un lenguaje, y podría tener ideas, memoria y experiencia, y podría usarlos, pero GT no fue diseñado para eso. Tales objetivos no estaban en los planes de sus desarrolladores.

En general, me reí de los resultados, aliviada al ver que no habíamos estado a punto de reemplazar los traductores por máquinas. Pero aún así me pareció que valía la pena estudiar el automóvil con más detalle. Un sorbo de sed no apaga.

Y, por cierto, ¿qué pasa con esta frase: "una sed para no saciar la sed" (insinuando, por supuesto, el dicho " una golondrina no es un verano"), la palabra golondrina también se traduce como "un sorbo", y como "golondrina". En la versión inglesa, una golondrina no hace verano. / aprox. transl. ] No pude evitar comprobarlo. Y aquí está lo que GT me dio: "Une hirondelle n'aspire pas la soif" [ GT le dio al ruso "una golondrina no apaga la sed" / traducción aprox. ] Gramaticalmente, esta oración es francesa, pero es difícil de entender. Primero, menciona un pájaro (une hirondelle - swallow) a), luego se dice que el pájaro no inhala o no aspira (n'aspire pas), y finalmente, se indica que lo que el pájaro no aspira es sed (la soif). GT claramente no entendió el significado de la frase, simplemente emitió un montón de mierda de toro. "Es cierto que el simplejo es un gusto de taureaux". "Él acaba de salir con un montón de toros". "El ambiente del ave es un buen taureaux". Perdona mi francés, o mejor dicho, pseudo-francés. GT.

* * *

Del fuego francés saltamos al fuego alemán. Recientemente, estoy inmerso en el libro Sie nannten sich der Wiener Kreis (Se llamaron a sí mismos el Círculo de Viena) del matemático austríaco Karl Sigmund. Describe a un grupo de intelectuales idealistas de Viena en las décadas de 1920 y 1930 que influyeron seriamente en la filosofía y la ciencia en la segunda mitad del siglo XX. Seleccioné una pequeña oración del libro de Sigmund y se la di a GT. Aquí está, primero en alemán, luego viene mi traducción, luego GT. (Por cierto, verifiqué mi traducción con dos hablantes nativos de alemán, incluido Karl Sigmund, por lo que puede considerarse precisa).
Sigmund:

Nach dem verlorenen Krieg sahen es viele deutschnationale Professoren, inzwischen die Mehrheit in der Fakultät, gewissermaßen als ihre Pflicht an, die Hochschulen vor den "Ungeraden" zu bewahren; am schutzlosesten waren junge Wissenschaftler vor ihrer Habilitation. Und wissenschaftlerinnen kamen sowieso nicht in frage; über wenig war man sich einiger.

Hofstadter:

Después de la derrota, muchos profesores con inclinaciones pangermanistas, que para ese entonces constituían la mayoría de la facultad, consideraban que su deber era proteger las instituciones de educación superior de los "indeseables". Los más propensos a ser despedidos fueron los jóvenes académicos que aún no se habían ganado el derecho de impartir clases universitarias. En cuanto a las eruditas, bueno, no tenían lugar en el sistema; nada estaba más claro que eso.

Traductor de Google:

Después de la guerra perdida, muchos profesores de nacionalidad alemana, mientras que la mayoría en la facultad, se veían a sí mismos como su deber de mantener a las universidades de lo "extraño"; Los jóvenes científicos eran más vulnerables antes de su habilitación. Y los científicos no cuestionaron de todos modos; Había pocos de ellos.

GT, ruso:

Después de la guerra perdida, muchos profesores de nacionalidad alemana, ahora la mayoría en la facultad, consideraron su deber proteger a las universidades de lo "extraño"; Los más vulnerables eran jóvenes científicos antes de su habilitación. Y las científicas todavía no tenían dudas; Había varios de ellos.

Ruso humano:

Después de la derrota, muchos profesores propensos al nacionalismo alemán (y para ese entonces había la mayoría en el liderazgo de la facultad) consideraron su deber proteger a las instituciones de educación superior de "elementos indeseables". Lo más probable es que los jóvenes científicos que aún no se hayan ganado el derecho a enseñar puedan ser rechazados. Para las mujeres científicas, no había lugar en este sistema en absoluto; Era más claro que claro.
La traducción GT consiste en palabras en inglés (por alguna razón desconocida, algunas de ellas comienzan por mayúscula). Hasta ahora todo bien! Pero pronto toda la traducción comienza a desdibujarse, y cuanto más avanza, más borrosa se vuelve.

Primero tome el "extraño" impar - extraño, extraño, no apareado]. Esto corresponde al dado alemán 'Ungeraden', que significa "personas no deseadas por razones políticas". Pero el GT tenía una razón, estadísticas puras, para usar la palabra "extraño". A saber: en su enorme base de datos bilingüe, la palabra ungerade casi siempre se traduce como extraña. Aunque el auto no entiende por qué, puedo explicarlo. Esto se debe a que ungerade, que literalmente significa "indirecto" o "desigual", casi siempre significa "extraño". Y mi elección de la palabra indeseables [elementos no deseados] no tiene nada que ver con las estadísticas de las palabras, sino que proviene de mi comprensión de la situación: entender una idea que no se indica directamente en el texto y no está presente en la lista de opciones de traducción para la palabra ungerade en ninguno de los diccionarios alemanes.

Pasemos a Habilitación, que denota el estado de un maestro, parecido a un miembro del personal del instituto. La habilitación de papel de rastreo en inglés [calificado] existe, pero rara vez se usa, y ciertamente no recuerda a los empleados a tiempo completo. Por lo tanto, expliqué brevemente esta idea, y no solo usé una palabra rara, porque un enfoque tan mecánico no daría nada a los lectores de habla inglesa. Por supuesto, GT nunca hará eso; no tiene un modelo de conocimiento para sus lectores.

Las últimas dos oraciones demuestran claramente la importancia crítica de la comprensión para una traducción adecuada. La palabra alemana de 15 letras Wissenschaftler significa "científico" o "científico" ["científico" / "erudito"]. Elegí la última opción, ya que denota a todos los intelectuales en general. GT no reconoció estas sutilezas. La palabra asociada de 17 letras Wissenschaftlerin en la oración final, plural, Wissenschaftlerinnen es una consecuencia del uso del parto en sustantivos alemanes. Un nombre corto gramaticalmente se refiere al género masculino, por lo tanto, significa un científico masculino, y un nombre largo se refiere a una mujer, y es aplicable solo a las mujeres. Por lo tanto, escribí "mujeres científicas". GT, mientras tanto, no entendía que el sufijo femenino -in era el principal en la oración. Como no entendía que las mujeres quedaban excluidas de la consideración, la máquina simplemente volvió a usar la palabra "científico", omitiendo por completo el punto de la oración [es interesante que GT la tradujo al ruso más correctamente / aprox. perev. ] Como fue el caso de los franceses, GT no tenía idea de que el único propósito de la propuesta alemana era resaltar el contraste entre hombres y mujeres.

Bueno, además de este error, el resto de la última oración es una pesadilla completa. Toma la primera parte. ¿Es “los científicos no cuestionaron de todos modos” realmente la traducción de “Wissenschaftlerinnen kamen sowieso nicht in frage”? Absolutamente no coinciden en significado. La oración simplemente consiste en palabras en inglés dominadas en alemán. ¿Y qué, es esto suficiente para describir un cierto texto de salida como una "traducción"? [ en la versión de la traducción al ruso, la pesadilla persiste / aprox. perev. ]

La segunda parte es igual de errónea. Las últimas seis palabras en alemán significan literalmente "poco estaba más unido", o, más suavemente, "había pocos para los cuales el consentimiento de las personas era más fuerte" ["sobre poco era uno más unido" / "había poco sobre qué personas estaban más de acuerdo "] - sin embargo, GT convirtió esta idea clara en" había varios "[ aproximadamente lo mismo en inglés y ruso / aprox. perev. ] Las personas perplejas pueden preguntar "¿Quiénes fueron varios?", Pero para un oyente mecánico, esta pregunta no tendría sentido. El GT no tiene idea de lo que está sucediendo detrás de escena, y no pudo haber respondido una pregunta aparentemente simple.El programa de traducción no imaginaba grandes o pequeñas cantidades, números o cosas. Ella solo arrojó símbolos, sin la menor idea de que podrían simbolizar algo.

* * *

Es muy difícil para una persona que ha adquirido experiencia, comprensión y uso de palabras de manera significativa durante toda su vida comprender cuán vacía la máquina GT arroja los contenidos de la palabra a la pantalla. Es casi imposible para las personas resistirse a la suposición de que el software que funciona tan bien con las palabras debe comprender su significado. Esta clásica ilusión relacionada con la IA se llama el " efecto Eliza " , porque uno de los primeros programas que hizo creer a las personas que parecía entender inglés fue el inútil manipulador de frases ELIZA que pretendía ser un psicoterapeuta en la década de 1960. Muchas personas que interactuaron con el programa crearon un sentimiento sobrenatural de que ella entendía sus sentimientos profundos.

Durante décadas, las personas inteligentes, incluso los investigadores de IA, han estado bajo la influencia del efecto Eliza. Para evitar que mis lectores caigan en esta trampa, permítanme citar algunas frases del texto anterior: "GT no entendió", "no se dio cuenta", "GT no tenía idea". Es irónico que, aunque estas frases insisten en una falta de comprensión, casi aluden al hecho de que el GT puede, al menos a veces, entender el significado de una palabra, frase u oración. Pero esto no es así. GT simplemente pasa por alto la cuestión de entender el idioma.

Para mí, la palabra "traducción" tiene un aura misteriosa que evoca recuerdos. Denota una forma de arte extremadamente humana que transforma con gracia ideas claras del lenguaje A en ideas claras del lenguaje B. Este trabajo en red no solo debe mantener la claridad, sino también transmitir los matices, los matices y las características distintivas del estilo de escritura del autor original. Cuando hago la traducción, primero leo cuidadosamente el texto original, aprendo las ideas lo más claramente posible y dejo que pasen el rato en mi mente. No se trata de palabras que flotan en la mente: ideas que evocan todo tipo de ideas relacionadas, creando un rico halo de los escenarios que lo acompañan en mi cabeza. La mayor parte de este halo, por supuesto, está en el inconsciente. Solo cuando el halo en mi conciencia está lo suficientemente despierto, comienzo a tratar de expresarlo, "exprimirlo", en un segundo idioma.Estoy tratando de decir en el lenguaje B lo que me parece natural que el lenguaje B hable sobre situaciones que conforman el halo de significado que se está discutiendo.

En general, no paso de palabras y frases del lenguaje A a palabras y frases del lenguaje B. En cambio, inconscientemente llamo imágenes, escenas, ideas, mi experiencia (o la experiencia que leí, vi en las películas, escuché de amigos ), y solo cuando se trata de un "halo" mental no verbal, figurado, experimentado, solo entonces comienzo el proceso de formulación de palabras y frases en el idioma de destino, y luego edito, edito y edito. Este proceso, que está mediado por el significado, puede parecer lento, y, por supuesto, en comparación con dos segundos por página en GT, esto es lo que es, pero es cualquier traductor serio quien lo use. Me imagino algo así cuando escucho la frase "mente profunda".

* * *

Dado todo esto, recurriré al chino, un idioma que es mucho más molesto con el software de aprendizaje profundo que los dos idiomas europeos. Para las pruebas, elegí las conmovedoras memorias de Mujeres Sa ("Las tres de nosotras"), la dramaturga y traductora china Yang Jiang , quien recientemente murió a la edad de 104 años. En el libro, recuerda el entretejido de las vidas de ella, su esposo Qian Zhongshu (también escritor y traductor) y su hija. No está escrito de manera muy compleja, pero utiliza un idioma chino animado y altamente educado. Elegí un pequeño pasaje y puse un GT en él. Aquí están los resultados, junto con mi traducción:
:

锺书到清华工作一年后,调任毛选翻译委员会的工作,住在城里,周末回校。 他仍兼管研究生。
毛选翻译委员会的领导是徐永煐同志。介绍锺书做这份工作的是清华同学乔冠华同志。
事定之日,晚饭后,有一位旧友特雇黄包车从城里赶来祝贺。客去后,锺书惶恐地对我说:

他以为我要做“南书房行走”了。这件事不是好做的,不求有功,但求无过。

:

After Zhongshu had worked at Tsinghua University for a year, he was transferred to the committee that was translating selected works of Chairman Mao. He lived in the city, but each weekend he would return to school. He also was still supervising his graduate students.
The leader of the translation committee of Mao's works was Comrade Xu Yongying, and the person who had arranged for Zhongshu to do this work was his old Tsinghua schoolmate, Comrade Qiao Guanhua.
On the day this appointment was decided, after dinner, an old friend specially hired a rickshaw and came all the way from the city just to congratulate Zhongshu. After our guest had left, Zhongshu turned to me uneasily and said:
“He thought I was going to become a 'South Study special aide.' This kind of work is not easy. You can't hope for glory; all you can hope for is to do it without errors.”

Google Translate:

After a year of work at Tsinghua, he was transferred to the Mao Translating Committee to live in the city and back to school on weekends. He is still a graduate student.
The leadership of the Mao Tse Translation Committee is Comrade Xu Yongjian. Introduction to the book to do this work is Tsinghua students Qiao Guanhua comrades.
On the day of the event, after dinner, an old friend hired a rickshaw from the city to congratulate. Guest to go, the book of fear in the book said to me:
He thought I had to do “South study walking.” This is not a good thing to do, not for meritorious service, but for nothing.

GT, :

, . - .
. , , .
, , , , . , , :
, « ». .

:

, , . , . , .
, , .
, , , . , :
, « ». . ; .
Describa brevemente las rarezas. En primer lugar, GT nunca mencionó a Zhongshu por su nombre, aunque su nombre ("锺 书") aparece tres veces en el original. Primero, la máquina usa el pronombre "él", la segunda vez que escribe el libro [libro], y la tercera vez el libro del miedo en el libro [libro del miedo en un libro]. ¡Ve a adivinar! [ en la versión rusa aparece el misterioso "libro" una vez / aprox. perev. ]

La segunda rareza: en el primer párrafo se indica claramente que Zhongshu supervisa a los estudiantes graduados, pero el propio GT lo convirtió en un estudiante graduado.

La tercera rareza: en la frase Comité de traducción de Mao Tse [comité de traducción de Mao Zedong], un tercio del nombre del presidente Mao [Mao Tse Tung] se cayó en alguna parte.

Cuarta extrañeza: el nombre Yongying se reemplaza por Yongjian.

Quinta rareza: después de que nuestro invitado se fue [después de dejar a nuestro invitado] simplemente lo reemplazaron con guest to go [guest to go].

Sexta extrañeza: la última oración no tiene sentido.

Seis de estas rarezas ya son suficientes para avergonzar al GT, pero perdónalos y olvídalo. Es mejor centrarse en la frase confusa que encontré en el texto: una frase de cinco caracteres entre comillas del último párrafo ("南 书房 行走"). Se puede traducir simbólicamente como "la sala sur de libros para dar un paseo", pero esto es claramente inaceptable, especialmente porque debería ser un sustantivo en contexto. GT inventó la "oficina de caminar hacia el sur", y eso no ayudó.

Admito que la frase china fue completamente incomprensible para mí. Literalmente, significaba algo como caminar en una oficina en el lado sur de un edificio, pero sabía que esto estaba mal, en el contexto no tenía sentido. Para traducir, necesitaba encontrar algo desconocido para mí en la cultura china. ¿Y a dónde fui por ayuda? Ir a google! (Pero no para Google Translate). Ingresé caracteres chinos, rodeado de comillas, e inicié una búsqueda de una coincidencia exacta. Y un montón de páginas web chinas aparecieron de repente en la pantalla, después de lo cual leí dolorosamente los primeros párrafos de un par de los primeros sitios, tratando de entender el significado de la frase.

Descubrí que este término se remonta a la dinastía Qing(1644–1911), y denota a un trabajador mental que ayudó al emperador a componer elegantes comunicaciones oficiales, y trabajó en la oficina del sur del palacio imperial. Dos personajes, que supuestamente indican "salir a caminar", en realidad significan un asistente. Por lo tanto, utilizando la información de una búsqueda en Google, se me ocurrió la frase "asistente especial de la oficina del sur".

Es una pena que el GT en sí no pueda usar el servicio de Búsqueda de Google, como lo hice yo. Pero, de nuevo, GT no puede entender las páginas web, aunque puede traducirlas en un abrir y cerrar de ojos. O tal vez? A continuación, le doy un texto increíble que GT arrojó instantáneamente en mi pantalla después de que le di el comienzo del sitio web del que obtuve la información necesaria:
"Caminar al sur del estudio" no es una posición oficial, antes de la era Qing es solo un "mensajero", generalmente por los entonces intelectuales imperiales Hanlin para servir. Estudio del sur en los funcionarios de Hanlin en el "seleccione sólo bienes chencai y excelente" en el valor, llamado "estudio del sur caminando". Debido a la cercanía del emperador, la decisión del emperador de tener cierta influencia. Más tarde, Yongzheng estableció un "avión militar", el Ministro de la máquina militar, a tiempo completo, aunque el estudio aún es el valor de Hanlin, pero no tiene participación en los asuntos del gobierno. Los estudiosos de la dinastía Qing en el valor del sur estudian orgullosos. Muchos estudiosos y académicos de principios de la dinastía Qing hacia el sur a través del estudio.
¿Es generalmente en inglés? Por supuesto, todos podemos estar de acuerdo en que el texto consta de palabras en inglés (en su mayor parte), pero ¿se deduce de esto que es un texto en inglés? En mi opinión, dado que este párrafo no tiene sentido, no es inglés; son ingredientes ingleses colocados al azar: una ensalada aleatoria de palabras, un hash divagante.

En caso de que esté interesado, aquí está mi versión de este pasaje (lo examiné durante varias horas):
La posición de Nan Shu Fan Xiaon Zu (asistente especial del Gabinete del Sur) no era oficial, pero a principios de la dinastía Qing era un papel especial que el erudito actual de la corte generalmente jugaba. Un grupo de científicos que trabajaba en la oficina del sur del palacio imperial eligió entre su gente grandes talentos y una buena reputación, por lo que escribió discursos para el emperador y siempre estuvo en sus instalaciones; por lo tanto, este papel fue llamado "asistente especial del Gabinete del Sur". El asistente, estando cerca del emperador, obviamente podía influir en sus decisiones políticas. Sin embargo, después de que el Emperador Yongzheng fundó el Ministerio de Guerra, con el Ministro y sus diversos subordinados, el asistente del Gabinete del Sur, a pesar de servir al emperador, dejó de desempeñar un papel importante en las decisiones gubernamentales. Sin embargo, los eruditos de la dinastía Qing lucharon por la gloria de este puesto, y en los primeros años de la dinastía varios eruditos famosos fueron asistentes especiales.
Algunos lectores pueden sospechar que, para criticar duramente al GT, seleccioné especialmente esos pasajes con los que tropezó activamente y que, de hecho, maneja la mayoría de los textos mucho mejor. Suena creíble, pero no lo es. Casi todos los párrafos que he seleccionado de los libros que estoy leyendo ahora condujeron a errores de traducción de todo tipo y franjas, incluidas frases sin sentido e incomprensibles como las que se dieron anteriormente.

Por supuesto, admito que a veces el GT emite algunas oraciones que suenan bastante bien (aunque pueden ser engañosas o simplemente incorrectas). Incluso puede suceder que uno o dos párrafos funcionen perfectamente, creando la ilusión de que el GT comprende lo que está haciendo, comprende lo que significa leer. En tales casos, el GT se ve impresionante, ¡casi humano! Y todas las alabanzas se relacionan claramente con sus creadores y su arduo trabajo. Pero al mismo tiempo, no olvide lo que hizo GT con estos dos pasajes chinos, y antes con francés y alemán. Para comprender estos errores, no debe olvidarse del "efecto Eliza". La máquina de lenguaje Bayan no lee nada, no en el sentido humano del verbo "leer". Ella procesa el texto. Los personajes procesados ​​no están relacionados con la experiencia mundana. No tiene memoria para extraer nada, ni imaginación, ni comprensión, ni el significado oculto detrás de las palabras con las que opera tan rápidamente.

* * *

Un amigo me preguntó si las habilidades GT pueden considerarse una función de base de datos simple. Pensó que si aumenta la base de datos un millón o mil millones de veces, al final, en principio, será capaz de traducir todo lo que dan, y en esencia es ideal. No lo creo Aumentar la cantidad de "big data" no lo acercará a la comprensión, ya que la comprensión depende de la disponibilidad de ideas, y la ausencia de ideas es la raíz de todos los problemas de la traducción automática moderna. Así que estoy seguro de que las bases de datos más grandes, incluso las más grandes, no ayudarán aquí.

Otra pregunta natural: el uso de redes neuronales en GT - imitación del cerebro - nos acercará a la comprensión real por parte de las máquinas de lenguaje. Al principio esto suena plausible, pero hasta ahora nadie ha intentado ir más allá del nivel superficial de palabras y frases. Todo tipo de estadísticas sobre grandes bases de datos están integradas en la red neuronal, pero estas estadísticas simplemente conectan algunas palabras con otras, no ideas. No hay intentos de crear estructuras internas que representen ideas, imágenes, recuerdos o experiencias. Dichas construcciones mentales son demasiado escurridizas para los métodos computacionales y, por lo tanto, en lugar de ellos, se utilizan algoritmos rápidos y complejos para la acumulación estadística de palabras. Pero los resultados de tales técnicas no se comparan con tener ideas que aparecen cuando alguien lee, entiende, crea, modifica y juzga el texto.

Pero a pesar de mi negatividad, GT proporciona un servicio apreciado por muchos: convierte rápidamente oraciones significativas escritas en lenguaje natural A en líneas de palabras no necesariamente significativas en lenguaje B. Y aunque el texto en lenguaje B es más o menos comprensible, muchos personas completamente satisfechas con el resultado. Si pueden obtener la "idea básica" de una propuesta escrita en un idioma desconocido, están contentos. Para mí, esto no es en absoluto lo que significa la palabra "traducción", pero para algunas personas es un gran servicio, y para ellos es una traducción. Bueno, puedo entender lo que necesitan y con lo que están contentos. Suerte ellos!

Recientemente vi gráficos de barras dibujados por tecnófilos que afirman representar la calidad de una traducción realizada por personas y computadoras, y que estos gráficos muestran cuán cercana es la traducción automática a los humanos. Desde mi punto de vista, tal cuantificación de conceptos que no se pueden expresar cuantitativamente huele a pseudociencia o, si se quiere, a nerds que intentan llevar a las matemáticas aquellas cosas cuya naturaleza intangible, sutil y artística los elude. En mi opinión, la conclusión actual de GT varía de excelente a grotesco, pero no puedo evaluar mis sentimientos sobre esto numéricamente. Recuerda mi primer ejemplo, usando los conceptos de "él" y "ella". El programa irreflexivo tradujo casi todas las palabras correctamente, pero a pesar de este éxito, no entendió completamente el significado. ¿Y cómo, entonces, expresar la calidad del trabajo numéricamente? El uso de gráficos pseudo-columnas para representar la calidad de la traducción es simplemente un abuso de los atributos externos de la ciencia.

Volvamos a la triste imagen, en la que los traductores de personas pronto se quedarán atrás, se volverán anticuados y al final se dedicarán a la corrección de pruebas. En el mejor de los casos, el resultado será una mediocridad. Un artista serio no comienza a trabajar con basura kitsch llena de errores para hacer una obra de arte haciendo un par de cambios. Esta no es la naturaleza del arte. Y la traducción es un arte.

En mis escritos a lo largo de los años, siempre he apoyado la opinión de que el cerebro humano es una máquina; coche muy complejo; y discutí vigorosamente con aquellos que decían que las máquinas eran esencialmente incapaces de entender. Incluso hay una escuela de filosofía que establece que las computadoras nunca "poseerán semántica" porque consisten en "el material equivocado" (silicio). En cuanto a mí, esto es una tontería superficial. Aquí no entraré en debate, pero no quiero impresionar al lector porque creo que la inteligencia y la comprensión nunca estarán disponibles para las computadoras. Si este ensayo suscita tales pensamientos, es solo porque las tecnologías que analizo no intentan reproducir la inteligencia humana. Por el contrario: intentan evadir el intelecto, y los pasajes resultantes demuestran estas brechas abiertas.

Desde mi punto de vista, no existe una prohibición fundamental de que las máquinas, en principio, algún día comiencen a pensar, se vuelvan creativas, divertidas, nostálgicas, alegres, asustadas, entusiastas, humildes, llenas de esperanza y, como resultado, puedan hacer el bien. Traducciones entre idiomas. No hay razones fundamentales por las que algún día no puedan traducir con éxito chistes, juegos de palabras, guiones, novelas, poemas y ensayos como este. Pero todo esto aparecerá solo cuando los autos estén llenos de ideas, emociones y experiencias, como las personas. Pero esto aún no es visible. Creo que esto todavía está muy lejos. Al menos, esta persona espera ardientemente esto, toda su vida admirando las profundidades de la mente humana.

Cuando, un buen día, un traductor mecánico componga una hábil novela en verso en inglés, usando un yámbico claro, rítmico, de cuatro pies, rico en pensamientos, sensualidad y líneas animadas, entenderé que es hora de que me vaya.

Source: https://habr.com/ru/post/es410185/


All Articles