Traducción Automática Neural de Google

El informe fue escrito en diciembre de 2017.
No es quién tiene el mejor algoritmo el que gana. Es quien tiene la mayor cantidad de datos. El ganador no es el que tiene el mejor algoritmo, sino el que tiene más datos. Andrew Ng, profesor de Machine Learning en Coursera.
Si escala tanto el tamaño del modelo como la cantidad de datos con los que lo entrena, puede aprender distinciones más finas o características más complejas. ... Estos modelos generalmente pueden tomar mucho más contexto. Jeff Dean, un ingeniero que ayuda a dirigir la investigación en Google. Si aumenta el tamaño del modelo y le da más datos para el entrenamiento, comenzará a distinguir entre características más sutiles y complejas. ... Estos modelos suelen tener un contexto más amplio. Jeff Dean, un ingeniero que ayuda a la gestión de la investigación en Google.
Probé Google Translate en los mismos textos en marzo y diciembre de 2011, enero de 2016 y diciembre de 2017. Tomó los mismos pasajes en inglés, ruso, alemán, francés, ucraniano y polaco y los tradujo a los otros cinco idiomas de la muestra. Además, en diciembre de 2017, también tomó nuevos textos y los probó en todas las direcciones de traducción. Los resultados de la verificación cruzada generalmente coincidieron con las tendencias en la muestra inicial. El resultado fue una parte del trabajo del traductor de Google para 2011 - 2017, y en base a estos materiales podemos sacar conclusiones sobre la evolución del servicio y comentar las declaraciones de marketing de la compañía (se planea publicar las citas por separado).

Crónica de los acontecimientos


Hasta 2011 (y posiblemente más tarde), Google afirmó que el traductor estadístico es autodidacta (consulte las citas correspondientes de los empleados en mi artículo "Compatibilidad de idiomas", [1]) y que, a medida que se acumulan textos paralelos en cada idioma pareja, la calidad del producto se ha esforzado constantemente por un nivel humano únicamente a través de un enfoque estadístico innovador. En 2012, Google lanzó una red neuronal de autoaprendizaje [6] y en septiembre de 2016 anunciaron la transferencia de su traductor automático al aprendizaje profundo, lo que nuevamente promete un aumento constante de la calidad del producto [3, 4, 5]. Desde marzo de 2017, la red neuronal comenzó a usarse para la traducción al ruso.

Echemos un vistazo a lo que el traductor de Google ha gestionado específicamente a lo largo de los años, cuáles son sus puntos fuertes (nadie niega que este sea uno de los mejores traductores automáticos).

Retrospectiva


Año 2011


(Basado en mi artículo de 2012, [1]).

La traducción en muchos pares de idiomas pasa por una traducción intermedia al inglés con el efecto de un "teléfono roto"


Al traducir en estas direcciones, el idioma inglés actúa como un "intermediario": el texto primero se traduce al inglés y solo luego al idioma de traducción seleccionado. Una versión en inglés distorsionada se traduce al idioma de destino, con fragmentos inexactos inevitables durante la traducción automática. Por lo tanto, una segunda capa se superpone a la "deformación primaria". Como resultado, el mismo texto se distorsiona más cuando se traduce al alemán, francés y otros idiomas que al inglés.

Tomamos la frase inglesa recibida [traducción del ruso] y traducimos el servicio al alemán y al francés. El resultado es 100% el mismo que se da en la tercera y cuarta línea de la traducción, supuestamente del ruso. Los errores en las traducciones al alemán y al francés se correlacionan con las imprecisiones y la estructura de la frase en inglés, pero no con el original ruso.

Cuando se altera el orden de las palabras en el texto en inglés, las formas de las palabras y su secuencia no son un indicador confiable del papel de estas palabras en la oración [con una traducción adicional a los idiomas de destino].

La traducción estadística es óptima entre idiomas relacionados.


La traducción de Google del ruso al ucraniano y viceversa es la correcta más "intuitiva" de todas las consideradas, más cercana al producto terminado, tiene menos distorsión del significado o las reglas del idioma, menos traducción literal.

La "conversión" correcta de las construcciones gramaticales de un idioma por medio de otro es el límite para la traducción automática estadística. Esta restricción no se elimina ni siquiera en función de los lenguajes relacionados y crea más "ruido" en la interpretación, menos similitud gramatical de los idiomas en un par.

Google puede continuar analizando documentos web, llenar la base de datos de correspondencia, pero no mejorarán la traducción solo "optimizando los resultados de búsqueda". No puede crear una base de datos de traducción para todas las frases posibles. Esto significa que un cierto porcentaje significativo de oraciones, frases, la máquina debe estar formada de forma independiente y no preparada, y esto significa que el desarrollador necesita enseñar la gramática de la máquina de otras maneras "no estadísticas".

El inglés es el idioma principal en Google Translate


La traducción del inglés al inglés en Google Translate es directa, sin la mediación de otro idioma. Esto proporciona una buena calidad, en la cual las ventajas del servicio son especialmente notables: a menudo la traducción correcta de nombres y términos, unidades fraseológicas, el uso del habla en vivo en contraste con la traducción literal, a menudo la elección correcta del significado léxico según el contexto.

Traducido a otras áreas del idioma, "centrado en el inglés" es el mayor inconveniente del trabajo de Google Translate. La traducción al inglés o al inglés aún no es la más exitosa: el texto sufre una doble distorsión debido al hecho de que el original no se traduce directamente al idioma de destino, sino de una traducción "intermedia" rota al inglés. Una de las opciones para mejorar la calidad de la traducción en el servicio puede ser "descargar" inglés y crear "nidos" en otros idiomas clave: uno de los eslavos, turcos, romances, etc.

La mejora significativa en la calidad de las traducciones no ocurre con el tiempo


Las traducciones del mismo texto en diferentes momentos (marzo, octubre y diciembre de 2011) demostraron la regularidad del desarrollo de la traducción estadística de Google. En traducciones posteriores hubo una notable variedad de vocabulario, pero en general, en términos de precisión y claridad, no fueron mucho mejores, incluso peores en algunos lugares.

Año 2016


Google elimina las repeticiones de la traducción; oración mejor construida, coherente, a veces una mejor elección de palabras; a veces revierte a una traducción menos exitosa ("herramienta de piedra" en lugar de "herramienta de piedra" en 2011); a veces una interpretación menos exitosa del rol del miembro de la oración es a veces más. Total: en algunos lugares es mejor, en otros lugares peor que las traducciones de 2011, pero en general el nivel y el techo son los mismos.

Año 2017


El inglés como idioma intermediario conserva su papel, pero está perdiendo terreno


Hay más variaciones, desviaciones de la traducción intermedia en inglés. A menudo, estos experimentos no tienen éxito, es decir, si la traducción al idioma de destino sigue ciegamente al inglés, el resultado sería mejor. Sin embargo, el "dominio" de la gramática del idioma de destino mejoró en paralelo: si el texto en la versión en inglés está decodificado adecuadamente, entonces puede estar 90% seguro de que las terminaciones correctas se colocarán en las traducciones a otros idiomas, se seleccionarán las herramientas léxicas apropiadas y se creará el orden óptimo de las palabras. Si en inglés "gachas" ... No, gachas en los resultados de 2017 ya no está allí y este es un gran logro. Si hay una pequeña falla en la traducción al inglés, entonces en la traducción a los idiomas de destino, de acuerdo con la ley de un teléfono roto, se intensifica el malentendido. Sin embargo, la distorsión (elección incorrecta de palabras) en los idiomas de destino también se encuentra en la traducción perfecta al inglés.

En comparación con las traducciones de 2011 - 2016, la naturaleza de las desviaciones de la traducción al inglés en 2017 es tal que parece que 1) arruinaron el "aleatorizador", 2) el traductor procesa el texto en varias etapas y puede distorsionar piezas individuales en el proceso o, por el contrario, refinarlas valor según la fuente, no el intermediario inglés.

Sin embargo, la estructura de las oraciones y la elección del vocabulario en los idiomas de destino aún están determinadas en gran medida por la traducción al inglés, y las traducciones a idiomas que usan el alfabeto latino a veces contienen fragmentos en inglés que no estaban en el original.

La tendencia a generar texto en el idioma de destino de acuerdo con las leyes de su gramática
La correlación entre las traducciones de un texto a diferentes idiomas es menor que antes. El servicio no traduce textualmente, el resultado se ha vuelto más libre: reformulación adecuada, reordenamiento de palabras, reordenamiento de palabras desde el principio hasta el final de la oración, si las reglas del idioma lo requieren (en alemán esto se implementa de manera excelente). En contraste con el nivel anterior (traducción basada en frases, coincidencia única de palabras y frases individuales), el traductor neuronal en cierta medida transforma las oraciones, las analiza como un todo y establece la correspondencia "de principio a fin" en varias etapas (final- mapeo de extremo a extremo: conversión de extremo a extremo, ciclo completo, transformación continua de una variedad de datos de entrada a salida).

Análisis más preciso de la estructura de oraciones y palabras.


El principal logro en los resultados de la traducción de 2017 es un reconocimiento más sólido y seguro de la estructura de la oración y la transmisión de significados gramaticales en los idiomas de destino. En inglés, los finales no juegan un papel tan importante en la transmisión de significados gramaticales como en ruso, alemán, polaco y ucraniano. Sin embargo, durante el "barrido" a través de la red neuronal, las conexiones gramaticales comenzaron a "perderse" con menos frecuencia que durante la traducción estadística. Rara vez se empezaron a reconocer palabras de raíces múltiples que se usan con poca frecuencia: el traductor maneja bien la división no solo de oraciones, sino también de palabras.
Sin embargo, la "habilidad" del análisis depende en gran medida del lenguaje. Se implementa mejor y de manera más consistente en alemán y polaco que en ruso (pero tampoco está mal). En las traducciones del ucraniano, a veces funciona, luego es francamente defectuoso (en tales fragmentos el nivel es peor que en las traducciones de años anteriores).

La calidad de la traducción ha crecido significativamente durante el año pasado.


En 2011 - 2016, las traducciones de frases complejas al inglés solo contenían una apariencia de conectividad: las palabras y frases traducidas se unieron en un orden ligeramente ajustado, pero no había una "comprensión profunda" de la estructura, y a veces la traducción parecía fluida solo porque en inglés a menudo no era Se necesitan finales, y la ausencia de palabras de servicio en algunos estilos es permisible. Pero este "malentendido" siempre se ha manifestado en más traducciones a los idiomas de destino. En las traducciones de diciembre de 2017, la estructura de la oración en inglés está mejor alineada y mejor interpretada en otros idiomas. La calidad en estos idiomas mejoró proporcionalmente: ligeramente más bajo que el inglés, pero mucho más alto que el anterior, hay omisiones esporádicas y desviaciones del inglés (en la mayoría de los casos no tuvieron éxito).

Algunas posiciones sobre la precisión léxica se pierden en comparación con las traducciones de 2011 y 2016, pero la claridad general del texto final es más importante que el hecho de que el traductor hace alarde de conocimiento de términos y expresiones individuales. En 2011, en el contexto de otros traductores automáticos, el trabajo de calidad con vocabulario y fraseología fue un logro. Solo los mejores lograron encontrar coincidencias exactas de frases estables, nombres propios y términos. Sin embargo, las correspondencias individuales con la incoherencia general no fueron suficientes. Era necesario reforzar el "conocimiento de la gramática". Durante los cinco años de "autoformación" del traductor estadístico (de 2011 a 2016), no hubo aumento en la conectividad. Se produjo un salto cualitativo después de la integración con la red neuronal (o eso coincidió). Ahora, en las muestras que tomé el 3 de diciembre de 2017, puedo confirmar que la supertarea se ha vuelto más factible: una "computadora" (más bien una gran red de computadoras) puede reconocer el texto sin la laboriosa ortografía de las reglas manualmente. (Pero a veces se equivoca. Por lo tanto, es mejor darle textos más simples, sin oraciones ornamentadas de cinco líneas de largo).

Si en 2011 y 2016 la proporción de "lugares oscuros" (conjunto de palabras incoherentes) en las muestras de traducción a todos los idiomas que tomé fue de 1 2 fragmentos por texto con una longitud de 65 a 90 palabras, entonces en 2017 no hubo "lugares oscuros". (No utilicé juegos de palabras y otras expresiones abstrusas para la traducción, sino textos simples. Todavía se lleva a cabo una traducción incorrecta e incluso cómica de palabras y frases individuales, pero no conduce a la creación de "lugares oscuros"). Al leer la traducción, entiendes qué discurso, incluso si es torpe. Además, la calidad de la traducción al inglés es mayor que en otros idiomas de destino.

Si en 2011 la característica principal del traductor de Google fue encontrar coincidencias ideales en este contexto entre idiomas (nivel léxico, frasal), entonces en 2017, habiendo perdido un poco en la precisión léxica, el traductor ganó impulso en el análisis de oraciones y la transferencia de relaciones gramaticales.

En 2011, el servicio a veces percibió fragmentos de una oración compleja como aislados y simplemente encadenaron su traducción uno tras otro en una cadena. En 2017, después de resolver este problema, también aísla mejor las piezas verdaderamente extrañas para que no creen "ruido". Estas son manchas de palabras en otro idioma y errores tipográficos. Esto acerca la máquina al nivel de una persona: si no escuchamos algunas palabras en la oración, por regla general, esto no nos impide captar el significado general.

La traducción al ucraniano fue "desatada" del idioma intermediario ruso


Anteriormente (hasta la penúltima "medición" en enero de 2016), las traducciones al ucraniano y al ruso coincidieron en un 99,9%, e incluso si esto redujo la calidad de la traducción al ucraniano, no lo hizo significativamente, a pesar de que la traducción se separó por primera vez del original por Inglés, luego al ruso ("tercer agua en gelatina").

Ahora hay una dispersión entre las traducciones de un texto al ruso y al ucraniano. En lugar de seguir ciegamente la traducción al ruso, el ucraniano ahora sigue su propio camino. A veces esto significa que simplemente contiene más traducciones incorrectas y formas de palabras. A veces, que no hay errores en él donde está en ruso.

Anteriormente, una traducción incorrecta, si la había, entonces inmediatamente en todos los idiomas: en el mismo lugar, el mismo error. Esto se debió a un "enganche" en la traducción al inglés. Ahora los errores aparecen esporádicamente: en un idioma y luego en otro, cuando todo está bien en inglés y otros idiomas de destino. En ucraniano, esto sucede con mucha más frecuencia que en otros idiomas de la muestra. Además, en la traducción de tres textos diferentes del ucraniano al alemán, francés y polaco hay muchas distorsiones absurdas, que no se traducen al inglés. Además, junto con Ucrania, aproximadamente un tercio de los nombres están distorsionados, aunque la transferencia exacta de nombres es una característica tradicional de Google desde "tiempos inmemoriales". Ejemplos: Bloodd en lugar de Bloodood, Daphne du Morley en lugar de Daphne de Maurier, Racine en lugar de Rachel; en otros lugares, Rachel se deletreaba correctamente solo en inglés, pero Racch aparecía en alemán, francés y polaco). Sugerí que tales distorsiones no son un error del glosario, sino una falla del sistema "situacional", y en otro texto el mismo nombre se puede transferir correctamente. La hipótesis fue confirmada, excepto en el caso de Daphne du "Morley".

El traductor neuronal no funciona con significados


El traductor estadístico trabajó bien con el reconocimiento de términos, nombres, frases y, a menudo, eligió con éxito el significado de las palabras en el contexto de una oración. Los problemas comenzaron cuando no fue posible interpretar correctamente la relación entre las palabras, su papel gramatical. En las traducciones de 2017, se nota una mejora significativa en esta dirección, es decir, los lugares no reconocidos se han vuelto menos. ¿Es esta una traducción adecuada? En realidad no El traductor neuronal está vinculado a la estructura de la oración. Hace un buen trabajo transformando las construcciones del lenguaje de un lenguaje a otro. El servicio toma el significado no de una oración o párrafo, sino de segmentos más pequeños (que se hizo mucho mejor definir) y piezas de "pegamento" de acuerdo con las reglas gramaticales del idioma de destino.

Dichos productos siguen siendo una ayuda para comprender el original, pero no un texto de alta calidad (aunque algunas de las oraciones se pueden traducir perfectamente).

Lo que falta


A los traductores profesionales se les enseña a transmitir significado en sus propias palabras, sin estar atados a la estructura de la oración fuente. Una traducción adecuada debe buscar la transmisión palabra por palabra y frase sabia a transformaciones semánticas.

¿Cuántas fases intermedias desde la etapa actual de desarrollo de la traducción automática hasta la literaria, lo que implica la posesión de normas de estilo y la transferencia de imágenes? Tanto como antes de la creación de inteligencia artificial, capaz de razonar.
A veces me parece que las normas del lenguaje cambiarán antes. Debido al hecho de que leemos muchas "subtraducciones" del inglés, nuestra lengua materna puede ser más tolerante con los ingleses, no solo a las frases individuales, sino también a la estructura extraña de las frases. Las lenguas que se forman sobre la base de la lengua del colonialista y la lengua de la población local se llaman pidjins. Toman neologismos del colonizador; la gramática deja la suya. Un ejemplo vívido: un discurso de nuestros antiguos conciudadanos en Brighton Beach (y en otros lugares de residencia en el extranjero) o una oficina rústica: las terminaciones rusas "se adhieren" a palabras en inglés. Validar, agregar, compartir, etc.

Lo que sucede en la traducción automática es el proceso opuesto: las palabras rusas con terminaciones rusas forman frases un poco incómodas pero comprensibles. No decimos eso. Pero puedes entender. Es como el discurso de un extranjero que habla bien ruso: parece que no hay acento, y el vocabulario es elegante, y las formas de las palabras son correctas, pero a veces "me ducho", "tomo un taxi", "honrar este principio requiere que intentemos un nuevo método de persuasión". ". Este nivel sigue siendo el límite para el traductor neuronal. No hace falta decir que esta es una barra muy alta? Además, el servicio "posee" en este nivel más de un centenar de idiomas y agrega nuevos con relativa facilidad. "Traductor con acento inglés".

¿Qué le falta exactamente al nivel de la traducción literaria?


Para aclarar de qué se quejan los traductores, en conclusión daré ejemplos de traducción automática y no automática del inglés al ruso.

Nadie que reflexione sobre su vida ha deseado que hubiera habido menos momentos de ese tipo.
Google: Nadie que reflexionó sobre su vida soñó que hubiera menos momentos de ese tipo.
Humano: Mirando hacia atrás en la vida pasada, nadie dirá que hubo demasiados momentos.

¿Es la civilización solo una chapa sobre un núcleo violento?
Google: ¿Es la civilización solo una chapa sobre un núcleo feroz?
Humano: ¿Es el hombre una bestia cruel bajo una delgada capa de civilización? // ¿Una persona bajo una delgada capa de civilización es una bestia cruel?

Referencias


1. Google Translate, 2012
2. : 7 -, 2012
3. Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation, 2016
4. Google's Multilingual Neural Machine Translation System: Enabling Zero-Shot Translation, 2016
5. A Neural Network for Machine Translation, at Production Scale, 2016
6. Google Puts Its Virtual Brain Technology to Work, 2012
7. Google Translate , 2016
8. (), 2017
9. [ GNMT], 2017

Source: https://habr.com/ru/post/es414343/


All Articles