Google Translate ist mit einem neuronalen Netzwerk verbunden


GNMT-Architekturmodell (Google Neural Machine Translation). Links ist das Encoder-Netzwerk, rechts der Decoder, in der Mitte das Aufmerksamkeitsmodul. Die unterste Ebene des Encoders ist zweiseitig: Rosa Module sammeln Informationen von links nach rechts und grüne in die entgegengesetzte Richtung

. Google wird den Google Translate-Dienst vollständig auf Deep Learning übertragen . Eine detaillierte Beschreibung des Algorithmus des neuronalen Netzes wurde veröffentlicht am arXiv.org.

Nach vorläufigen Schätzungen von Google bietet ein neuronales Netzwerk eine viel bessere Übersetzungsqualität als herkömmliche statistische Methoden. Es wurde bereits im schwierigsten Englisch-Chinesisch-Sprachpaar getestet, und das neuronale Netzwerk reduzierte die Anzahl der Übersetzungsfehler sofort um 60%. Das Ergebnis ist beeindruckend. Andere Sprachpaare werden sich in den nächsten Monaten mit dem neuronalen Netzwerk verbinden.


Die Struktur der bidirektionalen Kommunikation auf der unteren Ebene des Encoders

Erfolg im Bereich der maschinellen Übersetzung ist eine weitere Errungenschaft der KI, von der sich in letzter Zeit viel angesammelt hat. Die Technologie trainierter neuronaler Netze ist eindeutig auf dem Vormarsch und wird in verschiedenen Bereichen eingesetzt. Bei der Bilderkennung und bei Spielen wurde eine besonders deutliche Überlegenheit gegenüber anderen Computertechniken erzielt. In einigen Bereichen arbeiten neuronale Netze sogar effizienter als das menschliche Gehirn. Beispielsweise schlagen sie eine Person in separaten Brettspielen.

Das neuronale Netzwerk von Google für maschinelle Übersetzung wird als neuronales maschinelles Übersetzungssystem (NMTS) bezeichnet. Von Anfang bis Ende erfüllt die Übersetzung des Textes das neuronale Netzwerk vollständig. Traditionell wurde AI in Google Translate in einem eingeschränkten Modus für einige Hilfsaufgaben verwendet. Zum Beispiel, um Texte zu vergleichen, die in mehreren Sprachen verfügbar sind, z. B. offizielle UN-Dokumente oder das Europäische Parlament. In diesem Modus wurde die Übersetzung jedes Wortes in den Texten verglichen.

Das neuronale NMTS-Netzwerk arbeitet auf einer grundlegend neuen Ebene. Sie analysiert nicht nur vorhandene Übersetzungsoptionen im Lernprozess, sondern führt auch eine intellektuelle Analyse von Sätzen durch und unterteilt sie in „Wörterbuchsegmente“. In einer bestimmten Darstellung innerhalb des Netzwerks entsprechen diese „Wörterbuchsegmente“ den Bedeutungen von Wörtern .


Die Google-Animation zeigt, wie ein chinesischer Satz in Teile unterteilt wird. Anschließend wählt das neuronale Netzwerk eine geeignete Übersetzung aus, wobei das Gewicht jedes Fragments im Originaltext berücksichtigt wird.

In gewissem Sinne ähnelt dieser Ansatz der Arbeit neuronaler Netzwerke in der Bildverarbeitung. Das System verarbeitet das Bild Pixel für Pixel. Dann steigt der Verarbeitungsgrad allmählich an und erreicht so komplexe Merkmale wie die Grenzen von Objekten, geometrischen Mustern usw. In NMTS bietet dasselbe neuronale Netzwerk, das den Quelltext analysiert, seine Übersetzung an.

In diesem Fall haben Google - Entwickler die bestehende Forschung in diesem Bereich, sowie eine Reihe von gebrauchten „methodischer Innovation“ , kommentierteunabhängige wissenschaftliche Arbeit auf arXiv.org veröffentlicht. Ihrer Meinung nach zeigt die Entwicklung von Google ein „erstaunliches“ Ergebnis und zeigt, dass die neuronale Übersetzung mit KI die Qualität klassischer maschineller Übersetzungsmethoden in ihrer Qualität bei weitem übertreffen kann . Das neuronale Netzwerk von Google verbessert die Übersetzungsqualität in vielerlei Hinsicht.

Zur Optimierung wurde NMTS an Computergeräten getestet, die speziell zum Testen eines neuronalen Netzwerks entwickelt wurden. Dort wurde zu dieser Zeit das neuronale AlphaGo-Netzwerk trainiert, das danach Lee Sedol , einen der besten Go-Spieler der Welt , besiegte .

Um die Wirksamkeit des Systems zu bewerten, wählten die Forscher eine Vielzahl von Angeboten aus Wikipedia und Nachrichtenartikeln im Internet aus. Diese Texte speisten NMTS in das alte maschinelle Übersetzungssystem von Google Translate ein und gaben es auch an menschliche Übersetzer weiter. Im Rahmen von Blindtests bewerteten menschliche Übersetzer die Qualität der Übersetzung jedes Fragments (einschließlich menschlicher Übersetzung).

Beispiele für die Übersetzung von Texten in Chinesisch, Spanisch, Französisch und Englisch mit einem herkömmlichen maschinellen Übersetzungssystem (blau), einem neuronalen Netzwerk (grün) und einem menschlichen (orange)

Das englischsprachige chinesische Sprachpaar ist bekannt für seine hohe Komplexität. Trotz eines signifikanten Rückgangs der Anzahl der Fehler ist die Qualität der Übersetzung in diesem Sprachpaar immer noch schlechter als die Qualität der Übersetzung anderer indogermanischer Sprachen. In einigen Sprachpaaren entspricht die NMTS-Übersetzung in ihrer Qualität der Übersetzung durch Personen, aber die Autoren der wissenschaftlichen Arbeit warnen davor, dass es zu früh ist, weitreichende Schlussfolgerungen zu ziehen, da der Vergleich mit einer begrenzten Anzahl sorgfältig ausgewählter einfacher Sätze durchgeführt wurde.



Das gleiche ergibt eine visuellere Form.



Experten zufolge kann ein Computer eine Person in Bezug auf die Übersetzungsqualität nur dann ansprechen oder umgehen, wenn zusätzliche Kanäle für eingehende Informationen mit dem maschinellen Übersetzungssystem verbunden sind. Nicht nur Text, sondern auch Video und Ton. „In Zukunft können Roboter durch Schmerzsensoren Objekte bewegen, manipulieren, Schmerzen fühlen - und ihre Gefühle im Text ausdrücken“, sagt Jürgen Schmidhuber von der Universität Lugano (Schweiz).

Das Google Translate-System verarbeitet derzeit rund 10.000 Sprachpaare für die maschinelle Übersetzung.

Source: https://habr.com/ru/post/de397959/


All Articles