O Google Tradutor está conectado a uma rede neural


Modelo de arquitetura GNMT (tradução automática neural do Google). À esquerda está a rede do codificador, à direita está o decodificador, no meio está o módulo de atenção. A camada inferior do codificador tem dois lados: os módulos rosa coletam informações da esquerda para a direita e os verdes na direção oposta.O

Google vai transferir completamente o serviço Google Translate para o aprendizado profundo . Uma descrição detalhada do algoritmo de rede neural é publicada em arXiv.org.

De acordo com estimativas preliminares do Google, uma rede neural oferece uma qualidade de tradução muito melhor do que os métodos estatísticos convencionais. Ele já foi testado no par de idiomas inglês-chinês mais difícil e a rede neural reduziu imediatamente o número de erros de tradução em 60%. O resultado é impressionante. Outros pares de idiomas serão conectados à rede neural nos próximos meses.


A estrutura das comunicações bidirecionais no nível inferior do codificador O

sucesso no campo da tradução automática é outra conquista da IA, da qual muito se acumulou recentemente. A tecnologia de redes neurais treinadas está claramente em ascensão e é usada em vários campos. Foi alcançada uma superioridade particularmente clara sobre outras técnicas de computador no reconhecimento de imagens e jogos. Em algumas áreas, as redes neurais funcionam ainda mais eficientemente do que o cérebro humano, por exemplo, elas vencem uma pessoa em jogos de tabuleiro separados.

A rede neural do Google para tradução automática é chamada de Sistema de tradução automática neural (NMTS). Desde o início até o fim, a tradução do texto agora realiza plenamente a rede neural. Tradicionalmente, a IA era usada no Google Translate em um modo limitado, para algumas tarefas auxiliares. Por exemplo, para comparar textos disponíveis em várias línguas, como documentos oficiais da ONU ou o Parlamento Europeu. Nesse modo, a tradução de cada palavra nos textos foi comparada.

A rede neural do NMTS opera em um nível fundamentalmente novo. Ela não apenas analisa as opções de tradução existentes no processo de aprendizado, mas também realiza uma análise intelectual das frases, dividindo-as em "segmentos de dicionário". Em uma certa representação dentro da rede, esses "segmentos de dicionário" correspondem aos significados das palavras .


A animação do Google mostra como uma frase em chinês é dividida em partes e, em seguida, a rede neural seleciona uma tradução adequada, levando em consideração o peso de cada fragmento no texto original.Em

certo sentido, essa abordagem se assemelha ao trabalho das redes neurais na visão de máquina. O sistema processa a imagem pixel por pixel. Em seguida, o nível de processamento aumenta gradualmente, atingindo recursos complexos como limites de objetos, padrões geométricos etc. No NMTS, a mesma rede neural que analisa o texto fonte e oferece sua tradução.

Nesse caso, os desenvolvedores do Google aplicaram desenvolvimentos existentes nessa área, bem como várias "inovações metodológicas", comentamtrabalho acadêmico independente publicado em arXiv.org. Na opinião deles, o desenvolvimento do Google mostra um resultado "surpreendente" e demonstra claramente que a tradução neural usando IA pode superar em muito a qualidade dos métodos clássicos de tradução automática. A rede neural do Google claramente melhora a qualidade da tradução de várias maneiras.

Para otimizar, o NMTS foi testado em equipamentos de computador especialmente projetados para testar uma rede neural. Foi lá que a rede neural AlphaGo foi treinada na época, que depois derrotou Lee Sedol , um dos melhores jogadores do mundo.

Para avaliar a eficácia do sistema, os pesquisadores selecionaram um grande conjunto de ofertas da Wikipedia e artigos na Internet. Esses textos alimentavam o NMTS, no antigo sistema de tradução automática do Google Translate, e também o eram para tradutores humanos. No âmbito do teste cego, tradutores humanos avaliaram a qualidade da tradução de cada fragmento (incluindo tradução humana).

Exemplos de tradução de textos em chinês, espanhol, francês e inglês com um sistema de tradução automática convencional (azul), rede neural (verde) e humano (laranja)

O par de idiomas chineses é conhecido por sua alta complexidade. Apesar de uma diminuição significativa no número de erros, a qualidade da tradução nesse par de idiomas ainda é inferior à qualidade da tradução de outros idiomas indo-europeus. Em alguns pares de idiomas, a tradução do NMTS é muito próxima da tradução das pessoas, mas os autores do trabalho científico alertam que é muito cedo para tirar conclusões de longo alcance, porque a comparação foi feita em um conjunto limitado de frases simples cuidadosamente selecionadas.



O mesmo resulta em uma forma mais visual.



Segundo os especialistas, um computador poderá abordar ou contornar uma pessoa em termos de qualidade de tradução somente se canais adicionais de informações recebidas estiverem conectados ao sistema de tradução automática. Não apenas texto, mas também vídeo e som. "No futuro, os robôs poderão se mover, manipular objetos, sentir dor através de sensores de dor - e expressar seus sentimentos no texto", diz Jürgen Schmidhuber, da Universidade de Lugano (Suíça).

Atualmente, o sistema Google Translate processa cerca de 10.000 pares de idiomas para tradução automática.

Source: https://habr.com/ru/post/pt397959/


All Articles