
Recentemente, fomos sussurrados que, em cinco anos, tradutores e professores de idiomas simplesmente não serão necessários. E o fato é que os sistemas neurais de inteligência artificial estão se desenvolvendo muito ativamente.
Assim, eles traduzirão texto e fala de maneira tão qualitativa e rápida que a necessidade de especialistas vivos simplesmente desaparecerá.
É claro que rimos, mas pensamos nisso. E eles decidiram se aprofundar no assunto e descobrir o que há com inteligência artificial e se isso realmente nos deixará sem trabalho.
O que é uma rede neural artificial
Em suma, uma rede neural artificial é criada na tentativa de simular o funcionamento do cérebro humano usando algoritmos matemáticos.
A principal característica da rede neural é a capacidade de aprender. Do ponto de vista dos matemáticos, esse processo parece um problema de otimização não-linear, que utiliza métodos discriminantes de análise e agrupamento.
Se for para ciências humanas, uma rede neural artificial é capaz de analisar dados usando algoritmos complexos e conduzir operações com sistemas matemáticos bem definidos e sistemas de linguagem difusa.
Dois exemplos que iremos analisar.
Um sistema matemático bem definido é o xadrez . O jogo tem várias regras claras que são absolutas a serem cumpridas. Há um objetivo específico - dar xeque-mate em um oponente.
E há uma enorme variedade de movimentos possíveis, entre os quais você precisa escolher aqueles que levarão à vitória.
A dificuldade de analisar um jogo de xadrez é que o número de jogos de xadrez exclusivos é próximo de 10 ^ 120. Sim, sim, são 10 a 120 graus. Em comparação, o número de átomos no Universo observável é de aproximadamente 10 ^ 79.
Analisar todas as posições é fisicamente irrealista. Portanto, o sistema é forçado a escolher movimentos e técnicas que levem a um ganho imediato ou fortalecimento estratégico da posição.
Um segundo exemplo de uso de uma rede neural é a tradução de um idioma para outro . Este é um sistema de processamento de dados completamente diferente, porque existem centenas de regras e milhares de nuances de idiomas que precisam ser considerados na tradução.
Além disso, o sistema precisa entender o contexto para traduzir palavras ou trocadilhos intraduzíveis. Caso contrário, como você pode encontrar a tradução correta de uma frase com o verbo "set", que possui apenas 44 valores reconhecidos?
Ou uma tarefa ainda mais difícil é transmitir sutil humor inglês, para que o russo possa rir dele. Ou ainda mais difícil é traduzir o verso. Ou ... bem, você entendeu.
Agora, brevemente, sobre como funciona uma rede neural.
O sistema primeiro decompõe os dados em componentes elementares. E então uma ou mais camadas ocultas dos algoritmos analisam os dados e realizam a transformação.

Nas redes neurais profundas, existem várias camadas de algoritmos que lidam com a análise. Muitas vezes, eles são de natureza em cascata, na qual as informações da camada inferior são transferidas para a camada que está na hierarquia acima e processam as informações em um nível diferente.

Além disso, se os algoritmos encontrarem dependências claras nos dados, novos algoritmos serão criados com base.
No xadrez, por exemplo, uma máquina rapidamente inventa táticas para desenvolver peças rapidamente e capturar campos centrais.
E tudo porque essas manobras quase sempre dão uma vantagem na abertura.
Observe que, nas regras do jogo, isso não chega nem perto, mas a maioria dos jogos confirma a hipótese, portanto a máquina começa a usá-la.
***
O mesmo se aplica à tradução dos significados de uma palavra, que em diferentes idiomas pode ser muito diferente.
Por exemplo, pegue a palavra arco. Ele tem duas variantes básicas, mas radicalmente diferentes de significados - um vegetal ("cebola") e uma pequena arma ("arco"). Há outro terço da gíria - “cebola” refere-se a uma combinação de roupas ou uma imagem da moda (papel vegetal do “visual” inglês). É raramente usado, mas a rede neural também deve "conhecê-lo".
Para descobrir qual opção de tradução usar, o sistema neural atribui seus próprios parâmetros a cada valor, que também depende das palavras usadas nas proximidades da frase.
Assim, na frase "Querida, compre um quilo de cebola e batata", o sistema traduzirá "cebola" como "cebola". E tudo porque existe um "quilograma" nas proximidades, que não é usado com armas pequenas, e uma "batata", que também se refere ao parâmetro "vegetal".

Da mesma forma, com a frase "O atirador puxou o arco e atirou uma flecha no inimigo". Você pode "puxar" apenas um arco como arma. Além disso, há a palavra "atirador". Portanto, obtemos a tradução - "arco".

Interessante. A palavra "flecha", neste caso, não será considerada significativa na determinação do significado da palavra "arco". E tudo porque a "flecha" também pode significar o caule verde da cebola como um vegetal. Portanto, mais cedo ou mais tarde, uma exceção será adicionada ao sistema que não levará em consideração a palavra “flecha” no contexto de um arco.
Conforme o sistema aprende, o número de algoritmos e parâmetros aumenta. Alguns deles estão melhorando e se tornando mais complicados, outros estão sendo substituídos por opções mais compactas.
E o resultado é um fenômeno quando, de acordo com suas conclusões, a máquina se aproxima de uma pessoa. E isso apesar do fato de ainda ser utilizado um sistema de algoritmos, mesmo complexos e multiníveis.
Que a cibernética e os matemáticos não jurem. Na verdade, somos humanistas no bom sentido da palavra e escrevemos um artigo para nós mesmos de humanóides semelhantes.
Algumas palavras sobre Alpha Zero e xadrez

Em 2017, a DeepMind, uma subsidiária do Google, lançou um programa atualizado para redes neurais. Os desenvolvedores decidiram testar o programa nos jogos estratégicos mais populares com regras claramente estabelecidas: xadrez, go e shogi.
O processo de aprendizagem de um programa de xadrez levou apenas 24 horas. Somente as regras do jogo foram inseridas no sistema - só isso. Nenhuma biblioteca de estreia ou banco de dados de terceiros. Apenas as regras. E 24 horas o programa tocava sozinho.
No primeiro jogo, movimentos absolutamente aleatórios foram feitos. É verdade que não pode ser visto em nenhum lugar - as informações são extraídas das palavras dos desenvolvedores. Como resultado, um lado perdeu e o sistema considerou que as ações do segundo lado eram melhores para vencer.
Após 24 horas e 44 milhões de jogos disputados, o AlphaZero se tornou o jogador de xadrez mais forte da história do jogo. A classificação AlphaZero da Elo é de aproximadamente 3.500 pontos, embora de acordo com várias fontes atinja 5.000.
Para comparação, a classificação média amadora é 1200 Elo, o mestre dos esportes no xadrez é 2200-2400 Elo. A classificação máxima que Elo recebeu pelo homem é Magnus Carlsen, o atual campeão do mundo. Em 21 de abril de 2014, atingiu o valor de 2889,2 pontos da Elo.

Alpha Zero joga cerca de 600 pontos mais forte (na versão mais otimista). É como um mestre de esportes jogando com um jogador de segunda classe. E o jogador de segunda categoria aqui é apenas o jogador humano mais forte.
Para conhecedores de xadrez. Aqui está uma análise de
alguns jogos de Alpha Zero contra Stockfish do grande mestre russo Sergey Shipov. E para ser sincero, ficamos impressionados.
Alpha Zero e Stockfish: qual a diferença
O Stockfish foi o programa de xadrez de computador mais forte até o Alpha Zero o humilhar.
Vale ressaltar que o Stockfish analisou 70 milhões de posições por segundo e o Alpha Zero - apenas 40.000, o que considerou promissor pelo método de Monte Carlo.
Ou seja, a rede neural não avalia cada movimento individual, mas a soma dos resultados dos empates, eliminando os empates que levam a uma posição perdida.
Como resultado, o Alpha Zero gastou 99,99% menos recursos em análise.
Como resultado, de 100 jogos, o Alpha Zero venceu 28, 72 empatados e não perdeu nenhum.
Quanto ao xadrez, a inteligência artificial neural já superou o homem e seus colegas de máquinas mais antigos.
Mas isso de fato se aplica a um sistema fechado com um pequeno conjunto inicial de regras.
Agora vamos lidar com o sistema de idiomas.
Inteligência Artificial Neural e Tradução

Estamos bem familiarizados com a criação do Google no campo da tradução - Google Translate.
Portanto, o Google Translate com traduções funciona de maneira um pouco diferente do Alpha Zero no xadrez. No xadrez, o sistema analisa conjuntos individuais de movimentos que levam ao resultado mais lucrativo. Para transferências, uma rede bidirecional é usada. Um fluxo divide a sentença original em elementos semânticos e o segundo os reproduz na ordem correta em outro idioma.
Algo assim acontece. A proposta é dividida em componentes. Além disso, a palavra não é o menor componente, porque os significados da palavra são considerados um nível mais profundo.Os elementos constituintes resultantes são analisados em significado usando algoritmos - as mesmas camadas ocultas de autoaprendizagem. A proposta é analisada primeiro em partes, depois - todas juntas e até na direção oposta. De fato, por exemplo, em alemão, a partícula "nicht" no final de uma frase muda radicalmente todo o seu significado.
Representação esquemática do processo. Cada camada de algoritmos analisa a sentença em diferentes configurações e, em seguida, “coleta” a sentença dos significados recebidos em outro idioma, levando em consideração suas características gramaticais.Mas se tudo está claro no xadrez, o idioma é um sistema mais flexível nas regras, que também permite a tradução de sentenças precisas não apenas “na letra”, mas também “no espírito”. Ou seja, o tradutor pode sacrificar conscientemente a precisão da tradução literal, a fim de transmitir o significado mais profundamente.
Tradução de ficção de poemas
Um exemplo comum é a tradução de versos. Afinal, é quase impossível traduzir uma única quadra para preservar imediatamente o ritmo, o arranjo das palavras e o significado completo.
Simplesmente não pode haver algoritmos uniformes, porque muitas vezes você precisa refazer radicalmente um verso para transmitir seu significado real.
Obviamente, a tradução de versos é uma das áreas mais difíceis da lingüística, mas as redes neurais já se mostraram as melhores em cálculos precisos; portanto, começaremos pelas mais difíceis.

Por exemplo, veja o segundo soneto de Shakespeare. Como alternativa, citamos o texto original, a tradução de S. Trukhtanov (escolhemos essa opção dentre muitas puramente subjetivamente) e a tradução do Google Translate.
Original:
Quando quarenta invernos cercarem tua testa,
E cavar trincheiras profundas no campo da tua beleza,
A libré orgulhosa da sua juventude, então olhei agora,
Será uma erva esfarrapada, de pequeno valor:
Então ser perguntado onde está toda a tua beleza,
Onde todo o tesouro dos teus dias luxuriantes,
Para dizer, dentro de teus próprios olhos fundos,
Era uma vergonha que tudo comia e um elogio sem piedade.
Quanto mais elogios mereciam o uso de tua beleza,
Se você pudesse responder "Este meu belo filho
Vou somar minha conta e dar minha velha desculpa.
Provando sua beleza por sucessão!
Isso deveria ser feito de novo quando você for velho,
E veja seu sangue quente quando sentir frio.
Como você pode ver, o inglês está claramente desatualizado aqui - há até uma segunda pessoa singular que não é usada no inglês moderno. E isso complica ainda mais a tradução.
Em geral, não analisaremos a diferença entre tradução humana e tradução automática:

E para ser sincero, isso está longe do melhor desempenho do Google. Talvez seja por isso que os adeptos das traduções automáticas ficam constrangidos quando perguntados se seus algoritmos com versos funcionarão. Afinal, mesmo o famoso Google Translate nem lida de perto com isso.
Ficção tradução de prosa
Nesse caso, tente algo mais simples. Prosa artística. O Grande Gatsby Fitzgerald.

Original:
“Nos meus anos mais jovens e mais vulneráveis, meu pai me deu alguns conselhos que tenho pensado desde então.
"Sempre que você quiser criticar alguém", ele me disse, "lembre-se de que todas as pessoas neste mundo não tiveram as vantagens que você teve".
Agora compare as traduções do homem e da máquina. Como defensor da humanidade, pegamos a tradução de N. Lavrov.

A tradução de Lavrov não corresponde exatamente ao original. Há mudanças no arranjo das frases, as frases são um pouco mais expandidas do que em inglês. Mas, em geral, a impressão é harmoniosa, o significado e o humor são totalmente transmitidos.
A tradução automática é mais precisa em termos de mecânica - as frases são traduzidas exatamente como estão escritas no original. O significado é transmitido muito bem, mas há problemas com "você-você" e tudo parece muito desajeitado.
Nas traduções literárias, pode-se sacrificar um pouco de precisão pelo bem da harmonia ou pela harmonia das frases. Tradutores humanos usam isso, mesmo desnecessariamente, mas a máquina não.
Então, o que vem a seguir?
É verdade que, por uma questão de justiça, é preciso mencionar que o Google Translate traduz textos técnicos, nos quais a precisão literal da tradução é importante, perfeita e praticamente sem erros. Mas os personagens que afirmam que os tradutores ficarão sem trabalho em 5 a 10 anos podem ser enviados com segurança em uma longa caminhada.
Os processadores e algoritmos de processamento de dados existentes podem lidar com sistemas que possuem um conjunto limitado de regras. Xadrez ou ir são apenas isso. Porém, com variedades flexíveis de sistemas como linguagens, onde os limites das regras são obscurecidos, o programa precisa adicionar algoritmos desnecessariamente complexos que funcionam longe de serem perfeitos.
É possível que os algoritmos precisem de mais tempo para aprender a trabalhar com idiomas com precisão. Bem, faremos nosso trabalho ainda mais e rastrearemos o sucesso das redes neurais nesse campo.
Mas não confie em redes neurais artificiais por enquanto - aprenda inglês e desenvolva o seu próprio.
EnglishDom.com - uma plataforma de aprendizado de inglês online

Aprenda inglês em cursos on-line da EnglishDom.com. Por
referência - 2 meses de assinatura para todos os cursos como presente.
E para comunicação ao vivo, escolha o treinamento do Skype com um professor. A primeira aula experimental é gratuita, registre-se aqui. Pelo código promocional
goodhabr2 - 2 lições de presente ao comprar 10 lições. O bônus é válido até 31/05/19.