Alpha Zero, les échecs et l'apprentissage de l'anglais: le présent et l'avenir de l'intelligence artificielle



Ici, nous avons récemment murmuré que dans cinq ans, les traducteurs et les professeurs de langues ne seront tout simplement plus nécessaires. Et le fait est que les systèmes neuronaux de l'intelligence artificielle se développent très activement.

Par exemple, ils traduiront le texte et le discours si qualitativement et rapidement que le besoin de spécialistes vivants disparaîtra tout simplement.

Bien sûr, nous avons ri, mais nous y avons pensé. Et ils ont décidé d'approfondir le sujet et de découvrir ce qu'il y a avec l'intelligence artificielle et si cela nous laissera vraiment sans travail.

Qu'est-ce qu'un réseau neuronal artificiel


En bref, un réseau neuronal artificiel est créé dans le but de simuler le fonctionnement du cerveau humain à l'aide d'algorithmes mathématiques.

La principale caractéristique du réseau neuronal est la capacité d'apprendre. Du point de vue des mathématiciens, ce processus ressemble à un problème d'optimisation non linéaire, qui utilise des méthodes d'analyse et de clustering discriminantes.

Si pour les sciences humaines, un réseau de neurones artificiels est capable d'analyser des données à l'aide d'algorithmes complexes et de mener des opérations avec des systèmes mathématiques bien définis et des systèmes de langage flou.
Deux exemples que nous analyserons.

Les échecs sont un système mathématique bien défini. Le jeu a un certain nombre de règles claires qui sont absolues à remplir. Il y a un objectif spécifique: mater un adversaire.

Et il existe un large éventail de mouvements possibles, parmi lesquels vous devez choisir ceux qui mèneront à la victoire.

La difficulté d'analyser une partie d'échecs est que le nombre de parties d'échecs uniques est proche de 10 ^ 120. Oui, oui, c'est de 10 à 120 degrés. En comparaison, le nombre d'atomes dans l'Univers observable est d'environ 10 ^ 79.

Analyser toutes les positions est physiquement irréaliste. Par conséquent, le système est obligé de choisir des mouvements et des techniques qui conduisent à un gain immédiat ou à un renforcement stratégique de la position.

Un deuxième exemple d'utilisation d'un réseau de neurones est la traduction d'une langue dans une autre . Il s'agit d'un système de traitement des données complètement différent, car il y a des centaines de règles et des milliers de nuances de langues à prendre en compte lors de la traduction.

De plus, le système doit comprendre le contexte afin de traduire des mots ou des jeux de mots intraduisibles. Sinon, comment trouver la traduction correcte d'une phrase avec le verbe "set", qui n'a que 44 valeurs reconnues?

Ou une tâche encore plus difficile consiste à transmettre un humour anglais subtil afin que le russe puisse en rire. Ou encore plus difficile est de traduire le verset. Ou ... eh bien, vous obtenez le point.

Maintenant, brièvement sur le fonctionnement d'un réseau de neurones.

Le système décompose d'abord les données en composants élémentaires. Et puis une ou plusieurs couches cachées des algorithmes analysent les données et effectuent la transformation.



Dans les réseaux de neurones profonds, plusieurs couches d'algorithmes traitent de l'analyse. Souvent, ils sont en cascade, dans lesquels les informations de la couche inférieure sont transférées vers la couche qui est dans la hiérarchie ci-dessus et traite les informations à un niveau différent.



De plus, si les algorithmes trouvent des dépendances claires dans les données, de nouveaux algorithmes sont créés sur leur base.
Aux échecs, par exemple, une machine «invente» très rapidement des tactiques pour développer rapidement des pièces et capturer des champs centraux.

Et tout cela parce que de telles manœuvres donnent presque toujours un avantage à l'ouverture.

Notez que dans les règles du jeu ce n'est même pas proche, mais la plupart des jeux joués confirment l'hypothèse, donc la machine commence à l'utiliser elle-même.

***

Il en va de même pour la traduction des significations d'un mot, qui dans différentes langues peuvent être très différentes.

Par exemple, prenez le mot arc. Il a deux variantes fondamentales mais radicalement différentes de significations - un légume ("oignon") et une petite arme ("arc"). Il existe un autre tiers d'argot - «oignon» fait référence à une combinaison de vêtements ou à une image à la mode (papier calque de l'anglais «look»). Il est rarement utilisé, mais le réseau de neurones devrait également le «connaître».

Pour savoir quelle option de traduction utiliser, le système neuronal attribue ses propres paramètres à chaque valeur, qui dépendent également des mots utilisés à proximité dans la phrase.

Ainsi, dans la phrase «Miel, achète un kilogramme d'oignons et de pommes de terre», le système traduira «oignons» par «oignon». Et tout cela parce qu'il y a un «kilogramme» à proximité, qui n'est pas utilisé avec des armes légères, et une «pomme de terre», qui fait également référence au paramètre «végétal».



De même, avec la phrase "Le tireur a tiré son arc et a tiré une flèche sur l'ennemi". Vous ne pouvez "tirer" qu'un arc comme arme. De plus, il y a le mot «shooter». Par conséquent, nous obtenons la traduction - "arc".



Intéressant. Dans ce cas, le mot «flèche» ne sera pas considéré comme significatif pour déterminer la signification du mot «arc». Et tout cela parce que la «flèche» peut aussi signifier la tige verte de l'oignon comme légume. Par conséquent, tôt ou tard, une exception sera ajoutée au système qui ne tiendra pas compte du mot «flèche» dans le contexte d'un arc.
À mesure que le système apprend, le nombre d'algorithmes et de paramètres augmente. Certains d'entre eux s'améliorent et deviennent plus compliqués, certains sont remplacés par des options plus compactes.

Et le résultat est un phénomène lorsque, selon ses conclusions, la machine se rapproche d'une personne. Et cela malgré le fait qu'il existe encore un système d'algorithmes, même complexe et multi-niveaux.

Que la cybernétique et les mathématiciens ne jurent pas. Si quoi que ce soit, alors nous sommes des humanistes dans le bon sens du terme, et nous avons écrit un article pour nous sur des humanoïdes similaires.

Quelques mots sur Alpha Zero et les échecs




En 2017, DeepMind, une filiale de Google, a publié un programme mis à jour pour les réseaux de neurones. Les développeurs ont décidé de tester le programme sur les jeux stratégiques les plus populaires avec des règles clairement établies: échecs, go et shogi.

Le processus d'apprentissage d'un programme d'échecs n'a pris que 24 heures. Seules les règles du jeu ont été entrées dans le système - c'est tout. Pas de premières bibliothèques ou bases de données de fête. Seules les règles. Et 24 heures, le programme a joué avec lui-même.

Dans le premier jeu, des mouvements absolument aléatoires ont été effectués. Certes, il ne peut être vu nulle part - les informations sont tirées des mots des développeurs. En conséquence, un côté a perdu et le système a considéré que les actions du deuxième côté étaient meilleures pour gagner.

Après 24 heures et 44 millions de matchs joués avec lui-même, AlphaZero est devenu le joueur d'échecs le plus fort de l'histoire du jeu. La cote AlphaZero d'Elo est d'environ 3 500 points, bien que selon diverses sources, elle atteigne 5 000.

A titre de comparaison, la cote moyenne amateur est de 1200 Elo, le maître du sport aux échecs est de 2200-2400 Elo. La note maximale reçue par Elo par l'homme est Magnus Carlsen, le champion du monde en titre. Le 21 avril 2014, il atteignait 2889,2 points d'Elo.



Alpha Zero joue environ 600 points de plus (dans la version la plus optimiste). C'est comme un maître du sport jouant avec un joueur de second ordre. Et le joueur de second ordre ici n'est que le joueur humain le plus fort.

Pour les connaisseurs d'échecs. Voici une analyse de certains jeux d'Alpha Zero contre Stockfish du grand maître russe Sergey Shipov. Et pour être honnête, nous avons été impressionnés.
Alpha Zero et Stockfish: quelle est la différence

Stockfish était le programme d'échecs informatique le plus puissant jusqu'à ce qu'Alpha Zero l'humilie.

Il est à noter que Stockfish a analysé 70 millions de positions par seconde, et Alpha Zero - seulement 40 000, ce qu'il considérait comme prometteur selon la méthode de Monte Carlo.

Autrement dit, le réseau neuronal n'évalue pas chaque mouvement individuel, mais la somme des résultats des tirages de mouvements, coupant les tirages qui conduisent à une position perdante.

En conséquence, Alpha Zero a dépensé 99,99% de ressources en moins pour l'analyse.

En conséquence, sur 100 matchs, Alpha Zero a gagné 28, 72 à égalité et n'a pas perdu un seul.
Quant aux échecs, l'intelligence artificielle neurale a déjà dépassé l'homme et ses homologues plus âgés.

Mais cela s'applique en fait à un système fermé avec un petit ensemble initial de règles.

Voyons maintenant le système linguistique.

Intelligence artificielle neuronale et traduction




Nous connaissons bien la création de Google dans le domaine de la traduction - Google Translate.

Ainsi, Google Translate avec traductions fonctionne un peu différemment qu'Alpha Zero avec les échecs. Aux échecs, le système analyse des ensembles de coups individuels qui conduisent au résultat le plus rentable. Pour les transferts, un réseau bidirectionnel est utilisé. Un flux divise la phrase originale en éléments sémantiques, et le second les reproduit dans l'ordre correct dans une autre langue.


Quelque chose comme ça arrive. La proposition est divisée en composantes. De plus, le mot n'est pas la plus petite composante, car la signification du mot est considérée comme un niveau plus profond.

Les éléments constitutifs qui en résultent sont analysés dans leur signification à l'aide d'algorithmes - les mêmes couches cachées auto-apprenantes. La proposition est analysée d'abord en partie, puis - tous ensemble et même dans la direction opposée. En effet, par exemple, en allemand, la particule «nicht» à la fin d'une phrase change radicalement tout son sens.


Représentation schématique du processus. Chaque couche d'algorithmes analyse la phrase dans différentes configurations, puis «recueille» la phrase à partir des significations reçues dans une autre langue, en tenant compte de ses caractéristiques grammaticales.

Mais si tout est clair avec les échecs, alors la langue est un système plus flexible dans les règles, qui permet également la traduction de phrases précises non seulement "en lettre", mais aussi "en esprit". Autrement dit, le traducteur peut consciemment sacrifier l'exactitude de la traduction littérale afin de transmettre le sens plus profondément.

Traduction de poèmes de fiction


Un exemple courant est la traduction des versets. Après tout, il est presque impossible de traduire ne serait-ce qu'un quatrain afin de préserver immédiatement le rythme et l'arrangement des mots, ainsi que le sens complet.

Il ne peut tout simplement pas y avoir d'algorithmes uniformes, car il faut souvent refaire radicalement un verset pour transmettre sa véritable signification.

Bien sûr, la traduction des versets est l'un des domaines les plus difficiles de la linguistique, mais les réseaux de neurones se sont déjà révélés être les meilleurs dans les calculs précis, nous allons donc commencer par les plus difficiles.



Par exemple, prenez le deuxième sonnet de Shakespeare. Alternativement, nous citons le texte original, la traduction de S. Trukhtanov (nous avons choisi cette option parmi beaucoup d'autres de manière purement subjective) et la traduction de Google Translate.

Original:

Quand quarante hivers assiégeront ton front,
Et creuse des tranchées profondes dans le champ de ta beauté,
La livrée fière de ta jeunesse, si regardée maintenant,
Sera une mauvaise herbe en lambeaux, de petite valeur détenue:
Puis on me demande où est toute ta beauté,
Où tout le trésor de tes jours vigoureux,
Pour dire, dans tes propres yeux profondément enfoncés,
Étaient une honte dévorante et des éloges sans faille.
Combien d'éloges méritaient l'usage de ta beauté,
Si tu pouvais répondre "Ce beau enfant à moi
Doit résumer mon compte et faire mon ancienne excuse, "
Prouvant sa beauté par succession à toi!
Cela devait être nouveau quand tu es vieux,
Et vois ton sang se réchauffer quand tu le sens froid.

Comme vous pouvez le voir, l'anglais est clairement dépassé ici - il y a même une deuxième personne singulière qui n'est pas utilisée dans l'anglais moderne. Et cela complique encore plus la traduction.

En général, nous ne tirerons pas et ne regarderons que la différence entre la traduction humaine et la traduction automatique:



Et pour être honnête, c'est loin d'être la meilleure performance de Google. C'est peut-être pourquoi les adeptes de la traduction automatique sont gênés lorsqu'on leur demande si leurs algorithmes avec des versets fonctionneront. Après tout, même le Google Translate tant vanté ne fait même pas face à cela.

Traduction de fiction de prose


Si oui, essayez quelque chose de plus simple. Prose artistique. Le grand Gatsby Fitzgerald.



Original:

«Au cours de mes années les plus jeunes et les plus vulnérables, mon père m'a donné des conseils que je me suis retournés depuis.

"Chaque fois que vous avez envie de critiquer qui que ce soit", m'a-t-il dit, "rappelez-vous simplement que toutes les personnes dans ce monde n'ont pas eu les avantages que vous aviez."

Comparez maintenant les traductions de l'homme et de la machine. En tant que défenseur de l'humanité, nous avons pris la traduction de N. Lavrov.



La traduction de Lavrov ne correspond pas exactement à l'original. Il y a des changements dans la disposition des phrases, les phrases sont un peu plus étendues qu'en anglais. Mais en général, l'impression est harmonieuse, le sens et l'humeur sont pleinement transmis.

La traduction automatique est plus précise en termes de mécanique - les phrases sont traduites exactement comme elles sont écrites dans l'original. Le sens est assez bien transmis, mais il y a des problèmes avec «vous-vous» et tout semble assez maladroit.

Dans les traductions littéraires, on peut sacrifier un peu de précision pour l'harmonie ou pour l'harmonie des phrases. Les traducteurs humains l'utilisent, même inutilement souvent, mais pas la machine.

Et maintenant?


Certes, par souci d'équité, il faut mentionner que Google Translate traduit des textes techniques, où la précision littérale de la traduction est importante, parfaitement et pratiquement sans erreurs. Mais ces personnages qui prétendent que les traducteurs seront laissés sans travail dans 5 à 10 ans peuvent être envoyés en toute sécurité lors d'un long voyage à pied.

Les processeurs et algorithmes de traitement de données existants peuvent gérer des systèmes qui ont un ensemble limité de règles. Les échecs ou le go ne sont que ça. Mais avec des variétés flexibles de systèmes comme les langages, où les limites des règles sont floues, le programme doit ajouter des algorithmes inutilement complexes qui fonctionnent loin d'être parfaits.

Il est possible que les algorithmes aient juste besoin de plus de temps pour apprendre à travailler avec précision sur les langages. Eh bien, nous ferons notre travail plus loin et à mi-chemin du succès des réseaux de neurones dans ce domaine.

Mais ne comptez pas sur les réseaux de neurones artificiels pour l'instant - apprenez l'anglais et développez le vôtre.

EnglishDom.com - une plateforme d'apprentissage de l'anglais en ligne





Apprenez l'anglais dans les cours en ligne de EnglishDom.com. Par référence - 2 mois d'abonnement à tous les cours en cadeau.

Et pour la communication en direct, choisissez la formation Skype avec un enseignant. La première leçon d'essai est gratuite, inscrivez-vous ici. Par le code promo goodhabr2 - 2 leçons en cadeau lors de l'achat à partir de 10 leçons. Le bonus est valable jusqu'au 31/05/19.

Source: https://habr.com/ru/post/fr429008/


All Articles