
La science populaire et même les médias de divertissement sont désormais submergés d'informations sur le succès des projets d'IA. Soit l'intelligence artificielle bat une personne en jeu, soit apprend à jouer à StarCraft et sort victorieuse d'un combat avec des champions reconnus. Et ce n'est qu'une petite fraction des réalisations, en fait, il y en a beaucoup plus. Une personne ordinaire (dans un sens, sans rapport avec la sphère informatique) pourrait penser qu'une véritable, "grande" intelligence artificielle est sur le point d'apparaître, sur laquelle j'écris de la science-fiction et fais des films.
Mais tout est loin d'être aussi rose. Par exemple, l'autre jour, il y avait des informations selon lesquelles l'IA avait essayé de passer le test en mathématiques supérieures (test scolaire, standard pour le Royaume-Uni) et ne pouvait pas le faire.
En principe, les causes de l'échec peuvent être expliquées sans trop de difficultés. Ainsi, une personne dans la résolution de problèmes mathématiques implique les capacités et capacités suivantes.
Il modifie pour lui-même des symboles par essence, tels que des nombres, des opérateurs arithmétiques, des variables (qui forment des fonctions dans un complexe) et des mots (définissant une question, le sens d'une tâche, etc.).
- Planification (par exemple, classer les fonctions dans l'ordre nécessaire pour résoudre un problème mathématique).
- Utilisation d'algorithmes auxiliaires pour composer des fonctions (addition, multiplication).
- Utilisation de la mémoire à court terme pour stocker des valeurs intermédiaires (par exemple h (f (x))).
- La mise en pratique a précédemment acquis des connaissances sur les règles, les transformations, les processus et les axiomes.
DeepMind a été formé et testé sur une sélection de différents types de problèmes mathématiques et de problèmes. Les développeurs n'ont pas utilisé le crowdsourcing; ils ont plutôt synthétisé un ensemble de données pour générer un grand nombre de tâches de test, contrôler leur complexité, etc. L'équipe de développement a utilisé un format de données de texte «forme libre».
Les données initiales étaient basées sur les tâches d'une sélection de devoirs pour les élèves des écoles britanniques (moins de 16 ans). Les tâches ont été prises dans des directions telles que l'arithmétique, l'algèbre, la théorie des probabilités, etc.
L'équipe DeepMind, choisissant une architecture de réseau neuronal pour résoudre des problèmes mathématiques, a opté pour LSTM (
mémoire à court terme à long terme ) et
Transformer (une architecture de réseau neuronal pour travailler avec des séquences).
DeepMind a testé deux modèles LSTM pour travailler avec des problèmes mathématiques: un LSTM simple et un LSTM attentionnel dont le schéma de fonctionnement est illustré dans la figure ci-dessous.

Voici un schéma du modèle Transformer.

Le résultat n'était pas trop bon. Seulement 35% des réponses AI étaient correctes, il s'agit d'une évaluation insatisfaisante par rapport aux normes de n'importe quelle école.

Bien sûr, les chercheurs de DeepMind viennent de commencer à travailler avec les mathématiques et l'IA. À l'avenir, un plus grand succès peut être attendu, comme ce fut le cas avec le même AlphaGo.
Les données complètes de l'étude sont disponibles sur
ce lien .

