DeepMind a créé un ordinateur qui apprend à utiliser sa mémoire
DeepMind a développé un nouveau type d'IA qui peut apprendre à utiliser sa propre mémoire. Le projet est appelé " ordinateur neuronal différentiel " (ordinateur neuronal différentiel, ou DNC).Quelles sont les conséquences d'un projet dont le but est d '«apprendre» à un ordinateur à utiliser sa propre mémoire? L'essentiel est qu'une forme faible d'IA devienne plus efficace que jamais. Par exemple, un tel système peut aider une personne à se déplacer dans une ville complètement inconnue sans le moindre inconvénient.
Illustration de l'architecture DNC. Le contrôleur de réseau neuronal reçoit des informations de l'extérieur, en utilisant les données pour travailler avec la mémoire via des opérations de lecture / écriture spécifiques. Afin d'aider le contrôleur à travailler avec la mémoire, DNC maintient des liens temporaires pour suivre les données enregistrées et capture également les niveaux d'utilisation actuels pour chaque emplacement de mémoire.La principale réussite des employés de DeepMind est qu'ils ont pu apprendre à leur IA à effectuer chaque tâche suivante, sans oublier comment les précédentes se sont déroulées. Dans une situation normale, le système peut utiliser la même zone de mémoire pour enregistrer des informations sur diverses tâches. Après avoir terminé la première tâche, la machine commence à effectuer la seconde. Et les données sur la mise en œuvre de la première pour remplacer les données sur la mise en œuvre de la seconde.
DNC joue le tagDNC de DeepMind ne fonctionne pas. Les employés de l'entreprise fournissent au réseau neuronal un morceau de mémoire sur un support externe et apprennent au système à l'utiliser. Dans ce cas, le processus d'apprentissage se présente sous la forme d'essais et d'erreurs. Les représentants du projet ont déclaré sur leur site Web ce qui suit: «Lorsque la DNC génère une réponse, nous la comparons avec la bonne réponse souhaitée. Au fil du temps, le système apprend à donner des réponses de plus en plus à droite. »Le cœur d'un DNC est un réseau de neurones appelé contrôleur. Les créateurs du système font ici une analogie avec le processeur de l'ordinateur. Le contrôleur est chargé de recevoir les données, de les écrire dans la mémoire et de lire dans la mémoire. De plus, le contrôleur analyse les données et génère une réponse en réponse à une question posée par le système.Le contrôleur effectue plusieurs types d'opérations en mémoire. À chaque instant, il décide d'écrire ou non quelque chose en mémoire. Si la solution est oui, le contrôleur peut choisir deux options d'enregistrement - dans un secteur inutilisé ou dans un secteur où il existe déjà des informations que le contrôleur recherchait précédemment. Cela permet de mettre à jour les informations enregistrées dans certains secteurs fixes. Si tous les secteurs de la mémoire sont utilisés, le contrôleur peut décider de libérer la mémoire, de la même manière que vous pouvez remplacer un secteur sur un disque dur ordinaire qui n'est plus nécessaire.Comme dans le cas de l'enregistrement, le contrôleur peut lire les données d'un certain nombre de secteurs. Le système peut rechercher les informations nécessaires dans chaque secteur, ou lire immédiatement les données stockées dans le secteur liées aux données demandées.Tout cela permet au système de résoudre efficacement le problème de l'utilisation de la mémoire, du stockage et de la récupération des données.Après que le réseau neuronal a reçu une carte du métro de Londres, l'ordinateur a immédiatement commencé à donner des réponses complexes à des questions complexes sur le déplacement dans le métro. Ces réponses étaient basées sur le principe de la déduction. Voici un exemple de l'une des questions auxquelles DNC peut répondre correctement juste après le chargement d'une carte de métro dans la mémoire du système: «Lorsque nous montons dans la voiture de métro et passons un arrêt le long de la ligne centrale, il y a quatre autres arrêts le long de la ligne Koltsevaya et il y a une autre ligne Dzhubili deux arrêts, à quel arrêt sortirons-nous? Pour les assistants numériques tels que Siri, cette question est insupportable - ils ne pourront tout simplement pas trouver la bonne réponse, malgré toute la puissance de calcul des centres de données Apple. Mais l'IA de DeepMind est tout à fait capable de donner la bonne réponse.
Source: Photofusion / GettyDe plus, ce système peut donner des conseils pour raccourcir le chemin entre les différents arrêts. Elle donne la bonne réponse dans 9 cas sur 10.Selon les développeurs, leur système peut donner la bonne réponse car le principe de son travail est similaire aux principes fondamentaux de la pensée humaine. Bien sûr, le système de DeepMind est encore loin d'une véritable machine analogique de l'intelligence humaine, mais la version actuelle fonctionne très bien. Le cerveau humain gère encore plus habilement les données stockées, y compris le processus de publication de nouvelles informations.Les spécialistes de DeepMind espèrent qu'à l'avenir ils pourront créer un système qui, sans introduire de programmes spécialisés dans sa mémoire, pourra utiliser les informations dont il dispose pour résoudre certains problèmes. Dans ce cas, nous pouvons déjà parler d'un système d'auto-apprentissage complet qui peut utiliser les données disponibles pour résoudre des problèmes complexes.On ne sait pas encore quand Alphabet pourra utiliser les avantages du nouveau système dans ses produits et services commerciaux. Jusqu'à présent, l'équipe de l'unité mène des études approfondies et ne dit rien sur le début de l'utilisation commerciale du système développé.Des experts disent que l'entreprise a fait de grands progrès dans la recherche sur l'IA, Herbert Jaeger de l' Université Jacobs de Brême, a déclaré que l'équipe DeepMind "a franchi l'une des étapes les plus importantes du développement évolutif des systèmes neuronaux modernes". Ce scientifique est sûr qu'en fait, l'entreprise a créé quelque chose de plus significatif que ce que décrivent ses représentants dans un article de la revue Nature .Comme tous les autres projets DeepMind, celui-ci est basé sur le deep learning. Presque la même technologie qui a permis au système AlphaGo de remporter 4 matchs du 5ème champion du monde Lee Sedol.Maintenant DeepMind et le Future of Humanity Institute font un autre travail intéressant. Une équipe intégrée de spécialistes crée un «bouton rouge» pour une forme d'intelligence artificielle forte. Il s'agit d'un outil qui désactivera l'intelligence artificielle en cas de perte de contrôle.Le problème de la création d'un tel instrument est bien illustré dans la déclaration de Nick Bostrom, directeur de l'Institut pour l'avenir de l'humanité: «Si une explosion intellectuelle nous menace d'extinction, nous devons comprendre si nous pouvons contrôler le processus de détonation. Aujourd'hui, il serait plus raisonnable d'accélérer les travaux de résolution du problème du contrôle plutôt que de suspendre la recherche dans le domaine de l'intelligence artificielle. Mais jusqu'à présent, six personnes résolvent le problème du contrôle, tandis que des dizaines, voire des centaines de milliers, travaillent à la création de l'intelligence artificielle. »Source: https://habr.com/ru/post/fr398357/
All Articles