DeepMind donne un accès gratuit à un environnement d'apprentissage de machine virtuelle



Récemment, des représentants de la division DeepMind (qui fait maintenant partie de la holding Alphabet) ont annoncé la fourniture d'un accès gratuit aux développeurs au code source de la plateforme DeepMind Lab. Il s'agit d'un service d'apprentissage automatique basé sur Quake III conçu pour la formation en intelligence artificielle. À savoir - pour apprendre à résoudre des problèmes dans un espace tridimensionnel sans intervention humaine. Le cœur de la plateforme est le moteur de jeu Quake III Arena.

À l'intérieur du monde du jeu, l'IA prend la forme d'une sphère et la capacité de voler tout en explorant l'espace environnant. L'objectif fixé par les développeurs est d'enseigner la forme faible de l'IA à «comprendre» ce qui se passe et à répondre aux diverses situations qui se produisent dans le monde virtuel. Un «personnage» peut effectuer une série d'actions, se déplacer dans un labyrinthe et étudier l'environnement immédiat.

«Nous essayons de développer diverses formes d'IA qui peuvent effectuer un certain nombre de tâches allant de l'étude habituelle du monde du jeu à la prise de toute action avec une analyse de leurs conséquences», explique Shane Legge, chercheur en chef chez DeepMind.



Les spécialistes espèrent que l'IA peut apprendre par essais et erreurs. Les jeux dans ce cas sont presque une option idéale. Par exemple, auparavant dans DeepMind, ils utilisaient (et utilisent maintenant) la console de jeu Atari afin d'apprendre au réseau neuronal à effectuer les actions séquentielles nécessaires au jeu.

Mais un monde tridimensionnel ouvert qui peut être changé représente un environnement beaucoup plus prometteur pour l'apprentissage de l'IA que le monde plat des jouets graphiquement simples pour Atari. L'IA dans le monde tridimensionnel a des affectations claires qui changent séquentiellement de telle sorte que l'expérience acquise dans la résolution de chaque affectation précédente s'avère utile pour l'IA dans la résolution de la suivante.

L'avantage d'un environnement tridimensionnel est qu'il peut être utilisé pour entraîner des systèmes informatiques à répondre à divers problèmes auxquels un robot peut s'attendre dans le monde réel. En utilisant ce simulateur, les robots industriels peuvent être formés sans problème. Et travailler avec un environnement virtuel n'est pas un exemple plus facile dans certains cas que d'enseigner de tels systèmes «manuellement».

Dans le même temps, la plupart des réseaux de neurones modernes sont développés pour résoudre un problème spécifique (traitement d'image, par exemple). Les développeurs de la nouvelle plateforme promettent qu'elle contribuera à créer une forme universelle d'IA capable de résoudre un grand nombre de tâches. De plus, avec l'aide de personnes dans ce cas, le système informatique n'est pas nécessaire. La génération de l'environnement pour le réseau neuronal se produit à chaque fois dans un ordre aléatoire.


Selon les développeurs de la plate-forme, cela aide à apprendre l'IA de la même manière que les enfants apprennent. "Comment avez-vous ou j'ai étudié le monde dans l'enfance", a cité un exemple d'un des employés de DeepMind. «La communauté du machine learning a toujours été très ouverte. Nous publions environ 100 articles par an, en plus, nous avons ouvert le code source de beaucoup de nos projets. »

Maintenant, Google DeepMind a ouvert le code source de DeepMind Lab, l'a publié sur GitHub. Grâce à cela, tout le monde peut télécharger le code de la plateforme et le modifier selon ses besoins. Les représentants du projet déclarent que les spécialistes connectés peuvent créer eux-mêmes de nouveaux niveaux de jeu en téléchargeant leurs propres projets sur GitHub. Cela peut aider l'ensemble de la communauté à atteindre ses objectifs plus rapidement et plus efficacement.

Ce projet n'est pas le seul pour DeepMind. Le mois dernier, ses représentants ont conclu un accord de coopération avec Activision Blizzard Inc. L'objectif est de transformer l'environnement Starcraft 2 en banc d'essai pour l'intelligence artificielle. Peut-être que dans un proche avenir, d'autres développeurs de jeux rejoindront ce projet. Soit dit en passant, l'IA dans l'environnement de jeu ne gagne aucun avantage sur l'ennemi, en utilisant uniquement des informations visuelles pour la promotioncomme un homme.

Dans la pratique, cela signifie que Google AI devra prévoir à tout moment ce que fait l'ennemi afin de répondre adéquatement aux actions de l '«ennemi». De plus, il sera nécessaire de répondre rapidement à ce qui a dépassé le plan. Tout cela permettra de tester le prochain niveau de capacités de l'intelligence artificielle. "Au final, nous voulons utiliser ces capacités pour résoudre des problèmes mondiaux", a déclaré Demis Hassabis, fondateur de Deepmind (c'est Google qui l'a acheté en 2014, et l'IA est en cours de développement sur la base des réalisations de la société acquise).

Les spécialistes de l'IA approuvent prudemment le projet. «La bonne chose est qu'ils fournissent un grand nombre de types d'environnements», a déclaré Ilya Sutskevar, cofondatrice d'OpenAI. «Plus un système rencontre de types d'environnement, plus il évoluera rapidement», a-t-il poursuivi. En effet, l'environnement d'apprentissage de l'IA en trois dimensions contient plus de 1000 niveaux et types d'environnements.

Zoubin Gahrahmani, professeur à Cambridge, estime que le DeepMind Lab et d'autres plateformes pour améliorer le développement de l'intelligence artificielle contribuent au progrès, permettant aux chercheurs d'accéder à l'environnement développé. De plus, des projets comme celui-ci sont assez transparents. Il a également remarquéqu'une personne atteint un certain niveau du jeu prend beaucoup moins de temps qu'un ordinateur. Par conséquent, le professeur doute que l'IA, sa forme faible, sera difficile à mettre au moins au niveau d'une personne en termes de vitesse d'apprentissage.

Source: https://habr.com/ru/post/fr399853/


All Articles