GTA V connecté à la plateforme OpenAI Universe pour l'apprentissage de l'IA du pilote automatique



Un peu plus d'un mois s'est écoulé depuis que l'organisation à but non lucratif OpenAI Ilona Mask a introduit le middleware Universe pour la formation et l'apprentissage d'une IA forte. Théoriquement, la formation peut avoir lieu sur toutes les informations de l'humanité disponibles sur Internet. En utilisant la plate-forme logicielle Universe, un agent intelligent utilise un ordinateur exactement de la même manière qu'une personne: il regardera les pixels de l'écran de l'ordinateur et interagira à l'aide du clavier et de la souris virtuels.

Maintenant, aux dizaines de jeux disponibles pour la formation à l'IA, le jeu Grand Theft Auto V a été ajouté , qui se distingue par un réalisme exceptionnel.

Vous pouvez créer un agent AI de véhicule sans pilote sur n'importe quel framework d'apprentissage automatique et il est relativement facile de se connecter à un jeu sur un ordinateur avec GTA V.


L'agent AI est à la croisée des chemins. Dans les diagnostics de la console, l'état de la pression sur la pédale de frein (vrai) et les autres paramètres actuels du pilote automatique sont affichés à gauche

Le jeu GTA V, même avec la violence désactivée, offre de riches possibilités de formation à l'IA pour un véhicule sans pilote. C'est l'un des mondes ouverts les plus vastes et les plus riches. L'action de jeu se déroule sur le territoire de l'île de San Andreas avec une superficie de près de 20% de ce Los Angeles. Ici, vous pouvez exécuter une variété de scénarios pour tester l'IA. Les agents ont accès à 257 types de voitures différents, 7 types de vélos, 14 types de conditions météorologiques et l'environnement peut être modifié directement pendant la simulation.


L'île de San Andreas

Grâce aux nombreux mods du jeu GTA V, vous pouvez charger des bâtiments de vraies villes, de vraies voitures, de vrais panneaux de signalisation et d'autres objets. En conséquence, votre agent IA sera formé à la conduite dans des conditions routières réelles.

Plateforme Universe


L'ouverture de la plateforme universelle universelle Univers est une continuation des actions prévues d'OpenAI pour créer une IA universelle ouverte mondiale. En avril de cette année, l'organisation a publié une version bêta publique de la boîte à outils OpenAI Gym pour développer et comparer des algorithmes d'apprentissage par renforcement. Le gymnase OpenAI Gym est composé d'un grand nombre d' environnements (du simulateur de robot humanoïde aux jeux Atari ). Il existe un site pour comparer et reproduire les résultats .

OpenAI pense que l'apprentissage par renforcement est un moyen important d'apprentissage automatique qui améliorera considérablement l'IA. Dans le processus d'apprentissage par cette méthode, le système de test (agent) apprend en interagissant avec un certain environnement. Contrairement à l'enseignement traditionnel avec un enseignant, la réponse aux décisions prises par l'IA est des signaux de renforcement, tandis que certaines règles de renforcement sont formées dynamiquement et difficiles à comprendre, c'est-à-dire basées sur l'activité simultanée de neurones formels.

Exécuter un agent AI sur votre ordinateur avec GTA V


L'intégration d'Univers à Grand Theft Auto V a été créée et est prise en charge par le projet DeepDrive , qui est maintenant passé à l'open source. Le projet offre la possibilité d'exécuter l'agent Universe sur votre propre ordinateur avec une copie du jeu installée.



Grâce à Universe, l'agent d'intelligence artificielle accède au monde réaliste du jeu en trois dimensions de GTA V. La vidéo suivante montre les images du jeu qui ont été transférées à l'agent AI pour traitement (ralenties artificiellement à 8 FPS, en haut à gauche), des informations de diagnostic de l'agent et de l'environnement (en bas à gauche) , ainsi qu'une vue conviviale de la caméra (à droite).

L'intégration de l'IA dans le jeu interdit toute action violente dans GTA V.


Pour ses ordinateur démarre l' agent de travail requis pour exécuter processus serveur GTA V . Vous devez d'abord installer l' univers de la bibliothèque python , puis connecter l'agent à l'aide du code suivant.

import gym
import universe # register Universe environments into Gym
from universe.spaces import joystick_event

env = gym.make('gtav.SaneDriving-v0')
env.configure(remotes='vnc://$host:$port') # point to the GTA V Universe server
observation_n = env.reset()

while True:
  steer = joystick_event.JoystickAxisXEvent(-1)     # turn right
  throttle = joystick_event.JoystickAxisZEvent(-1)  # go in reverse
  # Alternatively, use WASD to steer: ('KeyEvent', 'w', True)
  action_n = [[steer, throttle] for _ in observation_n]
  observation_n, reward_n, done_n, info = env.step(action_n)
  env.render()

Comme d'habitude pour les agents Univers, l'IA utilise un clavier virtuel, mais dans ce cas, un joystick virtuel est également disponible. L'IA montre les meilleurs résultats avec le joystick.

Conduite profonde


DeepDrive est une plate-forme de développement d'IA spécialisée pour les véhicules sans pilote open source. Il utilise des cadres de modding et des techniques spéciales pour transformer GTA V en un simulateur de voiture normal. Des agents pré-formés avec des capacités de gestion des transports et des ensembles de données sur lesquels ils ont été formés sont disponibles.

Bien que la plateforme DeepDrive soit apparue plus tôt que l'Univers, mais maintenant son développeur a décidé qu'il serait sage de transférer son travail sur cette plateforme ouverte universelle. C'était la bonne étape. Auparavant, pour exécuter l'agent, un ordinateur Windows et de nombreuses heures de configuration de l'environnement étaient nécessaires (l' interception DirectX y était utiliséepour capturer l'écran et écrire des agents, il fallait utiliser l'interface C ++ vers Caffe sous Windows). Désormais, DeepDrive s'installe en 20 minutes, s'exécute sur Linux et OS X, et les agents peuvent être écrits sur n'importe quel framework d'apprentissage machine. Code

source publié open source et AMI pour GTA V, un agent-pilote pré-formé . Sa formation a duré 21 heures (600 000 images). L'agent possède des compétences de conduite de base et est un bon début pour vos propres expériences.


Ensemble, des milliers d'agents IA peuvent créer un pilote vraiment sophistiqué - un programme qui peut conduire un vrai véhicule sans pilote dans le monde réel.

Source: https://habr.com/ru/post/fr400551/


All Articles