GTA V连接到OpenAI Universe平台以学习自动驾驶AI



自非营利组织OpenAI Ilona Mask 推出用于训练和教授强大AI Universe中间件以来,已经过去了一个多月。从理论上讲,可以通过互联网访问有关人类所有信息的培训。通过使用Universe软件平台,智能代理可以使用与人完全相同的方式使用计算机:他将查看计算机屏幕的像素并使用虚拟键盘和鼠标进行交互。

现在,在可用于AI训练的数十种游戏中,增加了侠盗猎车手V游戏,以超凡的真实感而著称。

您可以在任何机器学习框架上创建无人驾驶汽车AI代理,并且在安装了GTA V的计算机上连接游戏相对容易,


而AI代理正处在十字路口。在控制台诊断中,踩下制动踏板的状态(真)和其他当前自动驾驶仪参数显示在左侧

GTA V游戏即使在禁用暴力的情况下,也为训练无人驾驶车辆的AI提供了丰富的机会。这是最大和最丰富的开放世界之一。游戏动作发生在圣安地列斯岛的领土上,占洛杉矶面积的近20%。在这里,您可以运行各种方案来测试AI。代理可以访问257种不同类型的汽车,7种类型的自行车,14种类型的天气,并且可以在模拟过程中立即更改环境。


圣安德烈亚斯岛

由于游戏GTA V中众多模块,您可以加载真实城市,真实汽车,真实交通标志和其他物体的建筑物。因此,您的AI代理将接受在真实道路条件下驾驶的培训。

宇宙平台


通用通用平台Universe的开放是OpenAI创建全球开放通用AI的计划行动的延续。今年4月,该组织发布了OpenAI Gym工具包公开测试版,以开发和比较强化学习算法。 “ gym” OpenAI体育馆包含许多环境(从人形机器人模拟器Atari游戏)。有一个站点可以比较和复制结果

OpenAI相信强化学习是机器学习的重要方法,它将大大改善AI。在通过这种方法进行学习的过程中,测试系统(代理)通过与特定环境进行交互来学习。与传统的教师授课不同,对AI决策的响应是强化信号,而一些强化规则是动态形成的,难以理解,即基于形式神经元的同时活动。

使用GTA V在计算机上运行AI代理


创建 了Universe与侠盗猎车手V的集成,并得到DeepDrive项目的支持,该项目现已切换为开源。该项目提供了在安装了游​​戏副本的情况下在您自己的计算机上运行Universe代理的功能。



通过Universe,人工智能代理可以访问GTA V的逼真的三维游戏世界。下一个视频显示了游戏中的帧,这些帧已转移到AI代理进行处理(人为地减慢到8 FPS,左上),来自代理和环境的诊断信息(左下) ,以及从相机拍摄的人性化视图(右)。

将AI集成到游戏中可禁止在GTA V中进行任何暴力行为。


要在计算机上启动代理,您需要启动GTA V服务器进程您必须首先安装python库Universe,然后使用以下代码连接代理。

import gym
import universe # register Universe environments into Gym
from universe.spaces import joystick_event

env = gym.make('gtav.SaneDriving-v0')
env.configure(remotes='vnc://$host:$port') # point to the GTA V Universe server
observation_n = env.reset()

while True:
  steer = joystick_event.JoystickAxisXEvent(-1)     # turn right
  throttle = joystick_event.JoystickAxisZEvent(-1)  # go in reverse
  # Alternatively, use WASD to steer: ('KeyEvent', 'w', True)
  action_n = [[steer, throttle] for _ in observation_n]
  observation_n, reward_n, done_n, info = env.step(action_n)
  env.render()

与Universe代理一样,AI使用虚拟键盘,但在这种情况下,虚拟键盘也可用。AI通过操纵杆展示出最佳效果。

深层驱动


DeepDrive是用于开源无人驾驶车辆的专业AI开发平台。它使用改装框架和特殊技术将GTA V变成普通的汽车模拟器。提供了具有运输管理功能和数据集的经过预先培训的代理。

尽管DeepDrive平台的出现要早于Universe,但现在它的开发人员认为将其工作转移到该通用开放平台是明智的。那是正确的步骤。以前,要运行代理,需要一台Windows计算机和许多小时的环境设置(那里使用DirectX拦截为了捕获屏幕并编写代理,您必须在Windows下使用C ++接口连接Caffe)。现在,DeepDrive只需20分钟即可安装,可在Linux和OS X上运行,并且可以在任何机器学习框架上编写代理。

开源发布的源代码用于GTA V的AMI,GTA V是预先训练的代理驱动程序他的训练持续了21个小时(60万张图片)。该代理具有基本的驾驶技能,是您自己进行实验的良好起点。


数以千计的AI代理可以共同创建一个真正复杂的驾驶员-该程序可以在现实世界中驾驶真正的无人驾驶汽车。

Source: https://habr.com/ru/post/zh-CN400551/


All Articles