OpenAI宇宙。开放平台训练强大的AI




非营利组织OpenAI由Ilon Musk及其同事创立,旨在创建安全(即公共和开放)人工智能的非营利组织OpenAI 在通用OpenAI平台的框架内通过强大的AI加强了一系列培训任务,该计划已迈出了下一步实施计划。 OpenAI 引入了Universe中间件来训练和学习强大的AI。从理论上讲,可以通过互联网访问有关人类所有信息的培训。这些是游戏,网站和其他应用程序。

只有九行代码-您的AI可以访问数千个培训环境。

使用Universe软件平台,智能代理将以与人完全相同的方式使用计算机:他将观察计算机屏幕上的像素并使用键盘和鼠标(虚拟)进行交互。


人工智能通过VNC界面学习知识,可以远程访问桌面,

它可以训练智能代理完成一系列任务。Universe平台会为AI打开一个人可以在计算机上解决的任何任务。

OpenAI体育馆环境


通用通用平台的开放是OpenAI创建全球开放通用AI的计划行动的延续。今年4月,该组织发布了OpenAI Gym工具包公开测试版,以开发和比较强化学习算法。 “ gym” OpenAI体育馆包含许多环境(从人形机器人模拟器Atari游戏)。有一个站点可以比较和复制结果

OpenAI Gym与包括TensorflowTheano在内的任何框架中编写的算法兼容最初,环境是用Python创建的,但是将来,开发人员计划使之有可能以任何编程语言来实现。

OpenAI相信强化学习是机器学习的重要方法,它将大大改善AI。在通过这种方法进行学习的过程中,测试系统(代理)通过与特定环境进行交互来学习。与传统的老师教学不同,对AI决策的响应是增强信号,而一些增强规则是动态形成的,难以理解,即基于形式神经元的同时活动。


光学文本识别模块以60 fps的速度识别增强信号:视频

中间件OpenAI Universe


今天推出的Universe是完全支持OpenAI Gym工具包和运行时环境的中间件。由于有了这种中间件,因此计划从根本上增加训练AI的环境数量。

早期,强化学习应用程序的最大类别仅包括55个Atari游戏(Atari Learning Environment),但是在Universe平台上,预计将有许多其他开发商出现该游戏,包括V​​alve,EA和Microsoft。

从一开始,通过Universe的中间件可以使用数千种游戏(Flash游戏,多人蛇Slither,Starcraft,GTA V等),各种浏览器任务(例如填写表格)和应用程序(例如fold.it拼图)。)使用python库Universe几乎可以免费启动任何游戏,该在Github上的公共领域中发布。

import gym
import universe # register Universe environments into Gym

env = gym.make('flashgames.DuskDrive-v0') # any Universe environment ID here
observation_n = env.reset()

while True:
  # agent which presses the Up arrow 60 times per second
  action_n = [[('KeyEvent', 'ArrowUp', True)] for _ in observation_n]
  observation_n, reward_n, done_n, info = env.step(action_n)
  env.render()

上面的代码启动了一个人工智能代理来玩“ 黄昏驱动器 ”游戏

黄昏驾驶游戏

OpenAI声明说:“我们的最终目标是开发一个智能代理,该代理能够灵活地应用在Universe中获得的经验来解决新问题并迅速获得新经验,这将是迈向强大AI的重要一步。” 。

Universe软件环境安装在Docker容器中。如前所述,它们与人一样通过可视界面-通过“屏幕”,“键盘”和“鼠标”与智能代理进行通信。该接口是使用VNC程序实现的,用于远程访问桌面。

从理论上讲,人工智能技能的不断提高以及在各种小任务中积累的经验将帮助他利用现有知识越来越快地掌握每个新任务。 Universe环境的平台和集合可以为智能代理提供与ImageNet数据相同的用于训练和强化训练的标准统一平台,ImageNet数据是在与老师一起教学时用于训练神经网络分类器的图像数据库。

强化训练确实可以非常有效。例如,Universe智力代理商经过了大约六天的培训,可以玩多人网络游戏Slither。六天后,人工智能在游戏会话中平均获得1,000点的得分,最高得分为1400点。相比之下,来自OpenAI组织的具有五个小时游戏经验的员工平均获得1,400分,最高得分为7050。

目前,通过Universe中间件的代理可以从OpenAI合作伙伴处获得以下游戏和应用程序:门户寓言周年纪念日GooRimWorld史莱姆牧场主铲骑士太空化学联队司令III指挥与征服:红色警戒2辛迪加魔毯镜之边缘西德·迈耶的半人马座Wolfram Mathematica该列表将增加。

Source: https://habr.com/ru/post/zh-CN399701/


All Articles