微软在Minecraft上举行AI代理竞赛


参赛者将在Minecraft平台上参加几场比赛。 左:构建战斗游戏,玩家需要重新创建建筑物(在这种情况下,建筑物位于地面上)。 右:“ Pig Chase”游戏,AI代理必须一起工作才能弯角猪

Microsoft Research正在MarmÖ竞赛中完成MarLÖ2018 Multi-Agent强化学习的资格赛阶段。 竞争对手介绍了能够增强学习能力的AI代理,他们可以玩MalmO平台上定义的几种3D游戏。

比赛的目的是鼓励对通用情报领域的研究。 AI代理不是在单个特定游戏上训练,而是在多个特定游戏上训练。 此外,他们必须合作,这需要了解彼此的意图和目标(这是人类意识的重要属性)。 因此,该系统将更适合在现实世界中生存。

为了激发一种更通用的训练通用AI代理的方法,该任务不是由一个游戏组成,而是由多个游戏组成,其中每个游戏都具有不同复杂性和设置的多个任务。 这些任务中有些是公开性质的,参与者可以向他们学习。 但是其他的则保持关闭状态,它们仅用于确定比赛的最终等级。

比赛的组织者是微软,伦敦玛丽皇后大学和crowdAI平台。 比赛于2018年7月27日开始。 资格赛将于2018年12月31日结束。 资格赛结束后一周,决赛将在离线状态下举行。



游戏和任务


竞争的主要特征之一是代理商打几局游戏。 因此,为比赛提供了一些任务。 游戏中的任务在关卡的位置,大小,复杂性和取决于游戏的其他参数上可能彼此不同。 该图显示了比赛中的游戏和任务的组织方式。



如您所见,每个游戏都有四个任务,其中两个是在公共领域发布的,另外两个是秘密的。

要参加比赛,您需要在rowdAI上注册,然后在GitHub上克隆比赛入门套件

Malmö平台提供了一个API,该API可以访问Minecraft平台上的动作,观察(即位置,环境,视频帧,游戏统计数据)和其他常见数据。 另一方面,Marlo是Malmö的外壳,它提供了更高级别的API和更标准化的学习环境,并加强了研究。

该框架是作为OpenAI Gym框架的补充而编写的,该框架是用于开发和比较强化学习算法的工具包,从而为科学家,开发人员和流行的框架提供了一个标准且熟悉的平台。

Malmö项目由AI研究人员Katya Hoffmann于2015年在英国剑桥大学Microsoft研究中心启动。 尽管现代AI代理人已经在不同的游戏中展示了许多成就,但Katya一直在寻找一款可以让AI掌握更广泛技能的游戏:“从我们开始谈论Minecraft的那一刻起,显然这是进行AI研究的理想环境,”她是。 “这是一个没有特定目的的人们加入的世界。” 因此,马尔默项目是在Minecraft之上构建的平台,研究人员可以在其中使用AI进行许多不同的实验,并以标准化方式比较其结果。

在2017年测试Marlo比赛时,仅向参与者提供一个游戏:捉猪。 2018年的比赛更加复杂:现在已经制定了三个任务,每个任务都需要合作。 代理商需要了解如何识别环境中的另一个AI代理商,然后找到一种方法来共同实现他们的共同目标。

如果AI代理假设另一个代理的目标,则可以称为心理学家称为“ 心理状态模型 ”的基本形式,即人类理解他人心理状态和意图的能力。 卡蒂亚·霍夫曼(Katya Hoffman)希望AI代理商最终能够通过与Minecraft中的人类玩家合作来磨练这种能力。 她说:“然后,算法将学习如何与人合作并找出人们想要的东西。”

Source: https://habr.com/ru/post/zh-CN434260/


All Articles