
尽管有相当长的历史,但各种版本的《
吃豆人 》游戏仍然非常受欢迎。 游戏迷们经常会互相竞争,谁会在比赛中获得最高分。 AI开发人员也在研究它,从而提高了传球游戏系统的技能。
来自加拿大初创公司Maluuba的开发团队(之前被Microsoft收购)
能够创建一个软件平台,该平台在通过Ms. Ms. 吃豆人(Pac-Man),该游戏是Atari 2600的版本。该程序打破了之前创造的所有记录,获得999,990点。
顺便说一句,该游戏
创建于1982年。 然后是Atari Inc. 发布Namco的《吃豆人》热门街机游戏端口。 与原始版本一样,您必须使用操纵杆控制主角。 主角必须穿越迷宫,获得分数,同时避开鬼魂。 移植游戏的创建者是Tod Fry。
一些专家认为,软件平台在游戏中得分最高的事实是在人工智能领域(弱势形式)的一项重大成就。 事实是,其他软件平台的成功率要低得多-事实证明,对于AI来说,游戏非常复杂。 当然,并不是所有的开发人员都根据Ms.女士的记录创建他们的项目。 吃豆人(Pac-Man),但从事这项工作的人在试图显示任何有意义的结果时谈到了许多技术问题。
为了取得成功,Maluuba团队决定将游戏分为一组小元素,并寻求与每个小元素进行交互的解决方案。 此外,这些元素分布在AI代理之间,每个代理都解决了其特定任务。 蒙特利尔麦吉尔大学的教授Doina Prekap表示,开发商提出的想法值得关注。 在她看来,这就是人脑在某些情况下的工作方式-将问题分解为多个部分,并依次解决了每个要素。
开发人员将他们的方法称为“混合奖励架构”,它使用了150多个AI代理,每个代理在传递游戏过程中与其他代理并行工作。 此外,每个代理在成功通过其自己的游戏部分时都会收到“奖励”。
除了“小型”代理程序外,还有另一个顶级代理程序,用于将从所有“下属”接收的所有数据汇总在一起。 他还决定了英雄人物的位置。 在这种情况下,将分析大量数据。 主要因素是由最大数量的基本试剂选择的运动方向。 另一方面,如果有100个特工想要向右走以获得奖杯,但是3个特工计划转弯,因为他们注意到了幽灵,则主要特工“听”这三个人。
根据首席开发人员的说法,在对代理进行自私行为编程之后,该系统开始显示出更好的结果。 也就是说,他们每个人都在不看其他人的情况下做出决定。 但是,有关英雄运动方向的一般决定是由主要代理人做出的。 他评估各种因素并指示要执行的操作。
微软研究团队主管Harm van Seijen说:“一方面,这需要交互,另一方面,需要制定个人决定,这是一种平衡。”
但是,为什么通常决定选择女士。 吃豆人? 选择这个游戏对于普通人来说似乎很奇怪。 但是专家说,这里没有什么奇怪的,因为这类游戏对于机器智能来说是相当复杂的,因为单位时间内有很多“紧急”情况,每种情况都需要自己的事件开发版本。 并且要找到解决方案,您需要像上面提到的那样像一个人一样“思考”。
“很多公司都在为游戏开发AI,开发自己的项目,因为传承需要许多人的素质,”马鲁巴的一名程序员Raul Mehrotra说。
在Microsoft开发的软件平台根据称为强化学习的机器学习方法进行
操作 。 在工作期间,测试系统(一个或多个代理)通过与环境交互来学习。 根据定义,这是一种控制论实验。 强化学习法是与老师一起进行教学的一种形式,但媒介或它的模式是老师。 代理对环境起作用,进而影响代理。 产生反馈。
该项目本身并不是一个纯粹的理论。 根据开发人员的说法,创建的软件平台可以在许多领域中使用。 例如,您可以吸引她到一家公司工作,该公司负责预测客户涌入,商品受欢迎程度和其他重要事物的动态。 该系统可以与总体趋势以及包括个人购买者在内的各个因素一起使用。