胜利与胜利:AI赢得了四位职业玩家的扑克比赛



卡内基梅隆大学信息学院的代表开发的人工智能(其弱形式)胜过四名职业扑克玩家。这是在匹兹堡河流赌场举行的德州扑克锦标赛。这是最受欢迎的扑克类型之一。在比赛中,大约有12万手。 AI以170万美元的价格收购了这家银行。

该程序的作者是Thomas Sandholm和Noam Brown。根据开发商的说法,扑克是一种游戏,参与者不知道其他人拥有什么牌。因此,计算某些东西非常困难。比赛的参与者之一吉米·朱(Jimmy Chu)抱怨说,他和他的同事们低估了天秤座的能力:“机器人每天都在玩得更好。他似乎是我们的一个熟练的版本。”

有问题的比赛被称为“ 大脑与人工智能:提升安特”。它于1月11日开始。有五位参与者。其中之一是Libratus机器人。其他四个是Jimmy Choo,Dong Kim,Jason Les和Daniel McAulay。比赛的总持续时间为20天。所有这四个人都被认为是世界上这种扑克中最好的玩家。

根据开发商的说法,赢得他们的扑克程序是人工智能领域最大的成就之一。


不幸的是,天秤座系统的作者没有公开其工作的特点。该算法的操作原理仅在一般意义上是已知的。然而,在不久的将来,技术细节将在同行评审的科学杂志上的出版物中披露。

开发人员声称Libratus由三部分组成。这是主要的核心,它是一个跟踪竞争对手所犯错误的系统,也是一个跟踪自身缺点的系统。在游戏过程中,第三部分帮助提高了程序的功能,并改善了前两部分的工作。天秤座的人学会了虚张声势,并认识到对手的虚张声势。总的计算时间约为1500万个核心小时。

最有趣的是,Libratus算法并未专门针对扑克或任何其他游戏而“锐化”。该程序应利用内部资源发展自己的游戏风格。这项工作基于开发人员最初提供的信息-扑克规则。

至于奖金,比赛参与者将获得20万美元 -该金额将根据他们收到的结果在所有人类玩家之间分配。开发人员不会把钱带回家。所有这些都已经事先达成共识,而创建该系统的科学家的主要目的就是证明其有效性。卡内基·梅隆Carnegie Mellon)的工作人员表示,Libratus的功能可用于网络安全,谈判和军事目的。



一般而言,每年人工智能都会击败所有以前认为无法通过计算机访问的新游戏的人。最初,这些是跳棋,然后是-象棋,视频游戏,现在是-扑克。此外,有趣的是,在以前的所有情况下,所有参与者都具有有关游戏过程的完整信息-您可以看到比赛场地以及所有筹码/数字。在后一种情况下,信息不完整,在这方面扑克与众不同。

AI以前玩过扑克,但是他们只能在最简单的游戏中获胜-在有限的德州扑克中以有限的提高利率步骤。但是在无限扑克中,一切都变得更加复杂。在这里,您需要同时根据自己的牌信息和对手的行动数据来行动。而且,对手可以虚张声势,这使任务更加复杂。

在无限注德州扑克中,另一个软件平台DeepStack也显示出出色的结果。它是在阿尔伯塔大学开发的,该大学的一个特殊研究小组的员工自上世纪90年代以来一直在创造扑克机器人。这里创建的第一个机器人是1997年的Loki。然后是Poki(1999),PsOpti / Sparbot(2002),Vexbot(2003),Hyperborean(2006),Polaris(2007),Hyperborean No-Limit(2007),Hyperborean Ring(2009),Cepheus(2015),最后是,创造的王冠-DeepStack。

由于开发人员已发布信息,因此对该程序的技术功能了解很多关于她在今年一月初。DeepStack使用Nash平衡。这是一组不同策略的名称,其中如果游戏中的其他参与者不更改策略,则任何玩家都无法在策略改变的情况下增加自己的赢利。此外,DeepStack还可以抵消其他参与者尝试使用自己的策略的企图。

Source: https://habr.com/ru/post/zh-CN401137/


All Articles