
2017年,Libratus扑克机器人在12万手无限制扑克
比赛中击败四名职业玩家时成为头条新闻。 现在,该技术已被
改编用于军事用途 。
脆弱的AI系统的开发人员通常会比较他们的程序在对抗人类的游戏中的有效性。 在游戏期间随时有完整信息的游戏中,所有玩家都具有有关游戏状态的完整信息,即有关任何玩家的位置和所有可能的动作的完整信息。 与这种确定性情况相反,在
信息不完整的游戏中,有关游戏状态的部分信息对玩家隐藏了,例如对手的卡。 没有无限注德州扑克只是这些游戏之一。 除了对手的不公开牌之外,由于每个下注的大小,这里还增加了不确定性。 考虑到这一点,可能的结果数量估计为10
161 。 考虑到对手的战术,面对不确定性,制定最佳战略正是军队所需要的。
卡内基梅隆大学的研究人员创建了Libratus(拉丁语中的“平衡”),以测试基于博弈论的自动化决策思想。 去年年初,该计划的主要作者Tuomas Sandholm教授在赢得专业人士的压倒性胜利之后,创立了一家名为Strategy Robot的初创公司,以适应政府使用的游戏技术。 例如,在战争游戏和模拟中研究军事战略和计划。 根据公开记录,八月下旬,该公司与美国陆军签订了一份为期两年的合同,合同金额高达1000万美元,由国防创新部提供资金,五角大楼于2015年成立,以改善与硅谷公司的联系,并更积极地引进新的技术。
天秤座策略在各个分布阶段。 根据分配结果,指定针对特定对手的游戏模型Libratus基于算法(计算)博弈论构建。 在与专业人士的单挑中,该机器人赢得了超过180万美元的常规奖金:在比赛中,他制定了强大的下注策略,甚至证明了诈的可能性。
桑德霍尔姆(Sandholm)相信这种方法适用于许多其他游戏以及军事模拟。 如今,军事游戏练习通常只针对虚构的对手测试少量策略:“这为剥削提供了很多机会,因为真正的对手可能无法按照您的假设进行比赛,
”这位教授
说 。
桑德霍尔姆拒绝讨论战略机器人项目的细节,尽管该公司已与至少另一份政府合同签订。 他说,该程序有助于完成模拟任务,包括在模拟的物理空间中做出决定,例如在哪里放置军事单位。
Libratus的扑克技术表明,战略性机器人可能会向军方提出一些令人惊讶的建议。 在比赛期间,与该机器人对峙的职业玩家惊讶地发现他出乎意料地从严厉的战术转换为过度攻击性的战术,因此他的举动几乎是无法预测的-但该机器人的所有举动都是以赢得胜利为目标。 桑德霍尔姆说:“这很奇怪,因为没有任何印象,他的表现要比你好,但随后您查看比分并了解发生了什么。”
专家认为,尽管结果仍将只是战略计划的组成部分之一,但这种技术可以使战争游戏和模拟更加有用。 与能够掌握最好的AI技术的场景相比,现实世界更加复杂和令人困惑。
五角大楼战略上的机器人机器人“天秤”并不是在军事事务中运用现代博弈论和弱势AI的唯一尝试。 DARPA研究机构已经启动了一项特殊计划,
名为“游戏中的持续交互,其中包含关于采用复杂军事决策(SI3-CMD)的不完整信息” 。 密歇根大学的教授迈克尔·韦尔曼(Michael Wellman)说,以Libratus为例,表明:该技术在现实世界中的使用已接近成熟:“扑克的突破简直是惊人的,而其他游戏的发展很快。 现在是时候在更实际的领域中尝试它了,”他说。
除了Strategy Robot之外,Sandholm教授还创立了另一家战略机器创业公司,在那里他将战略机器人改编为用于电力市场,体育和计算机游戏等商业任务。
Wired写道,人工智能技术不仅在美国,而且在
俄罗斯和
中国都受到军方的关注。 桑霍尔姆教授对此并不表示担忧。 他认为,人工智能将“使世界更加安全”。