移动理论

1962年10月,美国国务卿迪安·拉斯克(Dean Rusk)在古巴导弹危机最严重的时候说:“我们玩过窥视,我认为敌人眨了眨眼。” 他铭记苏联发出的信号,希望解决两个超级大国之间最危险的核对峙,许多分析家将其解释为核小鸡游戏的经典例子(该游戏的俄文版称为鹰和鸽子)。
鸡游戏通常用于模拟每个玩家都将要发生冲突的冲突。 玩家可以是驾驶员在狭窄的道路上互相接近,每个道路上都有一个选择-为避免碰撞而关闭或不关闭。 在后来被改编成由詹姆斯·迪恩(James Dean)执导的电影
《无因的叛逆》(Rebel Without a Cause)的故事中,司机是两个少年,但他们不是在彼此之上而是在悬崖上。 游戏的目的不是要先踩刹车,也不是要以这种方式变成“鸡”,同时又不要掉下悬崖。
尽管加勒比海导弹危机看起来像一场鸡游戏,但实际上,该游戏的建模方式很差。 另一个游戏更准确地描述了美国和苏联领导人的行动,但是即使对于这个游戏,标准博弈论也不能完全描述他们可用的选择。
另一方面,基于博弈论的移动理论,却从根本上改变了博弈的标准规则,再现或预测了领导者过去的行为。 更重要的是,该理论基于以下假设:玩家不仅考虑其行为的直接后果,而且还考虑其对未来游戏的影响,从而阐明了游戏的动态性。
我用加勒比核危机来说明该理论的一部分,该理论不仅是一个抽象的数学模型,而且反映了现实生活中的选择,导致现实的思想过程,并解释了鲜血和鲜血玩家的行为。 约翰·肯尼迪(John F. Kennedy)总统的特别顾问西奥多·索伦森(Theodore Sorensen)实际上是用此举来形容古巴导弹危机期间肯尼迪首席顾问执行委员会的讨论:
“我们讨论了苏联人对美国可能采取的任何行动的反应,我们对苏联人的这些行动的反应,等等,试图在每条路径上得出合乎逻辑的结论。”
古典博弈论与核危机

博弈论是研究社会互动中决策的数学领域。 它适用于两个或两个以上人(称为
玩家 )从两个或多个动作模式(称为
策略 )中进行选择的情况(
游戏 )。 可能的游戏结果取决于所有玩家选择的动作,并且可以根据每个玩家的偏好进行评估。
在某些具有两个玩家和两个策略的游戏中,从某种意义上说,有些玩家策略是“稳定的”。 当没有任何球员偏离策略时,这是正确的。 在数学家
约翰·纳什 (
John Nash)因其在博弈论领域的工作而获得1994年诺贝尔经济学奖之后,这两种策略统称为纳什均衡。 纳什均衡不一定会为一个或两个球员带来最佳结果。 此外,在可以分析的游戏中,玩家只能设置结果的等级(“常规游戏”),而不能将数值与它们相关联(“基本游戏”),它们可能不存在。 (尽管,正如纳什所表明的那样,它们始终存在于基数博弈中,但此类博弈中的纳什均衡可能包括“混合策略”,我将在下面进行讨论。)
1962年10月,苏联试图在古巴安装可能会袭击美国大部分地区的中程和中程核弹道导弹,从而引发了古巴核危机。 美国的目标是立即运送苏联导弹,为实现这一目标,美国最高领导人认真考虑了两种战略[
见图1 ]:
- 海军封锁(B) ,或秘密地称为“隔离区”,以防止新导弹的交付,有可能采取更严重的行动,迫使苏联撤走已经安装的导弹。
- 进行一次“外科手术”空袭(A),以尽可能摧毁现有的导弹,然后可能会入侵该岛。
在苏维埃领导层之前出现了以下选择:
- 召回(W)他们的导弹。
- 在岛上节省(M)导弹。
| | 苏联(苏联) |
| | 评论(W) | 节省(M) |
美国(美国) | 封锁(B) | 妥协(3.3) | 苏联的胜利,美国的失败(2.4) |
空袭(A) | 美国的胜利,苏联的失败(4.2) | 核战争(1.1) |
图1:古巴核危机只是一场小游戏关键点: (x,y)=(美国获胜,苏联获胜):4 =最佳; 3 =比最佳差一些; 2 =比最坏的略好; 1 =最差。 强调纳什均衡。
这些策略可以被视为可以由两方或游戏理论术语中的“参与者”选择的替代行动程序。 它们会导致四种可能的结果,玩家应该按以下顺序进行排名:4 =最佳; 3 =比最佳差一些; 2 =比最坏的略好; 1 =最差。 也就是说,数字越大,增益越大; 但是获胜只是
顺序的 ,也就是说,它们仅指示获胜的顺序(从最佳到最差),而不是玩家偏爱一个结果而不是另一个结果的程度。 每个配对结果中的第一个数字是玩家的水平胜利(美国),第二个数字是玩家的垂直胜利(苏联)。
毋庸置疑,图1所示的策略选择,可能的结果以及相关的获利仅给出了在13天中展现的危机情况的大致骨架。 双方都考虑了清单中的两个以上备选方案,每个方案都有几种不同形式。 例如,苏联要求从土耳其召回美国的导弹,以此作为从古巴召回自己的导弹的
交换条件 。 美国已公开忽略了这一主张。
然而,大多数对此危机的观察者认为,这两个超级大国将发生冲突,这使该超级大国的名字成为有关核对抗的一本书。 此外,他们同意,各方都没有采取任何无法挽回的步骤,就像其中一位驾驶“小鸡”的驾驶员在其他驾驶员面前示范性地将其汽车的方向盘撕裂,从而排除了熄火的可能性。
尽管从某种意义上说,美国通过强迫苏联撤回导弹而“获胜”,但苏联第一书记尼基塔·赫鲁晓夫却同时拒绝了肯尼迪总统的诺言,不要攻击古巴,因此,这一最终结果可视为一种妥协。 但是对于鸡只游戏,这不是游戏理论的预测,因为折衷策略不会构成纳什均衡。
为了验证这一点,假设游戏处于折衷位置(3.3),即美国在封锁古巴,而苏联则在撤回导弹。 这个策略是不稳定的,因为两个参与者都有动机偏离他们更好战的策略。 如果美国通过将战略改为空袭而偏离战略,那么游戏将转向(4.2),从而提高美国的收益。 如果苏联偏离了战略,改变了保留导弹的策略,那么博弈将转移到(2,4),从而使苏联获得4的收益。(这种经典的博弈论方案无法为我们提供关于选择哪种结果的任何信息,因为获胜表这是在解释可能会出现几个平衡位置的博弈的理论分析结果时的一个常见问题。)最后,如果博弈者得到了互为最差的结果(1.1),即核战争,那么很明显两者都将希望偏离他那个 使与此相关的策略不稳定,例如(3.3)。
移动理论与核危机

用鸡游戏来模拟类似加勒比海危机那样的问题是有问题的,这不仅是因为折衷结果(3.3)不稳定,而且因为在现实世界中,双方并没有像预期的那样同时或独立地选择战略。在上面的鸡游戏中。 在美国宣布封锁之后,苏联人特别对封锁作出了回应。 此外,美国正在考虑升级冲突,至少在空袭之前一直如此,这一事实表明,关于封锁的初步决定并不被视为最终决定。 也就是说,在宣布封锁之后,美国仍在考虑选择战略的可能选择。
因此,最好将此博弈建模为连续的谈判,双方都没有选择“全有还是全无”的选择。 两者都考虑了替代方案,特别是在相对方没有以另一方认为适当的方式做出回应的情况下。 自第二次世界大战以来,超级大国之间的核威慑关系最严重恶化,各方都审慎地探索了自己的道路,采取了威胁性步骤。 危机爆发前,苏联担心美国入侵古巴,并试图维持其在世界上的战略地位,因此得出结论,在岛上安装导弹的风险值得承担。 他认为,面对
既成事实 (即既成事实),美国将避免攻击古巴,也不敢采取其他严厉的报复措施。 即使安装导弹引发了危机,苏联人也不认为战争的可能性很高(在危机期间,肯尼迪总统估计战争的可能性在1/3到1/2之间),也就是说,挑衅美国的风险对他们来说是合理的。
有合理的理由相信,美国高级官员并不将对抗看作是一场鸡游戏,至少在它如何解释和排列可能的结果方面。 我以游戏的形式提出了加勒比核危机的替代模型,我将其称为
“替代” 。 在其中,我将保留与“小鸡”中相同的球员策略,但我将假设美国对结果的排名和解释不同[
见图2 ]。 从肯尼迪总统和美国空军的声明以及苏联可用的核武器的类型和数量上判断,这种排名和解释比鸡只游戏的参数更适合于历史文献。 )
- BW :美国仍然选择苏联封锁和召回导弹,这对双方都还是一个妥协-(3.3)。
- BM :面对美国的封锁,苏联保留古巴的导弹导致苏联的胜利(这是最好的结果)和美国的投降(对于他们来说是最糟糕的结果)-(1.4)。
- 上午 :对苏联储存的空袭摧毁导弹被认为对美国来说是“光荣的”行动(对他们而言是最好的结果),而对苏联则是失败(其结果最差)-(4.1)。
- AW :被苏联人召回的空袭摧毁导弹被认为是美国的“可耻”行动(结果比对他们最坏的情况稍好)和对苏联的击败(结果比最坏的情况稍好)-(2.2)。
| | 苏联(苏联) |
| | 评论(W) | | 节省(M) |
美国(美国) | 封锁(B) | 妥协 (3.3) | → | 苏维埃胜利,美国投降 (1.4) |
|  | |  |
空袭 (A) | 美国的“可耻”行动,苏联的失败(2.2) | ← | 美国的“光荣”行动,击败了苏联人(4.1) |
图2:作为“替代方案”的加勒比核危机关键: (x,y)=(美国获胜,苏联获胜),4 =最佳; 3 =比最佳差一些; 2 =比最坏的略好; 1 =最差。 近视平衡以粗体突出显示。 箭头指示循环的方向。
即使在这两种情况下的空袭都导致了苏军(2.2)和(4.1)的失败,我仍将(2.2)解释为对苏联造成的损失最小,因为从世界其他地区的角度来看,可以将空袭视为这是公然的过度反应,因此如果有明显证据表明苏联正在召回导弹,美国将采取“可耻”的行动。 另一方面,在没有此类证据的情况下,美国的空袭(可能随后遭到入侵)将是驱逐苏联导弹的行动。
美国高级管理层的声明证实了对Alternative的遵守。 在回应赫鲁晓夫的一封信时,肯尼迪报告:
“如果您同意从古巴拆除这些武器系统……就我们而言,我们将同意……(a)立即取消现行有效的检疫措施,并(b)保证不对古巴进行侵略”,
与(Alternative)对应,因为(3.3)在美国比(2.2)更可取,而(4.2)在“鸡肉”(3.3)中则不可取。
如果苏联保留导弹,美国本来希望进行空袭封锁。 根据当时他兄弟的亲密顾问罗伯特·肯尼迪(Robert Kennedy)的说法,
“如果他们不删除这些基础,我们将删除它们”,
对应于“替代”,因为美国更喜欢“鸡”游戏的结果(4.1)胜过结果(1.4),而不是结果(1.1)胜过结果(2.4)。
最后,众所周知,肯尼迪总统的许多顾问非常不愿意考虑对古巴发动攻击,而又不竭尽全力地采取可能导致以较低风险,更符合美国理想和价值观的方式撤出导弹的好战方法。 特别是,罗伯特·肯尼迪(Robert Kennedy)指出,立即发动的攻击看起来像“相反,珍珠港,它会使美国在历史上的名称变黑”,与“替代”相对应,因为美国将AW的排名比最差的结果要好一些(2 )-作为国家的“可耻”行动,而不是最好的(4)-美国的胜利-在“鸡”中。
尽管“替代”提供了比“鸡”更真实的游戏参与者感知观念,但是游戏的标准理论在解释如何达成妥协以及为何稳定证明稳定方面并没有太大帮助(3.3)。 就像在“小鸡”中一样,与此结果相关的策略也不是纳什均衡,因为苏维埃立即有动力从(3.3)切换到(1.4)。
但是,不同于“鸡”,“替代”通常没有“纳什均衡”的结果,除了“混合策略”。 在这些策略中,玩家随机选择自己的动作,并选择两个具有给定概率的所谓纯策略。 但是,不可能将混合策略用于“替代”的分析,因为要执行此类分析,必须将数字获胜附加到每个结果上,而不是按顺序排列。
当研究由顺时针方向运行的箭头所指示的偏好周期时,最好看到“替代”结果的不稳定性。 遵循这些箭头意味着该游戏
是周期性的 ,并且一个玩家总是立即有动机偏离每种状态:苏联-从(3.3)到(1.4); 在美国-从(1.4)到(4.1); 在苏联人中-从(4.1)到(2.2); 在美国,从(2.2)到(3.3)。 我们再次获得了不确定性,但这并不是因为像“鸡”中那样存在几个纳什均衡,而是因为在“另类”中,纯策略之间没有均衡。
动作理论中的游戏规则

那么,根据博弈的标准理论,在给定非平衡状态的情况下,我们如何解释“ 3.3”在“替代”中的选择,同时在“鸡”中进行解释呢? 事实证明,根据
运动理论 (TOM),(3.3)在两个博弈中都是“非近视平衡”,而在“另类”中是唯一的这种平衡。 假设参与者不仅提前考虑了举动的直接后果,而且还考虑了反举动对这些举动,反举动等造成的后果,TOM将对冲突的战略分析扩展到更遥远的未来。
当然,博弈论允许通过分析“游戏树”来考虑这种想法,“游戏树”描述了玩家随时间的连续动作。 但是,随着危机的发展,博弈树也在不断变化。 相反,在“另类”中,尽管玩家处于改变的矩阵中,但获胜的配置或多或少保持恒定。 实际上,TOM描述了一场比赛的胜利,但允许玩家对不同位置的移动进行顺序计算,这为经典博弈论提出的描述经济增加了非短视思维。
博弈论创始人约翰·冯·诺伊曼(John von Neumann)和奥斯卡·摩根斯坦(Oscar Morgenstern)将
游戏定义为“描述其规则集”。 TOM , , . TOM :
- , .
- , , , . 1 ( P1 ).
- 2 ( P2 ) ,=, , .
- , ( P1 P2 ), , . , , .
- , (i) , (ii) , .
- , — , : , , .
, : , , , , , , , . , , ( , ).
, , , , , . , . , , , . , , , , .
1 , , . , , TOM ,
- ,
. , , .
, , , , , . , , , , , , . -, . TOM.
: , , , — , , , ( ). , , , , .
, . TOM () , ( ) . , , , , , .
, - , , ; . , , , , . , , .
1 — 4 ( ) ,
, , : , «, , » ( 4). , ?
, , . (i) , (ii) . ,
P1 ,
P1 . , -, « », , ?
, , , ,
. , , , . , , , , , , .
, «» 2. BM, (1) (4). , , AM, AW, , , , ( 1):
| 1 | | 2 | | 3 | | 4 | | 1 |
| (1,4) | → | (4,1) | → | (2,2) | → | | (3,3) | → | (1,4) |
| (2,2) | | (2,2) | | (2,2) | | (1,4) |
, , . — , . , ( 1, ).
, «» (1,4) (4,1), (2,2) (3, 3), 4 , (3,3) , (1,4). , (1,4) (3,3), (1,4) (3,3): (1,4), (3,3), , - , (1,4).
, (2,2) (3,3)? (2,2) (3,3) , (1,4), «». (2,2) , (2,2) (3,3) — , , (1,4) (3,3).
(4,1) (2,2), (4,1), (2,2) , (4,1). , (1,4), (2,2) (1,4), (2,2).
, (2,2) (1,4) , (4,1), (2,2), , (2,2) , (1,4). (3,3), , , , . , (2,2), , (2,2) , (2,2).
, (2,2) AM , (3,3) BW. , , - (1,4), , (1,4)? , , , (1,4) :
| 1 | | 2 | | 3 | | 4 | | 1 |
| (1,4) | → | (3,3) | →| | (2,2) | → | (4,1) | → | (1,4) |
| (3,3) | | (3,3) | | (2,2) | | (4,1) |
, «», BM (4) (3) BW, (3,3), 2. , , , , ( 90%), .
TOM

, TOM . , 3 4, ( ?) . , 4, 1 , : 3 2 (), .
, ( ), 4 1, : 4, , , 4. , , , , .
: . , , , - , . TOM , (, ) , , . , .
- «Theory of Moves», Steven J. Brams. Cambridge University Press, 1994.
- «Game Theory and Emotions», Steven J. Brams in Rationality and Society, Vol. 9, No. 1, pages 93-127, February 1997.
- «Long-term Behaviour in the Theory of Moves», Stephen J. Willson, in Theory and Decision, Vol. 45, No. 3, pages 201-240, December 1998.
- «Catch-22 and King-of-the-Mountain Games: Cycling, Frustration and Power», Steven J. Brams and Christopher B. Jones, in Rationality and Society , Vol. 11, No. 2, pages 139-167, May 1999.
- «Modeling Free Choice in Games», Steven J. Brams in Topics in Game Theory and Mathematical Economics: Essays in Honor of Robert J. Aumann, pages 41-62. Edited by Myrna H. Wooders. American Mathematical Society, 1999.
关于作者
. (Steven J. Brams) — - . 13 , , , . :
Fair Division: From Cake-Cutting to Dispute Resolution (1996 )
The Win-Win Solution: Guaranteeing Fair Shares to Everybody (1999 ) . . , « », , .

不明飞行物护理分钟
这些材料可能会引起矛盾的感觉,因此在写评论之前,请刷新您记忆中的重要内容: