Théorie du mouvement

"Nous avons joué des regards indiscrets et, à mon avis, l'ennemi a cligné des yeux", a déclaré le secrétaire d'État américain Dean Rusk au plus fort de la crise des missiles cubains en octobre 1962. Il avait à l'esprit les signaux que l'Union soviétique envoyait, souhaitant résoudre la confrontation nucléaire la plus dangereuse entre les deux superpuissances, que de nombreux analystes ont interprétée comme un exemple classique d'un jeu de poulet nucléaire (la version russe de ce jeu est appelée faucons et pigeons).
Le jeu de poulet est généralement utilisé pour modéliser les conflits dans lesquels chaque joueur s'est dirigé vers une collision. Les joueurs peuvent être des conducteurs s'approchant les uns des autres sur une route étroite, chacun ayant le choix - désactiver pour éviter une collision, ou ne pas désactiver. Dans l'histoire
Rebel Without a Cause , qui a ensuite été refaite dans un film mettant en vedette James Dean, les conducteurs étaient deux adolescents, mais ils conduisaient non pas l'un sur l'autre, mais sur une falaise. Le but du jeu n'était pas d'appuyer sur les freins en premier et de ne pas se transformer en «poulet» de cette façon, et en même temps de ne pas tomber d'une falaise.
Bien que la crise des missiles dans les Caraïbes ressemble à un jeu de poulet, en réalité, elle est mal modélisée par ce jeu. Un autre jeu décrit plus précisément les actions des dirigeants des États-Unis et de l'Union soviétique, mais même pour ce jeu, la théorie des jeux standard ne décrit pas entièrement les options qui s'offrent à eux.
D'autre part, la théorie des mouvements, basée sur la théorie des jeux, mais changeant radicalement les règles standard du jeu, reproduit ou prédit les actions passées des leaders. Plus important encore, cette théorie met en lumière la dynamique du jeu, basée sur l'hypothèse que les joueurs pensent non seulement aux conséquences immédiates de leurs actions, mais aussi à leur impact sur le jeu à l'avenir.
J'utilise la crise nucléaire des Caraïbes pour illustrer des parties de cette théorie, qui n'est pas seulement un modèle mathématique abstrait, mais reflète également les choix faits dans la vie réelle, les processus de pensée qui y ont conduit, et explique également les actions des joueurs vivants de chair et de sang. Le conseiller spécial du président John F. Kennedy, Theodore Sorensen, a en fait utilisé la terminologie des mesures pour décrire les discussions du comité exécutif des principaux conseillers de Kennedy pendant la crise des missiles cubains:
"Nous avons discuté des réactions des Soviétiques à tout mouvement possible des États-Unis, de notre réaction à ces actions des Soviétiques, etc., essayant de parvenir à une conclusion logique sur chacune de ces voies."
Théorie des jeux classiques et crise nucléaire

La théorie des jeux est un domaine des mathématiques qui étudie la prise de décision dans les interactions sociales. Elle s'applique aux situations (
jeux ) dans lesquelles deux personnes ou plus (appelées
joueurs ) choisissent parmi deux ou plusieurs modes d'action (appelés
stratégies ). Les résultats possibles du jeu dépendent des actions choisies par tous les joueurs et peuvent être évalués par ordre de préférence pour chaque joueur.
Dans certains jeux avec deux joueurs et avec deux stratégies, il existe des stratégies de joueurs qui sont, dans un sens, «stables». Cela est vrai quand aucun des joueurs, s'écartant de leur stratégie, ne peut obtenir de meilleurs résultats. Ces deux stratégies sont appelées collectivement l'équilibre de Nash, du nom du mathématicien
John Nash , qui a reçu le prix Nobel d'économie en 1994 pour ses travaux dans le domaine de la théorie des jeux. Les équilibres de Nash ne conduisent pas nécessairement aux meilleurs résultats pour un ou même deux joueurs. De plus, dans les jeux qui peuvent être analysés et où les joueurs peuvent uniquement définir le rang des résultats («jeux ordinaux»), mais ne peuvent pas leur associer des valeurs numériques («jeux cardinaux»), ils peuvent ne pas exister. (Bien que, comme l'a montré Nash, ils existent toujours dans les jeux cardinaux, l'équilibre de Nash dans ces jeux peut inclure des «stratégies mixtes», dont je parlerai ci-dessous.)
La crise nucléaire cubaine a été déclenchée par une tentative de l'Union soviétique en octobre 1962 d'installer des missiles balistiques nucléaires de portée moyenne et intermédiaire à Cuba qui pourraient frapper une grande partie des États-Unis. Le but des États-Unis était le mouvement immédiat des missiles soviétiques, et pour y parvenir, la haute direction des États-Unis a sérieusement envisagé deux stratégies [
voir la figure 1 ]:
- Le blocus naval (B) , ou, comme on l'appelait secrètement, la «quarantaine», pour empêcher la livraison de nouveaux missiles, ce qui pourrait potentiellement être suivi d'une action plus sérieuse qui forcerait l'Union soviétique à retirer les missiles déjà installés.
- Une frappe aérienne «chirurgicale» (A) pour détruire au maximum les missiles existants, qui pourrait être éventuellement suivie d'une invasion de l'île.
Les alternatives suivantes se sont ouvertes devant la direction de l'Union soviétique:
- Rappel (W) de leurs missiles.
- Sauvegarde (M) de missiles sur l'île.
| | Union soviétique (URSS) |
| | Révision (W) | Économie (M) |
États-Unis (USA) | Blocus (B) | Compromis (3.3) | Victoire des Soviétiques, défaite des USA (2.4) |
Frappe aérienne (A) | Victoire américaine, défaite des Soviétiques (4.2) | Guerre nucléaire (1.1) |
Figure 1: La crise nucléaire cubaine comme un jeu de pouletClé: (x, y) = (victoire américaine, victoire soviétique): 4 = meilleure; 3 = légèrement pire que le meilleur; 2 = légèrement meilleur que le pire; 1 = pire. L'équilibre de Nash est souligné.
Ces stratégies peuvent être considérées comme des programmes d'action alternatifs qui peuvent être choisis par deux parties, ou «acteurs» dans la terminologie de la théorie des jeux. Ils conduisent à quatre résultats possibles selon lesquels les joueurs devraient se classer comme suit: 4 = meilleur; 3 = légèrement pire que le meilleur; 2 = légèrement meilleur que le pire; 1 = pire. Autrement dit, plus le nombre est élevé, plus le gain est important; mais les gains ne sont que
ordinaux , c'est-à-dire qu'ils indiquent uniquement l'ordre des gains du meilleur au pire, mais pas dans la mesure où le joueur préfère un résultat à un autre. Le premier nombre dans chacun des résultats appariés est la victoire horizontale du joueur (USA), le deuxième nombre est la victoire verticale du joueur (URSS).
Inutile de dire que les choix stratégiques, les résultats probables et les gains associés présentés dans la figure 1 ne donnent qu'un aperçu général de l'image de la crise qui se déroule sur une période de treize jours. Les deux parties ont envisagé plus de deux alternatives de la liste, et chacune a plusieurs variantes. Les Soviétiques, par exemple, ont exigé le rappel des missiles américains de Turquie comme
contrepartie pour le rappel de leurs propres missiles de Cuba. Cette affirmation a été publiquement ignorée par les États-Unis.
Néanmoins, la plupart des observateurs de cette crise pensaient que les deux superpuissances se dirigeaient vers un affrontement, qui a donné le nom à l'un des livres sur cette confrontation nucléaire. De plus, ils conviennent qu'aucune des parties n'a cherché à prendre des mesures irréparables, comme l'un des chauffeurs jouant au «poulet», arrachant de manière démonstrative le volant de sa voiture devant l'autre conducteur, excluant ainsi la possibilité de s'éteindre.
Bien que, dans un sens, les États-Unis aient "gagné" en forçant les Soviétiques à retirer leurs missiles, le premier secrétaire de l'URSS, Nikita Khrouchtchev, a en même temps repoussé une promesse du président Kennedy de ne pas attaquer Cuba, donc ce résultat final peut être considéré comme une sorte de compromis. Mais pour un jeu de poulet, ce n'est pas une prédiction de la théorie des jeux, car les stratégies de compromis ne constituent pas l'équilibre de Nash.
Pour vérifier cela, supposons que le jeu soit dans une position de compromis (3.3), c'est-à-dire que les États-Unis bloquent Cuba et que l'URSS retire ses missiles. Cette stratégie est instable, car les deux joueurs sont incités à s'écarter de leur stratégie plus belliqueuse. Si les États-Unis déviaient en changeant leur stratégie en frappe aérienne, le jeu passerait à (4.2), améliorant le gain américain; si l'URSS déviait, changeant sa stratégie pour préserver les missiles, le jeu passerait à (2,4), donnant à l'URSS un gain de 4. (Un tel schéma classique de la théorie des jeux ne nous donne aucune information sur le résultat qui sera choisi, car la table gagnante symétrique pour les deux joueurs.C'est un problème commun dans l'interprétation des résultats de l'analyse théorique des jeux où plusieurs positions d'équilibre peuvent se produire.) Enfin, si les joueurs obtiennent le pire résultat mutuel (1.1), c'est-à-dire une guerre nucléaire, alors il est évident que les deux voudront s'écarter de lui qu'avec rend les stratégies qui y sont liées, par exemple (3.3), instables.
Déplacer la théorie et la crise nucléaire

L'utilisation d'un jeu de poulet pour simuler une situation comme la crise des Caraïbes est problématique non seulement parce que le résultat du compromis (3.3) est instable, mais aussi parce que dans le monde réel, les deux parties ne choisissent pas leurs stratégies simultanément ou indépendamment, comme cela est supposé dans le jeu de poulet ci-dessus. Les Soviétiques ont spécifiquement répondu au blocus après sa déclaration par les États-Unis. De plus, le fait que les États-Unis envisageaient une escalade du conflit, du moins jusqu'à la frappe aérienne, suggère que la décision initiale sur le blocus n'a pas été considérée comme définitive. C'est-à-dire qu'après l'annonce du blocus, les États-Unis envisageaient toujours des options possibles pour choisir une stratégie.
Par conséquent, il est préférable de modéliser ce jeu comme des négociations consécutives dans lesquelles aucune des parties n'a fait le choix de «tout ou rien»; les deux ont envisagé des alternatives, en particulier dans le cas où la partie adverse ne répond pas d'une manière que l'autre partie juge appropriée. Dans la détérioration la plus grave des relations de dissuasion nucléaire entre les superpuissances, qui perdure depuis la Seconde Guerre mondiale, chacune des parties a prudemment sondé son chemin, faisant des pas menaçants. L'Union soviétique, avant la crise, craignant une invasion de Cuba par les États-Unis et essayant également de maintenir sa position stratégique dans le monde, a conclu que le risque d'installer des missiles sur l'île en valait la chandelle. Il pensait que les États-Unis, devant le
fait accompli (un fait accompli), s'abstiendraient d'attaquer Cuba et n'oseraient pas prendre d'autres mesures de représailles dures. Même si l'installation de missiles déclenche une crise, les Soviétiques n'ont pas considéré la probabilité de guerre élevée (pendant la crise, le président Kennedy a estimé la probabilité de guerre dans une fourchette de 1/3 à 1/2), c'est-à-dire que le risque de provoquer les États-Unis serait rationnel pour eux.
Il y a des raisons raisonnables de croire que les hauts responsables américains ne considéraient pas la confrontation comme un jeu de poulet, du moins dans la façon dont elle interprétait et classait les résultats possibles. Je propose un modèle alternatif de la crise nucléaire des Caraïbes sous la forme d'un jeu, que j'appellerai
«Alternative» . Dans ce document, je conserverai les mêmes stratégies des joueurs que dans le «poulet», mais je supposerai un classement et une interprétation différents des résultats par les États-Unis [
voir la figure 2 ]. Ce classement et ces interprétations correspondent mieux à des documents historiques qu'aux paramètres du jeu de poulet, pour autant que l'on puisse en juger par les déclarations du président Kennedy et de l'US Air Force, ainsi que par les types et la quantité d'armes nucléaires dont dispose l'URSS (plus de détails ci-dessous). )
- BW : Le choix des États-Unis de blocus et de rappel de missiles par l'Union soviétique est toujours considéré comme un compromis pour les deux joueurs - (3.3).
- BM : face au blocus américain, la préservation soviétique des missiles à Cuba conduit à la victoire de l'URSS (le meilleur résultat pour elle) et la capitulation américaine (le pire résultat pour eux) - (1.4).
- AM : une frappe aérienne détruisant des missiles stockés par l'Union soviétique est considérée comme une action «honorable» pour les États-Unis (le meilleur résultat pour eux) et une défaite pour les Soviétiques (leur pire résultat) - (4.1).
- AW : une frappe aérienne détruisant des missiles rappelée par les Soviétiques est considérée comme l'action "honteuse" des États-Unis (le résultat est légèrement meilleur que le pire pour eux) et la défaite des Soviétiques (le résultat est légèrement meilleur que le pire) - (2.2).
| | Union soviétique (URSS) |
| | Révision (W) | | Économie (M) |
États-Unis (USA) | Blocus (B) | Compromis (3.3) | → | Victoire des Soviétiques, reddition des USA (1.4) |
|  | |  |
Frappe aérienne (A) | Action "honteuse" des USA, défaite des Soviétiques (2.2) | ← | Action "honorable" des USA, défaite des Soviétiques (4.1) |
Figure 2: La crise nucléaire des Caraïbes comme «alternative»Clé: (x, y) = (gains pour les États-Unis, gains pour l'URSS), 4 = meilleur; 3 = légèrement pire que le meilleur; 2 = légèrement meilleur que le pire; 1 = pire. Les équilibres myopes sont mis en évidence en gras. Les flèches indiquent la direction du cycle.
Même si la frappe aérienne dans les deux cas conduit à la défaite des Soviétiques, (2.2) et (4.1), j'interprète (2.2) comme causant le moins de dégâts à l'URSS, car du point de vue du reste du monde, la frappe aérienne peut être considérée comme une réaction manifestement excessive, et donc une action "honteuse" des États-Unis dans le cas où il existe des preuves claires que les Soviétiques sont en train de rappeler des missiles. En revanche, en l'absence de telles preuves, une frappe aérienne américaine, qui aurait pu être suivie d'une invasion, aurait été une action pour évincer les missiles soviétiques.
Les déclarations de la haute direction américaine confirment la conformité à Alternative. En réponse à une lettre de Khrouchtchev, Kennedy rapporte:
"Si vous acceptez le démantèlement de ces systèmes d'armes de Cuba ... nous, de notre côté, nous accepterons ... (a) de supprimer immédiatement les mesures de quarantaine actuellement en vigueur et (b) de garantir la non-agression contre Cuba",
ce qui correspond à l '"Alternative", puisque (3.3) est préférable pour les États-Unis que (2.2), tandis que (4.2) n'est pas préférable pour le "poulet" (3.3).
Si les Soviétiques avaient conservé leurs missiles, les États-Unis auraient préféré un blocus anti-aérien. Selon Robert Kennedy, un proche conseiller de son frère à l'époque,
"S'ils ne suppriment pas ces bases, nous les supprimerons",
ce qui correspond à l '«Alternative», car les États-Unis préféreront le résultat (4.1) au résultat (1.4), plutôt que le résultat (1.1) au résultat (2.4) pour le gibier.
Enfin, il était bien connu que de nombreux conseillers du président Kennedy étaient très réticents à envisager de lancer une attaque contre Cuba, sans épuiser les méthodes d'action moins belligérantes qui pourraient conduire au retrait de missiles avec moins de risques et davantage en accord avec les idéaux et les valeurs de l'Amérique. En particulier, Robert Kennedy a déclaré qu'une attaque immédiate aurait ressemblé à «Pearl Harbor au contraire, et cela aurait noirci le nom des États-Unis dans les pages de l'histoire», ce qui correspond à «Alternative», car les États-Unis ont classé AW un peu mieux que le pire résultat (2). ) - comme l'action «honteuse» des États, et non comme la meilleure (4) - la victoire des États-Unis - dans le «poulet».
Bien que l '«Alternative» donne une idée plus réaliste de la perception des participants au jeu que le «poulet», la théorie standard des jeux n'aide pas beaucoup à expliquer comment le compromis a été atteint et pourquoi le compromis s'est avéré stable (3.3). Comme dans le «poulet», les stratégies associées à ce résultat ne sont pas un équilibre de Nash, car les Soviétiques sont immédiatement incités à passer de (3.3) à (1.4).
Cependant, contrairement au «poulet», l '«alternative» n'a généralement pas de résultats qui sont des équilibres de Nash, à l'exception des «stratégies mixtes». Ce sont des stratégies dans lesquelles les joueurs randomisent leurs actions choisies, choisissant chacune de leurs deux stratégies dites pures avec des probabilités données. Mais il est impossible d'utiliser des stratégies mixtes pour l'analyse de l '«Alternative», car pour effectuer une telle analyse, il est nécessaire d'attacher des gains numériques à chaque résultat, et non classés dans l'ordre.
L'instabilité des résultats dans «l'Alternative» est mieux visible lorsque l'on étudie le cycle des préférences indiqué par les flèches qui courent dans ce jeu dans le sens des aiguilles d'une montre. Suivre ces flèches signifie que ce jeu
est cyclique , et un joueur a toujours une incitation immédiate à s'écarter de chaque état: les Soviétiques - de (3.3) à (1.4); aux USA - de (1.4) à (4.1); chez les Soviétiques - de (4.1) à (2.2); et aux USA, de (2.2) à (3.3). Nous avons de nouveau eu de l'incertitude, mais pas à cause de la présence de plusieurs équilibres de Nash, comme dans le «poulet», mais parce que dans «l'Alternative», il n'y a pas d'équilibre entre les stratégies pures.
Les règles du jeu dans la théorie des mouvements

Comment expliquer alors le choix de (3.3) dans l '«Alternative», et en même temps dans le «poulet», étant donné l'état de non-équilibre selon la théorie standard des jeux? Il s'avère que (3.3) est dans les deux jeux «équilibre non myope», et dans «Alternative», selon la
théorie des mouvements (TOM), est le seul équilibre de ce type. En supposant que les joueurs anticipent non seulement les conséquences immédiates des mouvements, mais aussi les conséquences des contre-mouvements en réponse à ces mouvements, contre-contre-mouvements et ainsi de suite, TOM élargit l'analyse stratégique du conflit dans un avenir plus lointain.
Bien entendu, la théorie des jeux permet de prendre en compte une telle réflexion en analysant les «arbres de jeu» qui décrivent les actions successives des joueurs dans le temps. Mais l'arbre de jeu change constamment à chaque évolution de la crise. En revanche, dans l '«Alternative» la configuration des victoires reste plus ou moins constante, bien que là les joueurs soient dans la matrice changée. En fait, TOM, décrivant les victoires dans un jeu, mais permettant aux joueurs de faire des calculs séquentiels de mouvements dans différentes positions, ajoute une pensée non myope à l'économie de description proposée par la théorie des jeux classique.
Les fondateurs de la théorie des jeux John von Neumann et Oscar Morgenstern ont défini le
jeu comme «décrivant son ensemble de règles». TOM , , . TOM :
- , .
- , , , . 1 ( P1 ).
- 2 ( P2 ) ,=, , .
- , ( P1 P2 ), , . , , .
- , (i) , (ii) , .
- , — , : , , .
, : , , , , , , , . , , ( , ).
, , , , , . , . , , , . , , , , .
1 , , . , , TOM ,
- ,
. , , .
, , , , , . , , , , , , . -, . TOM.
: , , , — , , , ( ). , , , , .
, . TOM () , ( ) . , , , , , .
, - , , ; . , , , , . , , .
1 — 4 ( ) ,
, , : , «, , » ( 4). , ?
, , . (i) , (ii) . ,
P1 ,
P1 . , -, « », , ?
, , , ,
. , , , . , , , , , , .
, «» 2. BM, (1) (4). , , AM, AW, , , , ( 1):
| 1 | | 2 | | 3 | | 4 | | 1 |
| (1,4) | → | (4,1) | → | (2,2) | → | | (3,3) | → | (1,4) |
| (2,2) | | (2,2) | | (2,2) | | (1,4) |
, , . — , . , ( 1, ).
, «» (1,4) (4,1), (2,2) (3, 3), 4 , (3,3) , (1,4). , (1,4) (3,3), (1,4) (3,3): (1,4), (3,3), , - , (1,4).
, (2,2) (3,3)? (2,2) (3,3) , (1,4), «». (2,2) , (2,2) (3,3) — , , (1,4) (3,3).
(4,1) (2,2), (4,1), (2,2) , (4,1). , (1,4), (2,2) (1,4), (2,2).
, (2,2) (1,4) , (4,1), (2,2), , (2,2) , (1,4). (3,3), , , , . , (2,2), , (2,2) , (2,2).
, (2,2) AM , (3,3) BW. , , - (1,4), , (1,4)? , , , (1,4) :
| 1 | | 2 | | 3 | | 4 | | 1 |
| (1,4) | → | (3,3) | →| | (2,2) | → | (4,1) | → | (1,4) |
| (3,3) | | (3,3) | | (2,2) | | (4,1) |
, «», BM (4) (3) BW, (3,3), 2. , , , , ( 90%), .
TOM

, TOM . , 3 4, ( ?) . , 4, 1 , : 3 2 (), .
, ( ), 4 1, : 4, , , 4. , , , , .
: . , , , - , . TOM , (, ) , , . , .
- «Theory of Moves», Steven J. Brams. Cambridge University Press, 1994.
- «Game Theory and Emotions», Steven J. Brams in Rationality and Society, Vol. 9, No. 1, pages 93-127, February 1997.
- «Long-term Behaviour in the Theory of Moves», Stephen J. Willson, in Theory and Decision, Vol. 45, No. 3, pages 201-240, December 1998.
- «Catch-22 and King-of-the-Mountain Games: Cycling, Frustration and Power», Steven J. Brams and Christopher B. Jones, in Rationality and Society , Vol. 11, No. 2, pages 139-167, May 1999.
- «Modeling Free Choice in Games», Steven J. Brams in Topics in Game Theory and Mathematical Economics: Essays in Honor of Robert J. Aumann, pages 41-62. Edited by Myrna H. Wooders. American Mathematical Society, 1999.
À propos de l'auteur
. (Steven J. Brams) — - . 13 , , , . :
Fair Division: From Cake-Cutting to Dispute Resolution (1996 )
The Win-Win Solution: Guaranteeing Fair Shares to Everybody (1999 ) . . , « », , .

Minute de soins OVNI
Ce matériel peut provoquer des sentiments contradictoires, donc avant d'écrire un commentaire, rafraîchissez quelque chose d'important dans votre mémoire: