Matemáticas del Apocalipsis: teoría de juegos y la crisis nuclear del Caribe

imagen

Mover la teoría


"Jugamos mirones y, en mi opinión, el enemigo parpadeó", dijo el secretario de Estado de los Estados Unidos, Dean Rusk, en el pico de la crisis de los misiles cubanos en octubre de 1962. Tenía en mente las señales que estaba enviando la Unión Soviética, deseando resolver la confrontación nuclear más peligrosa entre las dos superpotencias, que muchos analistas interpretaron como un ejemplo clásico de un juego de pollo nuclear (la versión rusa de este juego se llama halcones y palomas).

El juego del pollo generalmente se usa para modelar conflictos en los que cada jugador se ha dirigido a una colisión. Los jugadores pueden ser conductores que se acercan en una carretera estrecha, cada uno de los cuales tiene una opción: apagar para evitar una colisión, o no apagar. En la historia Rebelde sin causa , que luego se convirtió en una película con James Dean, los conductores eran dos adolescentes, pero no conducían uno encima del otro, sino en un acantilado. El objetivo del juego no era presionar los frenos primero y no convertirse en un "pollo" de esta manera, y al mismo tiempo no caerse por un precipicio.

Aunque la crisis de los misiles en el Caribe parece un juego de gallinas, en realidad está mal modelada por este juego. Otro juego describe con mayor precisión las acciones de los líderes de los Estados Unidos y la Unión Soviética, pero incluso para este juego, la teoría del juego estándar no describe completamente las opciones disponibles para ellos.

Por otro lado, la teoría de los movimientos, basada en la teoría de los juegos, pero cambiando radicalmente las reglas estándar del juego, reproduce o predice las acciones pasadas de los líderes. Más importante aún, esta teoría arroja luz sobre la dinámica del juego, basada en la suposición de que los jugadores piensan no solo en las consecuencias inmediatas de sus acciones, sino también en su impacto en el juego en el futuro.

Utilizo la crisis nuclear caribeña para ilustrar partes de esta teoría, que no solo es un modelo matemático abstracto, sino que también refleja las decisiones tomadas en la vida real, los procesos de pensamiento que condujeron a ella, y también explica las acciones de los jugadores vivos de carne y hueso. El asesor especial del presidente John F. Kennedy, Theodore Sorensen, en realidad utilizó la terminología de los movimientos para describir las discusiones del Comité Ejecutivo de los principales asesores de Kennedy durante la crisis de los misiles cubanos:

"Discutimos las reacciones de los soviéticos a cualquier posible movimiento de los Estados Unidos, nuestra reacción a estas acciones de los soviéticos, etc., tratando de llegar a una conclusión lógica en cada uno de estos caminos".

Teoría del juego clásico y crisis nuclear


La teoría de juegos es un campo de las matemáticas que estudia la toma de decisiones en las interacciones sociales. Se aplica a situaciones ( juegos ) en las que dos o más personas (llamadas jugadores ) eligen entre dos o más modos de acción (llamadas estrategias ). Los posibles resultados del juego dependen de las acciones elegidas por todos los jugadores y pueden evaluarse en orden de preferencia para cada jugador.

En algunos juegos con dos jugadores y con dos estrategias, hay estrategias de jugador que son, en cierto sentido, "estables". Esto es cierto cuando ninguno de los jugadores, desviándose de su estrategia, puede lograr mejores resultados. Estas dos estrategias se denominan colectivamente equilibrio de Nash, en honor al matemático John Nash , quien recibió el Premio Nobel de economía de 1994 por su trabajo en el campo de la teoría de juegos. Los equilibrios de Nash no conducen necesariamente a los mejores resultados para uno o incluso dos jugadores. Además, en los juegos que se pueden analizar y donde los jugadores solo pueden establecer el rango de resultados ("juegos ordinales"), pero no pueden asociar valores numéricos con ellos ("juegos cardinales"), es posible que no existan. (Aunque, como Nash ha demostrado, siempre existen en los juegos cardinales, el equilibrio de Nash en tales juegos puede incluir "estrategias mixtas", que analizaré a continuación).

La crisis nuclear cubana fue desencadenada por un intento de la Unión Soviética en octubre de 1962 de instalar misiles balísticos nucleares de mediano y mediano alcance en Cuba que podrían atacar a una gran parte de los Estados Unidos. El objetivo de los Estados Unidos era el movimiento inmediato de los misiles soviéticos, y para lograrlo, la alta dirección de los Estados Unidos consideró seriamente dos estrategias [ ver Figura 1 ]:

  1. Un bloqueo naval (B) o, como se llamaba encubiertamente, "cuarentena", para evitar la entrega de nuevos misiles, lo que podría ser seguido por una acción más seria que obligaría a la Unión Soviética a eliminar los misiles ya instalados.
  2. Un ataque aéreo "quirúrgico" (A) para destruir los misiles existentes en la medida de lo posible, que podría ser seguido por una invasión de la isla.

Las siguientes alternativas se abrieron ante el liderazgo de la Unión Soviética:

  1. Recordemos (W) de sus misiles.
  2. Ahorro de misiles (M) en la isla.

Unión Soviética (URSS)
Revisión (W)Ahorro (M)
Estados Unidos (USA)Bloqueo (B)Compromiso (3.3)Victoria de los soviéticos, derrota de los Estados Unidos (2.4)
Ataque aéreo (A)Victoria estadounidense, derrota de los soviéticos (4.2)Guerra Nuclear (1.1)

Figura 1: Crisis nuclear cubana como un juego de pollo

Clave: (x, y) = (triunfo estadounidense, triunfo soviético): 4 = mejor; 3 = ligeramente peor que el mejor; 2 = ligeramente mejor que lo peor; 1 = peor El equilibrio de Nash está subrayado.

Estas estrategias pueden considerarse programas de acción alternativos que pueden ser elegidos por dos partes, o "jugadores" en la terminología de la teoría de juegos. Conducen a cuatro resultados posibles que los jugadores deben clasificar de la siguiente manera: 4 = mejor; 3 = ligeramente peor que el mejor; 2 = ligeramente mejor que lo peor; 1 = peor Es decir, cuanto mayor es el número, mayor es la ganancia; pero las ganancias son solo ordinales , es decir, indican solo el orden de las ganancias de mejor a peor, pero no en la medida en que el jugador prefiera un resultado a otro. El primer número en cada uno de los resultados emparejados es la ganancia horizontal del jugador (EE. UU.), El segundo número es la victoria vertical del jugador (URSS).

Huelga decir que las opciones de estrategia, los resultados probables y las ganancias relacionadas que se muestran en la Figura 1 dan solo un esqueleto general de la imagen de la crisis que se desarrolla en el transcurso de trece días. Ambas partes consideraron más de dos alternativas de la lista, y cada una de ellas tenía varias variaciones. Los soviéticos, por ejemplo, exigieron el retiro de misiles estadounidenses de Turquía como un quid pro quo para retirar sus propios misiles de Cuba. Este reclamo ha sido ignorado públicamente por los Estados Unidos.

Sin embargo, la mayoría de los observadores de esta crisis creían que las dos superpotencias se dirigían a un enfrentamiento, que dio el nombre a uno de los libros sobre esta confrontación nuclear. Además, están de acuerdo en que ninguna de las partes trató de tomar medidas irreparables, como uno de los conductores que juegan el "pollo", arrancando demostrativamente el volante de su automóvil frente al otro conductor, excluyendo así la posibilidad de apagarse.

Aunque en cierto sentido Estados Unidos "ganó" al obligar a los soviéticos a retirar sus misiles, el primer secretario de la URSS, Nikita Khrushchev, al mismo tiempo cumplió una promesa del presidente Kennedy de no atacar a Cuba, por lo que este resultado final puede considerarse una especie de compromiso. Pero para un juego de pollo, esto no es una predicción de la teoría de juegos, porque las estrategias de compromiso no constituyen el equilibrio de Nash.

Para verificar esto, supongamos que el juego está en una posición de compromiso (3.3), es decir, Estados Unidos está bloqueando a Cuba y la URSS retira sus misiles. Esta estrategia es inestable, ya que ambos jugadores tienen el incentivo para desviarse de su estrategia más beligerante. Si Estados Unidos se desviara cambiando su estrategia de ataque aéreo, el juego cambiaría a (4.2), mejorando la ganancia de Estados Unidos; si la URSS se desviara, cambiando su estrategia para preservar misiles, entonces el juego cambiaría a (2,4), dando a la URSS una ganancia de 4. (Tal esquema clásico de teoría de juegos no nos da ninguna información sobre qué resultado se elegirá, porque la mesa ganadora simétrico para ambos jugadores. Este es un problema común en la interpretación de los resultados del análisis teórico de los juegos donde pueden surgir varias posiciones de equilibrio.) Finalmente, si los jugadores obtienen el peor resultado mutuo (1.1), es decir, una guerra nuclear, entonces es obvio que ambos querrán desviarse de el que con hace que las estrategias relacionadas con él, por ejemplo (3.3), sean inestables.

Teoría del movimiento y crisis nuclear


Usar un juego de gallinas para simular una situación como la crisis del Caribe es problemático no solo porque el resultado del compromiso (3.3) es inestable, sino también porque en el mundo real las dos partes no eligen sus estrategias de forma simultánea o independiente, como se supone en el juego de pollo anterior. Los soviéticos respondieron específicamente al bloqueo después de que Estados Unidos lo declarara. Además, el hecho de que Estados Unidos estaba considerando intensificar el conflicto, al menos hasta el ataque aéreo, sugiere que la decisión inicial sobre el bloqueo no se consideró definitiva. Es decir, después del anuncio del bloqueo, Estados Unidos aún consideró posibles opciones para elegir una estrategia.

Por lo tanto, es mejor modelar este juego como negociaciones consecutivas en las que ninguna de las partes eligió "todo o nada"; ambos consideraron alternativas, en particular en el caso de que el lado opuesto no responda de la manera que el otro lado considere apropiado. En el deterioro más grave de las relaciones de disuasión nuclear entre las superpotencias, que ha persistido desde la Segunda Guerra Mundial, cada una de las partes ha explorado su camino con prudencia, dando pasos amenazantes. La Unión Soviética, antes de la crisis, temiendo una invasión de Cuba por parte de Estados Unidos y también tratando de mantener su posición estratégica en el mundo, concluyó que valía la pena el riesgo de instalar misiles en la isla. Creía que Estados Unidos, ante un hecho consumado (un hecho consumado), se abstendría de atacar a Cuba y no se atrevería a tomar otras duras medidas de represalia. Incluso si la instalación de misiles desencadena una crisis, los soviéticos no consideraron alta la probabilidad de guerra (durante la crisis, el presidente Kennedy estimó la probabilidad de guerra en el rango de 1/3 a 1/2), es decir, el riesgo de provocar a Estados Unidos sería racional para ellos.

Hay razones razonables para creer que los altos funcionarios estadounidenses no vieron la confrontación como un juego de gallinas, al menos en la forma en que interpretaron y clasificaron los posibles resultados. Propongo un modelo alternativo de la crisis nuclear del Caribe en forma de juego, al que llamaré "Alternativa" . En él, retendré las mismas estrategias de los jugadores que en el "pollo", pero asumiré una clasificación e interpretación diferente de los resultados por parte de los Estados Unidos [ ver Figura 2 ]. Dicha clasificación e interpretaciones corresponden mejor a los documentos históricos que a los parámetros del juego del pollo, hasta donde se puede juzgar por las declaraciones hechas por el presidente Kennedy y la Fuerza Aérea de los EE. UU., Así como por los tipos y la cantidad de armas nucleares disponibles para la URSS (más sobre esto a continuación )

  1. BW : La elección de los Estados Unidos de bloqueo y retirada de misiles por parte de la Unión Soviética todavía se considera un compromiso para ambos jugadores - (3.3).
  2. BM : ante el bloqueo de los Estados Unidos, la preservación soviética de los misiles en Cuba conduce a la victoria de la URSS (el mejor resultado) y la rendición de los Estados Unidos (el peor resultado para ellos) - (1.4).
  3. AM : un ataque aéreo que destruye misiles almacenados por la Unión Soviética se considera una acción "honorable" para Estados Unidos (el mejor resultado para ellos) y una derrota para los soviéticos (su peor resultado) - (4.1).
  4. AW : un ataque aéreo que destruye misiles recordados por los soviéticos se considera la acción "vergonzosa" de los Estados Unidos (el resultado es ligeramente mejor que lo peor para ellos) y la derrota de los soviéticos (el resultado es un poco mejor que lo peor) - (2.2).

Unión Soviética (URSS)
Revisión (W)Ahorro (M)
Estados Unidos (USA)Bloqueo (B)Compromiso
(3.3)
Victoria de los soviéticos, rendición de los EE. UU.
(1.4)
Ataque aéreo
(A)
Acción "vergonzosa" de los Estados Unidos, derrota de los soviéticos (2.2)Acción "honorable" de los Estados Unidos, derrota de los soviéticos (4.1)

Figura 2: Crisis nuclear del Caribe como una "alternativa"

Clave: (x, y) = (ganancias para EE. UU., Ganancias para la URSS), 4 = mejor; 3 = ligeramente peor que el mejor; 2 = ligeramente mejor que lo peor; 1 = peor Los equilibrios miopes se resaltan en negrita. Las flechas indican la dirección del ciclo.

Aunque el ataque aéreo en ambos casos conduce a la derrota de los soviéticos, (2.2) y (4.1), interpreto que (2.2) causa el menor daño a la URSS, porque desde el punto de vista del resto del mundo, el ataque aéreo puede considerarse como una reacción abiertamente exagerada y, por lo tanto, una acción "vergonzosa" de los Estados Unidos en caso de que exista evidencia clara de que los soviéticos están en proceso de retirar misiles. Por otro lado, en ausencia de tal evidencia, un ataque aéreo estadounidense, que podría haber sido seguido por una invasión, habría sido una acción para expulsar los misiles soviéticos.

Las declaraciones de la alta gerencia de EE. UU. Confirman el cumplimiento de Alternative. En respuesta a una carta de Jruschov, Kennedy informa:

"Si acepta el desmantelamiento de estos sistemas de armas de Cuba ... nosotros, por nuestra parte, acordaremos ... (a) eliminar de inmediato las medidas de cuarentena actualmente en vigor y (b) garantizar la no agresión contra Cuba",

que corresponde a la "Alternativa", ya que (3.3) es preferible para los Estados Unidos que (2.2), mientras que (4.2) no es preferible en el "pollo" (3.3).

Si los soviéticos retuvieran sus misiles, Estados Unidos hubiera preferido un bloqueo de ataque aéreo. Según Robert Kennedy, un asesor cercano a su hermano en ese momento,

"Si no eliminan estas bases, las eliminaremos",

que corresponde a la "Alternativa", ya que Estados Unidos preferirá el resultado (4.1) al resultado (1.4), en lugar del resultado (1.1) al resultado (2.4) para el juego de "pollo".

Finalmente, era bien sabido que muchos asesores del presidente Kennedy eran muy reacios a considerar iniciar un ataque contra Cuba, sin agotar los métodos de acción menos beligerantes que podrían conducir a la retirada de misiles con menos riesgo y más en línea con los ideales y valores de Estados Unidos. En particular, Robert Kennedy declaró que un ataque inmediato habría parecido "Pearl Harbor por el contrario, y habría ennegrecido el nombre de Estados Unidos en las páginas de la historia", que corresponde a "Alternativa", porque Estados Unidos clasificó a AW un poco mejor que el peor resultado (2 ) - como la acción "vergonzosa" de los Estados, y no como la mejor (4) - la victoria de los Estados Unidos - en el "pollo".

Aunque la "Alternativa" proporciona una idea más realista de la percepción de los participantes del juego que el "pollo", la teoría estándar de los juegos no ayuda mucho a explicar cómo se logró el compromiso y por qué el compromiso resultó ser estable (3.3). Como en el "pollo", las estrategias asociadas con este resultado no son un equilibrio de Nash, porque los soviéticos tienen un incentivo inmediato para cambiar de (3.3) a (1.4).

Sin embargo, a diferencia del "pollo", la "Alternativa" generalmente no tiene resultados que sean equilibrios de Nash, con la excepción de las "estrategias mixtas". Estas son estrategias en las que los jugadores asignan al azar sus acciones elegidas, eligiendo cada una de sus dos llamadas estrategias puras con probabilidades dadas. Pero es imposible utilizar estrategias mixtas para el análisis de la "Alternativa", porque para realizar dicho análisis, es necesario adjuntar ganancias numéricas a cada resultado y no clasificarlas en orden.

La inestabilidad de los resultados en la "Alternativa" se ve mejor cuando se estudia el ciclo de preferencias indicado por las flechas que se ejecutan en este juego en el sentido de las agujas del reloj. Seguir estas flechas significa que este juego es cíclico , y un jugador siempre tiene un incentivo inmediato para desviarse de cada estado: los soviéticos: de (3.3) a (1.4); en los Estados Unidos: de (1.4) a (4.1); entre los soviéticos: de (4.1) a (2.2); y en los Estados Unidos, de (2.2) a (3.3). Nuevamente tuvimos incertidumbre, pero no por la presencia de varios equilibrios de Nash, como en el "pollo", sino porque en la "Alternativa" no hay equilibrios entre estrategias puras.

Reglas del juego en la teoría de los movimientos.


Entonces, ¿cómo podemos explicar la elección de (3.3) en la "Alternativa", y al mismo tiempo en el "pollo", dado el estado de no equilibrio de acuerdo con la teoría estándar de los juegos? Resulta que (3.3) es en ambos juegos "equilibrio no miope", y en "Alternativa", según la teoría de los movimientos (TOM), es el único equilibrio de este tipo. Asumiendo que los jugadores piensan con anticipación no solo las consecuencias inmediatas de los movimientos, sino también las consecuencias de los contramovimientos en respuesta a estos movimientos, contramovimientos, etc., TOM expande el análisis estratégico del conflicto en un futuro más distante.

Por supuesto, la teoría del juego permite que se tenga en cuenta tal pensamiento al analizar los "árboles del juego", que describen las acciones sucesivas de los jugadores a lo largo del tiempo. Pero el árbol del juego cambia constantemente con cada desarrollo de la crisis. Por el contrario, en la "Alternativa" la configuración de las victorias permanece más o menos constante, aunque allí los jugadores están en la matriz cambiada. De hecho, TOM, que describe las victorias en un juego, pero permite a los jugadores hacer cálculos secuenciales de movimientos en diferentes posiciones, agrega un pensamiento no miope a la economía de descripción propuesta por la teoría clásica del juego.

Los fundadores de la teoría de juegos John von Neumann y Oscar Morgenstern definieron el juego como "describiendo su conjunto de reglas". TOM , , . TOM :


  1. , .
  2. , , , . 1 ( P1 ).
  3. 2 ( P2 ) ,=, , .
  4. , ( P1 P2 ), , . , , .


  1. , (i) , (ii) , .


  1. , — , : , , .

, : , , , , , , , . , , ( , ).

, , , , , . , . , , , . , , , , .

1 , , . , , TOM , - , . , , .

, , , , , . , , , , , , . -, . TOM.

: , , , — , , , ( ). , , , , .

, . TOM () , ( ) . , , , , , .

, - , , ; . , , , , . , , .

1 — 4 ( ) , , , : , «, , » ( 4). , ?

, , . (i) , (ii) . , P1 , P1 . , -, « », , ?


, , , , . , , , . , , , , , , .

, «» 2. BM, (1) (4). , , AM, AW, , , , ( 1):

12341
(1,4)(4,1)(2,2)→ |(3,3)(1,4)
(2,2)(2,2)(2,2)(1,4)

, , . — , . , ( 1, ).

, «» (1,4) (4,1), (2,2) (3, 3), 4 , (3,3) , (1,4). , (1,4) (3,3), (1,4) (3,3): (1,4), (3,3), , - , (1,4).

, (2,2) (3,3)? (2,2) (3,3) , (1,4), «». (2,2) , (2,2) (3,3) — , , (1,4) (3,3).

(4,1) (2,2), (4,1), (2,2) , (4,1). , (1,4), (2,2) (1,4), (2,2).

, (2,2) (1,4) , (4,1), (2,2), , (2,2) , (1,4). (3,3), , , , . , (2,2), , (2,2) , (2,2).

, (2,2) AM , (3,3) BW. , , - (1,4), , (1,4)? , , , (1,4) :

12341
(1,4)(3,3)→|(2,2)(4,1)(1,4)
(3,3)(3,3)(2,2)(4,1)

, «», BM (4) (3) BW, (3,3), 2. , , , , ( 90%), .

TOM



, TOM . , 3 4, ( ?) . , 4, 1 , : 3 2 (), .

, ( ), 4 1, : 4, , , 4. , , , , .

: . , , , - , . TOM , (, ) , , . , .


  1. «Theory of Moves», Steven J. Brams. Cambridge University Press, 1994.
  2. «Game Theory and Emotions», Steven J. Brams in Rationality and Society, Vol. 9, No. 1, pages 93-127, February 1997.
  3. «Long-term Behaviour in the Theory of Moves», Stephen J. Willson, in Theory and Decision, Vol. 45, No. 3, pages 201-240, December 1998.
  4. «Catch-22 and King-of-the-Mountain Games: Cycling, Frustration and Power», Steven J. Brams and Christopher B. Jones, in Rationality and Society , Vol. 11, No. 2, pages 139-167, May 1999.
  5. «Modeling Free Choice in Games», Steven J. Brams in Topics in Game Theory and Mathematical Economics: Essays in Honor of Robert J. Aumann, pages 41-62. Edited by Myrna H. Wooders. American Mathematical Society, 1999.



Sobre el autor


. (Steven J. Brams) — - . 13 , , , . : Fair Division: From Cake-Cutting to Dispute Resolution (1996 ) The Win-Win Solution: Guaranteeing Fair Shares to Everybody (1999 ) . . , « », , .

Minuto de cuidado de ovnis


Este material puede causar sentimientos conflictivos, así que antes de escribir un comentario, actualice algo importante en su memoria:

Cómo escribir un comentario y sobrevivir
  • No escriba comentarios ofensivos, no se ponga personal.
  • Abstenerse de lenguaje obsceno y comportamiento tóxico (incluso en forma velada).
  • Para informar comentarios que violen las reglas del sitio, use el botón "Informar" (si está disponible) o el formulario de comentarios .

Qué hacer si: menos karma | cuenta bloqueada

Código de autores Habr y habraetiket
Versión completa de las reglas del sitio

Source: https://habr.com/ru/post/es436066/


All Articles