Teoria do movimento

"Nós jogamos peepers e, na minha opinião, o inimigo piscou", disse o secretário de Estado dos EUA, Dean Rusk, no auge da crise dos mísseis cubanos em outubro de 1962. Ele tinha em mente os sinais que a União Soviética estava enviando, desejando resolver o confronto nuclear mais perigoso entre as duas superpotências, que muitos analistas interpretaram como um exemplo clássico de um jogo nuclear de frango (a versão russa deste jogo é chamada de falcões e pombos).
O jogo da galinha é geralmente usado para modelar conflitos nos quais cada jogador se dirige para uma colisão. Os jogadores podem ser motoristas se aproximando em uma estrada estreita, cada um dos quais tem uma escolha - desligue para evitar uma colisão ou não desligue. Na história
Rebel Without a Cause , que mais tarde foi transformada em filme com James Dean, os motoristas eram dois adolescentes, mas não estavam dirigindo um em cima do outro, mas em um penhasco. O objetivo do jogo não era pressionar os freios primeiro e não se transformar em “galinha” dessa maneira e, ao mesmo tempo, não cair de um penhasco.
Embora a crise dos mísseis do Caribe pareça um jogo de galinha, na realidade ela é pouco modelada por esse jogo. Outro jogo descreve com mais precisão as ações dos líderes dos Estados Unidos e da União Soviética, mas mesmo para esse jogo a teoria padrão dos jogos não descreve totalmente as opções disponíveis para eles.
Por outro lado, a teoria dos movimentos, baseada na teoria dos jogos, mas mudando radicalmente as regras padrão do jogo, reproduz ou prediz as ações passadas dos líderes. Mais importante, essa teoria lança luz sobre a dinâmica do jogo, com base no pressuposto de que os jogadores pensam não apenas nas conseqüências imediatas de suas ações, mas também em seu impacto no jogo no futuro.
Uso a crise nuclear do Caribe para ilustrar partes dessa teoria, que não é apenas um modelo matemático abstrato, mas também reflete as escolhas feitas na vida real, os processos de pensamento que a levaram e também explica as ações de jogadores vivos de carne e osso. O conselheiro especial do presidente John F. Kennedy, Theodore Sorensen, na verdade usou a terminologia dos movimentos para descrever as discussões do Comitê Executivo dos principais conselheiros do Kennedy durante a crise dos mísseis cubanos:
"Discutimos as reações dos soviéticos a quaisquer movimentos possíveis dos Estados Unidos, nossa reação a essas ações dos soviéticos e assim por diante, tentando chegar a uma conclusão lógica em cada um desses caminhos".
Teoria Clássica dos Jogos e Crise Nuclear

A teoria dos jogos é um campo da matemática que estuda a tomada de decisão nas interações sociais. Isso se aplica a situações (
jogos ) em que duas ou mais pessoas (chamadas de
jogadores ) escolhem entre dois ou mais modos de ação (chamadas de
estratégias ). Os possíveis resultados do jogo dependem das ações escolhidas por todos os jogadores e podem ser avaliados em ordem de preferência para cada jogador.
Em alguns jogos com dois jogadores e com duas estratégias, existem estratégias de jogadores que são, de certo modo, "estáveis". Isso é verdade quando nenhum dos jogadores, que se desvia de sua estratégia, pode obter melhores resultados. Essas duas estratégias são coletivamente chamadas de equilíbrio de Nash, em homenagem ao matemático
John Nash , que recebeu o Prêmio Nobel de 1994 em economia por seu trabalho no campo da teoria dos jogos. Os equilíbrios de Nash não levam necessariamente aos melhores resultados para um ou até dois jogadores. Além disso, em jogos que podem ser analisados e onde os jogadores só podem definir a classificação dos resultados ("jogos ordinais"), mas não podem associar valores numéricos a eles ("jogos cardinais"), eles podem não existir. (Embora, como Nash tenha mostrado, eles sempre existam nos jogos principais, o equilíbrio de Nash nesses jogos pode incluir "estratégias mistas", que discutirei abaixo).
A crise nuclear cubana foi desencadeada por uma tentativa da União Soviética, em outubro de 1962, de instalar mísseis balísticos nucleares de alcance médio e intermediário em Cuba que poderiam atingir grande parte dos Estados Unidos. O objetivo dos Estados Unidos era o movimento imediato de mísseis soviéticos e, para alcançá-lo, a alta liderança dos Estados Unidos considerou seriamente duas estratégias [
veja a Figura 1 ]:
- Um bloqueio naval (B) , ou, como era chamado secretamente de "quarentena", para impedir a entrega de novos mísseis, que poderiam ser seguidos por uma ação mais séria que forçaria a União Soviética a remover os mísseis já instalados.
- Um ataque aéreo "cirúrgico" (A) para destruir os mísseis existentes, tanto quanto possível, o que poderia ser seguido por uma invasão da ilha.
As seguintes alternativas foram abertas diante da liderança da União Soviética:
- Lembre-se (W) de seus mísseis.
- Salvando (M) mísseis na ilha.
| | União Soviética (URSS) |
| | Revisão (W) | Salvando (M) |
Estados Unidos (EUA) | Bloqueio (B) | Compromisso (3.3) | Vitória dos soviéticos, derrota dos EUA (2.4) |
Ataque aéreo (A) | Vitória dos EUA, derrota dos soviéticos (4.2) | Guerra Nuclear (1.1) |
Figura 1: Crise nuclear cubana como um jogo de galinhaChave: (x, y) = (vitória dos EUA, vitória soviética): 4 = melhor; 3 = ligeiramente pior que o melhor; 2 = ligeiramente melhor que o pior; 1 = pior. O equilíbrio de Nash está sublinhado.
Essas estratégias podem ser consideradas programas de ação alternativos que podem ser escolhidos por duas partes, ou "jogadores", na terminologia da teoria dos jogos. Eles levam a quatro resultados possíveis que os jogadores devem classificar da seguinte maneira: 4 = melhor; 3 = ligeiramente pior que o melhor; 2 = ligeiramente melhor que o pior; 1 = pior. Ou seja, quanto maior o número, maior o ganho; mas os ganhos são apenas
ordinais , ou seja, indicam apenas a ordem dos ganhos do melhor para o pior, mas não na medida em que o jogador prefere um resultado ao outro. O primeiro número em cada um dos resultados emparelhados é a vitória horizontal do jogador (EUA), o segundo número é a vitória vertical do jogador (URSS).
Desnecessário dizer que as escolhas de estratégia, os resultados prováveis e os ganhos relacionados mostrados na Figura 1 fornecem apenas um esqueleto geral da imagem da crise que se desenrola ao longo de treze dias. Ambos os lados consideraram mais de duas alternativas da lista e cada uma delas teve várias variações. Os soviéticos, por exemplo, exigiram a retirada de mísseis americanos da Turquia como
contrapartida pela retirada de seus próprios mísseis de Cuba. Esta alegação foi publicamente ignorada pelos Estados Unidos.
No entanto, a maioria dos observadores dessa crise acreditava que as duas superpotências se dirigiam a um confronto, que deu o nome a um dos livros sobre esse confronto nuclear. Além disso, eles concordam que nenhuma das partes procurou dar passos irreparáveis, como um dos motoristas tocando a “galinha”, arrancando demonstrativamente o volante do carro na frente do outro motorista, excluindo a possibilidade de desligar.
Embora, em certo sentido, os Estados Unidos "tenham vencido" forçando os soviéticos a retirar seus mísseis, a primeira secretária da URSS, Nikita Khrushchev, ao mesmo tempo cumpriu uma promessa do presidente Kennedy de não atacar Cuba, portanto esse resultado final pode ser considerado uma espécie de compromisso. Mas para um jogo de frango, isso não é uma previsão da teoria dos jogos, porque as estratégias de compromisso não constituem o equilíbrio de Nash.
Para verificar isso, suponha que o jogo esteja em uma posição comprometida (3.3), ou seja, os Estados Unidos estão bloqueando Cuba e a URSS está retirando seus mísseis. Essa estratégia é instável, pois os dois jogadores têm o incentivo para se desviar para sua estratégia mais beligerante. Se os Estados Unidos se desviassem mudando sua estratégia para ataque aéreo, o jogo mudaria para (4.2), melhorando o ganho dos EUA; se a URSS se desviasse, mudando sua estratégia para preservar mísseis, o jogo passaria para (2,4), dando à URSS um ganho de 4. (Esse esquema clássico da teoria dos jogos não nos fornece nenhuma informação sobre qual resultado será escolhido, porque a mesa vencedora Simétrico para ambos os jogadores.Este é um problema comum na interpretação dos resultados da análise teórica dos jogos em que várias posições de equilíbrio podem surgir.) Finalmente, se os jogadores obtiverem o pior resultado mutuamente (1.1), isto é, uma guerra nuclear, é óbvio que ambos quererão desviar-se de ele que com faz com que estratégias relacionadas a ele, por exemplo (3.3), sejam instáveis.
Teoria do Movimento e Crise Nuclear

Usar um jogo de galinha para simular uma situação como a crise do Caribe é problemático não apenas porque o resultado do compromisso (3.3) é instável, mas também porque no mundo real os dois lados não escolhem suas estratégias de maneira simultânea ou independente, como é suposto no jogo de frango acima. Os soviéticos responderam especificamente ao bloqueio depois que este foi declarado pelos Estados Unidos. Além disso, o fato de os Estados Unidos estarem considerando escalar o conflito, pelo menos até o ataque aéreo, sugere que a decisão inicial sobre o bloqueio não foi considerada final. Ou seja, após o anúncio do bloqueio, os Estados Unidos ainda consideravam possíveis opções para a escolha de uma estratégia.
Portanto, é melhor modelar esse jogo como negociações consecutivas nas quais nenhum dos lados escolheu "tudo ou nada"; ambas consideradas alternativas, em particular no caso de o lado oposto não responder da maneira que o outro lado considerar apropriado. Na deterioração mais séria das relações de dissuasão nuclear entre as superpotências, que persiste desde a Segunda Guerra Mundial, cada uma das partes prudentemente sondou seu caminho, dando passos ameaçadores. A União Soviética, antes da crise, temendo uma invasão de Cuba pelos Estados Unidos e também tentando manter sua posição estratégica no mundo, concluiu que o risco de instalar mísseis na ilha valia a pena. Ele acreditava que os Estados Unidos, diante do
fato consumado , abster-se-iam de atacar Cuba e não ousariam tomar outras medidas duras de retaliação. Mesmo que a instalação de mísseis desencadeie uma crise, os soviéticos não consideraram alta a probabilidade de guerra (durante a crise, o presidente Kennedy estimou a probabilidade de guerra na faixa de 1/3 a 1/2), ou seja, o risco de provocar os Estados Unidos seria racional para eles.
Há razões razoáveis para acreditar que as altas autoridades americanas não viram o confronto como um jogo de galinha, pelo menos na maneira como ele interpretou e classificou os possíveis resultados. Proponho um modelo alternativo da crise nuclear do Caribe na forma de um jogo, que chamarei de
"Alternativa" . Nele, reterei as mesmas estratégias dos jogadores que no “frango”, mas assumirei uma classificação e interpretação diferentes dos resultados pelos Estados Unidos [
veja a Figura 2 ]. Tais classificações e interpretações correspondem melhor a documentos históricos do que os parâmetros do jogo das galinhas, tanto quanto se pode julgar pelas declarações feitas pelo Presidente Kennedy e pela Força Aérea dos EUA, bem como pelos tipos e quantidade de armas nucleares disponíveis para a URSS (mais sobre isso a seguir) )
- BW : A escolha dos Estados Unidos de bloqueio e retirada de mísseis pela União Soviética ainda é considerada um compromisso para ambos os jogadores - (3.3).
- BM : diante do bloqueio dos EUA, a preservação soviética de mísseis em Cuba leva à vitória da URSS (o melhor resultado) e a rendição dos EUA (o pior resultado para eles) - (1.4).
- AM : um ataque aéreo que destrói mísseis armazenados pela União Soviética é considerado uma ação "honrosa" para os Estados Unidos (o melhor resultado para eles) e uma derrota para os soviéticos (seu pior resultado) - (4.1).
- AW : um ataque aéreo destruindo mísseis evocados pelos soviéticos é considerado a ação “vergonhosa” dos EUA (o resultado é um pouco melhor que o pior para eles) e a derrota dos soviéticos (o resultado é um pouco melhor que o pior) - (2.2).
| | União Soviética (URSS) |
| | Revisão (W) | | Salvando (M) |
Estados Unidos (EUA) | Bloqueio (B) | Compromisso (3.3) | → | Vitória dos soviéticos, rendição dos EUA (1.4) |
|  | |  |
Ataque aéreo (A) | Ação "vergonhosa" dos EUA, derrota dos soviéticos (2.2) | ← | Ação "honrosa" dos EUA, derrota dos soviéticos (4.1) |
Figura 2: Crise nuclear do Caribe como uma “alternativa”Chave: (x, y) = (ganhos para os EUA, ganhos para a URSS), 4 = melhor; 3 = ligeiramente pior que o melhor; 2 = ligeiramente melhor que o pior; 1 = pior. Os equilíbrios míopes são destacados em negrito. As setas indicam a direção do ciclo.
Embora o ataque aéreo em ambos os casos leve à derrota dos soviéticos, (2.2) e (4.1), eu interpreto (2.2) como causando o menor dano à URSS, porque, do ponto de vista do resto do mundo, o ataque aéreo pode ser considerado como uma reação exageradamente flagrante e, portanto, "vergonhosa" por parte dos Estados Unidos, no caso de haver evidências claras de que os soviéticos estão no processo de recuperar mísseis. Por outro lado, na ausência de tais evidências, um ataque aéreo dos EUA, que poderia ter sido seguido por uma invasão, teria sido uma ação para derrubar mísseis soviéticos.
Declarações da alta administração dos EUA confirmam a conformidade com a Alternative. Em resposta a uma carta de Khrushchev, Kennedy relata:
"Se você concordar com o desmantelamento desses sistemas de armas de Cuba ... nós, por nossa parte, concordaremos ... (a) remover imediatamente as medidas de quarentena atualmente em vigor e (b) garantir a não agressão a Cuba",
que corresponde à “Alternativa”, uma vez que (3.3) é preferível para os Estados Unidos do que (2.2), enquanto (4.2) não é preferível para a “galinha” (3.3).
Se os soviéticos mantivessem seus mísseis, os Estados Unidos teriam preferido um bloqueio de ataque aéreo. De acordo com Robert Kennedy, um conselheiro próximo de seu irmão na época,
"Se eles não removerem essas bases, nós as removeremos",
que corresponde à "Alternativa", pois os Estados Unidos preferem o resultado (4.1) ao resultado (1.4), em vez do resultado (1.1) ao resultado (2.4) para o jogo de "frango".
Finalmente, era sabido que muitos conselheiros do presidente Kennedy relutavam muito em considerar iniciar um ataque a Cuba, sem esgotar métodos de ação menos beligerantes que poderiam levar à retirada de mísseis com menos risco e mais alinhados com os ideais e valores da América. Em particular, Robert Kennedy afirmou que um ataque imediato teria parecido com "Pearl Harbor, pelo contrário, e teria enegrecido o nome dos Estados Unidos nas páginas da história", o que corresponde a "Alternativa", porque os Estados Unidos classificaram AW um pouco melhor que o pior resultado (2). ) - como a ação "vergonhosa" dos Estados Unidos, e não como a melhor (4) - a vitória dos Estados Unidos - na "galinha".
Embora a “Alternativa” forneça uma ideia mais realista da percepção dos participantes do jogo do que a “galinha”, a teoria padrão dos jogos não ajuda muito a explicar como o compromisso foi alcançado e por que o compromisso se mostrou estável (3,3). Como no “frango”, as estratégias associadas a esse resultado não são um equilíbrio de Nash, porque os soviéticos têm um incentivo imediato para mudar de (3,3) para (1,4).
No entanto, diferentemente do “frango”, o “Alternativo” geralmente não tem resultados que sejam equilíbrios de Nash, com exceção das “estratégias mistas”. Essas são estratégias nas quais os jogadores selecionam aleatoriamente suas ações escolhidas, escolhendo cada uma das duas chamadas estratégias puras com probabilidades dadas. Mas é impossível usar estratégias mistas para a análise da “Alternativa”, porque para realizar essa análise, é necessário anexar vitórias numéricas a cada resultado, e não classificadas em ordem.
A instabilidade dos resultados na "Alternativa" é mais bem vista quando se estuda o ciclo de preferências indicado pelas setas rodando neste jogo no sentido horário. Seguir estas setas significa que este jogo
é cíclico e um jogador sempre tem um incentivo imediato para se desviar de cada estado: os soviéticos - de (3.3) a (1.4); nos EUA - de (1.4) a (4.1); entre os soviéticos - de (4.1) a (2.2); e nos EUA, de (2.2) a (3.3). Novamente temos incerteza, mas não por causa da presença de vários equilíbrios de Nash, como no "frango", mas porque no "Alternativo" não há equilíbrios entre estratégias puras.
As regras do jogo na teoria dos movimentos

Então, como podemos explicar a escolha de (3.3) na “Alternativa” e, ao mesmo tempo, na “galinha”, dado o estado de não-equilíbrio de acordo com a teoria padrão dos jogos? Acontece que (3.3) está em ambos os jogos “equilíbrio não-míope” e em “Alternativa”, de acordo com a
teoria dos movimentos (TOM), é o único equilíbrio desse tipo. Supondo que os jogadores pensem adiante não apenas as consequências imediatas dos movimentos, mas também as consequências dos contra-movimentos em resposta a esses movimentos, contra-contra-movimentos e assim por diante, o TOM expande a análise estratégica do conflito para um futuro mais distante.
Obviamente, a teoria dos jogos torna possível levar esse pensamento em consideração ao analisar as "árvores de jogos", que descrevem as ações sucessivas dos jogadores ao longo do tempo. Mas a árvore do jogo está mudando constantemente a cada desenvolvimento da crise. Por outro lado, em "Alternativa", a configuração das vitórias permanece mais ou menos constante, embora os jogadores estejam na matriz alterada. Em essência, o TOM, descrevendo vitórias em um jogo, mas permitindo que os jogadores façam cálculos sequenciais de movimentos em posições diferentes, adiciona um pensamento não míope à economia de descrição proposta pela teoria clássica dos jogos.
Os fundadores da teoria dos jogos, John von Neumann e Oscar Morgenstern, definiram o
jogo como "descrevendo seu conjunto de regras". TOM , , . TOM :
- , .
- , , , . 1 ( P1 ).
- 2 ( P2 ) ,=, , .
- , ( P1 P2 ), , . , , .
- , (i) , (ii) , .
- , — , : , , .
, : , , , , , , , . , , ( , ).
, , , , , . , . , , , . , , , , .
A regra 1 é muito diferente da regra do jogo correspondente na teoria padrão dos jogos, em que os jogadores escolhem simultaneamente estratégias de um jogo matricial que determina seu resultado. Em vez de começar com a escolha da estratégia, o TOM assume que, no início do jogo, os jogadores já estão em algum estado e recebem um ganho desse estado somente se permanecerem nele . Com base nesses ganhos, eles devem decidir individualmente se devem mudar esse estado, tentando alcançar o melhor., , , , , . , , , , , , . -, . TOM.
: , , , — , , , ( ). , , , , .
, . TOM () , ( ) . , , , , , .
, - , , ; . , , , , . , , .
1 — 4 ( ) ,
, , : , «, , » ( 4). , ?
, , . (i) , (ii) . ,
P1 ,
P1 . , -, « », , ?
, , , ,
. , , , . , , , , , , .
, «» 2. BM, (1) (4). , , AM, AW, , , , ( 1):
| 1 | | 2 | | 3 | | 4 | | 1 |
| (1,4) | → | (4,1) | → | (2,2) | → | | (3,3) | → | (1,4) |
| (2,2) | | (2,2) | | (2,2) | | (1,4) |
, , . — , . , ( 1, ).
, «» (1,4) (4,1), (2,2) (3, 3), 4 , (3,3) , (1,4). , (1,4) (3,3), (1,4) (3,3): (1,4), (3,3), , - , (1,4).
, (2,2) (3,3)? (2,2) (3,3) , (1,4), «». (2,2) , (2,2) (3,3) — , , (1,4) (3,3).
(4,1) (2,2), (4,1), (2,2) , (4,1). , (1,4), (2,2) (1,4), (2,2).
, (2,2) (1,4) , (4,1), (2,2), , (2,2) , (1,4). (3,3), , , , . , (2,2), , (2,2) , (2,2).
, (2,2) AM , (3,3) BW. , , - (1,4), , (1,4)? , , , (1,4) :
| 1 | | 2 | | 3 | | 4 | | 1 |
| (1,4) | → | (3,3) | →| | (2,2) | → | (4,1) | → | (1,4) |
| (3,3) | | (3,3) | | (2,2) | | (4,1) |
, «», BM (4) (3) BW, (3,3), 2. , , , , ( 90%), .
TOM

, TOM . , 3 4, ( ?) . , 4, 1 , : 3 2 (), .
, ( ), 4 1, : 4, , , 4. , , , , .
: . , , , - , . TOM , (, ) , , . , .
- «Theory of Moves», Steven J. Brams. Cambridge University Press, 1994.
- «Game Theory and Emotions», Steven J. Brams in Rationality and Society, Vol. 9, No. 1, pages 93-127, February 1997.
- «Long-term Behaviour in the Theory of Moves», Stephen J. Willson, in Theory and Decision, Vol. 45, No. 3, pages 201-240, December 1998.
- «Catch-22 and King-of-the-Mountain Games: Cycling, Frustration and Power», Steven J. Brams and Christopher B. Jones, in Rationality and Society , Vol. 11, No. 2, pages 139-167, May 1999.
- «Modeling Free Choice in Games», Steven J. Brams in Topics in Game Theory and Mathematical Economics: Essays in Honor of Robert J. Aumann, pages 41-62. Edited by Myrna H. Wooders. American Mathematical Society, 1999.
Sobre o autor
. (Steven J. Brams) — - . 13 , , , . :
Fair Division: From Cake-Cutting to Dispute Resolution (1996 )
The Win-Win Solution: Guaranteeing Fair Shares to Everybody (1999 ) . . , « », , .

Minuto de cuidados UFO
Esse material pode causar sentimentos conflitantes; portanto, antes de escrever um comentário, atualize algo importante em sua memória: