Teoria dos jogos, confusão do mouse e pneu furado



A teoria dos jogos é uma ciência na fronteira da matemática e da economia.

A própria teoria dos jogos se originou com a teoria econômica cerca de três séculos atrás, mas John Forbes Nash transformou-a em uma ciência, não, não está relacionada à revista Forbes.

Nash é bem conhecido sobre a biografia de Nash, mas seu trabalho ainda é um mistério para muitos. Hoje vou tentar começar a revelar a essência da teoria dos jogos e começar com o básico.

Jogo de estratégia

“Jogo” - ouvindo essa palavra, muitas pessoas pensam que estamos falando de algo insignificante e não em grande escala, especialmente em comparação com a economia mundial, negócios ou assuntos militares. De fato, os jogos estratégicos incluem não apenas estratégias militares e de negócios, mas também economia, construção de carreira e relacionamento e muito mais. Quase tudo o que nos rodeia se relaciona com jogos estratégicos, e a teoria dos jogos ajuda a descobrir isso.

Mas letras suficientes, todo mundo já entendeu que jogos estratégicos e teoria dos jogos são as coisas mais importantes que podem existir na vida, o que significa que é hora de começar a analisar exemplos.

Soco em círculo


O tênis é um ótimo campo para jogos de estratégia. O que o jogador A deve fazer para vencer o jogador B - acertar na linha de campo ou na diagonal? E o jogador A deve esperar um golpe ao longo da linha e inclinar para um lado ou esperar um golpe na diagonal e inclinar-se no lado oposto?



O mais eficaz é um acerto na linha, aqui a bola voará menos e o adversário terá menos tempo para reagir. Mas se você o usar constantemente, o jogo será muito previsível, o que significa que o inimigo estará constantemente pronto para atacar. Conseqüentemente, é necessário usar um golpe diagonal com bastante frequência, e o jogador A sempre terá que tomar uma decisão a favor de neutralizar um golpe de linha ou diagonal.

O princípio básico de ação nesta situação:

O jogador B deve se concentrar no que ele não deve fazer e não no que deve ser feito. Caso contrário, o jogador A estará pronto para atacar e as chances de sucesso serão menores.

Este exemplo ilustra bem a situação do filme, onde o personagem principal precisa envenenar um dos óculos e oferecê-lo ao vilão, mas onde está a garantia de que o vilão não adivinhará as intenções do herói e não tomará um copo de vinho não envenenado, especialmente se ele já havia encontrado algo antes assim.



Conclusão: em situações semelhantes, você deve agir aleatoriamente, mas é melhor envenenar os dois óculos, pois isso definitivamente funcionará. Mas não esqueça o antídoto!

Confusão do mouse


O dilema dos prisioneiros é conhecido há muito tempo, mas como aplicá-lo em outros casos que não a investigação.

Imagine que você se matriculou em um curso em que as notas são colocadas com desempenho médio. Ao mesmo tempo, independentemente do seu sucesso, apenas 40% dos alunos receberão uma nota de "excelente" e os outros 40% de "bom", pelos 20% restantes, essas notas ficarão indisponíveis, por melhores que sejam os resultados em termos absolutos.



Acontece que, para alcançar bons resultados, você precisa trabalhar não apenas na aprendizagem como tal, mas também para monitorar o sucesso de seus companheiros. A maioria dos alunos entende que tudo isso é motivo de confusão, e após a primeira palestra eles se reúnem para concordar em não mostrar excessivo zelo em seus estudos.

E tudo ficaria bem, mas depois de algumas semanas o desejo de tirar boas notas se torna muito forte e os alunos começam a violar o acordo, passando mais tempo estudando. Além disso, seus colegas não terão conhecimento do volume de seus esforços e não podem, de alguma forma, realmente afetá-lo, e uma pontuação alta claramente vale um pequeno esforço.

Mas o problema é que o restante dos alunos resolve da mesma maneira e, como resultado, você recebe exatamente a mesma nota como se todos tivessem um acordo. Há apenas uma diferença - você passará mais tempo estudando do que gostaria.

É geralmente aceito que em qualquer jogo haja um vencedor e um perdedor, mas o dilema dos prisioneiros não é um deles - nele todos os jogadores podem perder e vencer.

Os dilemas dos presos incluem uma variedade de atividades diárias, como uma corrida armamentista ou quando você sai do estádio para ter uma visão melhor. Todos os casos são diferentes, mas estão unidos por uma coisa: como todos os participantes seguem o mesmo caminho, o resultado permanece inalterado e nenhum dos participantes no jogo obtém uma vantagem significativa.

Pneu furado




Nos Estados Unidos, existe uma bicicleta comum entre os alunos que ilustra bem a estratégia em jogos com movimentos consecutivos. A situação é semelhante ao dilema dos presos, mas ainda um pouco diferente:

Dois estudantes estudaram química, tiveram boas provas e exames laboratoriais, e apenas um exame foi deixado para a certificação final. Ele estava marcado para segunda-feira e os caras estavam determinados a obter a classificação mais alta, mas no sábado eles decidiram relaxar na festa. Como resultado - durante todo o domingo, em vez de se preparar, eles caíram de ressaca.

Percebendo que, sem preparação, eles têm poucas chances de passar no exame perfeitamente, os alunos decidiram contar ao professor de química uma história comovente sobre um pneu furado, por causa do qual o fim de semana inteiro foi em vão, e eles não puderam se preparar. Eles também pediram para fazer o exame amanhã, pois haviam acabado de chegar e estavam muito cansados.

Depois de pensar, o professor concordou e os rapazes foram estudar urgentemente os materiais.

Chegando no dia seguinte para o exame, eles se sentaram em diferentes públicos e deram a tarefa. A tarefa consistiu em apenas duas perguntas: a primeira era muito simples e foi avaliada em 10 pontos em uma escala de 100 pontos, e a segunda em outra página e em 90 pontos.

A segunda pergunta era uma frase simples: "Então, qual pneu abaixou?"

Esta excelente história traz duas lições estratégicas importantes: não subestime seu oponente e você deve considerar movimentos futuros à frente e depois analisá-los na ordem inversa para determinar as melhores ações.

A propósito, devido ao fato de os alunos não terem concordado com as respostas antecipadamente, a probabilidade de coincidência é de apenas 25%.

Para a resposta correta, você precisa pensar não apenas em uma resposta lógica e óbvia, mas também em sua obviedade a um amigo. Assim, você pode adivinhar para sempre. E embora a roda dianteira direita pareça ser uma resposta lógica devido à proximidade do meio-fio, onde podem haver óculos e unhas, mais de 50% responderam à frente esquerda quando entrevistaram estudantes. Por que - ninguém sabe, mas essa resposta lhes parecia mais óbvia.

Proteção de manipulação




Muitos professores não passam nos exames sob nenhuma circunstância. Por um lado, isso pode parecer cruel, mas se você pensar bem, a posição deles fica clara.

A maioria dos professores é uma pessoa gentil e prestativa, e eles ficariam felizes em dar concessões aos alunos, mas, devido à sua gentileza, eles podem entrar em uma situação difícil.

Depois de sentir a fraqueza, os alunos podem começar a usá-la e, como resultado, o processo educacional pode ser interrompido, porque nem sempre é possível distinguir a verdade da mentira, principalmente se as desculpas forem iguais. Então você tem que aceitar tudo com fé.

A maneira mais fácil de evitar situações embaraçosas e inconvenientes futuros é nem começar a dar concessões. Mas como tornar sua recusa confiável. A melhor maneira é se referir à administração da instituição e suas instruções, porque se ele não as seguir, os professores poderão ser punidos.

Mas o que fazer se a administração não fornecer restrições de economia - nesse caso, você deve consultar seus próprios princípios e expressá-los quando conhecer os alunos. E assim que surgir a situação com desculpas, lembre-se dos princípios expressos e exija um senso de justiça: "Se eu for junto com você, também terei que agir com outros alunos, e você sabe que isso é inaceitável".

Essa estratégia de comprometimento e promessas e ameaças relacionadas. Um tópico extenso sobre o qual muitas outras estratégias de jogo são construídas.

Puxe para o último


Muitos têm a experiência de morar em um dormitório ou em um apartamento alugado com amigos e, provavelmente, durante o acúmulo dessa experiência, houve situações em que o pó ou o detergente termina, mas não há desejo de ir atrás deles. Então começamos a esperar que o vizinho desça e compre, e puxe para o último, ou vamos à loja e conseguimos o que precisamos? Isso acontece de maneiras diferentes, mas muitas vezes todo mundo é arrastado para o último, e é quem tem "sorte" de encontrar o sabão em pó acabado, mas muito necessário, ou qualquer outra coisa que vá à loja. Tais situações podem atingir conflitos e grandes brigas, mas consideraremos isso do lado do jogo estratégico.

Vale a pena considerar a situação por dois lados.

A primeira é uma simples escolha binária - ir ou não à loja. E aqui a melhor opção é se o vizinho for à loja e você ficar em casa, e o pior é se você for e o vizinho se sentar na frente do console. Além disso, se vocês forem à loja sem notificar um ao outro, haverá duplicação desnecessária de compras e possível deterioração dos produtos; se ninguém for, haverá uma catástrofe local, como um papel higiênico vazio, sobre o qual alguém pode descobrir por hora de necessidade. Um dos títulos deste jogo de estratégia é "jogo covarde".

A segunda é a guerra de atrito, e é um pouco mais interessante. Nesta guerra, cada participante tenta esperar os vizinhos e espera que alguém termine sua paciência mais cedo. Ao mesmo tempo, aumenta o risco de que algo importante termine e ocorra uma catástrofe e uma briga subsequente. Aqui, cada jogador admite um agravamento da situação ao seu ponto de tolerância e, no final, perde o mais impaciente. Nesta guerra, cada participante avalia a disposição de outros jogadores em alcançar uma catástrofe, e isso é chamado de "equilibrar no limite". Essa também é uma variação do jogo de covarde, mas mais dinâmica.

Equilibrar à beira é um jogo com crescente risco mútuo e pode ter apenas dois resultados. O primeiro - um dos jogadores atinge seu ponto de tolerância e rendimento, e o segundo - o risco aumenta para um nível crítico e surge uma briga. Na maioria das vezes, a segunda opção é muito pior para todos.

Data do jogo




Quando você sai para um encontro, deseja se apresentar da melhor maneira possível ao seu parceiro e causar a melhor impressão nele, porque se você falhar, o relacionamento poderá não funcionar - não haverá segunda chance de causar uma primeira impressão.

Ao mesmo tempo, você gostaria de aprender não apenas sobre os aspectos positivos do parceiro, mas também sobre os negativos - deseja estar preparado para tudo. Mas o problema é que você não apenas conhece a arte de namorar.

Portanto, durante a primeira reunião, você e o oponente se avaliam, tentando entender quais qualidades negativas estão escondendo e que o positivo mostrado é a verdade, não a falsa. Assim, por exemplo, presentes podem mostrar generosidade e vontade de sacrificar algo por você, mas presentes devem ser avaliados em termos de valor para o oponente. Um buquê de flores para um aluno será tão valioso quanto um anel de diamante para um bilionário. Mas o tempo de um bilionário pode custar muito mais do que esse anel.

Além disso, o envio e ocultação de informações ocorre não apenas na primeira data, mas em todo o relacionamento. Aqui está uma história que ilustra isso perfeitamente:

Na cidade de Nova York, um homem e uma mulher alugam apartamentos com aluguéis regulados pelo estado. Essa habitação é sempre vantajosa para alugar, diferentemente das ofertas particulares. O relacionamento do casal se desenvolveu e eles decidiram morar juntos. A mulher se ofereceu para morar com ela e recusar o homem de seu apartamento. Mas ele decidiu sair do apartamento, explicando isso pelo fato de que é sempre melhor ter várias opções. E como a probabilidade de uma pausa, embora mínima, permanece, então, dado o risco, é melhor deixar um apartamento alugado para alugar. A mulher percebeu a resposta negativamente e cortou o relacionamento.

Os racionalistas confirmam a viabilidade de uma ampla escolha, mas, neste caso, a razão para explicar as ações das mulheres deve ser considerada do lado da estratégia. Como não estava confiante no parceiro, decidiu testá-lo quanto à confiabilidade e ele não passou no teste. Não basta dizer "eu te amo", vale a pena confirmar as palavras por ação, e neste caso a quebra do contrato seria confirmação e a recusa do homem seria confirmação suficiente do contrário. E a ruptura nas relações por parte da mulher era lógica.

Este exemplo pertence à classe de jogos de estratégia com base em sua própria experiência e sua principal ferramenta é a manipulação de informações. Portanto, estratégias que transmitem informações são chamadas de sinais, e estratégias que incentivam a divulgação de informações são ferramentas de triagem. Assim, no exemplo, as ações de uma mulher estavam examinando e as ações de um homem eram um sinal. A metodologia para o uso de estratégias de rastreamento e sinalização é ampla e merece uma publicação separada.

Talvez eu termine nisso. Como sempre, ficarei feliz com as adições e discussões nos comentários.
Tenham um bom dia a todos!



Referências:

Jogos de estratégia. Tutorial de teoria dos jogos disponível »
Autores: Dixit Avinash, Skeet Susan, Reilly Jr. David
Mannov, Ivanov e Ferber, 2017
ISBN: 978-5-00100-813-2

Source: https://habr.com/ru/post/pt409165/


All Articles