Alexey Savvateev: Modèle de schisme social de la théorie des jeux (+ enquête nginx)

Bonjour, Habr!
Je m'appelle Asya. J'ai trouvé une conférence très sympa, je ne peux m'empêcher de partager.

J'attire votre attention sur un synopsis d'une conférence vidéo sur les conflits sociaux dans le langage des mathématiciens théoriciens. La conférence complète est disponible sur le lien: Model of social split: a ternary choice game on interaction networks (A.V. Leonidov, A.V. Savvateev, A.G. Semenov). 2016.


Aleksey Vladimirovich Savvateev - Ph.D. en économie, docteur en physique et mathématiques, professeur à l'Institut de physique et de technologie de Moscou, chercheur principal à la NES.

Dans cette conférence, je parlerai de la façon dont les mathématiciens et les théoriciens des jeux regardent un phénomène social récurrent, dont des exemples votent pour la sortie de la Grande-Bretagne de l'Union européenne ( Brexit) , le phénomène de profonde scission sociale en Russie après le Maidan et l' élection aux États-Unis avec un résultat sensationnel .

Comment modéliser de telles situations pour qu'elles contiennent des échos de la réalité? Pour comprendre le phénomène, il est nécessaire de l'étudier de manière approfondie, mais dans cette conférence, il y aura un modèle.

Le schisme social signifie




Dans ces trois scénarios, la chose générale est qu'une personne se joint en quelque sorte à un camp, ou refuse de participer et de discuter de son choix. C'est-à-dire Le choix de chaque personne est ternaire - de trois valeurs:

  • 0 - refuser de participer au conflit;
  • 1 - participer au conflit d'un côté;
  • -1 - pour participer au conflit du côté opposé.

Il y a des conséquences directes qui sont en fait liées à votre propre attitude face au conflit. On suppose que tout le monde a un sentiment a priori de qui est ici. Et c'est une vraie variable.

Par exemple, lorsqu'une personne ne comprend vraiment pas qui a raison, le point est situé sur une droite numérique autour de zéro, par exemple 0,1. Lorsqu'une personne est sûre à 100% que quelqu'un a raison, son paramètre interne sera -3 ou +15, selon la force des croyances. Autrement dit, il y a un certain paramètre matériel qu'une personne a dans sa tête, et il exprime son attitude face au conflit.



Il est important que si vous choisissez 0, cela n'entraîne aucune conséquence pour vous, il n'y a aucun gain dans le jeu, vous avez abandonné le conflit.

Si vous choisissez quelque chose qui n'est pas cohérent avec votre position, alors un moins apparaît avant vi, par exemple v i = - 3. Si votre position interne coïncide avec le côté du conflit auquel vous parlez, et votre position est σ i = -1, alors v i = +3.

Alors la question se pose, pour quelles raisons parfois vous devez choisir le mauvais côté qui est dans votre âme? Cela peut se produire sous la pression de votre environnement social. Et ceci est un postulat.



Le postulat est que vous êtes affecté par des conséquences indépendantes de votre volonté. L'expression a ji est un paramètre matériel du degré et du signe d'influence sur vous par j. Vous êtes le numéro i, et la personne qui vous affecte est la personne numéro j. Ensuite, il y aura toute une matrice d'un tel ji .

Cette personne j peut même vous influencer négativement. Par exemple, c'est ainsi que vous pouvez décrire le discours d'un politicien désagréable de l'autre côté du conflit. Lorsque vous regardez un discours et pensez: "Cet idiot, et regardez ce qu'il dit, j'ai dit qu'il était idiot."

Cependant, si l'on considère l'influence d'une personne proche ou respectée par vous, alors il s'avère être immédiatement un joueur j sur tous les joueurs i. Et cette influence est multipliée par la coïncidence, ou l'inadéquation des positions acceptées.

C'est-à-dire si σ i , σ j , est un signe positif, et qu'un ji est également un signe positif, alors c'est un plus pour votre fonction de gain. Si vous ou une personne très importante pour vous avez pris une position zéro, ce terme ne l'est pas.

Ainsi, nous avons essayé de prendre en compte tous les effets de l'influence sociale.

Vient ensuite le point suivant. Il existe de nombreux modèles d'interaction sociale décrits sous différents angles (modèles de prise de décision seuil, nombreux modèles étrangers). Ils considèrent un concept de théorie des jeux standard appelé équilibre de Nash. Il y a une profonde insatisfaction à l'égard de ce concept pour les jeux avec un grand nombre de participants, comme dans les exemples avec le Royaume-Uni et les États-Unis mentionnés ci-dessus, c'est-à-dire plusieurs millions de personnes.

Dans cette situation, la bonne solution au problème passe par l'approximation à l'aide du continuum. Le nombre de joueurs est une sorte de continuum, un jeu «cloud», avec un certain espace de paramètres importants. Il y a une théorie des jeux de continuum, Lloyd Shapley

"Importance pour les jeux non atomiques." Il s'agit d'une approche de la théorie des jeux coopératifs.

Il n'y a pas de théorie des jeux non coopératifs avec un nombre continu de participants, car il n'y a pas de théorie. Il existe des classes distinctes qui sont étudiées, mais cette connaissance n'a pas encore été formée dans la théorie générale. Et l'une des principales raisons de son absence est que dans un cas particulier, l'équilibre de Nash est erroné. Essentiellement le mauvais concept.

Quel est donc le bon concept? Au cours des dernières années, il y a un certain consensus sur le concept développé par Palfrey et McKelvey, qui sonne en anglais comme « Quantal response equilibrium » ou « Discrete response equilibrium », comme nous l'avons traduit avec Zakharov. La traduction nous appartient, et comme personne ne l'a traduite en russe avant nous, nous avons imposé cette traduction au monde russophone.

Nous entendons par ce nom que chaque personne en particulier ne joue pas une stratégie mixte, il en joue une pure. Mais dans ce "nuage" il y a des zones dans lesquelles tel ou tel nettoyeur est sélectionné, et en réponse, je vois comment une personne joue, mais je ne sais pas où elle est dans ce nuage, c'est-à-dire qu'il y a des informations cachées là-bas, je perçois personne dans le "nuage" comme la probabilité avec laquelle il ira d'une manière ou d'une autre. Il s'agit d'un concept statique. La symbiose mutuellement enrichissante des physiciens et des théoriciens des joueurs, me semble-t-il, déterminera la théorie des jeux du 21e siècle.



Nous généralisons l'expérience disponible de modélisation de telles situations avec des données initiales complètement arbitraires et écrivons un système d'équations éloigné de l'équilibre de la réponse discrète. C'est tout, alors, pour résoudre les équations, il faut faire une approximation raisonnable des situations. Mais c'est encore à venir, c'est une énorme direction dans la science.

L'équilibre de réponse discret est un équilibre dans lequel, en fait, nous jouons de façon incompréhensible avec n'importe qui . Dans ce cas, ε est ajouté au gain de la stratégie pure. Il y a trois gains, trois chiffres qui signifient «noyade» d'un côté, «noyade» de l'autre côté et s'abstenir, et il y a ε, qui s'ajoute à ces trois. De plus, la combinaison de ces ε est inconnue. La combinaison ne peut être estimée qu'a priori, connaissant la probabilité de distribution de ε. Dans ce cas, les probabilités de la combinaison ε doivent être dictées par les propres choix de la personne, c'est-à-dire ses estimations des autres personnes et les estimations de leurs probabilités. Cette coordination est l'équilibre de la réponse discrète. Nous reviendrons sur ce moment.



Formalisation par un équilibre de réponse discret


Voici le gain dans ce modèle:



Il met entre parenthèses toute l'influence qui s'exerce sur vous si vous avez choisi un côté, ou sera multipliée par zéro si vous n'avez choisi aucun côté. De plus, ce sera avec un signe «+» si σ 1 = 1, et avec un signe «-» si σ 1 = -1. Et à cela s'ajoute ε. Autrement dit, σ i est multiplié par votre état interne et toutes les personnes qui vous influencent.

Dans le même temps, une personne spécifique peut influencer des millions de personnes, tout comme les personnalités des médias, les acteurs ou même le président affectent des millions de personnes. Il s'avère que la matrice d'influence est terriblement asymétrique, verticalement, elle peut contenir un grand nombre d'entrées non nulles et horizontalement, sur 200 millions de personnes dans le pays, par exemple, 100 nombres non nuls. Pour chacun, ce gain est la somme d'un petit nombre de termes, mais un ij (l'influence d'une personne sur quelqu'un) peut être différent de zéro pour un grand nombre de j, et l'influence d'un ji (l'influence d'une personne sur une personne) n'est pas si grande, souvent limitée à cent. Ici, une très grande asymétrie apparaît.

Exemples de participants au réseau


Nous avons tenté d'interpréter les données initiales du modèle en termes sociologiques. Par exemple, qui est un «conformiste-carriériste»? Il s'agit d'une personne qui n'est pas impliquée en interne dans le conflit, mais il y a des gens qui l'influencent fortement, par exemple le patron.



On peut prédire comment son choix est lié au choix du patron à n'importe quel équilibre.

De plus, un «passionné» est une personne ayant une forte conviction intérieure du côté du conflit.



Son a ij (influence sur quelqu'un) est super, contrairement à la version précédente, où un ji (influence de quelqu'un sur l'homme) est super.

De plus, l'autiste est une personne qui n'est pas impliquée dans le jeu. Ses croyances sont proches de zéro et personne ne l'influence.



Et enfin, un «fanatique» est une personne que personne n'influence du tout .

Peut-être, du point de vue de la linguistique, la terminologie actuelle est incorrecte, mais le travail reste dans cette direction.



Cela suggère que lui, comme celui du «passionné», vi est bien supérieur à zéro, mais aji = 0. J'attire votre attention sur le fait que «passionné» peut être simultanément un «fanatique».

Nous supposons qu'au sein de ces nœuds, la décision est prise par le «passionné / fanatique», car cette décision sera distribuée dans le cloud. Mais ce n'est pas de la connaissance, mais seulement une hypothèse. Jusqu'à présent, nous ne pouvons résoudre ce problème en aucune approximation.

Et il y a une télé. Qu'est-ce qu'une télévision? Il s'agit d'un changement dans votre état interne, une sorte de «champ magnétique».



De plus, l'influence du téléviseur, contrairement au «champ magnétique» physique sur toutes les «molécules sociales», peut être différente à la fois en amplitude et en signe.

Puis-je remplacer le téléviseur par Internet?

Au contraire, Internet est le modèle d'interaction lui-même, il doit être discuté. Nous appellerons cela une source externe, sinon des informations, puis une sorte de bruit.

Nous décrivons trois stratégies possibles pour σ i = 0, σ i = 1, σ i = -1:



Comment se passe l'interaction? Au début, tous les participants sont des «nuages», et chaque personne ne sait pour tout le monde que c'est un «nuage», et suppose une distribution a priori des probabilités de ces «nuages». Dès qu'une personne spécifique commence à interagir, elle se reconnaît les trois ε, c'est-à-dire un point spécifique, et au moment où la personne prend une décision qui lui donne un plus grand nombre (parmi ceux où ε est ajouté au gain, il choisit celui qui est plus que les deux autres), les autres ne savent pas dans quel point il se trouve, donc ils ne peuvent pas prédire .

Ensuite, une personne choisit (σ i = 0 / σ i = 1 / σ i = -1), et pour choisir, elle doit connaître σ j pour tout le monde. Faites attention à la parenthèse, la parenthèse [∑ j ≠ i a ji σ j ], c'est-à-dire, ce qu'une personne ne sait pas. Il doit le prévoir en équilibre, mais en équilibre il ne perçoit pas σ j comme des nombres, il les perçoit comme des probabilités.

C'est l'essence de la différence entre l'équilibre de la réponse discrète et l'équilibre de Nash. Une personne doit prédire la probabilité, donc un système d'équations basé sur la probabilité. Supposons que nous imaginions un système d'équations pour 100 millions de personnes, nous multiplions par un autre 2. parce qu'il y a une probabilité de choisir «+», la probabilité de choisir «-» (la probabilité de rester à l'écart ne tient pas compte, car il s'agit d'un paramètre dépendant). En conséquence, 200 millions de variables. Et 200 millions d'équations. Résoudre ce problème est irréaliste. Et il est également impossible de collecter exactement ces informations.

Mais les sociologues nous disent: "Attendez, mes amis, nous vous dirons comment caractériser une société." Ils demandent combien de types nous pouvons résoudre. Je dis, nous allons toujours résoudre 50 équations, l'ordinateur peut résoudre un système où 50 équations, même 100 ne sont rien. Ils disent que ce n'est pas un problème. Et puis ils ont disparu, salauds.

Nous avons vraiment eu une réunion avec des psychologues et des sociologues de HSE, ils ont dit que nous pouvons écrire un projet révolutionnaire révolutionnaire, notre modèle, leurs données. Et n'est pas venu.

Si vous voulez me demander pourquoi cela se passe par le cul, je vous le dis car les psychologues et les sociologues ne viennent pas à nos réunions. Ils se rejoindraient, les montagnes tourneraient.



En conséquence, une personne doit choisir parmi trois stratégies possibles, mais ne peut pas, car elle ne connaît pas σj. Ensuite, nous modifions σ j pour la probabilité.

Gains en équilibre de réponse discret




À l'inconnue σ j, nous substituons la différence de probabilités qu'une personne occupe l'une ou l'autre des parties au conflit. Quand nous savons à quel vecteur ε à quel point dans l'espace tridimensionnel nous tombons. Des «nuages» apparaissent à ces points (victoires), et nous pouvons les intégrer et trouver le poids de chacun des 3 «nuages».

En conséquence, nous trouvons les probabilités de la part d'un observateur externe qu'une personne particulière choisisse l'une ou l'autre avant de découvrir sa véritable position. Autrement dit, ce sera une formule qui, en réponse à la connaissance de tous les autres p, donnera la sienne. Et une telle formule peut être écrite pour chaque i et laisser de côté un système d'équations qui sera familier à ceux qui ont travaillé sur les modèles Ising et Pots. La statphysique suppose fermement que a ij = a ji , l'interaction ne peut pas être asymétrique.



Mais il y a des "miracles". Les «miracles» mathématiques sont que les formules coïncident presque avec les formules des modèles physiques statiques correspondants, malgré le fait qu'il n'y a pas d'interaction avec le jeu, mais qu'il existe une fonctionnalité optimisée dans une variété de domaines.

Avec des données d'entrée arbitraires, le modèle se comporte comme si quelqu'un y optimisait quelque chose. De tels modèles sont appelés «jeux potentiels», dans le cas de l'équilibre de Nash. Quand un jeu est conçu pour que les équilibres de Nash soient déterminés en optimisant une sorte de fonctionnalité dans l'espace de tous les choix. La potentialité à l'équilibre d'une réponse discrète n'est pas encore finalisée. (Bien que Fedor Sandomierz puisse être en mesure de répondre à cette question. Ce serait certainement une percée).

Voici le système complet d'équations:



Les probabilités avec lesquelles vous choisissez l'une ou l'autre sont cohérentes avec les prévisions pour vous. L'idée est la même que dans l'équilibre de Nash, mais elle se réalise par des probabilités.

Une distribution spéciale de ε, à savoir la distribution de Humbel, qui est un point fixe pour prendre le maximum d'un grand nombre de variables aléatoires indépendantes.



Une distribution normale est obtenue en faisant la moyenne d'un grand nombre de variables aléatoires indépendantes avec variance dans les valeurs admissibles. Et si vous prenez le maximum d'un grand nombre de variables aléatoires indépendantes, vous obtenez une telle distribution spéciale.
Soit dit en passant, l'équation omet le paramètre de hasard λ des décisions prises, j'ai oublié de l'écrire.

Comprendre comment résoudre cette équation vous aidera à comprendre comment regrouper une société. Dans l'aspect théorique, la potentialité des jeux en termes d'équation de réponse discrète.

Il faut essayer un vrai graphe social, qui diffère par un ensemble de propriétés:
  • petit diamètre;
  • loi de puissance de la distribution des degrés de sommets;
  • clustering élevé.

Autrement dit, les propriétés d'un véritable réseau social peuvent être réécrites à l'intérieur de ce modèle. Jusqu'à présent, personne n'a essayé, peut-être que quelque chose va s'arranger.



Je peux maintenant essayer de répondre à vos questions. Au moins, je peux certainement les écouter.

Comment cela explique-t-il le mécanisme du Brexit et les élections américaines?

Il en est ainsi. Cela n'explique rien. Mais cela donne une idée pourquoi les sondages sociologiques se trompent constamment dans leurs prévisions. Parce que les gens répondent publiquement à ce que leur environnement social exige, et en privé, ils donnent leur vote pour une conviction intérieure. Et si nous pouvons résoudre cette équation, la solution sera ce que l'enquête sociologique nous a donné, et v i est ce qui sera sur le bulletin de vote.

Et ce modèle peut être considéré comme un facteur distinct non pas une personne, mais une strate sociale?

C'est exactement ce que j'aimerais faire. Mais nous ne connaissons pas la structure des couches sociales. C'est pourquoi nous essayons de suivre les sociologues et les psychologues.

Votre modèle peut-il être utilisé d'une manière ou d'une autre pour expliquer le mécanisme des différents types de crises sociales observées en Russie? Supposons la divergence entre les actions des institutions formelles?

Non, ce n'est pas ça. Il s'agit du conflit de personnes. Je ne pense pas que la crise des institutions ici puisse s’expliquer. A ce sujet, j'ai ma propre idée que les institutions créées par l'humanité sont trop complexes, elles ne pourront pas tenir à un tel degré de complexité et seront obligées de se dégrader. C'est ma compréhension de la réalité.

Peut-on en quelque sorte enquêter sur le phénomène de polarisation de la société? Vous avez déjà cela en v, à quel point est-ce bon pour n'importe qui ...

Pas vraiment, nous avons un téléviseur là-bas, v + h. Il s'agit de statistiques comparatives.

Oui, mais la polarisation est progressive. Je veux dire que la participation d'une société avec une position prononcée est de 10% v-positif, 6% v-négatif, et l'écart se creuse de plus en plus entre ces valeurs.

Je ne sais pas quelle sera la dynamique en général. Dans la dynamique correcte, apparemment, v prendra les valeurs du σ précédent. Mais si un tel effet est obtenu, je ne sais pas. Il n'y a pas de panacée, il n'y a pas de modèle universel de société. Ce modèle est un look qui peut être utile. Je pense que si nous résolvons ce problème, nous verrons comment les sondages d'opinion s'écartent de manière stable de la réalité du vote. Il y a un énorme chaos dans la société. Même la mesure d'un paramètre spécifique donne des résultats différents.

Est-ce en quelque sorte lié à la théorie classique des jeux matriciels?

Ce sont des jeux matriciels. C'est juste que les matrices ici ont une taille de 200 millions par 200 millions. C'est un jeu de tout le monde avec tout le monde, la matrice est écrite en fonction.Ceci est lié aux jeux matriciels de cette façon: les jeux matriciels sont des jeux à deux, et ici ils jouent 200 millions. Par conséquent, c'est un tenseur qui a une dimension de 200 millions. Pas même une matrice, mais un cube avec une dimension de 200 millions. Mais ils considèrent un concept de solution inhabituel.

Existe-t-il un concept du prix d'un jeu?

Le prix du jeu n'est possible que dans le jeu antagoniste de deux joueurs, c'est-à-dire avec un montant nul. Ce n'est pas un jeu antagoniste d'un grand nombre de joueurs. Au lieu du prix du jeu, il y a des gains d'équilibre, non pas dans l'équilibre de Nash, mais dans l'équilibre de la réponse discrète.

Et le concept de "stratégie"?

Il existe des stratégies, 0, -1, 1. Elle est issue du concept classique de l'équilibre de Nash-Bayes, l'équilibre des jeux avec des informations incomplètes.Et dans un cas particulier, l'équilibre Bayes-Nash est mis sur les données d'un jeu régulier. De ce fait, une combinaison est obtenue, appelée l'équilibre de la réponse discrète. Et c'est infiniment loin des jeux matriciels du milieu du 20e siècle.

Quelque chose est douteux que vous puissiez faire quelque chose avec un million de joueurs ...

C'est aussi une question de regroupement d'une société, il est impossible de résoudre un jeu avec autant de joueurs, vous avez raison.

Littérature dans des domaines connexes en statistique et sociologie


  1. Dorogovtsev SN, Goltsev AV et Mendes JFF Phénomènes critiques dans les réseaux complexes // Reviews of Modern Physics. 2008. Vol. 80. Pp. 1275-1335.
  2. Lawrence E. Blume, Steven Durlauf Concepts d'équilibre pour les modèles d'interaction sociale // Revue internationale de théorie des jeux. 2003. Vol. 5, (3). Pp. 193-209.
  3. Gordon MB et. al., Discrete Choices under Social Influence: generic Perspectives // Mathematical Models and methods in Applied Science. 2009. Vol. 19. Pp. 1441—1381.
  4. Bouchaud J.-P. Crises and Collective Socio-Economic Phenomena: Simple Models and Challenges // Journal of Static Physics. 2013. Vol. 51(3). Pp. 567—606.
  5. Sornette D. Physics and financial economics (1776—2014): puzzles, lsing, and agent-based models // Reports on Progress in Physics. 2014. Vol. 77, (6). Pp. 1-287


Source: https://habr.com/ru/post/fr479442/


All Articles