Archives de Tag: théorie des jeux

Règles, théorie des jeux et ontologie sociale

La semaine prochaine, j’aurai le plaisir de présenter au séminaire "Philosophie-Economie-Droit" du GREQAM mon article "Against the Eliminativist View of Institutions in Economics: Rule-Following and Game Theory". Ce post n’a néanmoins pas pour objet de faire ma promo (enfin, de fait un peu quand même) mais d’évoquer un récent working paper de Francesco Guala et Frank Hindriks que l’on a porté à ma connaissance la semaine dernière. Il se trouve que le papier de Guala et Hindriks a à peu près le même objectif que le mien, à savoir caractériser le concept de règle dans un cadre de théorie des jeux. Il recoupe également partiellement mon propos, mais en diverge aussi à certains endroits.

Pour le recoupement, Guala et Hindriks caractérisent également les règles (plus exactement, les conventions) comme des équilibres corrélés, c’est à dire des équilibres de Nash où les joueurs ont à leur disposition des stratégies qui sont conditionnelles à un signal public émis par un "chorégraphe". Cette approche, qui a d’abord été proposée par Herbert Gintis, permet de saisir le fait qu’une règle consiste à coordonner les actions (et aussi les croyances) des agents sur un espace d’états du monde sans que pour autant ces derniers aient une connaissance parfaite de ce chacun sait ou fait. Les auteurs considèrent que cette conceptualisation permet de réunir les deux conceptions des règles en théorie des jeux (les règles comme formes de jeux et les règles comme équilibres) que j’évoque dans mon papier. Ce dernier point est discutable mais est largement secondaire.

Pour les divergences, les auteurs rejettent dans leur papier le concept de règles constitutives de Searle que je retiens pour ma part de manière essentiellement tacite. Ils proposent à la place une approche consistant à décomposer les règles constitutives au travers de l’articulation de "règles de statut" et de "règles de base". L’idée est que l’on peut alors toujours réduire une règle constitutive à un ensemble de règles régulatives. Sur un plan ontologique, les règles constitutives n’existent donc pas. Ce débat sur l’existence des règles constitutives (concept que l’on trouve chez Wittgenstein et Rawls) est assez ancien et je l’ai déjà évoqué à plusieurs reprises ici. Formellement, son objet n’est pas essentiel pour la question de la conceptualisation des règles en théorie des jeux. Plus intéressant peut-être est la question de la prise en compte de la normativité de la règle, que les auteurs discutent dans la dernière section de leur papier. Bien que ce soit un point que je n’aborde pas dans mon article, il est possible de la prendre en compte à partir de la "theorie des jeux psychologiques" où préférences et croyances sont rendues interdépendantes. Incidemment, comme je l’explique dans cet autre papier, cette approche est précisément un autre moyen de rendre compte du caractère constitutif de certaines règles.

Poster un commentaire

Classé dans Non classé

Economie, psychologie et "multiple selves" : un programme de Nash intra-personnel ?

En théorie des jeux, le Nash program renvoie à l’ensemble de la littérature de ces 40 dernières années visant à reformuler les solutions axiomatiques dans les jeux coopératifs (en particulier, dans le bargaining game) en termes de solutions dans le cadre de jeux non-coopératifs. La caractéristique des jeux coopératifs est qu’il est supposé que les joueurs peuvent former des coalitions au travers d’accords contraignants. Cette possibilité n’existe pas dans les jeux non-coopératifs. Plus exactement, l’ensemble de la négociation qui précède tacitement le jeu coopératif doit être explicitement modélisé dans un jeu non-coopératif en forme extensive. L’objectif est de s’assurer que la solution axiomatique du jeu coopératif peut être « implémentée » dans le cadre d’un jeu non-coopératif en tant qu’équilibre parfait en sous-jeux (ou équilibre séquentiel si l’information est incomplète/imparfaite). En particulier, cela suppose que les promesses ou les menaces des joueurs soient crédibles. Une bonne illustration de ce programme est fournie par le modèle de Rubinstein qui montre que, dans le cadre d’un jeu séquentiel à chaque joueur fait une offre à l’autre à tour de rôle, les joueurs implémenterons la solution de Nash sous certaines conditions concernant leurs préférences et la procédure de négociation.

Dans un jeu, les joueurs sont des agents. Ces derniers sont identifiés par le fait qu’ils peuvent choisir la stratégie à adopter (un agent est une unité de décision) et par leurs préférences, lesquelles sont représentées par une fonction d’utilité associant à chaque profil stratégique (un vecteur de stratégies jouées, une par joueur) un nombre réel. Un point essentiel est que cette approche présuppose que les joueurs sont rationnels dans un sens bien précis : leurs préférences sont cohérentes, c’est-à-dire notamment qu’elles satisfont l’axiome de transitivité. Cela est vrai pour les jeux statiques, mais aussi pour les jeux répétés où il est généralement supposé que les joueurs actualisent leurs gains futurs de manière exponentielle. Cette dernière hypothèse revient à supposer que les préférences temporelles des agents sont stables et cohérentes. Autrement dit, dans la cadre d’un jeu, on fait toujours l’hypothèse que les joueurs sont des entités bien identifiées et unifiées, dans le sens où on peut les modéliser comme des centres de décision indépendants les uns des autres et dont la structure est stable à travers le temps. Cela est vrai quelque soit l’identité des agents : individus, ménages, entreprises ou Etats.

L’économie comportementale contribue évidemment à remettre en cause la conception de l’individu comme un agent, dans le sens évoqué au-dessus. Les individus auraient ainsi tendance à révéler des préférences incohérentes, notamment dans le cadre de problèmes de décision intertemporelle. Dans ce dernier cas, les individus actualiseraient leurs gains futurs non pas de manière exponentielle, mais de manière hyperbolique, ce qui peut engendrer des inversions de préférences. L’identification des individus à des agents dotés de préférences stables et cohérentes dans le cadre d’un jeu peut donc s’avérer discutable. En parallèle, les économistes ont développé depuis plusieurs années maintenant des modèles « multiple selves » visant à rendre compte des biais comportementaux des individus (un exemple, un autre). L’idée basique est la suivante : les individus peuvent en fait s’appréhender comme une communauté d’agents interagissant d’une manière spécifique. L’interaction de ces agents produit alors, au niveau individuel, un comportement individuel observable et plus ou moins cohérent. Dans ces modèles, les agents sont des « selves », c’est-à-dire des personnalités qui peuvent être identifiées sur le plan diachronique (la personnalité d’aujourd’hui, celle de demain, etc.) ou sur le plan synchronique (la personnalité consumériste, la personnalité éthique, etc.). En tant qu’agents, ces personnalités sont dotés de préférences cohérentes et stables, et peuvent donc s’appréhender comme des centres de décision. Sur le plan philosophique, à la fois ontologique et éthique, l’ouvrage Reasons and Persons de Derek Parfit fournit un ensemble d’arguments pouvant permettre de justifier ce type de modélisation.

Il y a un aspect intéressant concernant cette stratégie de modélisation que je mettrai de côté ici, mais qui est significatif sur la nature de l’économie comme science distincte de la psychologie : même si ces modèles permettent de modéliser des mécanismes au moins partiellement psychologiques, ils sont surtout pour les économistes un moyen de réaffirmer la spécificité méthodologique et théorique de leur discipline : l’économie, c’est d’abord la science qui étudie les interactions entre des agents dans un cadre « institutionnel » donné. Loin de rapprocher l’économie et la psychologie, il me semble que ces modèles sont au contraire un moyen de réaffirmer l’autonomie de l’économie (et même sa domination). L’autre aspect qui m’intéresse plus dans ce billet est que l’on peut voir ces modèles comme les prémices d’une sorte de Nash program au niveau intra-individuel. Finalement, en supposant que l’individu est un agent, la théorie des jeux non-coopératifs présuppose que les différents selves d’un individu se sont d’ores et déjà entendus pour se coordonner et coopérer. Un jeu non-coopératif modélise ainsi les interactions entre des communautés de selves en faisant l’hypothèse que chaque communauté poursuit un objectif stable et identifié et agit de manière cohérente. Mais, de la même manière que le Nash program a consisté à ouvrir la boîte noire des coalitions d’individus et de leur formation, on peut imaginer à terme un programme en théorie des jeux visant à ouvrir la boîte noire qu’est l’individu et à insérer les interactions entre selves d’un même individu dans les interactions plus larges entre individus.

Cela peut paraître être tiré par les cheveux mais à la réflexion ça ne l’est pas tant que ça. D’une part, c’est le prolongement logique des modèles multiple selves à partir du moment où l’on prend ces derniers au sérieux. Comme je l’ai dit plus haut, il y a des arguments métaphysiques et éthiques qui soutiennent l’idée qu’il n’est pas aberrant de considérer que l’individu est réellement une telle communauté de personnalités. D’autre part, certaines approches récentes en théorie des jeux poursuivent déjà implicitement ce programme. Considérons l’approche en termes de team reasoning développée Michael Bacharach, Robert Sugden et d’autres. Dans le cadre de cette approche, les individus sont des agents qui ont la possibilité d’agir soit sur la base de leurs préférences individuelles, soit sur la base de préférences associées à un collectif. Dans cette optique, on peut alors plutôt considérer que les individus sont plutôt composés de deux agents distincts (l’un avec les préférences individuelles, l’autre avec les préférences collectives). Qu’est ce qui va déterminer que l’individu agit sur la base d’un ordre de préférences plutôt qu’un autre ? Probablement, les interactions entre les selves d’un même individu mais aussi, pourquoi pas, entre les selves des différents individus. On peut ainsi considérer que les selves sont autant de dispositions comportementales qui sont activées en fonction du contexte interpersonnel et institutionnel. Ce qui en jeu ici c’est la question de la formation de l’individualité et de la personnalité des individus au travers de leurs interactions sociales. Tel pourrait être l’objet de ce futur Nash program intra-personnel.

6 Commentaires

Classé dans Non classé

Nouveau working paper : "Against the Eliminativist View of Institutions in Economics: Rule-Following and Game Theory"

Je viens d’achever un nouveau working paper intitulé "Against the Eliminativist View of Institutions in Economics: Rule-Following and Game Theory". Il reprend de manière détaillée des idées développées dans quelques récents billets (voir ici et notamment). L’article sera présenté en juin au séminaire Philosophie-Economie-Droit du GREQAM, ainsi qu’au colloque "Philosophie économique" qui aura lieu à Strasbourg en octobre prochain. Comme d’habitude, tous les commentaires sont les bienvenus.

Poster un commentaire

Classé dans Non classé

L’équilibre de Nash dans la pensée économique : un retour à von Neumann ?

Dans le précédent billet, j’ai expliqué pourquoi l’utilisation du concept d’équilibre de Nash s’imposait presque naturellement dès lors que l’on prend en compte la dimension réflexive des phénomènes économiques et sociaux. En complément, je voudrais brièvement revenir ici sur la manière dont ce concept est progressivement devenu le pilier central de l’analyse économique moderne et sur le fait que ce statut tend à s’amenuiser aujourd’hui. Lire la suite

Poster un commentaire

Classé dans Non classé

Réflexivité et équilibre de Nash

En 1928, l’économiste autrichien Oskar Morgenstern, s’intéressant aux capacités prédictives de la science économique dans un contexte où les agents peuvent modifier leur comportement en fonction des prédictions réalisées, discute un problème de décision ayant Sherlock Holmes et Moriarty comme protagonistes : poursuivi par Moriarty, Holmes monte dans un train en direction de Douvres. Il sait que Moriarty l’a vu et anticipe que ce dernier va l’attendre à la gare de Douvres. Holmes envisage alors la possibilité de descendre avant l’arrivée à Douvres, à la gare de Canterbury. Cependant, Holmes sait que Moriarty est quelqu’un d’intelligent, et par conséquent envisage sérieusement la possibilité que ce dernier ait anticipé son raisonnement. Holmes envisage alors finalement d’aller jusque Douvres, mais considère à nouveau sérieusement la possibilité que Moriarty raisonne de la même manière.

Ce problème ne semble pas avoir de solution, ce qui amena Morgenstern à conclure avec pessimisme sur les capacités prédictives de la science économique : dès lors que les agents sont dotés d’une capacité de réflexivité, autrement dit d’anticiper les effets de leurs décisions sur le comportement des autres et plus largement sur le système auquel ils appartiennent, alors il semble qu’une forme d’indécidabilité soit inévitable. La réflexion de Morgenstern n’est pas isolée. Quelques années plus tard, Keynes semble proposer une réflexion similaire au travers de son concours de beauté : le choix optimal de chaque participant dépend non pas de son évaluation de la beauté « objective » des visages, mais de sa croyance sur les évaluations des autres participants. Mais comme il en va de même pour chacun des autres participants, le choix optimal dépend de la croyance concernant la croyance des autres sur les évaluations de chacun, etc. Ici encore, le problème de décision est marquée par une dimension réflexive : les conséquences des décisions de chaque agent dépendent des décisions des autres agents, et chaque agent sait cela de telle sorte qu’il est capable d’anticiper mentalement le jeu des interdépendances croisées entre les décisions de chacun. Le problème que la réflexivité est supposée présenter pour la science économique est l’objet principal de la contribution de George Soros dans un numéro spécial du Journal of Economic Methodology, dont tous les articles sont librement accessibles. Lire la suite

2 Commentaires

Classé dans Non classé

Changement climatique et préférences sociales

« De plus, les générations présentes ne supporteront qu’une toute petite partie des dommages climatiques qu’elles généreront à travers leurs émissions, l’essentiel étant porté par les générations futures. Et, comme on le voit dans les dossiers des retraites, de la dette publique ou de l’emploi des jeunes par exemple, la génération au pouvoir aujourd’hui se moque bien du devenir de celles qui les suivront !  L’attentisme des gouvernements nationaux n’est donc que le reflet du manque d’altruisme de leurs électeurs. »

 Il s’agit d’un extrait de l’interview de Christian Gollier (économiste à la TSE) dans Atlantico, au sujet du réchauffement climatique. Dans le paragraphe cité, Gollier émet donc l’idée que la non-action des gouvernements est le reflet des préférences égoïstes des électeurs, et plus particulièrement d’une absence d’altruisme intergénérationnel. Est-ce nécessairement le cas ? Lire la suite

4 Commentaires

Classé dans Non classé

Qu’est ce que suivre une règle (en théorie des jeux) ?

J’ai déjà écrit ici un certain nombre de billets sur la notion de règles et sur la manière dont cette dernière peut être appréhendée dans un cadre de théorie des jeux. La lecture d’un récent papier de Giacomo Sillari m’amène à revenir sur le sujet. Comme je l’ai expliqué récemment, les économistes, en particulier lorsqu’ils utilisent la théorie des jeux, ont tendance à développer une approche « éliminativiste » des institutions et plus généralement des règles. L’idée est simple : la règle est assimilée à une simple régularité comportementale auto-renforçante, autrement dit à un équilibre dans un jeu. Le point notable est que la règle n’existe qu’au travers du regard du théoricien mais pas des agents eux-mêmes. Lire la suite

1 commentaire

Classé dans Non classé

Searle vs l’analyse économique, le retour

Les économistes J.P. Smit, Filip Buekens et Stan du Plessis viennent de publier dans la revue de philosophie Synthese un article intitulé "Developing the incentivized action view of institutional reality" (article dispo sur demande). Cet article prolonge la réflexion concernant la nature des faits institutionnels que les auteurs avaient amorcé  dans un article dans Economics and Philosophy dont j’avais parlé ici. Le point de départ de Smit et al. est la théorie des faits institutionnels de Searle dont ils critiquent la dimension "non-réductible" qu’elle conférerait aux institutions dans l’explication. Ils proposent comme alternative une approche en termes d’incitation qui est en fait ni plus ni moins qu’une explication des institutions via la théorie des jeux. Lire la suite

1 commentaire

Classé dans Non classé

Anticipations rationnelles et rationalité stratégique

Le site Bruegel synthétise le récent débat sur l’hypothèse d’anticipations rationnelles qui s’est développé dans la blogosphère économique anglo-saxonne. Un point me semble manquer dans toute cette discussion, par ailleurs très intéressante, et je vais brièvement le rappeler ici (j’en avais déjà parlé sur ce blog). Lire la suite

2 Commentaires

Classé dans Non classé

"Shutdown", théorie de la négociation et information incomplète

Alors que le « Shutdown » n’en finit plus, les Etats-Unis approchent lentement et sûrement du plafond de la dette, synonyme de défaut de paiement pour l’Etat américain. D’un strict point de vue de théorie économique, cette incapacité des démocrates et des républicains à se mettre d’accord en dépit des conséquences potentiellement désastreuses de ce conflit est plutôt surprenant. Que nous dit en effet la branche dite de la théorie de la négociation (bargaining theory) en économie ? Lire la suite

1 commentaire

Classé dans Non classé

Binmore et l’évolution des normes d’équité

Voici une vidéo d’une récente intervention de Ken Binmore relative à ses travaux sur l’évolution des normes d’équité. Voir ici et pour quelques éléments de discussion.

1 commentaire

Classé dans Non classé

"Darwin’s Conjecture"

Geoffrey Hodgson et Thorbjorn Knudsen, auteurs du livre Darwin’s Conjecture: The Search for General Principles of Social and Economic Evolution, ont ouvert un groupe de lecture sur cet ouvrage. Les personnes intéressées peuvent intervenir sur le site pour poser des questions ou développer des commentaires. Comme le sous-titre l’indique, l’objectif de l’ouvrage est d’identifier un ensemble de principes, ou plus exactement de mécanismes, régissant les processus d’évolution au niveau socioéconomique. Hodgson et Knudsen défendent ce qu’ils appellent le darwinisme généralisé (ou universel). Il s’agit d’une conception ontologique selon laquelle les principes darwiniens de la réplication, de la variation et de la sélection seraient communs à l’ensemble des processus d’évolution, que ces derniers portent sur l’évolution génétique, biologique culturelle ou socioéconomique.  Hodgson défend depuis un certain temps l’idée que l’on trouve l’idée du darwinisme généralisé dès les écrits de Thorstein Veblen. J’ai eu l’occasion d’écrire une ou deux choses sur le sujet il y a quelques temps.

A titre personnel, je reste plutôt convaincu par cette idée de darwinisme généralisé. Je pense qu’effectivement, sur un plan ontologique, il y a des mécanismes très généraux régissant l’ensemble des processus d’évolution. Il faut toutefois être attentif aux implications que l’on croit pouvoir tirer de cette thèse métaphysique. Il y a une tendance croissante dans les sciences sociales depuis environ 25 ans à substituer l’évolution (au sens large) à la rationalité,  en partie en raison des impasses logiques et empiriques auxquelles fait face un principe de rationalité trop fort (merci la théorie des jeux !). Le danger bien réel est de passer du tout au rien : de l’agent rationnel et épistémiquement sophistiqué (capable de former des croyances sur des croyances sur des croyances etc.), on est parfois passé à la modélisation d’automates de faible complexité et soumis à une dynamique mimant plus ou moins explicitement la sélection naturelle (cf. la très large utilisation de l’équation de dynamique de réplication dans les modèles évolutionnaires en sciences sociales). Le problème, c’est que cette modélisation s’est souvent faite en faisant fi de toute considération empirique sur la spécificité des mécanismes de transmission au niveau culturel et socioéconomique.

Les travaux (qui n’en restent pas moins intéressants) de Brian Skyrms ou de Peyton Young illustrent à la fois les intérêts et les limites de ce type d’approche : formellement, on obtient des résultats très intéressants, mais on peut fortement douter de leur pertinence pour expliquer la plupart des phénomènes socioéconomiques d’intérêt (comme l’existence de normes d’équité). Robert Sugden a développé ce qui reste à mon sens la critique la plus aboutie sur ce plan. Quoiqu’il en soit, cet ouvrage de Karl Sigmund propose un bon panorama des modèles de jeux évolutionnaires appliqués à l’étude des phénomènes socioéconomiques. De manière plus générale, cela fait un certain que l’évolution sociale est étudiée à l’aune des outils et modèles développés par les biologistes (cet ouvrage est une très bonne introduction à la question), l’approche la plus intéressante étant de mon point de vue celle visant à modéliser la coévolution ente gènes et culture. L’interaction entre l’évolution génétique et l’évolution culturelle est souvent la grande oubliée des modèles de jeux évolutionnaires développés par les économistes.

Enfin, il reste ce qui pour moi est l’un des grands challenges pour les sciences sociales dans les 10 ou 20 prochaines années : intégrer les approches en termes d’évolution et celles en termes de rationalité. Plus spécifiquement, imaginez des agents capables de se coordonner sur la base d’un ensemble  de croyances communes itératives sur les intentions et la rationalité de chacun. Comment ce système de croyances a-t-il pu voir le jour ? Comment l’aptitude cognitive à former de telles croyances a-t-elle pu évoluer ? La formation d’un tel système est-elle nécessaire en théorie ou en pratique pour permettre la coordination ? C’est le genre de questions qui devraient intéresser pas mal de chercheurs dans l’avenir.  

1 commentaire

Classé dans Non classé

Gauthier, Parfit, et la rationalité des dispositions à agir

Dans son difficile mais important livre On What Matters, le philosophe Derek Parfit revient brièvement sur un débat entre lui et David Gauthier relatif à la question de la rationalité des engagements non-crédibles. Dans son ouvrage Morals by Agreement ainsi que dans une série d’articles, Gauthier défend en effet la thèse que s’il est rationnel pour un agent d’acquérir une certaine disposition D en termes de comportement, que selon D l’agent doive entreprendre une action A dans une situation S, mais qu’il existe une action alternative A’ qui est objectivement et de manière transparente meilleure pour l’agent, il est malgré tout rationnel pour ce dernier de suivre A. Sans suivre spécifiquement la critique que développe Parfit contre cette idée, je vais revenir brièvement sur les difficultés soulevées par la thèse de Gauthier. Lire la suite

Poster un commentaire

Classé dans Non classé

De l’impossibilité épistémique du poisson d’avril II

Soit deux individus, Daryl et Merle (c’était le dernier épisode de la saison 3 de The Walking Dead hier soir) interagissant un 1er avril. Merle est facétieux et aime bien faire des blagues à Daryl, en particulier un 1er avril. Daryl quant à lui, n’aime pas se faire avoir. Merle peut annoncer à Daryl soit une vraie nouvelle T, soit une fausse nouvelle F, soit ne rien annoncer N ; Daryl peut soit le croire (B), soit ne pas le croire (U). Il y a donc 6 résultats possibles et les préférences de Merle et Daryl sont respectivement les suivantes :

Merle : FB > TU = TB = NB = NU > FU

Daryl : FU = TB > NB = NU = TU > FB

On suppose que tout cela est connaissance commune parmi les deux joueurs. On suppose par ailleurs que les deux joueurs sont rationnels au sens bayésien. Il n’est pas très difficile de voir que dans cette configuration Merle ne prendra jamais l’initiative d’annoncer une nouvelle à Daryl, étant donnée la suspicion de ce dernier. On peut formaliser les choses de la manière suivante : soit E l’évènement « on est le 1er avril » et où E renvoi à un seul et unique état du monde w où, étant donnée la suspicion de Daryl, Merle n’annonce aucune nouvelle. Si l’on considère que E est connaissance commune, il en va de même pour la matrice et donc pour le résultat auquel elle conduit. Si l’on note par P l’évènement « Merle annonce le 1er avril une nouvelle fausse à Daryl qui le croit », alors il est trivial que E ne peut impliquer P. C’est ce que l’on peut appeler l’impossibilité épistémique du poisson d’avril.

Le résultat précédent est une pure tautologie : si on postule que les joueurs ont connaissance commune de l’évènement « 1er avril » et que celui-ci implique (logiquement) qu’aucune nouvelle surprenante (c’est-à-dire fausse mais perçue comme vraie) ne peut être annoncée, alors il est évident qu’il est connaissance commune qu’aucune nouvelle ne sera annoncée. L’hypothèse clé est que l’ensemble des états du monde Ω ne comporte qu’une seule et unique entité w, et que donc par définition Merle et Daryl lui assignent une probabilité de 1. Maintenant, supposons malgré tout que Merle annonce une nouvelle f à Daryl et notons Ef l’évènement « nous sommes le 1er avril et Merle annonce f ». Du point de vue de Daryl, il en découle que le modèle épistémique du paragraphe précédent est nécessairement faux. L’évènement Ef correspond nécessairement à un état du monde w’ autre que w. L’état du monde w’ peut renvoyer à plusieurs possibilités : Merle n’a pas les préférences indiquées ci-dessus, Merle n’est pas rationnel, Merle pense que Daryl n’est pas rationnel, Merle pense que Daryl pense que Merle n’est pas rationnel, etc. Il faut donc modifier la spécification de l’ensemble Ω des états du monde possibles en intégrant ces différentes possibilités. Pour faire simple, supposons que le seul autre état w’ est un état où Merle est irrationnel dans le sens où il agit aléatoirement selon une stratégie mixte conférant une probabilité de 1/3 à chacune de ses stratégies.

Par conséquent, si Daryl observe Ef, il sait que nous sommes en w’ et puisque Merle a annoncé une nouvelle, il en résulte qu’il y a une probabilité de ½ que celle-ci soit fausse. Si les préférences de Daryl sont celles spécifiées plus haut, il est optimal pour lui de penser que celle-ci est fausse. De ce point de vue, il semblerait que Merle n’aurait rationnellement aucun intérêt à paraître irrationnel. Mais est-ce si sûr ? Admettons que dans un troisième état du monde w’’ possible, Daryl pense que Merle est sincère (dire la vérité est une stratégie dominante pour Merle). Maintenant, l’évènement Ef devient difficile à interpréter pour Daryl car il peut signifier soit que Merle est irrationnel (auquel cas, il ne doit pas le croire), soit que Merle est sincère (auquel cas, Merle dit forcément la vérité et Daryl doit le croire). La réaction de Daryl à l’annonce de la nouvelle f (croire ou ne pas croire) dépendra de sa croyance antérieure p(w’’) concernant la probabilité que Merle soit sincère. On arrive alors au d’un résultat démontré par Robert Aumann sur la base de ce qu’il appelle la doctrine d’Harsanyi : si Merle et Daryl ont les mêmes croyances antérieures p concernant les différents états du monde et que leurs croyances postérieures sont connaissance commune, alors ils s’accorderont sur le résultat du jeu et la notion même de poisson d’avril n’a pas de sens. Par exemple, si p(w’’) est identique et très faible pour Merle et Daryl, alors tous deux savent que Daryl ne croira jamais une annonce f par Merle et que Merle ne fera donc jamais d’annonce. La surprise est impossible parce que leurs croyances antérieures sont les mêmes. Mais si leurs croyances antérieures sont différentes, les choses sont différentes : si par exemple Merle confère une probabilité élevée à p(w’’) mais pas Daryl, Merle fera l’annonce f et Daryl ne le croira pas ; le poisson d’avril échouera, comme cela arrive souvent en réalité. Si c’est Daryl qui assigne une probabilité élevée à l’état w’’ (mais pas Merle), on observe un résultat intéressant : Daryl s’attendra à ce que Merle lui annonce une (vraie) nouvelle mais Merle ne le fera pas.

La morale de l’histoire : si vous voulez expliquer les phénomènes de la vie réelle (les poissons d’avril, pourquoi des agents s’échangent des actifs sur les marchés financiers, etc.), il faut tenir compte de la possibilité que les croyances antérieures des agents divergent très souvent. Le fait qu’elles puissent parfois coïncider s’expliquent par l’existence de normes sociales. Mais dans le cas du poisson d’avril, il est intéressant de voir que la norme est auto-destructrice : en générant des croyances antérieures communes, elle rend impossible la surprise.

Sinon, sur le même thème, on peut lire ce billet de Jeff Ely.

1 commentaire

Classé dans Non classé

The Nuclear Game

Soit deux joueurs, que l’on appellera respectivement CN (en rouge) et EU (en bleu), jouant au jeu séquentiel suivant :

The Nuclear Game

On suppose les hypothèses épistémiques suivantes concernant la rationalité et les connaissances des joueurs :

* CN et EU sont rationnels dans le sens où ils maximisent leur utilité ; on note cela respectivement par RCN et REU ;

* CN croit que EU est rationnel et croit que EU croit qu’il est rationnel ; on note cela respectivement par BCN(REU) et BCN[BEU(RCN)] ;

* EU croit que CN est rationnel ; on note cela par BEU(RCN).

Appelons l’ensemble {RCN & REU & BCN(REU) & BCN[BEU(RCN)] & BEU(RCN)} la base épistémique E du jeu. Si E est connaissance commune entre les joueurs, il est évident que la seule solution, correspondant à l’équilibre parfait en sous-jeux, est pour CN de ne rien faire. On trouve ce résultat par le biais d’un raisonnement à rebours : au troisième noeud, CN aurait intérêt à attaquer. Sachant cela, au deuxième noeud, EU aurait intérêt à jouer la prévention. Sachant cela, au premier noeud, CN a intérêt à ne rien faire.

Imaginons malgré tout que le deuxième noeud est atteint. Il en découle alors que E ne peut être vrai. Supposons donc que E n’est pas connaissance commune mais que chaque joueur a seulement connaissance de ses propres croyances. Comment EU doit-il raisonner si le deuxième noeud est atteint ? Il y a deux possibilités :

* EU peut en déduire que CN n’est pas rationnel : ¬RCN

* EU peut en déduire que CN croit qu’il n’est pas rationnel : BCN(¬REU)

Ces deux déductions possibles remettent en cause E. Si EU pense que ¬RCN (et si l’on suppose que l’irrationalité consiste à toujours jouer la stratégie contraire à ses intérêts), alors il aura intérêt à ne pas réagir. S’il pense que BCN(¬REU), alors il a bien entendu à jouer la prévention. Le problème pour EU, c’est qu’en soit il ne peut absolument rien déduire du comportement de CN : il y a sous-détermination épistémique concernant la raison de la déviation de l’équilibre.

 Plaçons nous maintenant du côté de CN. Si CN est rationnel, il est capable de reproduire le raisonnement du paragraphe précédent. Si CN est versé dans la théorie de la décision, il doit connaître également le principe d’indifférence de Laplace : dans un contexte d’incertitude totale, il est « rationnel » d’assigner la même probabilité à tous les états du monde. Du point de vue de EU, cela veut dire assigner une probabilité de ½ à chaque scénario envisagé ci-dessus. Si CN décide de menacer, il y a donc une chance sur deux pour que EU ne réagisse pas. L’espérance de gain de CN est donc de 0. Si CN considère qu’il y a une possibilité infime e que EU « tremble » et renonce à prendre les mesures préventives qu’il devrait prendre une fois sur deux, alors il a intérêt à proférer des menaces.

1 commentaire

Classé dans Non classé