Gauthier, Parfit, et la rationalité des dispositions à agir

Dans son difficile mais important livre On What Matters, le philosophe Derek Parfit revient brièvement sur un débat entre lui et David Gauthier relatif à la question de la rationalité des engagements non-crédibles. Dans son ouvrage Morals by Agreement ainsi que dans une série d’articles, Gauthier défend en effet la thèse que s’il est rationnel pour un agent d’acquérir une certaine disposition D en termes de comportement, que selon D l’agent doive entreprendre une action A dans une situation S, mais qu’il existe une action alternative A’ qui est objectivement et de manière transparente meilleure pour l’agent, il est malgré tout rationnel pour ce dernier de suivre A. Sans suivre spécifiquement la critique que développe Parfit contre cette idée, je vais revenir brièvement sur les difficultés soulevées par la thèse de Gauthier. Lire la suite

Poster un commentaire

Classé dans Non classé

Mensonge et politique

Soit un homme politique i qui peut définir un certain niveau de mensonge mi de manière à maximiser son utilité ui(., mi) avec ui’ > 0. L’homme politique maximise son utilité pour un niveau de mensonge mi*. En n’étant pas sincère, l’homme politique i pénalise toutefois tous les autres hommes politiques j en affectant leur crédibilité auprès des électeurs. Formellement, l’utilité uj de ces derniers est négativement fonction du niveau de mensonge de i, soit uj(., mi) avec u’ < 0. Autrement dit, le mensonge de i est générateur d’externalités négatives sur le reste de la population des hommes politiques. En conséquence, le niveau de mensonge mi* est socialement sous-optimal.

 Comment les hommes politiques peuvent-ils remédier à cette défaillance du « marché politique » ? Une possibilité consiste à jouer une stratégie de « boycott politique » : tout homme politique dont le niveau de mensonge est supérieur au niveau socialement optimal mi est exclu de son parti politique et, pour faire simple, de l’ensemble de la vie politique. Est-ce une stratégie crédible ? Notons Vit la somme des flux des gains futurs actualisés découlant d’une carrière politique pour n’importe quel agent i (en incluant les gains issus d’un niveau de mensonge socialement optimal) et notons vit les gains d’une carrière non-politique. Pour simplifier, supposons vit = 0. De ce fait, si Vit > ui(mi*) + 0 avec mi* > mi, un homme politique n’a pas intérêt à mentir au-delà du niveau socialement optimal. Les autres hommes politiques ont par définition intérêt à pratiquer le boycott à partir du moment où cela permet de maintenir le mensonge de la classe politique à un niveau socialement optimal et où il n’est pas trop couteux d’exclure un de leurs collègues.

Une difficulté provient du problème d’information : le niveau de mensonge précis d’un homme politique n’est pas directement observable et est donc difficile à déterminer. Un homme politique peut choisir un niveau de mensonge supérieur au niveau socialement optimal mi mais inférieur à son niveau individuellement optimal mi* en prenant en compte la probabilité d’être découvert. De ce point de vue, le rôle des médias de type Mediapart ou Le canard enchaîné est socialement très utile car il permet de remédier (partiellement) au problème d’information. Plutôt que de les vilipender comme ils le font souvent, les hommes politiques feraient mieux de les louer : pour un mensonge révélé, combien ne voient jamais le jour du seul fait de la désincitation au mensonge créée par les médias ?

4 Commentaires

Classé dans Non classé

Et de cinq

5 ans

Il y a 5 ans, un certain blog dénommé "Rationalité Limitée" était créé par un doctorant anonyme. Cinq ans plus tard,  je ne suis plus anonyme, ni doctorant, la "ligne éditoriale" du blog a pas mal évolué et le rythme de publication n’est plus le même (je me demande bien comment j’ai pu faire pour publier plus d’un billet par jour pendant près d’un an et demi !). Mais le blog est toujours là, et c’est bien l’essentiel. J’en profite pour remercier les fidèles lecteurs qui, pour certains d’entre eux, lisent ce blog depuis le début et pour saluer le travail de tous les blogueurs (nouveaux et anciens) de la blogosphère francophone en économie et en sciences sociales.

Je profite aussi de cette occasion pour mettre en ligne un nouveau working paper, dont la rédaction est d’ailleurs largement responsable de la faible activité de ces dernières semaines. Il y est question de règles constitutives et de théorie des jeux (une ébauche de l’idée générale du papier peut être trouvée dans ce billet) :

"Constitutive Rules in Game Theory"

5 Commentaires

Classé dans Non classé

De l’impossibilité épistémique du poisson d’avril II

Soit deux individus, Daryl et Merle (c’était le dernier épisode de la saison 3 de The Walking Dead hier soir) interagissant un 1er avril. Merle est facétieux et aime bien faire des blagues à Daryl, en particulier un 1er avril. Daryl quant à lui, n’aime pas se faire avoir. Merle peut annoncer à Daryl soit une vraie nouvelle T, soit une fausse nouvelle F, soit ne rien annoncer N ; Daryl peut soit le croire (B), soit ne pas le croire (U). Il y a donc 6 résultats possibles et les préférences de Merle et Daryl sont respectivement les suivantes :

Merle : FB > TU = TB = NB = NU > FU

Daryl : FU = TB > NB = NU = TU > FB

On suppose que tout cela est connaissance commune parmi les deux joueurs. On suppose par ailleurs que les deux joueurs sont rationnels au sens bayésien. Il n’est pas très difficile de voir que dans cette configuration Merle ne prendra jamais l’initiative d’annoncer une nouvelle à Daryl, étant donnée la suspicion de ce dernier. On peut formaliser les choses de la manière suivante : soit E l’évènement « on est le 1er avril » et où E renvoi à un seul et unique état du monde w où, étant donnée la suspicion de Daryl, Merle n’annonce aucune nouvelle. Si l’on considère que E est connaissance commune, il en va de même pour la matrice et donc pour le résultat auquel elle conduit. Si l’on note par P l’évènement « Merle annonce le 1er avril une nouvelle fausse à Daryl qui le croit », alors il est trivial que E ne peut impliquer P. C’est ce que l’on peut appeler l’impossibilité épistémique du poisson d’avril.

Le résultat précédent est une pure tautologie : si on postule que les joueurs ont connaissance commune de l’évènement « 1er avril » et que celui-ci implique (logiquement) qu’aucune nouvelle surprenante (c’est-à-dire fausse mais perçue comme vraie) ne peut être annoncée, alors il est évident qu’il est connaissance commune qu’aucune nouvelle ne sera annoncée. L’hypothèse clé est que l’ensemble des états du monde Ω ne comporte qu’une seule et unique entité w, et que donc par définition Merle et Daryl lui assignent une probabilité de 1. Maintenant, supposons malgré tout que Merle annonce une nouvelle f à Daryl et notons Ef l’évènement « nous sommes le 1er avril et Merle annonce f ». Du point de vue de Daryl, il en découle que le modèle épistémique du paragraphe précédent est nécessairement faux. L’évènement Ef correspond nécessairement à un état du monde w’ autre que w. L’état du monde w’ peut renvoyer à plusieurs possibilités : Merle n’a pas les préférences indiquées ci-dessus, Merle n’est pas rationnel, Merle pense que Daryl n’est pas rationnel, Merle pense que Daryl pense que Merle n’est pas rationnel, etc. Il faut donc modifier la spécification de l’ensemble Ω des états du monde possibles en intégrant ces différentes possibilités. Pour faire simple, supposons que le seul autre état w’ est un état où Merle est irrationnel dans le sens où il agit aléatoirement selon une stratégie mixte conférant une probabilité de 1/3 à chacune de ses stratégies.

Par conséquent, si Daryl observe Ef, il sait que nous sommes en w’ et puisque Merle a annoncé une nouvelle, il en résulte qu’il y a une probabilité de ½ que celle-ci soit fausse. Si les préférences de Daryl sont celles spécifiées plus haut, il est optimal pour lui de penser que celle-ci est fausse. De ce point de vue, il semblerait que Merle n’aurait rationnellement aucun intérêt à paraître irrationnel. Mais est-ce si sûr ? Admettons que dans un troisième état du monde w’’ possible, Daryl pense que Merle est sincère (dire la vérité est une stratégie dominante pour Merle). Maintenant, l’évènement Ef devient difficile à interpréter pour Daryl car il peut signifier soit que Merle est irrationnel (auquel cas, il ne doit pas le croire), soit que Merle est sincère (auquel cas, Merle dit forcément la vérité et Daryl doit le croire). La réaction de Daryl à l’annonce de la nouvelle f (croire ou ne pas croire) dépendra de sa croyance antérieure p(w’’) concernant la probabilité que Merle soit sincère. On arrive alors au d’un résultat démontré par Robert Aumann sur la base de ce qu’il appelle la doctrine d’Harsanyi : si Merle et Daryl ont les mêmes croyances antérieures p concernant les différents états du monde et que leurs croyances postérieures sont connaissance commune, alors ils s’accorderont sur le résultat du jeu et la notion même de poisson d’avril n’a pas de sens. Par exemple, si p(w’’) est identique et très faible pour Merle et Daryl, alors tous deux savent que Daryl ne croira jamais une annonce f par Merle et que Merle ne fera donc jamais d’annonce. La surprise est impossible parce que leurs croyances antérieures sont les mêmes. Mais si leurs croyances antérieures sont différentes, les choses sont différentes : si par exemple Merle confère une probabilité élevée à p(w’’) mais pas Daryl, Merle fera l’annonce f et Daryl ne le croira pas ; le poisson d’avril échouera, comme cela arrive souvent en réalité. Si c’est Daryl qui assigne une probabilité élevée à l’état w’’ (mais pas Merle), on observe un résultat intéressant : Daryl s’attendra à ce que Merle lui annonce une (vraie) nouvelle mais Merle ne le fera pas.

La morale de l’histoire : si vous voulez expliquer les phénomènes de la vie réelle (les poissons d’avril, pourquoi des agents s’échangent des actifs sur les marchés financiers, etc.), il faut tenir compte de la possibilité que les croyances antérieures des agents divergent très souvent. Le fait qu’elles puissent parfois coïncider s’expliquent par l’existence de normes sociales. Mais dans le cas du poisson d’avril, il est intéressant de voir que la norme est auto-destructrice : en générant des croyances antérieures communes, elle rend impossible la surprise.

Sinon, sur le même thème, on peut lire ce billet de Jeff Ely.

Un commentaire

Classé dans Non classé

Le paternalisme est-il réellement inévitable ?

Dans leur article pionnier sur le « paternalisme libéral » (libertarian paternalism), Cass Sunstein et Richard Thaler défendent l’idée que le paternalisme est inévitable, que ce soit de la part d’organisations privées telles que les entreprises, ou de l’Etat. En conséquence, puisqu’on ne peut éviter toutes les formes de paternalisme, autant mettre en place celui qui préserve au mieux la liberté de choix et la souveraineté du consommateur, en l’occurrence le paternalisme libéral. Lire la suite

7 Commentaires

Classé dans Non classé

Economie comportementale et bien-être

Soit un produit S, dont la consommation par une partie N des membres d’une population P diminue le bien-être de l’ensemble des autres membres M de P. Autrement dit, la consommation de S par N génère des externalités négatives. Dans l’hypothèse où les coûts de transaction ne sont pas trop élevés, et si l’on suppose que N et M peuvent choisir collectivement de manière rationnelle et optimale (i.e. pas de problème d’action collective et d’agrégation des préférences), alors on peut imaginer une négociation entre N et M débouchant sur une transaction où M payent N pour que ces derniers réduisent leur consommation de S. Plus exactement, si l’utilité totale que N tirent de leur consommation de S dans une quantité q est UN(q) = u et que le désagrément lié à cette même consommation génère une perte d’utilité chez M de VM(q) = v, alors les membres de M proposeront un paiement x tel que VM(x) ≤ v aux membres de N pour que ces derniers cessent de consommer S. Si UN(x) ≥ u, ils accepteront. Le même raisonnement est applicable dans le cas où il s’agit non pas de supprimer la consommation de S, mais de la réduire d’un montant ∂q (dans ce cas, il faut que la diminution de la consommation ∂q satisfasse les inégalités suivantes : VM(x) ≤ VM(∂q) = v’ et UN(x) ≥ UN(∂q) = u’).

Supposons maintenant que M et N sont les mêmes personnes mais à deux moments différents dans le temps. Pour clarifier, on notera Nt et Nt+1 les deux mêmes populations se succédant dans le temps. Au temps t, les membres de N ne souhaitent pas consommer S. Au temps t+1, les membres de N souhaitent consommer S. Mais comme Nt et Nt+1 sont les mêmes personnes, la consommation de S par Nt+1 a un impact (négatif) sur Nt. On a donc un nouveau problème d’externalité négative. Peut-on imaginer le même mécanisme de négociation et de marchandage que ci-dessus pour régler le problème ? La réponse est non car l’éventuel « contrat » qui pourrait être conclu ne pourrait être mis en application : quand bien même Nt et Nt+1 pourraient contracter en  t pour réduire la consommation de S en t+1, Nt+1  n’auraient  aucun intérêt à respecter l’accord. Il en va de même pour les vendeurs du produit S. La solution « coasienne » n’étant pas disponible, la taxation voire l’interdiction pure et simple de S semble être la seule solution pour remédier au problème de l’externalité.

Comme le laisse entendre Jeff Ely, taxer les sodas, ou interdire leur vente dans un volume supérieur à une certaine limite comme a voulu le faire le maire de New York, pourrait se justifier par ce raisonnement. Sauf qu’en réalité les circonstances sont un peu différentes. Est-on sûr que les personnes qui consomment les sodas et que celles qui demandent la régulation de leur consommation sont les mêmes personnes ? Dans le cas d’espèce, on peut fortement en douter. Supposons que ce ne soit pas le cas. Nous nous retrouvons alors dans la configuration du premier paragraphe, avec deux populations N et M bien distinctes. Il y a toutefois une différence notable : il est très difficile de considérer que la consommation de S par N génère des externalités négatives sur M. Autrement dit, puisqu’il n’y a pas d’externalité, la situation actuelle (caractérisée par un certain niveau q de consommation par N) est d’ores et déjà optimale au sens de Pareto. L’intervention du législateur ou du politique ne peut alors se justifier que de deux manières :

* on parvient à démontrer que les conséquences de la consommation de S par N a des effets sur la santé de N (obésité, diabète, etc.) et que ces effets entraînent à leur tour un coût économique pour les membres de M. C’est possible, en particulier dans un système où la santé serait socialisée. Mais ce n’est pas certain : la consommation de certains produits peut réduire l’espérance de vie de telle sorte que in fine des économies seront faites par une diminution des dépenses pour traiter des maladies liées à la vieillesse ;

* on invoque un critère éthique ou normatif particulier autre que le critère de Pareto pour justifier malgré tout la régulation de la consommation de S. C’est une possibilité, mais il faut alors expliciter ce critère et le justifier. L’argument se déplace alors du terrain de l’analyse économique vers celui de la philosophie morale. C’est le problème du versant normatif de l’économie comportementale : il existe peu ou proue de tentatives de justification d’un tel critère alternatif. Le plus souvent, celui-ci reste implicite et mal identifié.

5 Commentaires

Classé dans Non classé

The Nuclear Game

Soit deux joueurs, que l’on appellera respectivement CN (en rouge) et EU (en bleu), jouant au jeu séquentiel suivant :

The Nuclear Game

On suppose les hypothèses épistémiques suivantes concernant la rationalité et les connaissances des joueurs :

* CN et EU sont rationnels dans le sens où ils maximisent leur utilité ; on note cela respectivement par RCN et REU ;

* CN croit que EU est rationnel et croit que EU croit qu’il est rationnel ; on note cela respectivement par BCN(REU) et BCN[BEU(RCN)] ;

* EU croit que CN est rationnel ; on note cela par BEU(RCN).

Appelons l’ensemble {RCN & REU & BCN(REU) & BCN[BEU(RCN)] & BEU(RCN)} la base épistémique E du jeu. Si E est connaissance commune entre les joueurs, il est évident que la seule solution, correspondant à l’équilibre parfait en sous-jeux, est pour CN de ne rien faire. On trouve ce résultat par le biais d’un raisonnement à rebours : au troisième noeud, CN aurait intérêt à attaquer. Sachant cela, au deuxième noeud, EU aurait intérêt à jouer la prévention. Sachant cela, au premier noeud, CN a intérêt à ne rien faire.

Imaginons malgré tout que le deuxième noeud est atteint. Il en découle alors que E ne peut être vrai. Supposons donc que E n’est pas connaissance commune mais que chaque joueur a seulement connaissance de ses propres croyances. Comment EU doit-il raisonner si le deuxième noeud est atteint ? Il y a deux possibilités :

* EU peut en déduire que CN n’est pas rationnel : ¬RCN

* EU peut en déduire que CN croit qu’il n’est pas rationnel : BCN(¬REU)

Ces deux déductions possibles remettent en cause E. Si EU pense que ¬RCN (et si l’on suppose que l’irrationalité consiste à toujours jouer la stratégie contraire à ses intérêts), alors il aura intérêt à ne pas réagir. S’il pense que BCN(¬REU), alors il a bien entendu à jouer la prévention. Le problème pour EU, c’est qu’en soit il ne peut absolument rien déduire du comportement de CN : il y a sous-détermination épistémique concernant la raison de la déviation de l’équilibre.

 Plaçons nous maintenant du côté de CN. Si CN est rationnel, il est capable de reproduire le raisonnement du paragraphe précédent. Si CN est versé dans la théorie de la décision, il doit connaître également le principe d’indifférence de Laplace : dans un contexte d’incertitude totale, il est « rationnel » d’assigner la même probabilité à tous les états du monde. Du point de vue de EU, cela veut dire assigner une probabilité de ½ à chaque scénario envisagé ci-dessus. Si CN décide de menacer, il y a donc une chance sur deux pour que EU ne réagisse pas. L’espérance de gain de CN est donc de 0. Si CN considère qu’il y a une possibilité infime e que EU « tremble » et renonce à prendre les mesures préventives qu’il devrait prendre une fois sur deux, alors il a intérêt à proférer des menaces.

Un commentaire

Classé dans Non classé