“But who will guard the guardians ?” (2/2)

Suite du billet précédent. Peut-on imaginer un équilibre institutionnel spontané où les agents n’ont pas intérêt à adopter des stratégies illégales et sans dispositif de “boucle de contrôle” ?

Prenons un cas très générique et abstrait : soit deux populations X et Y, respectivement composées de n et m individus, avec n>m. Le fait que la population X soit plus nombreuse que la population Y lui confère la possibilité d’asservir l’autre, car en possession de la force physique. Ces deux populations existent au sein d’un Etat, ce dernier n’exerçant que des fonctions régaliennes (armée, police, justice). X et Y ont la possibilité de participer au financement d’un bien public (peu importe lequel) mais ne sont pas contraintes par l’Etat. Légalement, elles ont donc deux stratégies possibles : financer (F), ou ne pas financer (PF). On fait l’hypothèse que X est suffisament nombreuses pour financer le bien public toute seule, mais cela lui revient alors plus cher que si Y l’aidait et, comme c’est un bien public, une fois produit celui-ci bénéficie à tout le monde. On a alors les paramètres suivants :

B = utilité totale procurée par la production du bien public à la population

P = utilité totale procurée par la non-production du bien public

w = coût de financement du bien public supporté par chaque individu de la population, avec B-mw>B-nw>P

La matrice est la suivante :  

      Y  
    F   PF
  F B-n.w ; B-m.w   B-n.w-m.w ; B
X        
  PF P ; P-m.w   P ; P

Les gains pour les résultats (F ; F) et (PF ; PF) sont évidents. Les gains issus de (F ; PF) s’expliquent par le fait que X supporte l’ensemble du coût de production du bien public, tandis que Y en bénéficie gratuitement. Les gains issus de (PF ; F) s’expliquent par le fait que le bien n’est pas produit et que par conséquent Y le finance ”dans le vide”. La population Y a une stratégie dominante : ne pas financer le bien public. En revanche, dans l’hypothèse où le bénéfice tiré du bien par la population X est suffisant (B est élevé et/ou le coût supporté est faible), alors la population X a pour stratégie dominante de financer le bien. Un équilibre de Nash plausible est donc (F ; PF). Très bien. Mais, en suivant Hurwicz, il faut se demander si l’un des joueurs n’a pas une autre stratégie à sa disposition, même illégale. Notamment, on sait que X est plus nombreux que Y. On sait aussi que, étant donné la configuration actuelle, X va se retrouver à financer seul un bien public dont va profiter gratuitement Y. Tout un tas de scénarios sont envisageables mais je ne vais en considérer qu’un : X et Y ne s’aiment pas trop (pas du tout même), et la population X en a marre de se faire “exploiter” par la population Y. Elle envisage alors une troisième stratégie : spolier par la force la population Y d’une partie de ses richesses, partie plus que suffisante pour financer le bien. On obtient alors la matrice suivante :

      Y  
    F   PF
  F B-n.w ; B-m.w   B-n.w-m.w ; B
X        
  PF P ; P-m.w   P ; P
         
  S B+m.a-n.w ; P-m.(a+w)   B+m.a-n.w-C ; 0

Une troisième stratégie a fait son apparition : “spolier” (S). Lorsque la population X entreprend la stratégie S, la population Y peut décider soit de financer le bien (ce qui revient à être coopératif et donc à ne pas opposer de résistance) ou bien ne pas le financer (ce qui revient à résister). Dans le premier cas, non seulement la population X va pouvoir financer le bien public (B) mais va en plus extraire des m individus de la population Y une somme (a). On soustrait aux gains de X la part de financement du bien public que la population assure toujours (n.w). Quant à Y, elle n’est de fait plus libre et ne bénéficie pas du bien public (P). De plus, il faut soustraire le tribu (a) que lui a pris la population X plus la somme correspondant à son financement (forcé) du bien public (m.w). Dans le second cas, on considère que la population Y résiste mais comme n>m, elle est battue et anéantie, d’où le gain de 0 (on pourrait ajouter un paramètre p de probabilité de ne pas perdre mais ça ne changerai pas grand chose à l’histoire). Par simplicité, on considère que les gains de la population X sont les mêmes que dans le cas précédent moins un coût (C) lié aux pertes humaines et matérielles occasionnées par le conflit. Que peut-on dire de cette nouvelle matrice ? La stratégie “ne pas financer” n’est plus dominante pour la population Y si on fait l’hypothèse que               P>m.(a+w).Dans le cas où la population Y finance le bien (coopère), il est évident que la meilleure stratégie pour X est de spolier ( B+m.a-n.w>B-n.w). On a donc un premier équilibre de nash (S ; F). Quid si Y décide malgré tout de ne pas financer ? Si le coût C du conflit n’est pas trop important (i.e.C<m(a+w)), alors S est la meilleure réponse (et est donc une stratégie dominante) et le jeu n’a donc pour seul équilibre que le résultat (S ; F). En d’autres termes, c’est un scénario où une population soumet une autre qui se produit. Sauf que souvenons nous que nous avons fait l’hypothèse qu’il existe un Etat. Cet Etat peut dissuader la population X d’être agressive en lui imposant des mesures de rétorsions (R) produisant des coûts supplémentaires. Dans ce cas, la matrice est la même que précédemment à l’exception de ce coût supplémentaire :

      Y  
    F   PF
  F B-n.w ; B-m.w   B-n.w-m.w ; B
X        
  PF P ; P-m.w   P ; P
         
  S B+m.a-n.w-R ; P-m.(a+w)   B+m.a-n.w-C-R ; 0

La stratégie S n’est alors plus dominante pour la population X si B-n.w>B+m.a-n.w-R et/ou B-n.w-m.w>B+m.a-n.w-C-R. Pour ce dernier cas, l’Etat peut amener à l’équilibre précédent (F ; PF) si les mesures de rétorsion induisent un coût R>m(a+w)-C. Bref, et cela est intuitif, ce coût doit être d’autant plus élevé que les gains issus de la spoliation sont élevés et d’autant plus faible que les coûts (C) liés aux pertes humaines et matérielles importants. 

Toutefois, c’est seulement maintenant que les choses se compliquent. Car “who will guard the guardian” ? Comment est-on sur que l’Etat va engager des mesures de rétorsions qui ont elles-mêmes un coût pour lui ? N’est-il pas plus intéressant pour l’Etat de laisser faire ? C’est la réponse à ces questions qui déterminera si l’Etat agira effectivement comme il est sensé le faire. Un raisonnement en jeu séquentiel est ici nécessaire (par souci de commodité, je ne dessine pas l’arbre) : la population X joue en premier et choisie entre financer le bien public toute seule ou alors spolier la population Y (je considère ici que la population Y ne joue pas, cela ne bouleverserait pas fondamentalement l’analyse). Si elle finance le bien public seul, ses gains sont donc les suivants : B-n.w et le jeu s’arrête là.

Si elle décide de s’attaquer à la population Y, alors c’est à l’Etat de jouer. On peut considérer que celui-ci a trois possibilités à disposition : 

a) laisser-faire et donc ne pas appliquer de mesure de rétorsion. C’est alors la deuxième matrice qui s’applique et les gains de la population X sont donc de B+m.a-n.w. Quels sont les gains de l’Etat ? On peut considérer qu’ils sont proches de 0 puisque cela revient de fait à laisser le pouvoir réel (de facto) à la population belliqueuse.

b) l’Etat peut s’allier à la population X et organiser ni plus ni moins la soumission voir l’extermination de la population Y. Les gains de la population X sont alors ceux de la dernière matrice à l’équilibre (S ; PF) auxquels on enlève les coûts C et R. L’Etat reçoit quant à lui une fraction f des gains de la population X : f(B+m.a-n.w) auquel s’ajoute les gains liés aux prélèvements des impôts (I). On peut éventuellement soustraire un coût N issu des mesures de rétorsion prise par la communauté internationale. Donc f(B+m.a-n.w)+I-N. Toutefois, en coopérant, le pouvoir en place affaiblit sa position de force et coure le risque avec une probabilité (1-p) de perdre totalement le pouvoir. Dès lors, la valeur présente de ses gains futurs espérés est la suivante : f(B+m.a-n.w)+I-N+(&p(f(B+m.a-n.w)+I))/(1-&)+(1-p).0, avec & le facteur d’actualisation (0<&1).

c) l’Etat peut faire respecter le droit et intervenir pour sanctionner la population belliqueuse en imposant des mesures de rétorsion équivalentes à un coût R pour la population X. Les gains de la population X sont alors B+m.a-n.w-C-R (si on considère que la population agressée se défend). Quels sont les gains de l’Etat ? La jouissance du bien public plus la collecte des impôts pour toutes les périodes futures, soit B+I/(1-&). Il faut également soustraire les coûts issus des mesures de rétorsion et des perturbations occasionnées (D). Donc, le gain net est égal à B+I/(1+&)-D.

Que va faire l’Etat ? Etant donné nos hypothèses, on peut raisonnablement exclure l’idée que l’Etat laissera faire puisqu’il n’y trouve aucun intérêt. On voit par ailleurs aisément que l’Etat choisera d’appliquer le droit en défendant la population agressée si son gain quand c’est le cas est supérieur à ce qui se passe lorsqu’il s’associe à la population belliqueuse. Autrement dit,

B+I/(1-&)-D > f(B+m.a-n.w)+I-N+(&p(f(B+m.a-n.w)+I))/(1-&).

La propension de l’Etat à faire appliquer la loi sera ainsi d’autant plus forte que I est important (que la société est riche) et qu’il est peu coûteux pour lui d’engager des mesures de rétorsions (D faible). Ce coût est décroissant avec la puissance de l’Etat mais il est probablement croissant avec la richesse de la société. Cette propension sera également d’autant plus forte que la puissance de l’Etat est faible par rapport à celle de la population belliqueuse. En effet, plus cette puissance est faible, plus la part que pourra réclamer l’Etat (f) et la probabilité de rester au pouvoir (p) sont faibles. Les pressions internationales (N) peuvent également jouer un rôle. En revanche, la richesse de la population attaquée, de laquelle dépend la part (a) qui peut lui être soutirée par la population X, est plutôt de nature à inciter l’Etat à se joindre à l’agresseur. Bref, si l’inégalité est satisfaite et que donc l’Etat fait respecter le droit en imposant des mesures de rétorsion, la population A anticipera cela et, conformément à la dernière matrice, elle choisira de financer le bien public toute seule.

L’équilibre spontané est donc fragile car il dépend d’un ensemble de paramètres (richesse de la société, force de l’Etat, valorisation des gains futurs). Une condition fragile est notamment celle de la force (physique) de l’Etat : il ne faut pas qu’il soit trop faible (dans le cas contraire, le coût des mesures de rétorsion serait trop élevé), mais il ne faut pas qu’il soit trop fort non plus, car dans ce cas ses représentants peuvent être tentés (avec le concours ou pas d’une partie de la population) d’imposer une forme de pouvoir dictatorial. 

L’histoire regorge d’illustrations de la fragilité de ce délicat équilibre. Un exemple particulièrement intéressant est donné par Avner Greif dans son ouvrage Institutions and the Path to the Modern Economy concernant la cité italienne de Gêne au 12ème siècle (une version du chapitre en question est disponible ici). A cette époque, la ville de Gêne est une cité prospère mais tiraillée par les conflits internes, dans un contexte d’absence d’Etat centralisateur puissant. Le contrôle politique est exercé par plusieurs clans et familles qui envoient leurs membres au sein d’un Consul et, jusqu’en 1164, la coordination entre les clans est assurée du fait de la forte menace militaire exercée par certaines puissances étrangères. En 1164, cette menace disparait et la ville de Gêne sombre dans le désordre et la guerre civile. En 1194, afin d’accéder à la demande de l’empereur allemand Henry VI d’apporter leur soutien militaire à l’une de ses campagnes, les deux clans dominant Gêne parviennent à se mettre d’accord pour mettre en place un arrangement institutionnel novateur : la podesteria. Le podestà est en fait un gouverneur étranger, nommé par Henry VI, pour gouverner la cité pour une période d’un an, en association avec les clans. A la mort prématuré du podestà en place, les clans génois on décidé d’eux même de perpétuer ce système en nommant un successeur (sans l’accord de Henry VI). Greif indique alors que dans le cadre de ce système Gêne va connaitre la période la plus prospère de son histoire. En fait, le système de la podesteria est la manifestation du subtil équilibre dont je parle plus haut. Greif montre que la viabilité de ce système repose sur plusieurs conditions : il ne faut pas que la podesteria soit trop puissante militairement, autrement elle peut être tentée de prendre le contrôle de la cité ; en même temps, elle doit suffisament être forte pour combattre aux côtés d’un clan dans le cas où un autre clan entreprendrait de prendre le contrôle de la cité. Mais il faut aussi que la puissance des deux clans soit comparable pour que l’engagement d’impartialité de la podesteria soit crédible. Dans l’hypothèse où ces conditions sont satisfaites, alors la podesteria parvient à maintenir l’équilibre des pouvoirs nécessaire pour la coopération politique et la prospérité économique. Greif montre qu’il semble que cet équilibre est prévalu pendant près de 150 ans par différents biais. Ce système politique était ”auto-enforçant” : aucun contrainte exogène n’était nécessaire pour que l’équilibre se maintienne. En d’autres termes, le gardien (la podesteria) n’avait pas à être surveillé en tant que tel : les incitations en présence faisaient qu’elle avait intérêt à maintenir la situation en l’état. Greif souligne toutefois que la possibilité même de cet arrangement institutionnel était très dépendante de l’histoire de Gêne où les factions ont toujours joué un rôle majeur, permettant ainsi un certain équilibre militaire.  

 

4 réponses vers «“But who will guard the guardians ?” (2/2)»

  1. J-E dit :

    Sacré Léonid ! Pour une fois qu’un Nobel d’économie cite du Juvénal dans le titre d’un article il disparaît dans l’année. Petite précision quand même : si depuis le mechanism design est devenu quelque chose d’assez technique, étudiant de nombreux cas pratiques différents et la meilleure façon d’organiser l’échange ou l’interaction à chaque fois, c’est parce que les premiers résultats et notamment ceux d’Hurwicz étaient très généraux et tout à fait fondamentaux au contraire.

    En 1972 il montre que si les agents sur un marché ont de l’information privée aucun mécanisme ne permet d’aboutir à une situation Pareto-optimale. Autrement dit, si on prend le cadre du débat Hayek-Lange sur le socialisme, Hayek a raison de dire que la planification est infaisable parce que les agents n’ont aucune raison de révéler leurs informations au planificateur. En revanche il a tort de dire que le marché agrège efficacement l’information : pour exactement la même raison les agents soumettront des fonctions de demande cachant quelque peu leurs préférences afin de profiter de meilleurs prix.

    Un autre résultat classique est celui de Myerson et Satterthwaite qui montrent que, lorsque un vendeur et un acheteur ont chacun de l’information privée sur la valeur d’un objet, il n’existe absolument aucune procédure de vente ou d’enchère garantissant l’optimalité. Un échange bilatéral est dans ce cadre forcément inefficace, c’est quand même fondamental ça !

    Pour les gardiens notons que comme le problème posé par Juvénal concerne au départ la surveillance des femmes (qui peuvent user de leurs charmes sur leurs gardiens pour qu’ils ferment les yeux sur les visites de leurs amants), historiquement plusieurs solutions ont été apportées au problème via l’utilisation de femmes ou d’eunuques comme gardiens. Je ne sais pas dans quelle mesure ce principe peut être transposé en politique (en gros il faut que les gardés soient incapables d’offrir des compensations aux gardiens).

    Votre raisonnement est très intéressant mais j’ai peur que vous ne simplifiiez un peu trop le problème d’Hurwicz, car tout jeu de mechanism design est un jeu en information asymétrique tandis que vous étudiez un problème de free-ride en information complète. Prenez le cas de la surveillance des femmes : il n’y a pas de problème si leur action est observable et que ex post le mari sait qu’il a été trompé, et pas besoin de gardien. Envisager l’action S est original mais je ne suis pas sûr que cela change fondamentalement les résultats obtenus par la théorie des jeux répétés, qui vous diront que les joueurs ont intérêt à punir les déviants si le jeu est répété un nombre infini de fois, parce que sinon on se retrouve perpétuellement sur l’équilibre non coopératif. Le problème est d’ailleurs posé exactement dans les termes que vous utilisez.

    Le problème d’Hurwicz se rencontrerait plutôt dans les jeux répétés avec observation imparfaite (qui ont été beaucoup étudiés aussi mais sont bien moins connus), où par exemple si le bien public n’a pas été fourni vous ne pouvez pas être sûr que c’est parce que les autres n’ont pas contribué, et inversement s’il l’est peut-être que les autres n’ont pas contribué tant que ça. Comme le résultat atteint à l’équilibre est dans ce cadre sous-optimal, si ma mémoire est bonne, on comprend qu’il soit plus intéressant d’avoir un gardien capable de surveiller directement les gens. Mais il est difficile à contrôler lui-même justement parce que l’information est imparfaite. Pensez au scandale Enron : le cabinet Arthur Andersen devait servir de gardien à Enron et avait à ce titre plus ou moins accès à son information privée, mais il était impossible de garder Arthur Andersen sans avoir accès soi-même à l’information privée d’Enron. On ne se débarrasse pas comme ça d’une asymétrie d’information, ce qui nuit beaucoup à la logique des modèles principal-agent.

    Il ne vous reste donc plus qu’à appliquer votre raisonnement dans un cadre d’information asymétrique, qui me semble plus proche du problème soulevé par Hurwicz. Bon courage !

    PS : là où y a de la Gênes, y a pas de plaisir

  2. C.H. dit :

    Merci pour ce commentaire très intéressant. Effectivement, un raisonnement en information imparfaite semble plus fidèle au raisonnement de Hurwicz. Je dois avouer que pour le coup je me suis autant inspiré des travaux de Greif (dont les modèles sont le plus souvent à information parfaite) que de Hurwicz. Ce sera l’occasion de transformer cette saga en trilogie !

  3. alexandre delaigue dit :

    En information asymétrique, pourquoi ne pas recourir au demand-revealing referendum? J’en avais mis un exemple ici :

    http://economistes.blogs.liberation.fr/chiffrage/2007/03/construire_un_p.html

    Sinon (cela fait longtemps que je l’ai lu) mais il me semble qu’il y a pas mal d’analyses de ce type chez Hirshleifer (dans the dark side of the force notamment).

  4. J-E dit :

    En information asymétrique, pourquoi ne pas recourir au demand-revealing referendum ?

    Justement pour les raisons que développe Hurwicz précisément à partir du même exemple (équilibre de Lindahl et son implémentation subséquente en stratégies de Nash) : votre référendum suppose par exemple que les agents ne peuvent pas menacer les autres de mort pour les forcer à voter comme ils le veulent. Pour empêcher que cela arrive il faut que de tels comportements soient punis, et que ceux qui les punissent aient intérêt à le faire et ne puissent être achetés par les déviants. On peut interdire aux gardiens de se faire acheter mais alors il faut qu’il y ait quelqu’un pour les surveiller etc. Les hypothèses qui garantissent l’implémentabilité d’un équilibre de Lindahl ne suffisent pas à garantir que les stratégies “illégales” seront punies.

    C’est pour cela que le problème posé par Hurwicz est original, il a deux composantes : 1. il y a un problème d’asymétrie d’information 2. les agents peuvent classiquement mentir, mais même recourir à des stratégies “illégales” qui doivent être interdites de manière crédible. Chaque problème pris séparément admet des solutions connues depuis une trentaine d’années, mais ces deux solutions prises ensemble ne suffisent pas à résoudre la situation quand les deux problèmes se posent ensemble, ce pourquoi l’article de Hurwicz est original.

Laisser un commentaire