Archives de Tag: critère de Pareto

Maximisation et Pareto-optimalité

Le philosophe David Gauthier vient de publier dans la revue (librement accessible) Rationality, Markets and Morals un article intitulé « Achieving Pareto-Optimality: Invisible Hands, Social Contracts, and Rational Deliberation » dans lequel il revient sur l’opposition en économie (et en particulier en théorie des jeux) entre optimisation et maximisation. Cette opposition était déjà au cœur de la théorie de la justice de Gauthier, dont j’ai parlé ici. Sur la base du dilemme du prisonnier, Gauthier part du fait que les comportements maximisateurs des agents (au sens maximisation de l’utilité espérée) ne débouchent pas nécessairement sur un résultat optimal au sens de Pareto :

     

B

 
   

Construire

 

Ne pas construire

 

Construire

3/4 ; 3/4

 

0 ; 1

A

       
 

Ne pas construire

1 ; 0

 

1/4 ; 1/4

Gauthier défend l’idée dans son article que la rationalité pratique doit, dans ce type de reconfiguration, recommander aux joueurs de coopérer (« construire »), ce qu’il appelle la « condition P-O ». Comme la théorie standard de la rationalité fait une recommandation contraire, elle doit être rejetée :

The orthodox theory of practical rationality, embraced by economists and theorists of rational choice, must treat cooperation as in itself irrational. But everyone may expect to benefit from cooperative interaction. The orthodox theory is therefore mistaken. It should be superceded by a theory based on Pareto-optimality and cooperation (p. 196).

En clair, Gauthier considère que la théorie de la rationalité dans un contexte d’interaction stratégique doit être fondée sur le critère de Pareto et non sur celui de la maximisation de l’utilité espérée, parce qu’il débouche sur une disposition à la coopération dont « tout le monde peut s’attendre à bénéficier ». Il est important de noter que l’argument de Gauthier porte sur les modes de raisonnement des agents dans un jeu. A ce titre, il semble très proche de l’approche développée par Michael Bacharach dans le cadre de ce que ce dernier appelle le « raisonnement en Mode-P » et qui se décline de la manière suivante :

P1. Le joueur i ordonne tous les profils stratégiques (combinaisons de stratégies) s sur la base du critère de Pareto.

P2. Le joueur i considère qu’il a une raison valable de jouer la stratégie constitutive du profil le mieux classé.

Un joueur qui adopte un raisonnement en mode-P dans le cadre du dilemme du prisonnier peut être amené ainsi à coopérer. C’est toutefois une condition non-suffisante : dans le dilemme du prisonnier, les profils stratégiques où un joueur coopère et l’autre ne coopère pas sont également optimaux au sens de Pareto ! Pour que la coopération mutuelle soit l’unique résultat recommandé par une théorie de la rationalité pratique, il faut compléter le raisonnement en Mode-P d’une règle de transformation des gains des joueurs. La règle utilitariste consistant à définir une fonction d’utilité collective comme la somme des utilités individuelles est une possibilité. Dans ce cas, la coopération mutuelle est optimale. Mais cela suppose 1) que les agents s’accordent sur une fonction d’utilité unique U représentant un ordre de préférences commun à tous les joueurs et 2) que les agents raisonnent à partir de cet ordre commun et que cela est connaissance commune. La définition d’une fonction d’utilité collective U et le fait qu’un joueur prenne ses décisions à partir de cette dernière correspond à ce que l’on peut appeler un raisonnement collectif. Le fait que les joueurs adoptent ce raisonnement collectif et le fait que cela soit connaissance commune est une condition suffisante pour garantir la coopération dans le dilemme du prisonnier.*

Gauthier rejette toutefois l’idée que la coopération repose sur l’identification d’un « bien commun » ou d’une utilité collective : « cooperation does not require any common good, or sense of common purpose, beyond the demand that each cooperator benefit in his own terms » (p. 197). Le problème à ce stade est qu’il lui est alors impossible d’expliquer pourquoi la coopération mutuelle serait rationnelle dans le dilemme du prisonnier, sauf à poser de manière artificielle un principe de symétrie selon lequel si le raisonnement d’un joueur l’amène à coopérer, alors l’autre joueur utilisant le même raisonnement doit arriver à la même conclusion. Le problème, bien sûr, c’est que la théorie de Gauthier ne recommande précisément pas aux joueurs de nécessairement coopérer !

Une autre difficulté à laquelle est confrontée l’argumentation de Gauthier est que sa condition P-O va, dans le cadre du dilemme du prisonnier, à l’encontre du principe de dominance. En effet, autant le principe de maximisation de l’utilité espérée dans le cadre d’interactions stratégiques peut être discutés, autant rejeter le principe de dominance semble excessif. En clair, la théorie de la rationalité défendue par Gauthier recommande aux joueurs de jouer des stratégies strictement dominées, ce qui semble contraire à tout principe de rationalité minimum. Ici encore, pour donner un fondement à cette recommandation, il me semble inévitable de poser l’existence de préférences collectives attribuées au groupe de joueurs, et non aux joueurs eux-mêmes. La seule autre possibilité serait la suivante : faire l’hypothèse que les modes de raisonnement des joueurs sont corrélés. Autrement dit si moi, joueur i, je raisonne selon la théorie de Gauthier (j’agi selon la condition P-O), ce fait devrait m’indiquer avec certitude que le joueur j raisonne de la même manière. Mais ce n’est rien de plus qu’une variante de la « pensée magique » qui consiste, dans le cadre d’interactions stratégiques, à faire l’hypothèse que les actions et les croyances des autres joueurs sont causalement déterminées par mes croyances et mes actions. Ici, il est intéressant d’ailleurs de noter que l’on peut inverser le raisonnement de Gauthier : ce dernier pose que le contrat social est fondé sur le fait que les joueurs raisonneraient de la manière dont le recommande Gauthier. On peut penser au contraire que le mode de raisonnement proposé par Gauthier n’est possible et rationnel que dans une société où un « contrat social » ayant institutionnalisé la coopération est déjà solidement ancré !

* Dans ce papier, je montre que la clause de la connaissance commune du raisonnement collectif n’est pas nécessaire, ainsi que l’accord explicite autour d’une fonction U. Il suffit que les joueurs aient connaissance commune du fait qu’ils ont un intérêt commun à coopérer pour que leur coopération puisse être représentée par une fonction d’utilité collective utilitariste. Toutefois, une condition préalable est que les joueurs s’identifient à un groupe et raisonnent explicitement du point de vue de ce groupe, condition que ne pose pas Gauthier.

Poster un commentaire

Classé dans Non classé

Economie comportementale et bien-être

Soit un produit S, dont la consommation par une partie N des membres d’une population P diminue le bien-être de l’ensemble des autres membres M de P. Autrement dit, la consommation de S par N génère des externalités négatives. Dans l’hypothèse où les coûts de transaction ne sont pas trop élevés, et si l’on suppose que N et M peuvent choisir collectivement de manière rationnelle et optimale (i.e. pas de problème d’action collective et d’agrégation des préférences), alors on peut imaginer une négociation entre N et M débouchant sur une transaction où M payent N pour que ces derniers réduisent leur consommation de S. Plus exactement, si l’utilité totale que N tirent de leur consommation de S dans une quantité q est UN(q) = u et que le désagrément lié à cette même consommation génère une perte d’utilité chez M de VM(q) = v, alors les membres de M proposeront un paiement x tel que VM(x) ≤ v aux membres de N pour que ces derniers cessent de consommer S. Si UN(x) ≥ u, ils accepteront. Le même raisonnement est applicable dans le cas où il s’agit non pas de supprimer la consommation de S, mais de la réduire d’un montant ∂q (dans ce cas, il faut que la diminution de la consommation ∂q satisfasse les inégalités suivantes : VM(x) ≤ VM(∂q) = v’ et UN(x) ≥ UN(∂q) = u’).

Supposons maintenant que M et N sont les mêmes personnes mais à deux moments différents dans le temps. Pour clarifier, on notera Nt et Nt+1 les deux mêmes populations se succédant dans le temps. Au temps t, les membres de N ne souhaitent pas consommer S. Au temps t+1, les membres de N souhaitent consommer S. Mais comme Nt et Nt+1 sont les mêmes personnes, la consommation de S par Nt+1 a un impact (négatif) sur Nt. On a donc un nouveau problème d’externalité négative. Peut-on imaginer le même mécanisme de négociation et de marchandage que ci-dessus pour régler le problème ? La réponse est non car l’éventuel « contrat » qui pourrait être conclu ne pourrait être mis en application : quand bien même Nt et Nt+1 pourraient contracter en  t pour réduire la consommation de S en t+1, Nt+1  n’auraient  aucun intérêt à respecter l’accord. Il en va de même pour les vendeurs du produit S. La solution « coasienne » n’étant pas disponible, la taxation voire l’interdiction pure et simple de S semble être la seule solution pour remédier au problème de l’externalité.

Comme le laisse entendre Jeff Ely, taxer les sodas, ou interdire leur vente dans un volume supérieur à une certaine limite comme a voulu le faire le maire de New York, pourrait se justifier par ce raisonnement. Sauf qu’en réalité les circonstances sont un peu différentes. Est-on sûr que les personnes qui consomment les sodas et que celles qui demandent la régulation de leur consommation sont les mêmes personnes ? Dans le cas d’espèce, on peut fortement en douter. Supposons que ce ne soit pas le cas. Nous nous retrouvons alors dans la configuration du premier paragraphe, avec deux populations N et M bien distinctes. Il y a toutefois une différence notable : il est très difficile de considérer que la consommation de S par N génère des externalités négatives sur M. Autrement dit, puisqu’il n’y a pas d’externalité, la situation actuelle (caractérisée par un certain niveau q de consommation par N) est d’ores et déjà optimale au sens de Pareto. L’intervention du législateur ou du politique ne peut alors se justifier que de deux manières :

* on parvient à démontrer que les conséquences de la consommation de S par N a des effets sur la santé de N (obésité, diabète, etc.) et que ces effets entraînent à leur tour un coût économique pour les membres de M. C’est possible, en particulier dans un système où la santé serait socialisée. Mais ce n’est pas certain : la consommation de certains produits peut réduire l’espérance de vie de telle sorte que in fine des économies seront faites par une diminution des dépenses pour traiter des maladies liées à la vieillesse ;

* on invoque un critère éthique ou normatif particulier autre que le critère de Pareto pour justifier malgré tout la régulation de la consommation de S. C’est une possibilité, mais il faut alors expliciter ce critère et le justifier. L’argument se déplace alors du terrain de l’analyse économique vers celui de la philosophie morale. C’est le problème du versant normatif de l’économie comportementale : il existe peu ou proue de tentatives de justification d’un tel critère alternatif. Le plus souvent, celui-ci reste implicite et mal identifié.

5 Commentaires

Classé dans Non classé

Ethique et Pareto-optimalité

Très bon billet de Chris Dillow qui, en repartant des travaux de Shapley et Roth sur les mécanismes d’allocation sans système de  prix, s’interrogent sur la pertinence du critère de Pareto pour évaluer la désirabilité d’une société ou d’un mécanisme. La conclusion de Dillow est assez connue : le critère de Pareto ne dit finalement pas grand chose, et n’a surtout en tant que tel aucune valeur normative. D’autres facteurs expliquent que l’on préfère tel mécanisme à tel autre.

On peut présenter les choses ainsi : imaginez deux individus en situation de marchandage autour d’un actif de valeur V qu’ils doivent se partager. Les deux individus doivent s’accorder sur une allocation A = [M1 ; M2] faisable (i.e. M1 + M2 ≤ V), n’obtenant rien dans le cas contraire.  On peut imaginer plusieurs  mécanismes d’allocation permettant d’atteindre une situation Pareto-optimale, c’est à dire une situation où l’intégralité de l’actif est partagée. On peut tout d’abord imaginer une procédure dictatoriale : un troisième agent, dont on peut supposé qu’il est incité à trouver une allocation efficiente, décide alors d’une allocation A* qui est Pareto-optimale mais avec une répartition dépendant de critères arbitraires choisis par le dictateur. Une deuxième possibilité serait un mécanisme « quasi-dictatorial » : la « Nature » (le hasard) octroie à l’un des individus le droit de choisir l’allocation qui lui convient. L’individu choisira probablement une allocation A** Pareto-optimale, mais probablement très inégalitaire (mais pas forcément complètement, si l’on en croit les résultats expérimentaux). Une dernière possibilité serait de laisser la possibilité aux agents de négocier selon un mécanisme où chaque individu fait une offre à tour de rôle, la procédure s’arrêtant lorsque l’une des parties accepte l’offre de l’autre. Selon la solution de Nash, et d’après un théorème de Rubinstein, si les agents actualisent leurs gains futurs au même taux (et si leurs gains en cas de désaccord sont les mêmes), alors l’allocation finale doit être A*** = [V/2 ; V/2].

Supposons maintenant que nos deux agents doivent s’accorder sur le mécanisme à utiliser pour allouer l’actif V. Cela revient à dire qu’ils doivent négocier sur le mécanisme d’allocation. A priori, les trois mécanismes sont équivalents en termes de Pareto-optimalité. Admettons que nos agents sont placés sous voile d’ignorance, c’est à dire qu’ils ne connaissent pas leur identité dans le cadre de la futur négociation. Cela veut par exemple dire qu’ils n’ont aucune information sur leurs futures caractéristiques qui pourraient éventuellement influencer le choix du dictateur si le mécanisme dictatorial était choisi. Ils ne savent pas s’ils possèderons des préférences sociales, ni quel sera le taux auquel ils actualisent les gains futurs. En conclusion, cela veut dire que, dans le cadre du voile d’ignorance, les individus ne peuvent pas discriminer les mécanismes par leur efficience (tous tendent vers la Pareto-optimalité) ni sur leurs gains espérés. Intuitivement cependant, il semble très probable que placé dans une telle situation, n’importe qui aurait tendance à choisir le troisième mécanisme en raison de certaines de ses caractéristiques saillantes : il est symétrique (si les individus ont exactement les mêmes caractéristiques, ils gagnent la même chose ), il est impartial (la décision d’allocation ne dépend pas d’un agent s’appuyant sur des critères arbitraires), il repose sur un isomorphisme formel (les individus ont les mêmes « droits » dans la procédure).

Il me semble que ce sont également les caractéristiques idéales d’une relation marchande. Néanmoins, dès lors que l’on dévie de ces caractéristiques idéales, il est possible que des individus placés sous un voile d’ignorance avec quelques informations complémentaires préfèrent les deux autres mécanismes : par exemple, s’il est connu que les gains en cas de désaccord ne sont pas les mêmes, si on sait que les joueurs n’actualiseront pas de la même manière les gains futurs, si l’on sait que le dictateur sera systématiquement biaisé en faveur de certaines caractéristiques par ailleurs jugées « justes » (ex : systématiquement trancher en faveur d’un individu physiquement handicapé), etc. Pour conclure, le critère de Pareto n’est pas très utile en matière d’éthique. Ce qui fait probablement l’attrait des solutions marchandes, c’est qu’elle repose sur une égalité formelle. Mais cette dernière n’est plus décisive si trop d’asymétries entre les individus sont révélées.

Poster un commentaire

Classé dans Non classé