Attention : billet un peu long et technique. La discussion philosophique et théorique commence à peu près à la moitié.
Les économistes sont traditionnellement plutôt sceptiques et critiques concernant l’argumentation développée par John Rawls pour soutenir son fameux principe de différence. Comme je l’ai expliqué dans plusieurs billets ici, le principe de différence correspond à un critère de décision (le maximin) sous voile d’ignorance difficilement justifiable. Rawls lui-même a proposé d’autres défenses du principe de différence, y compris dans Theory of Justice (cf. son chapitre 2), qui ne reposent pas sur l’expérience de pensée du voile d’ignorance. Dans une optique assez différente relevant de la théorie du choix social, Kenneth Arrow a également tenté de proposer une axiomatisation du principe de différence, ou plus précisément de ce qu’il nomme le principe lexicographique du maximin. On trouve la démonstration d’Arrow dans deux articles, l’un de 1977 l’autre de 1978, ayant le même titre : « Extended Sympathy and the Possibility of Social Choice ». L’approche d’Arrow est particulièrement digne d’intérêt, dans la mesure où elle explore les possibilités de la théorie du choix social pour éclairer des problématiques de justice sociale et où elle permet de repérer les éléments clés dans la défense du principe de différence rawlsien.
Je ne vais pas ici reprendre dans le détail la démonstration axiomatique d’Arrow, qui du reste est relativement simple à comprendre. Se plaçant dans un cadre d’agrégation des préférences « personnelles » des agents (i.e. des préférences exprimant uniquement les intérêts individuels des agents [« tastes »] et non leurs opinions morales [« values »]), Arrow s’attache à proposer une procédure de choix social qu’il nomme « constitution » susceptible d’avoir une inclination égalitariste proche du principe de différence rawlsien. Contrairement à sa fameuse démonstration du théorème d’impossibilité où il ne travaille qu’avec des ordres de préférences, Arrow raisonne ici en termes de fonctions d’utilité (qui bien sûr, représentent des ordres de préférence), ce qui a quelques implications intéressantes sur lesquelles je reviendrai plus bas. Les fonctions d’utilité utilisées par Arrow sont purement ordinales, ce qui techniquement parlant signifie qu’elles préservent l’ordre de préférence pour toute transformation strictement monotone*.
Précisons quelques éléments de notation. Soit N l’ensemble des individus dont il s’agit d’agréger les préférences, X l’ensemble des alternatives sociales disponibles et U l’ensemble des fonctions d’utilité u(x) définies pour tous les éléments x appartenant à X. Une fonction u(x) définit un ordre de préférences, de telle sorte que ui(x) > ui(y) signifie simplement que l’agent i préfère l’alternative sociale x à l’alternative sociale y. Une constitution, ou procédure de choix social, est une fonction f transformant les éléments de U en un ordre portant sur X. Autrement dit, pour tout profil de préférences exprimé par un vecteur U* = [u1, …, un], une constitution f détermine l’alternative sociale x* collectivement préférée. Quelles sont les propriétés « raisonnables » que doit posséder f ? Arrow propose la liste d’axiomes suivante :
- Binarité : pour deux fonctions u et u’ telles que ui(x) = u’i(x) et ui(y) et u’i(y) pour tout agent i, xf(u)y (x est socialement préféré à y dans le cadre de l’ordre représenté par u) si et seulement si xf(u’)y.
- Anonymat : soit s une permutation dans N. Si ui(x) = u’s(i)(x) pour tout x et i, alors f(u) = f(u’).
- Pareto : si ui(x) > ui(y) pour tout i, alors x est socialement strictement préféré à y. Il s’agit d’un critère parétien faible. Le critère parétien fort s’applique si on retient plutôt une préférence faible ui(x) ≥ ui(y).
- Elimination des individus indifférents : en mots, la préférence sociale entre deux alternatives x et y au sein d’une population N dépend uniquement des préférences entre x et y des groupes de membres de N qui ne sont pas indifférents entre les deux alternatives.
L’axiome de binarité est une variante de l’axiome d’indépendance utilisé par Arrow dans son théorème d’impossibilité. Il indique que pour toute fonction u, la préférence sociale entre deux alternatives dépend uniquement des préférences des agents entre ces deux alternatives. L’axiome d’anonymat renforce l’axiome de non-dictature que l’on retrouve dans le théorème d’impossibilité. Il indique que les préférences sociales sont indépendantes de l’identité des porteurs de préférences individuelles. Les deux derniers axiomes n’appellent pas à des commentaires particuliers, mais ils ont un rôle essentiel dans la démonstration puisqu’ils impliquent que les préférences sociales entre deux alternatives sont uniquement fonction des préférences des agents non indifférents.
On sait (c’est l’essence du théorème d’impossibilité d’Arrow) que ces axiomes sont incompatibles si l’ordre de préférences sociales doit répondre à des conditions minimales de cohérence. Toutefois, Arrow montre que si l’on postule que les fonctions d’utilité sont co-ordinalement invariantes, alors les axiomes peuvent tous être satisfaits par une constitution répondant au principe du maximin selon lequel x est socialement strictement préféré à y si et seulement si min ui(x) > min ui(y) pour tout agent i. Plus précisément, Arrow définit le « principe lexicographique du maximin » de la manière suivante :
Pour toute alternative x et pour toute fonction d’utilité u, on ordonne les agents dans l’ordre croissant définit par la fonction u(x, i) indiquant l’utilité de l’agent i dans l’alternative x. Soit i(x, k) l’agent classé au kème rang. Pour toute paire d’alternative x et y, on définit k(x, y) tel que
K(x, y) = min {k|u[x, k] ¹ u[y, i(y, k)]
L’alternative x est alors socialement strictement préférée à y si et seulement si u[x, i(x, k(x, y))] > u[y, i(y, k(x, y))]
En langage courant, le principe lexicographique du maximin indique que l’alternative socialement préférée est celle qui est préférée par l’agent qui est classé au dernier rang (i.e. le moins bien lotie) dans chaque alternative. De manière évidente, puisqu’il n’y a pas de raison que ce soit à chaque fois le même agent i qui soit classé au dernier rang dans chaque alternative x, le principe lexicographique du maximin présuppose que l’on puisse faire des comparaisons interpersonnelles d’utilité. Cela est permis par l’hypothèse que les fonctions d’utilité sont co-ordinalement invariantes et qui indique que pour toute alternative x et tout agent i, il existe une fonction g telle que si u’(x, i) = g[u(x, i)], alors f(u) = f(u’). En clair, les ordres de préférence de tous les agents sont préservés par une seule et unique transformation monotone de toutes les fonctions d’utilité. Pour obtenir de cette hypothèse d’invariance co-ordinale et des axiomes stipulés plus haut le principe lexicographique du maximin, la constitution doit répondre à une dernière condition, la condition d’équité forte :
Pour toutes les fonction u ε U, toutes les alternatives x, y ε X et tous les individus i, j ε N, si u(x, k) = u(y, k) pour tout individu k ≠ i, j et que u(y, i) < u(x, i) < u(x, j) < u(y, j), alors l’alternative x est socialement préférée à y.
La condition d’équité forte opérationnalise le principe de différence rawlsien et selon lequel seule la situation de l’individu le plus défavorisé importe dans la procédure de choix social. Si cette condition est acceptée, alors on peut déduire des autres axiomes une constitution mettant en oeuvre les principes de justice de Rawls (tout du moins son principe de différence). Plus intéressant encore, cette constitution est l’une des deux seules qui est disponible ! L’autre constitution possible est en effet celle qui répond à une condition parfaitement symétrique à la condition d’équité forte, la condition d’inéquité, et qui conditionne le choix social aux préférences de l’agent le plus avantagé. On débouche alors sur une condition mettant en oeuvre le principe du maximax, et non du maximin.**
J’en ai enfin terminé avec les aspects techniques. Dans quelle mesure cette approche axiomatique apporte-t-elle un soutien au principe de différence rawlsien ? Arrow lui-même relève deux éléments de discussion. En premier lieu, une potentielle difficulté tient au fait que la démonstration repose sur la possibilité de réaliser des comparaisons interpersonnelles (et ordinales) d’utilité. A l’instar d’Harsanyi à peu près au même moment, Arrow s’appuie sur le concept de préférences étendues qui permet la réalisation de comparaisons entre des alternatives définissant une position sociale x et une identité personnelle i. Plus précisément, l’hypothèse d’invariance co-ordinale rend significative une relation de préférence du type « il est préférable d’être i dans la situation x, que j dans la situation y », ou plus formellement, u(x, i) > u(y, j). Arrow se montre relativement prudent quand à la possibilité effective de mener de telles comparaisons. Fondamentalement, et même si encore aujourd’hui beaucoup d’économistes continuent de considérer les comparaisons interpersonnelles d’utilité comme ne relevant pas du domaine scientifique (notamment parce toute proposition à ce sujet est difficile à tester), il me semble non pertinent de rejeter une approche au seul motif qu’elle repose sur de telles comparaisons. Permettre les comparaisons interpersonnelles d’utilité revient juste à élargir la base informationnelle à partir de laquelle un choix social peut être effectué et l’une des explications au théorème d’impossibilité d’Arrow est précisément qu’il repose sur une base très étroite. On peut même aller plus loin et considérer qu’en matière de jugements moraux et de justice, les comparaisons interpersonnelles d’utilité sont nécessaires : après tout, un jugement en termes de justice distributive n’est rien de plus qu’un arbitrage entre des intérêts partiellement contradictoires mais dont on se doit de supposer qu’ils sont également partiellement commensurables.
Plus problématique est le fait que la démonstration d’Arrow suppose implicitement que les préférences étendues sont les mêmes pour tous les membres de la population : pour que la procédure de choix social imaginée par Arrow débouche sur un résultat significatif, il faut notamment que tout le monde s’accorde sur l’évaluation du bien-être de l’agent le moins bien loti dans chaque situation sociale. Contrairement à l’approche proposée par Harsanyi dans son théorème de l’observateur impartial, Arrow ne suppose pas que les agents sont derrières un voile d’ignorance. Mais le problème reste le même : tout le monde doit ordonner les alternatives étendues (x, i) de la même manière. Il est très intéressant de constater qu’Arrow suggère, en appui de cette hypothèse, une défense qui rappelle « l’argument causal » de Harsanyi et qui indique que, pour une spécification suffisamment fine des caractéristiques définissant les alternatives sociales, les différences individus doivent avoir des préférences identiques ou proches. Arrow lui-même se montre réservé concernant une telle défense. Une alternative plus prometteuse selon moi consiste à renoncer à un raisonnement en termes de préférences et à adopter une interprétation « objective » du concept d’utilité. La démonstration d’Arrow repose en effet sur une certaine ambiguïté (qui, ici encore, se retrouve chez Harsanyi) sur la signification du concept d’utilité. Celui-ci tend à être définit, de manière classique, comme le degré de satisfaction des préférences. Mais absolument rien n’empêche d’adopter une interprétation objective, similaire aux biens premiers rawlsien. L’utilité serait alors un bien valorisable en tant que telle, ou une mesure objective du bien-être des agents. Dans tous les cas, cela reviendrait à supposer que l’utilité est une quantité objective et commensurable d’un agent à l’autre, ce qui élimine de facto le problème des comparaisons interpersonnelles d’utilité. Encore une fois, dans la mesure où la démonstration d’Arrow ne repose par sur le concept de préférence, une telle interprétation est possible.
Un deuxième type de problème à trait à la condition d’équité forte. Le statut de cette condition est ambigu : elle n’est pas un résultat nécessaire des axiomes posés par Arrow puisque la condition d’inéquité est également compatible avec la même liste d’axiome. Toutefois, cette condition débouche sur des résultats diamétralement opposés. Pourquoi choisir l’une plutôt que l’autre ? Si le choix est purement moral, cela revient à présupposer le résultat qui doit être découvert. On est en fait confronté à un problème parallèle à celui générer par l’argument que développe Rawls en faveur du principe de différence à l’aide du voile d’ignorance. Derrière le voile d’ignorance, Rawls postule que les agents auront une aversion au risque telle qu’ils ne s’intéresseront qu’à la situation du plus défavorisé. En réalité, on sait que le critère du maximin en choix risqué est qualitativement distinct d’une aversion au risque extrême (j’ai expliqué ce point ici). Même des agents rationnels très fortement averses au risque maximiseront leur utilité espérée, que l’utilité soit une mesure de la satisfaction des préférences ou la quantité de biens premiers possédés. Cela n’est pas anodin du point de vue de la pertinence des principes rawlsiens dans un cadre de théorie du choix social, et je vais finir ce billet en expliquant pourquoi. Soit un agent, placé derrière un voile d’ignorance, devant choisir entre les deux alternatives sociales suivantes :
Alternative/position |
1 |
2 |
Total |
A |
10 |
10 |
20 |
B |
5 |
16 |
21 |
Les chiffres dans le tableau exprime une mesure du bien-être de l’agent en termes de bien premiers. Supposons que l’agent a autant de chances d’être dans la situation 1 que dans la situation 2 et qu’il sache cela (nous sommes en situation de risque et non d’incertitude). Imaginons que l’agent préfère l’alternative A à l’alternative B. Cela s’explique par l’aversion au risque de l’agent qui, formellement, se traduit par le fait que l’utilité marginale des biens premiers est décroissante. Un agent rawlsien, qui utilise le critère du maximin pour choisir, fera exactement le même choix, puisque le gain minimum apporté par l’alternative A (10) est supérieur à celui apporté par l’alternative B (5). Néanmoins, on peut concevoir un argument philosophique qui indique que, dès lors que la quantité à maximiser est une mesure objective de bien-être, il est logiquement requis de préférer l’alternative qui maximise la quantité espérée de bien-être. Supposons que les chiffres dans ce tableau soient des utilités mesurant la quantité d’éléments objectivement valorisables dans la vie (éventuellement des biens premiers). Dans ce cas, un agent rationnel choisira l’alternative B car les utilités incorporent déjà tous les éléments intrinsèquement valorisables ou délétères, comme par exemple le risque. Bien sûr, un agent rawlsien continuera à préférer l’alternative A, mais ce choix est fragilisé par les problèmes relatifs au critère du maximin.
Il est donc difficile de rationaliser par l’aversion au risque le choix de la condition d’équité forte si on adopte une interprétation objective de la notion d’utilité. Il me semble toutefois qu’une autre manière de le justifier est envisageable à partir d’une stratégie similaire à celle que Rawls emploie dans le chapitre 2 de Theory of Justice pour défendre son principe de différence. Mais ce sera pour un prochain billet.
* Par exemple, soit U une fonction d’utilité représentant un ordre de préférences. Si U est ordinale, alors toute fonction V = f(U) avec f une transformation monotone préserve l’ordre de préférences. C’est le cas par exemple si V = U².
** Pour ceux qui sont intéressés par la démonstration, il suffit de noter que l’on peut déduire des axiomes de binarité, d’anonymat et d’élimination des individus indifférents un « principe de neutralité » selon lequel les préférences sociales ne sont pas affectées par une permutation des préférences individuelles entre deux agents i et j. On peut alors montrer que l’hypothèse que ni le principe d’équité forte ni le principe d’inéquité n’est opérant contredit le principe de neutralité.
Il faut vraiment que vous lisiez A theory of social fairness and justice… La conclusion de leur axiomatique du choix social, c’est que le leximin est quasi-inévitable, mais que le critère de comparaison des situations relatives des individus (et donc de détermination de l’individu « le moins bien loti »), lui, est très variable selon l’axiomatique choisie.
Je suppose que vous faites référence à l’ouvrage de Fleurbaey et Manniquet ? Il est effectivement au programme de mes lectures de cet été !
Eh bien commencez par lui 🙂 Ils répondent de façon très structurée aux questions que vous vous posez depuis trois ou quatre billets.