Depuis les contributions pionnières de Kenneth Arrow et Amartya Sen, la théorie du choix social est le champ de l’économie qui s’intéresse à la manière dont on peut agréger les préférences individuelles de manière à obtenir un ordre ordonnant des préférences « collectives » ou « sociales » dans le cadre d’un problème de décision collective. Il est de notoriété que la théorie du choix social est l’un des domaines de la science économique qui est le plus mathématisé. Cela s’explique largement par l’approche méthodologique qui est adoptée, approche que l’on peut qualifier d’axiomatique : on définit tout d’abord un certain nombre d’axiomes minimaux et raisonnables que toute procédure d’agrégation doit respecter, puis on déduit de la conjonction de ces axiomes la ou les fonctions de bien-être social représentant les préférences collectives.
L’un des intérêts de cette approche est qu’elle permet de révéler des « impossibilités », c’est-à-dire le fait qu’il est possible qu’aucune fonction de bien-être social ne peut satisfaire simultanément un certain nombre d’axiomes. C’est évidemment le cœur du théorème d’impossibilité d’Arrow ou du paradoxe libéral-parétien de Sen. Lorsque de tels résultats d’impossibilité surviennent, il faut alors revenir sur les axiomes pour interroger leur pertinence. Il se peut par exemple que l’un des axiomes, qui paraissait raisonnable initialement, s’avère être en fait non pertinent ou problématique. Si l’on prend l’exemple du paradoxe libéral-parétien, la plupart des discussions qui ont suivi la publication par Sen de son résultat initial se sont attachés à montrer que son axiome définissant la condition de liberté était une formalisation erronée de la notion de droit. La division du travail entre philosophes et économistes intervient d’ailleurs souvent à ce stade : si une large partie du travail des économistes est de dériver logiquement des conclusions sur la base des axiomes, le travail des philosophes va souvent être d’interroger ces axiomes (parfois indépendamment des résultats auxquels ils mènent) en les mettant en perspective avec des réflexions relatives à la morale, au droit ou encore à la justice.
La théorie du choix social peut mener d’une autre manière à s’interroger sur les axiomes que l’on considérait initialement comme raisonnables : lorsque la conjonction des axiomes produit un résultat qui s’écarte de manière sensible du sens commun, de l’intuition voire d’autres résultats théoriques ou empiriques. Ici, nous n’avons pas un résultat d’impossibilité proprement dit, mais une contradiction entre une croyance initiale et un résultat scientifique. Le propre de l’enquête scientifique est précisément de remettre en cause nos croyances initiales pour les faire évoluer, mais certaines d’entre elles semblent tellement fondées qu’il est parfois tentant de rejeter le résultat scientifique. Je vais illustrer ce type de cas en prenant un exemple bien connu en éthique des populations, à savoir la « conclusion répugnante », décrite par Derek Parfit dans son ouvrage Reasons and Persons. Avant de décrire ce qu’est la conclusion répugnante (pour les impatients, suivez le lien ci-dessus), je vais d’abord décrire un raisonnement axiomatique qui va nous faire arriver directement sur elle. Le raisonnement axiomatique en question est abondamment développé par John Broome dans ses deux ouvrages Weighing Goods et Weighing Lives, et on peut en trouver une présentation très synthétique dans le chapitre 4 d’un de ses ouvrages sur le réchauffement climatique.
La question qui nous intéresse est celle de la manière dont on doit agréger le bien-être des individus pour obtenir un bien-être collectif. On ne se pose pas ici la question de savoir ce qui constitue le bien-être en question : libre à chacun d’y mettre ce qu’il veut (la richesse, la santé, l’éducation, l’égalité, etc.). On suppose juste que ce bien-être est bien définit, comparable entre les agents et qu’il peut être quantifié par le biais d’une échelle cardinale. Plus précisément, pour un vecteur (x1, …, xk) d’éléments constituant le bien-être (xi pouvant être le revenu, xj l’état de santé, etc.), on peut définir pour chaque individu i une fonction gi = gi(x1, …, xk) unique pour toute transformation affine strictement croissante.* Puisque l’on suppose que le bien-être des individus est comparable, cela revient à dire que l’on utilise pour tous les agents une échelle ayant la même unité et le même point 0.
Soit un état des affaires sk correspondant à la distribution de bien-être (gik, …, gnk) lorsqu’il y a n personnes (je raisonne pour l’instant à population constante, mais il faudra ensuite permettre à la population de varier). Soit S l’ensemble des états des affaires envisageables. Le but est définir une fonction d’agrégation gk = gk(g1k, …, gnk) permettant de comparer tous les membres de S entre eux de manière à définir quelle est la meilleure alternative. Il est important de noter pour la suite qu’une alternative sj peut être un résultat sûr ou bien une loterie, c’est-à-dire un ensemble de résultats (de distributions) associé à un ensemble de probabilités, chaque résultat ayant une certaine probabilité de se réaliser. Il existe un nombre infini de manière d’agréger le bien-être individuel. L’objectif est de définir une série d’axiomes dont il semble raisonnable de considérer que leur satisfaction doit être effective pour qu’une fonction d’agrégation soit considérée comme acceptable. Un premier axiome qui semble raisonnable est le suivant :
- Principe de Pareto (ou « principe de bien personnel » dans les termes de Broome) : pour deux alternatives A et B, si pour tous les membres i de la population gi(A) ≥ gi(B) et si pour au moins un membre j gj(A) > gj(B), alors g(A) > g(B).
Le principe de Pareto est un principe d’unanimité : si aucun membre de la population ne préfère (ou est mieux en termes de bien-être) B à A, mais qu’au moins un membre préfère A à B, alors A doit être collectivement préféré à B. Le principe de Pareto est évidemment largement accepté en économie et il semble plutôt raisonnable puisqu’il indique que le bien-être collectif doit dépendre du bien-être des individus. Il faut quand même remarquer qu’un certain nombre de fonctions d’agrégation souvent discutées en philosophie morale et politique ne satisfont pas à ce critère. C’est par exemple le cas de toutes les fonctions lexicographiques, telles que le maximin par exemple.**
Un second axiome, qui découle du premier, est le suivant :
- Axiome de séparabilité entre les personnes : pour deux alternatives A et B et deux personnes i et j, les comparaisons entre gi(A) et gi(B) d’une part, et entre gj(A) et gj(B) d’autre part, sont indépendantes l’une de l’autre.
Le principe de Pareto implique l’axiome de séparabilité entre les personnes puisqu’il implique que la valeur relative des alternatives peut être établie personne par personne. Par conséquent, la valeur en termes de bien-être d’une alternative pour une personne est indépendante de la valeur de cette alternative (ou d’une autre) pour une autre personne. Cela parait raisonnable, notamment parce que cette condition semble respecter l’autonomie et la souveraineté des personnes. On peut toutefois arguer que cela conduit à exclure la notion d’inégalité puisque l’on s’interdit de faire dépendre le bien-être général du pattern caractérisant la distribution du bien-être individuel. Il y a toutefois une solution pour remédier à ce problème : introduire les inégalités comme un input dans la fonction de bien-être individuel de chaque agent.
On arrive au troisième axiome, proche du précédent mais qui est toutefois indépendant :
- Axiome de séparabilité entre les états de nature : pour toutes loteries A et B, et pour tout états de nature e1 et e2, les comparaisons entre g(A ; e1) et g(B ; e1) d’une part, et entre g(A ; e2) et gj(B ; e2) d’autre part, sont indépendantes l’une de l’autre.
Il s’agit de l’axiome d’indépendance forte (ou « sure-thing principle ») de la théorie de l’utilité espérée. Il indique que la valeur de chacun des résultats d’une loterie est indépendante de la valeur des autres résultats. Par hypothèse, on a supposé que cet axiome était vérifié pour les agents (puisque gi est une fonction d’utilité cardinale) et on l’étend aussi à la fonction de bien-être social g. La combinaison des deux axiomes de séparabilité nous permet de déduire la condition de séparabilité croisée, qui elle-même implique que g est additivement séparable. Autrement dit, on sait déjà que g aura une forme additive. Il nous reste un dernier axiome :
- Impartialité : l’identité des personnes n’entre pas en compte dans la fonction g. Plus formellement, pour toute permutation entre deux individus i et j dans le vecteur (g1k, …, gnk), la valeur de g reste inchangée.
La condition d’impartialité signifie qu’une unité de bien-être de n’importe quel membre de la population a la même que celle de n’importe quel autre membre de la population. Cela s’applique également sur le plan intertemporel : le bien-être d’un agent qui vit aujourd’hui compte autant que le bien-être d’un agent qui vivra dans 10 ans ou dans 100 ans.*** Même si ce point peut faire débat, il y a en effet de solides arguments contre l’idée d’escompter, même faiblement, le bien-être des générations futures.
La combinaison de ces 4 axiomes nous permet d’obtenir une fonction de bien-être social utilitariste :
g = ∑igi
Il faut toutefois adapter cette formule pour prendre en compte le fait que la population peut varier en taille. Notamment, de nouveaux individus peuvent voir le jour, d’autres disparaitre. Enfin, certains individus potentiels ne naîtront jamais. Notons gi = Ω le bien-être d’un individu qui ne verra jamais le jour. Par ailleurs, est-ce que la naissance d’un individu supplémentaire implique nécessairement l’augmentation du bien-être total ? Pour certains philosophes et économistes, une nouvelle vie est nécessairement neutre du point de vue de g. On peut avoir une position plus nuancée et considérer qu’une vie supplémentaire ne contribue au bien-être général que si elle « vaut d’être vécu », autrement dit si elle apporte un bien-être supérieur à une certaine valeur seuil a. Pour inclure cet élément dans g, on peut procéder de la manière suivante : soit f une transformation affine (et unique pour tous les individus) de gi telle que f(gi) = bgi – ba. La valeur de b n’a aucune importance et on peut donc poser que b = 1. On obtient donc f = gi – a. On obtient alors
g = ∑ (i׀gi ≠ Ω) (gi – a)
Cette expression, qui indique que le bien-être total correspond à la somme de la différence entre le bien-être individuel et le seuil de bien-être minimal, correspond à la formule de « l’utilitarisme de niveau critique » des économistes Charles Blackorby et David Donaldson.
On peut facilement deviner qu’en dépit de l’apparent caractère raisonnable de ses axiomes, l’utilitarisme de niveau critique » peut mener à un certain nombre de conclusion discutable. Cet utilitarisme est ainsi victime de la « conclusion répugnante » de Parfit. L’idée est assez simple. Prenez les trois distributions suivantes (la hauteur représente le bien-être moyen, la largeur le nombre d’individus) :
La comparaison directe entre A et B peut s’avérer délicate, sauf à être d’emblée convaincu par l’utilitarisme. Comparons donc d’abord A et A+ : dans la distribution A+, on retrouve les mêmes individus (ou d’autres individus mais avec le même niveau de bien-être) que dans la population A, avec donc le même niveau de bien-être, plus d’autres individus ayant un niveau de vie tout à fait convenable, et en tout cas largement supérieur à notre seuil a. La plupart des théories morales, et pas seulement l’utilitarisme, considéreraient que A+ est meilleure que A. Si l’on compare A+ à B, on voit que la taille de la population est la même, mais que tous les individus ont le même niveau de vie. Comme ceux qui étaient défavorisés dans A+ ont gagné plus que n’ont perdu ceux qui étaient favorisés, notre formule utilitariste nous amène à conclure que B est meilleur que A+.**** Par ailleurs, si l’on accepte l’hypothèse que la relation « est meilleur que » est transitive (et, pour ce qui concerne la fonction g, elle l’est nécessairement), on doit conclure que B est meilleur que A. Par le même raisonnement, on peut construire une population B+ en rajoutant des individus ayant un niveau de bien-être inférieur à ceux de B, telle que B+ est meilleur que B, puis une population C avec autant d’individus mais où les moins favorisés dans B+ gagnent légèrement plus que ne perdent ceux qui étaient favorisés dans B+. On conclura alors que C est meilleur que B et est donc meilleur que A. On voit clairement le problème : on peut procéder ainsi jusqu’à atteindre une population Z composée de dizaines de milliards d’individus ayant un bien-être tout juste supérieur au seuil critique a. C’est la conclusion que Parfit juge « répugnante ».
Je n’essaierais pas ici de discuter le raisonnement et les hypothèses qui mènent à cette conclusion, en particulier l’hypothèse que la relation « est meilleure que » est transitive. Ce qui est intéressant, c’est que l’acceptation d’axiomes qui, individuellement, semblent en tout point raisonnables à de nombreuses personnes, nous conduit à une conclusion que les mêmes personnes trouvent « répugnante ». On peut voir cela comme une forme d’effet émergent et c’est ce qui fait tout l’intérêt du raisonnement axiomatique. Dans le cas d’espèce, certains auteurs gardent confiance dans leurs axiomes. C’est le cas de John Broome qui considère que la conclusion répugnante ne l’est pas et que notre jugement est biaisé par notre incapacité à traiter intuitivement les problèmes impliquant des nombres très grands. Par ailleurs, Broome fait remarquer que la conclusion répugnante le devient beaucoup moins si on fixe le seuil critique a à un niveau suffisamment élevé.*****
L’autre solution consiste à abandonner un ou plusieurs axiomes présentés ci-dessus. En plus de ceux que j’ai explicitement présentés, on peut également rejeter les axiomes de transitivité et/ou de continuité pour la fonction g. Dans tous les cas, cela revient à rejeter la pertinence de théorie de l’utilité espérée dans le domaine de l’éthique des populations.
Notes :
* Cela signifie que pour toute fonction h telle que hi = a + bgi, avec b > 0, hi(x) ≥ hi(y) si et seulement si gi(x) ≥ gi(y).
** Broome fait remarquer que le principe de Pareto ne pose aucun problème en situation de certitude mais qu’il peut mener à une contradiction en situation d’incertitude si les agents n’ont pas les mêmes probabilités subjectives. Pour la suite, on simplifiera les choses en supposant que les agents ont un « prior » commun, c’est-à-dire les mêmes croyances.
*** Pour les économistes, cela revient à dire que le taux d’actualisation est nul.
**** Notez qu’un égalitariste pourrait tout à fait parvenir à la même conclusion, mais pour d’autres raisons évidemment.
***** Broome note que par ailleurs il y a une conclusion répugnante « négative » : pour une population d’une certaine taille avec des personnes vivant tout juste sous le seuil critique a, il y aura toujours une population plus petite avec des personnes vivant un peu plus sous le seuil a qui sera préférable. Il faut donc ne pas fixer le seuil a à un niveau trop élevé si on veut éviter cette version négative.