J’ai commencé la lecture dernièrement de Rethinking the Good, du philosophe Larry Temkin. L’ouvrage, paru en 2012, reprend et développe 25 ans de réflexion de l’auteur sur la nature du raisonnement moral et sur un certain nombre de paradoxes qui émergent dès lors que l’on s’interroge sur la manière appropriée d’agréger le bien-être des membres d’une population. On peut voir cet ouvrage comme une longue réponse à la partie 4 de Reasons and Persons de Derek Parfit, paru lui en 1984. L’article de Temkin « Intransitivity and the Mere Addition Paradox », publié en 1987, est une excellente introduction aux thèmes développés dans son livre. Je reviendrai dessus dans un prochain billet. Ici, je vais revenir sur la discussion que Temkin propose dans son chapitre 8 de la théorie de l’utilité espérée, et plus particulièrement sur la manière dont celle-ci peut s’accommoder de l’incomplétude des préférences (ou de toute autre relation qui ordonne les états du monde).
La théorie de l’utilité espérée (TUE) repose, entre autres, sur deux axiomes essentiels concernant la relation ordonnant les états du monde : la complétude et la transitivité. Soit R la relation en question. R peut être une relation de préférence, comme c’est le cas en économie, ou de manière plus générale une relation de bien-être ou de betterness. Ecrire xRy signifie tout simplement que x est « au moins aussi préférable/bien/… » que y. J’ai déjà expliqué ce qu’implique la transitivité : si pour trois alternatives ou états du monde x, y et z, xRy et yRz, alors on doit avoir xRz. Pour beaucoup d’économistes, la transitivité des préférences est constitutive de la notion de rationalité. La complétude indique que, pour toute paire d’alternatives x et y, une relation de préférence ou d’indifférence doit nécessairement s’appliquer. Si je note P et I pour « strictement préféré à/strictement meilleur que » et « équivalent à/aussi bon que » respectivement, alors la complétude implique que l’on a soit xPy, yPx ou xIy. Autrement dit, la TUE repose sur l’hypothèse que tous les états du monde ou toutes les alternatives doivent être comparables, ce qui implique qu’elles puissent être toutes ordonnées en fonction d’une seule et même relation. Plus que la transitivité, la complétude parait pour le moins discutable. Que ce soit au niveau individuel lorsqu’il de préférences personnelles, ou au niveau collectif, lorsqu’il s’agit de préférences collectives ou de jugements moraux, il semble qu’il y ait plein de situations où il est impossible d’établir une relation comparative bien définie. Il se peut tout à fait que deux alternatives soient incomparables, soit parce qu’elles sont incommensurables, soit parce que leur valeur respective est fondamentalement vague.
Il a été suggéré que l’incomplétude n’est pas un problème radical. Par exemple, il existe des versions de la théorie du consommateur ou de la théorie de l’équilibre général qui se passent de l’axiome de complétude. De manière générale, comme l’explique très bien Amartya Sen dans cet article, l’incomplétude n’empêche pas la maximisation. Prenez trois alternatives x, y et z et supposez qu’un agent a les préférences suivantes les concernant :
xPy
zPy
¬ xRz
¬ zRx
Notre agent préfère strictement x et z à y. En revanche, il ne préfère pas x à z, ni l’inverse, et n’est pas non plus indifférent entre les deux alternatives. On dira que « x n’est pas moins préférable à/bon que z », ce que je vais noter par x~z. Il est tout à fait possible de caractériser le choix effectif de notre agent en termes de maximisation (d’une fonction d’utilité) dès lors que l’on admet qu’un agent maximise s’il choisit une alternative qui n’est pas moins bonne qu’aucune autre. Comme x et z ne sont pas moins bonnes qu’aucune autre des autres alternatives, le choix de x ou de z peut être décrit par le biais d’une maximisation.
Temkin montre toutefois que cette approche ouvre la voie à un certain nombre de paradoxes. Il faut d’abord s’interroger sur la nature de la relation « ~ ». Notamment, cette relation est-elle transitive ? A priori, pas nécessairement. Imaginez par exemple que deux carrières s’ouvrent à vous, une carrière académique A et une carrière juridique J. Vous êtes incapables de déterminer laquelle est la meilleure pour vous. Ce n’est pas de l’indifférence (vous n’êtes pas prêt à faire reposer votre décision sur un lancer de pièce), ni un problème d’information (on suppose que vous savez précisément à quoi ressembleront vos deux carrières). Le problème, c’est que les valeurs respectives de A et J sont incommensurables et/ou vagues. Donc, nous avons A~J. Imaginez que l’on vous propose une troisième alternative J* qui consiste en fait dans l’alternative J plus 10000$ (on peut supposer que c’est la prime d’accueil versée par le cabinet d’avocats qui veut vous embaucher). Il semble raisonnable de penser que J* est meilleur que J, donc J*RJ. Mais on peut aussi penser que cela ne suffit pas à lever l’indécidabilité entre la carrière juridique et la carrière académique. On peut donc tout à fait avoir J*~A. Par conséquent, nous avons A~J, A~J* mais J*RJ. La relation « ~ » n’est donc pas transitive, sans que cela paraisse choquant sur le plan intuitif. Au contraire, la non transitivité de cette relation est ce qui la distingue de la relation d’indifférence, qui elle est supposée être transitive.
On arrive maintenant au nœud du problème. Selon Temkin, la TUE semble impliquer les deux principes suivants :
Principe d’équivalence : si pour deux loteries A et B, les mêmes résultats xi peuvent se produire avec les mêmes probabilités pi, alors la valeur V de ces deux loteries doit être la même, i.e. V(A) = V(B).
Principe de comparaison état par état : soit deux loteries A et B qui définissent chacune respectivement un résultat xi et yi pour chaque état de nature si. Si, pour chaque état de nature possible, les résultats xi et yi sont comparables selon une seule et même relation R (ou P, ou I ou ~), alors cette relation s’applique aux deux loteries dans leur ensemble.
Le premier principe semble indiscutable selon les termes de la TUE : si je vous propose de choisir entre deux tirages, vous garantissant tous les deux un gain x avec une probabilité de ½ et un gain de 0 ave une probabilité de ½, alors les deux tirages doivent être équivalents pour vous. Le second principe est tout aussi important puisqu’il correspond à l’axiome d’indépendance forte (ou « sure-thing principle » chez Savage) qui est constitutif de la TUE. C’est cet axiome qui donne la forme additive aux fonctions d’utilité dérivée de la TUE. Il pose que les états de nature sont indépendants les uns des autres, de sorte que la valeur u(xi) d’un résultat xi dans un état si est indépendante de ce qui se passe dans les autres états sj. Ce que nous dit le principe de comparaison, c’est que si les résultats xi d’une loterie A sont meilleurs que les résultats yi d’une loterie B pour tous les états de nature si, alors A est meilleure que B. Le même raisonnement s’applique pour la relation d’indifférence et, a priori, pour la relation ~.
Le principe de comparaison parait indiscutable car il semble dérivé d’un autre principe important en théorie de la décision, le principe de domination. Si vous savez qu’une alternative vous donnera un meilleur résultat qu’une autre quelque soit l’état de nature qui se réalise, alors il est rationnel de préférer cette alternative. L’idée étant qu’une fois qu’un état de nature s’est réalisé, le résultat d’une alternative ne peut dépendre que de cet état et pas d’un autre. Cependant, il semble que le principe d’équivalence et le principe de comparaison sont incompatibles.
Prenez deux loteries M et N. Toutes deux reposent sur le lancer d’une pièce. M vous offre une carrière académique A si la pièce tombe sur pile et une carrière juridique J si la pièce tombe sur face. N vous offre l’inverse : J si pile, A si face. Il est clair que selon le principe d’équivalence, vous devez être indifférent entre M et N. Mais prenez le principe de comparaison et notons s1 pour le cas où la pièce tombe sur pile et s2 pour le cas où elle tombe sur face. Clairement, on a alors M(s1) = A ~ J = N(s1) et M(s2) = J ~ A = N(s2). Autrement dit, selon le principe de comparaison, M et N devraient être incomparables ! Clairement, dans ce cas d’espèce, l’intuition semble être du côté du principe d’équivalence. Supposons que l’on modifie le principe de comparaison de manière à ce qu’il ne s’applique que dans les cas où le principe d’équivalence ne s’applique pas. Temkin montre que cela ne résout pas le problème.
En effet, la TUE repose également sur un troisième principe, le principe de Pareto. Le principe de Pareto nous dit que pour deux loteries A et B, au moins un résultat xi de A est meilleur qu’un résultat yi de B et que tous les autres résultats xj de A sont aussi bons ou meilleurs que les résultats yj de B, alors V(A) > V(B). Ce principe parait indiscutable, mais là encore il parait incompatible ave le principe d’équivalence et le principe de comparaison modifié. Reprenons les deux loteries M et N et ajoutons en une troisième, O. La loterie O offre A si la pièce tombe sur pile et J* si la pièce tombe sur face. Pour faciliter le raisonnement, on peut résumer les trois loteries dans le tableau suivant :
s1 |
s2 |
|
M |
A |
J |
N |
J |
A |
O |
A |
J* |
Comparons M et O. Clairement, si la pièce tombe sur pile, les deux loteries sont équivalentes. En revanche, si la pièce tombe sur face, on sait que J*PJ, et le principe de Pareto implique donc que V(O) > V(M). Par ailleurs, au-dessus, nous avons accepté par hypothèse que V(M) = V(N). Cela semble impliquer, par le principe de transitivité, que V(O) > V(N). Or, si on compare directement N et O, on voit que de par les hypothèses posées au-dessus, les deux loteries sont incomparables dans les deux états de nature. Par conséquent, V(N)~V(O) et nous avons donc une contradiction !
Ce que cette discussion montre, c’est que dès lors que l’on admet la possibilité d’une incomplétude dans la relation de préférence, la TUE débouche sur des contradictions. En clair, il semble que l’incomplétude, le principe de transitivité, le principe d’équivalence, le principe de comparaison modifié et le principe de Pareto sont incompatibles. Temkin ne propose pas de solution et il n’est pas évident de voir comment on peut résoudre ce qui s’apparente à un « théorème d’impossibilité ». Le principe de Pareto et le principe de comparaison sont constitutifs de la TUE, tout comme le principe de transitivité. Le principe d’équivalence parait impossible à rejeter. La seule solution semble de rejeter l’incomplétude, par exemple en transformant la relation ~ en simple relation d’indifférence. Mais sur un plan axiologique et normatif, on ne voit pas trop comment justifier une telle approche. Comme le suggère Hilary Putnam dans son ouvrage The Collapse of the Fact/Value Dichotomy, il semble que le problème de l’incomplétude implique de la part du théoricien un jugement de valeur, ce qui est contradictoire avec l’objectif même de la TUE et des différentes théories de la décision, qui est de réduire la rationalité à des propriétés formelles.
L’intuition semble clairement rejeter le principe de comparaison. Est-ce qu’il ne faudrait pas invoquer un principe plus faible du type : s’il existe au moins une loterie A’ correspondant à une permutation des résultats de A telle que la relation R vaut entre chaques résultats de A’ et B, et si R est transitive, alors R vaut entre A et B ? Ca semble fonctionner quand les états de nature sont équiprobables (on peut montrer que V(O) > V(N)), il faudrait voir s’il est possible de généraliser aux autres cas…
En fait c’est surtout que je ne vois pas pourquoi le principe de comparaison devrait s’étendre aux relations non transitives. Il s’agit d’ordonner les loteries donc il devrait se restreindre aux relations d’ordre (et par extension d’équivalence), et l’incommensurabilité ne devrait valoir entre plusieurs loteries que quand il est impossible de les ordonner. En tout cas ça ne me parait pas être un problème insurmontable…
Je suis d’accord avec Quen_tin. Pour la comparaison d’alternatives aléatoires, la propriété presque sûre n’est pas toujours nécessaire. Il suffit de comparer les fonctions de répartitions. Voilà pourquoi les mesures de risque utilisent souvent les caractéristiques probabilistes des variables et non les variables elles-même.
D’ailleurs c’est bien pour cela qu’on évalue l’utilité espérée, et non chacune des utilités possibles pour chaque état du monde futur.
Pingback: Somewhere else, part 69 | Freakonometrics
Merci pour vos commentaires. Effectivement, il me semble que l’on doit pouvoir se passer du principe de comparaison « fort » et le remplacer par une variante où l’on peut permuter les résultats d’une loterie de manière à retrouver la transitivité. Du reste, cela revient au principe d’équivalence. Par exemple, la loterie N’ = (A ; J) est équivalente à la loterie N = (J ; A) et clairement on a V(O) > V(N’).
Temkin apporte une sorte d’argument métaphysique en faveur du principe de comparaison qui consiste en gros dans l’affirmation suivante : si je sais aujourd’hui que dans le futur j’aurai une information justifiant que je préfère x à y, alors je sais aujourd’hui que je dois préférer x à y. L’information en question consiste dans la réalisation de l’un des états de nature. Cela justifierait que l’on puisse étudier les résultats d’une loterie état de nature par état de nature. Je ne suis pas encore trop au clair là-dessus mais mon intuition me dit que c’est juste un problème de formalisation du problème de décision.