Rationalité et théorie de l’utilité espérée

Le concept de rationalité en économie a toujours eu un statut ambigu. La rationalité peut ainsi s’entendre comme un concept descriptif, l’énoncé « X est rationnel » étant alors un jugement de fait ; ou alors peut s’entendre comme un concept prescriptif, la rationalité définissant alors un certain de nombre de propriétés auquel un comportement doit se conformer. En économie, la rationalité est plus particulièrement associée à la théorie de l’utilité ordinale, et pour les décisions en situation de risque et d’incertitude, à la théorie de l’utilité espérée (TUE). Telle que formalisée par von Neumann et Morgenstern ainsi que par Leonard Savage (il existe d’autres formalisations qui ne reposent pas sur le même ensemble d’axiomes), la TUE repose sur cinq axiomes : la réflexivité, la complétude, la transitivité, la continuité, l’indépendance. Les trois premiers axiomes permettent de s’assurer que l’ensemble de préférences associé à un agent forme un ordre. L’axiome de continuité est une condition technique qui permet de représenter cet ordre de préférences par une fonction d’utilité. Enfin, l’axiome d’indépendance (parfois appelé « sure-thing principle » à la suite de Savage) est une propriété fondamentale qui garantie que l’on peut représenter les préférences de l’agent par une fonction d’utilité correspondant à la somme pondérée des utilités associées à chaque état du monde. C’est cet axiome en particulier qui va m’intéresser dans ce billet.

On sait que sur le plan descriptif, les axiomes de la TUE sont douteux : dans de nombreux cas, le comportement des agents ne reflètent pas des préférences correspondant à ces axiomes. Qu’en est-il sur le plan prescriptif/normatif ? Des agents rationnels doivent-ils ou devraient-ils se conformer aux axiomes de la TUE ? Autrement dit, ces axiomes forment-ils l’essence de la rationalité ? Cette question est essentielle, notamment eu égard aux débats actuels autour du paternalisme et de l’économie comportementale normative, cette dernière prenant implicitement la TUE comme un point de référence normatif (voir mon dernier working paper sur le sujet). La question n’est donc pas « les agents se conforment-ils à la TUE ? » mais plutôt « devraient-ils s’y conformer ? ». Je vais surtout m’intéresser à l’axiome d’indépendance mais on peut auparavant rapidement se poser la question pour l’axiome de transitivité, plus connu et plus simple à comprendre. L’axiome de transitivité pose simplement que si un agent préfère l’alternative x à l’alternative y, et l’alternative y à z, alors il doit rationnellement préférer x à z. La transitivité garantit notamment que les préférences d’un agent ne sont pas cycliques. Cet axiome est-il raisonnable comme définition de la rationalité ? Prenons un exemple similaire à celui proposé par Amartya Sen. A la table d’un dîner auquel vous êtes invité est posé un panier de fruits. Il reste exactement deux fruits dans ce panier : une pomme et une banane. Comme vous préférez strictement les pommes aux bananes, vous choisissez de prendre la pomme. Prenons maintenant la même situation mais avec une légère différence : il n’y a plus qu’une pomme et dans le panier. Cette fois-ci, parce que vous ne voulez pas prendre le dernier fruit dans le panier, vous choisissez de ne rien prendre. Formalisons les choses de la manière suivante. Notons b le fait de prendre la banane, p le fait de prendre la pomme et n le fait de ne rien prendre. Notons S l’ensemble des alternatives possibles et C(S) le ou les choix effectués :

1)      C(p, b, n) = p

2)      C(p, n) = n

Ces deux choix violent nécessairement l’axiome de transitivité, puisque le premier choix révèle une préférence pour p par rapport à n, tandis que le second révèle une préférence contraire. Or, l’axiome de transitivité garantit précisément qu’une telle contradiction ne peut pas se produire. Cependant, on peut maintenir que ces choix respectent l’axiome de transitivité de la manière suivante : dans le premier cas, une fois un des deux fruits pris, il en restera un dernier pour les autres convives ; dans le second cas, si je prends la pomme, il ne reste plus de fruit. Mon choix dans le second scénario est dicté par une norme sociale qui postule qu’il est impoli de prendre le dernier item dans un plat. Il devient alors possible de redéfinir l’espace des alternatives ainsi que la relation de préférences le régissant. Notons ainsi p* et b* le fait de prendre un fruit lorsqu’il reste au moins deux fruits dans le panier et p lorsqu’il s’agit du dernier fruit. Nous obtenons alors

1)      C(p*, b*, n) = p*

2)      C(p, n) = n

Etant donné que p* et p sont deux alternatives différentes, ces deux choix ne révèlent plus aucune incohérence. L’ordre de préférence révélé est le suivant : p* > n > p (ainsi que p* > b*). L’axiome de transitivité serait donc parfaitement raisonnable comme critère de rationalité, dès lors que l’on utilise la bonne description du problème de décision.

Intéressons-nous maintenant à l’axiome d’indépendance, lequel s’applique dans le cadre de choix en situations de risque et d’incertitude. Cet axiome pose de manière générale que les préférences d’un agent correspondant à un état du monde donné sont indépendantes de ses préférences en vigueur dans les autres états du monde. Cela implique alors que les résultats possibles dans un état du monde donné peuvent être évalués de manière indépendante aux résultats possibles dans d’autres états du monde. Par exemple, votre préférence pour les glaces lorsqu’il fait chaud doit être indépendante de votre préférence pour le chocolat chaud lorsqu’il fait froid : le fait qu’il y ait incertitude sur le temps ne doit pas modifier votre préférence pour les glaces dans le cas où il ferait chaud (et pour le chocolat chaud dans le cas où il ferait froid). Sur le plan empirique, l’axiome d’indépendance a été mis à mal par le célèbre paradoxe d’Allais. Plutôt que de revenir sur ce résultat expérimental très connu, je vais prendre un autre exemple que l’on doit à Peter Diamond et qui à l’intérêt (comme pour l’exemple ci-dessus pour l’axiome de transitivité) d’introduire une dimension éthique. L’exemple de Diamond ne questionne pas l’exactitude empirique de l’axiome d’indépendance, mais sa pertinence formelle pour définir la rationalité. Soit deux malades x et y qui ont besoin d’une transplantation de rein dans un délai très court. Les deux malades sont identiques au niveau de toutes les variables pertinentes : ils ont quasiment le même âge, ont les mêmes chances de survie en cas de transplantation, etc. Le médecin n’a à sa disposition qu’un seul rein et on suppose qu’il doit choisir entre les deux alternatives suivantes : l’alternative A est une « loterie » qui confère une probabilité de ½ à chaque patient de recevoir le rein en fonction du résultat d’un lancer de pièce ; l’alternative B donne le rein à au patient x quelque soit le résultat du lancer de pièce. Diamond considère que, intuitivement mais aussi rationnellement, l’alternative A doit être préférée à l’alternative B. Cependant, l’axiome d’indépendance implique qu’un agent rationnel doit être indifférent entre les deux alternatives.

Généralisons l’exemple de Diamond de la manière suivante. Soit deux agents à qui il faut allouer un bien indivisible. L’ensemble des résultats « purs » possibles est constitué de deux éléments où l’un des agents reçoit le bien et l’autre rien. Notons ces deux résultats r = (1 ; 0) et s = (0 ; 1). On postule que ces deux résultats sont équivalents, de sorte qu’un agent rationnel est indifférent entre les deux. L’alternative A correspond à la loterie suivante A = [r, ½ ; s, ½] tandis que l’alternative B peut s’analyser comme une « loterie » dégénérée B = [r, ½ ; r, ½]. L’axiome d’indépendance implique que l’on peut étudier les résultats dans les différents états du monde de manière séparée. Dans le premier état du monde (par exemple, celui où la pièce tombe sur pile), le résultat r se produit quelque soit l’alternative choisit. Dans le second état du monde (état du monde « face »), s se produit si A est choisit, r si B est choisit. Dans l’état du monde « pile », A et B sont indiscutablement équivalents. En ce qui concerne l’état du monde face, étant donné que l’on suppose une indifférence entre r et s, A et B sont également équivalents. Conclusion : un agent rationnel doit être indifférent entre A et B.

Cette conclusion va à l’encontre du sens commun car une différence importante entre A et B porte sur l’équité relative des deux alternatives. L’alternative A est équitable car elle donne la même chance aux deux malades de recevoir le bien, au contraire de l’alternative B. Cet aspect se généralise clairement à tous les problèmes d’équité, à un point tel que pour Diamond, l’axiome d’indépendance est inopérant en matière choix social. Peut-on sauver pour autant l’axiome d’indépendance, de la même manière que l’on a « sauvé » l’axiome de transitivité, c’est à dire en redéfinissant l’ensemble des résultats ? John Broome propose de reformuler le problème ainsi : on peut enrichir la description des résultats dans l’alternative B en écrivant rB = (1 ; 0 ; y est traité de manière inéquitable).  On peut alors postuler que si r et s sont strictement équivalents, en revanche on doit rationnellement préférer r et s à rB. Dans ce cas, la conclusion du paragraphe précédent ne s’applique plus : tout en respectant l’axiome d’indépendance, il devient tout à fait rationnel de préférer l’alternative A = [r, ½ ; s, ½] à l’alternative B = [rB, ½ ; rB, ½].

Comme dans le cas de la transitivité, la solution a consisté à affiner l’espace des résultats en distinguant des résultats qui initialement étaient non discriminés dans la description du problème de décision. Cette discrimination est opérée à partir de ce que Broome appelle un principe d’individuation par justification. Le problème évident de ce principe est qu’il peut sembler ad hoc puisqu’il sera toujours possible de préserver les axiomes d’indépendance et de transitivité par une redéfinition du problème de décision. Mais dans ce cas, ces axiomes sont creux et n’ont aucune utilité sur le plan normatif. Broome indique donc que le principe d’individuation doit être borné par un autre principe, le principe d’indifférence rationnelle. Ce principe pose qu’un agent rationnel doit être indifférent entre deux alternatives x et y s’il n’existe aucune raison permettant rationnellement de distinguer les deux alternatives. Dans les deux exemples discutés ci-dessus, il semble bien qu’il y ait une raison valable et raisonnable justifiant de distinguer les alternatives posant problème. Si l’on accepte cette approche, il semble alors que l’on arrive à réconcilier les deux axiomes de transitivité et d’indifférence avec une acception relativement intuitive du rationnel et du raisonnable. Mais notez que cela à un certain coût, à deux niveaux.

Tout d’abord, il faut remarquer que dans bien des cas, la justification permettant la distinction de différentes alternatives trouve son origine non pas dans un principe de rationalité auto-suffisant, mais en faisant référence à des contraintes extérieurs à l’agent (normes sociales, principes de justice). On retrouve ici un des apports majeurs des travaux d’Amartya Sen sur le concept de rationalité (que je discute dans ce working paper mais en m’intéressant aux axiomes de complétude et de transitivité) : la rationalité d’un comportement ne peut pas se définir indépendamment d’ « objets sociaux » qui structurent les choix individuels. Par ailleurs, et de manière peut-être encore plus significative, cette stratégie de réinterprétation de la TUE va à l’encontre de l’idée (acceptée par la plupart des économistes) que cette dernière n’est qu’une théorie formelle de la rationalité. Une théorie formelle de la rationalité n’indique pas quels sont les comportements rationnels, mais impose seulement une structure à ces comportements. Or, le principe d’indifférence rationnelle proposée par Broome repose nécessairement sur un critère substantif indiquant qu’en l’absence de raison valable (raison qui doit être précisée) pour distinguer deux alternatives, ces dernières doivent être considérées comme identiques. C’est finalement une remise en cause assez significative de l’interprétation standard de l’un des outils majeurs de la théorie économique.

Advertisements

3 Commentaires

Classé dans Non classé

3 réponses à “Rationalité et théorie de l’utilité espérée

  1. Je recommande cet article qui critique aussi l’usage des probabilités subjectives (comme la TUE), autant d’un point de vue psychologique que d’un point de vue normatif :
    Subjective probability Criticisms, reflections, and problems – Henry Kyburg
    http://fr.scribd.com/doc/145238405/

  2. Kart

    Vous devriez lire A theory of fairness… de Fleurbaey et Maniquet (si ce n’est pas déjà fait). Ils axiomatisent leur théorie du choix social à partir de présupposés normatifs les plus contraignants possibles, et démontrent à partir de quel moment ceux-ci deviennent incompatibles entre eux (ou au contraire, ce qui est plus intéressant, restent compatibles). L’un des axiomes étudiés est précisément l’anonymité au chapitre 4. L’anonymité demande que, si A a des préférences Ra et une dotation Xa et b Rb et Xb, alors la situation A Rb Xb et B Ra Xa est équivalente. Conjuguée au « transfert entre égal » (si deux personnes ont les mêmes préférences, mais des dotations différentes, alors réduire l’inégalité entre elles par un transfert est une bonne chose), on a bien, normativement, une préférence pour le tirage au sort (dotation équivalente, en probabilité, de guérison) par rapport au soin certain pour l’un des patients.

  3. Titan

    Ce post est excellent a tous les niveaux.
    Il réaffirme l’importance de choix éthiques dans  » l’intuition rationnelle » qui ne sont pas poses comme des normes, mais comme des hypothèses nécessaires a la raison, puisque les résultats sont rationnels.
    Ainsi, on peut s’interroger meme sur le pouvoir rationnel de l’éthique comme le fait A.Sen , au lieu de considérer que ce choix pose un probleme lie a l’indépendance rationnelle, et a la subjectivité de choix éthiques. Au final, conclure aussi sur les raisons objectives de nos choix, autrement que par une rationalité de type procédurale.
    Bravo!
    PS: Je comprend le désaccord avec la TUE comme un conflit entre deux branches: la « philosophie économique » et « l’économie axiomatique ». Les uns ne voulant pas partager les principes, et thèses des autres.
    Mais rationnellement, on peut comme vous le faites, reconnaitre leur interdépendance, a partir d’un tronc commun qui est la rationnalite.

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s