Dans un article qui date de 1985, « Why be Consistent » (Economica), Robert Sugden s’intéresse à la question de savoir si un comportement rationnel est forcément cohérent au sens où l’entend la théorie économique. La cohérence peut évidemment renvoyer à l’axiome de transitivité des choix et des préférences dont j’ai parlé ici plusieurs fois, mais aussi à des conditions plus faibles s’appliquant aux préférences et/ou aux patterns de choix. Une des conditions les plus souvent citées dans la littérature est la condition de Chernoff qui pose une contrainte sur les choix des agents lorsque l’espace des alternatives faisables se restreint. Formellement,
pour toute alternative x et pour tout ensemble d’alternatives faisables S1, S2 avec x ε S1 et S1 (sous-ensemble strict de) S2, la proposition suivante doit être vérifiée : si x ε C(S2), alors x ε C(S1).
En français, la condition de Chernoff impose que si un individu opte pour l’alternative x lorsqu’un ensemble d’alternatives S2 est disponible, alors il doit également opter pour x si l’ensemble d’alternatives à sa disposition est un strict sous-ensemble de S2. Cette condition semble raisonnable en apparence et Amartya Sen par exemple la considère comme une contrainte basique pour tout choix rationnel dans son classique Collective Choice and Social Welfare. Dans son article, Sugden prend cependant pour base de la discussion une condition encore plus faible qu’il nomme « condition de cohérence minimale » :
Si x = C(x, y), alors pour tous les ensembles possibles S = (x, y, …), y ≠ C(S).
En mots, si x est choisi lorsque y est disponible, alors y ne doit jamais être choisi lorsque x est disponible. Sugden s’emploie à montrer que cette condition pourtant très faible rentre en contradiction avec une conception intuitive et raisonnable de la rationalité, aussi bien au niveau du choix individuel qu’au niveau du choix social. Dans ce billet, je vais uniquement m’intéresser à l’argument de Sugden pour ce qui concerne les choix individuels. Sa discussion concernant le choix social est cependant très intéressante et mériterait également un billet.
Le but de Sugden est de montrer qu’un agent rationnel peut raisonnablement faire des choix qui l’amènent à violer la condition de cohérence minimale évoquée plus haut, et a fortiori la condition de Chernoff. La démonstration de Sugden s’appuie sur la « regret theory » qu’il a élaboré avec Graham Loomes. Sans rentrer dans les détails formels (je renvoie à l’article les personnes intéressées), la regret theory est basée sur le constat qu’un agent, lorsqu’il fait un choix à partir d’un ensemble S d’alternatives en ne connaissant pas avec certitude l’état de la nature (choix en situation de risque ou d’incertitude), va obtenir un résultat qui n’est pas nécessairement le meilleur. Dans ce cas, il peut ressentir un sentiment de regret face à l’opportunité qu’il a laissé passer. A l’inverse, si son choix se révèle être rétrospectivement le meilleur (ou en tout cas meilleur qu’un ensemble d’autres alternatives), il ressentira un sentiment de satisfaction. Ces deux sentiments (regret et satisfaction) sont intrinsèquement valorisables et entrent de ce point de vue dans une fonction d’utilité Vi,jk définit comme l’utilité intrinsèque associée au résultat obtenu lorsque l’alternative Ai est choisi dans un état j, à laquelle vient s’ajouter (ou se soustraire) l’utilité associée aux sentiments de regret et de satisfaction lorsque Ai est choisi alors que l’alternative Ak était disponible. L’utilité espérée est obtenue en additionnant les fonctions Vi,jk pour chaque état j pondérées par la probabilité de réalisation de j. Sur un plan technique, il est important de remarquer que ce cadre d’analyse rompt de manière significative avec la théorie de l’utilité espérée de von Neumann et Morgenstern ou de Savage. Tout d’abord, la regret theory ne présuppose pas l’existence d’un ordre de préférences, cohérent ou non. Les choix ne s’analysent pas en termes de préférence sur des couples d’alternatives. Par ailleurs (et c’est la conséquence du premier point), la notion d’utilité a une signification différente de celle qu’elle a dans la théorie de l’utilité espérée. Dans cette dernière, les fonctions d’utilité ne sont rien de plus qu’une représentation mathématique des choix et donc des préférences sur un ensemble de loteries. Dans la regret theory, l’utilité est une quantité intrinsèque qui explique les choix effectués par les agents. Cela correspond plus ou moins à « l’utilité d’expérience » que l’on retrouve dans l’approche « Back to Bentham » de certains économistes comportementaux comme Kahneman.
Sugden montre facilement que, moyennant quelques hypothèses raisonnables sur la forme mathématique de la fonction d’utilité (en particulier en ce qui concerne la manière dont les intensités de regret et de satisfaction se traduisent en utilité), il est possible d’obtenir des patterns de choix cycliques. Par exemple, pour trois alternatives A1, A2 et A3, on peut obtenir pour certaines configurations en termes d’utilité et de probabilité de réalisation des états de nature, le pattern suivant :
C(A1, A2) = A1
C(A2, A3) = A2
C(A1, A3) = A3
La généralisation de la théorie à des choix non-binaires ne fait que renforcer la plausibilité d’un tel pattern de choix « incohérent ». Quelle est la cause de cette incohérence ? Elle vient simplement du fait que la valeur d’une alternative (en termes d’utilité « psychologique) n’est pas indépendante des autres alternatives disponibles. Dans la théorie de l’utilité espérée, une valeur est associée à chaque alternative, indépendamment des autres alternatives disponibles, et celle ayant la valeur la plus élevée est choisie.* Sugden fait une analogie avec le sport. Dans la théorie de l’utilité espérée, les choix s’apparentent à une compétition dans un sport non-interactif (ex : le saut en longueur) : la valeur absolue de chaque athlète (mesurée par ses performances) est largement indépendante des autres athlètes présents dans la compétition. Dans la regret theory, les choix sont plutôt analogues aux sports interactifs : la valeur « absolue » d’un participant dépend de celle des autres participants, dans le sens où un participant peut être très performant contre certains adversaires, et beaucoup moins contre d’autres, sans qu’aucune transitivité ne puisse être garantie.
A ce stade, il me semble cependant que l’argumentation de Sugden bute sur un problème conceptuel. Après avoir illustré la plausibilité d’une « incohérence » des choix et indiqué que la regret theory formalise des mécanismes psychologiques à l’oeuvre dans diverses expériences contrôlées, l’auteur suggère deux manières de maintenir malgré tout que les choix des agents sont « irrationnels » :
a) Il est irrationnel de prendre en compte les sentiments de regret ou de satisfaction lorsque l’on prend une décision, même si l’on ressent ces sensations
b) Il est irrationnel d’avoir ces sentiments
La première objection est faible : si un agent sait que, quoiqu’il arrive, il va avoir un sentiment de regret, et que donc il peut prédire son occurrence dans le futur, on ne voit pas en quoi il serait irrationnel de s’appuyer sur cette information pour prendre des décisions. La réponse de Sugden à la seconde objection est moins convaincante : pour l’auteur, le fait que les sentiments de regret et de satisfaction soient largement répandus dans la population est en soi suffisant pour considérer que la regret theory décrit un comportement rationnel (p. 174-5) ! L’argument me semble faible : le fait qu’un biais comportemental, un sentiment ou une représentation soit largement répandu dans une population ne peut pas être suffisant pour le considérer comme rationnel. Qu’on l’entende comme un concept évaluatif, normatif ou même descriptif, le concept de rationalité doit permettre de discriminer empiriquement les comportements et d’identifier deux ensembles : les comportements rationnels et les comportements non rationnels. Prenez une théorie de la raison pratique dont l’objectif est de définir les règles de comportement ou les actes qui doivent suivre les individus. Il est difficile d’imaginer une telle théorie se bornant à affirmer que, quoique fasse les agents, cela est rationnel, dès lors que cela est répandu dans la population.
Pour aller plus loin, on peut toutefois imaginer l’expérience de pensée suivante (qui m’est inspirée de ma lecture de Derek Parfit, même si lui applique son expérience de pensée aux problèmes de commitment). Imaginez qu’il soit possible pour un individu de prendre une pilule inhibant temporairement tout sentiment de regret ou de satisfaction tel que définit dans la regret theory. L’individu doit-il prendre cette pilule ? Cette question est toutefois mal spécifiée. Le choix de l’individu doit-il être guidé (1) par des considérations personnelles (succès matériel, plaisir, …) ou par (2) l’obligation d’adhérer à des supposés règles logiques définissant ce qu’est un comportement cohérent ? Il me semble évident que l’alternative (2) est insoutenable : le fait qu’un comportement respecte certaines règles de logique n’est pas en soi suffisant pour justifier ce comportement. C’est pourtant, implicitement, la justification normative du concept de rationalité qu’adoptent de nombreux économistes, y compris comportementaux. L’alternative (1) est évidemment bien plus intéressante. On peut alors par exemple raisonner de manière évolutionnaire : est-ce que le sentiment de regret (encore une fois, tel que définit dans la regret theory) est évolutionnairement avantageux ? Si c’est le cas, alors notre individu ne doit pas prendre sa pilule et le regret, même s’il mène à des patterns de choix en apparence incohérents, est bien rationnel. Il y a d’autres possibilités que je n’explorerai pas ici, mais ce qui intéressant c’est de se rendre compte qu’il est impossible, ou en tout cas non significatif, de réduire la rationalité à une propriété de cohérence interne des choix. A chaque fois que la question de la rationalité d’un comportement se pose, on est obligé de faire référence à quelque chose d’extérieur à la seule cohérence du comportement (par exemple, le succès évolutionnaire) pour se prononcer.
* En réalité, les choses ne se passent pas ainsi. L’échelle (cardinale) qui permet d’assigner une valeur à chaque alternative est inférée des choix effectués par les agents à partir d’un ensemble de loterie. Mais la construction mathématique de cette échelle cardinale présuppose effectivement que les préférences des agents sur les loteries sont indépendantes des loteries disponibles.
» Sugden s’emploie à montrer que cette condition pourtant très faible rentre en contradiction avec une conception intuitive et raisonnable de la rationalité, aussi bien au niveau du choix individuel qu’au niveau du choix social. » » l’obligation d’adhérer à des supposés règles logiques définissant ce qu’est un comportement cohérent ? »
Sauf que Chernoff n’avait pas envisagé les hypothèses de Snugden, c’est comme dire: Newton a faux. Toute théorie avec son tas d’hypothèses tend à être dépassé, et c’est une limite aussi au physicalisme qui pose comme réel au fond des hypothèses. Mais en sciences économiques, peut-on se donner comme cela des règles déontologiques définitives?
Oui, c’est le sens de l’impératif catégorique de Kant, parceque le devoir moral est inconditionné, et la science évolutionnaire au fond détourne ce principe en posant une autre norme, fluctuante, qui ne remet pas en cause la nécessité de l’impératif catégorique qui a un sens très pratique si l’on voit que l’arbitre par exemple n’est pas évolutionnaire. D’où il vient rationnel d’être cohérent, car en le ramenant au jeu, s’attend-on à ce qu’il évolue constamment, ou que les joueurs respectent mieux les règles?
On peut supposer alors qu’il y a non-transitivité des joueurs pour les décisions d’arbitres, mais billet précédent, on a défini cela comme irrationnel, et non comme une incohérence au niveau des choix.
Les deux possibilités sur l’hypothèse irrationnel/incohérent restent envisageables, mais si nous les ramenons aux sentiments (vision de Snugden):
» Si c’est le cas, alors notre individu ne doit pas prendre sa pilule et le regret, même s’il mène à des patterns de choix en apparence incohérents, est bien rationnel. »
En apparence seulement, car la regret theory fixe une expérience sentimentale, qui ne saurait de reste trouver de justification dans la science évolutionnaire; Si l’on considère cela, que fixera t’on à l’étape N+1 comme sentiments, car on ne peut imposer de règles supposées être irrationnelles, ou incohérentes parce qu’elles contredisent simplement mes choix?