Instabilité des préférences en économie positive et normative

Il est bien connu que le concept de préférence est absolument central dans l’analyse économique moderne, c’est-à-dire depuis au moins Pareto. Tous les modèles micro- et macroéconomiques reposent sur une spécification des préférences des agents (le plus souvent représentées par une fonction d’utilité) à partir de laquelle les économistes dérivent des conclusions sur le problème qui les intéressent. La plupart du temps, l’économiste ne prend pas la peine de justifier la spécification particulière qu’il utilise et, surtout, fait l’hypothèse implicite ou explicite que ces préférences sont stables. On dit ainsi souvent qu’en économie, les préférences sont « données », c’est-à-dire exogènes. Dans un récent billet, Noah Smith s’inquiète : que se passe-t-il si, comme semblent l’indiquer tout un ensemble de travaux expérimentaux, les préférences des agents sont en réalité instables et changent à travers le temps de manière a priori plus ou moins aléatoire ? La conclusion de Smith est assez radicale (dans bien des cas, cela rend l’analyse économique non pertinente), et je voudrais la tempérer un peu, notamment en distinguant les conséquences de l’instabilité des préférences en économie positive d’une part, en économie normative d’autre part.

Premier point à noter, la question de l’instabilité des préférences a préoccupé les économistes dès les années 1960, au moins depuis un célèbre article de Becker et Stigler « De Gustibus non est Disputandum ». Le même Gary Becker a d’ailleurs proposé une théorie du changement des préférences dans son ouvrage Accounting for Tastes (1996). L’idée de Becker est que les préférences d’un agent peuvent changer dans le temps en fonction de l’investissement dans différents types de capitaux. Plus exactement, dans son analyse, les préférences sont déterminées par deux stocks de capitaux, le capital personnel et le capital social. Le capital personnel comprend l’ensemble des expériences passées d’un agent qui ont une influence sur la manière dont il valorise sa consommation présente. Par exemple, un agent peut initialement n’accorder aucun intérêt aux peintures. Mais le fait d’avoir suivi des études d’art et/ou d’avoir visiter plusieurs musées peut lui avoir « appris » à les apprécier ; en conséquence, ses préférences vont changer dans le temps en classant plus haut le fait d’observer un beau tableau. Le capital social répond à la même logique mais son stock dépend cette fois-ci du comportement des autres agents dans la population. Par exemple, un agent peut accorder plus ou moins d’intérêt au fait de jouer au tennis en fonction du nombre (et peut-être de l’identité) de personnes qui jouent dans son club. Le point à retenir pour la suite de la discussion est le suivant : le fait que les préférences des agents changent dans le temps ne pose pas de problème particulier dès lors que ce changement répond de manière systématique à certains mécanismes que l’on peut introduire dans la fonction d’utilité ou plus généralement dans le modèle.

Cela m’amène directement à un deuxième point concernant le fait que Smith illustre son propos avec le cas de l’incohérence intertemporelle. Plus précisément, Smith indique que le fait que les agents escomptent la valeur de leurs gains futurs de manière hyperbolique peut conduire à des comportements incohérents et notamment à des inversions de préférences, comme cela est bien connu. L’escompte hyperbolique consiste dans le fait qu’un agent accorde une importance « démesurée » et « myope » aux gains présents par rapport aux gains futurs, quelque soit le point du temps auquel ces derniers se réaliseront. En conséquence, il est possible qu’un tel agent préfère, au temps t0, obtenir l’option B en t2 plutôt que l’option A en t1, mais qu’arrivé en t1, il préfère avoir l’option A immédiatement plutôt que l’option B en t2. Ce comportement est incohérent pour l’économiste car il indique que les préférences de l’agent changent à travers le temps, qui plus est de manière contradictoire. L’escompte hyperbolique est-il néanmoins vraiment un problème pour les économistes et leur approche en termes de préférences (stables) ? Pas vraiment. Il y a en fait plusieurs manières de réconcilier cette apparente incohérence avec une approche standard en termes de préférences stables. Une première option, sur laquelle je reviendrai plus bas, est de considérer qu’à partir du moment où un agent se définit par un ordre de préférences stable, tout changement de préférence dans le temps implique que ce ne sont pas les mêmes agents qui choisissent en t0 et en t1. Cela renvoie aux modèles « multiple selves » de plus en plus utilisés en économie.

Une autre solution consiste à indexer préférences et choix en fonction du temps. Voici une illustration assez simple. Supposez que les choix de l’agent correspondent au pattern du paragraphe précédent. Si je représente ces choix au travers d’une fonction de choix C(S, t) qui indique, pour tout ensemble d’alternatives S disponibles et pour un moment t donné, quelles sont les alternatives retenues par l’agent, on peut écrire les choses ainsi :

C([A, B], t0) = B

C([A, B], t1) = A

(Notez que pour alléger l’écriture, je suppose implicitement que l’option B est obtenue en t2 et l’option A en t1). Ces préférences sont-elles contradictoires ou même instables ? La réponse est non car je les ai indexées au temps. Pour s’en convaincre, on peut écrire l’ordre de préférences que ces choix révèlent :

B0 > A0

A1 > B1

L’ « astuce » consiste tout simplement à considérer que l’option A en t0 et celle en t1 ne sont pas les mêmes options ; idem pour l’option B. Ce classement ne révèle aucune incohérence et même, au-delà, aucune instabilité des préférences. Fondamentalement, ce n’est pas très surprenant : l’économiste n’a aucune difficulté à représenter les choix d’un agent qui actualise ses gains de manière hyperbolique via une fonction d’utilité. Si une telle représentation est possible, c’est que nécessairement il y a une cohérence sous-jacente dans les préférences ! Si l’économiste veut juger que le comportement de l’agent est « irrationnel », il devra le faire non sur la base d’un critère formel, mais bien sur la base d’un jugement de valeurs concernant le contenu des préférences. L’essentiel est encore une fois de voir que les préférences des agents changent de manière systématique et donc prévisible. D’ailleurs, un agent ayant une rationalité « globale » (plutôt que « locale ») au sens d’Elster sera capable d’anticiper l’apparente incohérence de son comportement et pourra éventuellement la corriger.

Le principal point de Smith est toutefois différent car il s’inquiète de l’instabilité des préférences (y compris intertemporelle) en raison du phénomène de « framing », que l’on pourrait traduire par effet de représentation ou effet de contextualisation. Ce phénomène, largement documenté en économie comportementale et en psychologie, indique que les choix d’un agent dans le même problème de décision peuvent significativement varier suivant la manière dont le problème est présenté. Le point clé est que cela est vrai même lorsque le changement dans la description est purement « ornemental », c’est-à-dire ne change nullement la substance du problème. La difficulté ici est que, contrairement au cas précédent, les préférences des agents semblent changer de manière complètement aléatoire. Si cela est le cas, alors Smith a raison : l’approche en termes de préférences est inadaptée. Il faut toutefois relativiser cette conclusion : il est vrai qu’aujourd’hui notre compréhension du phénomène de framing est très partielle. Mais les résultats expérimentaux sont déjà suffisamment nombreux pour avoir repéré quelques régularités empiriques qui peuvent servir de base à la modélisation. Pour ne prendre qu’un exemple, le phénomène de « anchoring », à défaut d’être complètement compris sur le plan psychologique/neuronal, est suffisamment empiriquement significatif pour que l’on puisse l’introduire formellement dans la modélisation du comportement des agents. Cela ne pose aucun problème : il suffit de supposer que les préférences des agents dépendent de « l’ancre », de la même manière qu’elles dépendent du temps dans le paragraphe précédent. Encore une fois, le point essentiel est qu’il doit exister une relation systématique entre la contextualisation et les préférences des agents.

Tout ce que j’ai dit jusqu’à présent concerne l’économie positive, i.e. la branche de l’économie qui cherche à décrire, expliquer et prédire les phénomènes économiques. Le problème de l’instabilité des préférences est en revanche beaucoup plus saillant pour l’économie normative, c’est-à-dire la branche de l’économie qui vise à évaluer les situations économiques, notamment en termes de bien-être. Pour comprendre pourquoi, il suffit de savoir que l’économie normative repose sur une conception du bien-être comme degré de satisfaction des préférences. Autrement dit, pour évaluer le bien-être d’un agent, on détermine dans quelle mesure ses préférences sont satisfaites pour un état des affaires donné. Cette définition du bien-être a plusieurs justifications : éthique (seul l’individu est légitime pour juger de ce qui est bon pour lui), épistémique (l’individu est le mieux placé pour savoir ce qui est bon pour lui) ou pragmatique (en général, il est préférable de laisser l’individu déterminer ce qui est bon pour lui). Quoiqu’il en soit, elle débouche sur une conception subjective du bien-être qui rentre clairement en tension avec les résultats de l’économie comportementale. Cette tension dépasse le seul problème du framing effect. Par exemple, on sait que les individus ont tendance à manifester des préférences adaptatives : les préférences des agents s’adaptent au contexte dans lequel ils vivent. Ainsi, des personnes qui vivent dans un régime dictatorial vont progressivement accorder moins d’importance à la liberté d’expression. Ce phénomène pose un problème évident en termes de bien-être. Supposons par exemple qu’un gouvernement compare deux alternatives sociales A et B, par exemple pour décider de réaliser une réforme passant de A à B. Cette comparaison peut être basée sur un critère utilitariste ou, plus simplement, sur le critère de Pareto ou celui de Kaldor-Hicks. Le gouvernement peut conclure que, étant données les préférences des membres de la population, B est supérieure à A. Toutefois, en raison de la nature adaptative des préférences, les préférences sur la base desquelles le bien-être collectif dans l’alternative B est évalué vont être différentes. Il est alors tout à fait possible que, sur la base de ces préférences, A soit jugée meilleure que B !*

L’instabilité des préférences, que ce soit en raison d’effets de contextualisation ou de leur nature adaptative, pose donc un problème significatif à l’économie normative. Pour le résoudre, beaucoup d’économistes adoptent de manière tacite ou explicite une approche similaire à la théorie des « désirs informés » de certains philosophes. En clair, le bien-être est définit comme le degré de satisfaction des préférences « informées » ou « rationnelles », c’est-à-dire les préférences que les agents auraient eu s’ils étaient parfaitement informés et débarrassés de tout biais cognitifs et comportementaux. Une très belle illustration dans le contexte de l’économie comportementale normative est l’approche proposé par Bernheim et Rangel. A partir de fonctions de choix C(S), ces auteurs définissent un nouveau critère normatif qu’ils nomment « multi-self Pareto optima ». Ce critère repose sur l’introduction d’agents à personnalités multiples pouvant avoir des préférences qui varient au gré des circonstances. Formellement, les fonctions de choix sont augmentées d’une « condition ancillaire » k qui peut représenter, par exemple, la manière dont un problème de décision est décrit. Dans le cas d’un individu devant choisir entre deux options x et y et dans le cadre de deux conditions ancillaires différentes k’ et k’’, on interprétera le pattern C([x, y], k’) = x et C([x, y], k’’) = y comme le fait que ce sont en réalité deux agents différents qui choisissent. Un « multi-self Pareto optima » correspond à une situation optimal au sens de Pareto pour tous les agents ainsi définit. Clairement, il peut y avoir des situations où un tel optimum (strict) n’existe pas, notamment si les selves d’un même individu ont des préférences contradictoires. Dans ce cas, Bernheim et Rangel sont très clairs : le planificateur bienveillant doit prendre une position normative en éliminant certains selves dans la détermination du bien-être collectif. Autrement dit, les préférences jugées irrationnelles ne sont pas prises en compte dans l’évaluation normative.

Au final, si l’instabilité des préférences n’est pas véritablement un problème pour l’analyse économique positive, dès lors que l’on suppose que les préférences ne changent pas de manière totalement aléatoire, elle représente en revanche un véritable défi pour l’économie normative. Dans ce cas, c’est la notion même de bien-être comme satisfaction des préférences qui perd une grande partie de sa signification. A moins de prendre position de manière explicite sur la rationalité du contenu des préférences, il est difficile de voir comment les économistes peuvent relever ce défi.

 Notes

* Comme le note Tyler Cowen dans cet article d’où est tiré l’exemple, ce problème est parfaitement isomorphique avec celui posé par les effets revenus dans l’évaluation des politiques publiques en termes de bien-être. Le raisonnement est le même : en modifiant la répartition des revenus, une réforme fait glisser, au travers des effets revenus, la courbe de demande. On retrouve alors le même problème de mesure du bien-être.

Advertisements

2 Commentaires

Classé dans Non classé

2 réponses à “Instabilité des préférences en économie positive et normative

  1. Plusieurs commentaires :

    1) Avec des préférences aléatoires, et du moment où cet aléatoire est parfaitement paramétré, il est encore possible de calculer une utilité espérée. Le problème est plus ce que les matheux en finance robuste appelle l’incertain (peut être que le terme est mal choisi ou fait référence à la Knightian uncertainty): plus qu’aléatoires les préférences futures sont simplement inconnues.

    2) Un souci à clarifier dans l’incohérence temporelle et la distinction entre rationalité globale/locale est que pour le praticien de modèle, la rationalité s’apparente à la maximisation d’un critère. Or, en cas d’incohérence temporelle, les articles font souvent cette distinction : l’agent ayant une fonction d’escompte non-exponentielle est soit naïf, c’est à dire qu’il fait comme si ses « futurs soi » se comporteront comme lui le voit, soit il sait que ses « futurs soi » ont leur propres préférences et optimise en fonction d’eux, et l’agent est dit sophistiqué. En tout cas, le premier est souvent traité d’inconsistant car étant donné la fonction objectif, son comportement est sous-optimal. Le deuxième pose aussi un certain problème encore peu résolu, qui est que la solution optimale change de terminologie pour devenir solution d’équilibre (car c’est un jeu entre plusieurs sois). Et là il faut non seulement prouver que la solution existe (et ce n’est pas une mince affaire, voir ici) mais encore illustrer son optimalité selon un critère, un peu comme on discrimine des équilibres de Nash pour trouver le plus significatif ou le plus performant.

    3) Un autre effet qui s’apparente au framing mais qui est beaucoup plus proche de l’incohérence inter-temporelle est la distorsion de probabilité, qui déforme la distribution des alternatives en fonction de la position de l’agent. Un papier technique est ici. C’est le pendant spatial de la myopie temporelle : on s’imagine souvent évoluer (la valeur de son portefeuille par exemple) localement autour de sa position présente. Si celle-ci bouge toutefois, on réactualise cette vision. Le problème est très compliqué lui aussi…

  2. Titan

    Oui, au final l’instabilité des préférences pose un problème plus au niveau des pattern des choix, qu’au niveau de l’inter-temporalité des choix qui a été largement résolu. En économie normative, la rationalité des préférences intemporelle est complexe car le comportement des agents est évolutif alors que la vision de la théorie comportementale est d’auto-référer un certain type de comportement pris comme modèle. Mais si on raisonne selon l’économie positive qui accepte plus de critiques, alors tout s’éclaire; le caractère aléatoire des préférences ne s’inscrit pas systématiquement comme un déséquilibre.
    Comme vous le dites, il est possible d’intégrer ce comportement aléatoire en théorie comportementale, alors que cela marche déjà pour les tenants de l’économie positive. Or, il y a un principe mathématique qui dit: le chemin le plus court est le meilleur.

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s