Transitivité, rationalité et éthique : suite (mais pas forcément fin)

Dans un récent billet, je suis revenu sur le principe de transitivité et sur son statut axiologique dans le domaine de l’éthique. Il y a eu plusieurs commentaires intéressants et comme je pense que l’argument du billet était un peu confus, j’aimerais revenir dessus et le compléter, ce qui pourrait permettre de répondre (en partie) aux commentaires.

D’abord, un résumé un peu formel de ce que j’ai essayé de démontrer dans le billet précédent. Le constat est que les économistes comportementaux, lorsqu’ils donnent dans l’économie normative, confèrent implicitement (voire explicitement) une valeur axiologique aux axiomes de la théorie de l’utilité espérée, en particulier à l’axiome de transitivité des préférences. Dans le cas des différentes variantes de paternalisme défendues par ces mêmes économistes comportementaux, ces axiomes acquièrent même une dimension déontique : les agents doivent avoir un comportement satisfaisant aux axiomes de l’utilité espérée, et si ce n’est pas le cas, alors les pouvoirs publics doivent intervenir pour faire en sorte que cela soit le cas. Les deux opérateurs déontiques « doivent » peuvent être discutés et sont discutables, mais ici c’est le premier qui m’intéresse. L’argument est le suivant : la valeur normative et déontique conférée aux axiomes de l’utilité espérée repose sur un raisonnement autoréférentiel et donc problématique.

Soit R le concept de rationalité dont se dote les économistes, y compris les économistes comportementaux. Notons par U l’ensemble des propriétés que les préférences des agents, révélées par leur comportement, doivent satisfaire pour que ces agents soient considérés comme rationnels. En l’occurrence, U consiste dans les axiomes de la théorie de l’utilité espérée (en particulier la transitivité et l’indépendance). Nous avons donc

P0        Le comportement d’un agent satisfait R si et seulement si il satisfait aux propriétés définies par U

Le paternalisme des économistes comportementaux repose sur le présupposé suivant :

P1        Les agents doivent avoir un comportement satisfaisant R

Comme R est définie par l’ensemble U (proposition P0), P1 consiste en fait en

P1’      Les agents doivent avoir un comportement satisfaisant aux propriétés définies par  U

Quand un économiste affirme qu’un agent doit être rationnel, il affirme en réalité que le comportement de l’agent doit (notamment) révéler des préférences transitives. Cependant, les propositions P1 et P1’ ne sont équivalentes qu’en apparence. P1 peut être accepté par a peu près toutes les théories de la raison pratique. Une théorie de la raison pratique définie des règles de l’action qu’un agent doit suivre. La « rationalité » peut être le concept qui subsume toutes ces règles. Le point est évidemment que P1’ n’est qu’une théorie de la raison pratique parmi d’autres, et que l’on peut légitimement se demander en quoi serait-elle plus pertinente que les autres.

Si on demande à un économiste d’expliciter ses raisons pour accepter P1’, voici l’argument qu’il développerait selon moi, sachant qu’il s’agit d’une reconstruction hypothétique, étant donné que rares sont les économistes à se donner la peine d’expliciter de la sorte leurs présupposés. En gros, l’argument de l’économiste s’appuiera sur ce que certains philosophes appellent le « préférencisme », un mot bien moche qui désigne une doctrine normative selon laquelle

P2a      tout état du monde s doit s’évaluer eu égard à la situation des agents à l’état s en termes de bien-être, et

P2b      le bien-être des agents est définie comme le degré de satisfaction de leur préférences personnelles.

La proposition P2a pose une structure normative à la fois conséquentialiste et welfariste qui est caractéristique de l’économie du bien-être. La proposition P2b est un principe axiologique qui indique que l’on mesure le bien-être en termes de satisfaction des préférences. Le préférencisme est une doctrine qui a ses propres problèmes et beaucoup de philosophes la rejettent. Considérons cependant qu’elle est valide et pertinente. Un économiste « standard » (i.e. pas un économiste comportemental) défendra la proposition P2b en faisant remarquer que les agents savent en général ce qui est bon pour eux, et qu’il se trouve que dans les faits que leur comportement correspond à U. Ici, le principe de rationalité définit par U a une dimension descriptive (les agents sont rationnels au sens de U) qui renforce sa dimension normative. Comme les agents satisfont U, ils ont des préférences cohérentes qui forment un ordre, et la notion de « degré de satisfaction des préférences » a donc un sens. Bien entendu, un économiste comportemental ne peut pas utiliser cet argument, puisque ses travaux montrent précisément que les agents ne satisfont pas U au travers de leur comportement. Mais ces économistes ont trouvé une parade en invoquant (implicitement la plupart du temps), ce que les philosophes appellent la « théorie des désires informés » qui consiste simplement à modifier la proposition P2b de la manière suivante :

P2b’    le bien-être des agents est définie comme le degré de satisfaction des préférences que les agents auraient s’ils étaient pleinement informés et non sujet à des biais comportementaux.

P2b’ repose sur le présupposé que les préférences « informées » des agents se conformeraient à U. Quel est l’argument pour défendre ce présupposé ? C’est là que l’autoréférentialité intervient car la seule défense plausible qui me vienne à l’esprit est

P3        R est U (au sens d’une relation constitutive)

Mais P3 est formellement identique au présupposé P0 qui permet de passer de P1 à P1’ ! Autrement dit, l’économiste comportemental (l’économiste standard n’est évidemment pas concerné par ce problème) ne peut pas invoquer le préférencisme pour justifier la valeur axiologique qu’il accorde à U, en particulier à l’axiome de transitivité, puisque la justification du préférencisme (en tout cas, l’une des plus plausibles) repose précisément sur le présupposé que U a une valeur axiologique. La valeur d’un tel raisonnement circulaire est douteuse.

Dans mon précédent billet, je soutiens malgré tout qu’en matière d’éthique, le principe de transitivité est un pré requis. L’argument est toutefois logique et non pas axiologique* : la transitivité à le même statut logique que le modus ponens par exemple. Autrement dit, de la même manière qu’on est en droit d’attendre que les modèles utilisés par les économistes respectent les lois mathématiques, on peut considérer que toute théorie éthique se doit de respecter le principe de transitivité en ce qui concerne la relation à partir de laquelle elle compare les différents états du monde. Si on se restreint aux théories conséquentialistes, il s’agit de comparer des états du monde s à partir d’une certaine relation C. Supposons que chaque état s se caractérise par une certaine quantité de bien G. Le contenu de G n’a pas d’importance ici ; ça peut être une quantité de plaisirs au sens psychologique (utilitarisme hédonique), le degré de satisfaction des préférences agrégées de manière appropriée (préférencisme, et en particulier l’utilitarisme des préférences à la Harsanyi), ou autre. Ecrivons G(s) cette quantité de bien à l’état s. Une théorie conséquentialiste indiquera qu’un état s est meilleur qu’un état s’ si et seulement si G(s) >C G(s’). Maintenant, si les mots (et la grammaire) ont un sens, et si on accepte de conférer aux règles de la logique une valeur significative dans l’enquête scientifique, alors on doit considérer que tout relation comparative correspondant à un prédicat monadique est nécessairement transitive. En l’occurrence ici, la relation comparative « meilleure que » s’applique au prédicat « bien » et la nature même de la relation implique qu’elle soit transitive. Le même raisonnement s’applique, par exemple, au prédicat « grand » et à la relation « plus grand que ». Ce type d’argument n’est pas définitif, mais je ne vois pas d’objection général qui puisse lui être opposé, si ce n’est des paradoxes alambiqués qui la plupart du temps s’écroulent une fois qu’ils sont re-spécifiés de manière appropriée.

A ce point, un économiste comportemental familier avec ces questions de logique pourra faire la remarque suivante : pourquoi la même contrainte logique de transitivité ne doit-elle pas s’appliquer à la relation de préférence ? Si x est préféré à y et y préféré à z, les règles de la logique n’imposent-elles pas que x doivent-être préférées à z ? Et, si c’est le cas et qu’il se trouve que les préférences des agents ne respectent pas cette contrainte, cela ne justifie-t-il pas qu’une intervention extérieure rétablisse la transitivité ? Cette remarque est pertinente et elle semble appeler à des réponses positives si a) vous êtes préférencistes et b) et que vous pensez qu’il n’y pas d’objection de principe au paternalisme. Admettons que ce soit le cas. Je pense malgré tout que l’on peut rejeter la remarque de l’économiste comportementale au travers de deux alternatives mutuellement exclusives :

A1       Les préférences personnelles des agents sont uniquement définies par leurs choix observés ou inférés (principe des préférences révélées)

A2       Préférences personnelles et choix ne sont pas conceptuellement identiques dans le sens où certains choix peuvent être « contre-préférentiels »

Supposons que l’on accepte A1. Dans ce cas, il sera possible dans la plupart des cas de redéfinir l’espace de choix de manière à retrouver la transitivité des choix et donc des préférences (voir ce billet par exemple). C’est une pure question de formalisation. Si, pour reprendre l’un des exemples d’Amartya Sen, je préfère prendre une pomme lorsqu’il en reste deux dans le plateau placé au milieu des convives, mais que je préfère ne rien prendre lorsqu’il n’en reste qu’une, l’apparente incohérence de ces préférences est effacée en re-spécifiant les choix à disposition (dans le premier cas, « prendre une pomme lorsqu’il en reste deux » versus « ne rien prendre lorsqu’il en reste deux », dans le second cas, « prendre une pomme lorsqu’il en reste une » versus « ne rien prendre lorsqu’il en reste une »). Je crois que cette astuce formelle permet de retrouver la transitivité dans a peu près tous les comportements observables, la seule exception étant peut-être certaines incohérences dans le cadre de décisions intertemporelles.

Supposons maintenant que l’on accepte A2. Dans ce cas, les choses sont encore plus simples. Comme le souligne à juste titre Amartya Sen, on peut tout à fait reconnaitre que préférer x à y et préférer y à x (ou plus généralement, avoir des préférences cycliques x > y, y > z et z > x) est incohérent sur le plan logique, et problématique sur le plan pratique. Mais est ce que choisir x plutôt que y dans un contexte A et y plutôt que x dans un contexte B relève également de l’incohérence logique ? Si préférences et choix ne sont pas la même chose (notamment parce que les choix dépendent d’autres facteurs, comme les normes sociales), on ne voit pas trop pourquoi. Le notion de choix n’est pas comparative, contrairement à la notion de préférence. Autant dire « je préfère x » n’a pas de sens s’il n’y a pas au moins implicitement une contrepartie (« je préfère x à y »), autant dire « je choisi x » a un sens. Autrement dit, si la contrainte de transitivité peut être imposée aux relations de préférence, elle ne peut pas être imposée aux patterns de choix des individus… sauf si vous définissez préférences et choix de manière synonyme. Mais on retombe dans l’alternative A1 ci-dessus.

La conclusion me semble inévitable : la valeur axiologique de l’axiome de transitivité des préférences est douteuse et peut donc difficilement justifier le paternalisme, et en tout état de cause elle ne peut être établie en invoquant la valeur logique du principe de transitivité en matière d’éthique.

* L’opposition logique/axiologique est à prendre avec des pincettes. Hilary Putnam montre de manière convaincante que les principes épistémiques et logiques qui sont au fondement de la démarche scientifique ont eux-mêmes une dimension axiologique et sont, de ce point de vue, également des valeurs.

6 Commentaires

Classé dans Non classé

6 réponses à “Transitivité, rationalité et éthique : suite (mais pas forcément fin)

  1. Thomas

    Billet très riche qu’il faudrait beaucoup de temps pour bien digérer. J’ai deux remarques.
    Vous écrivez :
    « P1 Les agents doivent avoir un comportement satisfaisant R »
    J’ai un peu du mal avec cette formulation. J’aurais plutôt tendance à dire « les agents souhaitent avoir un comportement satisfaisant R « et par conséquent, on peut les aider « paternalistiquement ».

    « Le notion de choix n’est pas comparative, contrairement à la notion de préférence. Autant dire « je préfère x » n’a pas de sens s’il n’y a pas au moins implicitement une contrepartie (« je préfère x à y »), autant dire « je choisi x » a un sens. Autrement dit, si la contrainte de transitivité peut être imposée aux relations de préférence, elle ne peut pas être imposée aux patterns de choix des individus… »
    Là aussi j’ai du mal et je ne suis pas bien sûr de suivre. Admettons qu’un individu ait une relation de préférence transitive et un pattern de choix non transitif, disons aléatoire. Vous pouvez toujours imposer un pattern de choix en retirant toutes les opportunités sauf une ce qui correspond à la position paternaliste.

    • C.H.

      « J’ai un peu du mal avec cette formulation. J’aurais plutôt tendance à dire « les agents souhaitent avoir un comportement satisfaisant R « et par conséquent, on peut les aider « paternalistiquement ». »

      Pas nécessairement. Il me semble qu’au moins une partie des mesures paternalistes recommandées par Thaler et ses collègues ne reposent pas sur l’accord ou le souhait des personnes concernées. D’ailleurs, je pense que peu de personnes souhaitent être rationnelles au sens de R, vu que cela implique de respecter des axiomes qui pour au moins certains d’entre eux apparaissent pour le moins étrange au commun des mortels (je ne parle pas de la transitivité mais plutôt des axiomes de complétude et d’indépendance).

      « Là aussi j’ai du mal et je ne suis pas bien sûr de suivre. Admettons qu’un individu ait une relation de préférence transitive et un pattern de choix non transitif, disons aléatoire. Vous pouvez toujours imposer un pattern de choix en retirant toutes les opportunités sauf une ce qui correspond à la position paternaliste ».

      C’est une question de logique. Le concept de préférence implique logiquement une relation binaire de type xRy (x est préféré à y). C’est un concept qui par essence est comparatif si vous voulez. Dès lors, il est tout à fait raisonnable de dire que le fait d’avoir des préférences de type xRy, yRz et zRx est incohérent et problématique (notez que ce n’est pas suffisant pour justifier le paternalisme). La relation comparative « préféré à », au même titre que la relation comparative « plus grand que » doit être transitive, parce que c’est dans la nature d’une relation comparative de l’être.
      Mais je pense que le même raisonnement ne marche pas avec le concept de choix (sauf si on est dans le cadre de la théorie des préférences révélées, où les préférences sont définies en termes de choix). Je ne vois pas de relation comparative que l’on puisse naturellement associer au concept de choix. Raisonnons en termes de fonction de choix. Prenez la configuration suivante :
      C(x, y) = x (i.e. lorsque x et y sont disponibles, je choisis x)
      C(y, z) = y
      C(x, z) = z

      Est-ce que ce pattern de choix est incohérent, illogique ou quelque chose d’autre dans le genre ? Pour moi, non. Il y a plein de bonnes raisons qui peuvent justifier un tel pattern. La notion même de transitivité n’a pas de sens dans ce cadre et ne peut pas servir à justifier le paternalisme.

  2. Thomas

    « Et, si c’est le cas et qu’il se trouve que les préférences des agents ne respectent pas cette contrainte, cela ne justifie-t-il pas qu’une intervention extérieure rétablisse la transitivité ?  »
    Si j’ai bien tout suivi, la réponse à cette question est le coeur de l’argumentation.Je vais essayer d’y répondre.

    L’argument paternaliste des économistes comportementaux tel qu’il est présenté dans « Nudge » est que, étant donné que les individus ont des biais comportementaux, on peut jouer sur l’option par défaut qui leur est proposée afin d’orienter leur comportement. Par exemple, un choix de portefeuille pour une retraite par capitalisation est proposé par défaut mais si l’individu veut changer et en prendre un plus ou moins risqué il est libre de le faire. J’interprète ça comme un paternalisme ex ante dans le sens où la mesure du « bien être » (au sens large ) est faite avant la possibilité de procéder à des échanges sur un marché ou dans cet exemple de modifier l’option par défaut. Avant les échanges, un paternaliste trouvera cette situation la meilleur possible car le portefeuille choisi par défaut sera par exemple celui qui maximisera l’espérance d’utilité moyenne de la population (critère transitif).

    Maintenant, supposons un individu ayant des préférences intransitives (si celà existe vraiment 😉 ) et qui pour un niveau de risque donné préfère un portefeuille qui lui rapportera 70$ à un portefeuille qui lui rapportera 100$ (car au final c’est bien de ça qu’on parle quand on parle d’intransitivité).
    En fin de période, lorsqu’il aura reçu les 100$, il pourra toujours se débarrasser de 30$ pour se retrouver à 70$.
    Autrement dit, le paternalisme (rétablir la transitivité) ex ante n’aura rien changé à la situation finale. C’est comme s’il y avait un « free lunch » quelque part : un individu se sépare de 30$, son utilité augmente(?!!) et un autre récupère les 30$, son utilité augmente aussi.
    En fait, il y a toujours une relation transitive « objective » si on prend en compte le prix des biens.

    J’espère que mon commentaire n’est pas trop confus et que je ne suis pas trop hors sujet.

    • C.H.

      « L’argument paternaliste des économistes comportementaux tel qu’il est présenté dans « Nudge » est que, étant donné que les individus ont des biais comportementaux, on peut jouer sur l’option par défaut qui leur est proposée afin d’orienter leur comportement. Par exemple, un choix de portefeuille pour une retraite par capitalisation est proposé par défaut mais si l’individu veut changer et en prendre un plus ou moins risqué il est libre de le faire. J’interprète ça comme un paternalisme ex ante dans le sens où la mesure du « bien être » (au sens large ) est faite avant la possibilité de procéder à des échanges sur un marché ou dans cet exemple de modifier l’option par défaut. Avant les échanges, un paternaliste trouvera cette situation la meilleur possible car le portefeuille choisi par défaut sera par exemple celui qui maximisera l’espérance d’utilité moyenne de la population (critère transitif).  »

      Ok, mais tout le noeud du problème est de savoir comment vous mesurez le « bien être ». Plus que ça, il faut savoir comment vous le définissez. De deux choses l’une, ou bien les paternalistes ont une définition de sens commun (ex : le bien être comme niveau de revenu ou comme espérance de vie) ou une définition « d’économistes » (i.e. comme degré de satisfaction des préférences). La première partie de mon billet montre que si on est dans ce dernier cas, les paternalistes doivent recourir à une stipulation ad hoc selon laquelle les préférences informées des agents doivent répondre aux axiomes de la théorie de l’utilité espérée. Si on est dans le premier cas, alors on attend toujours des études démontrant que les agents « irrationnels » subissent une perte en termes de bien être. Il se trouve que je n’ai pas connaissance de telles études !

  3. Jérémie

    J’ai l’impression de lire un problème de physique… est-ce normal?? Désolé Romain mais, revenant d’une discussion avec un pote physicien, cette remarque me vient tout naturellement !
    Par exemple: « P1 Les agents doivent avoir un comportement satisfaisant R

    Comme R est définie par l’ensemble U (proposition P0), P1 consiste en fait en

    P1’ Les agents doivent avoir un comportement satisfaisant aux propriétés définies par U »

    Est-ce encore de la « compréhension du réel », par nature complexe et contingent? La simplification n’aurait-elle pas été poussé jusqu’à son extrême à travers ces propositions logiques formalisées à l’extrème? (voir la terminologie pleine de « P1 », de « R » et de « U »…). Dans un contexte explicatif déjà assez riche en symboles et concepts spécialisées, ne peut on pas utiliser des mots compréhensibles par le plus grand nombre, ou au moins par la majorité des membres de la communauté des sciences humaines et sociales, au lieu de ces abréviations?

    • C.H.

      Je serais d’accord avec vous si le sens des symboles n’était pas pleinement explicité. Il me semble toutefois que j’ai fait l’effort de le faire, même si je conviens que le vocabulaire et le raisonnement dans son ensemble puissent paraitre ésotériques à un non-spécialiste. Je fais de mon mieux pour être clair, mais je ne peux pas éliminer la complexité intrinsèque du problème qui m’intéresse.

      Votre commentaire est intéressant parce qu’il exprime une idée assez répandue et que j’essaye indirectement de remettre en cause au travers de ma discussion de la transitivité : parce qu’on s’attaque à des problèmes complexes relevant de la sphère de l’éthique ou plus largement du « social », on ne pourrait pas raisonner à partir de propositions logiques ; ou en tout cas, il faudrait « cacher » ces propositions en les enrobant d’un autre style de jargon supposé apporter quelque chose d’autre. Je pense le contraire : plus le problème est complexe, plus il est intéressant de procéder à une décomposition des propositions logiques. Quelque soit le problème auquel on s’attaque, il faut respecter les contraintes de la logique et si possible expliciter au maximum les enchaînements. C’est la raison pour laquelle le principe de transitivité est particulièrement important en éthique : il contribue à définir les limites des raisonnements et des théories acceptables.

Votre commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l’aide de votre compte WordPress.com. Déconnexion /  Changer )

Image Twitter

Vous commentez à l’aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l’aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s