Gauthier, Parfit, et la rationalité des dispositions à agir

Dans son difficile mais important livre On What Matters, le philosophe Derek Parfit revient brièvement sur un débat entre lui et David Gauthier relatif à la question de la rationalité des engagements non-crédibles. Dans son ouvrage Morals by Agreement ainsi que dans une série d’articles, Gauthier défend en effet la thèse que s’il est rationnel pour un agent d’acquérir une certaine disposition D en termes de comportement, que selon D l’agent doive entreprendre une action A dans une situation S, mais qu’il existe une action alternative A’ qui est objectivement et de manière transparente meilleure pour l’agent, il est malgré tout rationnel pour ce dernier de suivre A. Sans suivre spécifiquement la critique que développe Parfit contre cette idée, je vais revenir brièvement sur les difficultés soulevées par la thèse de Gauthier.

L’argument que Parfit développe pour réfuter la thèse de Gauthier suit une trame qui est bien connue des économistes, puisqu’en substance il s’appuie sur l’idée de perfection en sous-jeux. Prenons deux problèmes stratégiques dont la structure est formellement la même : est-il rationnel pour un agent de tenir sa promesse envers un autre agent qui ne dispose d’aucun moyen de rétorsion à son encontre ? Est-il rationnel pour un agent de mettre en oeuvre une menace qui a été formulé – sans succès –  dans une optique de dissuasion, sachant que la mise en oeuvre n’est clairement pas la meilleure alternative à disposition de l’agent ? Ces deux problèmes de décision soulèvent la même difficulté : à chaque fois, la réalisation de l’engagement (tenir sa promesse ou mettre en oeuvre la menace) n’est pas dans l’intérêt de l’agent qui s’est engagé. Cette difficulté est particulièrement saillante dans le cas de la menace dans un contexte militaire : si un pays A a menacé un pays B de mesures de rétorsion dans l’hypothèse où B attaquerait et que B attaque malgré tout, est-il rationnel pour A de répliquer sachant qu’une réplique débouchera à coup sûr sur un conflit très couteux pour A, bien plus que de ne rien faire ?

Ce type de problématique est bien entendu bien connue des économistes depuis les travaux de Thomas Schelling. La réponse d’un théoricien des jeux (qui, en substance, est aussi celle de Parfit) serait qu’à partir du moment où ne pas répondre est une meilleure alternative pour A que la mise en oeuvre de la menace, alors il ne peut être rationnel de répliquer. Si l’information est complète et parfaite, alors cette réponse semble difficilement discutable et n’est qu’une reformulation du concept de perfection en sous-jeux : pour qu’un profil stratégique soit joué par des joueurs rationnels, il faut qu’à chaque noeud de décision l’action correspondant au profil stratégique soit la meilleure réponse disponible. Il en découle que l’engagement en tant que tel (faire une promesse ou formuler une menace) ne peut être rationnellement formulé, faute de crédibilité. Pourtant, dans Morals by Agreement, Gauthier semble contester cette idée (p. 186) :

it may be rational for a perfect actor to dispose herself to threat enforcement, and if it is, then it is rational for her to carry out a failed threat. Equally, it may be rational for a perfect actor to dispose herself to threat resistance, and if it is, then it is rational for her to resist despite the cost to herself. Deterrence, we have argued elsewhere, may be a rational policy, and non-maximizing deterrent choices are then rational.

Il est important de noter ici que Gauthier parle de disposition et non d’action. On peut définir une disposition comme un plan d’action fondé sur le contrefactuel « si j’étais dans la situation S, alors je ferai A » pour toute les situations S couvertes par la disposition. Lorsque Gauthier attribue la propriété de rationalité à un agent, il le fait au niveau de ses dispositions à agir et non de ses actions en tant que telle (p. 182). Une disposition est rationnelle « si et seulement si un agent la possédant peut s’attendre à ce que ses choix ne lui apportent pas moins d’utilité que les choix qu’il ferait s’il possédait une autre disposition » (p. 183). Cette définition de la rationalité prend toute son importance dans le cadre du concept de maximisation contrainte sur lequel Gauthier fonde sa théorie contractualiste de la justice (voir ici pour quelques développements sur ce point). Dans un cadre standard de marchandage, la maximisation contrainte va consister pour un agent à maximiser son utilité sous contrainte de la règle de minimisation de la concession relative maximum. Ainsi, dans le cadre d’un dilemme du prisonnier, si les deux joueurs ont pour disposition de maximiser sous ce type de contrainte, alors ils coopéreront. Les questions de type « est-il rationnel de coopérer dans un dilemme du prisonnier ? », « est-il rationnel de respecter une promesse ? » ou « est-il rationnel de mettre en oeuvre une menace ? » se rapportent alors à la question de savoir s’il est optimal pour un agent d’adopter la disposition de maximisation contrainte.

Gauthier montre que cela est le cas, moyennant certaines hypothèses concernant en particulier la « transparence » des agents : si chaque agent peut parfaitement (ou avec une forte fiabilité épistémique) observer la disposition des autres agents, alors les maximisateurs contraints auront plus de succès dans une population que les maximisateurs au sens strict. Admettons ce résultat, ainsi que l’hypothèse de transparence des agents. Supposons qu’une disposition D soit rationnelle au sens de Gauthier et que dans une situation S, elle m’amène à choisir l’action A. Supposons que cette action A soit particulièrement destructrice pour les participants à l’interaction, y compris moi-même, de telle sorte qu’une action alternative A’ soit clairement meilleure pour moi dans l’hypothèse où S surviendrait. Cependant, il est rationnel de posséder D précisément parce que la menace que A fait peser sur tout le monde fait que la plupart du temps je vais me retrouver dans une situation S’ qui m’est clairement favorable. Supposons malgré tout que je me retrouve dans S, est-il rationnel pour moi d’entreprendre A ? Pour Gauthier, du moment que l’on admet que D est rationnel, la réponse est nécessairement oui. Notez qu’en raison de l’hypothèse de transparence, la réputation ou tout autre facteur pouvant agir sur les croyances des autres joueurs ne peuvent être une raison d’agir motivant A. C’est uniquement la rationalité de D qui procure une raison d’agir selon A.

Il semble que l’argument de Gauthier est confronté à l’impasse suivante : soit il existe une alternative A’ objectivement et ouvertement meilleure pour moi que A, auquel cas il est difficile de comprendre comment D peut être la meilleure disposition existante dès lors qu’il est dans l’intérêt des autres agents de se retrouver dans la situation S ; soit A est en fait la meilleure alternative à disposition, et le fait que l’on se retrouve dans S est uniquement la conséquence de l’irrationalité des autres agents. Ces deux alternatives sont toutefois contraire aux hypothèses posées dans le paragraphe précédent. Une troisième possibilité serait la suivante : D est rationnel mais n’est pas crédible dans le sens où il est dans l’intérêt des autres agents de faire en sorte que S se présente car alors j’ai intérêt à choisir A’. Malgré tout, parce que D est rationnel, suivre cette disposition en choisissant A dans S serait rationnel en dépit du fait que A’ est objectivement la meilleure alternative à disposition. Si on retient cette dernière possibilité, on arrive au paradoxe suivant : une disposition D peut être rationnelle (optimale) parce qu’elle conduit son porteur à agir en toute connaissance de cause de manière non-optimale à au moins un noeud de l’arbre de décisions. Il est clair que ce paradoxe pose problème si l’on accepte l’hypothèse de transparence.

Un simple exemple permet de s’en rendre compte. Supposons un conflit entre deux pays A et B équipés de l’arme nucléaire et supposons qu’en cas d’attaque de A, la menace de rétorsion de B n’est pas crédible au sens de la théorie des jeux. Pour dissuader A d’attaquer malgré tout, B met sur pied une doomsday machine programmée pour lancer une riposte automatique sans une quelconque intervention humaine à une éventuelle attaque de A. La mise en place d’une telle machine revient à acquérir une disposition au sens de Gauthier. Si elle dissuade A de lancer une attaque, elle est rationnelle au sens de ce dernier. Supposons que A attaque malgré tout ; la riposte (automatique) de B peut-elle être qualifiée de rationnelle ? Il me semble que tout ce que l’on peut dire c’est que cette riposte est cohérente avec la disposition, mais que la question de sa rationalité ne se pose pas ici puisqu’à strictement parler aucune décision n’a été prise. Mais si l’on retient l’hypothèse de transparence, ce scénario (et donc cette question) ne doit pas pouvoir se produire : A connait la disposition de B (la mise en place de la doomsday machine) et B connait la disposition de A (son degré de rationalité). Dans ces conditions, les choix par A et B de leur disposition respective doivent être des meilleures réponses mutuelles : si B savait que A est irrationnel, il n’aurait pas mis en place la doomsday machine, et si A était rationnel, il n’aurait pas du attaquer suite à la mise en place de la machine.

J’en arrive à la conclusion que l’hypothèse de transparence est incohérente avec le concept de disposition. Dans un monde où l’information est parfaite et complète, parler de disposition rationnelle ou irrationnelle n’a pas de sens car choisir une disposition revient tout simplement à choisir une stratégie pour chaque noeud dans l’arbre de décision. Une disposition ne peut pas être rationnelle si les actions qu’elle implémente ne le sont pas également. Le point de départ même de l’argument de Gauthier (la distinction entre disposition rationnelle et action rationnelle) me parait donc problématique. Qu’en est-il si on relâche l’hypothèse de transparence ? Dans ce cas, il est tout à fait possible qu’une disposition rationnelle recommande une action qu’il est irrationnel de suivre si l’interaction ne se répète pas, mais dont la mise en oeuvre se justifie en cas de répétition de l’interaction. Mais relâcher l’hypothèse de transparence à un coût non négligeable pour la théorie contractualiste de Gauthier car son argument concernant la rationalité de la maximisation contrainte perd alors considérablement de sa force.

Publicités

Poster un commentaire

Classé dans Non classé

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s