L’éthique kantienne est-elle évolutionnairement stable ?

C.H.

Un certain nombre d’auteurs en philosophie morale ont contesté de longue date l’idée selon laquelle la seule attitude rationnelle dans un dilemme du prisonnier est de faire défection. Comme je l’avais déjà discuté ici, il a été proposé plusieurs dispositifs et mécanismes permettant d’expliquer le fait que les individus tendent à manifester une propension à la coopération significative. La plupart de ces tentatives reposent toutes sur l’idée que les individus cherchent à maximiser une fonction objectif. Elles ont donc en commun d’accepter la rationalité instrumentale qui sous-tend les analyses en termes de théorie des jeux. Mais d’autres tentatives consister à modifier le mode de raisonnement des individus, autrement dit à les doter d’une autre forme de rationalité.

L’une de ces tentatives est de supposer que les individus peuvent raisonner selon la maxime énoncée par l’impératif catégorique kantien :

Agis seulement d’après la maxime grâce à laquelle tu peux vouloir en même temps qu’elle devienne une loi universelle”.

L’impératif catégorique kantien (que je noterai K dans la suite du texte) indique que, dans un jeu symétrique, un individu doit adopter le comportement qui, s’il était également adopté par les autres individus, maximiserait son propre bien-être. Plus formellement, K mène un agent à choisir inconditionnellement une action x telle que la fonction d’utilité suivante soit maximisée :

K(x, y) = u(x, x)

avec ui(x, y) les gains du joueur i lorsqu’il joue x et que j joue y. Prenons deux exemples pour voir dans quelle mesure le mode de raisonnement K a une incidence sur le comportement des joueurs :

      2  
    C   D
  C 5 ; 5   0 ; 8
1        
  D 8 ; 0   2 ; 2

 

      2  
    X1   X2
  X1 3 ; 3   0 ; 0
1        
  X2 0 ; 0   2 ; 2

La première matrice décrit un dilemme du prisonnier avec la stratégie D (défection) dominante. Comment un individu kantien va-t-il raisonner ? Un kantien ne va s’intéresser qu’aux profils de résultats de la diagonale, c’est-à-dire les résultats où les deux joueurs ont adopté la même stratégie. Dans ce profil O, il choisira la stratégie x correspondant au résultat o* = (x, x) optimisant la fonction u(x, x). En l’occurrence, on voit facilement que K(C, y) = u(C, C) = 5 > K(D, y) = u(D, D) = 2. Un individu kantien choisira donc de coopérer dans un dilemme du prisonnier. Si dans un dilemme du prisonnier à n joueurs, les n joueurs adoptent le raisonnement K, il émergera une coopération généralisée.

La seconde matrice décrit le jeu Hi-Lo : il s’agit d’un jeu de pure coordination avec un équilibre pareto-dominant. La théorie des jeux standard est incapable d’expliquer et encore moins de prédire quel équilibre sera sélectionné par les joueurs. Dans les expériences contrôlées, toutefois, on constate généralement qu’environ 90% des joueurs parviennent à se coordonner sur l’équilibre pareto-optimal. Il y a plusieurs explications possibles à ce résultat. Pour l’instant, on se contentera de constater que des individus kantiens se coordonneront nécessairement sur l’équilibre pareto-optimal puisque K(X1, y) > K(X2, y). L’éthique kantienne parait donc désirable : dans les deux exemples, si tous les joueurs adoptent le raisonnement K, la meilleure solution collective émerge. Le fait que K soit souhaitable n’implique cependant que celui-ci soit réalisable ou possible. En éthique comme ailleurs, il est important de dissocier le « être » du « devoir être ». La démarche naturaliste part de cette distinction ; naturaliser l’éthique consiste à réfléchir aux possibilités d’émergence et d’évolution de différentes formes de morales ou d’éthiques.

Soit une population d’individus « programmés » pour utiliser un mode de raisonnement ou un autre. On considère pour l’instant que nos individus adoptent un mode de raisonnement de manière inconditionnelle, c’est-à-dire quelque soit le mode de raisonnement des autres individus dans la population. Pour simplifier, tenons nous en à une population où coexistent deux modes de raisonnement, le raisonnement K et le raisonnement I, ce dernier correspondant tout simplement au mode de raisonnement classique qui est conféré aux joueurs dans la théorie des jeux. Pour bien souligner le fait que les individus ne peuvent choisir leur mode de raisonnement, on appellera les individus qui adoptent le raisonnement kantien des K-machines, et les individus qui raisonnent de manière instrumentale des I-machines. Soit une population de n individus appariés deux à deux de manière aléatoire pour jouer le dilemme du prisonnier ci-dessus. Soit p la proportion de K-machines dans cette population. Comme on l’a indiqué plus haut, un individu kantien coopérera toujours dans un dilemme du prisonnier. A l’inverse, les I-machines, suivant la logique traditionnelle de la théorie des jeux, joueront toujours la stratégie dominante, à savoir faire défection. Le résultat est évident : les I-machines feront toujours mieux que les K-machines. Plus précisément, autant des individus kantiens ne peuvent pas envahir une population de I-machines (puisque u(C, D) < u(D, D)), autant une population de K-machines est vulnérable à une invasion par des I-machines (puisque u(D, C) > u(C, C)). Autrement dit, seul le raisonnement instrumental est une « éthique évolutionnairement stable » dans cette configuration. Il faut toutefois noter que les interactions ne consistent pas uniquement (et heureusement) en des dilemmes du prisonnier. Si l’on prend le jeu Hi-Lo présenté plus haut, les choses sont en effet différentes. Des individus kantiens parviendront toujours à se coordonner sur le meilleur équilibre. Deux I-machines, quant à elle, ne peuvent pas a priori déterminer sur quel équilibre se coordonner puisque la seule logique instrumentale est incapable de dire quel équilibre émergera. Au mieux, on peut supposer que deux I-machines joueront l’équilibre en stratégie mixte, avec un gain espéré à la clé de 1,2. Par conséquent, une population d’individus kantiens fera mieux qu’une population d’individus instrumentalistes. Lors de la rencontre entre une K-machine et une I-machine, si l’on fait l’hypothèse que le mode de raisonnement des joueurs est common knowledge, alors une I-machine jouera la stratégie permettant d’atteindre l’équilibre pareto-optimal ; une I-machine fera donc aussi bien contre une K-machine qu’une K-machine contre elle-même, mais une K-machine fera mieux contre une I-machine qu’une I-machine contre elle-même. Conclusion : seule l’éthique kantienne est évolutionnairement stable.

Il est donc difficile de tirer une conclusion générale à ce stade car tout dépend du type de jeu auquel sont confrontés les joueurs. Ce qui semble clair c’est que le raisonnement K ne peut pas faire moins bien que le raisonnement I dans les jeux de (pure) coordination mais qu’en revanche il fera toujours moins bien dans les jeux où les intérêts des jeux sont partiellement conflictuels (comme dans le dilemme du prisonnier). Cela explique pourquoi il est impossible pour l’éthique kantienne d’être universalisable : à partir du moment où les individus évoluent dans une « écologie » de jeux diversifiée, le raisonnement K ne peut être exclusif. On peut en revanche imaginer que certains individus ont la capacité d’adopter le raisonnement K dans certaines circonstances bien spécifiques. On pourrait décrire une population exclusivement kantienne de la sorte :

K(n) = {S, O, U}

S décrit l’ensemble de la population composée de n individus kantiens, O l’ensemble des profils de résultats envisagés par les individus (uniquement les résultats symétriques donc) et U est une fonction objectif à partir duquel sont hiérarchisés ces résultats. Comme on l’a vu plus haut, parmi l’ensemble O, des individus kantiens choisiront toujours le profil o* maximisant la fonction u(x, x). Maintenant, imaginons que la population ne soit composée que d’une fraction w d’individus kantiens et que cette fraction soit common knowledge. Dorénavant, seul un sous-ensemble T de l’ensemble S est composé d’individus capables de raisonner selon le mode K. La description de la population devient alors :

K(w) = {S, T, w, O, U}

Ici, nous n’avons plus à faire à des machines qui adoptent automatiquement un mode de raisonnement mais à des individus capables d’adopter un raisonnement kantien de manière conditionnelle : ces individus, que l’on notera KC, raisonneront de manière kantienne uniquement s’ils pensent que les autres feront de même. Considérons que le mode de raisonnement des autres n’est pas observable ; la seule information disponible est la proportion w de kantiens conditionnels KC. Ces derniers vont alors optimiser la fonction d’utilité U(x, y) suivante :

U(x, y; w) = max [K(x, y; w) ; u(x,  y; w)]

La stratégie x choisit par un kantien conditionnel dépend donc de la probabilité d’être confronté à un autre kantien (conditionnel ou non). Reprenons le dilemme du prisonnier. L’espérance de gains d’un kantien conditionnel face à un autre kantien sera de 5w ; elle sera de 2(1 – w) face à individu instrumental. Dans un contexte de dilemme du prisonnier, un tel individu raisonnera donc de manière kantienne si w > 2/7. Comment s’en sort un tel individu dans une population avec des individus instrumentaux ? Si l’éthique des individus était common knowledge, alors l’éthique instrumental ne serait plus évolutionnairement stable (en effet, des kantiens conditionnels face à face font mieux qu’un individu instrumentaliste face à un kantien conditionnel). A l’inverse, l’éthique kantienne conditionnelle serait évolutionnairement stable face à des intrus instrumentalistes (pour la même raison que précédemment). Cependant, si l’on reprend l’hypothèse selon laquelle l’éthique de chacun est une information privée, alors on comprend intuitivement que passé le seuil de 2/7 d’individus kantiens (conditionnels) dans la population, les I-machines feront mieux (puisque que les kantiens coopéreront toujours). La proportion d’individus kantiens diminuera ; à partir du moment où elle passe sous le seuil des 2/7, les kantiens conditionnels adoptent eux-mêmes un raisonnement instrumental et font également défection. Il est intéressant de voir que si l’on permet la réapparition aléatoire de K-machines (des kantiens inconditionnels donc), on peut de nouveau franchir le seuil des 2/7 entrainant une « réactivation » de l’éthique kantienne devenue dormante chez les kantiens conditionnels. Toutefois, à nouveau, les I-machines ré-envahiront la population, etc. Encore une fois, il s’agit d’une analyse spécifique à un type de jeu hautement particulier, le dilemme du prisonnier.

Que retenir de tout ça ? Tout d’abord, l’importance d’avoir une approche naturaliste de l’éthique. La question du is est tout aussi importante pour la philosophie morale que la question du ought. Autre manière de dire que si l’on veut changer le monde, il est important d’abord de bien le connaitre. Ensuite, que la théorie des jeux a peut être trop longtemps ignorée la possibilité qu’il existe différents modes de raisonnements et que leur prise en compte est importante pour comprendre certains faits stylisés. C’est l’un des points centraux des travaux de Michael Bacharach autour du raisonnement d’équipe sur lesquels je reviendrai dans les jours prochains. Enfin, concernant plus spécifiquement l’éthique kantienne, cette dernière a été beaucoup critiquée. D’un point de vue naturaliste, cela est partiellement justifiée : l’éthique kantienne n’est pas universalisable, non pas selon sa propre logique, mais selon la logique évolutionnaire, cet algorithme universel au fondement aussi bien de la biologie que de l’éthique. En revanche, elle est rationalisable dans certains contextes bien particuliers (contexte de coordination) où les intérêts particuliers ne sont pas trop divergents. S’il existe probablement peu de « vrais » kantiens, certains d’entre nous sommes peut être des kantiens conditionnels. Cette conclusion s’accompagne de deux corolaires : d’une part, on peut supposer que l’adoption de l’éthique kantienne peut être fonction des enjeux en présence (et pas uniquement du fait que les autres soient kantiens). Notamment, on peut penser que le raisonnement kantien sera d’autant plus probable chez un individu que les conséquences d’un comportement purement instrumental sont négatives (il suffit de changer la matrice dans le dilemme du prisonnier pour s’en rendre compte). D’autre part, les individus kantiens peuvent avoir intérêt à développer des stratégies signalement : le bénévolat ou le fait de faire des dons ne sont peut être pas seulement le produit de préférences pro-sociales (altruisme, réciprocité), mais ont également pour fonction de signaler un mode de raisonnement « non-instrumental ».

Advertisements

1 commentaire

Classé dans Non classé

Une réponse à “L’éthique kantienne est-elle évolutionnairement stable ?

  1. GC

    Bonjour,

    Tombé par hasard sur cette démonstration particulièrement intéressante, je vous soumets une observation marginale.

    «L’impératif catégorique kantien […] indique que, dans un jeu symétrique, un individu doit adopter le comportement qui, s’il était également adopté par les autres individus, maximiserait son propre bien-être»: c’est une hypothèse de travail comme une autre, mais en tout cas, elle ne peut se réclamer de l’autorité de Kant, ce dernier indiquant (Fondements de la Métaphysique des Moeurs, Critique de la raison pratique: passim) qu’il n’est pas question, tant qu’on parle d’action morale, de bonheur ou de bien-être, et qu’en tout cas la maximisation de mon propre bien-être et de celui d’autrui ne peut jamais constituer une fin en soi, mais tout au plus, pour le dire en gros, une cerise sur le gâteau. Bref, Kant soutient une tout autre doctrine éthique.

    Ce n’est, en un sens, qu’un détail historique, car peu importe, du point de vue du raisonnement, si la formule ici testée est de Kant ou non (à part pour les formules conclusives qui élargissent à «la philosophie morale», et aussi pour le titre du post, qui en toute rigueur ne convient donc pas).

    Seulement, il m’a semblé utile de le signaler, parce qu’une fois qu’on lui retire l’autorité du philosophe qui ne peut la soutenir, la formule qui est ici réellement discutée apparaît, me semble-t-il, comme une lubie un peu étrange. S’il ne s’agit en effet pour moi que de «maximiser mon propre bien-être», comment l’idée de n’adopter pour cela que les conduites qui le maximiseraient si elles étaient adoptées également par les autres individus germera-t-elle dans l’esprit de quelqu’un, et de quel argument pourra-t-elle se recommander?

    Bien à vous

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s