Règles constitutives et théorie des jeux

La semaine dernière je présentais le concept de règles constitutives tel que développé par des philosophes tels que Ludwig Wittgenstein, John Rawls et John Searle. Ayant proposé une discussion critique du concept, je vais aborder ici une toute autre question : comment peut-on rendre compte des règles constitutives à l’aide de la théorie des jeux ?

Le fait que les économistes (standards) aient commencé à s’intéresser aux normes et aux conventions sociales à peu près au même moment où la théorie des jeux s’institutionnalisait dans la discipline (soit durant la seconde moitié des années 1970) n’est pas un hasard. La théorie des jeux est un outil particulièrement puissant pour étudier les conditions d’émergence des règles sociales, ainsi que les modalités par lesquelles elles se maintiennent. Si l’on accepte la proposition selon laquelle le concept de règles constitutives est utile pour caractériser et étudier le monde social, on peut donc s’attendre à ce que la théorie des jeux soit en mesure d’en proposer un éclairage via leur modélisation. Dans ce qui suit (je précise qu’il s’agit d’une recherche en cours, pas d’une réflexion aboutie), je vais distinguer trois approches possibles des règles dans le cadre de la théorie des jeux, dont seulement deux d’entre elles sont, il me semble, en mesure de rendre compte des règles constitutives : 1) les règles comme régularités comportementales, 2) les règles comme anticipations normatives, 3) les règles comme instruments de corrélation des croyances et des comportements.

 La première approche est de loin la plus répandue en théorie des jeux. C’est par exemple celle que l’on retrouve dans l’un des tous premiers ouvrages mobilisant la théorie des jeux pour étudier les institutions, celui d’Andrew Schotter (1981). L’idée générique consiste à identifier la règle à un équilibre (de Nash) lorsqu’il existe au moins deux équilibres. Soit l’exemple, du jeu dit de la chasse au cerf décrit par la matrice suivante :

C

D

C

4 ; 4

0 ; 3

D

3 ; 0

3 ; 3

Le jeu comporte trois équilibres, deux en stratégie pure ([C ; C] et [D ; D]) et un en stratégie en stratégie mixte (jouer C avec une probabilité de ¾ et D avec une probabilité de ¼). Une règle (que ce soit une loi, une norme ou une convention) sélectionnera l’un des équilibres et s’identifiera à une régularité dans les comportements. Autrement dit, on identifie la règle à un profil d’actions (et de croyances). En conséquence, la règle est purement régulative car quelque soit la règle effectivement suivie par les agents, la nature de l’interaction telle que décrite par la matrice ne change pas. Autre caractéristique très intéressante : la règle étant un épiphénomène, le fait que les agents aient conscience ou non de suivre la règle, ou qu’ils la suivent délibérément ou non, n’a aucune importance. On pourra ainsi interpréter la régularité comportementale comme une règle, même si les agents ne sont dotés que d’une capacité de réflexivité limitée, voire nulle, comme ce serait le cas si c’était des animaux.

Les choses sont très différentes avec la deuxième approche où les règles sont identifiées à des attentes normatives, ou plus exactement sont conçues comme générant des attentes normatives. Une telle conception est par exemple développée dans le célèbre article de Mathew Rabin sur la modélisation de l’équité dans un cadre de théorie des jeux, dans le modèle d’aversion pour le ressentiment de Robert Sugden (que j’avais discuté ici) ou encore sur la modélisation des normes comme repose sur une préférence conditionnelle à la conformité proposée par Cristina Bichierri (j’en ai également parlé ici). Concentrons-nous sur la modélisation de Bichierri. Elle propose la définition suivante de la norme sociale : soit une règle de comportement R s’appliquant dans une interaction I avec I un jeu où les intérêts des joueurs sont partiellement conflictuels. On dira que R est une norme sociale dans la population P s’il existe un sous-ensemble PC suffisamment important tel que, pour un individu i appartenant à PC :

a)      i sait que R existe et s’applique à I ;

b)      i préfère se conformer à R dans le cadre de I à la condition que :

  1. i croit qu’un sous-ensemble suffisamment large de P se conforme à R dans un cadre et
  2. soit 2’) i croit qu’un sous-ensemble suffisamment large de P s’attend à ce que i se conforme à R dans un cadre I, soit 2’’) i croit qu’un sous-ensemble suffisamment large de P s’attend à ce que i se conforme à R dans un cadre I, préfère que i se conforme et peut infliger des sanctions dans le cas contraire.

La fonction d’utilité d’un agent i ayant une préférence pour la conformité peut être écrite ainsi :

 

Ui = uiki max[um((xn), N(xn)) – um((xn), (x-n)), 0]

Le paramètre k > 0 mesure le degré de préférence conditionnelle pour la conformité. L’expression um((xn), N(xn)) décrit l’utilité de tous les agents lorsque tout le monde se conforme à la norme N ; um((xn),(x-n)) décrit les gains d’un agent lorsqu’il est le seul à se conformer à la norme.  Cette fonction indique qu’un agent subira une désutilité s’il dévie de la norme alors que les autres s’y conforment ou s’il se conforme à la norme et que les autres dévient. L’aspect intéressant de cette modélisation est que la norme N prend directement la forme d’une règle constitutive dans le sens où elle modifie la structure du jeu et donc la nature de l’interaction. Soit un agent i ayant une préférence pour la conformité ki> 0 et interagissant dans le cadre du dilemme du prisonnier suivant :

C

D

C

3 ; 3

0 ; 5

D

5 ; 0

1 ; 1

Supposons qu’une norme sociale indique que les joueurs doivent adopter la stratégie C. Supposons enfin que l’agent soit incertain sur le fait que le ou les autres joueurs ont une préférence pour la conformité et jouer C. On obtient alors un jeu bayésien où avec une probabilité p l’autre joueur a une préférence pour la conformité, ce qui génère la matrice de gains suivante :

C

D

C

3 ; 3

0 ; (5 – 3kj)

D

(5 – 3ki) ; 0

1 ; 1

Pour une valeur de ki, kj > 2/3, la défection n’est plus une stratégie dominante et la coopération est possible. Bien entendu, avec une probabilité 1 – p l’autre agent n’a aucune préférence pour la conformité, auquel cas l’interaction est décrite par la matrice suivante :

C

D

C

3 ; 3

0 ; 5

D

5 – 3k ; 0

1 ; 1

Dans ce cas, même si l’agent i a une préférence pour la conformité, il choisira de faire défection. Le choix effectif de l’agent i dépendra donc de sa croyance subjective p dans la force de la norme, autrement dans l’intensité de la préférence conditionnelle pour la conformité de l’autre joueur. Le point important ici est de voir comment l’introduction de la norme modifie totalement le jeu auquel prennent part les joueurs. L’introduction de la norme intervient par le biais d’un mécanisme de « framing » qui fait que la norme modifie la manière dont les agents se représentent l’interaction. En ce sens, la norme est une règle constitutive d’une pratique, car la pratique (ici, la coopération dans un dilemme du prisonnier) est indissociable de l’existence de la règle : la construction et la représentation de l’interaction ne peut se faire en faisant abstraction de la règle.

Il en va de même pour la troisième approche, celle où la règle est modélisée comme un instrument de corrélation. Je fais ici référence au concept d’équilibre corrélé dont j’ai plusieurs fois parlé ici. Dans ce cadre, la règle est formellement identique à un « chorégraphe » qui, après avoir observé l’état du monde, signal à chaque agent l’action qu’il doit entreprendre. Formellement, un équilibre corrélé est un profil de stratégies s*(w) fonction de l’état du monde w et tel qu’aucun agent n’a intérêt à changer de stratégie. Comme dans le cas précédent, l’existence de la règle (une norme, une convention) modifie le jeu : la « Nature » détermine l’état du monde, et les joueurs adoptent une stratégie conditionnée à cet état. Il me semble que cette approche, encore plus que la précédente, s’inscrit dans une perspective wittgensteinienne de la règle. La révélation de l’état du monde effectif w renvoie à un évènement E qu’observe les agents. Si cet évènement est public, alors l’évènement E est connaissance commune : chacun sait que chacun sait que sait… que E. Une règle N consiste dans le fait que les agents infèrent de l’évènement E le fait qu’ils doivent se conformer au profil de stratégies s*(w). Sur quoi repose cette inférence ? La réponse est la même qu’à la question de savoir comment poursuivre la série de nombres 1000, 1002, 1004, … ou la question de ce que signifie additionner deux nombres, ou encore la question de savoir ce que signifie le mot « arbre ». Ontologiquement, il n’y a rien de plus dans le fait de suivre une règle donnée que de suivre cette règle, autrement dit de se conformer à la pratique dont elle est constitutive. L’inférence qui conduit les agents à suivre N après avoir observé E est la règle N. La pratique (qui ici correspond au profil s*) est définie par la règle N articulant un évènement à un ensemble de comportements. De ce fait, la règle n’est ici pas seulement une régularité comportementale, elle est constitutive des croyances et des comportements et donc de la pratique sociale que le jeu formalise.

A mon sens, les deux dernières approches participent d’une interprétation « non-individualiste » de la théorie des jeux, dans le sens où elles indiquent que l’on ne peut pas expliquer les phénomènes sociaux (y compris l’émergence et le maintien des normes et conventions) sans faire références à des entités non-individuelles telles que des institutions pré-existantes. Mais c’est de toute façon une conclusion inévitable dès lors que l’on accepte le concept de règles constitutives.

Poster un commentaire

Classé dans Non classé

Votre commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l’aide de votre compte WordPress.com. Déconnexion /  Changer )

Image Twitter

Vous commentez à l’aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l’aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s