Réflexivité et équilibre de Nash

En 1928, l’économiste autrichien Oskar Morgenstern, s’intéressant aux capacités prédictives de la science économique dans un contexte où les agents peuvent modifier leur comportement en fonction des prédictions réalisées, discute un problème de décision ayant Sherlock Holmes et Moriarty comme protagonistes : poursuivi par Moriarty, Holmes monte dans un train en direction de Douvres. Il sait que Moriarty l’a vu et anticipe que ce dernier va l’attendre à la gare de Douvres. Holmes envisage alors la possibilité de descendre avant l’arrivée à Douvres, à la gare de Canterbury. Cependant, Holmes sait que Moriarty est quelqu’un d’intelligent, et par conséquent envisage sérieusement la possibilité que ce dernier ait anticipé son raisonnement. Holmes envisage alors finalement d’aller jusque Douvres, mais considère à nouveau sérieusement la possibilité que Moriarty raisonne de la même manière.

Ce problème ne semble pas avoir de solution, ce qui amena Morgenstern à conclure avec pessimisme sur les capacités prédictives de la science économique : dès lors que les agents sont dotés d’une capacité de réflexivité, autrement dit d’anticiper les effets de leurs décisions sur le comportement des autres et plus largement sur le système auquel ils appartiennent, alors il semble qu’une forme d’indécidabilité soit inévitable. La réflexion de Morgenstern n’est pas isolée. Quelques années plus tard, Keynes semble proposer une réflexion similaire au travers de son concours de beauté : le choix optimal de chaque participant dépend non pas de son évaluation de la beauté « objective » des visages, mais de sa croyance sur les évaluations des autres participants. Mais comme il en va de même pour chacun des autres participants, le choix optimal dépend de la croyance concernant la croyance des autres sur les évaluations de chacun, etc. Ici encore, le problème de décision est marquée par une dimension réflexive : les conséquences des décisions de chaque agent dépendent des décisions des autres agents, et chaque agent sait cela de telle sorte qu’il est capable d’anticiper mentalement le jeu des interdépendances croisées entre les décisions de chacun. Le problème que la réflexivité est supposée présenter pour la science économique est l’objet principal de la contribution de George Soros dans un numéro spécial du Journal of Economic Methodology, dont tous les articles sont librement accessibles.

Soros semble considérer que la science économique n’est pas en mesure de traiter de manière satisfaisante la réflexivité qui caractérise les phénomènes sociaux. Pis, la crise financière serait directement la conséquence de cette inaptitude. En fait, comme l’explique très clairement Francesco Guala dans un article qui répond à celui de Soros, la théorie des jeux procure au contraire les outils pour étudier de manière rigoureuse la dimension réflexive des phénomènes sociaux. Cela n’a certes pas toujours été le cas : l’objectif initial du fondateur de la théorie des jeux, John von Neumann (dont Morgenstern a bien sûr été le co-auteur pour leur ouvrage fondateur) était précisément d’éliminer toute la réflexivité propre aux interactions stratégiques. Le théorème du minimax de von Neumann vise en effet ni plus ni moins à définir pour chaque joueur une prescription qui est indépendante des décisions des autres joueurs, tout du moins dans le cadre restrictif des jeux à deux joueurs et à somme nulle. L’objectif de restriction de la théorie des jeux à une analyse purement « objective » était d’ailleurs explicitement revendiquée par von Neumann.

Les choses ont évidemment changé avec les travaux de John Nash et la conception de l’équilibre qui porte son nom. L’apport décisif est la démonstration par Nash de l’existence d’un équilibre en stratégie mixte dans tout jeu où le nombre de stratégies est fini. Un équilibre de Nash se caractérise comme un profil stratégique où chaque joueur joue sa meilleure stratégie (pure ou mixte) étant donnée la stratégie de chacun des autres joueurs. L’indécidabilité qui semble caractériser les exemples de Morgenstern ou Keynes disparait alors. Dans l’exemple de Morgenstern, il existe un équilibre de Nash en stratégie mixte où chaque joueur (Holmes et Moriarty) décide de descendre avec une probabilité de ½ à chacune des gares. L’équilibre de Nash est un point fixe qui casse l’indécidabilité qui semble inhérente à toute boucle réflexive. Le théorème démontré par Nash assure que cette indécidabilité est toujours une illusion, tout du moins dans les situations où le nombre de stratégies à disposition n’est pas infini.

De manière intéressante, la résolution de l’indécidabilité donne une justification supplémentaire à la place centrale qu’occupe le concept d’équilibre de Nash dans l’analyse économique moderne. Plusieurs autres justifications existent déjà. Par exemple, comme l’explique David Kreps, si dans le cadre d’un jeu G les joueurs ont la possibilité de conclure un accord (non-contraignant) sur la manière de jouer, autrement dit un accord définissant un profil de stratégies S*, ces joueurs n’auront intérêt à implémenter l’accord ex post que si ce dernier est un équilibre de Nash. Une justification supplémentaire est donc procurée par la résolution de l’indécidabilité : dans un cadre réflexif, chaque joueur pour prendre sa décision doit simuler le mode de pensée de l’autre joueur, lequel simule le mode de pensée du premier qui simule le mode pensée du second, etc. Ce processus ne peut s’arrêter que sur un point fixe où chaque simulation confirme la précédente, et celui-ci correspond à un équilibre de Nash.

Le paragraphe précédent peut toutefois être trompeur car il semble suggérer qu’un équilibre de Nash émerge suite à un processus dynamique. Les mots en italiques renvoient à l’idée que, d’une situation « hors équilibre », des agents rationnels sont nécessairement conduits à se coordonner sur un équilibre de Nash. Cela n’est bien sûr pas le cas et c’est à cet endroit que l’article de Soros a un semblant de pertinence. Le théorème démontré par Nash apporte une preuve d’existence : sous certaines conditions, on sait qu’il existe au moins un profil stratégique tel qu’aucun joueur n’a intérêt à changer de stratégie. Il ne démontre pas que les joueurs joueront nécessairement un équilibre de Nash. Les conditions épistémiques pour que ce soit le cas sont assez exigeantes ; parmi les listes des conditions suffisantes qui ont été proposé dans la littérature, on trouve par exemple la condition de connaissance commune des croyances des joueurs. Notez que le problème n’est pas la multiplicité des équilibres. Ce dernier est significatif bien entendu, mais même dans les situations où il n’existe qu’un seul équilibre (comme dans l’exemple de Morgenstern), il y a peu de raison en pratique de s’attendre à ce que les joueurs jouent un équilibre de Nash. Le problème en fait est le suivant : si initialement les conjectures des joueurs sont hors équilibre, la convergence vers un équilibre de Nash dépendra de la manière dont les joueurs ajustent leurs croyances (en temps réel ou de manière purement mentale). Autrement dit, on ne peut rien dire tant que l’on a pas une idée plus ou moins précise de la dynamique des croyances et donc de la manière dont les agents apprennent.

On peut montrer que dans le cadre d’une grande variété de règles d’apprentissage, les croyances des agents vont converger vers un équilibre de Nash. De manière intéressante, l’ensemble des équilibres stables dans le cadre d’une règle d’apprentissage donné est la plupart du temps un strict sous-ensemble des équilibres de Nash. Une des limites de ces approches dynamiques est qu’hormis les croyances des agents, tout est statique : l’ensemble de stratégies disponibles ne change pas, pas plus que les préférences. Or, si l’on considère que le processus de convergence peut prendre un certain temps, il n’y aucune raison de penser que ces éléments soient fixes. En pratique, on peut ainsi supposer que les profils stratégiques joués par les agents ne se restreignent pas à l’ensemble des équilibres de Nash où à l’un de ses sous-ensembles. L’indécidabilité est cassée souvent d’autres manières. On peut ainsi penser qu’un certain nombre d’agents (des entreprises par exemple) optent plutôt pour des stratégies qui garantissent un gain minimum maximum. D’autres agents peuvent se comporter sur la base d’un critère de maximisation de l’utilité espérée mais au travers de croyances ne correspondant pas à un équilibre de Nash mais définie de manière ad hoc, par exemple sur la base de normes sociales. Dans ce dernier cas, on peut modéliser ces dernières comme des équilibres corrélés, l’ensemble de ces derniers étant systématiquement plus large que celui des équilibres de Nash.

L’idée est donc que suivant les connaissances des joueurs et leurs modes de raisonnement, il existe de multiples manières de se comporter dans le cadre d’une interaction sociale. Sur un plan strictement formel, la réflexivité caractéristique des phénomènes sociaux appelle à raisonner sur la base du concept d’équilibre de Nash. Mais, en pratique, la manière dont les agents raisonnent effectivement ainsi que les connaissances et information à leur disposition conduisent à une plus grande diversité de comportements. Le problème posé par Morgenstern en 1928 est donc toujours d’actualité : prédire le comportement des agents nécessite de faire de nombreuses hypothèses sur ces derniers, et le seul outil mathématique du point fixe dont l’équilibre de Nash est une émanation ne peut suffire à s’émanciper de la complexité de la réalité sociale.

2 Commentaires

Classé dans Non classé

2 réponses à “Réflexivité et équilibre de Nash

  1. Pingback: Somewhere else, part 119 | Freakonometrics

  2. Titan

    Le prix Nobel Nash a formulé une théorie en stratégie montrant qu’il existe sous certaines conditions un profil stratégique type tel qu’aucun joueur n’a intérêt à changer de stratégie. Sa théorie stratégique n’était pas mise en œuvre pour décrire les interactions sociales. Sa maladie aurait d’ailleurs rendu ce projet fort difficile, outre ses exceptionnelles capacités en mathématiques..
    Sinon le problème de la démarche de la réflexivité tel qu’il est utilisé comme démarche sociologique ou anthropologique pour « sortir de l’illusionnisme de la compréhension objective et transparente  » en intégrant le chercheur dans son objet d’analyse pose fondamentalement le problème de l’objectivité, si l’on prend la thèse au pied de la lettre.
    Car si l’objectivité de l’étude est supposée en être améliorée, c’est par celui qui fixe le cadre d’analyse de façon subjective. Or, c’est faire là un subjectivisme absolu en objectivant un point de vu.
    Il suffit de soumettre l’objet d’étude à une analyse multicritère, et universelle pour voir réellement la part de subjectivité dans l’objet d’étude, quitte à se fonder au départ sur l’illusion d’une compréhension transparente. C’est ainsi que l’ont fait tous les grands économistes.
    La raison devrait nous renseigner sur la réflexivité. L’inverse est moins vrai, mais peut décrire des situations réelles sans que cela soit paradoxal, il suffit de citer le concours de beauté de Keynes pour en voir un exemple.

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s