Dans le précédent billet, j’ai expliqué pourquoi l’utilisation du concept d’équilibre de Nash s’imposait presque naturellement dès lors que l’on prend en compte la dimension réflexive des phénomènes économiques et sociaux. En complément, je voudrais brièvement revenir ici sur la manière dont ce concept est progressivement devenu le pilier central de l’analyse économique moderne et sur le fait que ce statut tend à s’amenuiser aujourd’hui.
L’histoire de l’équilibre de Nash* est évidemment indissociable de celle de la théorie des jeux. Cette dernière commence à être développée dans les années 1920 par le mathématicien John von Neumann. Comme je l’ai expliqué dans le précédent billet, bien que l’objet de la théorie des jeux porte sur les interactions stratégiques (i.e. des situations où les conséquences des choix d’un agent i sont fonction des choix des autres agents j), l’objectif de von Neumann était d’expurger de l’analyse tous les éléments relevant de la subjectivité des agents et de leur interdépendance épistémique. La solution du minimax, que von Neumann expose dès les années 1920 et qui constitue le cœur de l’ouvrage qu’il co-écrit avec Oskar Morgenstern au début des années 1940, débouche ainsi sur une prescription pour chaque joueur qui est indépendante des choix et croyances des autres joueurs. Cela peut paraître surprenant, mais une des explications plausibles est que von Neumann tout comme Morgenstern étaient largement influencés par le positivisme logique du Cercle de Vienne dont on sait que l’un des principes fondateurs était l’élimination du champ scientifique de tous éléments non-observables et mesurables, en particulier ceux relevant de la subjectivité humaine telle que les « croyances ».
Il est bien connu que lorsque John Nash présenta ses idées concernant l’équilibre qui allait porter son nom à von Neumann à la fin des années 1940, ce dernier fut loin d’être impressionné et n’y attacha en tout cas guère d’importance. Mais von Neumann ne fut pas le seul à ne pas saisir immédiatement la portée de la découverte de Nash : aucun économiste de l’époque ne comprit qu’il s’agissait là d’un concept qui allait devenir la pierre angulaire de l’analyse économique moderne. En étant quelque peu schématique, on peut résumer les choses ainsi : jusque vers la fin des années 1960, le concept d’équilibre de Nash ne sera quasiment pas utilisé en économie à l’exception notable de Kenneth Arrow et Gérard Debreu qui le mobiliseront dans leur preuve de l’existence d’un équilibre général. L’histoire de la place de l’équilibre de Nash dans l’analyse économique est évidemment étroitement liée à celle de la théorie des jeux plus largement, cette dernière ne devenant partie intégrante du bagage de tous les économistes qu’à la fin des années 1970. De ce point de vue, on peut penser que la tardive acceptation du concept d’équilibre de Nash par les économistes est liée au peu d’intérêt plus général pour la théorie des jeux dans son ensemble.
Dans un article publié dans la revue History of Political Economy en 2004 (voir aussi cet ouvrage), l’historien de la pensée Nicola Giocoli propose toutefois une explication complémentaire intéressante. Selon Giocoli, la difficile réception de l’équilibre de Nash en économie dans les années 1950 et une grande partie des années 1960 tient au fait que ce concept, tout du moins dans la version présentée par Nash dans son article de 1951 (« Non-Cooperative Games », Annals of Mathematics), rentrait alors en contradiction à la fois avec les préoccupations des économistes de l’époque et leurs critères épistémologiques pour évaluer les concepts et théories. Les années 1950 sont en effet le théâtre de ce qui a été qualifié par Mark Blaug de « révolution formaliste » : sous l’impulsion des travaux précurseurs de Samuelson, la science économique a commencé à muter à cette époque en nouvelle branche des mathématiques fondée sur une démarche d’axiomatisation permettant l’élaboration de théorème d’existence. C’est dans ce contexte qu’Arrow et Debreu démontrent « indirectement » l’existence d’un équilibre général, en prouvant que sous un certain nombre de conditions une non-existence mène à une contradiction. La preuve par Nash de l’existence d’au moins un équilibre de Nash dans tout jeu où le nombre de stratégies est fini relève exactement de la même démarche mathématique. Toutefois, comme dans toute révolution scientifique, ce qui est vrai pour les pionniers ne l’est pas pour le reste des scientifiques : l’essentiel des économistes de l’époque ont une formation qui date au moins des années 1930 et la plupart d’entre eux rejettent, voire ignorent le développement rapide de la démarche formaliste. D’après Giocoli, les principales préoccupations de ces économistes de la « vieille génération » sont très éloignées de celles des nouveaux économistes formalistes. En particulier, la plupart des économistes s’intéressent toujours aux problématiques qui ont émergé dans les années 1930 concernant les processus concurrentiels qui prennent place sur le marché. Autrement dit, tandis que les économistes formalistes s’intéressent essentiellement à la question de l’existence (un équilibre de Nash/concurrentiel existe-t-il et à quelles conditions), ceux de la vieille génération s’intéressent plutôt à celles des mécanismes qui assurent la convergence vers l’équilibre.
Quelle est la place de l’équilibre de Nash dans ce contexte ? Il est maintenant bien connu que dans le cadre de sa thèse, Nash a proposé deux interprétations relatives à son équilibre. La première, celle qui apparaitra dans son article de 1951, relève de l’approche formaliste où l’équilibre est conçu comme un point fixe statique : l’équilibre se caractérise par un ensemble de conditions constitutives sans que rien ne soit dit sur la manière dont ses conditions peuvent être atteintes. Mais son sait aujourd’hui que Nash avait proposé une seconde interprétation en termes de « mass-action » où l’équilibre de Nash est alors conçu comme le « résultat », ou l’état stable, d’un processus où un grand nombre de joueurs jouent de manière répétée un jeu donné et où par le biais d’un processus d’apprentissage, la distribution des stratégies dans la population se stabilisent à l’équilibre. Alors que dans la première interprétation un équilibre correspond à une distribution de probabilités associées à chaque stratégie pure pour chaque joueur, dans la seconde il s’agit d’une distribution de fréquences des stratégies pures que l’on retrouve dans la population. L’article de 1951 ne mentionne nullement la question de l’interprétation de l’équilibre et en particulier cette dernière interprétation. C’est ainsi l’interprétation « formaliste » de l’équilibre de Nash qui va être retenue par la poignée d’économistes à la frontière de la discipline dans les années 1950. Mais pour l’essentiel de la profession, cette interprétation ne répondait pas aux questions jugées pertinentes, ce qui expliquerait la lente diffusion du concept dans la discipline.
Quoique l’on puisse penser de cette interprétation, il est clair que les choses ont rapidement évolué à compter des années 1970 et que le concept d’équilibre de Nash est ensuite devenu central dans l’analyse économique. Mais il est intéressant de noter qu’aujourd’hui, le mouvement du balancier semble sur le point de s’inverser. De plus en plus de théoriciens des jeux considèrent qu’il a été donné au concept d’équilibre de Nash trop d’importance et que l’étude des interactions stratégiques nécessite non pas de l’abandonner, mais d’aller au-delà. Deux explications complémentaires permettent de rendre compte de cette évolution. Il y a tout d’abord le problème bien connu de la multiplicité des équilibres. Ce problème a donné lieu dans les années 1980 à une abondante littérature sur le raffinement du concept d’équilibre. Cette dernière a débouché sur une impasse : non seulement il s’est avéré qu’il n’est pas possible de remédier totalement au problème de la multiplicité, mais en plus les solutions de plus en plus restrictives imaginées par les théoriciens des jeux reposaient sur des hypothèses de plus en plus forte sur la rationalité épistémique des agents. Un nouveau programme de recherche a en partie émergé de cette impasse : afin de restreindre l’ensemble des équilibres de Nash possibles, on formalise explicitement un mécanisme dynamique de sélection ou d’apprentissage au travers duquel la fréquence des stratégies évoluent dans une population de joueurs. Il s’agit alors de déterminer quels sont les équilibres qui correspondent à des états stables sous une dynamique donnée. Ironiquement, ce programme de recherche renoue avec l’interprétation en termes de mass-action proposée par Nash. De là à y voir le signe d’une évolution des critères épistémologiques et méthodologiques de la discipline est un pas que l’on serait tenté de franchir.**
Il y a une explication, peut-être plus décisive. Il est rapidement apparu que les conditions d’existence de l’équilibre de Nash repose sur des hypothèses épistémiques très fortes, notamment concernant la rationalité des joueurs. Toute une littérature relative au programme dit « épistémique » en théorie des jeux s’est ainsi attachée à définir des listes de conditions suffisantes pour que des joueurs jouent un équilibre de Nash (quelques exemples ici et là). Il est alors apparu, comme je l’explique dans le précédent billet, qu’il n’y a en règle générale absolument aucune raison de s’attendre à ce que des joueurs même rationnels jouent un équilibre de Nash. Autrement dit, même si l’on sait que l’équilibre existe formellement, les raisons théoriques voire empiriques pour lui accorder un intérêt particulier sont de plus en plus considérées comme minces. Là encore, il est tentant de voir cela comme le signe d’une évolution épistémologique de la discipline. Un récent article de Robert Aumann (indéniablement un artisan majeur de la révolution formaliste) et Jacques Drèze permet de mesurer cette évolution. Aumann et Drèze proposent une approche « épistémique » des interactions stratégiques fondée sur la notion de « game situation » :
We are discussing not just a game, but a « game situation », i.e. a game played in a specific context; and we should be prepared to let a player’s expectation depend upon the context – the “situation”. (p. 72).
Il s’agit pour les auteurs de caractériser les anticipations rationnelles dans le cadre d’un jeu. De manière intéressante, le concept d’équilibre de Nash ne joue aucun rôle. Les auteurs vont même jusqu’à remettre en cause l’une des justifications traditionnelles du concept que j’évoquais dans le billet précédent, à savoir l’idée que toute recommandation faite à des joueurs ne peut que correspondre à un équilibre de Nash :
When carefully examined, the argument breaks down. It assumes that the putative “recommendation of game theory” must be for each player to play some specified (mixed or pure) strategy, known to all players. But game theory need not make that kind of recommendation; its recommendation could be – indeed, should be – “respond optimally to your private information”. The players are faced with a game situation, not just a game (p. 80).
Maintenant que je relis cet article à la lueur de la reconstruction rationnelle de Giocoli, je ne peux m’empêcher de voir dans cet article d’Aumann et Drèze une sorte de « retour à von Neumann » : ce que dois faire un joueur dépend uniquement de ce qu’il sait, indépendamment de ce que peuvent faire ou savoir les autres. Cela est évidemment excessif – les auteurs s’intéressent aux anticipations rationnelles et dans le cadre d’un jeu, ces anticipations dépendent forcément de ce que font les autres. Mais il y a clairement une reconnaissance de la nécessité de dépasser une approche purement formelle des jeux (d’où la notion de « situation de jeu »), ce qui implique de se passer du concept d’équilibre de Nash.
Notes
* Je rappelle rapidement la définition d’un équilibre de Nash : constitue un équilibre de Nash tout profil stratégique s* = (s1*, s2*, …, sn*) tel que pour chaque joueur i la condition de maximisation suivante est satisfaite :
ui(si*, s-i*) ≥ ui(si’, s-i*)
Autrement dit, chaque joueur maximise son utilité (espérée, si l’équilibre implique des stratégies mixtes) lorsque tous les autres joueurs jouent leur stratégie correspondant à l’équilibre. Une autre formulation est encore qu’un équilibre de Nash est une situation où chacun sa meilleure réponse étant donné le comportement du reste de la population.
** Si l’on en croit Robert Sugden, une partie significative de ce programme de recherche ne serait en réalité qu’une nouvelle extension de l’approche formaliste au travers de ce qu’il appelle le « recovery program ».