En théorie des jeux, le Nash program renvoie à l’ensemble de la littérature de ces 40 dernières années visant à reformuler les solutions axiomatiques dans les jeux coopératifs (en particulier, dans le bargaining game) en termes de solutions dans le cadre de jeux non-coopératifs. La caractéristique des jeux coopératifs est qu’il est supposé que les joueurs peuvent former des coalitions au travers d’accords contraignants. Cette possibilité n’existe pas dans les jeux non-coopératifs. Plus exactement, l’ensemble de la négociation qui précède tacitement le jeu coopératif doit être explicitement modélisé dans un jeu non-coopératif en forme extensive. L’objectif est de s’assurer que la solution axiomatique du jeu coopératif peut être « implémentée » dans le cadre d’un jeu non-coopératif en tant qu’équilibre parfait en sous-jeux (ou équilibre séquentiel si l’information est incomplète/imparfaite). En particulier, cela suppose que les promesses ou les menaces des joueurs soient crédibles. Une bonne illustration de ce programme est fournie par le modèle de Rubinstein qui montre que, dans le cadre d’un jeu séquentiel à chaque joueur fait une offre à l’autre à tour de rôle, les joueurs implémenterons la solution de Nash sous certaines conditions concernant leurs préférences et la procédure de négociation.
Dans un jeu, les joueurs sont des agents. Ces derniers sont identifiés par le fait qu’ils peuvent choisir la stratégie à adopter (un agent est une unité de décision) et par leurs préférences, lesquelles sont représentées par une fonction d’utilité associant à chaque profil stratégique (un vecteur de stratégies jouées, une par joueur) un nombre réel. Un point essentiel est que cette approche présuppose que les joueurs sont rationnels dans un sens bien précis : leurs préférences sont cohérentes, c’est-à-dire notamment qu’elles satisfont l’axiome de transitivité. Cela est vrai pour les jeux statiques, mais aussi pour les jeux répétés où il est généralement supposé que les joueurs actualisent leurs gains futurs de manière exponentielle. Cette dernière hypothèse revient à supposer que les préférences temporelles des agents sont stables et cohérentes. Autrement dit, dans la cadre d’un jeu, on fait toujours l’hypothèse que les joueurs sont des entités bien identifiées et unifiées, dans le sens où on peut les modéliser comme des centres de décision indépendants les uns des autres et dont la structure est stable à travers le temps. Cela est vrai quelque soit l’identité des agents : individus, ménages, entreprises ou Etats.
L’économie comportementale contribue évidemment à remettre en cause la conception de l’individu comme un agent, dans le sens évoqué au-dessus. Les individus auraient ainsi tendance à révéler des préférences incohérentes, notamment dans le cadre de problèmes de décision intertemporelle. Dans ce dernier cas, les individus actualiseraient leurs gains futurs non pas de manière exponentielle, mais de manière hyperbolique, ce qui peut engendrer des inversions de préférences. L’identification des individus à des agents dotés de préférences stables et cohérentes dans le cadre d’un jeu peut donc s’avérer discutable. En parallèle, les économistes ont développé depuis plusieurs années maintenant des modèles « multiple selves » visant à rendre compte des biais comportementaux des individus (un exemple, un autre). L’idée basique est la suivante : les individus peuvent en fait s’appréhender comme une communauté d’agents interagissant d’une manière spécifique. L’interaction de ces agents produit alors, au niveau individuel, un comportement individuel observable et plus ou moins cohérent. Dans ces modèles, les agents sont des « selves », c’est-à-dire des personnalités qui peuvent être identifiées sur le plan diachronique (la personnalité d’aujourd’hui, celle de demain, etc.) ou sur le plan synchronique (la personnalité consumériste, la personnalité éthique, etc.). En tant qu’agents, ces personnalités sont dotés de préférences cohérentes et stables, et peuvent donc s’appréhender comme des centres de décision. Sur le plan philosophique, à la fois ontologique et éthique, l’ouvrage Reasons and Persons de Derek Parfit fournit un ensemble d’arguments pouvant permettre de justifier ce type de modélisation.
Il y a un aspect intéressant concernant cette stratégie de modélisation que je mettrai de côté ici, mais qui est significatif sur la nature de l’économie comme science distincte de la psychologie : même si ces modèles permettent de modéliser des mécanismes au moins partiellement psychologiques, ils sont surtout pour les économistes un moyen de réaffirmer la spécificité méthodologique et théorique de leur discipline : l’économie, c’est d’abord la science qui étudie les interactions entre des agents dans un cadre « institutionnel » donné. Loin de rapprocher l’économie et la psychologie, il me semble que ces modèles sont au contraire un moyen de réaffirmer l’autonomie de l’économie (et même sa domination). L’autre aspect qui m’intéresse plus dans ce billet est que l’on peut voir ces modèles comme les prémices d’une sorte de Nash program au niveau intra-individuel. Finalement, en supposant que l’individu est un agent, la théorie des jeux non-coopératifs présuppose que les différents selves d’un individu se sont d’ores et déjà entendus pour se coordonner et coopérer. Un jeu non-coopératif modélise ainsi les interactions entre des communautés de selves en faisant l’hypothèse que chaque communauté poursuit un objectif stable et identifié et agit de manière cohérente. Mais, de la même manière que le Nash program a consisté à ouvrir la boîte noire des coalitions d’individus et de leur formation, on peut imaginer à terme un programme en théorie des jeux visant à ouvrir la boîte noire qu’est l’individu et à insérer les interactions entre selves d’un même individu dans les interactions plus larges entre individus.
Cela peut paraître être tiré par les cheveux mais à la réflexion ça ne l’est pas tant que ça. D’une part, c’est le prolongement logique des modèles multiple selves à partir du moment où l’on prend ces derniers au sérieux. Comme je l’ai dit plus haut, il y a des arguments métaphysiques et éthiques qui soutiennent l’idée qu’il n’est pas aberrant de considérer que l’individu est réellement une telle communauté de personnalités. D’autre part, certaines approches récentes en théorie des jeux poursuivent déjà implicitement ce programme. Considérons l’approche en termes de team reasoning développée Michael Bacharach, Robert Sugden et d’autres. Dans le cadre de cette approche, les individus sont des agents qui ont la possibilité d’agir soit sur la base de leurs préférences individuelles, soit sur la base de préférences associées à un collectif. Dans cette optique, on peut alors plutôt considérer que les individus sont plutôt composés de deux agents distincts (l’un avec les préférences individuelles, l’autre avec les préférences collectives). Qu’est ce qui va déterminer que l’individu agit sur la base d’un ordre de préférences plutôt qu’un autre ? Probablement, les interactions entre les selves d’un même individu mais aussi, pourquoi pas, entre les selves des différents individus. On peut ainsi considérer que les selves sont autant de dispositions comportementales qui sont activées en fonction du contexte interpersonnel et institutionnel. Ce qui en jeu ici c’est la question de la formation de l’individualité et de la personnalité des individus au travers de leurs interactions sociales. Tel pourrait être l’objet de ce futur Nash program intra-personnel.