Le site Bruegel synthétise le récent débat sur l’hypothèse d’anticipations rationnelles qui s’est développé dans la blogosphère économique anglo-saxonne. Un point me semble manquer dans toute cette discussion, par ailleurs très intéressante, et je vais brièvement le rappeler ici (j’en avais déjà parlé sur ce blog).
L’hypothèse d’anticipations rationnelles (AR) nous dit que les agents prédisent en moyenne correctement en t-1 la valeur future d’une variable X en t, ce que l’on note Xta. Plus formellement, Xta = E[Xt|It-1], avec It-1 l’ensemble de l’information pertinente disponible à la date t-1 permettant de prédire la valeur de X. Les AR ainsi définies ont plusieurs propriétés, notamment que l’anticipation rationnelle d’erreur dans la prédiction de la valeur de X est nulle (les agents anticipent qu’ils ne feront pas d’erreur) et que les erreurs (dues aux variations ne pouvant être anticipées étant donné l’information disponible) sont indépendantes. X peut correspondre à n’importe quel variable envisageable, et en particulier les variables macroéconomiques telles que l’inflation. L’information pertinente It-1 comprend notamment la politique économique mis en œuvre par les pouvoirs publics mais aussi (et surtout) la théorie économique à partir de laquelle est estimée l’impact de cette politique économique sur la variable.
Formulée ainsi, l’hypothèse d’AR ne parait pas aberrante, surtout si l’on considère que les alternatives (anticipations adaptatives, extrapolatives, voire pas d’anticipation du tout) ne sont pas plus réalistes. Il y a toutefois un point que j’ai rarement vu souligné et qui me semble pourtant essentiel suivant la manière dont on interprète la variable X. La valeur de cette dernière peut être déterminée de manière purement exogène, c’est-à-dire indépendamment de la prédiction faite par l’agent. Il me semble que c’est comme cela que l’hypothèse est interprétée par les macroéconomistes. Mais les variables macroéconomiques ne varient pas au travers de forces mystérieuses ; elles fluctuent au gré des décisions des agents économiques, les mêmes qui cherchent à prédire leur évolution. Autrement dit, si l’on note (Xta1, …, Xtan) les prédictions réalisées par les n agents appartenant à l’économie, la valeur effective prise par Xt est telle que Xt = f(Xta1, …, Xtan) : les agents économiques prennent leurs décisions en fonction de ces anticipations (rationnelles), et ces décisions affectent la valeur de X. Plus précisément, un agent rationnel i choisit une action (ou un ensemble d’actions) si tel que
maxs ui (si ; Xtai)
Dans la mesure où Xtai est la prédiction de i sur la valeur future de X et que celle-ci dépend des décisions de l’ensemble des agents de l’économie, la prédiction porte donc sur les prédictions des autres agents (Xta1, …, Xtai-1, Xtai+1,…, Xtan). Notons σi = (s1, …, si-1, si+1,…, sn) la conjecture de i sur les décisions des autres agents sur la base de l’hypothèse qu’ils maximisent leur utilité en fonction de leurs anticipations. Si on considère que les agents sont très nombreux, il est raisonnable de supposer que l’action si adoptée par i pour maximiser son utilité n’affecte pas à la marge la valeur de X. On peut donc réécrire la maximisation précédente
maxs ui (si ; σi)
Le raisonnement étant le même pour les n agents de l’économie, on obtient ainsi un ensemble de conjectures (σ1,…, σn). Rappelons ce que signifie l’hypothèse d’AR : en moyenne, les anticipations des agents sont bonnes, ce qui revient au même de dire que les conjectures σi de chaque agent i sont bonnes. En moyenne, chaque agent prédit correctement le comportement des autres agents et choisit en conséquence l’action qui maximise son utilité. On obtient donc une situation d’équilibre où les conjectures des agents forment un équilibre subjectif et où le profil d’actions (s1, …, sn) forme un équilibre de Nash.
Il est intéressant de s’arrêter un instant et de réfléchir à la manière dont on est arrivé à la conclusion que des agents avec AR jouent un profil stratégique correspondant à un équilibre de Nash. Tout d’abord, on a posé que les agents sont rationnels, au sens où ils maximisent leur utilité espérée étant donné leurs croyances subjectives. Mais il faut aller au-delà : chaque agent i, en formant sa conjecture σi, fait l’hypothèse que les autres agents sont rationnels. La rationalité est donc connaissance mutuelle au sein de la population. Mais on ne peut s’arrêter là : la conjecture de chaque agent porte indirectement sur les anticipations des autres agents, et donc sur les conjectures de ces derniers. Par conséquent, pour chaque agent i, σi découle d’une conjecture sur les conjectures σ-i de l’ensemble des autres agents. Comme ces derniers, pour former σ-i, ont fait l’hypothèse que chaque agent est rationnel, il en découle que chaque agent i « sait » (ou pense) que tous les autres agents « savent » (ou pensent) que tout le monde est rationnel. On peut poursuivre la même procédure pour obtenir une hiérarchie de croyances communes sur la rationalité des agents. On peut facilement vérifier que cette hiérarchie comporte autant d’itérations qu’il y a d’agents dans l’économie.
Outre la croyance/connaissance commune de la rationalité, une autre hypothèse est implicitement postulée dans notre caractérisation des AR comme équilibre de Nash. Pour le voir, on peut se mettre à la place d’un agent i quelconque pour déterminer son mode de raisonnement. Non seulement, i doit former une conjecture sur les actions des autres agents. Pour prédire l’action d’un agent j, i (étant donne la connaissance commune de la rationalité) doit former une conjecture sur les conjectures de j, ce que l’on peut noter σij. Ces dernières portent, entre autre, sur l’action de l’agent k, σjk. Pour obtenir un équilibre, il faut clairement que i et j soient d’accord sur leur prédiction du comportement de k, i.e. σik = σjk , mais aussi que i pense cela, i.e. σik= σij (σjk) (en mots, i pense que j fait la même conjecture sur k que lui-même fait sur k). A nouveau, on obtient une chaine d’itérations mais cette fois-ci pour chaque agent. On peut interpréter cette condition de la manière suivante : pour que les agents fassent des anticipations rationnelles, il faut qu’il y ait croyance/connaissance commune dans le fait qu’ils font des anticipations « rationnelles », ou plus exactement, dans le fait qu’il y a consensus dans leurs anticipations.
Autant l’hypothèse de croyance commune de la rationalité peut parfois être recevable, autant l’hypothèse de croyance commune de consensus des anticipations parait trop forte. C’est pourtant une condition souvent requise pour que les joueurs convergent vers un équilibre de Nash lorsqu’il y a plus de deux joueurs. La solution est peut être à rechercher dans le fait que les agents ont accès à une information que l’on considérera comme public (ce qui implique que tout le monde à accès à l’information, tout le monde sait que tout le monde à accès à l’information, tout le monde sait que tout le monde sait que tour le monde à accès à l’information, etc.). Plus précisément, et suivant en cela caractérisation des AR par John Muth dans son article pionnier, les anticipations sont rationnelles si « elles sont essentiellement les mêmes que celles générées par la théorie économique pertinente ». Notons T cette théorie qui est donc connaissance commune. T indique ainsi aux agents que la rationalité est connaissance commune et surtout quelles conjectures chaque agent doit former. Comme l’indiquent Robert Aumann et Jacques Drèze, cela revient au même que faire l’hypothèse que les joueurs ont des priors communs sur la distribution des états du monde.
Dans la mesure où il n’y a aucune raison de penser que les agents connaissent T, la question qui se pose est alors la suivante : les agents peuvent-ils apprendre T ? Cela revient au même que de se demander si les agents peuvent apprendre à jouer un équilibre de Nash. De la réponse à cette question dépend la plausibilité de l’hypothèse d’AR. Telle que je la comprend, c’est précisément la question à laquelle tente de répondre toute la littérature sur l’apprentissage (plus ou moins) rationnel à laquelle fait référence Simon Wren-Lewis dans son billet.
Est-ce que l’anticipation rationnelle n’est pas en soi un procédé de connaissance commune qui n’appelle à aucune stratégie informationnelle des agents, autre que l’anticipation? Autrement dit la possibilité posée de l’hypothèse d’AR ne suppose t’elle pas sa résolution? Comme vous le remarquez à juste titre. Ecrire une chaîne d’itération sur i, et tirer une conjecture de la conjecture de l’action des agents, ne revient-il pas à supprimer la variable X d’une fonction qui prend ses valeurs dans le réel?
Je m’explique; quand on note σi = (s1, …, si-1, si+1,…, sn) la conjecture de i sur les décisions des autres agents sur la base de l’hypothèse qu’ils maximisent leur utilité en fonction de leurs anticipations, ne supprime t’on pas une information sur les prédictions des autres agents (Xta1, …, Xtai-1, Xtai+1,…, Xtan), conduisant tout droit à la conclusion: σi devient Xtai, la base de notre hypothèse à tester. CQFD
Débat intéressant, je ferai deux commentaires:
1) La macroéconomie n’est pas mon domaine, mais comme j’essaie de publier là dessus en ce moment, je vais me jeter à l’eau pour ce qui est de l’avertissement épistémologique 😉
Le terme d’anticipation rationnelle (rational expectations )est mal choisi en macro d’après Grunberg et Modigliani (The predictability of social events, 1954) qui utilisent le terme « Harrodien » d’anticipation justifiée (warranted expectation) pour les mêmes raisons que Phelps préfère « warranted » à « natural rate of unemployment » (Studies in Macroeconomics theory, 1974). Voir l’intro de Velupillai (A disiquilibrium macrodynamic model of fluctuations, 2006).
Enfin, comme je tente une approche « post-keynesienne » en ce moment, je suis amené à voir que pas d’anticipation du tout, remplacé par une hypothèse comportementaliste macro, est assez satisfaisant pour certains objectifs. Mais c’est plus un débat sur la critique de Lucas alors je ne développerai pas.
2) L’hypothèse d’AR, c’est un peu comme vous le dites, pousser l’optimalité dans son dernier retranchement. L’équilibre de Nash, point fixe des perturbations locales des utilités individuelles (personne n’a intérêt à changer légèrement de stratégie), correspond bien à ce type d’ambition. En fait, on a remarqué récemment que la notion d’équilibre amenait à des équations pour la fonction valeur (l’utilité maximisée) qui généralisent Hamilton-Jacobi-Bellman, qui elle dérive de la programmation dynamique et donc de l’optimalité individuelle (plus « naïve » à un certain degré). Voir les récents travaux d’Ivar Ekeland sur l’inconsistence temporelle. C’est donc in fine une bonne définition, car dans des cas particuliers (joueur seul au monde), on retombe sur l’optimalité classique.
D’un point de vue math, il faut avec N joueurs (N fini) considérer la structure de jeu dans toutes ses configurations (interférence entre i et j, mais aussi entre i et j, jet k, puis k et i, etc). C’est très compliqué non seulement de trouver un équilibre de Nash, mais encore plus ambitieux de prouver son unicité, ou son optimalité face à un critère s’il en existe plusieurs. Toutefois, à la limite, ce qui se passe est très intéressant. Si les joueurs sont symétriques, l’impacte de chacun sur les autres (pris ensembles ou individuellement) se réduit et converge vers 0. On peut montrer alors que ce qui compte c’est la distribution des σi = (s1, …, si-1, si+1,…, sn), aux permutations près de joueurs. À l’infini, la distribution converge vers une densité. L’interaction devient alors réellement cette idée d’information publique par une interaction de champs moyen: chacun participe à la densité, et chacun agit en fonction de la densité, mais pas en fonction des autres joueurs pris individuellement. Pour cela, voir les travaux de P.L. Lions au Collège de France depuis 7 ou 8 ans (avec O. Guéant, J.M. Lasry), et les travaux récents de René Carmona et alumni (F. Delarue, A. Lachapelle) sur les jeux à champs moyens.