Corrélation des interactions et théorie de la décision « vaudou »

C.H.

Dans mon examen de microéconomie pour des étudiants d’IUT de 1er année, j’avais inséré une question sur la rationalité du vote : « sachant qu’aller voter est couteux (frais de déplacement, coûts d’opportunité) et que la probabilité que le vote d’un électeur soit décisif est quasi-nulle, est-il rationnel d’aller voter ? ». L’une des idées était bien sûr de faire dire aux étudiants que le fait qu’un agent soit rationnel ne préjuge en rien du contenu de sa fonction d’utilité et que des motivations « citoyennes » par exemple peuvent tout à fait justifier l’acte de vote. Un certain nombre d’étudiants ont cependant proposer un argument assez différent mais qui est plutôt commun dans ce type de situation : non, il n’est pas rationnel d’aller voter mais si tout le monde raisonne comme ça, alors personne n’irait voter, donc finalement il est rationnel d’aller voter.

C’est finalement un raisonnement assez kantien puisqu’il conditionne une action à la possibilité ou non de la rendre universalisable. Cependant, plutôt que le symptôme de la grande importance de l’éthique kantienne dans la population, on peut voir ce genre de raisonnement comme la manifestation d’une autre logique qui part du principe qu’il y a une corrélation entre la manière dont j’agi et la manière dont les autres vont agir. Dans le cadre d’interactions stratégiques où il n’y pas de stratégies dominantes, cette logique peut être justifiée (sous certaines conditions, voir plus bas) ; c’est beaucoup moins le cas dans une situation non-stratégique ou lorsque les joueurs ont une stratégie dominante à leur disposition. On utilise parfois les expressions de « pensée magique » ou de « théorie de la décision vaudou » pour qualifier le raisonnement d’un individu qui prend une décision en faisant l’hypothèse que sa décision influence l’état du monde en vigueur alors même qu’il y a aucune relation causale entre la décision et l’état du monde. Il me semble malgré tout que ce type de raisonnement est assez répandu et il peut être intéressant de voir comment il a pu évoluer.

La théorie de la décision telle qu’elle a été axiomatisée par Leonard Savage part de l’hypothèse qu’il y a une indépendance entre l’action d’un individu et la réalisation de l’un des états du monde. Plus exactement, l’utilité espérée d’une action doit être évaluée en fonction de ses conséquences étant donné l’état du monde. Si on note A l’ensemble des actions possibles, B l’ensemble des états du monde qui peuvent se réaliser et C les conséquences exprimées en termes d’utilité, alors le problème de décision D se présente tel que

D : A x B –> C

Si on note par u(Ai, Bj) l’utilité de l’action i lorsque l’état du monde j se réalise, alors le problème de décision consiste dans le programme d’optimisation suivant :

max Eu(Ai) = ∑j p(Bj) u(Ai, Bj)

avec p(Bj) la probabilité (objective ou subjective) que l’état du monde j se réalise. Le problème de décision présuppose clairement qu’il y a indépendance entre l’action et la probabilité qu’un état du monde se réalise. On nomme parfois cette approche théorie causale de l’utilité espérée (ou théorie causale de la décision) car l’indépendance entre les états du monde et les actions est fondée sur le fait qu’il n’existe aucune relation de causalité entre les deux.

Il est cependant des cas où il peut y avoir clairement une relation statistique entre une action et un état du monde. Par exemple, la probabilité d’avoir un cancer des poumons est clairement partiellement déterminée par le fait de décider ou non de fumer. Dans ce genre de cas, il faut alors modifier le programme d’optimisation en y intégrant une probabilité conditionnelle :

Eu(Ai) = ∑j p(Bj | Ai) u(Ai, Bj)

Cette expression correspond à ce que l’on appelle parfois à la théorie « évidentielle » de l’utilité espérée, à ma connaissance proposé pour la première fois par Richard Jeffrey en 1965. Cette formulation est basée sur le fait qu’il y a une corrélation entre l’action choisie et l’occurrence d’un état du monde spécifique. La question est de savoir si l’approche évidentielle est justifiée lorsqu’il n’existe aucune relation causale entre A et B. La plupart des théoriciens de la décision considèrent que non. Certains problèmes de décision tels que celui décrit par le paradoxe de Newcomb montrent toutefois que les choses ne sont pas si simples (pour rappel, dans le paradoxe de Newcomb, le critère de dominance et le critère de l’espérance d’utilité débouche sur des prescriptions contraires ; l’approche évidentielle conduit à choisir conformément au critère d’espérance d’utilité, l’approche causale conformément au critère de dominance). Quoiqu’il en soit, ce qui nous occupe ici n’est pas de savoir laquelle des deux approches est justifiée sur un plan logique, mais laquelle correspond à la manière dont raisonnent effectivement les individus.

Il y a certains éléments qui indiquent que, dans des circonstances bien précises, les individus tendent à adopter l’approche évidentielle alors même qu’aucune relation de causalité entre action et état du monde ne peut être soupçonnée d’exister. Par exemple, Andrew Colman a mené plusieurs expériences contrôlées qui tendent à indiquer que dans le jeu Hi-Lo, les joueurs adoptent un raisonnement nommé « heuristique de Stackelberg » :

 

Hi

Lo

Hi

10 ; 10

0 ; 0

Lo

0 ; 0

5 ; 5

L’heuristique de Stackelberg consiste à raisonner en faisant comme si, en tant que joueur, j’étais un leader de Stackelberg, c’est-à-dire celui qui a la possibilité de choisir le premier dans un jeu séquentiel à information parfaite. Dans ce cas, l’autre joueur pourrait observer mon choix et optimiser en conséquence. On est bien dans l’approche évidentielle : mon action conditionne le choix de l’autre joueur (lequel, dans une interaction stratégique, correspond à l’état du monde). Si tous les joueurs raisonnent effectivement à partir de l’heuristique de Stackelberg, alors il est évident qu’ils vont tous jouer « High », conformément à ce qui est observé lors des expériences. Le point crucial est évidemment que sur un plan strictement logique, l’heuristique de Stackelberg n’est pas valide, puisque les deux joueurs ne peuvent pas l’adopter et avoir « raison » simultanément. Autrement dit, l’inférence causale entre action et état du monde que fait l’heuristique de Stackelberg n’a pas lieu d’être.

S’il est cependant avéré que les individus adoptent ce type de raisonnement, il faut expliquer comment cela est possible. Autrement dit, comment le raisonnement évidentiel pouvant prendre la forme de l’heuristique de Stackelberg a-t-il pu évoluer ? Mon hypothèse est que l’on peut l’expliquer en prenant en compte le fait que, dans la nature comme dans les sociétés humaines, les interactions sont la plupart du temps corrélées, c’est-à-dire que l’on tend à interagir avec des personnes qui nous sont semblables. Dans le cadre de l’analogie entre théorie de l’évolution et théorie de la décision, Brian Skyrms est le premier à avoir indiqué que l’hypothèse de corrélation des interactions dans la théorie de l’évolution revenait au même qu’à adopter, dans le cadre de la théorie de la décision, l’approche de Jeffrey.

La notion de corrélation des interactions est simple à comprendre. Imaginez une population avec deux types d’individus (ou des individus se distinguant par un trait phénotypique ou encore par un allèle sur un locus), X et Y. Soit q la proportion d’individus X dans la population. Si les individus interagissent toujours par paire et si les interactions dans la population sont parfaitement aléatoires, la probabilité de rencontrer un individu X (si la population est très grande) est donc q et la probabilité de rencontrer un Y est 1 – q. Par conséquent, la probabilité que deux X se rencontrent est q², la probabilité que deux Y se rencontrent est (1 – q)², et la probabilité d’une rencontre « mixte » est 2q(1 – q). On note e le coefficient de corrélation (avec 0 < e < 1) qui mesure le biais favorisant la rencontre de deux individus du même type. Si on note P(a | b) la probabilité qu’un individu b rencontre un individu a, on obtient les probabilité conditionnelles suivantes une fois pris en compte le coefficient e :

P(X | X) = q + e (1 – q)

P(Y | Y) = 1 – q + eq

P(Y | X) = 1 – qe(1 – q)

P(X | Y) = qeq

Si la corrélation est parfaite, e = 1 et on voit alors que chaque individu ne peut que rencontrer un adversaire du même type que lui. Il est évident que le coefficient de corrélation e est un analogue parfait de la probabilité conditionnelle dans la théorie évidentielle de l’utilité espérée. Cependant, nous ne sommes qu’au niveau de l’analogie. On peut aller plus loin en suggérant que la corrélation des interactions peut expliquer pourquoi les individus ont une propension à raisonner de manière évidentielle et plus spécifiquement en partant du principe que les autres raisonnent comme eux raisonnent.

Le raisonnement évidentiel est clairement problématique sur un plan purement logique ; cependant, si la corrélation des interactions fait que l’on tend à rencontrer plus souvent des individus qui se comportent comme nous, le raisonnement évidentiel va paraitre être efficace sur un plan pragmatique du point de vue de chaque individu. En vérité, ce ne sera pas vrai car c’est uniquement le mécanisme de corrélation qui fait que les individus parviennent à se coordonner. Mais le raisonnement évidentiel peut néanmoins être sélectionné comme « side-effect » selon un mécanisme bien connu en biologie :

 

Les flèches en gras indiquent que la corrélation des interactions est à la fois responsable de la sélection du raisonnement évidentiel et de la coordination entre individus, tandis que la flèche en pointillés indiquent qu’il y a une corrélation entre raisonnement évidentiel et coordination. Cependant, cette corrélation est « spurious » comme diraient les économètres, c’est-à-dire qu’elle disparait une fois que l’on contrôle pour la corrélation des interactions. Formellement, cela veut dire que la probabilité conditionnelle dans la formule ci-dessus est non-causale mais qu’elle est le produit du coefficient de corrélation e qui l’a sélectionné. On a donc ici bien dépassé le cadre de la simple analogie.

Etant donné que les biologistes ont depuis longtemps démontré l’importance des interactions corrélées dans le monde animal et que, au niveau social, les institutions organisent largement cette corrélation, cette explication semble plausible. Evidemment, il peut y avoir d’autres facteurs au niveau social qui explique la corrélation entre action et état du monde. La plus simple est l’existence de conventions et de normes (que l’on peut formaliser comme des équilibres… corrélés) qui, de fait, suppriment l’indépendance entre les actions des agents.

4 Commentaires

Classé dans Non classé

4 réponses à “Corrélation des interactions et théorie de la décision « vaudou »

  1. gdm

    @C.H.
    En 1997, Raymond Boudon avait proposé cinq explications au vote dans son « paradoxe » du vote ». Aucune des cinq raisons de Boudon ne m’avait alors convaincu. Votre explication ne me convainc pas plus. Sauf peut-être votre terme de « motivation citoyenne », lequel me semble aller dans une meilleure direction. Prétendre définir une « fonction d’utilité » pour un vote me semble contestable.

    Chaque électeur peut s’intéresser au calcul de la probabilité que son vote influe sur le résultat de la votation. Tout calcul de probabilité montre que la probabilité d’influer sur un vote est inférieure à un sur un milliard de milliards. C’est à dire le zéro presque absolu. Une autre manière d’évaluer cette probabilité est de compter le nombre de fois que le résultat d’une élection s’est joué à un vote près.

    Sans être un mathématicien, chaque votant a l’intuition que la probabilité qu’il influe sur le vote est quasiment nulle. L’acheteur d’un billet de loterie achète une émotion, une espérance. Il n’achète pas une probabilité de gagner. Il achète une espérance de gagner. L’achat d’un billet de loterie est rationnel. Son plaisir à se bercer d’illusion vaut plus que le cout du billet.

    C’est un phénomène analogue qui est en oeuvre dans une votation. Un mélange d’un espoir et d’une éphémère auto-illusion. Le mot « illusion » est au coeur de ce paradoxe du vote. Le terme « motivation citoyenne » peut être utilisé par qualifier l’état d’esprit du votant. La nature psychologique d’une « motivation citoyenne » est créée par une illusion qui provient de l’État.

    L’État prétend représenter la Nation. Or chacun a le sentiment confus de faire partie d’une sorte de communauté de qq chose qui pourrait ressembler à ce concept de Nation. L’État prétend être une autorité morale capable de dire le Bien et de dire le Mal. L’État prétend aussi représenter la patrie, représenter confusément les dieux des ancêtres et leurs glorieux souvenirs ensuite oubliés. L’État prétend être un père fort et juste et être une mère aimant ses enfants d’une égale attention. L’État français est le seul garant de la pérennité de la tradition et des racines culturelles de chaque votant. L’État est la seule institution qui puisse apparaitre crédible dans ces représentations illusoires.

    Un bulletin de votre n’est pas un mandat de représentation, au sens du Code Civil. Aucun élu ne représente donc aucun électeur, du moins au sens du Code Civil. Le Code électoral précise comme un mandat électif est défini et rémunéré par l’État. Selon le Code électoral, ni le peuple, ni l’électeur ne donne un mandat électif à un élu. Et pourtant, chacun entretient la douce et nécessaire illusion d’une représentation des élus et du pouvoir du peuple.

    La « motivation citoyenne » est donc un des sommets de l’illusion acceptée par la plupart, par le besoin métaphysique d’y croire, comme d’autres croient en un Dieu. Refuser cette illusion serait alors accepter le néant politique, le néant de toute vie sociale, le néant de toute Justice. L’auto-illusion est préférable plutôt que risquer le néant et la mort de la civilisation.

    Bruler en effigie son ennemi est un soulagement de la même nature que de voter contre le politicien, contre celui jugé responsable de violer des valeurs essentielles, de violer son intérêt légitime.

    Enfin il existe une autre raison de voter. C’est le souhaiter de participer à la fête collective par simple sympathie avec ceux qui vivent cette illusion de la motivation citoyenne.

    • C.H.

      « Prétendre définir une « fonction d’utilité » pour un vote me semble contestable »

      Selon les principes de la théorie du choix rationnel, et moyennant l’hypothèse que les électeurs satisfont aux divers axiomes (complétudes, transitivité, réflexivité, continuité), il n’y a aucun problème à écrire une fonction d’utilité pour *décrire* le comportement de l’électeur. J’insiste bien sur le terme décrire parce qu’une fonction d’utilité n’explique jamais rien. Derrière, il faut une théorie ou des données empiriques qui justifient les arguments de la fonction.

      Pour le reste, je ne suis pas en désaccord avec ce que vous dites. Le point de la question posée à mes étudiants était juste de voir s’ils avaient compris qu’utilité n’est pas équivalent à monnaie ou n’est pas antinomique à des motivations « collectives ».

  2. alexandre

    Je ne comprend pas l’intérêt de l’exercice, si l’on va voter ce n’est pas en supposant un effet, que l’on sait quasi-nul, c’est pour répondre à l’idée que l’on se fait de soi-même. Le vote participe d’une démarche identitaire et se suffit à lui même.
    Les corrélations relèvent des actes routiniers qui n’ont de sens que dans un contexte social précis. Si certains groupes sociaux votent plus que d’autres ce n’est pas nécessairement par entraînement mais parce que les mêmes critères sociaux entraînent les mêmes conséquences. Constater que dans un groupe donné les comportements sont proches tient de la lapalissade auto-réalisatrice, la question est de savoir comment le groupe a émergé et ce qui l’anime.

    Enfin bon moi je dis ça je dis rien, j’étais simplement étonné que sur votre blog que je découvre avec plaisir vous posiez une question à laquelle la sociologie la plus élémentaire répond.

    Cordialement

  3. Titan

    Le modèle scientifique tel qu’il a été défini avec son raisonnement évidentiel et son mécanisme d’intéraction, est utilisé dans toutes les sciences, y compris les sciences « dures » (Médecine, Physique).

    On reconnaîtra qu’à la base, tout modèle hypothéco déductif repose sur une hypothèse et une réponse qui font consensus. Car le questionnement est posé dans un certain sens, pour attendre une certaine réponse, le plus souvent binaire. On a dans ce cas une forte probabilité d’avoir vu juste: 50%, même dans un modèle « non statistique ».
    Le raisonnement qui y conduit est toujours supposé direct, nécessaire, logique, l’existence d’une troisième voie étant, soit exclue par les conditions restrictives de l’hypothèse, soit réputée « hors normes ».
    Une façon dialectique de repousser alors les autres voies est de raisonner dans un système clos, qui renvoie l’argumentation à une tautologie; la boucle est bouclée.
    Dans le cas du « paradoxe du vote », on voit bien que les tests statistiques cachent des arguments qui font autorité; l’évidence primordiale relève alors de l’intuition qui n’est plus soumis à la critique, et qui peut entraîner des dérives.
    Je rejoins ainsi les commentaires en disant  » L’utilité espérée n’est pas une affaire de statistiques ». Les statistiques n’engageant que les statisticiens.

Laisser un commentaire