Procrastination, préférence conditionnelle pour la conformité et raisonnement d’équipe

C.H.

Note : voici un billet que je voulais écrire depuis longtemps…

Venant à peine de déménager, j’ai eu et j’ai encore pas mal de formalités administratives à régler. Cela a été l’occasion de me rappeler à quel point j’ai tendance à remettre au lendemain ce que je pourrais et devrais faire aujourd’hui. Cela dit, je ne suis certainement pas le seul dans ce cas ; la procrastination est certainement l’un des défauts les plus partagés. L’analyse économique rend traditionnellement compte de ce phénomène au travers d’une analyse en termes de « moi multiples ». Un même individu est identifié par une collection d’agents « transitoires » identifiés chacun par leur propre fonction d’utilité et agissant lors d’une seule et unique période. A chaque période, l’agent agit de telle sorte à maximiser son utilité intertemporelle. Une telle formalisation peut déboucher sur différents résultats.

Traditionnellement, les économistes considèrent que les individus optimisent une fonction d’utilité intertemporelle en actualisant les gains futurs de manière non linéaire ; c’est l’actualisation exponentielle. En fait, la psychologie et l’économie comportementale indiquent que les individus (mais aussi les animaux) actualisent les gains futurs de manière plutôt hyperbolique. L’actualisation hyperbolique rend possible un phénomène intéressant : l’inversion des préférences qui signifie qu’à un moment t, A est préféré à B, mais qu’à un moment t+n, B devient préféré à A. Imaginons un individu que l’on identifiera comme un enseignant qui doit corriger un gros paquet de copies. Il reste à notre enseignant 3 soirées pour corriger ses copies et l’on considérera ses soirées comme autant de périodes auxquelles correspondent trois agents P1, P2 et P3. L’utilité de chaque agent correspond à v(x) avec x = [corriger les copies ; ne pas corriger les copies] les deux options disponibles. Nos agents sont cependant partiellement altruistes les uns envers les autres, de telle sorte qu’ils maximisent une fonction u décrivant les préférences de l’agent concernant le fait de corriger ou non les copies au moment présent. Un agent situé à la période t optimisera alors la fonction suivante :

 ut = at,1 v1(x1) + at,2 v2(x2) + at,3 v3(x3)

Le paramètre at,i décrit l’importance que l’agent situé à la période t accorde à l’utilité que tire les agents i présent et futurs. On considère que l’agent n’a que des préférences pour les comportements futurs ; les comportements passés sont ignorés étant donnés qu’aucune préférence ne s’applique à eux. On suppose que les trois agents ont des préférences temporelles identiques, c’est-à-dire que a1,2/a1,3 = a2,2/a2,3 (les poids relatifs que P1 confère à l’utilité dont il bénéficie pour les périodes 2 et 3 doit être le même que les poids relatifs que P2 confère à l’utilité pour ces mêmes périodes). Il nous faut décrire la valeur des paramètres at,i. Si on adopte une actualisation exponentielle habituelle, alors on aura a1,1 = a2,2 = a3,3 = 1, a1,2 = a2,3 = β et a1,3 = β2 avec β le facteur d’actualisation compris entre  0 et 1. Comme je l’ai indiqué plus haut, l’actualisation exponentielle n’est souvent pas un bon moyen de décrire les choix intertemporels des individus. Il est facile ici de modifier la valeur des paramètres at,i pour obtenir une actualisation hyperbolique. Il suffit pour cela de définir un paramètre γ > 1 de préférence pour le présente et de poser : a1,1 = a2,2 = a3,3 = γ et a1,2 = a2,3 = a1,3 = a2,1 = a3,1 = a3,2 = 1. Ici, un agent donne la même valeur aux gains de toutes les périodes sauf à ceux de la période qui correspond à son activité. Dans ce cadre, le comportement stratégique de chaque agent peut déboucher sur un résultat sous-optimal.

Reprenons notre enseignant. Lors de la première soirée, celui-ci, au travers de l’agent P1, a le choix entre corriger et ne pas corriger ses copies. Corriger les copies lui procure une désutilité de -3, ne pas corriger une utilité de 0. Il en va de même pour l’agent P2 le deuxième soir. Lors du troisième soir, l’agent P3 n’a pas le choix : il doit corriger des copies s’il en reste. Si P1 et P2 n’ont pas travaillé les soirs précédents, P3 a une utilité de 0. S’il doit en corriger la moitiés (P1 ou P2 a corrigé l’autre moitié), il gagne 5. Il bénéficie d’un gain de 10 s’il n’a rien à faire. Posons γ = 2. Le jeu en forme normale est alors le suivant :  

      P2  
    Corriger   Ne pas corriger
  Corriger  1 ; 1 ; 14    -1 ; 2 ; 7
P1        
  Ne pas corriger  2 ; -1 ; 7    0 ; 0 ; 0

 Les gains dans chaque entrée de la matrice sont respectivement ceux de P1, P2 et P3. Le jeu à la structure d’un dilemme du prisonnier avec « ne pas corriger » la stratégie dominante. Dans ce cadre stratégique, l’interaction entre ses « moi multiples » conduit notre enseignant à attendre le dernier soir pour corriger ses copies, solution clairement « collectivement » sous-optimale.

Peut-on aider cet enseignant à ne pas tomber dans le piège de la procrastination ? Une première solution, décrite par George Ainslie, est de présupposer que les trois agents P1, P2 et P3 peuvent marchander et négocier entre eux un accord qui soit meilleur pour tous. Plus précisément, l’enseignant peut instaurer des règles personnelles s’appliquant à son comportement. Une règle personnelle serait du type par exemple : « je ne bois que le week-end » ou « je ne ferai pas de soirée les deux semaines qui précèdent mes examens » ou encore, en ce qui concerne notre enseignant, « je ne corrigerai jamais mes copies au dernier moment ». On peut considérer que ces règles personnelles sont analogues à des règles de (bonne) gouvernance qui peuvent s’appliquer dans les organisations. Bien entendu, pour avoir une chance d’être effective, ces règles doivent être crédibles, dans le sens où elles doivent prescrire des comportements que les agents ont intérêt à entreprendre. Cela est possible si l’on dote les agents d’une préférence conditionnelle pour la conformité : l’agent P1 préfère respecter une règle personnelle s’il pense que P2 en fera de même. Ainslie indique que pour l’individu, cela revient à considérer que le comportement présent est un indicateur sur le comportement futur : si je me conforme à la règle personnelle aujourd’hui, alors j’ai d’autant plus de chance de me conformer à la règle demain. On peut écrire une fonction d’utilité Ut pour incorporer cette préférence pour la conformité :

 Ut = ut kt max[um(xn), N(xn)) – um((xn), (x-n)), 0]

Le paramètre k > 0 mesure le degré de préférence conditionnelle pour la conformité. L’expression um((xn), N(xn)) décrit l’utilité de tous les agents lorsque tout le monde se conforme à la norme N ; um((xn),(x-n)) décrit les gains d’un agent lorsqu’il est le seul à se conformer à la norme.  Cette fonction indique qu’un agent subira une désutilité s’il dévie de la norme alors que les autres s’y conforment ou s’il se conforme à la norme et que les autres dévient. Avec l’exemple numérique ci-dessous, si l’enseignant se fixe comme règle personnelle de ne jamais corriger ses copies au dernier moment (donc P1 et P2 doivent tous les deux corriger), la nouvelle matrice devient : 

      P2  
    Corriger   Ne pas corriger
  Corriger 1 ;1 ; 14    -1 – 2k ; 2 -2k ; 7
P1        
  Ne pas corriger  2 – 2k ; -1 – 2k ; 7   0 , 0 , 0

 Si k > ½, alors ne pas corriger n’est pas plus la stratégie dominante ; la correction par P1 et P2 est devenu un équilibre dans ce qui ressemble à un « jeu de l’assurance ». L’existence de règles personnelles n’évite pas à coup sûr la procrastination (« ne pas corriger » est toujours un équilibre) mais améliore quand même la situation.

Il existe une autre solution : raisonner en équipe. Après tout, nos trois agents sont liés par un destin commun. Plutôt que de raisonner individuellement en tentant d’optimiser leur propre utilité, pourquoi ne pas se placer dans une autre perspective en essayant d’optimiser une fonction d’utilité collective. Autrement dit, cela revient pour les agents à raisonner en termes de « nous » et non en termes de « je ». Pour l’enseignant, cela consiste à voir son activité d’aujourd’hui comme une partie d’une activité plus générale qui se déroule dans le temps. C’est la notion de raisonnement en équipe développée par Michael Bacharach. Raisonner en équipe veut dire agir de manière à optimiser l’utilité collective d’un groupe ou d’une équipe. Un agent raisonne en équipe s’il procède ainsi : il repère d’abord le profil d’actions qui donne l’utilité la plus élevée d’un point de vue collectif (c’est-à-dire en faisant la somme des utilités individuelles sans pondération) ; il identifie ensuite l’action qu’il doit entreprendre dans le cadre de ce profil ; enfin, il exécute cette action. Mettons nous à la place de P1, c’est-à-dire notre enseignant le premier soir. Si l’on reprend la première matrice, il est évident que le profil d’actions [corriger ; corriger] est le plus désirable sur un plan collectif. P1 repère donc facilement que, pour atteindre ce résultat, il doit corriger des copies. Par conséquent, si P1 raisonne en équipe, il choisira de corriger des copies. Si P2 adopte ce même raisonnement, il fera de même. Le raisonnement en équipe découle d’une représentation (au sens de framing) spécifique d’une situation. Ce type de représentation conduit à modifier la matrice du point de vue de chaque agent :  

      P2  
    Corriger   Ne pas corriger
  Corriger 16   8
P1        
  Ne pas corriger 8   0

Par définition, les gains qui figurent dans chaque entrée sont les gains de tous les agents, autrement dit de l’enseignant. « Corriger » devient le seul équilibre de ce jeu ainsi transformé. Concevoir ses moi multiples comme appartenant à une seule et même équipe est donc un moyen de combattre la procrastination. Cette notion de raisonnement en équipe est très intéressante et peut évidemment s’étendre à de véritables interactions stratégiques. J’y reviendrai très prochainement.

9 Commentaires

Classé dans Non classé

9 réponses à “Procrastination, préférence conditionnelle pour la conformité et raisonnement d’équipe

  1. MacroPED

    je profite de ça pour vous rappeler que j’attends toujours vos commentaires…

  2. MarcO

    Bonjour,

    C’est vraiment très intéressant comme concept: de l’organisation personnelle sous forme économique.

    J’a toujours un peu de mal à comprendre la représentation du jeu en forme normale. Connaitriez vous une bonne référence (bonne = pédagogique) sur ce sujet pour comprendre cette représentation pour un néophyte?

    Merci beaucoup en tout cas.

    • C.H.

      En français, vous pouvez essayer l’ouvrage de Bernard Guerrien sur la théorie des jeux, même si son partie pris de la critiquer tout en l’expliquant est discutable. En anglais, ceux de Dixit et Nalebuff et de Dixit et Skeath sont pas mal et très accessibles.

  3. MarcO

    Merci beaucoup pour ces ref

  4. SG

    Au risque de paraître ignorant ou pisse-froid, ce qui me frappe dans cet exemple c’est l’absence de « plus-value » apportée par ce modèle. Car les conclusions (les « solutions ») apportées n’ont rien d’original (j’ai intérêt à corriger maintenant comme ça j’en suis débarrassé et je passe un bon week-end). Le problème est « seulement » transcrit dans une autre langue, celle des économistes de la théorie des jeux. Par contre, il me semble qu’il y a une « moins-value » puisque le modèle ignore que la procrastination est en soi une source de plaisir (ne pas corriger maintenant peut m’apporter une « utilité », celle de jouir maintenant de mon temps libre): indiquer une utilité nulle au fait de ne pas corriger maintenant me paraît bien discutable. Si on modifie ce paramètre, la solution est modifiée. Ce qui revient à dire que le résultat dépend de l’utilité qu’a chacun à reporter la correction. On est bien avancé…
    Eclairez-moi…

  5. Sahelonline

    Vous connaissez, ça : http://www.bouletcorp.com/blog/index.php?date=20101108 ?🙂 Application auto-psy de votre principe de raisonnement en équipe, qui implique toutefois, en plus des différents « moi futurs », un « moi passé » sur qui se défouler un peu pour enclencher le processus. Et en plus, c’est de la B.D. Enjoy !

  6. Nicolas Clauss

    Bonjour, cet article est vraiment intéressant. Je le lis avec la référence de celui paru dans Le Monde du 7 janvier 2011. Connaissez vous les travaux de Gerald Bronner ? Il explore avec une approche en sociologie cognitive les dissonances cognitives à la faculté de sciences sociales de l’université de Strasbourg, notamment à propos des croyances. Pour ma part l’approche socianalytique permettrait une autre lecture de ces expériences, mettant en avant plusieurs dynamiques de nature sociale dont un individu pourrait être simultanément porteur et dont la prévalence de l’une à un temps t pourrait l’emporter sur les autres. Nicolas Clauss, socianalyste, CAP, Paris

  7. Marc

    impressionnante mise en équation des comportements humains même si j’aimerais lire une réponse aux arguments apportés par SG qui relativisent l’étonnante étude…

  8. Totoro

    Ce ticket est vraiment très intéressant🙂. Je trouve un peu dommage que le texte soit en gris moyen sur font gris clair, ça n’aide pas à la lecture, j’ai été obligé de zoomer la page pour ne pas trop m’abimer les yeux et le cou😉. Un texte dans un gris sombre ou noir aurais permis une meilleure optimisation de la lecture, tout en réduisant la consommation électrique sur les écrans à LED.

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s