Deuxième partie du billet. La troisième et dernière partie demain.
Quelle est la légitimité du critère du maximin ? En quoi se critère est-il plus « moral » qu’un autre ? Est-ce vraiment le critère qu’utiliseraient des individus placés sous voile d’ignorance ? Il faut déjà noter que le maximin n’est bien sûr pas une invention de Rawls puisqu’il trouve son origine dans le théorème minimax de John von Neumann. Ce théorème s’applique à une classe particulière de problèmes de décision, les jeux à somme nulle, c’est à dire où les gains d’un joueur correspondent aux pertes de l’autre. Voici un exemple :
Pile |
Face |
|
Pile |
-5 ; 5 |
2 ; -2 |
Face |
-2 ; 2 |
5 ; -5 |
Le théorème du minimax (pour minimise le gain maximum de l’adversaire) indique que, dans un jeu à somme nulle, il existe une stratégie qui garantit à chaque joueur un gain minimum, quoique fasse l’autre joueur. Cette stratégie est celle qui minimise le gain maximum de l’adversaire, ce qui est la même chose que la stratégie qui maximise le gain minimum du joueur (maximin donc). Dans l’exemple ci-dessus, la stratégie minimax pour le joueur en ligne est face, et la stratégie minimax pour le joueur en colonne est pile. On voit facilement que 1) il s’agit également des stratégies maximin et 2) que le résultat (Face ; Pile) correspond au seul équilibre de Nash des jeux.
Dans un jeu à somme nulle, minimax et maximin sont donc formellement la même chose et tous deux correspondent à l’équilibre de Nash. Cependant, il n’est pas très compliqué de voir que cette propriété disparaît pour toutes les autres catégories de jeux : la plupart du temps, minimax et maximin débouchent sur des préconisations différentes et, surtout, ne correspondent pas nécessairement à un équilibre de Nash. Il n’y a dès lors plus de raison de donner une légitimité particulière au critère du maximin. Il semble clair qu’interpréter la position originelle comme un jeu à somme nulle est impossible : les joueurs ne connaissent pas leur situation passée et le choix s’opère entre des sociétés se différenciant en termes de bien-être collectif. Clairement, en adoptant le critère du maximin, Rawls défend une position non-orthodoxe vis-à-vis de la théorie de la décision.
En effet, ce que la théorie de la décision recommande comme critère de décision à des individus placés en voile d’ignorance n’est pas le maximin mais la maximisation de l’utilité espérée. Les agents doivent définir un ensemble de probabilités concernant la réalisation des différents états du monde (ici, les différentes positions sociales) et doivent choisir l’option qui maximise la somme, pondérée par les probabilités préalablement définies, des gains obtenus. Dans le cadre du voile d’ignorance, les probabilités correspondent nécessairement aux croyances subjectives des joueurs. En principe, chaque joueur peut appliquer n’importe quelle distribution concernant la probabilité d’occurrence des différents états du monde, mais le principe d’indifférence indique qu’en l’absence d’information pertinente indiquant le contraire, le choix par défaut consiste à attribuer la même probabilité à chaque état du monde. Cela semble être le cas pour ce qui concerne la position originelle. Si on reprend le tableau ci-dessus, on voit alors qu’un individu raisonnant de cette manière choisira la société qui maximise le bien-être total, à savoir la société B. Il n’échappera pas aux lecteurs que cela correspond à la solution utilitariste dans le cadre du voile d’ignorance.
On peut néanmoins objecter qu’il ne s’agit pas là d’un réel argument contre le critère du maximin. Après tout, nous avons deux critères de décision, et le seul fait que le maximin ait été à la base définie au travers de l’étude de jeux à somme nulle ne suffit pas à le disqualifier complètement quand il s’agit de l’étendre à d’autres problèmes de décision. Il y a toutefois des raisons de rejeter ce critère, notamment parce qu’il débouche sur des préconisations contre-intuitives, comme le montre John Harsanyi dans cet article où il discute du maximin rawlsien. Pour reprendre des exemples proches de ceux d’Harsanyi, imaginez que vous résidez à New York et que vous occupiez un emploi peu passionnant et mal payé ; on vous offre un emploi beaucoup pus intéressant et mieux rémunéré à Los Angeles. Vous devez choisir entre rester à New York, ou bien déménager à Los Angeles pour prendre ce nouvel emploi qui vous correspond largement plus. Bien sûr, si vous optez pour cette dernière option, il faut prendre l’avion, ce qui implique une probabilité non nulle de décéder dans un accident. Dans la mesure où vous préférez largement travailler à Los Angeles qu’à New York, et en supposant que la probabilité d’un crash d’avion est très faible, un simple calcul d’utilité espérée doit évidemment vous amener à déménager. Mais si vous raisonnez sur la base du critère du maximin, vous restez à New York car c’est bien cette dernière option qui maximise le gain minimum (le gain minimum en cas de déménagement étant la mort) ! Dans le même ordre d’idée, le principe de différence qui découle du critère de maximin conduirait un médecin, face à deux patients atteints d’une pneumonie, à traiter en priorité celui qui est par ailleurs atteint d’une maladie incurable, plutôt que celui qui est en bonne santé (nonobstant la pneumonie).
Ce dernier résultat est largement contre-intuitif sur le plan moral et anticipe pour partie l’objection que Rawls adresse aux exemples soulignant les résultats étranges auxquels mène le maximin. Dans un article justifiant la pertinence du critère du maximin dans le cadre la position originelle, Rawls écrit en effet :
« the maximin criterion is not meant to apply to small-scale situations, say, to how a doctor should treat his patients or university its students. (…) Maximin is a macro, not a micro principle » (p. 142)
Il faut admettre que cette réponse de Rawls est assez étrange, dans la mesure où ce n’est pas l’échelle mais plutôt la nature du problème de décision qui pourrait éventuellement justifier que l’on utilise un critère de décision particulier. En l’occurrence, on pourrait arguer que pour les problèmes moraux, le maximin est plus adapté ou intuitif que la maximisation de l’utilité espérée. Mais la position originelle est précisément censée être définie pour représenter un problème de décision moral, et on a vu qu’a priori il est difficile de justifier le recours au critère de maximin.
Dans la troisième partie, j’évoquerai d’autres arguments plus solides en faveur du critère du maximin…
Bonjour,
Merci pour cet article très intéressant et très clair sur un sujet passionnant !
Je me permets de vous adresser une question concernant les exemples de théorie de jeux que vous mentionnez et les stratégies minimax ou maximin.
Dans la situation suivante à somme nulle :
P F
P 1 / -1 -1 / 1
F -2 / 2 1 / -1
Pour le joueur 1 (en ligne), P semble être la stratégie maximin ou minimax (de l’adversaire) car elle garantit au minimum -1 alors que F ne garantit que -2.
Pour le joueur 2, P et F semblent être toutes deux des stratégies maximin et minimax.
En revanche, j’ai l’impression qu’il n’y a pas dans ce cas d’équilibre réciproque ou de Nash (en stratégie pure).
Ce cas est-il donc une exception au théorème vNM ?
Merci encore et au plaisir de vous lire !
Vincent
Merci pour votre commentaire.
En fait, l’exemple que vous proposez n’est pas une exception au théorème minimax : le seul équilibre de Nash est en stratégie mixte, et où le joueur en ligne joue P avec une probabilité de 3/5 et le joueur en colonne joue P avec une probabilité de 2/5. A l’équilibre, les gains espérés du joueur en ligne et du joueur en colonne sont respectivement de -1/5 et de 1/5. Vous remarquerez que ces gains sont supérieurs aux gains minimums maximums que les joueurs peuvent escompter s’ils ne jouent que des stratégies pures (-1 pour les deux joueurs). Par conséquent, la stratégie mixte de chacun des joueurs est aussi leur stratégie minimax (et maximin).
Ok je comprends mieux merci, le théorème porte donc sur les stratégies mixtes.
A bientôt.
Une façon d’apprécier le critère de Rawls est de le comparer à la « règle d’or » en éthique. Dans sa version négative, la règle d’or dit qu’il « ne faut pas faire à autrui ce qu’on n’aimerait pas que l’on nous fasse ». Dans sa version positive, elle dit qu’il « faut faire etc. ».
J’ai lu que cette règle est apparue sous des formes très semblable dans des cultures et à des époques différentes. On peut dire qu’elle a passé avec succès le test de la mémoire collective parce qu’elle est simple et intuitive. Nous sommes tous plus ou moins capables de nous mettre dans la peau de quelqu’un d’autre et de nous demander si l’on apprécierait tel ou tel traitement. L’idée est d’apprécier le critère normatif sur sa base de son succès, de son caractère intuitif et réaliste.
Une autre règle qui revient parfois dans la littérature est celle du « spectateur impartial ». Comparée à la règle d’or, elle est un peu plus complexe à mettre en oeuvre parce qu’elle demande que le lecteur se mette dans la peau d’un juge impartial. Il faut donc raisonner en termes de droit et non d’émotions subjectives.
Le critère de Rawls me semble encore plus complexe. Il exige que le lecteur se transforme en ingénieur social impartial. Il faut toujours endosser le rôle d’un tiers, comme dans la règle d’or. Comme dans le spectateur impartial, il faut également effectuer un raisonnement abstrait, en pas seulement de projeter des émotions. Mais cela exige de surcroît une capacité à calculer à l’avance la position sociale de chacun dans différentes sociétés possibles, et en particulier les coûts et les bénéfices pour les plus pauvres. Je ne vois pas quel usage pratique on pourrait faire d’un tel critère pour résoudre un dilemme moral ou face à une question concrète concernant les inégalités.
Je l’ai souvent vu cité – p. ex. chez Piketty, de mémoire – mais rarement appliqué. On ne voit d’ailleurs pas comment il pourrait l’être.
– À mon avis le nœud de la discussion concerne la portée à accorder à la théorie de Rawls. Voilà ce que j’en pense :
La théorie de Rawls est conçue comme une théorie du contrat social ; il lui fixe pour objectif de « généraliser et de porter à un plus haut degré d’abstraction la théorie traditionnelle du contrat social telle qu’elle se trouve chez Locke, Rousseau et Kant » (TJ).
En ce sens il est avec Rousseau, pour qui l’existence d’un contrat social se fonde sur la capacité pour l’homme à être doté d’une capacité morale d’ordre supérieur, d’une empathie, contre Hobbes (et contre l’utilitarisme), pour qui les individus sont maximisateurs d’utilité et au mieux indifférents entre eux.
Ainsi pour Rawls les individus, en raison de l’incertitude et de la rareté, choisissent de déléguer leur pouvoir à un État censé incarner le contrat social ; l’élection serait ainsi le moyen d’en délimiter les contours. Ceux qu’il préconise sont d’abord le principe d’égale liberté, ensuite le principe d’égalité des chances et le principe de différence, soit liberté, égalité, fraternité.
« Nous pouvons associer les idées traditionnelles de liberté, d’égalité et de fraternité avec l’interprétation démocratique des deux principes de la justice de la façon suivante : la liberté correspond au premier principe, l’égalité à l’idée d’égalité contenue dans le premier principe et à celle d’une juste (fair) égalité des chances, et la fraternité correspond au principe de différence » (TJ).
Il s’agit selon lui des principes élémentaires qui doivent fonder l’organisation d’une société bien ordonnée. Ils ne s’appliquent donc pas, pour Rawls, aux choix des individus mais à la structure de base, à savoir la structure légale coercitive. Ainsi sa théorie n’est pas une théorie de la décision individuelle mais une théorie du choix social et politique. Tu écartes cette position sans vraiment la discuter, en qualifiant d’étrange le caractère macro que Rawls attribue à sa théorie.
Dans le cadre de cette structure légale, les choix des individus sont libres conformément au 1er principe.
Ainsi tu écris que « le voile d’ignorance doit permettre au théoricien de déterminer quelle société serait choisie par des individus impartiaux ». Je ne pense pas que Rawls a conçu le voile d’ignorance comme un outil pour le théoricien mais plutôt pour la prise de décision politique au gouvernement auquel la population a délégué le pouvoir. Il s’agit donc plus d’un consensus que d’un accord total, ce que semble suggérer Harsanyi.
– Quelques points plus mineurs :
Tu discutes de la possibilité/impossibilité de présenter le principe de différence comme un jeu à somme nulle. C’est précisément parce qu’il ne l’est pas que Rawls l’a formulé. Il justifie l’existence d’inégalités en suggérant qu’une société marquée par un certain degré d’inégalités peut générer un niveau de richesse supérieur à une société entièrement égalitaire, en raison notamment d’incitations. Le principe de différence est donc conçu, à sa conception, comme un jeu à somme positive. Il échoue s’il est un jeu à somme nulle puisque cela signifierait que les inégalités ne profitent pas aux moins bien lotis.
Je ne comprends pas la valeur ni la portée de l’exemple New York/Los Angeles pour réfuter Rawls, puisque quelle que soit la circonstance (en avion, en vélo, à pied, en voiture, à NY, à LA, à Paris, à Londres), la probabilité de décéder dans un accident est non nulle, et il n’est pas sûr que la probabilité de décès dans un vol New York-Los Angeles soit supérieure à la probabilité de décès dans un déplacement entre le domicile et le lieu de travail ou dans n’importe quelle action ou inaction.
Quant à la dernière partie sur le risque extrême et sur les paris, elle s’appuie sur la validité de l’hypothèse défendue dans les deux premières parties selon laquelle le principe de différence est un principe utilitariste, ce qui me pose un certain nombre de problèmes, que j’ai évoqués précédemment.
@ Fab
Voici quelques éléments de réponse :
* « Il s’agit selon lui des principes élémentaires qui doivent fonder l’organisation d’une société bien ordonnée. Ils ne s’appliquent donc pas, pour Rawls, aux choix des individus mais à la structure de base, à savoir la structure légale coercitive. Ainsi sa théorie n’est pas une théorie de la décision individuelle mais une théorie du choix social et politique. Tu écartes cette position sans vraiment la discuter, en qualifiant d’étrange le caractère macro que Rawls attribue à sa théorie.
Dans le cadre de cette structure légale, les choix des individus sont libres conformément au 1er principe.
Ainsi tu écris que « le voile d’ignorance doit permettre au théoricien de déterminer quelle société serait choisie par des individus impartiaux ». Je ne pense pas que Rawls a conçu le voile d’ignorance comme un outil pour le théoricien mais plutôt pour la prise de décision politique au gouvernement auquel la population a délégué le pouvoir. Il s’agit donc plus d’un consensus que d’un accord total, ce que semble suggérer Harsanyi »
C’est effectivement une question essentielle. Cela dit, j’ai du mal à voir l’intérêt d’utiliser la position originelle autrement que de s’en servir pour se demander quel choix des individus raisonnables feraient s’ils étaient dans cette situation. La position a toute les caractéristiques nécessaire pour s’assurer que les individus feront un choix impartial, c’est à dire qui n’est pas fonction de caractéristiques personnelles. In fine, la question posée est « quelle décision des individus impartiaux prendraient concernant le structure de base de la société ? ».
Concernant le statut de la position originelle et du voile d’ignorance, il s’agit pour moi d’un « principe régulatif », i.e. une représentation qui doit nous (le chercheur, le politique, le citoyen) aider à penser un problème, en l’occurrence qu’est-ce qu’une société juste. Je ne suis pas du tout convaincu que Rawls concevait cet instrument comme quelque chose utilisable et applicable par le pouvoir politique pour mener des réformes concrètes (c’est d’ailleurs l’une des critiques habituelles qui est adressée à l’approche « transcendantale » de Ralws).
* « Tu discutes de la possibilité/impossibilité de présenter le principe de différence comme un jeu à somme nulle. C’est précisément parce qu’il ne l’est pas que Rawls l’a formulé. Il justifie l’existence d’inégalités en suggérant qu’une société marquée par un certain degré d’inégalités peut générer un niveau de richesse supérieur à une société entièrement égalitaire, en raison notamment d’incitations. Le principe de différence est donc conçu, à sa conception, comme un jeu à somme positive. Il échoue s’il est un jeu à somme nulle puisque cela signifierait que les inégalités ne profitent pas aux moins bien lotis. »
Précisément, le critère du maximin n’a en théorie de sens que dans le cadre d’un jeu à somme nulle. Le « jeu » que Rawls décrit avec la position originelle n’est pas à somme nulle, il ne peut donc pas en théorie l’utiliser.
* « Je ne comprends pas la valeur ni la portée de l’exemple New York/Los Angeles pour réfuter Rawls, puisque quelle que soit la circonstance (en avion, en vélo, à pied, en voiture, à NY, à LA, à Paris, à Londres), la probabilité de décéder dans un accident est non nulle, et il n’est pas sûr que la probabilité de décès dans un vol New York-Los Angeles soit supérieure à la probabilité de décès dans un déplacement entre le domicile et le lieu de travail ou dans n’importe quelle action ou inaction. »
Effectivement, c’est précisément l’un des aspects contre-intuitif du maximin : un individu qui utilise le maximin ne prendra jamais aucun « risque », ça ne peut donc un critère raisonnable pour la plupart des problèmes de décision.
* « Quant à la dernière partie sur le risque extrême et sur les paris, elle s’appuie sur la validité de l’hypothèse défendue dans les deux premières parties selon laquelle le principe de différence est un principe utilitariste, ce qui me pose un certain nombre de problèmes, que j’ai évoqués précédemment ».
Le principe de différence n’est pas un principe utilitariste, puisque une société qui satisfait le principe de différence peut par ailleurs ne pas maximiser l’utilité totale (voir le papier de 74 de Rawls). Le problème est ailleurs : en imaginant la position originelle qu’il emprunte d’ailleurs à Harsanyi, Rawls construit d’emblée un cadre d’analyse dans lequel la théorie de la décision (qui n’est pas utilitariste, cf. Savage and Co) doit naturellement s’appliquer. Mais Rawls la rejette, avec des arguments pas complétement convaincants (c’est l’objet de mes trois billets) pour lui substituer un critère de décision douteux, lequel fonde le principe de différence. Le point, c’est que l’on ne peut probablement pas défendre le principe de différence à partir de la position originelle.