1. Contexte:
Deux forbans (ils sont vraiment très méchants
et totalement immoraux) sont écroués par une très
noble et très futée force policière qui les soupçonne
d'avoir commis quelque forfait. Mais hélas -pour les honnêtes
gens comme vous et moi- aucune preuve n'est disponible qui permettrait
de les condamner comme ils le méritent. À peine pourrait-on
les incriminer pour un délit mineur.
On les enferme alors dans deux cellules distinctes, sans aucun contact.
On propose à l'un et à l'autre le marché suivant (en
effet même la justice n'échappe pas à la logique du
marché), dans la plus pure tradition du plea bargaining.
2. Une proposition:
À chacun on lit la proposition suivante: "Si tu (en effet on tutoie les mécréants) avoues ton crime et que ton comparse fait de même, vous écoperez chacun de 6 ans d'emprisonnement; si tu avoues et que ton comparse ne le fait point (les bandits sont toujours impressionnées quand on utilise "point" plutôt que "pas") tu seras libéré et ton comparse passera les 10 prochaines années (à rêver à toi, songe le policier) derrière les barreaux . Si au contraire tu n'avoues pas et que ton comparse parle, il sera libéré et tu végéteras en prison durant 10 bonnes années (c'était avant l'apparition de la Commission des libérations conditionnelles). Si vous refusez tous les deux de parler, vous serez enfermés pour trois ans.
3. La présentation du Jeu:
Appelons joueur A et joueur B les prisonniers en puissance.
Dans le rectangle qui apparaît ci-dessous est décrite la matrice
de gains du jeu: on y inscrit les actions à la disposition des joueurs
de même que les "gains" qui leur correspondent: P signifie parler
et NP signifie ne pas parler. Les couples de nombres indiquent les années
de prison qui correspondent aux choix d'actions effectués, celui
de gauche représentant le sort réservé à A
et celui de droite le sort réservé à B.
Matrice de gains du jeu du dilemme du prisonnier.
| Joueur A | |||
|
Joueur B |
P | NP | |
| P | 6 6 | 0 10 | |
| NP | 10 0 | 3 3 | |
Lecture du jeu:
Le joueur A dispose d'un choix entre deux actions. Il peut choisir de parler (P) ou de ne pas parler (NP). Les conséquences de sa décision dépendra de la décision de B qui dispose du même choix. Ainsi la matrice des gains nous indique que si A décide de parler (P) alors que B choisit lui aussi de parler (P) alors au croisement de la rangée P du joueur A et de la colonne P du joueur B, on lit 6,6 ce qui indique 6 ans de prison pour A et 6 ans de prison pour B. Si au contraire B choisit de se taire (NP) alors que A décide de parler (P) alors au croisement de la rangée P du joueur A et de la colonne NP du joueur B on lit les gains 0,10 ce qui indique que le joueur A sera libéré et que le joueur B écopera de 10 ans de prison. Mais si A décide de ne pas parler et que B parle, A écopera de 10 ans et son comparse prendra la clef des champs; enfin si A et B tiennent tous deux leur langue chacun sera condamné à 3 ans. On aura compris que les joueurs ont comme objectif de minimiser leur gain soit le nombre d'années passées à l'ombre.
| Joueur A | |||
|
Joueur B |
P | NP | |
| P | 6 6 | 0 10 | |
| NP | 10 0 | 3 3 | |
4. La résolution du jeu:
Chacun tentera donc dans son propre intérêt d'obtenir la peine la plus faible possible, un objectif qu'il chechera à atteindre en tenant compte, bien sûr, de ce que l'autre est susceptible de faire. Plaçons-nous dans la situation de A et raisonnons avec lui: si B choisit de parler, j'ai manifestement intérêt à parler car ainsi j'aurai 6 ans alors que si je ne parle pas j'en aurai 10. Par contre, si B choisit de ne pas parler, j'ai encore intérêt à parler ce qui me libérera alors que si je ne parle pas j'aurai 3 ans. Le joueur A est devant ce que la théorie des jeux appelle une stratégie dominante c'est-à-dire une action qui rapporte le meilleur gain quelque soit le choix d'action de l'autre joueur. En conclusion, il est évident que le joueur A parlera. Il suffit de refaire le raisonnement en se plaçant cette fois-ci dans la peau de B pour déduire que lui aussi parlera. Les deux prisonniers avouant, ils écoperont de 3 ans chacun. On a identifié une situation d'équilibre, c'est-à-dire une situation dans laquelle aucun joeur n'a intérêt à modifier son comportement compte-tenu du comportement attendu de l'autre joueur.
5. Commentaire.
L'intérêt théorique de ce petit
modèle tient au démenti qu'il offre à la proposition
(normative) du libéralisme selon laquelle la recherche de leur intérêt
personnel par les membres d'une collectivité garantit toujours
leur mieux-être. On montre en effet ici que la poursuite individuelle
de son propre intérêt -la peine la plus légère-
aboutit à un résultat commun de 12 ans de prison (6,6) qui
n'est pas optimal puisque la collaboration entre les deux prisonniers leur
aurait assuré un résultat supérieur, soit 6 ans de
prison (3,3). Le dilemme du prisonnier est donc devenu l'archétype
de situations dans lesquelles des individus, des firmes, des organisations
ou même des pays qui ont un intérêt collectif à
coopérer préfèrent tricher compte-tenu de l'intérêt
de chacun à le faire et donc compte-tenu du risque élevé
que chacun le fasse. Voilà donc un intéressant paradoxe:
la recherche de l'intérêt individuel aboutit à la destruction
de cet intérêt.