En soulevant le couvercle
D8, fossoyeur assumé de jeux télévisé, vient de déterrer "à prendre ou à laisser", plutôt connu entre 2004 et 2010 sous le nom de "jeu des boîtes d'Arthur". Le jeu est aujourd'hui présenté par Julien Courbet, mais il garde ses principes de base : ouvertures de boîtes, musiques de suspens, téléphone à cadran et candidats recalés de télé réalité.
Le principe du jeu est plutôt simple mais diablement efficace. 24 boîtes, contenant des sommes connues de 0.01 € à 100 000 € (jusqu'à 1 000 000 € dans les précédentes éditions de l'émission), sont confiées à des candidats qui ne connaissent par leur contenu. L'un des candidat est tiré au sort et aura le privilège d'ouvrir une par une les 23 autres boîtes, jusqu'à ce qu'il ne reste plus que la sienne. Le candidat gagne alors le contenu de sa boîte.
Là où le jeu passe du bingo traditionnel à une application de théorie des jeux, c'est que de nombreuses fois durant l'émission, le "banquier" appelle et propose un choix : échanger sa boîte avec un autre candidat, ou bien, accepter de vendre sa boîte au banquier.
La question que se pose n'importe quel candidat est alors la suivante : à quel moment faut-il échanger sa boîte ? à quel moment est-il préférable d'accepter la proposition pécuniaire du banquier ?
Paradoxe de Monty Hall
Le paradoxe de Monty Hall, par xkcd
Le problème de à prendre ou à laisser, à cause de cette possibilité d'échanger sa boîte, fait terriblement penser au paradoxe de Monty Hall (ou, dans son nom plus franchouillard, paradoxe du Bigdil). Pourtant, cela n'a rien à voir !
L'énoncé du problème de Monty Hall est le suivant :
Vous participez à un jeu télé, et vous êtes enfin arrivé en finale. Devant vous, trois portes A, B et C. Deux d'entre elles cachent une chèvre, la troisième cache une voiture. Bien sûr, vous jouez pour remporter la voiture et non la chèvre. Vous devez choisir une porte, et vous gagnerez ce que cache cette porte. Le choix de la porte se fera selon la procédure suivante :
- vous choisissez la porte de votre choix ;
- le présentateur ouvrira une porte que vous n'avez pas choisi et qui cache une chèvre (il connaît le lot attribué à chaque porte);
- vous avez la possibilité de changer de porte, et vous gagnez le contenu de la porte finalement retenue.
La question est la suivante : est-il préférable de changer de porte, ou bien, est-ce que cela ne change en rien les probabilités ?
Un raisonnement erroné consiste à dire que, au stade où il ne reste que deux portes, il y a une chance sur deux d'avoir la bonne porte, et que changer de choix ne change rien. Ce raisonnement est pourtant faux : en changeant de porte, on fait passer la probabilité de gagner la voiture de 33% à 67% !
Pour comprendre pourquoi les probabilités changent, il faut comprendre ce qu'il se passe quand l'animateur retire une chèvre : dans le cas où l'on se trompe dans le choix initial, l'animateur n'a pas le choix dans la chèvre qu'il devra retirer, et laissera nécessairement la voiture. Changer de choix assure alors de remporter la voiture. Cette situation arrive donc dans deux tiers des cas.
Si on choisit la voiture lors de son choix initial, l'animateur pourra retirer n'importe quelle autre porte, qui cachera forcément une chèvre. En changeant de choix, on tombera donc sur l'autre chèvre. Mais cette situation n'arrive que dans un tiers des cas (si la voiture a été choisie dès le début).
Finalement, en changeant de choix après la révélation de la chèvre par l'animateur, on est assuré de gagner la voiture avec une probabilité de 2/3. En fait, le choix de l'animateur apporte une information nouvelle que l'on peut utiliser pour renverser les probabilités de gagner.
On peut se convaincre du bienfondé du raisonnement en plaçant dans une situation où 100 portes sont présentes (99 chèvres, une voiture), et où l'animateur retire 98 chèvres lors de l'étape 2. La probabilité de tomber sur la voiture lors du choix initial est particulièrement faible (1/100), le changement de porte sera donc plus que conseillé.
Changer de boîte chez Courbet
Mais dans à prendre ou à laisser, la situation est complètement différente. Contrairement au paradoxe de Monty Hall, la phase d'élimination des boîtes est faite au hasard, et non par un animateur qui connaît le contenu des boîtes et cherche à ménager le suspens. L'ouverture des boîtes n'apporte donc aucune nouvelle information, et il est impossible de l'utiliser pour modifier les probabilités.
La probabilité de détenir la boîte à 100 000 € est donc de 1 / 24, et aucun changement de boîte ne peut modifier cette probabilité !
« Oui, mais pour le candidat d'hier, il ne lui restait au final que deux boîtes possibles, un contenant 100 000 € et une autre contenant une ventouse. Dans ce cas, il a bien une chance sur 2 de gagner le gros lot ! »
Effectivement ! Dans ce cas (que l'on échange ou non sa boîte), la probabilité de gagner les 100 000 € est bien de 1/2 (et donc, échanger sa boîte n'apporte pas un supplément de probabilité)
Mais "ce cas" (où la boîte à 100 000 € n'est pas éliminé pendant les 22 premiers tours) ne se présentera qu'avec une probabilité de une chance sur 12*, ce qui, puisque (1/2) x (1/12) = (1/24), nous ramène bien au fait que l'on a toujours que une chance sur 24 de remporter les 100 000 €.
Bref : la possibilité d'échanger sa boîte dans à prendre ou à laisser est un non-choix total ! Il est presque aussi pertinent que le choix des numéros que l'on coche dans une grille de loto (bien que, pour le loto, le partage des gains au rang 1 implique que certains numéros peuvent rapporter plus que d'autre).
Bon, pour être un peu honnête, la possibilité d'échanger sa boîte est là pour garantir l'équité du jeu. Étant donné que le banquier connaît la répartition des différentes somme entre les boîtes, il pourra systématiquement proposer des sommes inférieures au contenu de la boîte, rendant le jeu injuste. Une meilleure solution serait que le banquier ne connaisse pas le contenu des boîtes, comme dans les versions étrangères du jeu.
Une proposition que l'on ne peut pas refuser
Mais il reste un choix qui garde un sens : les propositions du banquier !
Après que l'on a éliminé six premières boîtes, le banquier appelle et offre la possibilité de racheter la boîte. D'autres propositions seront faite après 11 boîtes, 15, 18, 20, 21 et 22 boîtes éliminées.
La somme qu'il propose est systématiquement inférieure à la moyenne des sommes restantes en jeu (sauf lorsque ces montants sont dérisoires, le banquier a tendance à proposer un geste commercial), et plus le nombre de boîtes diminue, plus la somme proposée par le banquier se rapproche de la moyenne des boîtes restantes en jeu.
Une stratégie optimale consiste à jouer tant que le banquier ne propose pas de somme supérieure à 10 000 (ce qui correspond au gain moyen des 24 boîtes). Mais comme le banquier ne propose jamais des sommes supérieure au gain moyen, appliquer cette stratégie revient à refuser systématiquement les propositions, rendant forcément le jeu moins intéressant.
Pour être un peu précis, l'élimination initiale de 6 boîtes fait varier le gain moyen de 1250 € à 13500 €, mais la stratégie optimale n'a pas plus de chance de porter ses fruits.
La question est donc de savoir à quel moment il faut savoir vendre sa boîte, et c'est à ce moment que la théorie des probabilité laisse sa place aux théories économiques.
Grossièrement, les dilemmes de à prendre ou à laisser peuvent être résumées par « préférez vous gagner 40 000 € ou avoir une chance sur 2 de gagner 100 000 € ?». Dans le deuxième cas, l'espérance de gain est de 50 000 €, et c'est donc ce choix qu'il serait logique de prendre. Mais dans la pratique, une personne sensée choisira les 40 000 € garantis, puisque 60 000 € supplémentaires ne nous rendront pas plus heureux, il n'est pas raisonnable de risquer de les perdre. C'est donc cette notion de satisfaction qu'il faut prendre en compte ("l'utilité"), et non les valeurs absolues des sommes engagées. C'est finalement cette utilité que l'on cherche à maximiser quand on joue à un tel jeu.
Évidemment, la risquophilie est bénéfique pour le suspens de l'émission, et est donc encouragée ! Il a d'ailleurs été montré que les mécaniques mises en oeuvre par l'émission diminuent l'aversion au risque des candidats. C'est d'ailleurs pour cette raison que l'émission s'est pour la première fois arrêtée en 2010 : avec la crise, les candidats étaient devenus moins tolérant au risque...
Finalement, la meilleure stratégie consiste à se fixer une somme idéale satisfaisante, et à ne rien risquer pour la dépasser. D8, si vous me lisez, sachez que je suis prêt à venir dans l'émission pour y appliquer cette stratégie désespérément pragmatique !
Il existe cependant une véritable stratégie permettant à tous les candidats de gagner avec une bonne probabilité une somme autour de 10 000 € : il suffit que chaque jour, le candidat désigné n'accepte à aucun moment les offres du banquier, et garde sa boîte jusqu'au bout. En suivant cette stratégie, chaque candidat gagnera donc en moyenne 10 000 €, mais c'est après plusieurs semaines de jeu que la stratégie se met en place : il suffit que l'ensemble des candidats se partagent leur gains. Le risque associé à cette stratégie est bien plus faible, puisqu'il invoque la loi des grands nombres ! Le seul hic, c'est qu'il peut être compliqué de convaincre Crystal, la gogo-danseuse recalée des Ch'tis à Mykonos qui vient de gagner 50 000 € de partager ses gains avec Marie-Joe, prof de lettres à la retraite, qui a seulement gagné 0.42 €.
Bon, de toutes façons, il y Question pour un champion à la même heure sur France 3. A choisir, je préfère regarder ma maman qui y participe bientôt répondre à des questions sur le cyclisme, plutôt qu'un pourfendeur d'huissier s'accoquiner avec une candidate qui n'en a que faire des théories économiques de la gestion du risque. C'est finalement dommage qu'un laboratoire de théorie des jeux appliqués se soit transformé en réunion tupperware de toutes les superstitions les plus délirantes...
* D'un côté, on 1 chance sur 24 d'avoir la boîte à 100 000 €. On a donc une proba de 23/24 de ne pas l'avoir. Dans ce second cas, la probabilité de ne pas révéler la boîte à 100 000 € lors de la première ouverture est de 22/23. Si elle n'a pas été ouverte lors de la première révélation, la probabilité qu'elle ne le soit pas lors de la deuxième est de 21/22. etc. Au final, dans le cas où l'on ne possède pas soi-même la boîte à 100 000 €, la probabilité ne pas pas l'ouvrir avant qu'il n'en reste plus que deux est 23/24 × 22/23 × 21/22 × ... × 2/3 × 1/2 = 1/24. En ajoutant la probabilité de soi même détenir cette boîte, on retrouve bien cette probabilité de 1/12.
Sources :
Deal or No Deal? Decision Making under Risk in a Large-Payoff Game Show - T. Post, M. Van den Assem , G. Baltussen, R. Thaler
Images : une chèvre, une autre chèvre, une voiture