Paradoxe des deux enfants

En théorie des probabilités, le paradoxe des deux enfants consiste à estimer le sexe d'un enfant parmi deux à partir de l'observation de l'autre, exemple-type d'inférence bayésienne. Il y a paradoxe pour deux raisons : d'une part la bonne réponse (l'autre enfant a davantage de chances d'être de sexe opposé) est contre-intuitive pour beaucoup de personnes, et d'autre part des formulations très voisines du problème mènent à un résultat différent.

Énoncé original

Formulation

La première occurrence de ce problème est un article de Martin Gardner, paru dans la revue Scientific American en 1959 sous le titre The Two Children Problem[1].

Mr. Jones has two children. The older child is a girl. What is the probability that both children are girls?
Mr. Smith has two children. At least one of them is a boy. What is the probability that both children are boys?
M. Jones a deux enfants. L'enfant aîné est une fille. Quelle est la probabilité que les deux enfants soient des filles ?
M. Smith a deux enfants. Au moins l'un des deux est un garçon. Quelle est la probabilité que les deux enfants soient des garçons ?

Dans cet article, les probabilités étaient évaluées respectivement à 1/2 et 1/3. Cela signifie que, parmi toutes les familles de deux enfants avec une fille en première position, la moitié d'entre elles a en réalité deux filles, tandis que, parmi toutes les familles de deux enfants avec au moins un garçon, un tiers d'entre elles a en fait deux garçons.

Mais Martin Gardner a reconnu plus tard que la seconde question était ambiguë[1]. En effet, la manière dont est acquise l'information selon laquelle il y a au moins un garçon influence la réponse à la question, qui peut alors varier de 1/3 à 1/2.

De nombreuses variantes de ce problème montrent l'importance de la formulation dans le calcul du résultat.

Hypothèses implicites

D'une part les sexes des enfants sont supposés indépendants d'un enfant à l'autre en l'absence d'hypothèse supplémentaire. D'autre part, chaque enfant peut être un garçon ou une fille de façon équiprobable.

Ces hypothèses ne traduisent pas exactement la réalité. D'une part, la possibilité que les enfants soient des jumeaux monozygotes contredit a priori l'indépendance des sexes et fait augmenter légèrement les deux probabilités calculées précédemment. D'autre part, les proportions des deux sexes sont inégales et varient même selon l'âge et le pays[2].

La correction de ces approximations fait varier les probabilités d'au plus quelques pourcents, ce qui ne change pas le résultat du paradoxe.

Explication par tableau

On distingue les quatre possibilités pour le sexe de deux enfants d'une famille à l'aide d'un tableau à double entrée :

Sexe du deuxième enfant
FilleGarçon
Sexe du premier enfant FilleFFFG
GarçonGFGG

D'après les hypothèses implicites, ces quatre possibilités sont équiprobables. Il suffit alors de déterminer le rapport du nombre de cas favorables par le nombre de cas possibles dans chaque famille.

Dans la famille de M. Jones, les seuls cas possibles sont notés FF et FG et le seul cas favorable est FF. La probabilité que les deux enfants soient des filles vaut donc 1/2.

Dans la famille de M. Smith, les cas possibles sont FG, GF et GG, alors que le seul cas favorable est GG. La probabilité que les deux enfants soient des garçons vaut donc 1/3.

Calcul formel avec probabilités conditionnelles

Le calcul peut être effectué avec les notations d'événements :

  •  : « le premier enfant est une fille » ;
  •  : « le deuxième enfant est une fille ».
Famille Jones

La probabilité qu'il y ait deux filles dans la famille Jones est alors la probabilité de l'intersection de ces deux événements, sous la condition du premier événement :

or, par indépendance de et ,

Cette probabilité vaut donc 1/2 d'après les hypothèses implicites.

Famille Smith

La probabilité qu'il y ait deux garçons dans la famille Smith s'écrit :

la dernière égalité se déduisant des propriétés des opérations ensemblistes, notamment d'une des lois de De Morgan. Puis par passage au complémentaire et indépendance des événements et ,

Acquisition de l'information

Le calcul effectué précédemment suppose que la famille Smith se retrouve de façon équiprobable de l'une des trois cases du tableau intitulées FG, GF et GG. Or l'information selon laquelle il y a au moins un garçon peut être obtenue de différentes manières :

  1. À la question « Avez-vous au moins un garçon ? », M. Smith répond « Oui. » (événement ) ;
  2. À la demande « Indiquez-moi le sexe de l'un de vos enfants. », M. Smith répond « J'ai (au moins) un garçon. » (événement ).

Dans le premier cas, la probabilité qu'il y ait deux garçons correspond effectivement à la probabilité conditionnelle calculée précédemment et qui vaut 1/3. Mais dans le deuxième cas, le fait que M. Smith choisisse de mentionner un garçon affaiblit la probabilité qu'il y ait une fille, sauf à supposer qu'un parent choisit toujours de mentionner un garçon lorsqu'il en a un. En supposant qu'un parent d'un garçon et d'une fille mentionne l'un ou l'autre de façon équiprobable, la probabilité que M. Smith ait deux garçons remonte à 1/2.

Explication par tableaux

Le premier cas (« Avez-vous au moins un garçon ? — Oui. ») correspond exactement au tableau donné précédemment. L'information donnée par M. Smith permettant d'éliminer le cas FF du tableau, et les trois autres possibilités étant équiprobables d'après les hypothèses implicites, la probabilité du cas GG est 1/3.

Pour le deuxième cas, on distingue comme antérieurement les quatre possibilités de sexe, et on écrit dans le tableau à double entrée ce que M. Smith peut répondre :

Sexe du deuxième enfant
FilleGarçon
Sexe du premier enfant FilleFF
« une fille »
FG
« une fille » ou bien « un garçon »
GarçonGF
« une fille » ou bien « un garçon »
GG
« un garçon »

M. Smith a répondu « un garçon », le cas FF est donc éliminé. M. Smith peut se trouver dans la situation GG, GF ou bien FG, ces trois situations étant équiprobables et associées à une probabilité d’1/3. Si l'autre enfant de M. Smith est une fille (GF ou FG), les deux réponses « un garçon » ou « une fille » sont possibles. En supposant qu'un parent dans cette situation répond sans préférence particulière, la réponse « un garçon » recueille la moitié de la probabilité de chaque situation, soit 1/6 pour GF et 1/6 pour FG, soit 1/3 au total. Si l'autre enfant de M. Smith est un garçon (GG), la réponse « un garçon » a la probabilité de la situation, soit 1/3 également. La probabilité que M. Smith réponde « un garçon » alors qu'il a aussi une fille (GF ou FG) ou alors qu'il a un second garçon (GG) sont donc égales, ce qui fait que la probabilité qu'il ait un second garçon est 1/2.

Calcul formel avec probabilités conditionnelles

D'autres manières d'acquérir l'information sur le sexe d'un enfant s'apparentent au deuxième cas, comme la rencontre d'un garçon disant être le fils de M. Smith.

Particularisation

Un autre biais de la formulation d'origine pour M. Smith est le recours à l'expression « l'un des deux » qui peut particulariser l'un des enfants de la même manière que le fait l'ordre de naissance. Cette particularisation peut être entérinée par la question « Quelle est la probabilité que l'autre enfant soit un garçon (aussi) ? » qui est parfois utilisée. À partir du moment où l'un et l'autre sont identifiés, le sexe de « l'autre » est indépendant de l'information fournie et la probabilité qu'il soit un garçon est bien 1/2.

Ce problème a été étudié par Fox et Levav[3], qui ont comparé les réponses aux questions suivantes :

  1. Mr. Smith says: "I have two children and at least one of them is a boy." Given this information, what is the probability that the other child is a boy?
  2. Mr. Smith says: "I have two children and it is not the case that they are both girls." Given this information, what is the probability that both children are boys?
  1. M. Smith dit : « J'ai deux enfants et au moins l'un d'entre eux est un garçon. » Étant donnée cette information, quelle est la probabilité que l'autre enfant soit un garçon ?
  2. M. Smith dit : « J'ai deux enfants et il ne s'agit pas de deux filles. » Étant donnée cette information, quelle est la probabilité que les deux enfants soient des garçons ?

L'étude a montré que 85 % des participants donnaient la valeur 1/2 à la première question et seulement 39 % répondaient ainsi à la seconde.

Variantes

Les variantes les plus courantes du paradoxe des deux enfants consistent à joindre une autre information au sexe.

Jour de naissance

Lê Nguyên Hoang propose de considérer une famille de deux enfants, dont au moins l'un des enfants est un garçon né un mardi. On se demande quelle est la probabilité que l'autre enfant soit un garçon aussi[4].

En supposant l'équiprobabilité, un enfant est un garçon né un mardi avec une probabilité de , c'est un garçon né un autre jour avec probabilité , et une fille avec probabilité . Pour deux enfants, on obtient les probabilités suivantes :

Probabilité a priori Deuxième enfant
GarçonFille
né un mardiné un autre jour
Premier enfant Garçon né un mardi
né un autre jour
Fille

Sachant que la famille a au moins un garçon né un mardi, on peut éliminer les cases ce qui ne correspondent ni à la première ligne, ni à la première colonne. On obtient alors par le calcul des probabilités conditionnelles que la probabilité recherchée est :

Prénom

Jean-Paul Delahaye a présenté le paradoxe suivant, inventé par Jacques Patarin[réf. nécessaire],[5]: déterminer la probabilité que deux enfants soient des filles sachant qu'il y a au moins une fille prénommée Sophie parmi eux[6]. L'information supplémentaire sur le prénom de la fille revient alors à particulariser l'enfant dont on parle, ce qui entraîne que la probabilité cherchée vaut à peu près 1/2.

Plus généralement, il montre que la probabilité que les deux enfants soient du même sexe sachant qu'au moins l'un d'eux est une fille avec une particularité de probabilité , est égale à .

Plus est faible — c'est-à-dire plus l'information particularise la fille (comme son prénom) — plus la probabilité est proche de 1/2, tandis que plus est proche de 1 — l'information n'apporte pas grand chose — plus la probabilité est proche de 1/3 du problème original.

Intuitivement, cela peut se comprendre en voyant que si est faible, alors il est presque deux fois plus probable que l'on retrouve la particularité parmi deux filles plutôt qu'une seule, et on a donc presque autant de chance d'avoir « fille-fille » plutôt que « fille-garçon ou garçon-fille ». Mais si est proche de 1, la particularité est vérifiée avec probabilité proche de 1 dès qu'il y a même une seule fille, et « fille-fille » reste donc à peu près deux fois moins probable que « fille-garçon ou garçon-fille ».

Notes

  1. (en) Martin Gardner, The Second Scientific American Book of Mathematical Puzzles and Diversions, Simon & Schuster, , 254 p. (ISBN 978-0-226-28253-4)
  2. Proportion de garçons et de filles selon les âges et les pays
  3. Craig R. Fox & Jonathan Levav, « Partition–Edit–Count: Naive Extensional Reasoning in Judgment of Conditional Probability », Journal of Experimental Psychology, vol. 133, no 4, , p. 626–642 (PMID 15584810, DOI 10.1037/0096-3445.133.4.626)
  4. Science4All, « 3 variantes mindfucks des 2 enfants | Bayes 6 », (consulté le )
  5. Jacques Patarin, « Le Paradoxe des Sophies »(ArchiveWikiwixArchive.isGoogle • Que faire ?) (consulté le )
  6. Jean-Paul Delahaye, « Le trésor et les Sophies », Pour la science n° 336, octobre 2005.

Articles connexes

  • Portail des probabilités et de la statistique
Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.