ChronoMath, une chronologie des MATHÉMATIQUES
à l'usage des professeurs de mathématiques, des étudiants et des élèves des lycées & collèges


Loi hypergéométrique             Aller au programme , loi géométrique (loi de Pascal) , exercices

Sous ce nom sophistiqué se cache une loi de probabilité très simple basée sur la combinatoire que l'on rencontre dans de nombreux exercices de base au lycée :

Considérons une population d'effectif N dont on sait qu'un pourcentage p d'éléments possèdent un caractère étudié C. On extrait au hasard un échantillon de n éléments, tirage exhaustif de n éléments (c'est à dire n tirages sans remise). Quelle est alors la probabilité que k d'entre eux possèdent le caractère C ?

Si m désigne le nombre d'éléments possédant le caractère C, alors p = m/N et on peut reformuler le problème en remplaçant la connaissance de p par celle de m et considérer le problème en termes de tirages aléatoires à la façon de boules dans une urne :

il s'agit d'un tirage simultané de n objets parmi N (équivalant à n tirages sans remise) et on s'intéresse à la variable aléatoire X égale au nombre k (k m) d'apparitions d'éléments ayant le caractère étudié sachant que leur effectif dans la population est m.

Loi de probabilité : Parmi les n objet tirés, k sont souhaités et n - k ne le sont pas. Il y a façons de constituer des lots de k objets parmi les m présentant le caractère étudié et façons de choisir les autres. Le nombre de cas possibles est . Finalement, la loi de probabilité est fournie par la formule :

On note souvent H(N,m,n) la loi hypergéométrique. Rappelons que la loi binomiale B(n,p) consiste en n tirages indépendants (tirages avec remise, également dits non exhaustifs) dont la probabilité d'un succès est de probabilité connue p et on s'intéresse à l'obtention de k succès. La loi de probabilité est alors fournie par :

Au poker menteur, célèbre jeu de cartes à deux joueurs, on distribue 5 cartes à l'un deux qui annonce « brelan de rois » (présence de 3 rois exactement sur les 5cartes tirées). Quelle est la probabilité qu'il ne mente pas :

a/ Il s'agit ici d'une loi hypergéométrique, équivalente à n = 5 tirages sans remise dans une population de N = 32 objets dont les m = 4 rois sont les objets dont la présence est étudiée. On s'intéresse à k = 3.

C'est une probabilité très faible ! le joueur ment presque sûrement ou les cartes sont mal battues... fort possible car, au poker, on ne bat les cartes qu'en début de partie...

b/ Ici, ou bien le brelan contient le joker et 2 rois ou bien il contient 3 rois (et pas de joker sinon, le joueur annoncerait un carré...). On peut aussi considérer le joker a priori comme un roi : tout se passe comme si il y avait 5 rois et la probabilité s'écrit avec ces deux façons d'envisager le problème :

C'est déjà plus probable mais seulement deux fois plus environ... Dans ce cas, je risque et je prends en tentant le full ou le carré...

Espérance mathématique & variance :

On démontrerait, par un calcul très fastidieux, que l'espérance mathématique de X = H(N,m,n) est n × m/N, soit E(X) = np (comme dans le cas de la loi binomiale). A l'instar de cette dernière loi, on peut poser q = 1 - p = 1 - m/N. La variance est alors :

On remarque que si n (la taille de l'échantillon) est petit devant N, alors la variance est sensiblement npq, c'est à dire celle de la loi binomiale. Ce résultat n'est pas un hasard... :

La limite pour N infini de sorte que m/N tende vers une limite finie p de la loi H(N,m,n)
est la loi binomiale B(n,p)

Par transitivité, la loi hypergéométrique qui possède 3 paramètres, peut donc être approchée par la loi de Poisson P à un seul paramètre λ = np. Notons que la formule :

est inutilisable dès que N dépasse quelques centaines eu égard aux produits et factorielles entrant dans son calcul et, dans la pratique, un phénomène suivant une loi hypergéométrique et dépendant de grands effectifs doit être approximé par une loi de Poisson.

On prendra soin de toujours réfléchir avant d'approximer... en effet, pour la loi hypergéométrique H(N,m,n), on doit avoir k m : au-delà les probabilités de l'événement {X = k} sont nulles, alors que pour la loi binomiale et la loi de Poisson, elles ne le seront jamais : faibles certes, mais jamais nulles !

On peut prendre comme conditions d'approximation n/N < 1/100 , p = m/N < 0,1 , np < 10. Tout comme pour l'approximation de la loi binomiale par la loi de Poisson, ces conditions dépendent du degré de précision souhaité, elles constituent un ordre de grandeur généralement acceptable. Dans son Que sais-je?, Les probabilités, n°1571, Albert Jacquard étudie le cas H(1000,10,100) approximable par B(100,1/100) et P(1) :

k 0 1 2 3 4 5 6
Hypergéométrique 0,3469 0,3894 0,1945 0,0569 0,0108 0,0014 0,0001
Binomiale 0,3660 0,3697 0,1849 0,0610 0,0149 0,0029 0,0005
Poisson 0,3679 0,3679 0,1839 0,0613 0,0153 0,0030 0,0005

On voit que les lois binomiale et de Poisson coïncident "bien". Mais plus k augmente, plus l'écart se creuse avec la loi hypergéométrique. Le rapport n/N est ici 1/10 : n est trop grand par rapport à N. Donc, prudence...


En raison des calculs de combinaisons, le programme ci-dessous n'appréciera pas un effectif "trop grand" de la population
dans le calcul de Prob{H = k} : faites l'expérience...

                   

Loi de Pascal, dite géométrique :


© Serge Mehl - www.chronomath.com