ChronoMath, une chronologie des MATHÉMATIQUES
à l'usage des professeurs de mathématiques, des étudiants et des élèves des lycées & collèges

Méthode du maximum de vraisemblance
     (en anglais : maximum likelihood)

Cette méthode permet de calculer, à partir d'un échantillon observé, la (les) meilleure(s) valeur(s) d'un paramètre d'une loi de probabilité. En voici le principe :

Si un phénomène X a été l'objet de n observations indépendantes x1, x2, ..., xn les unes des autres, sa loi de probabilité (dans le cas discret  : loi binomiale, loi de Poisson) ou sa densité (en cas de loi continue, comme la loi normale) est une fonction f'(x, p1, .., pk) où les pk sont les paramètres de la loi.

Afin de calculer ces paramètres, on cherche à maximiser la probabilité de la conjonction des valeurs effectivement observées x1, x2, ..., xn. L'indépendance permet d'écrire que le produit :

f'(x1, p1, .., pk) × f'(x2, p1, .., pk) × ... × f'(xn, p1, .., pk)

doit être maximum. La condition nécessaire s'obtient en annulant chaque dérivée partielle de f par rapport à p1, p2, ..., pk. L'expression à dériver étant un produit de nombres strictement positifs, on aura tout intérêt à prendre les dérivées logarithmiques.

Un exemple dans le cas discret :      

Prenons le cas d'une loi binomiale B pouvant prendre N valeurs (entières) :  loi discrète. Il n'y a qu'un seul paramètre à estimer : la valeur théorique p de la probabilité attachée à B.

On a ici :

Pr(B = k) = CN,k × pk(1 - p)n - k

CN,k désignant le nombre de combinaisons de k objets pris parmi N. Ce nombre ne dépend pas de p. Calculons le produit des probabilités en remplaçant k par chacune des valeurs x1, x2, ..., xn observées de B.

Pour plus de commodité, introduisons la moyenne x des xi : on a donc ici x = (x1+ x2 + ...+ xn)/n. Le produit est de la forme :

C × pnx(1 - p)nN - nx , C désignant un produit de combinaisons indépendant de p

Dérivons par rapport à p. La dérivée est du signe de nx - pnN et s'annule en p = xN. Le coefficient de p dans nx - pnN étant négatif, il s'agit d'un maximum.

    Sous la forme x = Np, on retrouve ici l'espérance mathématique de B.

Un exemple dans le cas continu :      

Prenons le cas d'une loi normale : c'est une loi continue. Il y a deux paramètres à estimer : la moyenne m(espérance mathématique) et l'écart-type que nous notons s.

Ayant observé n valeurs x1, x2, ..., xn, f désignant la densité, nous devons maximiser le produit :

f'(x1, m, s) × f'(x2, m, s) × ... × f'(xn, m, s), avec :

Prenons le logarithme népérien L(m,s) du produit en ne tenant pas compte du (√2)n indépendant de m et s :

Les dérivées partielles par rapport à m et à s sont respectivement ∂L(m,s)/∂m = -Σ(xi - m)/s2  et  ∂L(m,s)/∂s = Σ(xi - m)2/s3 - n/s. Ces dérivées s'annulent lorsque m = Σ(xi - m) = x  et s2 = Σ(xi - m)2/n.

On vérifie facilement qu'il s'agit encore là de maximums. Et les valeurs optimales des paramètres s'avèrent être respectivement les moyenne et écart-type de la série de valeurs observées.


Daniell Gonseth
© Serge Mehl - www.chronomath.com