
|
|
Le
but de cette étude est de constater que des résultats statistiques portant sur
une certaine période et possédant des propriétés remarquables (comme ici un
ajustement linéaire tout à fait justifié) ne peuvent être extrapolés sans précaution.
L' Annuaire statistique de la France donne le tableau suivant indiquant le taux pour mille (°/oo) de mortalité infantile par période quinquennales de 1886 à 1940 :
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
le taux de mortalité infantile est un indice exprimant le
nombre de décès pour 1000 naissances sur une période de 1 an.
1. Représenter
graphiquement les données précédentes
par un nuage de 11 points. On prendra
comme abscisse 1,2,...11 : 1 sera l'année 1888, 2
l'année 1893, ... , 11 l'année 1938.
2. Vous constatez que les points sont susceptibles d'être ajustés linéairement. Calculer le coefficient de corrélation et procédez à l'ajustement par la méthode des moindres carrés.
3. Montrer que l'abscisse n d'une année An > 1887 est donnée par : An - 1888 = 5(n - 1).
Quelle est l'abscisse de l'année 1988 ? Quel serait le taux en admettant que la droite d'ajustement trouvée est encore valable ?
Si vous séchez après avoir bien
cherché :
| Solution : |
1°/

2°/ Le coefficient de corrélation linéaire est donné par la formule :

Le tableau ci-contre résume les différents
paramètres statistiques (V = variance,
s
= écart-type) des séries observées.
| r | = 0,989 est proche de 1 : forte
présomption d'alignement.
La droite de régression de y en x (ajustement linéaire) par la méthode des moindres carrés a sensiblement pour équation : y = -11x + 187
Rappelons que si y = ax +
b est l'équation de la droite (d) de régression, le coefficient directeur de
cette droite est donné par la formule : a = cov(X,Y)/V(X); l'ordonnée à
l'origine se calcule facilement sachant que (d) passe par le point moyen G(Sxi,Syi).
On pourra
utiliser le
programme JavaScript on line
3°/ Les classes ont une amplitude de 5 ans; si 1888, centre de la classe, correspond à l'abscisse n = 1, les années sont en progression arithmétique (An) de raison 5, de 1er terme 1888; on a donc : An = 1888 + (n - 1) x 5, ou encore :
An - 1888 = 5(n - 1)
On constate qu'une prédiction à long terme (x = 21 : 100 ans entre 1888 et 1988)
n'a pas de sens : le taux serait négatif ! Toute extrapolation de résultats
statistiques doit bien sûr tenir compte de changements significatifs dans une
population donnée.

Dans la première moitié du 20e siècle les progrès de la médecine, dus pour
beaucoup à Pasteur (1822-1895), ont permis d'éradiquer un grand nombre de
maladies du nourrisson.
De plus, en Europe en particulier, les naissances ont lieu désormais dans des maternités avec un suivi de l'enfant, ce qui n'était pas le cas jusque dans les années 1950. La mortalité infantile a beaucoup baissé depuis cette époque mais cette évolution est plus lente. En France, le taux était de 7,8°/oo en 1988; 4,2 en 2002; 3,4 en 2008.
On pourra
consulter de nombreuses statistiques sur
http://www.indexmundi.com/