![]() Enquête pour le prix d'acquisition d'un nouveau matériel » #1 , #2 , #3 , #5 (couple pondéré) |
» Source : extrait modifié du sujet BTS Services Informatiques 1983, in Annales corrigées BTS comptabilité et gestion, informatiques de gestion, Éd. Foucher, 1989
La société ProdManage a mis au point un logiciel de gestion destiné aux PME. Elle a enquêté dans 500 entreprises informatisées de la région afin de déterminer à quel prix elles accepteraient d'acquérir ce nouveau logiciel.
Série X :
prix proposés xi (exprimé en FF de l'époque) |
Série Y : nombre d'entreprises yi disposées à acheter le logiciel |
40 000 | 60 |
36 000 | 70 |
32 000 | 130 |
28 000 | 210 |
24 000 | 240 |
20 000 | 340 |
16 000 | 390 |
12 000 | 420 |
10 000 | 440 |
8 000 | 500 |
Le tableau ci-dessous résume les calculs partiels indispensables au calcul des paramètres de position et dispersion de X et Y. Il n'est pas demandé de les justifier :
Σxi = 226 000 | Σyi = 2 800 | Σxi2 = 6 244 000 000 | Σyi2 = 1 014 800 | Σxiyi = 47 200 000 |
1°/ En précisant les formules utilisées, calculer :
les valeurs exactes des coordonnées du point moyen G;
les valeurs exactes des variances V(X) et V(Y);
la covariance cov(X,Y)
Calculer le coefficient de corrélation linéaire à 10-3 près.
2°/ a/ On a représenté ci-dessous le nuage de points Mi(xi,yi) dans un repère orthogonal. Calculer l'équation de la droite de Mayer obtenue en partitionnant le nuage au moyen des 5 premières et 5 dernières observations en précisant es coordonnées exactes des points moyens G1 et G2 des sous-nuages. On donnera le coefficient directeur arrondi au 1/1000è et l'ordonnée à l'origine arrondie à l'unité.
b/ La droite D1 de régression de y en x a été tracée ci-dessous dans le repère précédent. Calculer son coefficient directeur arrondi au 1/1000è et son ordonnée à l'origine arrondie à l'unité (on justifiera que D1 a pour équation y = -0,015x + 600). La comparer à celle de la droite de Mayer. Quelles conclusions peut-on énoncer au vu du graphique et des calculs précédents ?
L'ajustement par la
méthode des moindres carrés vu par Graphmatica
3°/ Les frais de conception du logiciel se sont élevés à 500 000 FF. Les frais variables par logiciel vendu sont supposés négligeables. On décide de considérer comme pertinente la droite de régression de y en x, laquelle établit donc la relation y = -0,015x + 600 entre x et y.
Calculer le bénéfice B(x) théorique de l'entreprise en fonction du prix choisi x et calculer ensuite la valeur de x permettant d'obtenir le bénéfice théorique maximum.
4°/ La société ProdManage admet que les 500 entreprises interrogées constituent un échantillon représentatif des PME constituant le marché potentiel et décide de fixer le prix de vente de son logiciel à 20 000 FF, ce qui permet d'estimer à 340/500, soit 0,68 (68%) la proportion d'entreprises susceptibles d'acheter à ce prix. Déterminer dans ces conditions l'intervalle de confiance contenant la proportion vraie au risque de 5%.
Si vous séchez après avoir bien cherché : ››››
Solution : |
1°/ Le point moyen est G(x,y) = G(Σxi/10, Σyi/10) = G(22 600, 2 800).
La
variance V(X) est égale à la moyenne des carrés diminué du carré de la
moyenne, soit :
V(X) = Σxi2/n -
x2
= 113 640 000. De la même
manière, V(Y) = 23 080.
La covariance de X et Y est la moyenne des produits diminuée du produit des moyennes : cov(X,Y) = Σxiyi/n - x.y = -1 608 000.
Le coefficient de corrélation linéaire est le quotient r = cov(X,Y)/[√V(X) × √V(Y)] ≅ - 0.993.
Paramètres obtenus au moyen du programme des moindres carrés :
Point moyen : G(22 600, 280) | Σxi = 226 000 | Σyi = 2 800 | Σxi2 = 6 244 000 000 |
Σyi2 = 1 014 800 | Σxiyi = 47 200 000 | V(X) = 113640000 | σ(X) = 10660.206 |
V(Y) = 23 080 | σ(Y) = 151.921 | cov(X,Y) = -1 608 000 | r ≅ - 0,993 |
2°/
a) Les points du nuage sont
relativement bien alignés dans le repère choisi.
G1 correspond à la moyenne des 5 premiers points : G1(32 000,142)
G2 correspond à la moyenne des 5 derniers : G2(13200,418).
La droite de Mayer est la droite (G1G2). Son équation y = ax + b vérifie 32000a + b 142 et 13200a + b = 418. Par soustraction, on obtient immédiatement a = - 276/18800 = - 0.01468 ≅ - 0.015, puis b = 418 - 13200a ≅ 612.
(G1G2) : y = - 0.015x + 612
La droite D1 de régression de y en x a pour équation y - y = a(x - x) avec a = cov(X,Y)/V(X) ≅ - 0.015 :
D1 : y = - 0.015x + 600
2°/ b) Pour info la droite D2 de régression de x en y fourni par le programme des moindres carrés a pour équation x - X = a'(y - Y) avec a' = cov(X,Y)/V(Y) ≅ - 69.671 : D2 : x = - 69.671y + 42108. En exprimant y en fonction de x, on obtient y = - 0.014x + 604 : on voit que les droites coïncident pratiquement avec aa' = r2 ≅ 1 (» Pearson) : forte corrélation linéaire signifiant dans ce contexte que le désintérêt (Δyi < 0) des entreprises est proportionnel à l'augmentation du prix du logicien (Δxi > 0) : le rapport Δyi/Δxi est sensiblement constant, égal au coefficient directeur (négatif) de la droite de régression.
3°/ Si l'on vend y logiciels au prix x, le bénéfice (diminué des frais) s'élèvera à :
B(x) = xy - 500000 = x(- 0.015x + 600) - 500000 = - 0.015x2 + 600x - 500000
Une étude élémentaire de ce trinôme du second degré dont le coefficient de x2 est négatif montre que B passe par un maximum absolu lorsque x = 600/0,030 = 20 000. Ce qui justifie le choix de la société ProdManage (question 4). Le bénéfice est alors de 5 500 000 FF.
4°/ L'intervalle de confiance dans l'estimation d'une proportion p au risque de 5% est donné par :
où fn désigne la fréquence de l'échantillon de taille n avec 2π(t) - 1 = 1 - 5% = 0,95 (» loi normale , intervalle de confiance). On a donc π(t) = 0,975. La table de la loi normale centrée réduite (source univ. Bordeaux/univ. René Descartes) indique que t = 1,96 :
On a ici fn = 0,68. Ce qui conduit à l'intervalle de confiance [0.639 , 0721] : arrondie à 0,01 près, la proportion vraie d'acheteurs potentiels est comprise entre 0,64 et 0,72 avec une probabilité de 95%.