Exercice TP Statistique

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 4

TP: Statistique inférentielle et modélisation

January 9, 2022

Objectifs
L’objectif de ce document est de présenter les principaux tests statistiques et commandes R
utilisés dans la pratique.

Exercice 1
Un producteur affirme qu’exactement 25% des haricots verts de sa récolte sont extra-fins.
Sur 400 haricots verts choisis au hasard dans la récolte, on en compte 118 extra-fins.

• Est-ce que l’on peut affirmer, au risque 5%, que le producteur a tort ?

Exercice 2
La société de Monsieur Labrador utilise deux machines, machine 1 et machine 2, pour rem-
plir automatiquement des paquets de cacao en poudre.

• On prélève un échantillon de 10 paquets remplis par la machine 1 et on les pèse. Les


résultats, en grammes, sont:
106.70 107.02 107.15 107.22 107.41 106.39 107.47 107.61 107.38 107.22

• On prélève un échantillon de 9 paquets remplis par la machine 2 et on les pèse. Les


résultats, en grammes, sont :
107.68 106.69 107.24 107.69 106.97 107.52 106.22 107.23 107.32

On suppose que le poids en grammes d’un paquet rempli par la machine 1 peut être mod-
élisé par une X 1 ∼ N (µ1 , 1.3) et celui avec la machine 2 peut être modélisé par une variable
X 2 ∼ N (µ2 , 0.9).

• Peut-on affirmer, au risque 5%, que les machines sont réglées de manière différente ?

1
Exercice 3
On considère deux lots de tasses et on souhaite comparer la solidité de ceux-ci. Pour chacun
des deux lots, on dispose d’un échantillon de 10 tasses et on mesure la résistance de chacune
d’entre eux. Les résultats sont :

• pour le premier échantillon :


31.70 31.98 32.24 32.35 31.18 32.19 32.63 31.19 31.54 31.89

• pour le deuxième échantillon :


31.61 31.10 31.20 31.11 32.66 31.15 31.71 31.22 31.16 31.21

La solidité d’une tasse du premier lot peut être modélisée par une var X 1 , et celle du tasse
du second lot peut être modélisée par une var X 2 . On suppose que X 1 et X 2 suivent des lois
normales de variances égales.
Peut-on affirmer que ces deux échantillons ne proviennent pas de la même production ?

Exercice 4
On dispose de deux lots de boîtes de sauce italienne conditionnées de la même manière
mais provenant de producteurs différents. On s’intéresse à la teneur en grammes de viande
dans celles-ci.

• On extrait 7 boîtes provenant du premier producteur et on mesure leur teneur de


viande. Les résultats, en grammes, sont :
12.12 12.03 13.58 13.38 11.81 15.92 13.65

• On extrait 6 boîtes provenant du deuxième producteur et on mesure leur teneur de


viande. Les résultats, en grammes, sont :
14.81 13.93 14.91 15.87 15.62 15.39

La teneur en grammes de viande dans une boîte provenant du premier producteur peut être
modélisée par une var X 1 , et celle dans une boîte provenant du deuxième producteur peut
être modélisée par une var X 2 . On suppose que X 1 et X 2 suivent des lois normales. Peut-on
affirmer qu’il y a une différence entre les producteurs quant à la teneur moyenne en viande
dans les boîtes ?

2
Exercice 5
Nous donnons les couples d’observations suivants :

xi 3 4 4 7 9 10 10 12 12 17 14 34 24 21 37

yi 40 46 53 58 65 70 76 82 88 94 101 106 111 117 123

Alors, dans l’exercice, on a seulement 15 observations de deux variables xet y. On souhaite


expliquer les variations de x par celles de y. Voici les données :

1. Tracer le diagramme de dispersion des couples (xi; yi). À la vue de ce diagramme,


pouvons-nous soupçonner une liaison linéaire entre ces deux variables?

2. Déterminer pour ces observations la droite des moindres carrés, c’est-à-dire donner
les coefficients de la droite des MC.

3. Représenter les valeurs estimées et celles observées sur un graphique

4. Calculer les résidus

5. Calculer le coefficient de détermination R 2 et conclure.

6. Vérifier les résultat obtenus avec la fonction 0 l m()0

Exercice 6
Les données que nous étudions présentent le taux de décès par attaque cardiaque chez les
hommes de 55 à 59 ans dans différents pays industrialisés. Les variables sont Y = 100 x
log(nbre de décès par crise cardiaque pour 100000 hommes)−2), X1 = 1000x téléphones par
habitants, X2 =calories grasses en pourcentage du total des calories et X3 =calories provenant
de protéines animales en pourcentage du total des calories.

3
Pays X1 X2 X3 Y

Australie 124 33 8 81

Autriche 49 31 6 55

Canada 181 38 8 80

Ceylan 4 17 2 24

Chili 22 20 4 78

Danemark 152 39 6 52

Finlande 75 30 7 88

France 54 29 7 45

Allemagne 43 35 6 50

Irlande 41 31 5 69

Maroc 17 23 4 66

Italie 22 21 3 45

Japon 16 8 3 24

Mexique 10 23 3 43

Pays-Bas 63 37 6 38

Nouvelle-Zélande 170 40 8 72

Norvège 15 38 6 41

Portugal 15 25 4 38

Suède 221 39 7 52

Suisse 171 33 7 52

Grande-Bretagne 97 38 6 66

Etats-Unis 254 39 8 89

Trouver l’équation de la régression multiple de Y sur X1, X2 et X3.

Vous aimerez peut-être aussi