Statistiques Inferentielles

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 63

MINISTERE DE LENSEIGNEMENT SUPERIEUR

DIRECTION DES ETUDES TECHNOLOGIQUES


INSTITUT SUPERIEUR DES ETUDES TECHNOLOGIQUES DE RADES
DEPARTEMENT DES SCIENCES ECONOMIQUES ET DE GESTION

NOTES DE COURS

*** STATISTIQUE II ***


(LE GUIDE DE LETUDIANT)

Enseignants : Makram BEN JEDDOU & Yakdhane ABASSI

Yakdhane ABASSI

http://yakdcours.webou.net

SOMMAIRE

Chapitre 1 : Notions de variables alatoires et lois de probabilit


Chapitre 2 : Les lois usuelles de probabilit
Chapitre 3 : Les mthodes dchantillonnage
Chapitre 4 : Les distributions dchantillonnage
Chapitre 5 : Lestimation statistique
Chapitre 6 : Les tests paramtriques
Chapitre 7 : Les tests non paramtriques

Les sries de travaux dirigs

Yakdhane ABASSI

http://yakdcours.webou.net

Chapitre 1 : Notions de variables alatoires et lois de probabilit


On appelle preuve alatoire, une preuve dont le rsultat dpend du hasard. Le
rsultat est donc incertain. On note lensemble des rsultats possible dune preuve
alatoire et () lensemble des parties possibles de . On appelle probabilit P sur
(, ()) toute application de () dans [0 ,1] telle que P() = 1, et toute famille
dlments

deux

deux

disjoints

de

(),

on

(, () , P) forme alors un espace probabilise. Pour tous lments A et B

A, B P(), P( A B) P( A) P( B) P( A B)
A, B P(), P( A / B)

P( A B)
P( B)

Si A et B sont indpendants alors

P( A B) P( A) xP( B)
Si tous les lments de sont quiprobables alors P(A) = CARD (A) / CARD ()
I- Notion de variable alatoire :
On appelle variable alatoire (V.A) le rsultat caractristique dune preuve alatoire.
De faon conventionnelle, on notera toujours par une majuscule (exemple X) la
variable alatoire et par des minuscules (exemple xi) les valeurs quelle peut prendre.
Exemple 1 :
X la V.A : Rsultat dun jet de d
xi =

1,2,3,4,5, 6

Exemple 2 :
X la V.A : Taille dune personne tire dans un chantillon
xi : [1m ; 1,5m[ ; [1,5m, 2m[ ; [2m, 3m[
Dans le premier cas, la variable alatoire est dite discrte car elle prend uniquement
des valeurs isoles. Dans le second cas la variable alatoire est dite continue du fait
quelle prend nimporte quelle valeur relle lintrieur dun intervalle.
II- Loi de probabilit :
1- Cas dune VA discrte
On appelle loi de probabilit dune VA discrte la relation qui permet de dterminer la
probabilit que cette variable prenne une valeur donne.
Exemple : Soit X la VA : Rsultat dun jet de d
La loi de probabilit de X peut tre reprsente par le tableau suivant sous rserve que
le d ne soit pas truqu :

Yakdhane ABASSI

http://yakdcours.webou.net

Xi
P(X= Xi)

1
1/6

2
1/6

3
1/6

4
1/6

5
1/6

6
1/6

On peut associer cette loi de probabilit le diagramme en btons suivant :


Pi

xi
2- Cas dune VA continue
On appelle loi de probabilit dune VA continue la fonction qui permet de dterminer
la probabilit que cette variable appartienne un intervalle.
Cette loi de probabilit sexprime par une fonction dite fonction de densit de
probabilit et note par f(x). Cette fonction peut tre reprsente graphiquement par
une courbe :
f(x)
x

III- Fonction de rpartition :


La fonction de rpartition ou fonction cumulative F dune variable alatoire X est la
fonction qui associe toute valeur x de X, la probabilit que X soit infrieure ou gale
x.
F(x) = P(X < x)
Proprits:
* 0 < F(x) < 1 (car F(x) est une probabilit)
* P(x1 <X < x2) = F(x2) F(x1)
Remarque:
Graphiquement la fonction de rpartition dune VA discrte sera un diagramme en
escaliers alors quil sagit dune courbe continue et croissante dans le cas dune VA
continue.
VI- Fonction de distribution ou de densit de probabilit :
Si la fonction de rpartition dune VA continue X est drivable, la fonction de
distribution ou de densit de probabilit sera alors la fonction drive de F.
f(x) = F(x) On peut alors crire
x2

f(x) dx F(x)

x2
x1

F(x2 )

- F(x1 ) P(x 1 X x 2)

x1

Yakdhane ABASSI

http://yakdcours.webou.net

Consquence : Dans le cas dune VA continue, la probabilit que cette variable prenne
une valeur particulire est nulle.
Dmonstration : P(X y) P(y X y) F(y) F(y) 0
V- Notion desprance et de variance
1- Cas dune VA discrte :
Dans le cas dune VA discrte lesprance et la variance sont donnes par :
N

E(X) p i x i
i 1
N

V(X) p i (x i E(X) )2
i 1

=
2- Cas dune VA continue
Dans le cas dune VA continue lesprance est la variance sont donnes par :

E(X) xf(x)dx

V(X) (x E(X)) 2 f(x) dx

3- Signification de lesprance mathmatique


Cest le rsultat moyen que lon doit sattendre obtenir sur un grand nombre
dpreuves.
Exemple : dans un jeu de pile ou face un individu A donne 4 dinars B chaque fois
que le ct pile apparat et reoit 2 dinars dans le cas ou cest le ct face qui apparat.
Soit X la VA : Gain de lindividu A
xi
P(X=xi)

- 4
0.5

2
0.5

E(X)= 0.5 (-4) + 0.5(2) = -1


Donc on peut conclure que lindividu A doit sattendre perdre en moyenne 1 dinar en
jouant ce jeu, var lesprance mathmatique de son gain est ngative 1.
IV- Oprations sur les VA
Soient deux variables alatoires X et Y, on aura alors :
E(X+Y) = E(X)+E(Y)
E(X-Y) = E(X)-E(Y)
E(aX) = a E(X) ; E(X+b) = E(X)+b ; E(aX+b) = a E(X) + b
V(aX) = a2V(X) ;

V(X+b) = V(X) ; V(aX+b) =a2V(X) ;

V(aX+bY) = a2V(X) + b2 V(Y) + 2ab COV(X,Y)


Si X et Y sont indpendants on aura alors:
V(X+Y) = V(X) + V(Y)
V(X-Y)= V(X) + V(Y)

Yakdhane ABASSI

http://yakdcours.webou.net

Chapitre 2 : Les lois usuelles de probabilit

I- La loi binomiale
Soit une preuve alatoire dans laquelle il nexiste que deux rsultats possibles, lun
tant qualifi de favorable et lautre de dfavorable (chec et succs).
Soit p la proportion du cas favorable q=1-p celle du cas dfavorable. On ralise
npreuves identiques et indpendantes et on notera :
X la VA : Nombre de rsultats favorables
La probabilit que cette variable prenne une valeur particulire x est :

P(X x) Cnx Px (1 P)n x Cnx Px qn x


Cette relation dfinit la loi binomiale de probabilit. Elle dpend de deux paramtres n
et p. Il existe diffrentes tables de probabilit qui indiquent la probabilit

simple P(X=x) ou la probabilit cumul P(X<x)


1- Conditions dapplication de la loi
- Lpreuve est dichotomique, elle ne comporte que deux rsultats possibles.
- Les rptitions de cette preuve sont mutuellement indpendantes, ainsi la probabilit
du cas favorable p est constante.

2- Caractristiques de la loi
Soit X une VA qui suit une loi binomiale de paramtres n et p. On notera alors :
X

B(n,p)

Les paramtres de cette loi sont :


E(X)= np
V(X) = np (1-p)=npq

Exemple: On jette dix fois une pice de monnaie et on considre X la VA nombre de


faces obtenues.
On aura alors X

B (10, 0,5)

Dou: E(X) = 10*0.5=5 V(X)= 10*0.5*=2.5

Yakdhane ABASSI

http://yakdcours.webou.net

II- La loi de poisson


Lorsque le nombre des preuves devient trs grand (n), et que la probabilit du cas
favorable devient trs faible (p) on dmontre que la loi binomiale tend vers la forme
limite :

(np) enp
P(Xx)
x!
x

Cette nouvelle loi ainsi dfinie est appele loi de poisson qui est qualifie de loi des
vnements rares du fait que p est trs faible.
On note souvent = np avec X

P () dou :

()
P(X x) e
x!
x

1- Conditions dapplication de la loi


- Les conditions dapplication de la loi binomiale sont runies (preuve dichotomique)
- La probabilit du cas favorable est faible (vnement rare)
- Le nombre des preuves est trs grand
2- Caractristiques de la loi
Soit X une VA tel que : X P

P() les paramtres de cette loi sont :

E(X)=
V(X)=
Il existe diffrentes tables de probabilit de la loi de poisson qui indiquent la
probabilit simple(X=x) ou la probabilit cumul P(X<x) . Cette loi sapplique au cas
dun nombre rare dvnement pendant une priode de temps file dattente. Si un
vnement surgit avec une proportion p pendant une priode de temps limit t( au
point que lvnement ne peut se produire au plus quune seule fois pendant t) , alors
la probabilit que ledit vnement se produise x fois pendant dans une priode plus
longue T est rgie par une loi de poisson de paramtre = n p avec n = T/t
Exemple : supposons quun standardiste recroit deux appels par minute, t doit
correspondre une unit de temps plus faible que la minute soit, la seconde avec une
probabilit de recevoir un appel de 2/60= 1/30, le nombre dappel reus pendant cinq
minut suit une loi de poisson de paramtre = n p = 300 /30 = 10

Yakdhane ABASSI

http://yakdcours.webou.net

III- La loi normale


La loi normale (ou loi de Gauss- Laplace) est une loi de probabilit continue dont la
densit de probabilit est donne par lexpression :

P( x)

1
exp
2 II

1
(
2

xm

sont les paramtres de la loi, respectivement sa moyenne et son cart type.


Pour noter quune variable alatoire X suit une loi de moyenne m et dcart type on
crit : X
N(m, )
m et

1- Caractristiques de la loi :
- Graphiquement, la courbe reprsentative de la loi normale lallure dune courbe en
cloche : elle est symtrique par rapport m abscisse pour lequel elle passe par un
maximum et elle admet laxe des x comme asymptote.
- La fonction y=P(x) est entirement dfinie et connue ds linstant o lon connat les
valeurs des paramtres m et

2- Conditions dapplication de la loi


La loi normale tire son importance du fait que sous certaines conditions plusieurs
autres lois de probabilit convergent vers elle. On dmontre notamment que la somme
de variables alatoires indpendantes obissant des lois de probabilit quelconques
tend vers une loi normale lorsque le nombre de ces variables augmente indfiniment
(thorique central limite).
Dautre part, on peut dire quune variable X est distribu normalement si :
-

Les facteurs de variation de X sont nombreux

Les fluctuations de X dues ces diffrents facteurs sont indpendantes les uns
des autres

Les fluctuations de X dues ces diffrents facteurs doivent tre suffisamment


petites et approximativement du mme ordre de grandeur.

3- La loi normale centre rduite


On considre la variable alatoire X

N(m,

) et on veut calculer la probabilit

suivante : P(X<x1). Le problme cest quon ne dispose pas dune table de probabilit
pour les diffrentes lois normales (suivant les valeurs de m et

) car il faudra prvoir

une infinit.
8

Yakdhane ABASSI

http://yakdcours.webou.net

Il faut alors procder au changement de variable suivant :

U X*

X m

Cette nouvelle variable alatoire U obit une loi normale rduite (LNCR) du fait
que :
E(U)= m=0
V(U)=

=1

(variable centre)
(variable rduite)

Ainsi la probabilit quon veut calculer sera :

P( X m x1m)

Lintrt de ce changement de variable est quil permet de ramener nimporte quelle


distribution normale une mme loi de probabilit qui est la loi normale centre
rduite N(0,1). Pour laquelle on dispose de tables de probabilit. Puisque cette loi est
symtrique alors on a :

Application :
Soit X

N (100,10). Calculer les probabilits suivantes :

P(X<110)

P(X>105)

P (110<X<120)

P( X 110)

Yakdhane ABASSI

http://yakdcours.webou.net

Table de la Loi Normale Centre Rduite


X* N(0,1)

P X* t 1-

0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9

0,00
0,5000
0,5398
0,5793
0,6179
0,6554
0,6915
0,7257
0,7580
0,7881
0,8159
0,8413
0,8643
0,8849
0,9032
0,9192
0,9332
0,9452
0,9554
0,9641
0,9713
0,9772
0,9821
0,9861
0,9893
0,9918
0,9938
0,9953
0,9965
0,9974
0,9981
0,99865
0,99903
0,99931
0,99952
0,99966
0,99977
0,99984
0,99989
0,99993
0,99995

0,01
0,5040
0,5438
0,5832
0,6217
0,6591
0,6950
0,7291
0,7611
0,7910
0,8186
0,8438
0,8665
0,8869
0,9049
0,9207
0,9345
0,9463
0,9564
0,9649
0,9719
0,9778
0,9826
0,9864
0,9896
0,9920
0,9940
0,9955
0,9966
0,9975
0,9982
0,99869
0,99906
0,99934
0,99953
0,99968
0,99978
0,99985
0,99990
0,99993
0,99995

0,02
0,5080
0,5478
0,5871
0,6255
0,6628
0,6985
0,7324
0,7642
0,7939
0,8212
0,8461
0,8686
0,8888
0,9066
0,9222
0,9357
0,9474
0,9573
0,9656
0,9726
0,9783
0,9830
0,9868
0,9898
0,9922
0,9941
0,9956
0,9967
0,9976
0,9982
0,99874
0,99910
0,99936
0,99955
0,99969
0,99978
0,99985
0,99990
0,99993
0,99996

0,03
0,5120
0,5517
0,5910
0,6293
0,6664
0,7019
0,7357
0,7673
0,7967
0,8238
0,8485
0,8708
0,8907
0,9082
0,9236
0,9370
0,9484
0,9582
0,9664
0,9732
0,9788
0,9834
0,9871
0,9901
0,9925
0,9943
0,9957
0,9968
0,9977
0,9983
0,99878
0,99913
0,99938
0,99957
0,99970
0,99979
0,99986
0,99990
0,99994
0,99996

0,04
0,5160
0,5557
0,5948
0,6331
0,6700
0,7054
0,7389
0,7704
0,7995
0,8264
0,8508
0,8729
0,8925
0,9099
0,9251
0,9382
0,9495
0,9591
0,9671
0,9738
0,9793
0,9838
0,9875
0,9904
0,9927
0,9945
0,9959
0,9969
0,9977
0,9984
0,99882
0,99916
0,99940
0,99958
0,99971
0,99980
0,99986
0,99991
0,99994
0,99996

0,05
0,5199
0,5596
0,5987
0,6368
0,6736
0,7088
0,7422
0,7734
0,8023
0,8289
0,8531
0,8749
0,8944
0,9115
0,9265
0,9394
0,9505
0,9599
0,9678
0,9744
0,9798
0,9842
0,9878
0,9906
0,9929
0,9946
0,9960
0,9970
0,9978
0,9984
0,99886
0,99918
0,99942
0,99960
0,99972
0,99981
0,99987
0,99991
0,99994
0,99996

0,06
0,5239
0,5636
0,6026
0,6406
0,6772
0,7123
0,7454
0,7764
0,8051
0,8315
0,8554
0,8770
0,8962
0,9131
0,9279
0,9406
0,9515
0,9608
0,9686
0,9750
0,9803
0,9846
0,9881
0,9909
0,9931
0,9948
0,9961
0,9971
0,9979
0,9985
0,99889
0,99921
0,99944
0,99961
0,99973
0,99981
0,99987
0,99992
0,99994
0,99996

0,07
0,5279
0,5675
0,6064
0,6443
0,6808
0,7157
0,7486
0,7794
0,8078
0,8340
0,8577
0,8790
0,8980
0,9147
0,9292
0,9418
0,9525
0,9616
0,9693
0,9756
0,9808
0,9850
0,9884
0,9911
0,9932
0,9949
0,9962
0,9972
0,9979
0,9985
0,99893
0,99924
0,99946
0,99962
0,99974
0,99982
0,99988
0,99992
0,99995
0,99996

0,08
0,5319
0,5714
0,6103
0,6480
0,6844
0,7190
0,7517
0,7823
0,8106
0,8365
0,8599
0,8810
0,8997
0,9162
0,9306
0,9429
0,9535
0,9625
0,9699
0,9761
0,9812
0,9854
0,9887
0,9913
0,9934
0,9951
0,9963
0,9973
0,9980
0,9986
0,99896
0,99926
0,99948
0,99964
0,99975
0,99983
0,99988
0,99992
0,99995
0,99997

0,09
0,5359
0,5753
0,6141
0,6517
0,6879
0,7224
0,7549
0,7852
0,8133
0,8389
0,8621
0,8830
0,9015
0,9177
0,9319
0,9441
0,9545
0,9633
0,9706
0,9767
0,9817
0,9857
0,9890
0,9916
0,9936
0,9952
0,9964
0,9974
0,9981
0,9986
0,99900
0,99929
0,99950
0,99965
0,99976
0,99983
0,99989
0,99992
0,99995
0,99997

NB : Pour avoir la probabilit qui correspond t = 1.53 il faut lire lintersection de


la ligne 1.5 et de la colonne 0.03 (1.53 = 1.5 + 0.03) ainsi P[X<1.53] = 0.9370
10

Yakdhane ABASSI

http://yakdcours.webou.net

IV- Les distributions drives de la loi normale


Les lois de probabilits qui seront prsentes dans cette section sont dfinies partir de
la loi normale
1- Loi de Khi-deux(2)
Soient n variables alatoires indpendantes U1,U2,U3,Un suivant chacune la loi
normale centre rduite.
Ainsi la somme :

U 1 U 2 U 3 ..... U n U i2
2

i 1

Reprsente une variable alatoire dont la distribution est celle dune 2 n degrs de
libert (n ddl) car cest la somme de n carrs de lois normales centres et rduites.
Cette loi se note 2(n) ou 2n.
Proprits :
-

E(2n) =n

V(2n)=2n

Lecture de la table de probabilit :


La variable 2 est tabule en fonction du nombre de ddl. La table donne pour
diffrentes valeurs de , la valeur de x telle que : P(2n>x)=
Exemple : Calculer P(210>20.5)

2- Loi de Student (T)


Soient n+1 variables alatoires indpendantes U1,U2,U3Un et Un+1 suivant chacune
la loi normale centre rduite. Ainsi la quantit suivante :

Un 1
1 n 2
U i
n i 1

Reprsente une variable alatoire dont la distribution est celle dune loi de Student n
de grs de libert (n= ddl). Cette loi se note T(n) ou Tn.

11

Yakdhane ABASSI

http://yakdcours.webou.net

Proprits :
-

E(Tn)=0

V (Tn)= (n/n-2)

Graphiquement la courbe de densit de probabilit de la loi de Student est une courbe


en cloche symtrique par rapport laxe des ordonnes, mais qui est plus vase que
celle de la LNCR.

Lecture de la table de probabilit :


La table de Student donne pour un nombre n de ddl dtermin et pour une probabilit
la valeur t de la variable de Student telle que :
P(T< t) = 1-
Exemple : Soit la variable T qui suit une loi de Student 20ddl :
-

Dterminer la valeur de t telle que : P(T<t)=0,7

Dterminer la valeur de t telle que P(T>t)= 0.05

Calculer P(T>0.86)

Dterminer la valeur de t telle queP( T t ) = 0.98

12

Yakdhane ABASSI

http://yakdcours.webou.net

Table de la loi de Khi-deux


X

n
2

n : le nombre de degrs de libert

P X 2

0,995

0,99

0,975

0,95

0,9

0,75

0,5

0,3

0,25

0,1

0,05

0,025

0,01

0,005

0,001

0,000

0,000

0,001

0,004

0,016

0,102

0,455

1,074

1,320

2,706

3,841

5,020

0,010

0,020

0,051

0,103

0,211

0,575

1,386

2,408

2,770

4,605

5,991

7,380

6,635

7,880

10,827

9,210

10,600

0,072

0,115

0,216

0,352

0,584

1,210

2,366

3,665

4,110

6,251

7,815

13,815

9,350

11,345

13,000

16,266

0,207

0,297

0,484

0,711

1,064

1,920

3,357

4,878

5,390

7,779

0,412

0,554

0,831

1,150

1,610

2,670

4,351

6,064

6,630

9,236

9,488

11,140

13,277

15,000

18,467

11,070

12,830

15,086

16,860

20,515

0,676

0,872

1,240

1,640

2,204

3,450

5,348

7,231

7,840

10,645

0,989

1,240

1,690

2,170

2,833

4,250

6,346

8,383

9,040

12,017

12,592

14,450

16,812

18,650

22,457

14,067

16,010

18,475

20,370

24,322

1,340

1,640

2,180

2,730

3,490

5,070

7,344

9,524

10,220

1,730

2,090

2,700

3,330

4,168

5,900

8,343

10,656

11,390

13,362

15,507

17,530

20,090

22,030

26,125

14,684

16,919

19,020

21,666

23,660

27,877

10

2,160

2,560

3,250

3,940

4,865

6,730

9,342

11,781

11

2,600

3,050

3,820

4,570

5,578

7,580

10,341

12,899

12,550

15,987

18,307

20,480

23,209

25,250

29,588

13,700

17,275

19,675

21,920

24,725

26,820

12

3,070

3,570

4,400

5,230

6,304

8,430

11,340

31,264

14,011

14,850

18,549

21,026

23,340

26,217

28,350

32,909

13

3,570

4,110

5,010

5,890

7,042

9,300

14

4,070

4,660

5,630

6,570

7,790

10,160

12,340

15,119

15,980

19,812

22,362

24,740

27,688

29,870

34,528

13,339

16,222

17,120

21,064

23,685

26,120

29,141

31,370

36,123

15

4,600

5,230

6,260

7,260

8,547

16

5,140

5,810

6,910

7,960

9,312

11,030

14,339

17,322

18,250

22,307

24,996

27,490

30,578

32,850

37,697

11,910

15,338

18,418

19,370

23,542

26,296

28,850

32,000

34,310

39,252

17

5,700

6,410

7,560

8,670

18

6,260

7,010

8,230

9,390

10,085

12,790

16,338

19,511

20,490

24,769

27,587

30,190

33,409

35,760

40,790

10,865

13,670

17,338

20,601

21,600

25,989

28,869

31,530

34,805

37,190

19

6,840

7,630

8,910

42,312

10,120

11,651

14,560

18,338

21,689

22,720

27,204

30,144

32,850

36,191

38,620

43,820

20

7,430

8,260

21

8,030

8,900

9,590

10,850

12,443

15,450

19,337

22,775

23,830

28,412

31,410

34,140

37,566

40,030

45,315

10,280

11,590

13,240

16,340

20,337

23,858

24,930

29,615

32,671

35,480

38,932

41,430

46,797

22

8,640

9,540

23

9,260

10,200

10,980

12,340

14,041

17,240

21,337

24,939

26,040

30,813

33,924

36,780

40,289

42,830

48,268

11,690

13,090

14,848

18,130

22,337

26,018

27,140

32,007

35,172

38,080

41,638

44,210

49,728

24

9,890

25

10,560

10,860

12,400

13,850

15,659

19,030

23,337

27,096

28,240

33,196

36,415

39,360

42,980

45,590

51,179

11,520

13,120

14,610

16,473

19,940

24,337

28,172

29,340

34,382

37,652

40,650

44,314

46,960

52,620

26
27

11,200

12,200

13,840

15,380

17,292

20,840

25,336

29,246

30,430

35,563

38,885

41,920

45,642

48,320

54,052

11,840

12,880

15,570

16,150

18,114

21,750

26,336

30,319

31,530

36,741

40,113

43,190

46,963

49,670

55,476

28

12,490

13,560

15,310

16,930

18,939

22,660

27,336

31,391

32,620

37,916

41,337

44,460

48,278

51,020

56,893

29

13,150

14,260

16,050

17,710

19,768

23,560

28,236

32,461

33,710

39,087

42,557

45,720

49,588

52,360

58,302

30

13,820

14,950

16,790

18,490

20,599

24,480

29,336

33,530

34,800

40,256

43,773

46,980

50,892

53,700

59,703

13

Yakdhane ABASSI

http://yakdcours.webou.net

Table de la Loi de Student


X T(n)
n: nombre de degrs de libert

P X t 1-
1-

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

0,6
0,325
0,289
0,277
0,271
0,267
0,265
0,263
0,262
0,261
0,260
0,260
0,259
0,259
0,258
0,258
0,258
0,257
0,257
0,257
0,257
0,257
0,256
0,256
0,256
0,256
0,256
0,256
0,256
0,256
0,256

0,7
0,727
0,617
0,584
0,569
0,559
0,553
0,549
0,546
0,543
0,542
0,540
0,539
0,538
0,537
0,536
0,535
0,534
0,534
0,533
0,533
0,532
0,532
0,532
0,531
0,531
0,531
0,531
0,530
0,530
0,530

0,8
1,376
1,061
0,978
0,941
0,920
0,906
0,896
0,889
0,883
0,879
0,876
0,873
0,870
0,868
0,866
0,865
0,863
0,862
0,861
0,860
0,859
0,858
0,858
0,857
0,856
0,856
0,855
0,855
0,854
0,854

0,9
3,078
1,886
1,638
1,533
1,476
1,440
1,415
1,397
1,383
1,372
1,363
1,356
1,350
1,345
1,341
1,337
1,333
1,330
1,328
1,325
1,323
1,321
1,319
1,318
1,316
1,315
1,314
1,313
1,311
1,310

0,95 0,975
0,99
0,995
6,314 12,710 31,820 63,660
2,920 4,303 6,965 9,925
2,353 3,182 4,541 5,841
2,132 2,776 3,747 4,604
2,015 2,571 3,365 4,032
1,943 2,447 3,143 3,707
1,895 2,365 2,998 3,499
1,860 2,306 2,896 3,355
1,833 2,262 2,821 3,250
1,812 2,228 2,764 3,169
1,796 2,201 2,718 3,106
1,782 2,179 2,681 3,055
1,771 2,160 2,650 3,012
1,761 2,145 2,624 2,977
1,753 2,131 2,602 2,947
1,746 2,120 2,583 2,921
1,740 2,110 2,567 2,898
1,734 2,101 2,552 2,878
1,729 2,093 2,539 2,861
1,725 2,086 2,528 2,845
1,721 2,080 2,518 2,831
1,717 2,074 2,508 2,819
1,714 2,069 2,500 2,807
1,711 2,064 2,492 2,797
1,708 2,060 2,485 2,787
1,706 2,056 2,479 2,779
1,703 2,052 2,473 2,771
1,701 2,048 2,467 2,763
1,699 2,045 2,462 2,756
1,697 2,042 2,457 2,750

14

Yakdhane ABASSI

http://yakdcours.webou.net

Chapitre3 : les mthodes d'chantillonnage


Pour effectuer une tude statistique (enqute, observation ou exprimentation), on se
sert gnralement d'un chantillon. Celui-ci doit reflter le plus exactement possible
L'image de la population. En fait, choisir un chantillon, c'est mettre ensemble un
certain nombre d'individus qui composeront une sorte de modle rduit de la
population laquelle ils appartiennent. Mais comment choisir ces individus? C'est
cette question que nous rpondrons dans ce chapitre, en prsentant les mthodes
d'chantillonnage les plus courantes.
I/ Les mthodes alatoires:
Commenons d'abord par les mthodes dites alatoires. Le mot "alatoire" vient du
latin ala, "jeu de ds". II est employ ici pour signifier que les mthodes abordes ont
toutes comme caractristique d'tre bases sur le hasard.
1- L'chantillonnage alatoire simple:
L'chantillonnage alatoire simple consiste choisir des individus de telle sorte que
chaque membre de la population ait une gale chance de figurer dans l'chantillon. Ce
choix peut se faire avec ou sans remise: avec remise (on dit aussi non exhaustif), un
individu peut tre choisi plusieurs fois; sans remise (on dit aussi exhaustif), un individu
dj choisi ne peut l'tre de nouveau. L'chantillonnage alatoire simple est
habituellement fait sans remise. En effet, l'chantillon est trs souvent de petite taille
par rapport celle de la population, et la possibilit qu'un mme individu soit choisi
plus d'une fois est alors faible. En outre, l'chantillonnage sans remise est plus facile
sur le plan oprationne1.
Pour recourir l'chantillonnage alatoire simple, il faut disposer d'une liste jour de
tous les individus d'une population dtermine. On choisit alors L'chantillon l'aide
de nombres alatoires: un nombre alatoire est un nombre dont le hasard a dtermin
chacun des chiffres qui le composent. Pour y parvenir, on utilise soit une table
spcialement conue cette fin, soit une calculatrice, soit un programme informatique.
L'exemple suivant aidera comprendre comment procder.
Exemple :
On veut choisir par chantillonnage alatoire simple, sans remise, 8 tudiants; parmi
un groupe de 60. La slection de L'chantillon sera faite l'aide de la table de nombres
alatoires qui se trouve la page suivante.

15

Yakdhane ABASSI

http://yakdcours.webou.net

Table des nombres alatoires


92033
48885
04774
60385
56702
32744
63084
96750
99809
48837
46347
65793
40585
48546
62661
35762
35940
96063
29650
85129
50109
37708
72040
06335
11859
54718
38055
79352
94669
20501
41980
37273
58854
79359
57074
47399
81615
11168
87140
80039
12567
51646
72362
17951
47518
70070
73556

80696
18295
56239
11803
16943
07171
35161
08697
57531
32253
90015
54819
83547
02045
07873
94389
85953
43229
55866
68938
88952
49907
49876
19548
66327
01251
63671
16177
73141
93684
06793
92154
67852
05765
10788
14441
88425
61067
24350
77313
84092
92661
04775
55486
78723
07152
43198

28539
35380
41710
81477
35824
46142
89169
97546
13973
97156
62242
89871
35551
19225
00215
86960
54717
00984
60952
62005
74335
91188
02777
02172
22991
55991
12730
95394
26022
87259
31724
85129
50109
37708
72040
55866
68938
88952
72362
17951
27273
84092
92661
37273
72362
17951
07273

82033
38885
50226
50385
46702
22744
53084
86750
89809
38837
36347
55793
30585
38546
52661
25762
25940
86063
19650
75129
40109
27708
62040
36650
01859
44718
28055
69352
84669
10501
31980
27273
48854
69359
47074
37399
71615
01168
77140
70039
02567
41646
62362
07951
37518
60070
63556

85696
23295
61239
16803
21943
12171
40161
13697
62531
37253
95015
59819
88547
07045
12873
99389
90953
48229
60866
73938
93952
54907
54876
24548
71327
06251
68671
21177
78141
98684
11793
97154
72852
10765
15788
19441
93425
66067
29350
82313
89092
97661
09775
60486
83723
12152
48198

33539
40380
46710
86477
40824
51142
94169
12546
18973
10156
67242
94871
40551
24225
05215
91960
59717
05984
65952
67005
79335
96188
07777
07172
27991
60991
17730
10394
31022
92259
36724
90129
55109
42708
77040
60866
73938
93952
77362
22951
32273
89092
97661
42273
77362
22951
12273

46017
24443
02387
30193
28351
16372
31542
48375
49905
24419
23174
32897
20293
24273
31331
17881
17970
48032
14825
42565
25055
18854
36020
03168
05930
27359
19028
39676
47335
10251
20990
18637
29427
39680
28537
23700
40808
05584
43570
40020
06284
25823
36181
08976
23759
35035
36778

09513
11793
13903
27159
11941
15381
29723
32515
04658
32385
20747
29957
11850
06408
01072
28987
18239
00328
20317
20668
24778
30396
00926
00724
07664
18664
04243
31798
08674
29086
10575
28376
16703
12569
24013
18622
22979
29651
24121
05984
09091
28031
30887
12424
24121
05984
02424

27344
12962
16742
16795
15567
07581
17695
28917
29936
12946
12116
18598
10195
12849
17554
08587
08647
28688
06550
25043
13370
09236
20680
12217
00620
14906
09352
23117
28223
03500
10660
09091
16285
23120
15691
12466
23872
00389
25713
23346
00856
13882
20787
02650
12506
20023
21185

20174
04574
14060
02951
04236
01793
08790
02174
14383
08063
22504
13705
20887
00511
01968
23597
21488
10807
13967
17235
22238
12477
12469
04887
16582
00313
15918
04044
18285
23421
01698
23039
16963
01441
02697
03610
22106
15267
06088
19328
21023
23165
01194
13872
19681
01788
10800

16

Yakdhane ABASSI

http://yakdcours.webou.net

- La premire tape consiste numroter chaque tudiant L'aide de deux chiffres afin
que chacun des tudiants ait la mme chance d'tre choisi: 01, 02, 03..., 59, 60.
- La deuxime tape consiste choisir un processus de dplacement dans la table et
dterminer au hasard un premier nombre de deux chiffres (car il y a deux chiffres dans
60) qui sera le point de dpart. L'chantillon sera alors constitu des huit premiers
nombres de deux chiffres n'excdant pas 60, tout nombre apparaissant une deuxime
fois tant limin.
Supposons que l'on ait choisi comme point de dpart de la table les deux premiers
chiffres l'intersection de la 4me ligne et de la 3me colonne. Supposons aussi que
L'on ait dcid d'aller de haut en bas jusqu' la fin de la colonne en ne prenant toujours
que les deux premiers chiffres de chaque nombre, puis de reprendre le mme processus
en haut de la colonne suivante.
L'chantillon se composerait alors des tudiants portant les numros suivants:
35,46,13,19,54,60,02 et 22.

En rsum, L'chantillonnage alatoire simple consiste choisir n units statistiques


parmi N units d'une population dont on possde la liste.
1. On numrote tous les individus de la liste avec des nombres comportant un
nombre de chiffres.

mme

2. En utilisant une table de nombres alatoires, une calculatrice ou un programme


informatique, on obtient des nombres alatoires comportant le nombre de chiffres
dsir.
3. En rejetant les nombres qui ne font pas partie de la liste ou qui se rptent, on
s'arrte aprs avoir slectionn n individus.
2/ L'chantillonnage systmatique:
L'chantillonnage systmatique est une mthode demandant moins de manipulations
que L'chantillonnage alatoire simple. Cependant, elle suppose aussi l'existence d'une
liste de la population o chaque individu est numrot de
1 jusqu' N. Notons n, le nombre d'individus que doit comporter L'chantillon. L'entier
voisin de N/n sera not r et appel la raison de sondage (ou le pas de sondage).
Choisissons ensuite au hasard un entier d entre 1 et N: cet entier sera le point de dpart.
Pour former L'chantillon, il s'agira de choisir un premier individu comme point de
dpart; ce sera l'individu dont le numro correspond : d. Pour slectionner (les autres,
il suffit d'ajouter d la raison de sondage:
les individus choisis seront alors les individus dont les numros correspondent :
d ; d + r; d + 2r; d + 3r; etc.
II faudra reprendre au dbut lorsque la liste sera puise.
17

Yakdhane ABASSI

http://yakdcours.webou.net

Exemple : On veut choisir par chantillonnage systmatique 6 tudiants parmi un


groupe de 60. La raison de sondage (r) sera 10, car N/n = 10. (Si L'on devait trouver un
chantillon de taille (n) 7, la raison serait plutt 9 puisque 60/7 = 8,57, arrondi 9.) Si
L'origine choisie au hasard est disons, 3, les tudiants inclus dans L'chantillon
correspondront aux numros suivants:
3, c'est--dire le point de dpart ; 13, c'est--dire 3 + 10 ;
23, c'est--dire 3 + (2 x 10) 33, c'est--dire 3 + (3 x 10) 43, c'est--dire 3 + (4 x 10) 53,
c'est--dire 3 + (5 x 10)
Notre chantillon est maintenant complet; il sera compos des tudiants portant les
numros suivants: 3, 13,23,33,43, 53.
Selon la raison de sondage et le point de dpart choisi, il peut arriver que le nombre
obtenu se situe l'extrieur de la liste. En pareil cas, il faut revenir au dbut de la liste.
Si L'on reprenait l'exemple prcdent et si L'on devait continuer prlever des
tudiants, on obtiendrait le numro 63, c'est--dire 3 + (6 x 10). Comme ce numro r se
situe l'extrieur de la liste, on reviendrait au dbut de la liste et on choisirait le
numro 3 (puisque 63 - 60 = 3).
En rsum, L'chantillonnage systmatique consiste choisir n units statistiques
parmi N units d'une population dont on possde la liste.
1. On numrote tous les individus de la liste.
2. On calcule la raison de sondage (r), c'est--dire l'entier le plus proche de Nin.
3. On choisit au hasard un entier d entre 1 et N.
4. A partir de d, on ajoute autant de fois r que cela est ncessaire pour slectionner n
units statistiques.
3/ L'chantillonnage stratifi:
Contrairement aux deux mthodes prcdentes, dans L'chantillonnage stratifi, on
tient compte des renseignements qu'on pourrait dj possder sur la population,
renseignements obtenus en particulier lors d'un recensement. La mthode repose en
effet sur une division de la population en groupes relativement homognes, appels
strates, puis sur la slection d'un chantillon dans chaque strate. C'est une mthode qui
permettra d'obtenir un chantillon reprsentatif, c'est--dire un chantillon qui
possdera les mmes caractristiques que la population dont il a t extrait. Illustrons
le processus L'aide d'un exemple.
Exemple :
On veut choisir par chantillonnage stratifi 10 lves dans un groupe de 60, en tenant
compte du fait que 50 % d'entre eux sont en premire anne, 30 % en 2e anne et 20 %
en 3e anne. Chaque anne sera une strate dans laquelle on ira chercher des lves en
18

Yakdhane ABASSI

http://yakdcours.webou.net

tenant compte des pourcentages qu'occupe chaque strate dans la ' population. Ainsi, on
choisira au hasard:
5 lves en 1re anne, puisque 10 x 50% = 5 ;
3 lves en 2me anne, puisque 10 x 30% = 3 ;
2 lves en 3me anne, puisque 10 x 20% = 2.
Il ne reste plus qu' slectionner un chantillon dans chaque strate, ce qui pourrait tre
fait par chantillonnage alatoire simple ou systmatique.
Dans une population peu homogne, le dcoupage en strates sera d'autant plus
avantageux qu'existera une certaine homognit L'intrieur de chaque strate.
4/ L'chantillonnage par grappes:
Dans chacune des mthodes prcdentes, les units de L'chantillon taient choisies
individuellement. L'chantillonnage par grappes consiste plutt choisir plusieurs
individus en mme temps, c'est--dire par groupes. Par exemple, prenons comme
population les habitants d'une ville partir desquels on dsire constituer un chantillon
de 600 individus. Selon les mthodes prcdentes, il faudrait choisir 600 individus
dissmins dans toute la ville. Suivant L'chantillonnage par grappes, on pourra choisir
les 600 individus dans une vingtaine d'immeubles choisis au hasard, o tous les
occupants auront t retenus.
Exemple :
Au moyen de L'chantillonnage par grappes, il s'agit de choisir 12 tudiants; dans un
groupe de 60. On demande aux tudiants de se regrouper par 6. On choisit ensuite au
hasard deux regroupements, par exemple les grappes numros 4 et 7. En retenant tous
les individus de ces deux grappes, on constitue un ; chantillon de 12 tudiants.
Dans l'exemple prcdent, la situation tait assez simple. Dans les faits, les choses
sont: beaucoup plus compliques. Par exemple, dans une ville, les quartiers et les
immeubles ne sont pas composs d'un nombre gal d'individus. Comment peut-on
procder alors pour effectuer un chantillonnage par grappes? Puisque le nombre
d'habitants et le nombre d'immeubles et de logements de chacun des quartiers sont
gnralement connus, il est possible de quadriller la ville en un grand nombre de
secteurs (qu'on appelle lots) ayant des populations peu prs semblables. Pour
constituer un chantillon, il suffira alors de choisir certains de ces secteurs et, par
consquent, toutes les personnes qui y habitent.

En rsum, L'chantillonnage par grappes consiste choisir n units statistiques parmi


N units d'une population.
1. On subdivise la population en grappes, autant que possible nombreuses et de taille
quivalente. Par exemple, si L'on doit rpartir 307 individus dans 10 grappes, on
pourra faire 7 grappes de 31 personnes et 3 grappes de 30 personnes.
19

Yakdhane ABASSI

http://yakdcours.webou.net

2. On calcule combien il faut de grappes pour constituer L'chantillon.


3. On choisit au hasard les grappes qui serviront construire L'chantillon.
4. On slectionne tous les individus des grappes choisies.

II/Les mthodes non alatoires


Les mthodes de la section prcdente sont dites alatoires. Le processus de slection
est alors bas sur le hasard, et les individus faisant partie de la population ont tous une
gale possibilit de faire partie de L'chantillon. On oppose aux mthodes alatoires
les mthodes dites non alatoires: ce sont des mthodes o le concept de chances
gales est absent. En utilisant des mthodes non alatoires, il faut toujours craindre un
manque de fiabilit. Un des seuls moyens de mesurer l'exactitude de leurs rsultats est
souvent de les contrler par d'autres tudes. Doit-on alors penser que les mthodes non
alatoires sont rarement employes? Pour diffrentes raisons, on ne peut souvent pas
faire autrement que d'y recourir. On s'en sert pour des tudes exploratoires; pour
rduire les cots; parce que le recours une mthode alatoire n'est ni possible ni
mme envisageable; ou encore lorsque l'homognit de la population est telle qu'il
serait inutile d'utiliser des mthodes alatoires.
1/ L'chantillonnage l'aveuglette:
La personne qui dguste des chantillons de vin pour dterminer lequel est le meilleur
ou le journaliste qui, au moyen d'entrevues dans (a rue, sonde L'opinion du grand
public sur un sujet d'actualit, mettent en pratique la mthode de L'chantillonnage
l'aveuglette. Le grand avantage de cette mthode est qu'elle demande peu de
planification. D'application restreinte, elle peut malgr tout donner de bons rsultats si
la population observe est homogne. Par exemple, si L'on dsire valuer la
concentration d'un produit chimique dans un lac ou le taux de glycmie d'une
personne, il est raisonnable de supposer que les rsultats devraient tre assez
semblables d'un chantillon L'autre.
2/ L'chantillonnage de volontaires:
Dans le cas d'expriences psychologiques ou mdicales, d'enqutes sur les habitudes
de consommation, il ne serait pas pratique de choisir au hasard des individus dans
toute la population. Comme l'enqute sera longue, exigeante, quelquefois mme
dsagrable, on prfre runir des volontaires, d'o le nom d'chantillonnage de
volontaires. Nanmoins, il faut toujours craindre un cart entre les caractristiques des
volontaires et celles de la population, surtout en matire d'opinion. Les maisons de
sondage font souvent appel un chantillon fixe, appel panel, form de volontaires. Il
faut savoir que cette faon de procder peut tre une source importante d'erreurs mme
si on essaie de l'amliorer en se servant d'un chantillon d'assez grande taille. Par
20

Yakdhane ABASSI

http://yakdcours.webou.net

exemple, on a souvent not la tendance tre systmatiquement favorables ou neutres


sur certaines d'actualit, alors que les opinions de la population sur les mmes
questions taient beaucoup plus diversifies.

3/ L'chantillonnage par quotas:


L'chantillonnage par quotas est largement utilis dans les enqutes d'opinion et les
tudes de march, notamment parce qu'il ne suppose pas de liste des individus de la
population. La mthode porte galement le nom d'chantillonnage dirig ou par choix
raisonn. On parle aussi d'chantillonnage reprsentatif 6. On demande en effet aux
enquteurs de faire un nombre dtermin d'entrevues dans divers groupes tablis en
fonction du secteur gographique, de L'ge, du sexe ou d'autres caractristiques. Les
chantillons de dpart peuvent tre obtenus par slection au hasard, par exemple par
tlphone, tout comme pour un chantillon alatoire. La diffrence essentielle rside
toutefois dans la slection des individus l'tape ultrieure: dans la mthode des
quotas, chaque enquteur doit suivre des instructions quant au nombre de personnes
interroger suivant le sexe, l'ge, etc.; il doit carter certains individus, en choisir
d'autres, et ce jusqu' l'obtention de ses quotas. Ceux-ci ont t calculs partir de
donnes disponibles, de manire que les sexes, les groupes d'ge et les catgories
socio-conomiques soient correctement reprsents dans L'chantillon. La mthode
des quotas est gnralement moins coteuse et plus facile raliser que celle d'un
chantillonnage alatoire. Elle prsente cependant certaines difficults du cot de la
reprsentativit de certains groupes. Pour le groupe d'ge de 65 ans et plus, il est
possible que les enquteurs n'interrogent que les personnes de 65 ou 66 ans, et qu'ils
ngligent ceux qui ont 70, 75 ou 80 ans. Une autre difficult vient du phnomne de
non-rponse: dans une mthode base sur des quotas, on ne se soucie pas des non
rpondants (refus de rpondre, absence du domicile), mme s'il peut exister des
diffrences importantes entre les caractristiques des rpondants et des nonrpondants.

21

Yakdhane ABASSI

http://yakdcours.webou.net

Chapitre 4 : les distributions dchantillonnage


Dune faon gnrale, la distribution dchantillonnage caractrise les fluctuations
dchantillonnage de toute statistique (moyenne, proportion variance) calcule sur tous
les chantillons possibles de mme taille.
I- Distribution dchantillonnage dune moyenne
Si nous prlevons tous les chantillons possibles de mme taille dune population, la
moyenne arithmtique (X) calcule sur chaque chantillon variera dun chantillon
lautre. Cependant, ces moyennes auront des valeurs autour dune valeur centrale qui
est celle de la moyenne de la population.

Dmonstration
n

xi
1

n
n

E( X )

E ( xi ) m

V (X )

V ( xi )
1

n.m
m
n

n. 2
n

Conclusion
Si on prlve un chantillon alatoire de taille n, dune population (infinie ou dune
population finis chantillonnage avec remis) dont les lments possde caractre X qui
suit une loi probabilit de moyenne E(X)=m et de variance V(X)=

alors la

moyenne dchantillon X suit une loi de probabilit de moyenne :


E( X )=E(X)=m
Et de variance:
V ar ( X )= ( /n)
2

Remarque : Lorsque lchantillonnage seffectue sans remise partir dune population


finie de taille N, on doit apporter une correction Var ( X )

22

Yakdhane ABASSI

http://yakdcours.webou.net

Var ( X ) = ( /n) * [(N-n)/(N-1)] = ( /n) *[1- ((n-1)/(N-1))] .


2

(n-1/N-1) le taux de sondage( n /N), le facteur de correction peut tre ignor si le


taux de sondage est infrieur 10%.

Thorme central limite :


On sait que X suit une variable alatoire sans pour autant connatre cette loi de
probabilit. Pour identifier cette loi il faut recourir au thorme central limite

Thorme central limite (TCL) :


Si on prlve un chantillon alatoire de taille n, dune population (infinie ou dune
population finie et chantillonnage avec remise) dont les lments possdent un
caractre X qui suit une loi de probabilit de moyenne E(X)=m et de variance V(X)=

alors la distribution dchantillonnage de la variable alatoire X tend se

rapprocher dune loi normale de moyenne E( X )=m et de variance V( X )=


Ainsi X

/n

N(m, )
n

On remarque que lcart type de X est en fonction de lcart type de la population .


Un problme peut ainsi se poser lorsquon ne connat pas cet cart type de la
population. Dans ce cas il faut estimer cet cart type par celui de lchantillon (S) :
n

( Xi X )

n 1

Cependant, dans ce cas, la loi de probabilit peut changer selon la taille de


lchantillon. Trois cas sont alors possibles :
1er cas :

connu alors la loi de probabilit sera :


X

N (m,

) do

X m

N(0,1)

23

Yakdhane ABASSI

http://yakdcours.webou.net

2me cas :

inconnu et n>30 alors la loi de probabilit sera :


N(m, S ) do
n

X m
N(0,1)
S
n

3me cas :

inconnu et n<30 alors la loi de probabilit sera :


X m
S

T(n-1)

n
Exercice : Dterminer la distribution dchantillonnage de la diffrence de deux
moyennes dun caractre X mesur sur deux chantillons extraits de deux populations
diffrentes en supposant que les carts type de ce caractre au niveau de chaque
population sont connus.

24

Yakdhane ABASSI

http://yakdcours.webou.net

II- Distribution dchantillonnage dune proportion :


On considre une population caractrise par un proportion p dindividus possdant un
certain caractrise qualitatif. Si on prlve au hasard diffrents chantillons de cette
population on remarque que la proportion f dindividus possdant ce caractre
qualitatif varie dun chantillon lautre, on peut donc lui attribuer une variable
alatoire.
On dmontre que pour une taille dchantillon n >30 :

f N ( p,

pq
f p
) d ' o
N (0,1)
n
pq
n

Exercice : Dterminer la distribution dchantillonnage de la diffrence de deux


proportions relatives un mme caractre mesur sur deux chantillons ayant une
taille suprieure 30 et extraits de deux populations diffrentes.

25

Yakdhane ABASSI

http://yakdcours.webou.net

Chapitre 5 : Lestimation statistique


Un aspect important de linfrence statistique est celui dobtenir partir des rsultats
trouvs sur lchantillon dune population des estimations fiables de certain paramtre
de cette population tels que la moyenne, la variance et la proportion.
Ces estimations peuvent sexprimer soit par une seule valeur, on parlera alors
destimation ponctuelle, soit par un intervalle, on parlera dans ce cas destimation par
intervalle de confiance.
I- Lestimation ponctuelle
Cette technique consiste estimer un paramtre de la population laide dun seul
nombre dduit des rsultats de lchantillon, ce nombre est appel estimateur ponctuel

de et sera not

Un estimateur dois possder certaines qualits ou proprits afin de fournire une bonne
estimation. Cet estimateur doit tre sans biais efficace et convergent.

-Estimateur sans biais :E( )=


-Estimateur efficace : si sa variance est la plus faible parmi les variances des autres
estimateurs sans biais

- estimateur convergent : limite V ( )= 0


n
Exercice :
- Montrer que X est un estimateur sans biais et convergent de m
- Montrer que f est un estimateur sans biais et convergent de p

26

Yakdhane ABASSI

http://yakdcours.webou.net

Remarque : les estimations ponctuelles ne fournissent aucune information concernant


la prcision des estimations, cest dire quelles ne tiennent pas fluctuations
dchantillonnage.
II- Lestimation par intervalle de confiance
Lestimation par intervalle dun paramtre inconnu consiste calculer partir dun

estimateur choisi , un intervalle dans lequel on a un pourcentage de chance dy


trouver correspondante du paramtre .
Lintervalle de confiance est dfini par deux limites auxquelles est associ une certaine
probabilit de contenir la vraie valeur du paramtre .

P( LI LS ) 1
LI : Limite infrieure de lintervalle de confiance
LS : Limite suprieure de lintervalle de confiance
1- Estimation dune moyenne :
Trois cas peuvent se prsenter selon la loi de probabilit de X :
1er cas :

connu alors la loi de probabilit de X sera :

X N (m,

X m
P
t

2

)d ' o

X m

N (0,1)

X m

P t
t 1

On dtermine alors la valeur de t/2 partir de la table de la loi normale centre rduite.
Par la suite on pourra dgager un intervalle de confiance pour m.

X t

m X t


m X t
; X t

n
n

2
2
Yakdhane ABASSI

27

http://yakdcours.webou.net

Application :
Une entreprise de conserves dsire connatre le poids moyen des boites quelle
fabrique. Des tests effectus il y 2 ans permettent de considrer que le poids dune
boite est distribu normalement avec une variance de 9 grammes.
Un test sur un chantillon de 16 boites a donn un poids moyen de 219 gr.
Estimer par un intervalle de confiance le poids moyen des boites avec un niveau de
confiance de 95%.

2me cas :

inconnu et

X N (m,

n30 alors la loi de probabilit de X sera :

S
)
n

X m

P
t 1

S
2

X m

P t
t 1


S
2
2

On dtermine alors la valeur de t/2 partir de la table de la loi normale centre


rduite. Par la suite on pourra dgager un intervalle de confiance pour m.
28

Yakdhane ABASSI

http://yakdcours.webou.net

X t

S
S
m X t

n
n
2

dou

S
m X t

n
2

X t

Application : Une entreprise de conserves dsire connatre le poids moyen des boites
quelle fabrique. Un test sur un chantillon de 36 boites a donn un poids moyen de
219 grammes avec un cart type de 1.5 grammes Estimer par intervalle de confiance le
poids moyen des boites avec un niveau de confiance de 99%.

3me cas :

inconnu et n<30 alors la loi de probabilit de X sera :

X m
T (n 1)
S
n

29

Yakdhane ABASSI

http://yakdcours.webou.net

m
P
t 1
S
2

X m

P t
t 1
S
2
2

On dtermine alors la valeur de t/2 partir de la table de la loi de Student. Par la suite
on pourra dgager un intervalle de confiance pour m.

S
S
m X t
; X t

n
n
2
2

Application : Une entreprise de conserves dsire connatre le poids moyen des boites
quelle fabrique. Un test sur un chantillon de 9 boites a donn un poids moyen de 219
grammes avec un cart type de 1.5 grammes
Estimer par intervalle de confiance le poids moyen des boites avec un niveau de
confiance de 99%

Remarque : Lexpression des bornes de lintervalle de confiance pourrait tre


modifie si on se trouve dans lobligation dapporter un ajustement la variance dans
le cas ou le tirage de lchantillon se fait sans remise avec un taux de sondage
suprieur 10%.
30

Yakdhane ABASSI

http://yakdcours.webou.net

Exercice : Dterminer un intervalle de confiance pour la diffrence de deux moyennes


dun mme caractre mesur sur deux populations diffrentes sachant que les carts
types de ce caractre au niveau des deux populations sont connus.

31

Yakdhane ABASSI

http://yakdcours.webou.net

2- Estimation dune proportion


Pour dterminer un intervalle de confiance pour une proportion on utilise la
distribution suivante :
f N ( p,

pq
)
n

d ' ou

f p
N (0,1)
pq
n

avec n 30

p
P
t 1
2
pq
n

On dtermine la valeur de t/2 partir de la table de la loi normale

t
2

f t

f p
pq
n

pq
p f t

n
2

pq
n

On remarque que les bornes de lintervalle de confiance de p, on va alors estimer p par


f uniquement au niveau des deux bornes de lintervalle.

f t

f(1 f)
f(1 f)
p f t
n
n
2

Exemple : Dans une banque, on a effectu un sondage pour connatre lopinion des
clients sur un nouveau service aux agences. Dune liste de 6000 clients de la banque on
extrait 150, sur ces 150 clients interrogs 45 taient satisfaits de ce service. Dterminer
un intervalle de confiance pour la vraie proportion des clients qui sont satisfaits de ce
nouveau service avec un niveau de confiance de 99%.

32

Yakdhane ABASSI

http://yakdcours.webou.net

III- La dtermination de la taille de lchantillon


La taille de lchantillon est lie la marge derreur E quon va tolrer cest dire la
diffrence en valeur absolue entre le paramtre estimer et son estimateur.

1- Cas dune moyenne

On sait que :

X t

Donc :

m X t

m X t

Ainsi pour un niveau de confiance 1- la marge derreur E est au plus gale :

t n
2

Cette valeur quantifie lerreur attribuable aux fluctuations dchantillonnage. Ainsi on


peut fixer la marge derreur E quon ne veut pas excder et dterminer la taille
minimale requise de lchantillon.

n 2

Et 2 n

Ainsi plus la marge derreur est faible plus la taille de lchantillon est leve.
Exemple : On veut estimer la dure de vie moyenne dun dispositif lectronique.
Daprs le bureau de RD lcart type de la dure de vie de ce dispositif serait 100
heures. Dterminer le nombre dessais requis pour estimer avec un niveau de confiance
de 95%, la dure de vie moyenne dune grande production de ce dispositif de sorte
que la marge derreur dans lestimation nexcde pas 50 heures.

33

Yakdhane ABASSI

http://yakdcours.webou.net

Exercice : Dterminer la formule donnant la taille de lchantillon dans le cas dun


chantillonnage sans remise avec un taux de sondage suprieur 10%.

2- Cas dune proportion


Dans le cas de lestimation dune proportion on sait que :

f p t

Et

p(1 p)
n

p(1 p)
n

La taille de lchantillon serait donc :

t2 / 2 p (1 p )

Si on a une information sur la valeur approximative de p on va la remplacer dans la


formule, sinon on remplace p par 0.5.

34

Yakdhane ABASSI

http://yakdcours.webou.net

Exemple : On veut effectuer un sondage auprs des 8000 tudiants dune facult pour
estimer le pourcentage des fumeurs. Dterminer la taille de lchantillon requise pour
estimer avec un niveau de confiance de 95% cette proportion avec une marge derreur
nexcdant pas 5% dans les deux cas suivants :
- Une enqute similaire effectue il y a 3 ans indiqua que 32% des tudiants fumaient
- En supposant quon na aucune information pralable sur p.

35

Yakdhane ABASSI

http://yakdcours.webou.net

Chapitre 6 : Les tests paramtriques


Pour effectuer un test statistique on doit dabord mettre des hypothses concernant un
paramtre de la population (moyenne, proportion ) afin de vrifier par la suite la
vracit de ces hypothses.
I- La procdure du test
Supposons quon veut effectuer le test suivant
H0 : = 0
H1 : 0
La dcision va seffectuer sur la base des rsultats dun chantillon. Deux types de
dcisions errones que lon appellera erreurs peuvent tre prises :
- On appelle erreur de premire espce le fait de rejeter tort lhypothse H0.
La probabilit correspondante cette erreur est appele risque de premire espce :
=P(rejeter H0 /H0 vraie )=P(dcider H1 / = 0)
- On appelle erreur de seconde espce le fait de rejeter tort lhypothse H1. La
probabilit correspondante cette erreur est appele risque de seconde espce :
= P (rejeter H1/ H1 vraie) = P(dcider H0/ 0)
Dcision
Raliste

H0 vraie
H1 vraie

H0 retenue
Bonne dcision (1- )
Erreur de seconde espce( )

H1 retenue
Erreur de premire espce ()
Bonne dcision (1- )

- On appelle puissance du test : = 1-


- On appelle rgion critique dun test, la rgion de rejet de lhypothse H0
La dmarche suivre pour effectuer un test est la suivante :
- Enoncer les hypothses H0 et H1 (H0 est lhypothse laquelle on crot le plus)
- Prciser la loi de la variable dans la population
- Prciser la statistique utilise et sa distribution au niveau de lchantillon
- Dterminer en fonction du risque de premire espce la frontire de la rgion
critique
- Si la valeur observe partir de lchantillon appartient la rgion critique, on
rejette H0 sinon on accepte cette hypothse.
II- Test sur une moyenne
Pour la dtermination de la rgion critique, on va se placer dans le cas ou la variable
tudie est distribu au niveau de la population suivant une loi normale de moyenne m
inconnue quon va tester et un cart type connu.
1-Test unilatral droite :
Les hypothses du test se prsentent sous la forme :
H0 : m = m0
H1 :m > m0
La variable X tudie au niveau de la population suit une loi normale de paramtres m
et ,avec connu. Ainsi la distribution de X au niveau de lchantillon sera :

36

Yakdhane ABASSI

http://yakdcours.webou.net

X N (m,

d ' o

X m

N (0,1)

On commence par dterminer la frontire de la rgion critique ( c )


= P (rejeter H0/H0 vraie)
= P (m>m0 /m=m0)
La dcision se fait compte tenu de la valeur de X calcule au niveau de lchantillon
P( X >c / m=m0)=

P( X m) cm /mm0)

P(X * cm0 )

n
P(X * cm0)1

D'ou t cm0

n
On dtermine la valeur de t partir de la table de la loi normale. Ainsi la frontire de
la rgion critique aura pour expression :

cm0t
n

Rgle de dcision :
-

Rejet de H0 si la valeur de X >c

Acceptation de H0 si la valeur de

X c

Axe :

37

Yakdhane ABASSI

http://yakdcours.webou.net

Exemple :
Une machine est rgle afin de verser 500 grammes de poudre de chocolat dans les
sachets. Les statistiques du service de production montrent que le poids vers dans ces
sachets suit une loi normale dcart type 9 grammes. Un chantillon de 9 sachets
prlevs au hasard a donn un poids net moyen de 504 grammes. Tester au seuil de 1%
si la machine est en train de verser plus de 500 grammes dans les sachets.

2- Test unilatral gauche


Les hypothses du test se prsentent sous la forme :
H0 :m=m0
H1 :m<m0
La variable X tudie au niveau de la population suit une loi normale de paramtres
N(m,) avec connu. Ainsi la distribution de X au niveau de lchantillon sera :

X N(m, )d'ou X m N(0,1)

n
n
Dtermination de la frontire de la rgion critique ( c )
=P (rejeter H0/H0 varie)
=P (m<m0/m=m0)
La dcision se fait compte tenu de la valeur de X calcule au niveau de lchantillon.
P( X <c/ m=m0)=
P( X m cm / mm0)

P(X* cm0)

n
38

Yakdhane ABASSI

http://yakdcours.webou.net

cm0 0

Or <0,5 dou

on aura ainsi

n
P(X* m0c )1

D'out m0c

n
On dtermine la valeur de t partir de la table de la loi normale. Ainsi la frontire de
la rgion critique aura pour expression :

cm0t
n

Rgle de dcision
- Rejet de H0 si la valeur de X <c
- Acceptation de H0 si la valeur de X c
Axe :

Exemple :
Une machine est rgle afin de verser 500 grammes de poudre de chocolat dans les
sachets. Les statistiques du service de production montrent que le poids vers dans ces
sachets suit une loi normale dcart type 9 grammes. Un chantillon de 9 sachets
prlevs au hasard a donn un poids net moyen de 495 grammes. Tester au seuil de 5%
si la machine est en train de verser moins que 500 grammes dans les sachets.

39

Yakdhane ABASSI

http://yakdcours.webou.net

3- Test bilatral
Les hypothses du test se prsentent sous la forme :
H0 :m=m0
H1 :m m0
La variable X tudie au niveau de la population suit une loi normale de paramtre m
et , avec connu .Ainsi la distribution de X au niveau de lchantillon sera :

X N(m, )d'ou X m N(0,1)

n
n
Dtermination de la rgion critique :
=P (rejeter H0 / H0 vraie )
=P(m < m0 /m = m0 )+P( m > m0 /m = m0 )
P(m < m0 /m = m0 ) = /2
P(m > m0 /m = m0 ) = /2
La dcision se fait compte tenu de la valeur de X calcule au niveau de lchantillon .
P( X <c1 /m=m0) = /2
P( X > c2 /m=m0 ) = /2
Dou :
c1 = m0 - t /2
n

c2 =m0 + t /2
n
Dcision : rejet de H0 si X < c1 ou X > c2

Axe :

C1

C2

X
Rejet Ho
m<m0

Acceptation H0
m = m0

Rejet Ho
m>m0

Exemple :
Une machine est rgle afin de verser du lait dans les bouteilles de 500 ml le volume
de lait vers suit une loi normal dcart type 5 ml .Un chantillon de 10 bouteilles a
donn un volume moyen de 496, 7 ml .
Peut-on conclure au seuil de 5% que la machine est drgle?

40

Yakdhane ABASSI

http://yakdcours.webou.net

Remarque : Les expressions des frontires des rgions critiques doivent tre
modifies lorsquon change la distribution de X .
III- Test sur une proportion
Pour effectuer un test sur une proportion on utilise la distribution suivante :

f N(p,

p(1 p)
)
n

f p
N (0,1)
p(1 p)
n
1- Test unilatral droite
Les hypothses du test sont :
H0 :p =p0
H1 :p>p0
Il faut dterminer la frontire c de la rgion critique.
P (rejet H0/ H0 vraie)=
P(f>c p=po)=
f p
c p0
P(

)
p(1 p)
p0(1 p0)
n
n
c po
P(X*
)1
po(1 p0)
n

c po
po (1 p 0)
n

41

Yakdhane ABASSI

http://yakdcours.webou.net

Dou c p0t

p0(1 p0)
n

Rgle de dcision : Rejet de Ho si f > c

et acceptation de Ho si f < c

Axe :

Exemple :
Aux dernires lections, un parti politique a obtenu 42% des suffrages. Un rcent
sondage a rvl que sur 1041 personnes interroges 458 accordaient leur appui ce
parti. Le chef du parti dclara que a popularit de son parti tait la hausse. Tester la
validit de cette affirmation au seuil de 5%.

2- Test unilatral gauche


Les hypothses du test sont :
H0 :p =p0
H1 :p<p0

42

Yakdhane ABASSI

http://yakdcours.webou.net

Il faut dterminer la frontire c de la rgion critique


P(rejet H0/H0 vraie)=
P(f<c / p=p0)=

P(X *

c p0
)
p0(1 p0)
n

p0c
)1
p0(1 p0)
n
p0c
)1
p0(1 p0)
n

P(X *

dou

Dou

c p0t

p0(1 p0)
n

Axe et rgle de dcision :

3- Test bilatral
Les hypothses du test sont :
H0 :p =p0
H1 :p p0
P(rejet H0/H0 vraie)=
P(f>c1 / P=P0)+p(f<c2 / P=P0)=
P(f>c1 / P=P0)= /2
p(f<c2 / P=P0)= /2
dou :

c1 p0t /2

p0(1 p0)
n

c2 p0t /2

p0(1 p0)
n
43

Yakdhane ABASSI

http://yakdcours.webou.net

Axe et rgle de dcision :

IV- Test sur la diffrence de deux moyennes


Supposons quon veut effectuer un test sur la diffrence m1-m2 des moyennes de 2
populations qui sont normalement distribues.
Si les carts types sont connus, la statistique utiliser est :

( X 1 X 2) (m1 m2)

n1

N (0,1)

n2

Lexpression de la rgion critique se dtermine de la mme faon que les tests


prcdents :
H0 :m1-m2=0
H1 :m1-m2>0
c=
Axe et rgle de dcision

H0 :m1-m2=0
H1 :m1-m2<0
c=
Axe et rgle de dcision

H0 :m1-m2=0
H1 :m1-m2 0
c1 =
c2 =
44

Yakdhane ABASSI

http://yakdcours.webou.net

Axe et rgle de dcision

Remarque : Dans le cas ou les variances sont inconnues, on utilise la distribution


suivante :

(X1 X2)(m1m2)
2

T(n1n22)

s s

n1 n2

et Si (n1n2230) On utilise alors lapproximation par la loi normale centre rduite.

Exemple :
On a effectu des essais sur la dure de vie des ampoules de 60 Watts fabriques par
deux diffrentes entreprises. Les essais effectus dans les mmes conditions sur un
chantillon de 40 lampes de chaque entreprise ont donn les rsultats suivants :
Entreprise 1
n1=40
X1=1025h
S1=120h
Entreprise2 :
n2= 40
X2= 1070h
S2= 140h
Peut-on affirmer au seuil de signification de 5% que les ampoules de lentreprise 1 ont
une dure de vie infrieure celles de lentreprise 2.

V- Test sur la diffrence de deux proportions


Supposons quon veut effectuer un test sur la diffrence de deux proportions p1-p2. les
hypothses du test sont :
H0 :p1= p2
H1 :p1< p2
La statistique utiliser est :
45

Yakdhane ABASSI

http://yakdcours.webou.net

( f 1 f 2) ( p1 p 2)
N (0,1)
p1 (1 p1 ) p 2(1 p 2)

n1
n2
Sous lhypothse H0 les valeurs p1 et p2 sont inconnus mais supposes gales une
valeur commune p. on obtient une estimation de cette valeur en combinant les
observations dans chaque chantillon.

n1f1n2f2
Dou p n1n2
(f1 f2)(p1 p2)
N(0,1)
1
1
p(1 p)( )
n1 n2

Lexpression de la rgion critique se calcule de la mme faon que les tests


prcdents :
H0 :p1-p2 = 0
H1 :p1-p2<0
c=
Axe et rgle de dcision

H0 :p1-p2 = 0
H1 :p1-p2>0
c=
Axe et rgle de dcision

H0 :p1-p2 = 0
H1 :p1-p2 0
c1 =
c2 =
46

Yakdhane ABASSI

http://yakdcours.webou.net

Axe et rgle de dcision

Exemple :
Pour la promotion de son nouveau produit, la direction commerciale dune entreprise
met lhypothse selon laquelle la publicit du type A serait plus efficace que celle du
type B. une enqute auprs de 125 individus ayant vu la publicit A a montr que 44
dentre eux ont achet le produit alors que sur 100 personnes ayant vu la publicit B,
32 ont achet le produit.
Est- ce que les rsultats de ce sondage permettent de confirmer au seuil de signification
de 5%, lhypothse mise par la direction commerciale ?

47

Yakdhane ABASSI

http://yakdcours.webou.net

Chapitre 7 : les tests non paramtriques


Dans ce chapitre, nous allons examiner comment nous pouvons construire un test sur
la distribution dune certaine variable X et sur la relation de cette variable avec
dautres.
I- le test dajustement
Considrons, dans une population , une certaine variable X dont on ne connat pas la
nature de la distribution .on tire une chantillon alatoire de cette population et lon se
demande si nous pouvons accepter ou non que lchantillon obtenu se conforme tout
fait une distribution particulire spcifie.
Les hypothses du test sont :
H0 : La distribution observe est tire dune population mre caractrise par une
distribution thorique f(x, ) o est un paramtre connu ou inconnu.
H1 : La distribution observe nest pas tire dune population mre caractrise par
une distribution thorique f(x, )
Le prlvement de lchantillon permettra ultrieurement daccepter ou de rejeter
H0 avec un risque derreur .
Pour effectuer ce test on utilise la loi suivante :
n

(ninpi)
i1
2(k l1)
npi
2

k : Le nombre de classes dans la distribution


l : Nombre de paramtres inconnus de la distribution (quon doit estimer)
pi : Probabilit thorique de la classe i
npi : Effectif thorique de la classe i
ni : Effectif observ de la classe i
rgle de dcision :
soit le niveau de risque accept. Le seuil critique

est donn tel que :

P( 2> )=
2

Soit

- Si
- Si

2
c

la statistique calcule partir de lchantillon :

2
c

: On accepte lhypothse H0

> : On rejette lhypothse H0


2

Remarques :
- Sil existe un ou plusieurs effectifs thoriques npi<5 on effectue des regroupements
- La taille de lchantillon doit tre suffisamment grande (n30)

48

Yakdhane ABASSI

http://yakdcours.webou.net

Exemple1 (ajustement une loi uniforme)


Le responsable des jeux dun casino veut vrifier si les ds utiliss sont bien quilibrs.
Il prend au hasard dun d et le jette 120 fois. Les rsultats obtenus sont rsums dans
le tableau suivant :
Face
1
2
3
4
5
6
Effectif
14
16
28
30
18
14
Peut-il conclure au seuil de signification =5% que le d est bien quilibr ?
Il sagit de tester lhypothse le d est quilibr contre lhypothse le d nest pas
quilibr.
H0 : Le d est quilibr (la rpartition des rsultats est uniforme)
H1 : Le d nest pas quilibr ( la rpartition des rsultats nest pas uniforme)
Pour dcider entre H0 et H1 il faut calculer la statistique de
figurant sur la table

face
1
2
3
4
5
6

2
c

et la comparer celle

Effectif observ
(ni)
14
16
28
30
18
14
n=120

Probabilit thorique
(pi)

Effectif thorique
(n.pi)

(ni-n.pi)2/n.pi

2
c

49

Yakdhane ABASSI

http://yakdcours.webou.net

Rappel
Lorsquon veut tester lajustement dune distribution donne une certaines loi on est
parfois amen estimer certains paramtres de la loi thorique.
Loi
Normale
Poisson
Binomiale

Paramtres de la loi
m et

Estimateurs
X et S
X
X /n
n : Taille de chaque lot

Exemple2 (ajustement une loi de Poisson) :


Dans une usine on a effectu une tude sur le nombre de pannes mensuelles des
machines de production. Les donnes sur les cinq dernires annes sont rsumes dans
le tableau suivant :
Nombre de pannes mensuelles
0
1
2
3
4
5
6 et plus

Nombre de mois
9
15
18
11
6
1
0

Est-ce quon peut dire au seuil de signification =1% que le nombre de pannes
mensuelles suit une loi de poisson ?

50

Yakdhane ABASSI

http://yakdcours.webou.net

Nombre de
pannes
0
1
2
3
4
5
6 et plus
Total

Effectif
observ
9
15
18
11
6
1
0
60

Prob thorique

Effectif
thorique

Calcul de X2

2
c

Exemple 3 (ajustement une loi binomiale) :


Dans une entreprise fabriquant des tubes de verre, on effectue un contrle visuel sur un
chantillon de 80 lots form chacun de 20 tubes.
Tubes dfectueux
0
1
2
3
4
5
6 et +
Total

Nombre de lots
13
21
19
12
9
4
2
80

51

Yakdhane ABASSI

http://yakdcours.webou.net

II- Le test dindpendance


On considre deux variable X et Y dans une mme population. La question et de
savoir si ces deux variable sont indpendantes ou lies. Le test de Khi-deux permet de
rpondre cette question.
Les hypothses considrer se notent :
H0 : Les deux variables X et Y tudies dans cette population sont indpendantes
H1 : Les deux variables X et Y tudies dans cette population sont dpendantes
Pour effectuer ce test, on tire un chantillon de taille n de cette population. On
compare les effectifs observs nij (associs aux diffrentes couples de modalits de X
et Y) avec les effectifs thoriques nij.
Les observations au niveau de lchantillon sont regroupes dans un tableau de
contingence :

X1
.
Xj
.
Xk
nj

y1
n11

ni1

nk1
n1

.
.

.
.

yj
n1j
.
nij
..
nkj
n,j

..
.

.
..
..
.

yr
n1r

nir
..
nkr
nr

nj
n1
.
nj

nk
n

(k modalits pour la variable X)


(r modalits pour la variable Y)
Les effectifs thoriques en cas dindpendance sobtiennent en utilisant la proprit
suivante :
52

Yakdhane ABASSI

http://yakdcours.webou.net

ni. * n. j
n

n' ij

On est donc en prsence de deux distributions : Lune empirique et lautre thorique


dont on cherche ladquation. On utilise la statistique :
2

A
i1

(nijn'ij)
n'ij

j 1

A (k 1)(r1) sous les hypothses que :


2

La statistique
-

Les k*r observations sont indpendantes


La taille n de lchantillon est suffisamment grande (n30)
Les effectifs thoriques nij sont suffisamment grands (nij5)

Rgle de dcision :
Soit le niveau de risque accept. Le seuil critique X2 est donn tel que :
P(X2 >

Soit

la statistique calcule partir de lchantillon :

- Si c
2

- Si

2
c

)=

>

: On accepte lhypothse H0
: On rejette lhypothse H0

Exemple :
Une entreprise de produits cosmtiques fabriques trois types de produit. Afin dajuster
sa stratgie marketing, elle veut connatre sil y a ou non un lien de dpendance entre
lge du consommateur et le type de produit prfr. Une enqute sur un chantillon de
200 personnes a donn les rsultats suivants :

Moins de 20 ans
Entre 20 et 40 ans
Plus que 20 ans

Produit 1
13
28
24

Produit 2
19
29
18

Produit 3
25
28
16

Effectuer le test adquat pouvant aider cette entreprise (=5%)

Les hypothses du test :

53

Yakdhane ABASSI

http://yakdcours.webou.net

Tableau des effectifs observs


Produit 1
Moins de 20 ans
13
Entre 20 et 40 ans
28
Plus que 40 ans
24
Totaux
65
Tableau des effectifs thoriques
Produit 1
Moins de 20 ans
Entre 20 et 40 ans
Plus que 20 ans

Le calcul de

Produit 2
19
29
18
66

Produit 2

Produit 3
25
28
16
69

Totaux
57
85
58
200

Produit 3

2
c

54

Yakdhane ABASSI

http://yakdcours.webou.net

TRAVAUX
DIRIGES

55

Yakdhane ABASSI

http://yakdcours.webou.net

TD chapitre 1 : NOTIONS DE VARIABLES ALEATOIRES

Exercice 1
On lance deux ds. Soit D la variable alatoire valeur absolue de la diffrence des
chiffres montrs par les deux ds .
a- Dterminer et reprsenter graphiquement la loi de probabilit de D.
b- Dterminer la fonction de rpartition de D.
c- Calculer lesprance et lcart type de D.

Exercice 2
A une heure dtermine, le nombre de personnes arrivant dans une rame une station
de mtro est une variable alatoire dont lesprance mathmatique est gale 120 et
lcart type 20. Le nombre de personnes qui montent dans cette rame est une variable
alatoire dont lesprance mathmatique est gale 40 et lcart type 9. Le nombre
de personnes qui descendent de la rame est galement une variable alatoire dont
lesprance mathmatique est gale 30 et lcart type 12.
En supposant que ces variables alatoires sont mutuellement indpendantes,
dterminer les paramtres de la variable alatoire nombre de personnes qui repartent
dans la rame .

Exercice 3
On lance trois fois une pice de monnaie. Soit Z la variable alatoire nombre de fois
o pile a t obtenu .
a- Dterminer la loi de probabilit de Z.
b- Dterminer sa fonction de rpartition.
Exercice 4 :
Soit une preuve alatoire consiste tirer 3 cartes parmi un jeu de 52 cartes, et deux
variables alatoires qui lui sont associes :
X : le nombre des as tirs
Y : le nombre de piques tirs.
Dterminer les lois de probabilits de X et de Y, lorsque :
a- Les cartes sont tires avec remise.
b- Les cartes sont tires sans remise.

56

Yakdhane ABASSI

http://yakdcours.webou.net

TD chapitre 2 : LES LOIS USUELLES DE PROBABILITE


Exercice 1
Un tireur fait mouche avec une probabilit de 0,6. On suppose quil nest pas motif et
que cette probabilit reste constante.
a- Quelle est la probabilit que sur 5 tirs, il fasse mouche au moins trois fois ?
b- Sur un trs grand nombre de sries de 5 tirs, quel est le nombre moyen de succs
auquel on doit sattendre ?
Exercice 2
En condition normale de fonctionnement, une machine produit des pices dfectueuses
dans une proportion constante gale 1%. Un client reoit un lot de 300 pices usines
par cette machine.
Quelle est la probabilit quil trouve moins de 3 pices dfectueuses dans ce lot ?
Exercice 3
Une machine a confectionn 1000 paquets dont les masses sont distribues
normalement. La masse moyenne des paquets est de 500 grammes avec un cart type
de 25 grammes.
a- Combien de paquets psent plus que 450 grammes ?
b- Combien de paquets psent moins que 475 grammes ?
c- Combien de paquets psent entre 480 et 550 grammes ?
d- Entre quelles limites de poids est comprise 95% de la production ?
Exercice 4
Un complexe sidrurgique fabrique des pipe-lines dun diamtre moyen gal 50 cm
avec un cart type de 0.25 mm. Le cahier des charges alloue une tolrance sur le
diamtre comprise entre 49.95 et 50.05 cm, sinon les canalisations seront refuses.
En admettent que le diamtre des pipe-lines est normalement distribu, quel sera le
pourcentage de rejet de la production ?
Exercice 5
Une socit minire exploite deux gisements. Le premier a une production journalire
moyenne de 2000 tonnes avec un cart type de 150 tonnes. Le second a une production
journalire moyenne de 3000 tonnes avec un cart type de 200 tonnes.
En admettant que les productions sont indpendantes et normalement distribues,
quelle est la probabilit que la production journalire de la socit excde 5200
tonnes ?
Exercice 6
Un commerant de chaussures reoit en moyenne 8 clients par heure.
1.
Dgager la loi de probabilit rgissant le nombre de clients reus en trente
minutes en admettant quil suit une loi de poisson.
2.
Calculer la probabilit de recevoir 3 clients.

57

Yakdhane ABASSI

http://yakdcours.webou.net

TD Chapitre 3 : LES METHODES DECHANTILLONNAGE

Exercice 1
Hichem est un tudiant en Marketing. Suite lobtention de son diplme, il a dcid
de crer une entreprise dont lobjet est la commercialisation des autoradios et des
accessoires autos. Afin dvaluer les chances de succs de son nouveau projet, il
envisage de mener une enqute auprs des propritaires des voitures dans le district du
Tunis. En sadressant linstitut national des statistiques ( INS) il a pu disposer des
donnes suivantes concernant le parc automobile du grand Tunis :
le nombre total des voitures citadines slvent 20 000 rpartis comme suit :
Selon le lieu de rsidence des propritaires ;
7 000 dans le gouvernorat de BEN AROUS.
3 000 dans le gouvernorat de TUNIS.
6 000 dans le gouvernorat de MANOUBA.
4 000 dans le gouvernorat de LARIANA.
Selon leur usage ;
15 000 voitures particulires.
5 000 voitures utilitaires.
Selon leur puissance fiscale :
7 000 dune puissance de 4 chevaux fiscaux.
7 000 dune puissance de 5 chevaux fiscaux.
4 000 dune puissance entre 6 et 8 chevaux fiscaux.
2 000 dune puissance plus 8 chevaux fiscaux.
1) Quelle est daprs vous la base de sondage quon peut utiliser pour reprer la
population mre ?
2) Hichem a dcid enfin dappliquer la mthode de quota avec un taux de sondage de
1/20. illustrer travers un tableau la structure de lchantillon.
3) Quelles sont les autres mthodes dchantillonnage qui vous paraissent approprier pour
mener lenqute ?
Exercice 2
En vue dvaluer la satisfaction vis--vis de ses produits un fournisseur de services
internet, souhaite mener une enqute auprs dun chantillon de 400 clients. Pour ce
faire, les 6000 clients ont t numrots de 0001 6000.
1- Quelles sont les diffrentes mthodes probabilistes (alatoires) quon peut
appliquer ? Quelle est la diffrence entre ces mthodes et les mthodes
empiriques (non alatoires) ?
2- Si on souhaite appliquer la mthode systmatique et si le numro du premier
client choisi est 39, quels seront les numros des cinq clients suivants ?

58

Yakdhane ABASSI

http://yakdcours.webou.net

TD chapitre 5 : LESTIMATION
Exercice 1
On considre que les rsultats obtenus par les tudiants pour un test d'aptitude en
informatique sont distribus selon une loi normale de variance 2 = 225. Pour un
chantillon alatoire de 25 tudiants, le rsultat moyen est de 70,6.
a- Quelle est l'estimation ponctuelle du rsultat moyen de l'ensemble des tudiants ?
b- Estimer par intervalle de confiance rsultat moyen de l'ensemble des tudiants avec
un niveau de confiance de 99%.

Exercice 2
La longueur des tiges fabriques par une entreprise est distribue normalement avec
une moyenne m et un cart type de 9 mm. Sur l'ensemble de la production mensuelle
qui est de 280 tiges on effectue un contrle de qualit en prlevant sans remise un
chantillon de 36 tiges qui a donn une longueur moyenne de 25 cm.
a- Quelle serait l'estimation ponctuelle de m ?
b- Donner deux proprits de cet estimateur.
c- Dterminer les limites de l'intervalle qui aurait 95 chances sur 100 d'encadrer la
vraie valeur de m.

Exercice 3
On veut effectuer un sondage auprs des foyers d'une certaine municipalit pour
estimer les dpenses moyennes annuelles pour l'alimentation. Une tude pilote a
permis d'valuer l'cart type des dpenses 825 dinars.
a- Quel est le nombre de foyers requis pour estimer avec un niveau de confiance de
95,44% le montant moyen des dpenses alimentaires avec une marge d'erreur
n'excdant pas 150 dinars ?
b- Sachant que la municipalit comprend 2057 foyers qui sont lists de 0001 2057,
quel est alors le taux de sondage ?
c- On envisage d'utiliser la mthode systmatique pour construire l'chantillon. Quel
est alors le pas de sondage ?
d- Si le numro du premier foyer inclure dans l'chantillon est 14 quels seront les
numros des autres foyers ?

Exercice 4
Le responsable de production de l'entreprise "Light" dsire estimer la dure de vie des
lampes fabriques. Un chantillon alatoire 16 lampes a donn les rsultats suivants:
Dure de vie en jour
72 73 73 74 74 75 76 66 66 67 65 73 71 70 71 - 70

59

Yakdhane ABASSI

http://yakdcours.webou.net

a- En supposant que la dure de vie d'une lampe est distribue normalement, estimer
alors ponctuellement et par intervalle de confiance la dure de vie moyenne de
l'ensemble de la production de lampes.
b- Quelle est la marge d'erreur dans l'estimation obtenue ?

Exercice 5
Lors d'un rcent sondage effectu auprs de la population tudiante, on a observ que
sur un chantillon de 700 tudiants, 380 sont satisfaits de la qualit de la nourriture
offerte la caftria.
a- Estimer pour l'ensemble de la population tudiante, la proportion des tudiants
satisfaits de la qualit de la nourriture offerte la caftria avec un niveau de
confiance de 95%.
b- Quelle est la marge d'erreur de ce sondage ?
Exercice 6
M. Sansouci envisage d'tre candidat une prochaine lection. Il veut estimer la
proportion des voix qu'il recueillera en sa faveur. Il a donc confi ce sondage la
maison de sondage IPOP pour connatre les intentions de vote de son lectorat.
a- Quelle devrait tre la taille d'chantillon requise pour assurer une estimation de la
proportion d'lecteurs favorables M. Sansouci avec une marge d'erreur n'excdant
pas 5% dans 19 cas sur 20 .
b- Sur l'chantillon obtenu en (a), 160 se dclarent en faveur de M. Sansouci. Dans
l'lectorat entre quelles valeurs peut se situer le vrai pourcentage favorisant ce
candidat avec un niveau de confiance de 95%.
Exercice 7
Dans un chantillon de 1000 personnes rsidant dans une ville A, on a observ 400
personnes abonnes au tlphone. Dans un chantillon de 1500 personnes d'une autre
ville B, on a observ 675 abonnes.
Dterminer un intervalle de confiance pour la diffrence des proportions des abonnes
dans chaque ville avec un niveau de confiance de 99%.

Exercice 8
Une multinationale possde deux filiales A et B dans deux pays diffrents. Le salaire
des diffrents employs de la filiale A suit une loi normale de moyenne ma et d'cart
type 130$.
Pour la filiale B le salaire est galement normalement distribu avec une moyenne mb
et un cart type de 150$.
Un chantillon de 20 employs de la filiale A a donn un salaire moyen de 450$ avec
un cart type de 100$.
Un chantillon de 25 employs de la filiale B a donn un salaire moyen de 500$ avec
un cart type de 120$.
Donner un intervalle de confiance 95% pour la diffrence des salaires moyen des
deux filiales dans les deux cas suivants:
a- Les carts types des salaires des filiales sont connus.
b- Les carts types des salaires des filiales sont inconnus
60

Yakdhane ABASSI

http://yakdcours.webou.net

TD chapitre 6 : LES TESTS PARAMETRIQUES


Exercice 1
Une entreprise d'assemblage de composants lectroniques utilise des plaques qui sont
achetes auprs d'un fournisseur tranger. Ce dernier livre priodiquement des plaques
qui doivent respecter une norme d'paisseur moyenne de 6mm sinon le lot livr sera
rejet.
Pour vrifier si la dernire livraison est conforme la norme, l'entreprise y a prlev un
chantillon de 16 plaques et a calcul une paisseur moyenne de 6.1 mm.
En supposant que l'paisseur des plaques est distribue normalement avec une variance
de 0.25 mm2 , quelle sera la dcision de l'entreprise avec un risque d'erreur de 5%.

Exercice 2
L'an dernier, le salaire hebdomadaire moyen pay par les entreprises aux spcialistes
en informatique tait de 475 dinars. Cette anne, un chantillon alatoire de 25
entreprises dans le domaine informatique rvle les faits suivants:

X 495 * et * X i X

2 9600

En supposant que le salaire est distribu normalement peut-on conclure au seuil de


signification = 0.05 que le salaire hebdomadaire moyen prsente une augmentation
significative par rapport l'an dernier ?

Exercice 3
D'aprs une tude sur le comportement du consommateur, il semble que 2
consommateurs sur 5 sont influencs par la marque du produit lors de l'achat. Le
responsable marketing d'une grande surface a interrog au hasard 200 consommateurs
parmi lesquels 65 se disent influencs par la marque.
Est-ce que ce sondage permet d'affirmer au seuil = 0.01 la conclusion de l'tude sur
le comportement du consommateur ?

Exercice 4
Un industriel cherche se procurer des pices obissant certaines normes de
fabrication.
Un fournisseur lui propose une grande quantit de pices et affirme que la proportion
des pices dfectueuses est de 7%.
L'industriel craint que le lot propos comporte en ralit 12% de pices dfectueuses.
Ainsi il extrait un chantillon de 100 pices dans lequel il trouve 11 pices
dfectueuses.
a- Effectuer le test pouvant aider cet industriel (avec = 0.01)
b- Calculer le risque de seconde espce.

61

Yakdhane ABASSI

http://yakdcours.webou.net

Exercice 5
Une firme cherche tablir si la proportion des pices acceptables est plus leve chez
un fournisseur tranger (P1) que chez un fournisseur local (P2).
L'observation ralise sur un chantillon extrait des livraisons de chaque fournisseur a
donn:
- Sur un chantillon de 100 pices du fournisseur tranger 90% sont acceptables.
- Sur un chantillon de 80 pices du fournisseur local 70% sont acceptables.
Tester au niveau de signification de 1% l'hypothse:
H0 : P1 = P2
contre
H1 : P1 > P2
Exercice 6
Selon les statistiques des 10 dernires annes le Ministre du tourisme tunisien a
constat que les dpenses en devises des touristes allemands et franais sont
normalement distribues avec un cart type respectivement de 50 et 40 dollars.
Pour mieux cibler son action promotionnelle, le Ministre dsire savoir sil y a ou non
une diffrence significative au seuil de 5% entre les dpenses moyennes des touristes
allemands et ceux franais. On a prlev ainsi un chantillon de chaque catgorie et les
rsultats sont rsums dans le tableau suivant :
Taille de lchantillon
Dpense moyenne

Allemands
500
1200 $

Franais
400
1150 $

a- Quel est le test statistique pouvant rpondre aux besoins du Ministre du


tourisme ?
b- Quelle est la dcision sur la base de ce test ?
c- Quelles seront les consquences sur laction promotionnelle du Ministre ?

62

Yakdhane ABASSI

http://yakdcours.webou.net

TD chapitre 7 : LES TESTS NON PARAMETRIQUES


Exercice 1
On a ralis un sondage auprs de 200 tudiants afin de connatre leur prfrence entre
cinq marques de sport. Les rsultats sont rsums dans le tableau suivant :
Marque
ni

Adidas
50

Puma
35

Nike
60

Reebok
25

Lotto
30

Peut-on conclure au seuil de 5% que la distribution des prfrences des tudiants est
galitaire ?
Exercice 2
Une compagnie dassurance dsire connatre la loi de la variable alatoire X
reprsentant le nombre daccidents de la route par semaine dans une ville.
Lobservation sur une priode dune anne a donn les rsultats suivants :
Nombre daccidents
Nombre de semaines

0
8

1
16

2
8

3
3

4
6

5
5

6
3

7
2

8 et +
1

Peut-on conclure que la variable alatoire X : nombre daccidents de la route par


semaine dans cette ville, suit une loi de poisson ? (risque : 1%)
Exercice 3
Une entreprise reoit ses commandes dun fournisseur par lots de 30 pices.
Lexprience a montr que le nombre de pices dfectueuses est variable dun lot un
autre. Lentreprise
a contrl au hasard 100 lots et a not les rsultats suivants :
Nombre de pices dfectueuses
Nombre de lots de 30 pices

0
44

1
20

2
15

3
12

4
5

5 et +
4

Soit Y la variable alatoire : Nombre de pices dfectueuses par lot . Tester au


niveau de signification de 5%, si Y est distribue suivant une loi binomiale.
Exercice 4
Effectuer au seuil de 5% le test pouvant aider cette entreprise. Un test de produit a t
men auprs dun chantillon de consommateurs de deux rgions afin de savoir sil
existe ou non une relation entre la rgion et le produit prfr. Pour ce test 4 produits
diffrents ont t tests tout en notant chaque fois la prfrence du rpondant :

Rgion A
Rgion B

Produit 1
40
20

Produit 2
80
30

Produit 3
50
60

Produit 4
40
80

Que peut-on conclure au seuil de 1%


63

Yakdhane ABASSI

http://yakdcours.webou.net

Vous aimerez peut-être aussi