0% ont trouvé ce document utile (0 vote)
7 vues14 pages

Biostatistique BOUHALLOUF - MHH - M1

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1/ 14

Université Frères Mentouri Constantine 1

Faculté des sciences de la nature et de la vie

Département de Biologie Appliquée

Master1
Hygiène Hospitalière et Santé

Année Universitaire : 2019/2020

Cours de Bio-Statistique

Dr. Habiba BOUHALLOUF


8. Tests de comparaison

8.1 Introduction
Dans ce chapitre, on s’intéresse aux lois de distribution théoriques principales utilisées
pour les tests statistiques de comparaison :

— La loi normale centrée réduite Z.


— La loi de Student T.
— La loi de Fisher F.
— La loi de χ 2 .

8.1.1 Comment choisir un test statistique ?


Le choix d’un test statistique dépend de plusieurs facteurs qu’on doit péalablement
identifier :

La nature des variables à comparer : vérifier si

— la variable est quatitative (continue ou discrète).


— la variable est qualitative (binaire, nominale à plusieurs classes ou ordinale).

Les grandeurs étudiées : vérifier si :

— la grandeur est une moyenne.


— la grandeur est une variance.
— la grandeur est un pourcentage.
— la grandeur est un effectif.
— ...

Dr. Habiba BOUHALLOUF


Département de biologie appliquée, SNV, UFMC1
8.1 Introduction 59

La nature du problème : vérifier si on doit

— comparer un échantillon à une population de référence.


— comparer deux échantillons.
— comparer plusieurs échantillons.

Le type de séries comparées : vérifier si :

— les séries sont appariées.


— les séries sont indépendantes.

La taille des échantillons : vérifier si :

— l’échantillon a un grand nombre d’individus.


— l’échantillon a un petit nombre d’individus.

Les conditions d’application des tests : vérifier s’il s’agit d’une

— normalité des distributions associées à la population d’où est issu l’échantillon.


— égalité des variances.
— taille minimale des échantillons.

8.1.2 Principaux tests de comparaison et domaine d’application


Les tests de comparaison servent à comparer les moyennes, les variances, les pourcen-
tages, ... des différentes distributions.
Leur principe consiste á poser une hypothèse nulle H0 et de décider de l’accepter si l’égalité
entre les paramètres est vérifiée ou de la rejeter si elle n’est pas vérifiée au profit d’une
hypothése alternative H1 .
Pour effectuer le calcul du test, on choisit selon la nature de la comparaison la loi de
distribution à suivre :

1. La loi normale centrée réduite (Z) sert à comparer :

— deux moyennes.
— deux moyenne observées de deux séries appariées.
— une moyenne observée à une moyenne théorique.

2. La loi de Student (T ) sert à comparer :

— deux moyennes.
— deux moyenne observées de deux séries appariées.
— une moyenne observée à une moyenne théorique.

3. La loi de Fisher (F) sert à comparer :

Dr. Habiba BOUHALLOUF


Département de biologie appliquée, SNV, UFMC1
60 Chapitre 8. Tests de comparaison

— deux variances.
— plusieurs moyennes.
— deux pourcentage.

4. La loi (χ 2 ) sert à comparer :

— une distribution observée à une distribution théorique.


— plusieurs distributions.
— plusieurs pourcentages.

8.2 Test Z de l’écart réduit


8.2.1 Comparer une moyenne observée à une moyenne théorique
Conditions
Soit la variable quantitative x d’un échantillon de grande taille (n ≥ 30) ayant la
moyenne x̄ et l’écart type σ .
On cherche à décider si la moyenne de l’échantillon x̄ et la moyenne d’une population de
référence µ sont significativement différentes. On teste alors, au risque de α :

* l’hypothèse nulle H0 : x̄ = µ.

* l’hypothèse alternative H1 bilatérale : x̄ 6= µ.

* l’hypothèse alternative H1 unilatérale : x̄ < µ ou x̄ > µ.


Calcul
Pour identifier la région de rejet ou d’acceptation de l’hypothèse nulle, on calcule et on
compare la quantité :
x̄ − µ
z= σ (8.1)

n

avec z α2 pour l’hypothèse bilatérale ou avec zα si l’hypothèse est unilatérale.


Si on prend α = 5% : z α2 = 1, 96 et zα = 1, 65.

Décision

H1 Z H0 Décision
bilatérale |z| < z α2 accepée x̄ n’est pas significativement différente de µ
bilatérale |z| ≥ z α2 rejetée x̄ est significativement différente de µ
unilatérale z < zα accepée x̄ n’est pas significativement supérieure
(ou inférieure) à µ
unilatérale z ≥ zα rejetée x̄ est significativement supérieure (ou inférieure) à µ

On trouve les valeurs de zα et z α2 dans la table de la loi Z de la loi normale centrée


réduite.

Dr. Habiba BOUHALLOUF


Département de biologie appliquée, SNV, UFMC1
8.2 Test Z de l’écart réduit 61

8.2.2 Comparer deux moyennes


Conditions
Maintenant on veut comparer deux moyennes x̄1 , x̄2 de deux échantillons indépendants
de tailles supérieurs à 30 (n1 ≥ 30, n2 ≥ 30). Sachant les écart types (σ1 , σ2 ), On pose au
risque de α, les hypothèses nulle et alternative :

* H0 : µ1 = µ2 .

* H1 bilatérale : µ1 6= µ2 .

* H1 unilatérale : µ1 < µ2 ou µ1 > µ2 .

où µ1 , µ2 sont les moyennes inconnues des deux populations d’où sont issus nos échan-
tillons.

Calcul
On calcul la quantité z à partir de la formule suivante :
x̄1 − x̄2
z= q 2 (8.2)
σ1 σ2 2
n1 + n2

Décision

H1 Z H0 Décision
bilatérale |z| < z α2 accepée x̄1 n’est pas significativement différente de x̄2
bilatérale |z| ≥ z α2 rejetée x̄1 est significativement différente de x̄2
unilatérale z < zα accepée x̄1 n’est pas significativement supérieure
(ou inférieure) à x̄2
unilatérale z ≥ zα rejetée x̄1 est significativement supérieure
(ou inférieure) à x̄2

On trouve les valeurs de zα et z α2 dans la table de la loi Z de la loi normale centrée


réduite.

8.2.3 Comparer deux moyennes pour deux séries appariées


Conditions
Dans ce cas, nous avons un seul échantillon de taille (n ≥ 30). On désire comparer deux
valeurs qui appartiennent à deux séries de valeurs dites appariées d’une même grandeur
(ici la moyenne) observée chez un individu. Chaque couple de mesures constitue une paire
((xi , yi ), i = 1,¯n).
Le principe est de construire des paires de mesure puis calculer la différence observée pour
chacune di = |xi − yi |.
Pour cela on pose les hypothèses nulle et alternative en fonction des moyennes calculées à
partir des différences trouvées (x̄d et σd ) :

Dr. Habiba BOUHALLOUF


Département de biologie appliquée, SNV, UFMC1
62 Chapitre 8. Tests de comparaison

* H0 : x̄d = 0.

* H1 bilatérale : x̄d 6= 0.

* H1 unilatérale : x̄d < 0 ou x̄d > 0.



x̄ = ∑ di (8.3)
Calcul
On calcul la quantité z à partir de la formule suivante :
x̄d − 0
z= q (8.4)
σd 2
n


 
1 1
σd2 = ∑ di2 − ( di )2 (8.5)
n−1 n ∑
Décision

H1 Z H0 Décision
bilatérale |z| < z α2 accepée les moyennes des séries ne sont pas signifi-
cativement différentes
bilatérale |z| ≥ z α2 rejetée les moyennes des séries sont significativement
différentes
unilatérale z < zα accepée les moyennes des 2 séries sont significativement
différentes
unilatérale z ≥ zα rejetée la moyenne d’une série est significativement
supérieure (ou inférieure) à l’autre

On trouve les valeurs de zα et z α2 dans la table de la loi Z de la loi normale centrée


réduite.

8.3 Test T de Student


8.3.1 Comparer une moyenne observée à une moyenne théorique
Conditions
On a vu qu’on peut utiliser le test Z pour comparer une moyenne observée à une
moyenne connue dans une population de référence lorsqu’il s’agit d’un échatillon ayant
une taille supérieures ou égale à 30.
Pour les petits échantillons (n < 30), on utilise plutôt le test de Student.
En effet, soient x̄ et σ la moyenne observée et l’écart type de l’échantillon respectivement,
et µ la moyenne de la population de référence.
On au risque de (α = 10%), pose les hypothèses nulle et alternatives au risque de
(α = 10%) :

Dr. Habiba BOUHALLOUF


Département de biologie appliquée, SNV, UFMC1
8.3 Test T de Student 63

* H0 : x̄ = µ.

* H1 bilatérale : x̄ 6= µ.

* H1 unilatérale : x̄ < µ ou x̄ > µ.

Calcul
de la même façon, on calcule la valeur de t du test de Student :
x̄ − µ
t= σ (8.6)

n

Si l’hypothèse nulle (x̄ = µ) est vraie (au risque de α = 10%), la quantité t suit une loi T
de Student à (n − 1) degrés de liberté (ddl).

Décision

H1 T H0 Décision
bilatérale |t| < t α2 accepée x̄ n’est pas significativement différente de µ
bilatérale . |t| ≥ z α2 rejetée x̄ est significativement différente de µ
unilatérale t < zα accepée x̄ n’est pas significativement supérieure
(ou inférieure) à µ
unilatérale t ≥ zα rejetée x̄ est significativement supérieure (ou inférieure) à µ

On trouve les valeurs de t5% et t10% dans la table de la loi de Student.

8.3.2 Comparer deux moyennes


Conditions
On choisit le test de Student aussi lorsqu’on désire comparer deux moyennes observées
dans deux échantillons de petites tailles (n1 < 30, n2 < 30 ).
En effet, on pose les hypothèses :

* H0 : µ1 = µ2 .

* H1 bilatérale : µ1 6= µ2 .

* H1 unilatérale : µ1 < µ2 ou µ1 > µ2 .


où µ1 , µ2 sont les moyennes inconnues des deux populations d’où sont issus nos échan-
tillons.

Calcul
On calcul la quantité z à partir de la formule suivante :
x̄1 − x̄2
t=q 2 (8.7)
σ1 σ2 2
n1 + n2

avec un nombre de degrés de liberté (ddl = n1 + n2 − 2).

Dr. Habiba BOUHALLOUF


Département de biologie appliquée, SNV, UFMC1
64 Chapitre 8. Tests de comparaison

Décision

H1 T H0 Décision
bilatérale |t| < t α2 accepée x̄1 n’est pas significativement différente de x̄2
bilatérale |t| ≥ t α2 rejetée x̄1 est significativement différente de x̄2
unilatérale t < tα accepée x̄1 n’est pas significativement supérieure
(ou inférieure) à x̄2
unilatérale t ≥ tα rejetée x̄1 est significativement supérieure
(ou inférieure) à x̄2

On trouve les valeurs de t5% et t10% dans la table de la loi de Student.

8.3.3 Comparer deux moyennes pour deux séries appariées


Conditions
Ce cas est similaire à celui où on utilise le test Z pour comparer deux moyennes de
deux séries apparées observées dans un seul échantillon. Ce dernier doit avoir une taille
inférieure à 30. En effet :

* H0 : x̄d = 0.

* H1 bilatérale : x̄d 6= 0.

* H1 unilatérale : x̄d < 0 ou x̄d > 0.


où µ1 , µ2 sont les moyennes inconnues des deux populations d’où sont issus nos échan-
tillons.

Calcul
On calcul la quantité t à partir de la formule suivante :

x̄d − 0
t=q (8.8)
σd 2
n

où x̄d et σd sont la moyenne des diffénces des moyennes (respectivement des écart types)
des paires :

x̄ = ∑ di ,
 
2 1 2 1 2
σd = d − ( di )
n−1 ∑ i n ∑

Le nombre de degrés de liberté est : dll = n − 1.

Dr. Habiba BOUHALLOUF


Département de biologie appliquée, SNV, UFMC1
8.4 Test F de Fisher 65

Décision

H1 T H0 Décision
bilatérale |t| < t α2 accepée les moyennes des séries ne sont pas signifi-
cativement différentes
bilatérale |t| ≥ t α2 rejetée les moyennes des séries sont significativement
différentes
unilatérale t < tα accepée les moyennes des 2 séries sont significativement
différentes
unilatérale t ≥ tα rejetée la moyenne d’une série est significativement
supérieure (ou inférieure) à l’autre

On trouve les valeurs de t5% et t10% dans la table de la loi de Student.

8.4 Test F de Fisher


8.4.1 Comparer deux variances
Conditions
On utilise le test de Fisher lorsqu’il s’agit de comparer deux variances σ1 2 et σ2 2 de
deux séries indépendantes de variables quantitatives quelque soit la taille des échantillons
(n1 et n2 ).
Pour cela soient au risque de α = 5%, les hypothèses :
* H0 : s1 2 = s2 2 .

* H1 bilatérale : s1 2 6= s2 2 .

* H1 unilatérale : s1 2 < s2 2 ou s1 2 > s2 2 .

où s1 et s2 sont respectivement les variances inconnues des deux populations d’où sont
issus les échantillons.

Calcul
Soit σ1 2 la variance la plus élevée, on définit la quantité F par :
σ1 2
F= 2 (8.9)
σ2
avec : (dll1 = k1 = n1 − 1), (dll2 = k2 = n2 − 1) et (α = 5%).

Décision

H1 F H0 Décision
bilatérale |F| < Fα2 accepée σ1 2 n’est pas significativement différente de σ2 2
bilatérale |F| ≥ Fα2 rejetée σ1 2 est significativement différente de σ2 2
unilatérale F < Fα accepée σ1 2 n’est pas significativement différente de σ2 2
unilatérale F ≥ Fα rejetée σ1 2 est significativement supérieure à σ2 2

Dr. Habiba BOUHALLOUF


Département de biologie appliquée, SNV, UFMC1
66 Chapitre 8. Tests de comparaison

On trouve les valeurs de F5% et F2,5% dans la table de la loi de Fisher.

8.4.2 Comparer plusieurs moyennes


Conditions
On choisit le test de Fisher également lorsqu’on désir comparer les moyennes observées
lors d’une experience d’une variable quantitative pour plusieurs échantillons. Pour cela
les distributions des populations d’où proviennent les échantillons doivent suivre la loi
normale et avoir la même variance.
En effet, au risque de (α = 5%), les hypothèses nulle et alternatives sont :

* H0 : Les moyennes ne sont pas significativement différentes.

* H1 : Les moyennes sont significativement différentes.

Alors, si les séries étudiées sont indépendantes, on test le rapport entre deux variances :

1. La variance entre individus de chaque série (variance résiduelle) (σr 2 ).

2. La variance entre les séries étudées (variance générale) (σg 2 ).


xi 2 xg 2 xi 2
∑ ni − N ∑ x2 − ∑ ni
σg 2 = , 2
σr = (8.10)
c−1 N −c

avec :
* xi : est la somme des valeurs observées sur chaque série.

* xg : est la somme des valeurs observées sur toutes les séries.

* ∑ x2 : est la somme des carrées des valeurs observées sur toutes les séries.

* n : est le nombre des effectifs de chaque série.

* N : est le nombre des effectifs de toutes les séries.

* c : est le nombre de séries à comparer.

Calcul
on teste le rapport suivant :

σg 2
F= (8.11)
σr 2

avec : (dll1 = k1 = c − 1), (dll2 = k2 = N − c) et (α = 5%).

Dr. Habiba BOUHALLOUF


Département de biologie appliquée, SNV, UFMC1
8.5 Test de χ 2 67

Décision

H1 F H0 Décision
bilatérale F < Fα accepée Les moyennes ne sont pas significativement
différentes
bilatérale F ≥ Fα rejetée Les moyennes sont significativement
différentes

8.5 Test de χ 2
Il est fréquent d’avoir à comparer deux grandeurs caractérisées par des variables
qualitatives comme en épidémiologie par exemple (malade / non malade).
On compare, Le plus souvent des distributions ou des pourcentages observés dans deux
échantillons ou plus, mais parfois on est tombé dans des situations où on doit comparer
un pourcentage observé dans un échantillon à un pourcentage théorique (de référence)
pour savoir si la différence entre eux est due aux fluctuations d’échantillonnage ou elle
correspond à une différence réelle.
Pour tous ça, si tous les effectifs théoriques (de référence) sont supérieurs ou égaux à 5, on
utilise le test de comparaison de χ 2 (chi-2).

8.5.1 Comparer une distribution observée à une distribution théorique (Test de


χ 2 d’ajustement)
Conditions
Les effectifs observés sont généralement différents des effectifs théoriques, donc on
teste la conformité entre la distribution expérimentale et la distribution théorique. Ce genre
de test se fait en utilisant "Test de χ 2 " d’ajustement (ou de conformité) à condition d’avoir
un nombre d’effectifs supérieur ou égal à 5.
On considère un échantillon de taille n extrait au hasard d’une population partagée en
classes, chaque classe est une modalité de réalisation du caractère. Et on attribut les
effectifs : fo1 , fo2 , fo3 , ..., fok , tels que :
k
n = ∑ foi (8.12)
i=1
où foi sont appelés " effectifs observés ".
D’autre part, on attribut à ces classes les probabilités : P1 , P2 , P3 , ..., Pk . Pi représente la
probabilité de présence de la modalité du caractère étudié dans la classe i (i = 1,¯ k) avec :
k
∑ Pi = 1 (8.13)
i=1
Donc, on peut définir les effectifs théoriques en fonction des probabilités ainsi :
fti = nPi (8.14)

k
n = ∑ fti (8.15)
i=1
On peut finalement construire le tableau suivant :

Dr. Habiba BOUHALLOUF


Département de biologie appliquée, SNV, UFMC1
68 Chapitre 8. Tests de comparaison

Classe 1 2 ... i ... k Total


Effectifs Observés ( foi ) fo1 fo2 ... foi ... fok n
Effectifs Théoriques ( fti ) ft1 ft2 ... fti ... ftk n

On pose alors les hypothèses suivantes au risque de (α = 5% ou α = 1%) :

* H0 : "Il y a une conformité entre la distribution étudiée (expérimentale) et la distribu-


tion théorique".

* H1 : "Il y a une différence significative entre la distribution étudiée (expérimentale)


et la distribution théorique".

Calcul
Pour décider si on accepte ou on rejette l’hypothèse H0 , on calcule la statistique de χ 2 :

2
k ( f oi − fti )
χ 2c = ∑ (8.16)
i=1 f ti

χ 2 c doit être comparée avec χ 2 α qui peut être obtenue par la table de χ 2 en fonction de
ν = k − 1 (k est le nombre de classes étudiées).
Décision

H1 χ2 H0 Décision
biilatérale χ 2c < χ 2α accepée Les distributions ne sont pas significativement
différentes
biilatérale χ 2c ≥ χ 2α rejetée Les distributions sont significativement
différentes

8.5.2 Comparer plusieurs pourcentages ( Test de χ 2 d’homogénéité)


Conditions
On applique le test de χ 2 d’homogénéité pour comparer plusieurs distributions ou
plusieurs pourcentages (pour une variable qualitative à plusieurs classes).
Comme nous avons vu dans la section précédente, on va s’intéresser aux effectifs plutôt
que les pourcentages. Par conséquent, on obtient le tableau suivant :

Échantillon→ éch(1) éch(2) ... éch(j)


Classe↓
1 fo11 ( ft11 ) fo12 ( ft12 ) ... fo1 j ( ft1 j )
2 fo21 ( ft21 ) fo22 ( ft22 ) ... fo2 j ( ft2 j )
3 fo31 ( ft31 ) fo32 ( ft32 ) ... fo3 j ( ft3 j )
.. .. .. .. ..
. . . . .
i foi1 ( fti1 ) foi2 ( fti2 ) ... foi j ( fti j )

Dr. Habiba BOUHALLOUF


Département de biologie appliquée, SNV, UFMC1
8.5 Test de χ 2 69

foi j ( fti j ) sont respectivement les effectifs observés (les effectifs théoriques) de la classe
(modalité du caractère) (i) de l’échantillon ( j).

Tous les effectifs théoriques doivent être supérieurs ou égaux à 5 pour pouvoir appliquer
la loi de χ 2 .

Au risque de (α = 5%), les hypothèses nulle et alternative sont données par :

* H0 : "Il n’ y a pas une différence significative entre les pourcentages (distributions).

* H1 : "Il y a pas une différence significative entre les pourcentages (distributions).

Calcul
Pour décider si on accepte ou on rejette l’hypothèse H0 au risque de (α = 5%), on
calcule χ 2 c :

2 k c ( f oi j − fti j )2
χ c =∑ ∑ (8.17)
i=1 j=1 fti j

χ 2 c doit être comparée avec χ 2 α qui peut être obtenue par la table de χ 2 à l’aide du nombre
de degrés de liberté : dll = (c − 1)(k − 1) (k est le nombre de classes étudiées, c est le
nombre d’échantillon).

Décision

H1 χ2 H0 Décision
biilatérale χ 2c < χ 2α accepée Les pourcentage (les distributions) ne sont pas
significativement différentes
biilatérale χ 2c ≥ χ 2α rejetée Les pourcentage (les distributions) sont
significativement différentes

Dr. Habiba BOUHALLOUF


Département de biologie appliquée, SNV, UFMC1

Vous aimerez peut-être aussi