ANOVA 1F Didactique Avec Post Hoc
ANOVA 1F Didactique Avec Post Hoc
ANOVA 1F Didactique Avec Post Hoc
de k échantillons
L’analyse de variance à un critère de classification (ANOVA)
• Pourquoi ne pas réaliser une série de tests t pour comparer la moyenne de toutes les
paires de groupes ?
Pour savoir laquelle ou lesquelles, il faut avoir recours, par la suite, aux
tests de comparaisons multiples
SCT = ∑∑ X − C 2
ij
i j
d.d.l. = N-1
2
∑∑ X ij
C= i j
N
Mesure de la dispersion (variation) intergroupe SCI
(∑ X )
2
d.d.l. = k-1
SCI = ∑
ij
−C
j
i ni
CM = Carré Moyen
Fc = CMfacteur/CMerreur
Le résultat de l’ANOVA nous dit simplement si au moins une des moyennes diffère ou
pas – Un test Post-Hoc paramétrique est nécessaire pour trouver quelles moyennes
diffèrent entre elles.
Conditions d’application de l’ANOVA
Principe
Comparer chaque moyenne de l’expérience 2 à 2
Conditions d’applications
Celles de l’Anova
Étape 1.
Ranger les moyennes de la plus petite à la plus grande
Comparaison Différence
(B vs. A) (moyenne B – moyenne A)
5 vs. 1 58,3 – 31,1 = 26,2
5 vs. 2 58,3 – 40,2 = 18,1
5 vs. 3 58,3 – 41,1 = 17,2
5 vs. 4 58,3 – 44,1 = 14,2
4 vs. 1 44,1 – 32,1 = 12
4 vs. 2 44,1 – 40,2 = 3,9
4 vs. 3 44,1 – 41,1 = 3
3 vs. 1 41,1 – 32,1 = 9
3 vs. 2 41,1 – 40,2 = 0,9
2 vs. 1 40,2 – 32,1 = 8,1
Étape 3. Calculer l’erreur standard de chaque couple
Si n égaux Si n inégaux
CMerreur CMerreur 1 1
SE = SE = −
n 2 na nb
Comparaison Différence SE
(B vs. A) (moyenne B – moyenne A) Comme n égaux SE est
identiques, CM = 9,7652
5 vs. 1 58,3 – 31,1 = 26,2 1,28
5 vs. 2 58,3 – 40,2 = 18,1 1,28
5 vs. 3 58,3 – 41,1 = 17,2 1,28
5 vs. 4 58,3 – 44,1 = 14,2 1,28
4 vs. 1 44,1 – 32,1 = 12 1,28
4 vs. 2 44,1 – 40,2 = 3,9 1,28
4 vs. 3 44,1 – 41,1 = 3 1,28
3 vs. 1 41,1 – 32,1 = 9 1,28
3 vs. 2 41,1 – 40,2 = 0,9 1,28
2 vs. 1 40,2 – 32,1 = 8,1 1,28
Étape 4. On calcule la statistique de Tuckey q
différence
q=
SE
Comparaison Différence SE q
(B vs. A) (moyenne B – moyenne A)
5 vs. 1 58,3 – 31,1 = 26,2 1,28 20,47
5 vs. 2 58,3 – 40,2 = 18,1 1,28 14,14
5 vs. 3 58,3 – 41,1 = 17,2 1,28 13,44
5 vs. 4 58,3 – 44,1 = 14,2 1,28 11,09
4 vs. 1 44,1 – 32,1 = 12 1,28 9,38
4 vs. 2 44,1 – 40,2 = 3,9 1,28 3,05
4 vs. 3 44,1 – 41,1 = 3 1,28 2,34
3 vs. 1 41,1 – 32,1 = 9 1,28 7,03
3 vs. 2 41,1 – 40,2 = 0,9 1,28 0,70
2 vs. 1 40,2 – 32,1 = 8,1 1,28 6,33
Étape 5. Hypothèses et Règle de décision
concentration de strontium
70
60
50
40
30
20
10
0 er
r
on
er
ive
re
av
gl
ys
et
R
An
Be
ra
pl
ck
G
Ap
c
c
Ro
La
La
c
c
La
La
Même procédure que le HSD de Tuckey pour le calcul du test et les règles de décision.
2CMerreur
Si n égaux SE =
n
Si n inégaux
1
SE = CMerreur +
1
n n
b contrôle
Moyennecontrôle − MoyenneA
q =
SE
On compare aux valeurs de la table de Dunnet q’
q’α(1); N-k;k
Hypothèses
H0 : Les k échantillons sont extraits d’une même population
H1 : au moins un groupe est issu d’une population différente des autres
Exemple
La densité (ffl.m-2) de la phanérogame marine Posidonia oceanica a été mesurée en
limite inférieure d’herbiers en 2003 dans 4 sites de la Région PACA.
Déterminer s’il existe une différence significative de densité entre ces 4 sites et où se
situe cette différence (α = 0,01).
Carry Cassis Le Brusc Port-Grimaud
0 0 66 150
0 0 66 162
0 100 100 166
7 125 100 191
25 200 108 208
32 200 133 275
50 232 133 283
Kruskal & Wallis ont défini la variable Hc (ou KW) telle que :
Hc = H/C
∑ t = ( 53 − 5 ) + 3 ( 23 − 2 ) + ( 33 − 3) = 162
C = 0,99
Don Hc = 16,2
Hc = 16,26 > χ2 (0,01, 3) = 11,34 donc H0 est rejetée à 0,01 il y a donc une
différence significative entre les densités de P. oceanica dans les 4 sites.
Tests non-paramétriques de comparaison multiples
(Tests post-hoc)
Test de Nemeyi
Si n égaux
Tuckey
n( nk )nk + 1) RB − RA
SE = q=
12 SE
qα,∞,k
SNK
n(np )(np + 1) RB − RA
SE = q=
12 SE
qα,∞,p
Si n inégaux
N ( N + 1) 1 1
SE = +
12 nA nB
N ( N + 1)
SE = −
∑ t 1 1
+
Si il y a des ex-aequo
12 12( N − 1) n A nB
__ __
RB − R A
Q=
SE
Qα,k Si Q<Qα H0 est acceptée