Etude Confirmatoire
Etude Confirmatoire
Etude Confirmatoire
-1-
EXEMPLE DU MILIEU SOCIO-ECONOMIQUE
Dans les données sur les étudiants américains (n=3094) on cherche à caractériser le
background d’un étudiant, à savoir le milieu socio-économique de ses parents et sa
performance académique à l’école secondaire. Cette dernière est mesurée par la variable
HSRank. Pour caractériser le milieu socio-économique on a utilisé la variable FaEd. On
va maintenant utiliser 3 variables
pour cela, à savoir MoEd, FaEd et
PaJntInc, (l’éducation de la mère, du
père et le revenu moyen des parents).
Le milieu socio-économique de
l’étudiant (PaSeS) est maintenant
une variable latente déterminée par 3
variables observées. On a deux
variables explicatives latentes (la
deuxième variable latente AcRank est
confondue avec la variable observée
HSRank.)
.
-2-
EXEMPLE DU MILIEU SOCIO-ECONOMIQUE
Si le diagramme ci-haut décrit bien la réalité et si la variable latente PaSeS est une
variable explicative pour les trois variables endogènes DegreAsp, Selctvty et Degree,
alors l’analyse de régression avec variable observée où FaEd caractérise le milieu socio-
économique (voir partie 1) sous estime la force de la relation entre PaSeS et les variables
dépendantes. En effet selon le diagramme, FaEd mesure PaSeS avec une erreur 2.
En régression, la force de la relation entre une variable explicative mesurée avec erreurs
et la variable dépendante est plus faible que si la variable explicative est mesurée sans
erreur.
-3-
DÉFINITION DU MODÈLE
Ce modèle a la même forme qu’un modèle factoriel exploratoire à m=2 facteurs sauf que
(i) on permet des variances quelconques et une corrélation pour les variables latentes et
(ii) des loadings (paramètres ) sont fixés à 0, = = 0 .
12 22 32 41
-4-
DÉFINITION DU MODÈLE
On a vu, dans l’étude des modèles d’analyse factorielle exploratoire, que d=3 variables
observées donnent un modèle à une variable latente saturé (il n’y a aucun degré de liberté
pour tester l’ajustement du modèle). Le modèle avec d=3 à une variable latente pour
MoEd, FaEd et PaJntInc s’ajuste donc parfaitement.
Le modèle étudié ici spécifie en plus que les trois corrélations entre HSrank et (MoEd,
FaEd, PaJntInc) s’expliquent toutes par la corrélation entre PaSES et HSrank. Etudier
l’ajustement du modèle c’est évaluer la véracité de cette hypothèse.
-5-
ÉCRITURE DE LA MATRICE DE VARIANCES-COVARIANCES THÉORIQUE.
1
1142 2142 12 3142 12 42 2 4
2 2 2
1 2
-6-
DÉFINITION DES VARIABLES LATENTES
Les paramètres du modèle précédent ne sont pas tous identifiables car les variables
latentes peuvent être définies de plusieurs façons :
les mêmes unités que PaJntInc alors que la deuxième est égale à HSRank.
Évidemment 24 n’est toujours pas estimable dans ces conditions.
3. On a en d(d+1)/2 =4x5/2=10 degrés de liberté dans une matrice de variances-
covariances 4x4 et 8 paramètres à estimer. Il reste donc 2 degrés de liberté pour
tester l’ajustement du modèle.
-7-
ESTIMATEUR DU MAXIMUM DE VRAISEMBLANCE
Le modèle postule que les Xi suivent une loi normale de moyenne (un vecteur 4x1) et
de matrice de variances covariances ( ) où est les vecteurs des 8 paramètres de la
matrice de variances covariances (on pose 1 et 24 0 ) :
31 42
2
212 2 2 2131 2 21
( ) 1 2
21 1 1 2 1
.
31 2 2131 2 312 2 2 31
1 1 1 3 1 2
21 31 2
2
1 2 1 2 1 2
1 et 1.
( )23 ( )14 2131 1 12
2
( )13 ( ) 24 31 1 21 12
2
La matrice de variances covariances empiriques S ne satisfait pas ces égalités, il faut donc
utiliser un algorithme itératif pour trouver une matrice ( ) qui soit le plus prêt possible
de S.
-8-
ESTIMATEUR DU MAXIMUM DE VRAISEMBLANCE
n 1
( )
2
log | ( ) | log | S | tr[S( ) 1 ] d
-9-
TESTS D’AJUSTEMENT
Notons que (ˆ) mesure l’écart entre la matrice de variances covariances empirique S et
son estimateur (ˆ) . En fait (ˆ) 0 si S (ˆ) . La magnitude de (ˆ) permet de
juger de l’ajustement du modèle CFA à l’étude. La statistique du chi-deux pour tester
l’ajustement du modèle est
d2( d 1)/2 p 2 (ˆ) (n 1) F S , (ˆ) .
On rejette au seuil l’hypothèse que le modèle s’ajuste bien si 2 (ˆ) d2( d 1)/2 p ,1 , le
percentile 100(1-) du chi deux à d(d+1)/2-p degrés de liberté (ici 2 degrés de libertés
sont associés à ce test). Notons qu’il n’y a pas de correction de Bartlett pour un modèle
CFA quelconque. Dans la sortie LISREL,
est le Minimum fit function pour le modèle. En fait le test du rapport de vraisemblance
n’est pas suffisant pour juger de la qualité d’un ajustement et plusieurs autres statistiques
on été mises de l’avant pour ce faire.
- 10 -
ETUDE DES RÉSULTATS
1. Les variances estimées de variables latentes (une variable latente intéressante varie!)
2. Les tests pour H0 : ji=0 pour savoir si les variables mesurées contribuent de façon
significative aux variables latentes construites;
3. Les R2 de chaque variable observée pour voir le pourcentage de sa variabilité
expliquée par les variables latentes;
4. Les estimations ˆ s des loadings standardisés pour déterminer les variables les plus
ij
associées à chaque variable latente;
5. Les indices d’ajustement pour vérifier si le modèle s’ajuste bien aux données;
- 11 -
AJUSTEMENT DU MODELE
PROGRAMME R
PROGRAMMATION SAS :
library(sem)
data afc(type=cov); cov<-matrix(
_type_="COV"; c(1.510,1.133,1.452,0.110,
infile cards missover; 1.133, 2.283, 2.125, 0.150,
input _name_ $ MoEd FaEd PaJntInc HSRank; 1.452, 2.125, 7.017, 0.113,
datalines; 0.110, 0.150, 0.113, 0.604),
MoEd 1.510 byrow=T, nrow=4, ncol=4,
FaEd 1.133 2.283 dimnames=list(c("MoEd","FaEd","PaJntInc","HSRan
PaJntInc 1.452 2.125 7.017 k"),c("MoEd","FaEd","PaJntInc","HSRank")))
HSRank 0.110 0.150 0.113 0.604
; model1<- specify.model()
PaSES -> MoEd, NA, 1
proc calis data=afc cov pcorr nobs=3094; PaSES -> FaEd, lam21, NA
LINEQS PaSES -> PaJntInc, lam31, NA
MoEd = F_PaSES + E1, AcRank -> HSRank, NA, 1
FaEd = lambda_21 F_PaSES + E2, MoEd <-> MoEd, e1, NA
PaJntInc = lambda_31 F_PaSES + E3, FaEd <-> FaEd, e2, NA
HSRank = F_AcRank; PaJntInc <-> PaJntInc, e3, NA
STD HSRank <-> HSRank, NA, 0
F_PaSES = var_PaSES, PaSES <-> PaSES, vf1, NA
F_AcRank = var_AcRank, AcRank <-> AcRank, vf2, NA
E1-E3 = var_e1-var_e3; PaSES <-> AcRank, covF1F2, NA
COV
F_PaSES F_AcRank = cov; afc <- sem(model1, cov, 3094)
VAR MoEd FaEd PaJntInc HSRank; summary(afc)
run;
- 12 -
PROGRAMME SIMPLIS
Quatre variables pour le statut parental et la
Programme LISREL
performance scolaire TI Quatre variables pour le statut parental et la
Observed Variables performance scolaire
MoEd FaEd PaJntInc HSRank !DA NI=4 NO=3094 MA=CM
Correlation Matrix SY='C:\Documents and Settings\***\CFA02-06.DSF'
1 MO NX=4 NK=2 TD=SY
.610 1 LK
.446 .531 1 PaSES ACRank
.115 .128 .055 1 FI TD(4,4)
Standard deviations FR LX(2,1) LX(3,1)
1.229 1.511 2.649 .777 VA 1 LX(1,1)
Sample Size 3094 VA 1 LX(4,2)
Latent Variables: PaSES ACRank PD
Relationships: OU SC ND=3
MoEd = 1*PaSES Note :
FaEd PaJntInc = PaSES LK Donne le nom des variables latentes
HSRank = 1*ACRank TD=Theta Delta
Set the error Variance of HSRank to 0
Number of Decimals = 3 SY= Symmetric
Wide Print FI=fixe des paramètres
Path Diagram FR= spécifie les paramètres libres
End of Problem
VA=donne une valeur spécifique à un
(Ce programme pose 1) 31 42
paramètre
- 13 -
SORTIE SAS :
Matrice de variances covariances empirique (S):
Cette partie de la sortie SAS donne les éléments de la matrice des coefficients structuraux ˆij
(loadings). Tous les coefficients sont significatifs.
- 14 -
Variances of Exogenous Variables
Comme en régression, le modèle décompose la variance de chaque variable en une partie prédite par
le modèle et une partie résiduelle. Par exemple,
- 15 -
Manifest Variable Equations with Standardized Estimates ˆijs
MoEd = 0.7159 F_PaSES + 0.6982 E1
FaEd = 0.8539*F_PaSES + 0.5205 E2
lambda_21
PaJntInc = 0.6208*F_PaSES + 0.7840 E3
lambda_31
HSRank = 1.0000 F_AcRank
Ces parties de la sortie SAS donne les loadings standardisés qui sont les corrélations entre les
variables observées et les variables latentes. Par exemple, la corrélation entre MoEd et PaSES est de
ˆ11s 0.7159 . De plus, le R2 de la régression de PaSES sur MoEd est de 51.26%. La dernière
statistique nous renseigne sur la corrélation entre les deux variables latentes, soit r=0.14354.
- 16 -
L’information sur l’ajustement du modèle peut être résumée dans le diagramme de cheminement
suivant :
Diagramme de cheminement des variables latentes
- 17 -
Interprétation des sorties
- 18 -
INDICES D’AJUSTEMENT
Tous les programmes pour les modèles d’équations structurelles rapportent plus d’une
trentaine d’indices pour évaluer l’ajustement d’un modèle. Le principal défaut du test
d’ajustement du rapport de vraisemblance est qu’il dépend de n. Il a tendance à être
significatif lorsque n est grand même si le modèle s’ajuste relativement bien. Plusieurs
alternatives au test du chi-deux ont été mises de l’avant pour évaluer l’ajustement. On a,
par exemple, essayer de généraliser le R2 de la régression qui s’écrit :
R 1
2 ( yi yˆ i )2
1
SSres
.
i( y y ) 2
SS tot
En mot, c’est un moins la proportion de la variabilité de y qui n’est pas expliquée par le
modèle de régression.
Le GFI (goodness of fit index) reprend cette formule avec SSres F S , (ˆ) et
SStot F S , (0) , où (0) est une matrice de variance covariances de référence dont
tous les paramètre sont fixes (peut-être que (0) est la matrice identité). Comme valeur
de SStot le NFI (normed fit index) prend plutôt SStot F S ,diag(ˆ12 ,...,ˆ d2 ) où
F S ,diag(ˆ12 ,...,ˆ d2 ) Fi est proportionnelle à la statistique du chi-deux pour tester
l’hypothèse d’indépendance,
- 19 -
d2( d 1)/2 (n 1) F S ,diag(ˆ12 ,..., ˆ d2 ) (n 1) Fi .
Rappelons que si cette statistique est petite, disons du même ordre de grandeur que ses
degrés de liberté, l’hypothèse d’indépendance entre les d variables est acceptable. Il est
inutile de poursuivre l’analyse.
Le Normed fit index est donc 1 moins la proportion du chi-deux d’indépendance qui reste
une fois que le modèle a été ajusté,
Fi F S , (ˆ) F S , (ˆ)
NFI 1 .
Fi Fi
(attention : peut être inférieur à 1 même si le modèle s’ajuste bien ; cet indice peut sous-
estimer la qualité de l’ajustement !)
Certaines mesures, comme le adjusted goodness of fit index (AGFI) s’inspirent du R2
ajusté,
n 1
2
Radj 1 (1 R 2 )
n p 1
Une version un peu compliquée du NFI, le non normed fit index (NNFI), compare les
indices 2 divisés par leur degré de liberté pour le modèle d’indépendance et le modèle à
l’étude :
- 20 -
Fi / [d ( d 1) / 2 d ] F S , (ˆ) / [d ( d 1) / 2 p]
NNFI .
Fi / [d (d 1) / 2 d ] n
- 21 -
Goodness of Fit Statistics (LISREL) ECVI for Saturated Model = 0.00647 ECVI for
Independence Model = 0.888
Degrees of Freedom = 2 =d(d+1)/2-p
Minimum Fit Function Chi-Square = 7.405 (P = Chi-Square for Independence Model with 6 Degrees
0.0247) Test d’ajustement du modèle (Hypothèse of Freedom = 2739.195
nulle: le modèle postulé décrit bien la relation entre Test d’indépendance, Hypothèse nulle: Les 4
les variables, Alternative : le modèle ne décrit pas variables du modèle sont indépendantes (les 6
bien cette relation) paramètres de covariance sont nuls)
Normal Theory Weighted Least Squares Chi-Square = Independence AIC = 2747.195 Model AIC = 23.372
7.372 (P = 0.0251) Saturated AIC = 20.000 Independence CAIC =
Estimated Non-centrality Parameter (NCP) = 5.372 2775.344 Model CAIC = 79.670 Saturated CAIC =
90 Percent Confidence Interval for NCP = (0.491 ; 90.372
17.733) (AIC=Akaike Information Criterion)
Minimum Fit Function Value F S , (ˆ) =0.00239
=7.405/3093 Normed Fit Index (NFI) = 0.997
Population Discrepancy Function Value (F0) = Non-Normed Fit Index (NNFI) = 0.994
0.00174 Parsimony Normed Fit Index (PNFI) = 0.332
90 Percent Confidence Interval for F0 = (0.000159 ; Comparative Fit Index (CFI) = 0.998
0.00573) Incremental Fit Index (IFI) = 0.998
Root Mean Square Error of Approximation (RMSEA) Relative Fit Index (RFI) = 0.992
(livre p. 89-90)
= 0.0295 .00239 / 2 1/ 3093
90 Percent Confidence Interval for RMSEA = Critical N (CN) = 3848.465
(0.00891 ; 0.0535) P-Value for Test of Close Fit Root Mean Square Residual (RMR) = 0.0228
(RMSEA < 0.05) = 0.915 Standardized RMR = 0.0116
Goodness of Fit Index (GFI) = 0.999
Expected Cross-Validation Index (ECVI) = 0.00756 Adjusted Goodness of Fit Index (AGFI) = 0.994
90 Percent Confidence Interval for ECVI = (0.00598 ; Parsimony Goodness of Fit Index (PGFI) = 0.200
0.0116)
- 22 -
Bentler's Comparative Fit Index
INDICE D’AJUSTEMENT DE LA SORTIE SAS 0.9979
Normal Theory Reweighted LS Chi-Square 7.3963
(LISTE ÉCOURTÉE) Akaike's Information Criterion 3.4288
Bozdogan's (1987) CAIC -10.6457
Fit Function Schwarz's Bayesian Criterion
0.0024 -8.6457
Goodness of Fit Index (GFI) McDonald's (1989) Centrality 0.9991
0.9988 Bentler & Bonett's (1980) Non-normed Index 0.9938
GFI Adjusted for Degrees of Freedom (AGFI) Bentler & Bonett's (1980) NFI 0.9972
0.9940 James, Mulaik, & Brett (1982) Parsimonious NFI
Root Mean Square Residual (RMR) 0.3324
0.0228 Z-Test of Wilson & Hilferty (1931) 1.9794
Parsimonious GFI (Mulaik, 1989) Bollen (1986) Normed Index Rho1 0.9915
0.3329 Bollen (1988) Non-normed Index Delta2 0.9979
Chi-Square Hoelter's (1983) Critical N 2496
7.4288
Chi-Square DF
2
Pr > Chi-Square
0.0244
Independence Model Chi-Square
2628.6
Independence Model Chi-Square DF
6
RMSEA Estimate
0.0296
RMSEA 90% Lower Confidence Limit
0.0091
RMSEA 90% Upper Confidence Limit
0.0537
ECVI Estimate
0.0076
ECVI 90% Lower Confidence Limit
0.0060
ECVI 90% Upper Confidence Limit
0.0116
Probability of Close Fit
0.9133
- 23 -
CONCLUSIONS POUR LE PREMIER EXEMPLE:
Statistique du chi deux (et obs
2
/ 2 =3.71) un peu grande ; ceci est sans doute
attribuable à la grande taille d’échantillon ;
Cette grande valeur vient du fait que la corrélation observée de 0.055 entre PaJntInc
et HSRank est beaucoup plus petite que la corrélation prédite .089. En fait PaJntInc
mesure le volet économique du milieu socio économique parental alors que les deux
autres variables sont associés à l’aspect académique de ce milieu. HSRank qui
mesure la performance académique est plus corrélée avec MoEd et FaEd qu’avec
PaJntInc. On pourrait raffiner le modèle en distinguant deux aspects, académique et
économique, au milieu parental.
Les indices d’ajustement sont bons, cependant les indices de parcimonie sont
faibles ; le modèle utilise beaucoup de paramètres pour modéliser 10 degrés de
liberté ;
Le R2 de .386 pour PaJntInc est faible et pose la question à savoir si cette variable
est vraiment utile pour caractériser le niveau socio-économique des parents. Notons
cependant que le loading associé à cette variable, ˆ13 1.869 , est significativement
différent de 0 (t=30). Ceci suggère de conserver cette variable dans le modèle.
Le alpha de Cronbach pour la variable latente PaSES est de .77. Les 3 items sous-
jacents sont bien associés à un même construit latent.
- 24 -
ANALYSE FACTOREILLE CONFIRMATOIRE : QUE FAIRE SI
L’AJUSTEMENT EST MAUVAIS
Le bon ajustement d’un modèle d’analyse factorielle confirmatoire signifie que l’analyste
a identifié une structure plausible pour le phénomène étudié. Évidemment, cette structure
plausible n’est pas unique et il est possible qu’une analyse des mêmes données avec un
autre modèle donne des résultats aussi bons!
On distingue souvent deux types d’erreurs, externes et internes. L’oubli d’une variable
importante pour l’analyse est une erreur externe alors que l’omission d’un lien entre deux
variables de l’analyse est une erreur interne. Une bonne connaissance du domaine
d’application des équations structurelles offre une certaine protection contre les erreurs
externes. Des outils statistiques sont disponibles pour mettre en lumière les erreurs
internes.
- 25 -
Modification Indices (MI) et Expected Parameter Change (EPC)
Ces deux classes de statistiques sont des outils pour détecter et corriger les erreurs
internes pour un modèle.
On va maintenant construire des variables latentes pour les variables endogènes dans
l’exemple du milieu socio-économique. Dans l’exemple de diagramme de cheminement
avec variables observée, on avait trois variables endogènes DegreAsp → Selctvty →
Degree. On va chercher à mieux caractériser l’ambition et le milieu socio-économique en
les définissant à partir de plusieurs variables observées.
- 26 -
CFA POUR LA MOTIVATION ACADEMIQUE, LE PRESTIGE DU COLLEGE ET
LE STATUT SOCIO-ECONOMIQUE
On a 7 variables observées X1=AcAbilty, X2=SelfConf, X3=DegreAsp, X4=Selctvty,
X5=Degree, X6=OcPrestg X7=Income. La matrice de variances covariances à modéliser
est
On veut exprimer ces variables en terme de trois variables latentes, à savoir 1=
Motivation académique, 2= Prestige du collège et 3= Statut socio-économique de la
façon suivante,
X1=AcAbilty, X2=SelfConf, X3=DegreAsp → 1= Motivation académique,( AcMotiv )
X4=Selctvty → 2= Prestige du collège (ColgPres )
X5=Degree, X6=OcPrestg X7=Income → 3=Statut socio-économique (SES)
- 27 -
UN PROBLEME POTENTIEL
Dans cet exemple, les corrélations entre Degree et Income est de .106 alors que la
corrélation Degree DegreAsp est de .253. Ces corrélations contreviennent à la règle
générale énoncée plus haut. Elle laisse planer un doute concernant la qualité du modèle
postulé. On note également la faible corrélation de Income avec toutes les autres
variables.
AcAbilty SelfConf DegreAsp Selctvty Degree OcPrestg Income
AcAbilty 1
SelfConf 0.487 1
DegreAsp 0.236 0.206 1
Selctvty 0.382 0.216 0.214 1
Degree 0.242 0.179 0.253 0.254 1
OcPrestg 0.163 0.090 0.125 0.155 0.481 1
Income 0.064 0.040 0.025 0.074 0.106 0.136 1
Note: les de Cronbach pour Degree , OcPrestg ,Income (correlation moyenne rm=.241,
s=0.49) et AcAbilty, SelfConf, DegreAsp (rm=.310, s=0.57) ne satisfont pas le critère
3rm
s 0.7 .
1 2rm
- 28 -
Le modèle de CFA est décrit par les matrices suivantes
21 0 0 0 0 0 0
11 0 0
2
0 0 0 0 0 0 0
0 2
21 0 2 0
31 0 0 2
0 0 0 0
1
1 2 1 3
3
x 0 42 0 12 2 et 0 0 0 2 4
0 0 0
0 0
2 2 3
2 2
0 0 53 13
0 0 0 5
0
2 3 3
0 0 63 0 0 0 0 0 2 0
2
6
0 73 0
0
0 0 0 0 0 7
- 29 -
LISREL Estimates (Maximum Likelihood) Goodness of Fit Statistics
Measurement Equations
AcAbilty = 1.000*AcMotiv, Errorvar.= 0.193 R=0.651 Degrees of Freedom = 12
(0.0161) Minimum Fit Function Chi-Square = 155.501 (P = 0.0)
11.972
Minimum Fit Function Value = 0.0503
SelfConf = 0.765*AcMotiv, Errorvar.= 0.401 R²=0.345 Population Discrepancy Function Value (F0) = 0.0459
(0.0371) (0.0138) 90 Percent Confidence Interval for F0 = (0.0341 ;
20.605 29.045 0.0600)
Root Mean Square Error of Approximation (RMSEA) =
DegreAsp = 0.568*AcMotiv, Errorvar.= .912 R²=0.113 0.0618
(0.0387) (0.0244) 90 Percent Confidence Interval for RMSEA = (0.0533
14.671 37.415 ; 0.0707)
P-Value for Test of Close Fit (RMSEA < 0.05) =
Selctvty = 1.000*ColgPres,, R² = 1.000 0.0116
Degree = 1.000*SES, Errorvar.= 0.287 , R² = 0.690 Expected Cross-Validation Index (ECVI) = 0.0601 (ou
(0.0430) 6.671 .0606 selon le livre p.107)
90 Percent Confidence Interval for ECVI = (0.0483 ;
OcPrestg = 1.151*SES, Errorvar.= 1.685 , R² =0.334 0.0742)
(0.0808) (0.0708)
14.254 23.801 Chi-Square for Independence Model with 21 Degrees
.5
CS= 1.151(.639/2.531) =.578 of Freedom = 3526.069
Income = 0.309*SES, Errorvar.= 2.586 , R² = 0.0230 Independence AIC = 3540.069
(0.0452) (0.0663) Model AIC = 185.852 Saturated AIC = 56.000
6.833 38.985 Independence CAIC = 3589.330
Model CAIC = 298.447 Saturated CAIC = 253.042
On note le petit R2 de 2.3%
Covariance Matrix of Independent Variables Normed Fit Index (NFI) = 0.956
AcMotiv ColgPres SES Non-Normed Fit Index (NNFI) = 0.928
AcMotiv 0.360 Parsimony Normed Fit Index (PNFI) = 0.546
(0.020) Comparative Fit Index (CFI) = 0.959
Incremental Fit Index (IFI) = 0.959
17.784
Relative Fit Index (RFI) = 0.923
ColgPres 0.549 3.960 Critical N (CN) = 522.490
(0.028) (0.101) Root Mean Square Residual (RMR) = 0.0540
19.604 39.326 Standardized RMR = 0.0370
SES 0.184 0.478 0.639 Goodness of Fit Index (GFI) = 0.986
(0.013) (0.035) (0.048) Adjusted Goodness of Fit Index (AGFI) = 0.967
Parsimony Goodness of Fit Index (PGFI) = 0.423
14.377 13.631 13.325
- 30 -
Faits saillants de l’analyse :
1-Income contribue très peu à la variable SES (R² = 0.0230)
2- Mauvais ajustement 12 153.85 .
2
On va chercher les aspects les plus problématiques du modèle à l’aide des indices de
modification (MI) et ajouter certains paramètres au modèle
- 31 -
The Modification Indices Suggest to Add the
- 32 -
#1 SelfConf AcAbilty 70.9
#2 Degree DegreAsp 70.8
DegreAsp SES 85.3
Stratégie d’analyse
1- On libère un paramètre
s’il a un grand MI et si
son EPC est grand s’il
respect la logique du
modèle.
2- On peut régler un
problème de deux façons
différentes, en ajoutant
un nouveau ou en
permettant à certaines
erreurs de covarier.
- 33 -
Suggestions pour la suite :
1- Laisser tomber Income et utiliser seulement deux variables pour définir la variable
latente SES ;
2- On ajoute des covariances entres les erreurs résiduelles pour (1) SelfConf et
AcAbilty et (2) Degree et DegreAsp
- 34 -
90 Percent Confidence Interval for F0 = (0.00306 ;
OcPrestg = 1.066*SES, Errorvar.= 1.751 ,R² = 0.308 0.0137)
(0.0856) (0.0748) Root Mean Square Error of Approximation (RMSEA) =
12.450 23.428 0.0379
90 Percent Confidence Interval for RMSEA = (0.0247
Error Covariance for SelfConf and AcAbilty = 0.126 ; 0.0524)
(0.0156) P-Value for Test of Close Fit (RMSEA < 0.05) =
8.069 0.912
Error Covariance for Degree and DegreAsp = 0.0895
(0.0161) Expected Cross-Validation Index (ECVI) = 0.0191
5.558 90 Percent Confidence Interval for ECVI = (0.0150 ;
0.0257)
La variance de AcMotiv a baissé de .360 à ECVI for Saturated Model = 0.0136
.230 ! Les R2 associés à cette variable ont ECVI for Independence Model = 1.102
diminués, sans doute parce que l’on permet une Normed Fit Index (NFI) = 0.992
corrélation entre SelfConf and AcAbilty. Non-Normed Fit Index (NNFI) = 0.980
Parsimony Normed Fit Index (PNFI) = 0.331
Covariance Matrix of Independent Variables
Goodness of Fit Index (GFI) = 0.997
Adjusted Goodness of Fit Index (AGFI) = 0.988
AcMotiv ColgPres SES Parsimony Goodness of Fit Index (PGFI) = 0.237
AcMotiv 0.230
(0.022)
10.438 Evidemment, l’ajustement est meilleur
ColgPres 0.551 3.960
(0.028) (0.101) qu’avant, cependant le construit AcMotiv
19.541 39.326 manque de stabilité. Sa variance
SES 0.181 0.484 0.686
(0.013) (0.035) (0.057) relativement est faible de AcMotiv .230 .
13.980 13.725 12.062
Un Intervalle de confiance à 95% est
Goodness of Fit Statistics
Degrees of Freedom = 5 (.186, .274).
Minimum Fit Function Chi-Square = 27.464 (P =
0.000)
- 35 -
Les estimés et les estimés standardisés
36
DISCUSSION DES RESULTATS
1-L’instrument mis au point répond-il aux attentes ? Mesure-t-il ce pourquoi il a été
développé ?
Les valeurs possibles de l’instrument couvrent-elles une plage suffisamment large ?
(Note : Instrument = Variable latente construite)
37
4- ANALYSE FACTORIELLE CONFIRMATOIRE : ÉVALUATION DES
POLICIERS
Le modèle avec les deux facteurs pour expliquer les 10 variables s’ajuste bien
262 34.94
Factor 1 Factor 2 Unique Var
CommSk 0.457 0.575 0.460
LearnAbi 0.187 0.708 0.464
Judgment 0.639 0.382 0.446
ObserSk 0.134 0.862 0.239
WillConP 0.103 0.797 0.353
IntPeop 0.886 0.159 0.190
InterPer 0.901 0.048 0.186
DesiSelf 0.414 0.644 0.415
Depend 0.580 0.551 0.361
Inegrety 0.768 0.321 0.307
En général un item n’est associé qu’à un seul construit latent. On peut donc 5 items à
chacun des deux construit sur la base du plus grand jis .Ceci donne un modèle d’AFC
dont nous allons maintenant évalué l’ajustement.
38
Programme Simplis
CFA: donnees sur les policiers; estimation des
variables latentes
Raw data from file job13AFE.lSF
Reorder variables: ObserSk CommSk DesiSelf
LearnAbi WillConP IntPeop Judgment InterPer
Depend Inegrety
Latent variables: Perso Rela
Relationships:
ObserSk =1*Perso
CommSk DesiSelf LearnAbi WillConP = Perso
IntPeop =1*Rela
Judgment InterPer Depend Inegrety
=Rela
path diagram
Number of Decimals=3
End of Program
Clairement le modèle proposé ne s’ajuste pas
bien
Goodness of Fit Statistics Root Mean Square Error of Approximation (RMSEA)
0.158
Degrees of Freedom for (C1)-(C2) 34 90 Percent Confidence Interval for RMSEA (0.128 ;
Maximum Likelihood Ratio Chi-Square (C1) 121.396 (P 0.189)
= 0.0000) P-Value for Test of Close Fit (RMSEA $<$ 0.05) 0.000
Browne's (1984) ADF Chi-Square (C2\_NT) 130.842 (P =
0.0000) Expected Cross-Validation Index (ECVI) 1.586
Estimated Non-centrality Parameter (NCP) 87.396 90 Percent Confidence Interval for ECVI (1.296 ;
90 Percent Confidence Interval for NCP (57.505 ; 1.950)
124.877) ECVI for Saturated Model 1.068
Minimum Fit Function Value 1.179 ECVI for Independence Model 12.310
Population Discrepancy Function Value (F0) 0.849
90 Percent Confidence Interval for F0 (0.558 ; Chi-Square for Independence Model (45 df) 1247.947
1.212)
39
Normed Fit Index (NFI) 0.902 Covariance Matrix of Independent Variables
Non-Normed Fit Index (NNFI) 0.903
Parsimony Normed Fit Index (PNFI) 0.681 Perso Rela
Comparative Fit Index (CFI) 0.927 -------- --------
Incremental Fit Index (IFI) 0.927 Perso 2.101
Relative Fit Index (RFI) 0.870 (0.429)
4.896
Critical N (CN) 48.104
Rela 1.429 2.822
(0.321) (0.500)
4.449 5.641
On inclut dans le modèle des covariances entre certaines variables observes pour obtenir
un meilleur ajustement. Les indices de modifications suggérent d’ajouter un lien de
Perso à Depen. Cette modification pourrait également être envisagée. Notons que l’ajout
des trois covariances résiduelles augmente la corrélation entre les deux facteurs latents
qui passe de 0.59 à 0.71.
Il faut aussi noter que l’ajout de covariance diminue les R2 car la variable latente n’est
plus la seule explication pour la variabilité d’une variable observée. Elle diminue aussi la
variance des variables latentes. Par exemple, celle de Rela passe de 2.82 à 2.39. Dans le
modèle retenu le RMSEA est élevé. Peut-être qu’identifier Depen à un seul construit
n’est pas approprié. C’est toutefois ce modèle que nous allons utiliser pour construire un
modèle de prédiction pour le score global.
40
Sortie SIMPLIS pour le modèle choisi
Measurement Equations
41
Standerr (0.132) (0.206)
Z-values 7.810 5.378
42
Z-values 9.688 4.722
Perso Rela
-------- --------
Perso 1.772
(0.413)
4.290
43