AFC (1) - Mode de Compatibilité

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 56

ANALYSE FACTORIELLE

DES CORRESPONDANCES :
A.F.C.

20/05/2018 cours ADD Rachid JAHIDI 1


• Objectifs de l’A.F.C. : Évaluer

–Les ressemblances entre


modalités d’une même variable.

–Les proximités entre les


modalités des deux variables.

20/05/2018 cours ADD Rachid JAHIDI 2


• Intérêt :

–Expliquer graphiquement une


variable à partir d’une autre
variable.
–Aspect non inférentiel de la
méthode.

20/05/2018 cours ADD Rachid JAHIDI 3


Croisement de variables nominales.

Mise en relation des thèmes d’un


questionnaire

20/05/2018 cours ADD Rachid JAHIDI 4


Opinions
Qui pense
quoi Quelles
significations

Qui fait quoi


Identité Comportement

Qui veut Pour quelles


quoi raisons

Motifs
20/05/2018 cours ADD Rachid JAHIDI 5
Données : Tableau des fréquences

b1 bj bp

a1  
 kij  ki .
a 
i f ij =  fi. = k
 k 
a 
 n 
k. j
f. j =
k
20/05/2018 cours ADD Rachid JAHIDI 6
Croisement de variables nominales
• Quelle est la C.S.P. du chef de famille ?
# Agriculteur # Patr indust commerce
# Profession libérale/cadre
#Cadre moyen #Employé #Ouvrier
#Personnel de service #Autre
• Quel est votre mode d'hébergement ?
#Hôtel #Camping # Location /
gîte #Famille / amis
20/05/2018 cours ADD Rachid JAHIDI 7
Tableau des correspondances

Quelle est la C.S.P. Quel est votre mode d'hébergement ?


du chef de famille ?Hôtel CampingLocation / gîteFamille / amisMarge active
Agriculteur 1 2 2 6 11
Patr indust commerce 17 4 10 13 44
Profession libérale/ 23 6 26 24 79
Cadre moyen 12 17 25 32 86
Employ 10 32 29 35 106
Ouvrier 7 20 8 9 44
Personnel de service 0 8 2 12 22
Autre 31 22 25 34 112
Marge active 101 111 127 165 504

20/05/2018 cours ADD Rachid JAHIDI 8


Comment les CSP choisissent
leurs modes d’hébergements?

20/05/2018 cours ADD Rachid JAHIDI 9


Tableau des profils lignes

b1 bj bp

a1
 
 f ij 
fj =
i
ai
 
 fi. 
an  

20/05/2018 cours ADD Rachid JAHIDI 10


Profils lignes

Quelle est la C.S.P. Quel est votre mode d'hébergement ?


du chef de famille ? Hôtel CampingLocation / gîteFamille / amisMarge active
Agriculteur ,091 ,182 ,182 ,545 1,000
Patr indust commerce,386 ,091 ,227 ,295 1,000
Profession libérale/ ,291 ,076 ,329 ,304 1,000
Cadre moyen ,140 ,198 ,291 ,372 1,000
Employ ,094 ,302 ,274 ,330 1,000
Ouvrier ,159 ,455 ,182 ,205 1,000
Personnel de service ,000 ,364 ,091 ,545 1,000
Autre ,277 ,196 ,223 ,304 1,000
Masse ,200 ,220 ,252 ,327

20/05/2018 cours ADD Rachid JAHIDI 11


Comment se fait le choix du
mode d’hébergement par
rapport à la CSP?

20/05/2018 cours ADD Rachid JAHIDI 12


Tableau des profils colonnes

b1 bj bp

a1  
 f ij 
 fi = 
j
ai

 f. j 
an  

20/05/2018 cours ADD Rachid JAHIDI 13


Profils colonnes

Quelle est la C.S.P. Quel est votre mode d'hébergement ?


du chef de famille Hôtel
? Camping
Location / gîte
Famille / amisMasse
Agriculteur ,010 ,018 ,016 ,036 ,022
Patr indust commerce ,168 ,036 ,079 ,079 ,087
Profession libérale/ ,228 ,054 ,205 ,145 ,157
Cadre moyen ,119 ,153 ,197 ,194 ,171
Employ ,099 ,288 ,228 ,212 ,210
Ouvrier ,069 ,180 ,063 ,055 ,087
Personnel de service ,000 ,072 ,016 ,073 ,044
Autre ,307 ,198 ,197 ,206 ,222
Marge active 1,000 1,000 1,000 1,000

20/05/2018 cours ADD Rachid JAHIDI 14


• Pour évaluer les ressemblances
entre modalités d’une même
variable on réalise une ACP sur la
matrice des profils lignes ou des
profils colonnes.

20/05/2018 cours ADD Rachid JAHIDI 15


• Pour évaluer les proximités entre
les modalités des deux variables
on étudie le lien entre les deux
ACP ( ACP des profils lignes et
des profils colonnes)

20/05/2018 cours ADD Rachid JAHIDI 16


ACP des profils lignes

20/05/2018 cours ADD Rachid JAHIDI 17


• On réalise une ACP en
considérant les profils lignes
comme des individus et les
modalités de la deuxième variable
comme des variables.

20/05/2018 cours ADD Rachid JAHIDI 18


Tableau des profils lignes

b1 bj bp masse
a1
 
 f ij 
fj =
i fi.
ai
 
 fi. 
an  
G=( f. j )= fJ
f J = ( f ,..., f ) = point modalité a i
i i i
1 p
20/05/2018 cours ADD Rachid JAHIDI 19
Nuage des profils lignes
A chaque modalité on associe le point

f J = ( f ,..., f ) = point modalité a i


i i i
1 p

et une masse égale à sa fréquence marginale


fi.
Le nuage de points N(I) de Rp est de centre de
gravité f
J

20/05/2018 cours ADD Rachid JAHIDI 20


Distance entre profils lignes
distance du khi-2
p
d (f , f )=∑ ( fj − fj )
2 i l 1 i l 2
J J f. j
j =1

Le fait de diviser par f.j gomme l’effet taille


et permet de mieux mesurer la forme des
liaisons entres profils

20/05/2018 cours ADD Rachid JAHIDI 21


Inertie du nuage des profils
lignes
n
λ 2
I ( N ( I ), f J ) = ∑ f i .d ( f J , f J ) =
2 i

i =1 k

n p
λ = k∑
2
∑ 1
f i . f. j ( f ij − f i . f. j ) 2

i =1 j =1
qui est une mesure de la liaison entre les
deux variables qualitative
20/05/2018 cours ADD Rachid JAHIDI 22
Recherche du premier axe
principal et de la première
composante principale

20/05/2018 cours ADD Rachid JAHIDI 23


Premier axe principal ∆1
• La droite ∆1 passe par le centre de
gravité fJ du nuage N(I) et est
engendrée par le vecteur u1 vecteur
propre normé associée à la plus grande
valeur propre λ1.
• La droite ∆1 maximise l’inertie des points
du nuage projetés sur ∆1 qui vaut λ1

20/05/2018 cours ADD Rachid JAHIDI 24


Première composante principale
F1
• F1 est une nouvelle variable définie
pour chaque individu par la
longueur algébrique de la
projection de l’individu sur ∆1..
• F1 est une variable centrée de
variance λ1

20/05/2018 cours ADD Rachid JAHIDI 25


Qualité globale de la première
composante principale.
• Part d’inertie expliquée :
Inertie expliquée par ∆1/Inertie totale

20/05/2018 cours ADD Rachid JAHIDI 26


Contribution des modalités ai à la
composante
f F (i )
2
CTR1 (i ) = i. 1
λ1

Un profil ligne est d’autant plus important dans


la construction de l’axe que sa contribution est
élevée.
L’interprétation de l’axe s’appuie en priorité sur
les modalités à fortes contributions
20/05/2018 cours ADD Rachid JAHIDI 27
Qualité de représentation des individus
sur le premier axe principal

• Est mesurée par le cosinus carré de


l’angle formé par l’individu et le premier
axe principal qui vaut :
2
F (i )
cos = 2 i
2
1
1
d ( fJ , fJ )
20/05/2018 cours ADD Rachid JAHIDI 28
Étude des autres dimensions
On cherche le deuxième axe principal
∆2 orthogonal à ∆1 passant au milieu
du nuage N(I),puis ∆3 orthogonal à ∆1
et ∆2 vérifiant le même critère, etc. …
Le nombre d’axes que l’on peut
construire est au plus égal à
r=inf(n-1, p-1)
20/05/2018 cours ADD Rachid JAHIDI 29
Axes principaux
Les axes principaux ∆1,..., ∆r passent
par le centre de gravité fJ et sont
portés par les vecteurs propres
u1,…,ur associé aux valeurs propres
λ1,..., λr rangées par ordre décroissant

20/05/2018 cours ADD Rachid JAHIDI 30


Les composantes principales

• Les composantes F1,…,Fr sont


les coordonnées des projections
des profils lignes f Ji sur les axes
∆1,..., ∆r

20/05/2018 cours ADD Rachid JAHIDI 31


Propriétés
• Les composantes principales sont
centrées et non corrélées entres
elles
• L’inertie expliquée par chaque axe
principale = variance de la
composante associée
• Les composantes sont classées
par ordre décroissant des
variances
20/05/2018 cours ADD Rachid JAHIDI 32
Distance entre profils lignes exprimée
en fonction des composantes
r
d ( f , f ) = ∑ ( Fh (i ) − Fh (l ))
2
J
i
J
l 2

h =1

r = nombre de composantes
La distance du khi2 entre profiles
correspond à la distance euclidienne de
ces mêmes profils exprimée en fonction
des composantes
20/05/2018 cours ADD Rachid JAHIDI 33
Exemple (suite)

Résumé

Valeur singulière de
Proportion d'inertie confiance
Corrélatio
Valeur Pris en n
Dimension
singulière Inertie Khi-deux Sig. compte CumuléEcart-type 2
1 ,311 ,097 ,707 ,707 ,039 ,005
2 ,166 ,027 ,201 ,908 ,044
3 ,112 ,013 ,092 1,000
Total ,137 68,884 ,000a 1,000 1,000
a.21 degrés de liberté

20/05/2018 cours ADD Rachid JAHIDI 34


a lignes
Caractéristiques des points

Score dans la
dimension Contribution
De point à inertie de
Quelle est la C.S.P. dimension
De dimension à inertie de point
du chef de famille
Masse? 1 2 Inertie 1 2 1 2 Total
Agriculteur ,022 -,323 ,915 ,005 ,007 ,110 ,140 ,601 ,741
Patr indust commerce
,087 ,854 -,257 ,022 ,205 ,035 ,892 ,043 ,935
Profession libérale/
,157 ,689 ,190 ,025 ,239 ,034 ,917 ,037 ,954
Cadre moyen ,171 -,101 ,398 ,006 ,006 ,163 ,097 ,798 ,896
Employ ,210 -,498 ,092 ,019 ,168 ,011 ,872 ,016 ,888
Ouvrier ,087 -,733 -,968 ,028 ,151 ,494 ,516 ,481 ,997
Personnel de service
,044 -1,112 ,539 ,024 ,174 ,077 ,709 ,089 ,798
Autre ,222 ,266 -,240 ,008 ,050 ,077 ,598 ,260 ,858
Total actif 1,000 ,137 1,000 1,000
a.Normalisation principale symétrique

20/05/2018 cours ADD Rachid JAHIDI 35


ACP des profils colonnes

20/05/2018 cours ADD Rachid JAHIDI 36


On réalise une ACP en considérant
les profils colonnes comme des
individus et les modalités de la
première variable comme des
variables.

20/05/2018 cours ADD Rachid JAHIDI 37


Tableau des profils colonnes

b1 bj bp G
a1  
 f ij 
 fi = 
j fi.
ai

 f. j 
an  
masse f. j
f I = ( f1 j ,..., f n j ) = point modalité b j
j
20/05/2018 cours ADD Rachid JAHIDI 38
Nuage des profils colonnes
A chaque modalité on associe le point

f I = ( f1 ,..., f n ) = point modalité b j


j j j

et une masse égale à sa fréquence marginale


f. j

Le nuage de points N(I) de Rn est de centre de


gravité f I

20/05/2018 cours ADD Rachid JAHIDI 39


Distance entre profils colonnes
distance du khi-2
n
d ( f I , f ) = ∑ ( fi − fi )
2 j k 1 j k 2
I fi .
i =1

Inertie du nuage des profils colonnes


p
λ2
I ( N ( I ), f I ) = ∑ f. j d 2 ( f I j , f I ) =
j =1 k
20/05/2018 cours ADD Rachid JAHIDI 40
Axes principaux
Les axes principaux Φ1,..., Φr passent
par le centre de gravité fI et sont
portés par les vecteurs propres
v1,…,vr associé aux valeurs propres
λ1,..., λr rangées par ordre décroissant

20/05/2018 cours ADD Rachid JAHIDI 41


Les composantes principales

Les composantes G1,…,Gr sont


les coordonnées des projections
des profils colonnes f I sur les
j

axes Φ1,..., Φr

20/05/2018 cours ADD Rachid JAHIDI 42


Propriétés
• Les composantes principales sont
centrées et non corrélées entres
elles
• L’inertie expliquée par chaque axe
principale = variance de la
composante associée
• Les composantes sont classées
par ordre décroissant des
variances
20/05/2018 cours ADD Rachid JAHIDI 43
Distance entre profils colonnes
exprimée en fonction des composantes
r
d ( f I , f ) = ∑ (Gh ( j ) − Gh ( k ))
2 j
I
k 2

h =1

r = nombre de composantes
La distance du khi2 entre profiles
correspond à la distance euclidienne de
ces mêmes profils exprimée en fonction
des composantes
20/05/2018 cours ADD Rachid JAHIDI 44
a
Caractéristiques des points colonnes

Score dans la
dimension Contribution
De point à inertie de
Quel est votre mode dimensionDe dimension à inertie de point
d'hébergementMasse? 1 2 Inertie 1 2 1 2 Total
Hôtel ,200 ,859 -,456 ,054 ,475 ,251 ,854 ,128 ,983
Camping ,220 -,825 -,473 ,055 ,482 ,297 ,851 ,149 1,000
Location / gîte ,252 ,187 ,195 ,013 ,028 ,058 ,217 ,126 ,342
Famille / amis ,327 -,115 ,447 ,016 ,014 ,394 ,086 ,699 ,785
Total actif 1,000 ,137 1,000 1,000
a.Normalisation principale symétrique

20/05/2018 cours ADD Rachid JAHIDI 45


Lien entre les deux analyses

20/05/2018 cours ADD Rachid JAHIDI 46


Relations de transition
Les composantes des deux analyses sont
liées par les relations suivantes
p
Fh (i ) = ∑
1 f ij
λh fi . Gh ( j )
j =1
n
Gh ( j ) = ∑
1 f ij
λh f. j Fh (i )
i =1
20/05/2018 cours ADD Rachid JAHIDI 47
Indice d’attraction répulsion

f ij  d ij > 1 ⇒ attractionentre a iet b j


d ij = 
f i . f. j d ij < 1 ⇒ répulsion entre a iet b j
= 1 ∀ i et j ⇒ independen ce des variables

20/05/2018 cours ADD Rachid JAHIDI 48


Indice d’attraction répulsion exprimé
en fonction des composantes

r
d ij = 1 + ∑ 1
λh
Fh (i )Gh ( j )
h =1

r = nombre de composantes

20/05/2018 cours ADD Rachid JAHIDI 49


Par conséquent :
r
Si ∑
h =1
1
λh
Fh (i )Gh ( j ) > 0

⇒ attraction entre les modalités ai et b j


r
Si ∑
h =1
1
λh
Fh (i )Gh ( j ) < 0

⇒ répulsion entre les modalités ai et b j

20/05/2018 cours ADD Rachid JAHIDI 50


Représentation simultanées

On superpose ici les deux ACP


(ACP des profils lignes et ACP des
profils colonnes)

20/05/2018 cours ADD Rachid JAHIDI 51


Représentation graphique
Axe 2 (20.1%)
Agriculteur

Cadre moyen Personnel de service


Profession libérale/cadre Employé
Axe 1 (70.7%) Autre
Patr indust commerce

Ouvrier

La proximité entre deux modalités traduit


ici des profils proches
20/05/2018 cours ADD Rachid JAHIDI 52
Représentation graphique
Axe 2 (20.1%)

Famille / amis
Location / gîte
Axe 1 (70.7%)
Hôtel Camping

La proximité entre deux modalités traduit


ici des profils proches
20/05/2018 cours ADD Rachid JAHIDI 53
Axe 2 (20.1%)
Agriculteur
Famille / amis Personnel de service
Location / gîte Cadre moyen
Profession libérale/cadre Employé
Axe 1 (70.7%)
Patr indust commerce Camping

Autre
Ouvrier
Hôtel

Si des modalités des 2 variables sont dans le


même cadran cela traduit ici des modalités
qui s’attirent.
20/05/2018 cours ADD Rachid JAHIDI 54
Axe 2 (20.1%)
Agriculteur
Famille / amis Personnel de service
Location / gîte Cadre moyen
Profession libérale/cadre Employé
Axe 1 (70.7%)
Patr indust commerce
Camping

Autre
Ouvrier
Hôtel

Si des modalités des 2 variables sont dans des


Cadrans opposés cela traduit ici des modalités
qui se repousses.
20/05/2018 cours ADD Rachid JAHIDI 55
Axe 2 (20.1%)
Agriculteur
Famille / amis Personnel de service
Location / gîte Cadre moyen
Profession libérale/cadre Employé
Axe 1 (70.7%)
Patr indust commerce Camping

Autre
Ouvrier
Hôtel

Si des modalités des 2 variables sont dans des


Cadrans adjacents on ne peut conclure que si
ces modalités sont proches de l’un des axes.
20/05/2018 cours ADD Rachid JAHIDI 56

Vous aimerez peut-être aussi