Rapport_Afc
Rapport_Afc
Rapport_Afc
ⵜⵉⵏⵎⵍⵜⴰⵏⴰⵎⵓⵔⵜⵏⵜⵎⴰⵙⵙⴰⵏⵉⵏⵜⵓⵙⵏⵉⵙⵉⵏ ⵜⴰⵙⴷⴰⵡⵉⵜⵙⵉⴷⵉⵎⵓⵃⵎⵎⴰⴷⴱⵏⵄⴱⴷⵓⵍⵍⴰⵀ
Ecole Nationale des Sciences Appliquées de Fès Université Sidi Mohamed Ben Abdellah
Rapport du TP n° 2 : AFC
Analyse de données
GESI 2
T th = ni. × n.j / n
6 6
On a ni. = 12 et n.j = 12 6 6 donc ni. × n.j = (12) . (12 6 6) =
6 6
72 36 36
(144 72 72)
72 36 36
72 36 36 3 1.5 1.5
1
D’ ou : T th = 24 (144 72 72) = (6 3 3)
72 36 36 3 1.5 1.5
On désire maintenant poursuivre l’étude du lien de dépendance entre les deux variables à l’aide
d’une analyse factorielle des correspondances.
1/4
𝑛𝑖.
𝑓𝑖. = = (1/2)
𝑛
1/4
𝑛.𝑗
𝑓.𝑗 = = (1/2 1/4 1/4)
𝑛
6. Calculer le centre de gravité des profils lignes et celui des profils colonnes :
1/4
Gx = f.j = (1/2 1/4 1/4) et Gy = f i. = (1/2)
1/4
7. Déterminer l’inertie totale associée au nuage des profils lignes. Comment la valeur de l’inertie
obtenue est-elle liée à la valeur de D2 calculées à la question 2 ?
0 0 1
On a : X = (1/2 1/2 0)
1 0 0
1 1 1 1 1 3
(0 − 2) (0 − 4) 1−4 −2 −4 4
𝑗 1 1 1 1 1 1 1
Donc : 𝑓𝑖 − 𝑓. 𝑗 = −2 −4 0−4 = 0 −4
2 2 4
1 1 1 1 1 1
1−2 0−4 0−4 −4 −4
( ) ( 2 )
1 1 9 1 1 9
4 16 16 16 64 64
𝑗 1 1 𝑗 1 1
(𝑓𝑖 − 𝑓. 𝑗)2 = 0 16 16
et alors : 𝑓𝑖. × (𝑓𝑖 − 𝑓. 𝑗)2 = 0 32 32
1 1 1 1 1 1
(4 16 16) (16 64 64)
1 1 9
16 64 64
𝑓𝑖. 𝑗 2 1 1
(𝑓 − 𝑓. 𝑗) = 2 4 4 0 = 1,25
𝑓.𝑗 𝑖 32 32
1 1 1
(16 64 64)
𝜒2 30
𝜒 2 = 30 et on sait que : 𝐼𝑥 = = 24 = 1.25
𝑛
Donc : 𝜆2 = 0.25
10. Rappeler les formules quasi barycentriques liant les coordonnées des modalités lignes aux
coordonnées des modalités colonnes.
𝜆𝛼 1 𝑓𝑖𝑗
𝑑𝛼 (𝑗) = 𝑢𝛼 (𝑗)√ = ∑ 𝑐 (𝑖)
𝑓. 𝑗 √𝜆𝛼 𝑓. 𝑗 𝛼
𝜆𝛼 1 𝑓𝑖𝑗
𝑐𝛼 (𝑖) = 𝑣𝛼 (𝑖)√ = ∑ 𝑑 (𝑗)
𝑓𝑖. √𝜆𝛼 𝑓𝑖. 𝛼
11. En déduire les coordonnées des modalités x, y, et z sur l’axe 1 puis sur l’axe 2.
12. Construire la représentation superposée des modalités lignes et des modalités colonnes pour
les axes 1 et 2.
13. Soit la modalité ligne supplémentaire t dont les valeurs sont données dans le Tableau 2.
Calculer son profil. En déduire sa position sur le plan factoriel de la question précédente.
Le tableau :
0 0 6
6 6 0
6 0 0
6 3 3
6
0 0 La modalité t se coïncide avec le centre de
9
1 2 gravite G car : 6/12 , 6/12 , 3/12 = ½ , ½, 1/4
Profil ligne : X = 0
3 3
1
0 0
3
1 1 1
3 3 3
0 0 1
1 1
Profil colonne : Y= 2 2 0
1 0 0
1 1 1
2 4 4
X=
Réalisation d’une AFC : 0 0 6
6 6 0
%% table de données 6 0 0
X=[0 0 6;6 6 0;6 0 0]
figure(1),bar(X,'stacked') X=
legend('a','b','c')
xlabel('x, y, z') 0 0 6 6
X(:,end+1)=sum(X,2); 6 6 0 12
X(end+1,:)=sum(X,1) 6 0 0 6
[n,p]=size(X); 12 6 6 24
total=X(n,p);
tab =
N=n-1;
P=p-1;
0 0 0.2500 0.2500
%% Tableau des Frequences nij/n 0.2500 0.2500 0 0.5000
for i=1:n 0.2500 0 0 0.2500
for j=1:p 0.5000 0.2500 0.2500 1.0000
tab(i,j)=X(i,j)/X(n,p);
end tabpct =
end
tab 0 0 25 25
%le resultat sous forme de pourcentage 25 25 0 50
tabpct=tab.*100 25 0 0 25
%% Tableau des frequences lignes nij/ni.=fij/fi. 50 25 25 100
for i=1:N
for j=1:P
Xl(i,j)=(X(i,j)/X(i,p)); Xl =
end
0 0 1.0000
end
0.5000 0.5000 0
Xl 1.0000 0 0
% le resultatsous forme de pourcentage
Xlpct=Xl.*100
Xlpct =
0 0 100
50 50 0
100 0 0
%% Tableau des frequences colonnes nij/n.j=fij/f.j Xc =
for i=1:N
for j=1:P 0 0 1.0000
Xc(i,j)=(X(i,j)/X(n,j)); 0.5000 1.0000 0
end 0.5000 0 0
end
Xc
%le resultatsous forme de pourcentage Xcpct =
Xcpct=Xc.*100
%% table d'effictif théorique 0 0 100
for i=1:N 50 100 0
for j=1:P 50 0 0
Teff_th(i,j)=tab(n,j)*tab(i,p);
end
end T=
%% matrice de taux de liaison
for i=1:N -100 -100 300
for j=1:P 0 100 -100
T(i,j)=(tab(i,j)-Teff_th(i,j))/Teff_th(i,j); 100 -100 -100
end
end
T=T*100 PHI2 =
inertieCY = inertieX =
CX =
0.8660 -0.0000
-0.2887 0.4082
-0.2887 -0.8165
vectpY2 =
1.0000 0 0
0 -0.8165 0.5774
0 -0.5774 -0.8165
Exercice 2 :
legend('chimie','economie','literature','médecine','Paix,Phys
ique')
xlabel('Allemagne,Canada,France,GB,Italie,Japon,Russie,USA')
X(:,end+1)=sum(X,2);
X(end+1,:)=sum(X,1) %% nouvelle ligne et colonne des ni. et
n.j
[n,p]=size(X); %% la taille du tab
total=X(n,p); %% nombre totale d individus
N=n-1;
P=p-1;
X=
24 1 8 18 5 24
4 3 2 4 1 4
8 3 11 12 10 9
23 6 7 26 11 20
1 1 6 5 1 5
6 0 2 3 1 11
4 3 5 2 3 10
51 43 8 70 19 66
%% Tableau des Frequences nij/n
for i=1:n
for j=1:p
tab(i,j)=X(i,j)/X(n,p); %% frequence marginale nij/n
end
end
tab
%le resultat sous forme de pourcentage
tabpct=tab.*100
tabpct =
Xlpct =
86.7592
%% ****** Analyse AFC*********
% Matrice transformé
for i=1:N
for j=1:P
XT(i,j)=Xl(i,j)/sqrt(tab(n,j));
YT(i,j)=Xc(i,j)/sqrt(tab(i,p));
end
end
XT =
YT =
%% centre de gravité de X
Gx=sqrt(tab(n,1:end-1))
Gy=sqrt(tab(1:end-1,p))
Gx =
Gy =
0.3746
0.1777
0.3049
0.4039
0.1826
0.2009
0.2176
0.6715
%% matrice transformé centré et p
for i=1:N
XTc(i,:)=XT(i,:)-Gx ;
end
for j=1:P
YTc(:,j)=YT(:,j)-Gy ;
end
XTc
YTc
XTc =
YTc =
%% matrice de variance
PP=diag(tab(1:end-1,p))
C=sqrt(PP)*XTc
V=C'*C
PP =
0.1404 0 0 0 0 0 0 0
0 0.0316 0 0 0 0 0 0
0 0 0.0930 0 0 0 0 0
0 0 0 0.1632 0 0 0 0
0 0 0 0 0.0333 0 0 0
0 0 0 0 0 0.0404 0 0
0 0 0 0 0 0 0.0474 0
0 0 0 0 0 0 0 0.4509
C=
%% Matrice d’inertie S
for i=1:N
B(i,:)=XT(i,:)*sqrt(tab(i,p));
end
S=B'*B
S1=B*B'
S=
S1 =
vectpX =
valpX =
1.0000
0.0833
0.0374
0.0217
0.0079
0.0019
valpX1 =
0.0833
0.0374
0.0217
0.0079
0.0019
vectpX1 =
vectpY =
valpY =
1.0000 0 0 0 0 0
0 0.0833 0 0 0 0
0 0 0.0374 0 0 0
0 0 0 0.0217 0 0
0 0 0 0 0.0079 0
0 0 0 0 0 0.0019
valpY =
1.0000
0.0833
0.0374
0.0217
0.0079
0.0019
vectpY1 =
0.2056 0.6188 -0.1559 -0.2401 0.3441
-0.0291 -0.1042 0.1354 -0.1393 0.7310
0.5264 -0.4305 -0.3221 0.3179 -0.0520
0.0499 0.0852 -0.5616 0.0283 -0.1437
0.4507 -0.2502 0.3500 -0.6999 -0.2499
0.1221 0.5353 0.3330 0.2120 -0.4373
0.2685 -0.0546 0.5253 0.5338 0.2199
-0.6222 -0.2478 0.1702 -0.0367 -0.1479
%% inertie de X et Y
inertieX=valpX1./sum(valpX1)*100
inertieCX=inertieX*[1 0]+cumsum(inertieX)*[0 1]
inertieY=valpY1./sum(valpY1)*100
inertieCY=inertieY*[1 0]+cumsum(inertieY)*[0 1]
figure (1)
subplot(1,2,1), bar(inertieX),title('Inertie de X')
subplot(1,2,2), bar(inertieY),title('Inertie de Y')
inertieX =
54.7479
24.5998
14.2272
5.1799
1.2454
inertieCX =
54.7479 54.7479
24.5998 79.3476
14.2272 93.5748
5.1799 98.7546
1.2454 100.0000
inertieY =
54.7479
24.5998
14.2272
5.1799
1.2454
inertieCY =
54.7479 54.7479
24.5998 79.3476
14.2272 93.5748
5.1799 98.7546
1.2454 100.0000
CX =
%% relations de transition
vectpY2=B*vectpX/diag(sqrt(valpX))
DY1=zeros(P,2)
for k=1:2
for j=1:P
for i=1:N
DY1(j,k)=DY1(j,k)+(tab(i,j)*CX(i,k))/tab(n,j);
end
DY1(j,k)=(1/sqrt(valpX1(k)))*DY1(j,k)
end
end
DY=DY1
DY =
0.0582 -0.2120
0.4616 0.3512
-0.7898 0.1860
0.1077 0.0662
-0.2034 0.2078
-0.0049 -0.1638
phy =
t=
err_abs =
err_rel =
0.0862
Canada et USA sont très proches l’un de l’autre, ce qui indique des similarités dans leurs prix
Nobel, surtout en médecine.
Allemagne et GB sont également proches, ce qui peut indiquer qu’ils partagent une distribution
similaire dans les prix Nobel, principalement en physique et chimie.
France et Russie sont un peu plus éloignées mais semblent avoir une certaine proximité,
suggérant peut-être une répartition proche dans les prix Nobel de paix ou de
disciplines similaires.
Exercice 3 :
1. Quelle est la méthode d'analyse utilisée ici ? Pourquoi utilise-t-on cette méthode?
La méthode utilisée est l’AFC , car elle permet d’étudier les relations entre deux ensembles
de variables qualitatives (ici, les marques et les attributs) represent2es en table de
contingence , en représentant graphiquement leurs interactions.
2. a) Dans le tableau des fréquences lignes, on lit 20,35% à l'intersection de la ligne "sobre-
élégant" et de la colonne "alezan". Comment a été obtenue cette valeur ? Que signifie-t-
elle ?
On a : 𝑓32 = 20,35 % on a obtenu cette valeur comme suit :
𝑓23 2,01%
𝑓32 = = = 20,35 %
𝑓3. 9,87%
On a La modalité corsaire représente des valeurs de min 0.94 % et max 30,19 % et le profil moyen
est entre le min de 7,60 % et max de 9 ,87 % donc le profil de modalité corsaire apparait avec des
fréquences plus faibles 4 valeurs et des fréquences élevées 4 valeurs donc le profil de modalité
corsaire est très éloigné du profil moyen
3. a) La première valeur indiquée dans le tableau des taux de liaison est -0,868. Indiquer
le calcul qui a permis d'obtenir cette valeur.
Le taux de liaison est calculée par : (tab(i,j)-Teff_th(i,j))/Teff_th(i,j) avec tabij est la table de
contingence et Teff th c’est la table théorique qui représente les fréquences attendues sous
l'hypothèse d'indépendance entre les lignes et les colonnes.
0.09 9,69×6,8
𝑓11 −𝑓1. 𝑓.1 −
100 100×100
On a : = 9,69×6,8 = −0,86
𝑓1. 𝑓.1
100×100
b) Au vu du tableau des taux de liaison, indiquer une modalité ligne et une modalité colonne
qui "s'attirent". Indiquer une modalité ligne et une modalité colonne qui "se
repoussent".
Les modalités Corsaire et vulgaire s’attirent , valeur de taux : 2,677
Les modalités Alezan et nouveau riche se repoussent avec un taux très faible de -0.164
c) Quel est le taux de liaison maximum du tableau ? Comment pourrait-on exprimer d'une
autre façon le résultat correspondant à ce taux de liaison.
Le taux maximum est celui de 2,677 cela veut dire que le fréquence du couple dépasse de 2,677 la
valeur attendue sous l’hypothèse d’indépendance .
4.Le coefficient Phi-2 de ce tableau vaut 0,60855. Relier ce résultat aux valeurs propres d'une
part, au khi-2 du tableau d'autre part.
𝜒2 696.79
On a 𝑝ℎ𝑖 2 = = = 0.60855
𝑁 1145
Et aussi 𝑝ℎ𝑖 2 = ∑𝑞−1 𝜆𝑘
= 0.1821 + 0.1330 + 0.1043 + 0.0812 + 0.0641 +
𝑘
0.0212 + 0.0111 + 0.0089 + 0.0026 + 0.0001 = 0.6086
D’après Kaiser On retient uniquement les axes dont les valeurs propres sont supérieures à la
𝑐ℎ𝑖2 696,79
La moyenne des valeurs propres est égale à min (𝑝−1,𝑞−1) = = 69,67
10
Donc on choisit 4 variables factorielles dont le cumulé est supérieur a l’inertie moyen
6. a) En utilisant le tableau des résultats relatifs aux lignes, calculer la distance du point
représentant la modalité "Nouveau-riche" à l'origine du repère, dans l'espace de dimension 3
défini par les premiers axes factoriels.
Donc 𝑑 = 0.4635
2( 𝑐𝑖 2
𝑞𝑙𝑡𝑘 (𝑖) = 𝑐𝑜𝑠 𝜃𝑖𝑘 ) =
𝑑2
𝐶2 0.2148
𝑑2 (𝑜𝑟𝑖𝑔𝑖𝑛𝑒, 𝑛𝑜𝑢𝑣𝑒𝑎𝑢 𝑟𝑖𝑐ℎ𝑒) = 𝑞𝑙𝑡 = = 0.5652 alors : d = 0.7518
0.38
𝐶 2 0.2516
= = 0.5431
𝑞𝑙𝑡 0.853
e) Dans la représentation en 3 dimensions, "Nouveau-riche" est plus près du profil moyen que
"Sobre-élégant". En est-il de même dans la réalité, c'est-à-dire dans l'espace de dimension 10?
- Corsaire de 33 ,2 %
- Zodiaque de 9 ,8 %
- Hotesse de 28,9 %
8. Mener une étude analogue pour la deuxième variable.
Pour les attribus :
- Vulgaire : 18 ,3%
- Pour une femme : 44,7%
Pour les marques :
On a pour l’axe 2 : les pourcentages de contributions a inertie supérieur a la moyenne sont :
- Corsaire : 10,7 %
- Directoire : 20,2%
- Escale : 25,2%
- Hotesse : 23%
9. Faire une synthèse des deux études précédentes en décrivant les résultats obtenus dans le
premier plan factoriel.
L’axe 1 : Oppose des attributs comme Distingué et Vulgaire, et des marques perçues
différemment, comme Corsaire et Hôtesse. Cet axe représente une opposition entre le
raffinement et le manque de sophistication.
L’axe 2 : Oppose des attributs liés au genre, comme Pour une femme et Vulgaire, avec des
marques comme Directoire et Escale. Cet axe semble refléter une dimension de genre
ou de perception sociale.
10. A votre avis, quelle est la marque qui a finalement été retenue par l'entreprise ?
Corsaire pourrait être celle qui a été retenue par l’entreprise, car :