Rapport_Afc

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 23

‫المدرسة الوطنية للعلوم التطبيقية‬ ‫جامعة سيدي محمد بن عبدللا‬

ⵜⵉⵏⵎⵍⵜⴰⵏⴰⵎⵓⵔⵜⵏⵜⵎⴰⵙⵙⴰⵏⵉⵏⵜⵓⵙⵏⵉⵙⵉⵏ ⵜⴰⵙⴷⴰⵡⵉⵜⵙⵉⴷⵉⵎⵓⵃⵎⵎⴰⴷⴱⵏⵄⴱⴷⵓⵍⵍⴰⵀ
Ecole Nationale des Sciences Appliquées de Fès Université Sidi Mohamed Ben Abdellah

Rapport du TP n° 2 : AFC
Analyse de données

GESI 2

Réalisé par : HAFSA LAMRABAT


Année universitaire : 2024 / 2025
EXERCICE 1 :
1. Dans le cadre de l’étude du lien de dépendance entre les variables V1 et V2, déterminer le
tableau des effectifs théoriques attendus sous l’hypothèse d’indépendance :

T th = ni. × n.j / n
6 6
On a ni. = 12 et n.j = 12 6 6 donc ni. × n.j = (12) . (12 6 6) =
6 6
72 36 36
(144 72 72)
72 36 36
72 36 36 3 1.5 1.5
1
D’ ou : T th = 24 (144 72 72) = (6 3 3)
72 36 36 3 1.5 1.5

2. Calculer l’indicateur global de distance χ2 entre les deux tableaux :


3 2 3
∑ ∑(𝑇(𝑖, 𝑗) − 𝑇𝑡ℎ(𝑖, 𝑗)2 (0 − 3)2 (0 − 2) (0 − 2)2
2 2 (𝑇,
𝜒 = 𝑛𝜒 𝑇𝑡ℎ) = 𝑛 = 24 ( + + ⋯+ )
𝑇𝑡ℎ(𝑖, 𝑗) 3 3/2 3/2
= 30

On désire maintenant poursuivre l’étude du lien de dépendance entre les deux variables à l’aide
d’une analyse factorielle des correspondances.

3. Calculer la marge ligne et la marge colonne du Tableau 1 :


6
ni.= 12 et n.j = 12 6 6
6
4. Calculer les profils lignes ainsi que les profils colonnes :
Profil ligne :
𝑓11 … 𝑓1𝐽 0 0 1
𝑗 𝑛𝑖𝑗
X = … … … = (0.5 0.5 0) avec 𝑓𝑖 = 𝑛𝑖.
𝑓𝐼1 … 𝑓𝐼𝐽 1 0 0
Profil colonne :
𝑓11 … 𝑓1𝐼 0 0 1
𝑛𝑖𝑗
𝑌 = … … … = (0.5 1 0) avec : 𝑓𝑗𝑖 = 𝑛.𝑗
𝑓𝐽1 … 𝑓𝐽𝐼 0.5 0 0
5. Quels sont les poids attribués à chacun des profils-lignes ? Même question pour les profils-
colonnes.

1/4
𝑛𝑖.
𝑓𝑖. = = (1/2)
𝑛
1/4
𝑛.𝑗
𝑓.𝑗 = = (1/2 1/4 1/4)
𝑛

6. Calculer le centre de gravité des profils lignes et celui des profils colonnes :
1/4
Gx = f.j = (1/2 1/4 1/4) et Gy = f i. = (1/2)
1/4

7. Déterminer l’inertie totale associée au nuage des profils lignes. Comment la valeur de l’inertie
obtenue est-elle liée à la valeur de D2 calculées à la question 2 ?

(𝑓𝑖𝑗 − 𝑓𝑖. 𝑓. 𝑗)2 𝜒 2 𝑓𝑖. 𝑗 2


𝐼𝑥 = ∑ ∑ = = ∑∑ (𝑓𝑖 − 𝑓. 𝑗)
𝑓𝑖. 𝑓. 𝑗 𝑛 𝑓. 𝑗

0 0 1
On a : X = (1/2 1/2 0)
1 0 0
1 1 1 1 1 3
(0 − 2) (0 − 4) 1−4 −2 −4 4
𝑗 1 1 1 1 1 1 1
Donc : 𝑓𝑖 − 𝑓. 𝑗 = −2 −4 0−4 = 0 −4
2 2 4
1 1 1 1 1 1
1−2 0−4 0−4 −4 −4
( ) ( 2 )
1 1 9 1 1 9
4 16 16 16 64 64
𝑗 1 1 𝑗 1 1
(𝑓𝑖 − 𝑓. 𝑗)2 = 0 16 16
et alors : 𝑓𝑖. × (𝑓𝑖 − 𝑓. 𝑗)2 = 0 32 32
1 1 1 1 1 1
(4 16 16) (16 64 64)

1 1 9
16 64 64
𝑓𝑖. 𝑗 2 1 1
(𝑓 − 𝑓. 𝑗) = 2 4 4 0 = 1,25
𝑓.𝑗 𝑖 32 32
1 1 1
(16 64 64)

La valeur d’ inertie est liée a la valeur de D2 comme suit :

𝜒2 30
𝜒 2 = 30 et on sait que : 𝐼𝑥 = = 24 = 1.25
𝑛

8. Combien d’axes factoriels l’analyse produit-elle ? Rappeler la formule utilisée


L’AFC toujours produit le min(I-1 , J-1) on a : min(3-1,3-1) = 2 d’où l’AFC produit 2 axes
9. Calculer l’inertie de l’axe 2 :
On a Ix = 1,25 = ∑ ∑21 𝜆𝑘 = 𝜆1 + 𝜆2 = 1 + 𝜆2

Donc : 𝜆2 = 0.25

10. Rappeler les formules quasi barycentriques liant les coordonnées des modalités lignes aux
coordonnées des modalités colonnes.
𝜆𝛼 1 𝑓𝑖𝑗
𝑑𝛼 (𝑗) = 𝑢𝛼 (𝑗)√ = ∑ 𝑐 (𝑖)
𝑓. 𝑗 √𝜆𝛼 𝑓. 𝑗 𝛼
𝜆𝛼 1 𝑓𝑖𝑗
𝑐𝛼 (𝑖) = 𝑣𝛼 (𝑖)√ = ∑ 𝑑 (𝑗)
𝑓𝑖. √𝜆𝛼 𝑓𝑖. 𝛼

11. En déduire les coordonnées des modalités x, y, et z sur l’axe 1 puis sur l’axe 2.

1 𝑓1𝑗 0×𝑑1 (𝑎) 0×𝑑1 (𝑏) 6 𝑑1 (𝑐)


𝑐1 (𝑥) = ∑ 𝑑 (𝑗) = + + = 𝑑1 (𝑐 )=1,73
√𝜆1 𝑓1. 1 1/4 1/4 24 1
4
1 𝑓2𝑗 6 𝑑1 (𝑎) 6 𝑑1 (𝑏) 0×𝑑1 (𝑐) 1
𝑐1 (𝑦) = ∑ 𝑑1 (𝑗) = 24 1 + 24 1 + = 2 (𝑑1 (𝑎) + 𝑑1 (𝑏))= -0,57
√𝜆1 𝑓2. 1/2
2 2

1 𝑓3𝑗 6 𝑑1 (𝑎) 𝑑1 (𝑏) 0×𝑑1 (𝑐)


𝑐1 (𝑧) = ∑ 𝑑 (𝑗) = 24 +0 + = 𝑑1 (𝑎)=-0,57
√𝜆1 𝑓3. 3 1 1
1/4
4 4

1 𝑓1𝑗 1 0×𝑑2 (𝑎) 0×𝑑2 (𝑏) 6 𝑑2 (𝑐) 1


𝑐2 (𝑥) = ∑ 𝑑 (𝑗) = ( + + )= 𝑑2 (𝑐 ) )=0
√𝜆2 𝑓1. 2 √𝜆2
1 1
24 1
√𝜆2
4 4 4
1 𝑓2𝑗 1 6 𝑑2 (𝑎) 6 𝑑2 (𝑏) 0 × 𝑑2 (𝑐)
𝑐2 (𝑦) = ∑ 𝑑2 (𝑗) = ( + + )
√𝜆2 𝑓2. √𝜆2 24 1 24 1 1/2
2 2
1
= (𝑑2 (𝑎) + 𝑑2 (𝑏)) = 0,4
2√𝜆2

1 𝑓3𝑗 1 6 𝑑2 (𝑎) 𝑑2 (𝑏) 0×𝑑2 (𝑐) 1


𝑐2 (𝑧) = ∑ 𝑑 (𝑗) = (24 +0 + )= 𝑑2 (𝑎)= -0 ,81
√𝜆2 𝑓3. 3 √𝜆2
1 1
1/4 √𝜆2
4 4

12. Construire la représentation superposée des modalités lignes et des modalités colonnes pour
les axes 1 et 2.
13. Soit la modalité ligne supplémentaire t dont les valeurs sont données dans le Tableau 2.
Calculer son profil. En déduire sa position sur le plan factoriel de la question précédente.
Le tableau :
0 0 6
6 6 0
6 0 0
6 3 3

6
0 0 La modalité t se coïncide avec le centre de
9
1 2 gravite G car : 6/12 , 6/12 , 3/12 = ½ , ½, 1/4
Profil ligne : X = 0
3 3
1
0 0
3
1 1 1
3 3 3

0 0 1
1 1
Profil colonne : Y= 2 2 0
1 0 0
1 1 1
2 4 4
X=
Réalisation d’une AFC : 0 0 6
6 6 0
%% table de données 6 0 0
X=[0 0 6;6 6 0;6 0 0]
figure(1),bar(X,'stacked') X=
legend('a','b','c')
xlabel('x, y, z') 0 0 6 6
X(:,end+1)=sum(X,2); 6 6 0 12
X(end+1,:)=sum(X,1) 6 0 0 6
[n,p]=size(X); 12 6 6 24
total=X(n,p);
tab =
N=n-1;
P=p-1;
0 0 0.2500 0.2500
%% Tableau des Frequences nij/n 0.2500 0.2500 0 0.5000
for i=1:n 0.2500 0 0 0.2500
for j=1:p 0.5000 0.2500 0.2500 1.0000
tab(i,j)=X(i,j)/X(n,p);
end tabpct =
end
tab 0 0 25 25
%le resultat sous forme de pourcentage 25 25 0 50
tabpct=tab.*100 25 0 0 25
%% Tableau des frequences lignes nij/ni.=fij/fi. 50 25 25 100
for i=1:N
for j=1:P
Xl(i,j)=(X(i,j)/X(i,p)); Xl =
end
0 0 1.0000
end
0.5000 0.5000 0
Xl 1.0000 0 0
% le resultatsous forme de pourcentage
Xlpct=Xl.*100
Xlpct =

0 0 100
50 50 0
100 0 0
%% Tableau des frequences colonnes nij/n.j=fij/f.j Xc =
for i=1:N
for j=1:P 0 0 1.0000
Xc(i,j)=(X(i,j)/X(n,j)); 0.5000 1.0000 0
end 0.5000 0 0
end
Xc
%le resultatsous forme de pourcentage Xcpct =
Xcpct=Xc.*100
%% table d'effictif théorique 0 0 100
for i=1:N 50 100 0
for j=1:P 50 0 0
Teff_th(i,j)=tab(n,j)*tab(i,p);
end
end T=
%% matrice de taux de liaison
for i=1:N -100 -100 300
for j=1:P 0 100 -100
T(i,j)=(tab(i,j)-Teff_th(i,j))/Teff_th(i,j); 100 -100 -100
end
end
T=T*100 PHI2 =

%% indice de Chi 2 X=PHI2 30


PHI2=0;
for i=1:N
for j=1:P Gx =
PHI2=PHI2+((tab(i,j)-(tab(n,j)*tab(i,p)))^2)/(tab(n,j)*tab(i,p));
end 0.7071 0.5000 0.5000
end
PHI2=total*PHI2
%% ****** Analyse AFC********* Gy =
% Matrice transformé
for i=1:N 0.5000
for j=1:P 0.7071
XT(i,j)=Xl(i,j)/sqrt(tab(n,j)); 0.5000
YT(i,j)=Xc(i,j)/sqrt(tab(i,p));
end XTc =
end
%% centre de gravité de X -0.7071 -0.5000 1.5000
Gx=sqrt(tab(n,1:end-1)) -0.0000 0.5000 -0.5000
Gy=sqrt(tab(1:end-1,p)) 0.7071 -0.5000 -0.5000
%% matrice transformé centré et p
for i=1:N YTc =
XTc(i,:)=XT(i,:)-Gx
end -0.5000 -0.5000 1.5000
for j=1:P -0.0000 0.7071 -0.7071
YTc(:,j)=YT(:,j)-Gy 0.5000 -0.5000 -0.5000
end
%% matrice de variance
PP=diag(tab(1:end-1,p))
C=sqrt(PP)*XTc
V=C'*C
%% Matrice d’inertie S PP =
for i=1:N
B(i,:)=XT(i,:)*sqrt(tab(i,p)); 0.2500 0 0
end 0 0.5000 0
S=B'*B 0 0 0.2500
S1=B*B'
C=
%% vecteurs propres et valeurs propres de S
[vectpX valpX]=svds(S) -0.3536 -0.2500 0.7500
valpX=diag(valpX) -0.0000 0.3536 -0.3536
valpX1=valpX(2:end); 0.3536 -0.2500 -0.2500
vectpX1=vectpX(:,2:end)
%% vecteurs propres et valeurs propres de S* V=
[vectpY valpY]=svds(S1)
valpY=diag(valpY) 0.2500 0 -0.3536
valpY1=valpY(2:end); 0 0.2500 -0.2500
vectpY1=vectpY(:,2:end) -0.3536 -0.2500 0.7500
%% inertie de X et Y S=
inertieX=valpX1./sum(valpX1)*100
inertieCX=inertieX*[1 0]+cumsum(inertieX)*[0 1] 0.7500 0.3536 0
inertieY=valpY1./sum(valpY1)*100 0.3536 0.5000 0
inertieCY=inertieY*[1 0]+cumsum(inertieY)*[0 1] 0 0 1.0000
figure (1)
subplot(1,2,1), bar(inertieX),title('Inertie de X')
subplot(1,2,2), bar(inertieY),title('Inertie de Y') S1 =
%% Coordonnées des nuages projetés sur les axes factoriels
CX=XTc*vectpX1 1.0000 0 0
%% relations de transition 0 0.7500 0.3536
vectpY2=B*vectpX/diag(sqrt(valpX)) 0 0.3536 0.5000
DY1=zeros(P,2)
for k=1:2
for j=1:P vectpX =
for i=1:N
DY1(j,k)=DY1(j,k)+(tab(i,j)*CX(i,k))/tab(n,j); 0 -0.8165 -0.5774
end 0 -0.5774 0.8165
DY1(j,k)=(1/sqrt(valpX1(k)))*DY1(j,k) 1.0000 0 0
end
end
DY=DY1 valpX =
%% Représentation des nuages lignes et colonnes
figure (3) 1.0000 0 0
indiv= {'x', 'y', 'z'}; 0 1.0000 0
for i=1:N 0 0 0.2500
plot(CX(i,1),CX(i,2),'sr')
text(CX(i,1),CX(i,2),indiv{i},'Color','blue','fontsize',12)
hold on valpX =
end
grid 1.0000
hold on; 1.0000
var={'a','b','c'}; 0.2500
for i=1:P
plot(DY(i,1),DY(i,2),'*b')
text(DY(i,1),DY(i,2),var{i},'Color','red','fontsize',12) vectpX1 =
hold on
end -0.8165 -0.5774
plot(-1:0.01:1,0,'.b',0,-1:0.01:1,'.b') -0.5774 0.8165
%% Contribution du profil-ligne i à l’inertie de l’axe k 0 0
for i=1:N
for k=1:2
CTRX(i,k)=100*tab(i,p)*(CX(i,k)^2)/valpX1(k); vectpY =
end
end 0 1.0000 0
%% Contribution du profil-colonne j à l’inertie de l’axe K -0.8165 0 -0.5774
for j=1:P -0.5774 0 0.8165
for k=1:2
CTRY(j,k)=100*tab(n,j)*(DY(j,k)^2)/valpY1(k);
end valpY =
end
%% Qualité de représentation du point-ligne i sur l’axe k 1.0000 0 0
0 1.0000 0
for i=1:N
0 0 0.2500
for k=1:2
qltX(i,k)=(CX(i,k)^2)/(norm(XTc(i,:)))^2
end
valpY =
end
%% Qualité de représentation du point-colonne j sur l’axe k
1.0000
for j=1:P
1.0000
for k=1:2
0.2500
qltY(j,k)=(DY(j,k)^2)/(norm(YTc(:,j)))^2
end
end
vectpY1 =
inertieY =
1.0000 0
80.0000 0 -0.5774
20.0000 0 0.8165

inertieCY = inertieX =

80.0000 80.0000 80.0000


20.0000 100.0000 20.0000

CX =

0.8660 -0.0000
-0.2887 0.4082
-0.2887 -0.8165

vectpY2 =

1.0000 0 0
0 -0.8165 0.5774
0 -0.5774 -0.8165
Exercice 2 :

1. Réalisez une AFC:


%% table de données
X=xlsread('prix_noble.xlsx') %% lire le tab
figure(1),bar(X,'stacked')

legend('chimie','economie','literature','médecine','Paix,Phys
ique')
xlabel('Allemagne,Canada,France,GB,Italie,Japon,Russie,USA')
X(:,end+1)=sum(X,2);
X(end+1,:)=sum(X,1) %% nouvelle ligne et colonne des ni. et
n.j
[n,p]=size(X); %% la taille du tab
total=X(n,p); %% nombre totale d individus
N=n-1;
P=p-1;

X=

24 1 8 18 5 24
4 3 2 4 1 4
8 3 11 12 10 9
23 6 7 26 11 20
1 1 6 5 1 5
6 0 2 3 1 11
4 3 5 2 3 10
51 43 8 70 19 66
%% Tableau des Frequences nij/n
for i=1:n
for j=1:p
tab(i,j)=X(i,j)/X(n,p); %% frequence marginale nij/n
end
end
tab
%le resultat sous forme de pourcentage
tabpct=tab.*100

tabpct =

4.2105 0.1754 1.4035 3.1579 0.8772 4.2105 14.0351


0.7018 0.5263 0.3509 0.7018 0.1754 0.7018 3.1579
1.4035 0.5263 1.9298 2.1053 1.7544 1.5789 9.2982
4.0351 1.0526 1.2281 4.5614 1.9298 3.5088 16.3158
0.1754 0.1754 1.0526 0.8772 0.1754 0.8772 3.3333
1.0526 0 0.3509 0.5263 0.1754 1.9298 4.0351
0.7018 0.5263 0.8772 0.3509 0.5263 1.7544 4.7368
8.9474 7.5439 1.4035 12.2807 3.3333 11.5789 45.0877
21.2281 10.5263 8.5965 24.5614 8.9474 26.1404 100.0000

%% Tableau des frequences lignes nij/ni.=fij/fi.


for i=1:N
for j=1:P
Xl(i,j)=(X(i,j)/X(i,p)); %% frequence conditionelle ligne
end
end
Xl
% le resultat sous forme de pourcentage
Xlpct=Xl.*100

Xlpct =

30.0000 1.2500 10.0000 22.5000 6.2500 30.0000


22.2222 16.6667 11.1111 22.2222 5.5556 22.2222
15.0943 5.6604 20.7547 22.6415 18.8679 16.9811
24.7312 6.4516 7.5269 27.9570 11.8280 21.5054
5.2632 5.2632 31.5789 26.3158 5.2632 26.3158
26.0870 0 8.6957 13.0435 4.3478 47.8261
14.8148 11.1111 18.5185 7.4074 11.1111 37.0370
19.8444 16.7315 3.1128 27.2374 7.3930 25.6809
%% Tableau des frequences colonnes nij/n.j=fij/f.j
for i=1:N
for j=1:P
Xc(i,j)=(X(i,j)/X(n,j));%% frequence conditionelle colonne
end
end
Xc
%le resultat sous forme de pourcentage
Xcpct=Xc.*100
Xcpct =

19.8347 1.6667 16.3265 12.8571 9.8039 16.1074


3.3058 5.0000 4.0816 2.8571 1.9608 2.6846
6.6116 5.0000 22.4490 8.5714 19.6078 6.0403
19.0083 10.0000 14.2857 18.5714 21.5686 13.4228
0.8264 1.6667 12.2449 3.5714 1.9608 3.3557
4.9587 0 4.0816 2.1429 1.9608 7.3826
3.3058 5.0000 10.2041 1.4286 5.8824 6.7114
42.1488 71.6667 16.3265 50.0000 37.2549 44.2953
%% %% table d'effictif théorique
for i=1:N
for j=1:P
Teff_th(i,j)=tab(n,j)*tab(i,p); %% ni. n.j
end
end
La table d'effectifs montre les effectifs
Teff_th = que l'on s'attendrait à obtenir sous
l'hypothèse d'indépendance entre les
0.0298 0.0148 0.0121 0.0345 0.0126 0.0367 lignes et les colonnes.
0.0067 0.0033 0.0027 0.0078 0.0028 0.0083
0.0197 0.0098 0.0080 0.0228 0.0083 0.0243
0.0346 0.0172 0.0140 0.0401 0.0146 0.0427
0.0071 0.0035 0.0029 0.0082 0.0030 0.0087
0.0086 0.0042 0.0035 0.0099 0.0036 0.0105
0.0101 0.0050 0.0041 0.0116 0.0042 0.0124
0.0957 0.0475 0.0388 0.1107 0.0403 0.1179

%% matrice de taux de liaison


for i=1:N
for j=1:P
T(i,j)=(tab(i,j)-Teff_th(i,j))/Teff_th(i,j);
end
end
T=T*100
Le taux de liaison est pour mesurer
T= le degré dépendance entre les lignes
et les colonnes d'un tableau de
41.3223 -88.1250 16.3265 -8.3929 -30.1471 14.7651 contingence.
4.6832 58.3333 29.2517 -9.5238 -37.9085 -14.9888
-28.8944 -46.2264 141.4324 -7.8167 110.8768 -35.0386
16.5023 -38.7097 -12.4424 13.8249 32.1948 -17.7311
-75.2066 -50.0000 267.3469 7.1429 -41.1765 0.6711
22.8890 -100.0000 1.1535 -46.8944 -51.4066 82.9589
-30.2112 5.5556 115.4195 -69.8413 24.1830 41.6853
-6.5183 58.9494 -63.7894 10.8949 -17.3724 -1.7575

%% indice de Chi 2 X=PHI2 Chi2 mesure de la distance au


PHI2=0; carré entre les distributions
for i=1:N observées et attendues
for j=1:P
PHI2=PHI2+((tab(i,j)-(tab(n,j)*tab(i,p)))^2)/(tab(n,j)*tab(i,p));
end
end
PHI2=total*PHI2
PHI2 =

86.7592
%% ****** Analyse AFC*********
% Matrice transformé
for i=1:N
for j=1:P
XT(i,j)=Xl(i,j)/sqrt(tab(n,j));
YT(i,j)=Xc(i,j)/sqrt(tab(i,p));
end
end
XT =

0.6511 0.0385 0.3411 0.4540 0.2089 0.5868


0.4823 0.5137 0.3790 0.4484 0.1857 0.4346
0.3276 0.1745 0.7079 0.4569 0.6308 0.3321
0.5368 0.1989 0.2567 0.5641 0.3954 0.4206
0.1142 0.1622 1.0771 0.5310 0.1760 0.5147
0.5662 0 0.2966 0.2632 0.1454 0.9354
0.3215 0.3425 0.6316 0.1495 0.3715 0.7244
0.4307 0.5157 0.1062 0.5496 0.2472 0.5023

YT =

0.5294 0.0445 0.4358 0.3432 0.2617 0.4299


0.1860 0.2814 0.2297 0.1608 0.1103 0.1511
0.2168 0.1640 0.7362 0.2811 0.6430 0.1981
0.4706 0.2476 0.3537 0.4598 0.5340 0.3323
0.0453 0.0913 0.6707 0.1956 0.1074 0.1838
0.2469 0 0.2032 0.1067 0.0976 0.3675
0.1519 0.2297 0.4688 0.0656 0.2703 0.3084
0.6277 1.0673 0.2431 0.7446 0.5548 0.6597

%% centre de gravité de X
Gx=sqrt(tab(n,1:end-1))
Gy=sqrt(tab(1:end-1,p))

Gx =

0.4607 0.3244 0.2932 0.4956 0.2991 0.5113

Gy =

0.3746
0.1777
0.3049
0.4039
0.1826
0.2009
0.2176
0.6715
%% matrice transformé centré et p
for i=1:N
XTc(i,:)=XT(i,:)-Gx ;
end
for j=1:P
YTc(:,j)=YT(:,j)-Gy ;
end
XTc
YTc

XTc =

0.1904 -0.2859 0.0479 -0.0416 -0.0902 0.0755


0.0216 0.1893 0.0858 -0.0472 -0.1134 -0.0766
-0.1331 -0.1500 0.4147 -0.0387 0.3317 -0.1791
0.0760 -0.1256 -0.0365 0.0685 0.0963 -0.0907
-0.3465 -0.1622 0.7839 0.0354 -0.1232 0.0034
0.1055 -0.3244 0.0034 -0.2324 -0.1538 0.4241
-0.1392 0.0180 0.3384 -0.3461 0.0723 0.2131
-0.0300 0.1913 -0.1870 0.0540 -0.0520 -0.0090

YTc =

0.1548 -0.3301 0.0612 -0.0314 -0.1129 0.0553


0.0083 0.1037 0.0520 -0.0169 -0.0674 -0.0266
-0.0881 -0.1410 0.4313 -0.0238 0.3381 -0.1068
0.0667 -0.1564 -0.0503 0.0558 0.1300 -0.0716
-0.1373 -0.0913 0.4881 0.0130 -0.0752 0.0012
0.0460 -0.2009 0.0023 -0.0942 -0.1033 0.1666
-0.0658 0.0121 0.2512 -0.1520 0.0526 0.0907
-0.0438 0.3958 -0.4283 0.0732 -0.1167 -0.0118

%% matrice de variance
PP=diag(tab(1:end-1,p))
C=sqrt(PP)*XTc
V=C'*C
PP =

0.1404 0 0 0 0 0 0 0
0 0.0316 0 0 0 0 0 0
0 0 0.0930 0 0 0 0 0
0 0 0 0.1632 0 0 0 0
0 0 0 0 0.0333 0 0 0
0 0 0 0 0 0.0404 0 0
0 0 0 0 0 0 0.0474 0
0 0 0 0 0 0 0 0.4509

C=

0.0713 -0.1071 0.0179 -0.0156 -0.0338 0.0283


0.0038 0.0336 0.0152 -0.0084 -0.0202 -0.0136
-0.0406 -0.0457 0.1264 -0.0118 0.1011 -0.0546
0.0307 -0.0507 -0.0147 0.0277 0.0389 -0.0366
-0.0633 -0.0296 0.1431 0.0065 -0.0225 0.0006
0.0212 -0.0652 0.0007 -0.0467 -0.0309 0.0852
-0.0303 0.0039 0.0737 -0.0753 0.0157 0.0464
-0.0202 0.1284 -0.1256 0.0363 -0.0349 -0.0060
V=

0.0135 -0.0094 -0.0130 0.0003 -0.0044 0.0035


-0.0094 0.0389 -0.0266 0.0077 -0.0054 -0.0053
-0.0130 -0.0266 0.0584 -0.0115 0.0136 -0.0017
0.0003 0.0077 -0.0115 0.0104 -0.0006 -0.0084
-0.0044 -0.0054 0.0136 -0.0006 0.0162 -0.0093
0.0035 -0.0053 -0.0017 -0.0084 -0.0093 0.0148

%% Matrice d’inertie S
for i=1:N
B(i,:)=XT(i,:)*sqrt(tab(i,p));
end
S=B'*B
S1=B*B'

S=

0.2257 0.1401 0.1221 0.2287 0.1334 0.2391


0.1401 0.1442 0.0686 0.1685 0.0917 0.1606
0.1221 0.0686 0.1444 0.1338 0.1013 0.1482
0.2287 0.1685 0.1338 0.2560 0.1477 0.2450
0.1334 0.0917 0.1013 0.1477 0.1057 0.1436
0.2391 0.1606 0.1482 0.2450 0.1436 0.2762

S1 =

0.1594 0.0639 0.1137 0.1559 0.0703 0.0879 0.0822 0.2346


0.0639 0.0336 0.0532 0.0694 0.0338 0.0334 0.0395 0.1221
0.1137 0.0532 0.1261 0.1280 0.0753 0.0562 0.0767 0.1802
0.1559 0.0694 0.1280 0.1705 0.0705 0.0795 0.0825 0.2658
0.0703 0.0338 0.0753 0.0705 0.0592 0.0378 0.0513 0.1031
0.0879 0.0334 0.0562 0.0795 0.0378 0.0554 0.0499 0.1249
0.0822 0.0395 0.0767 0.0825 0.0513 0.0499 0.0618 0.1344
0.2346 0.1221 0.1802 0.2658 0.1031 0.1249 0.1344 0.4861

%% vecteurs propres et valeurs propres de S


[vectpX valpX]=svds(S)
valpX=diag(valpX)
valpX1=valpX(2:end);
vectpX1=vectpX(:,2:end)

vectpX =

-0.4607 0.0928 -0.5047 -0.3344 0.0410 0.6410


-0.3244 0.5188 0.5889 0.3827 0.1054 0.3482
-0.2932 -0.8022 0.2818 0.2340 -0.2562 0.2658
-0.4956 0.1849 0.1695 -0.3882 -0.6084 -0.4131
-0.2991 -0.2108 0.3212 -0.4601 0.7100 -0.2170
-0.5113 -0.0087 -0.4327 0.5697 0.2174 -0.4236

valpX =

1.0000
0.0833
0.0374
0.0217
0.0079
0.0019

valpX1 =

0.0833
0.0374
0.0217
0.0079
0.0019

vectpX1 =

0.0928 -0.5047 -0.3344 0.0410 0.6410


0.5188 0.5889 0.3827 0.1054 0.3482
-0.8022 0.2818 0.2340 -0.2562 0.2658
0.1849 0.1695 -0.3882 -0.6084 -0.4131
-0.2108 0.3212 -0.4601 0.7100 -0.2170
-0.0087 -0.4327 0.5697 0.2174 -0.4236
%% vecteurs propres et valeurs propres de S*
[vectpY valpY]=svds(S1)
valpY=diag(valpY)
valpY1=valpY(2:end);
vectpY1=vectpY(:,2:end)

vectpY =

-0.3746 0.2056 0.6188 -0.1559 -0.2401 0.3441


-0.1777 -0.0291 -0.1042 0.1354 -0.1393 0.7310
-0.3049 0.5264 -0.4305 -0.3221 0.3179 -0.0520
-0.4039 0.0499 0.0852 -0.5616 0.0283 -0.1437
-0.1826 0.4507 -0.2502 0.3500 -0.6999 -0.2499
-0.2009 0.1221 0.5353 0.3330 0.2120 -0.4373
-0.2176 0.2685 -0.0546 0.5253 0.5338 0.2199
-0.6715 -0.6222 -0.2478 0.1702 -0.0367 -0.1479

valpY =

1.0000 0 0 0 0 0
0 0.0833 0 0 0 0
0 0 0.0374 0 0 0
0 0 0 0.0217 0 0
0 0 0 0 0.0079 0
0 0 0 0 0 0.0019

valpY =

1.0000
0.0833
0.0374
0.0217
0.0079
0.0019

vectpY1 =
0.2056 0.6188 -0.1559 -0.2401 0.3441
-0.0291 -0.1042 0.1354 -0.1393 0.7310
0.5264 -0.4305 -0.3221 0.3179 -0.0520
0.0499 0.0852 -0.5616 0.0283 -0.1437
0.4507 -0.2502 0.3500 -0.6999 -0.2499
0.1221 0.5353 0.3330 0.2120 -0.4373
0.2685 -0.0546 0.5253 0.5338 0.2199
-0.6222 -0.2478 0.1702 -0.0367 -0.1479

%% inertie de X et Y
inertieX=valpX1./sum(valpX1)*100
inertieCX=inertieX*[1 0]+cumsum(inertieX)*[0 1]
inertieY=valpY1./sum(valpY1)*100
inertieCY=inertieY*[1 0]+cumsum(inertieY)*[0 1]
figure (1)
subplot(1,2,1), bar(inertieX),title('Inertie de X')
subplot(1,2,2), bar(inertieY),title('Inertie de Y')

inertieX =

54.7479
24.5998
14.2272
5.1799
1.2454

inertieCX =

54.7479 54.7479
24.5998 79.3476
14.2272 93.5748
5.1799 98.7546
1.2454 100.0000

inertieY =

54.7479
24.5998
14.2272
5.1799
1.2454

inertieCY =

54.7479 54.7479
24.5998 79.3476
14.2272 93.5748
5.1799 98.7546
1.2454 100.0000

%% Coordonnées des nuages projetés sur les axes factoriels


CX=XTc*vectpX1

CX =

-0.1584 -0.3196 -0.0612 -0.0569 0.0400


0.0472 0.1135 0.1121 -0.0696 0.1791
-0.4983 0.2732 -0.1554 0.0926 -0.0074
-0.0357 -0.0408 -0.2046 0.0062 -0.0155
-0.7127 0.2652 0.2821 -0.3404 -0.0596
-0.1755 -0.5156 0.2440 0.0937 -0.0948
-0.3561 0.0486 0.3551 0.2178 0.0440
0.2675 0.0714 0.0373 -0.0048 -0.0096

%% relations de transition
vectpY2=B*vectpX/diag(sqrt(valpX))
DY1=zeros(P,2)
for k=1:2
for j=1:P
for i=1:N
DY1(j,k)=DY1(j,k)+(tab(i,j)*CX(i,k))/tab(n,j);
end
DY1(j,k)=(1/sqrt(valpX1(k)))*DY1(j,k)
end
end
DY=DY1

DY =

0.0582 -0.2120
0.4616 0.3512
-0.7898 0.1860
0.1077 0.0662
-0.2034 0.2078
-0.0049 -0.1638

%% Représentation des nuages lignes et colonnes


figure (3)
indiv= {'Allemagne','Canada','France','GB','Italie','Japon','Russie','USA'};
for i=1:N
plot(CX(i,1),CX(i,2),'sr')
text(CX(i,1),CX(i,2),indiv{i},'Color','blue','fontsize',9)
hold on
end
grid
hold on;
var={'chimie','economie','literature','médecine','Paix','Physique'};
for i=1:P
plot(DY(i,1),DY(i,2),'*b')
text(DY(i,1),DY(i,2),var{i},'Color','red','fontsize',7)
hold on
end
plot(-1:0.01:1,0,'.b',0,-1:0.01:1,'.b')
%% %% Contribution du profil-ligne i à l’inertie de l’axe k
for i=1:N
for k=1:2
CTRX(i,k)=100*tab(i,p)*(CX(i,k)^2)/valpX1(k);
end
end
CTRX
%% Contribution du profil-colonne j à l’inertie de l’axe K
CTRX = for j=1:P
for k=1:2
4.2260 38.2964 CTRY(j,k)=100*tab(n,j)*(DY(j,k)^2)/valpY1(k);
0.0846 1.0858 end
27.7092 18.5358 end
0.2491 0.7266 CTRY
20.3162 6.2615 CTRY =
1.4916 28.6527
7.2102 0.2984 0.8619 25.4708
38.7131 6.1427 26.9160 34.6745
64.3531 7.9417
3.4183 2.8736
4.4430 10.3161
0.0076 18.7232

%% Qualité de représentation du point-ligne i sur l’axe k


for i=1:N
for k=1:2 qltX =
qltX(i,k)=(CX(i,k)^2)/(norm(XTc(i,:)))^2;
end 0.1847 0.7521
end 0.0345 0.1993
qltX 0.6980 0.2098
0.0282 0.0370
0.6535 0.0905
0.0824 0.7110
0.4163 0.0077
0.9155 0.0653
%% Qualité de représentation du point-colonne j sur l’axe k
for j=1:P
for k=1:2 qltY =
qltY(j,k)=(DY(j,k)^2)/(norm(YTc(:,j)))^2;
end 0.0533 0.7081
end 0.5766 0.3337
qltY 0.9177 0.0509
0.2731 0.1032
0.2284 0.2382
0.0004 0.4750
%% %% reconstitution des données
phy=zeros(N,P)
for i=1:N
for j=1:P
for k=1:2
phy(i,j)=phy(i,j)+tab(i,p)*tab(n,j)*CX(i,k)*DY(j,k)/sqrt(valpX1(k));
end
t(i,j)=phy(i,j)+tab(i,p)*tab(n,j);
end
end
phy
t
%%erreur de reconstruction
err_abs=abs(t-tab(1:N,1:P))
err_rel=norm(t-tab(1:N,1:P))/norm(t)

phy =

0.0095 -0.0123 0.0015 -0.0058 -0.0029 0.0100


-0.0008 0.0009 -0.0001 0.0004 0.0003 -0.0008
-0.0079 -0.0029 0.0130 -0.0021 0.0054 -0.0054
0.0013 -0.0023 0.0008 -0.0011 -0.0003 0.0015
-0.0031 -0.0023 0.0063 -0.0014 0.0023 -0.0018
0.0045 -0.0052 -0.0001 -0.0024 -0.0016 0.0046
-0.0013 -0.0024 0.0042 -0.0014 0.0013 -0.0004
-0.0023 0.0265 -0.0257 0.0138 -0.0045 -0.0077

t=

0.0393 0.0025 0.0136 0.0287 0.0096 0.0467


0.0059 0.0043 0.0027 0.0082 0.0031 0.0075
0.0118 0.0068 0.0210 0.0207 0.0137 0.0189
0.0359 0.0149 0.0148 0.0390 0.0143 0.0442
0.0040 0.0012 0.0092 0.0068 0.0053 0.0069
0.0131 -0.0009 0.0034 0.0075 0.0021 0.0152
0.0088 0.0026 0.0082 0.0103 0.0055 0.0119
0.0934 0.0739 0.0131 0.1245 0.0358 0.1102

err_abs =

0.0028 0.0007 0.0004 0.0029 0.0009 0.0046


0.0011 0.0010 0.0008 0.0012 0.0013 0.0004
0.0022 0.0016 0.0017 0.0003 0.0039 0.0031
0.0044 0.0044 0.0026 0.0066 0.0050 0.0091
0.0022 0.0006 0.0013 0.0020 0.0036 0.0019
0.0026 0.0009 0.0001 0.0023 0.0003 0.0041
0.0018 0.0027 0.0005 0.0068 0.0003 0.0056
0.0039 0.0015 0.0010 0.0017 0.0025 0.0056

err_rel =

0.0862

2. Interprétez les résultats de l'AFC, en répondant notamment aux questions suivantes


a. La répartition des prix Nobel par discipline est-elle la même pour les 8 pays ?
Non la répartition des prix Nobel par discipline n’est pas la même :
Italie est proche de la catégorie littérature, ce pays a une forte représentation dans les prix Nobel de
littérature.
Canada et USA sont proches de médecine, ce qui indique qu'ils ont probablement reçu un grand
nombre de prix Nobel dans cette discipline.
Allemagne et GB sont proches des catégories physique et chimie, indiquant une prédominance de
prix Nobel dans ces disciplines pour ces pays.
b. Quels sont les pays les plus proches du point de vue du type de prix Nobel reçu
?

Canada et USA sont très proches l’un de l’autre, ce qui indique des similarités dans leurs prix
Nobel, surtout en médecine.
Allemagne et GB sont également proches, ce qui peut indiquer qu’ils partagent une distribution
similaire dans les prix Nobel, principalement en physique et chimie.
France et Russie sont un peu plus éloignées mais semblent avoir une certaine proximité,
suggérant peut-être une répartition proche dans les prix Nobel de paix ou de
disciplines similaires.

c. Quels sont les pays les plus atypiques ?


Les pays les plus atypiques sont :
Japon est relativement isolé et ne se rapproche d'aucune discipline spécifique
Italie se démarque également, étant associé principalement à la littérature, ce qui la rend
différente des pays qui ont une forte représentation dans des disciplines scientifiques.

Exercice 3 :
1. Quelle est la méthode d'analyse utilisée ici ? Pourquoi utilise-t-on cette méthode?
La méthode utilisée est l’AFC , car elle permet d’étudier les relations entre deux ensembles
de variables qualitatives (ici, les marques et les attributs) represent2es en table de
contingence , en représentant graphiquement leurs interactions.

2. a) Dans le tableau des fréquences lignes, on lit 20,35% à l'intersection de la ligne "sobre-
élégant" et de la colonne "alezan". Comment a été obtenue cette valeur ? Que signifie-t-
elle ?
On a : 𝑓32 = 20,35 % on a obtenu cette valeur comme suit :
𝑓23 2,01%
𝑓32 = = = 20,35 %
𝑓3. 9,87%

Elle représente la proportion de la catégorie "sobre-élegant" dans la marque "Alezan" par


rapport au total des descripteurs pour cette marque.
b) - Comparer qualitativement le profil de la marque "Corsaire" au profil moyen.

On a La modalité corsaire représente des valeurs de min 0.94 % et max 30,19 % et le profil moyen
est entre le min de 7,60 % et max de 9 ,87 % donc le profil de modalité corsaire apparait avec des
fréquences plus faibles 4 valeurs et des fréquences élevées 4 valeurs donc le profil de modalité
corsaire est très éloigné du profil moyen

3. a) La première valeur indiquée dans le tableau des taux de liaison est -0,868. Indiquer
le calcul qui a permis d'obtenir cette valeur.
Le taux de liaison est calculée par : (tab(i,j)-Teff_th(i,j))/Teff_th(i,j) avec tabij est la table de
contingence et Teff th c’est la table théorique qui représente les fréquences attendues sous
l'hypothèse d'indépendance entre les lignes et les colonnes.
0.09 9,69×6,8
𝑓11 −𝑓1. 𝑓.1 −
100 100×100
On a : = 9,69×6,8 = −0,86
𝑓1. 𝑓.1
100×100

b) Au vu du tableau des taux de liaison, indiquer une modalité ligne et une modalité colonne
qui "s'attirent". Indiquer une modalité ligne et une modalité colonne qui "se
repoussent".
Les modalités Corsaire et vulgaire s’attirent , valeur de taux : 2,677
Les modalités Alezan et nouveau riche se repoussent avec un taux très faible de -0.164

c) Quel est le taux de liaison maximum du tableau ? Comment pourrait-on exprimer d'une
autre façon le résultat correspondant à ce taux de liaison.
Le taux maximum est celui de 2,677 cela veut dire que le fréquence du couple dépasse de 2,677 la
valeur attendue sous l’hypothèse d’indépendance .
4.Le coefficient Phi-2 de ce tableau vaut 0,60855. Relier ce résultat aux valeurs propres d'une
part, au khi-2 du tableau d'autre part.
𝜒2 696.79
On a 𝑝ℎ𝑖 2 = = = 0.60855
𝑁 1145
Et aussi 𝑝ℎ𝑖 2 = ∑𝑞−1 𝜆𝑘
= 0.1821 + 0.1330 + 0.1043 + 0.0812 + 0.0641 +
𝑘
0.0212 + 0.0111 + 0.0089 + 0.0026 + 0.0001 = 0.6086

5. Au vu du tableau des valeurs propres, combien de variables factorielles faudrait il étudier


dans le cadre d'une étude complète des données observées

D’après Kaiser On retient uniquement les axes dont les valeurs propres sont supérieures à la

moyenne des valeurs propres .

𝑐ℎ𝑖2 696,79
La moyenne des valeurs propres est égale à min (𝑝−1,𝑞−1) = = 69,67
10

Donc on choisit 4 variables factorielles dont le cumulé est supérieur a l’inertie moyen
6. a) En utilisant le tableau des résultats relatifs aux lignes, calculer la distance du point
représentant la modalité "Nouveau-riche" à l'origine du repère, dans l'espace de dimension 3
défini par les premiers axes factoriels.

𝑑 2 (𝑜𝑟𝑖𝑔𝑖𝑛𝑒, 𝑛𝑜𝑢𝑣𝑒𝑎𝑢 𝑟𝑖𝑐ℎ𝑒) = (−0,436)2 + (−0,157)2 + (−0.007)2 = 0.2148

Donc 𝑑 = 0.4635

b) Rappeler la définition de la notion de qualité de représentation d'un point.

2( 𝑐𝑖 2
𝑞𝑙𝑡𝑘 (𝑖) = 𝑐𝑜𝑠 𝜃𝑖𝑘 ) =
𝑑2

c) En utilisant la qualité de représentation indiquée dans le tableau, calculer la 6 distance du


point représentant la modalité "Nouveau-riche" à l'origine du repère dans l'espace de
dimension 10 défini par l'ensemble des axes factoriels.
On a la qualité de nouveau riche est 0.38 donc

𝐶2 0.2148
𝑑2 (𝑜𝑟𝑖𝑔𝑖𝑛𝑒, 𝑛𝑜𝑢𝑣𝑒𝑎𝑢 𝑟𝑖𝑐ℎ𝑒) = 𝑞𝑙𝑡 = = 0.5652 alors : d = 0.7518
0.38

d) Mêmes questions pour le point représentant la modalité "Sobre-élégant".

𝑑2 (𝑜𝑟𝑖𝑔𝑖𝑛𝑒, 𝑠𝑜𝑏𝑟𝑒) = −(0.409)2 + (0.216)2 + (0.194)2 = 0.2516 => 𝑑 = 0.5016

𝐶 2 0.2516
= = 0.5431
𝑞𝑙𝑡 0.853
e) Dans la représentation en 3 dimensions, "Nouveau-riche" est plus près du profil moyen que
"Sobre-élégant". En est-il de même dans la réalité, c'est-à-dire dans l'espace de dimension 10?

Réellement pour nouveau riche on a d = 0.7518 et pour sobre c’est d = 0.5016 et en


projection 0.4 pour nouveau riche et 0.5 pour sobre .

7. Etude de la première variable factorielle


a) On considère le nuage des attributs. Quels sont les individus dont la contribution est
supérieure à la moyenne ? Pour chacun d'eux, préciser le signe de la coordonnée
correspondante. Comment peut-on interpréter cet axe en termes d'opposition entre attributs.

On a pour l’axe 1 : les pourcentages de contributions a inertie supérieur a la moyenne sont :


- Distingué de pourcentage 23,7 %
- Vulgaire de 21%
- Nouveau riche de 10 %
- Cocasse de 19,6 %

b) Même question pour le nuage des marques envisagées.


On a pour l’axe 1 : les pourcentages de contributions a inertie supérieur a la moyenne sont :

- Corsaire de 33 ,2 %
- Zodiaque de 9 ,8 %
- Hotesse de 28,9 %
8. Mener une étude analogue pour la deuxième variable.
Pour les attribus :

On a pour l’axe 2 : les pourcentages de contributions a inertie supérieur a la moyenne sont :

- Vulgaire : 18 ,3%
- Pour une femme : 44,7%
Pour les marques :
On a pour l’axe 2 : les pourcentages de contributions a inertie supérieur a la moyenne sont :

- Corsaire : 10,7 %
- Directoire : 20,2%
- Escale : 25,2%
- Hotesse : 23%

9. Faire une synthèse des deux études précédentes en décrivant les résultats obtenus dans le
premier plan factoriel.

L’axe 1 : Oppose des attributs comme Distingué et Vulgaire, et des marques perçues
différemment, comme Corsaire et Hôtesse. Cet axe représente une opposition entre le
raffinement et le manque de sophistication.

L’axe 2 : Oppose des attributs liés au genre, comme Pour une femme et Vulgaire, avec des
marques comme Directoire et Escale. Cet axe semble refléter une dimension de genre
ou de perception sociale.

10. A votre avis, quelle est la marque qui a finalement été retenue par l'entreprise ?

Corsaire pourrait être celle qui a été retenue par l’entreprise, car :

Sa contribution élevée : Corsaire a la contribution la plus forte sur l'axe 1 (33,2 %)

Vous aimerez peut-être aussi