TP Acp2
TP Acp2
TP Acp2
> Moy.tab1=sapply(tab1,mean)
> Moy.tab1
> Sd.tab1=sapply(tab1,sd)
> Sd.tab1
Commentaire : Les variables PAO, VIO, VIO,... sont trés disperssées tandis que les variables
POT, RAI et PLP ont une disperssion moyenne et les variables PAA, LEC sont proches de
la moyenne. On peut conclure q’il y ait une dispersion importante du nuage.
3. Calculer la matrice des corrélations
1
> cor.tab1=round(cor(tab1),2)
> cor.tab1
Commentaire : La plus part des variables sont trés corrélées entre elles.
4. Effectuer l’ACP
> library(FactoMineR)
> pca=PCA(tab1)
> pca
name description
1 "$eig" "eigenvalues"
2 "$var" "results for the variables"
3 "$var$coord" "coord. for the variables"
4 "$var$cor" "correlations variables - dimensions"
5 "$var$cos2" "cos2 for the variables"
6 "$var$contrib" "contributions of the variables"
7 "$ind" "results for the individuals"
8 "$ind$coord" "coord. for the individuals"
9 "$ind$cos2" "cos2 for the individuals"
10 "$ind$contrib" "contributions of the individuals"
11 "$call" "summary statistics"
12 "$call$centre" "mean of the variables"
13 "$call$ecart.type" "standard error of the variables"
14 "$call$row.w" "weights for the individuals"
15 "$call$col.w" "weights for the variables"
2
> eig.tab1= pca$eig
> eig.tab1
Commentaire :
comp1,...comp7 sont les composantes principales de l’ACP, les valeurs de la 1ère colonne
sont les valeurs propres associées aux vecteurs propres Comp1,...,comp7. La composante
comp8 a été ingorée par l’analyse car la valeur propre associée est nulle. Chaque valeur
propre λ étant la variance de la sème composante principale.
s
La 2ème colonne représente le pourcentage de la variance c-à-d pour chaque composante s
P
son pourcentage de variance est (λs / i λi ) × 100.
6. > inertie=eig.tab1[,2]
> inertie
>
3
2 Rappel et interprétation
2.1 Coordonnées, contributions et qualités des individus
Les tableaux suivants résument les coordonnées, contributions et qualités des individus de
l’exemple précédent
Table 1: Coord des inds Table 2: QLT des inds Table 3: Contrib des inds
Rappel :
Coordonnées des individus :
Les coordonnés des individus dans le repère des composantes principales sont données par la table
1. La coordonnée de l’individu i sur la composante s est Fs (i), par exemple F1 (AGRI) = −3.37
Contribution des inds :
On rappelle que la contribution d’un individu d’un individu i par la composante s est
Fs (i)2
Contribs (i) =
pλs
ou p est le nombre d’individus. Plus la contribution est grande, plus la reprśentation est meilleure.
La table 3 donne les contributions des différents individus par les deux composantes, par exemple
Fs (i)2
QLTs (i) = P 2
= cos (θ)2
t F t (i)
ou θ est l’angle entre la droite (Oi) est l’axe s. Par exemple QLT2 (AGRI) = 0.00. Plus la qualité
est proche de 1, l’individu est proche de l’axe s.
Interprétation
On relève, pour chaque axe, quels sont les individus qui ont la plus forte contribution à la forma-
tion de l’axe. Par exemple, on retient (pour l’analyse) les individus dont la contribution relative
100
est supérieure à p %. On note également si cette contribution intervient dans la partie positive
4
Contribution of individuals to Dim−1 Contribution of individuals to Dim−2
40
30 60
Contributions (%)
Contributions (%)
20 40
10 20
0 0
P
AG
IN
VR
PL
AC
AC
PL
AG
VR
IN
R
R
O
O
SU
SU
AG
PR
AG
PR
EM
EM
IN
IN
M
M
U
U
SA
SA
C
C
O
O
C
Figure 1 Figure 2
ou dans la partie négative de l’axe. Soit on classe par un ordre croissant ou dćroissant ces con-
tributions ou on les représente par un histogramme. Les histogrammes des contributions par la
composante 1 et la composante 2 de l’exemple prćédent sont donnés par les figures 1 et 2.
On résume dans le tableau suivant Les individus qui contribuent à la formation de l’axe 1
(voir figure 1) dont leurs qualités de représentation (cos2 (θ) est proche de 1 en précisant le signe
donnant le sens de la contribution (voir table 1).
- +
SAAG CSUP
AGRI
De même les individus qui contribuent à la formation de l’axe 2 ( voir figure 2) dont leurs qualités
de représentation par rapport à cette axe (cos2 (θ) est proche de 1, sont donnés par
- +
INAC
Les tableaux suivants résument les coordonnées, contributions et qualité des variables de
l’exemple précédent
Rappel :
Coordonnées des variables :
5
Dim.1 Dim.2
Dim.1 Dim.2 Dim.1 Dim.2
PAO 15.31 1.90
PAO -0.97 0.13 PAO 0.95 0.02
PAA 12.16 19.41
PAA 0.87 0.41 PAA 0.76 0.17
VIO 12.19 4.07
VIO -0.87 0.19 VIO 0.76 0.04
VIA 13.96 6.78
VIA 0.93 0.24 VIA 0.87 0.06
POT 6.07 55.33
POT -0.61 0.70 POT 0.38 0.49
LEC 13.31 1.64
LEC -0.91 0.12 LEC 0.83 0.01
RAI 13.92 10.63
RAI 0.93 0.31 RAI 0.86 0.09
PLP 13.08 0.25
PLP 0.90 -0.05 PLP 0.81 0.00
Table 8: Contrib des vari-
Table 6: Coord des variables Table 7: QLT des variables
ables
Les coordonnées des variables (centrées réduites initiales, X̃j ) dans le repère des composantes
principales sont les corrélations entre ces variables et les facteurs principales
corr(X̃j , Fs )
Elles sont données par la table 6, par exemple la coordonnée de la variable ”PAA” sur la com-
posante 1 est corr(X̃j , Fs ) = 0.87,
Contribution des variables :
On rappelle que la contribution d’une variable X̃j par la composante s est
(corr(X̃j , Fs ))2
Contribs (j) =
λs
Plus la contribution est grande, plus la représentation est meilleure.
La table 8 donne les contributions des différentes variables par les deux composantes, par exemple
(corr(X̃j , Fs ))2
QLTs (j) = P = (corr(X̃j , Fs ))2
(corr( X̃ , F ))2
k k s
2
P
car k (corr(X̃k , Fs )) = 1. Par exemple QLT2 (P AA) = 0.17. Plus la qualité est proche de 1, la
variable est proche de l’axe s.
On résume dans le tableau suivant Les variables qui contribuent à la formation de l’axe 1
dont leurs qualités de reprśentation (voir table 7) est proche de 1 et leurs contributions sont assez
grandez (voir table 8) en précisant le signe donnant le sens de la contribution (voir table 6).
6
- +
PAO RAI
LEC VIA
VIO PLP
(PAA)
De même, les variables qui contribuent à la formation de l’axe 2, sont données par
- +
POT
PAA
2.3 Synthèse
Suite aux interprétations données dans les deux paragraphes précédents, on conclut
– d’après la table 9, la composante principale ”comp 1” ou ”dim 1” résume les variables PAO
(pain ordinaire), LEC (des légumes secs) VIO (vin ordinaire), RAI (raisin) et PLP (plats
préparés) (voir figure 3). D’après la table 4, elle oppose les individus (SAAG et AGRI) qui
consomment PAO, VIO et LEC aux individus (CSUP) qui consomment RAI et PLP. La
première composante principale mesure donc la répartition entre aliments ordinaires (PAO,
LEC et VIO) et les aliments (RAI, PLP et VIA) (voir figure 4).
– d’après la table 10, La deuxième composante principale résume les variables POT (pomme
de terre) et éventuellement PAA (Autre pain) (voir figure 3). Cette axe mesure la consom-
mation de pommes de terre. D’après la table 5, cette axe est caractérisés par les individus
inactif (INAC) (voir figure 4).
Variables − PCA Individuals − PCA
INAC
1.0 ●
2
POT
0.5
PAA
RAI
VIA
VIO coord
PAO
LEC 1
Dim2 (11%)
Dim2 (11%)
15
0.0 PLP
10
CSUP
●
PRIN
●
0
−0.5 OUVR
AGRI ●
●
SAAG
●
EMPL CMOY
●
−1.0 ●
−1
−1.0 −0.5 0.0 0.5 1.0 −2 0 2 4
Dim1 (77.6%) Dim1 (77.6%)