Correction ADD
Correction ADD
Correction ADD
Partie 1
1. Le nuage des individus doit être représenté dans R4 car on observe 4 variables sur chacun des étudiants.
2. Le nuage des variables doit être représenté dans R10 car pour chaque variable, on observe 10 notes.
3. On a le tableau suivant :
9.90
5. La matrice des écarts-types est
2.2113 0 0 0
0 1.7782 0 0
Ds =
0 0 2.5707 0
0 0 0 1.7659
6. Le rôle du barycentre et de la matrice des écart-types est de centrer et réduire le tableau de données initial.
7. Dans le cadre de l’ACP normée, la matrice à diagonaliser est Z t Dn ZMp = n1 Z t Z. Par calcul matriciel littéral,
on montre aisément que cette matrice n’est autre que la matrice des corrélations.
8. D’après cette matrice des corrélations, on observe que la variable “Stats” présente une quasi absence de corrélation
linéaire avec les variables “Info” et “Basesm” et une faible corrélation négative avec la variable “Anglai”. La
variable “Info” est faiblement corrélée positivement avec la variable “Anglai” et corrélée négativement avec la
variable “Basesm”. Enfin, les variables “Basesm” et “Anglai” présentent une quasi absence de corrélation.
9. La dernière valeur propre est facile à calculer car d’après le cours, on sait que la somme des valeurs propres est
égale à l’inertie totale du nuage des individus laquelle est égale (dans le cadre de l’ACP normée) au nombre de
variables actives. Finalement, on obtient λ4 = 0.161.
10. L’inertie d’un axe est égale à la valeur propre associée. Par conséquent, on obtient
Ψα = 0 et V ar(Ψα ) = λα
Elles sont facilement vérifiées.
17. Les individus qui contribuent fortement à la formation d’un axe sont les individus qui présentent de fortes
coordonnées positives ou négatives sur l’axe. Ils sont donc facilement observables sur un graphique car ce sont
ceux qui sont les plus éloignés du barycentre. Cette réponse se justifie directement à partir de la formule des
contributions.
18. La formule permettant de compléter le tableau est
1 Ψ2α (i)
Cri (α) =
n λα
On obtient
Si l’on retient les individus qui contribuent significativement à la formation d’un axe, il convient de retenir les
individus pour lesquels la contribution est supérieure à n1 , c’est-à-dire 10%. Ainsi, pour l’axe 1, les individus
2,4 et 5 contribuent significativement à la formation de cet axe. Les individus 2 et 5 présentent une coordonnée
négative tandis que l’individu 4 présente une coordonnée positive. Pour l’axe 2, ce sont les individus 1, 6 et 7
qui contribuent de manière significative. 1 et 7 présentent une coordonnée négative tandis que 6 présente une
coordonnée positive. Effectivement, on retrouve bien les individus énumérés dans la précédente question.
19. Pour calculer les qualités de représentation, il convient de faire usage de la formule
Ψ2α (i)
Quali (α) =
~ i k2
kGE
On obtient alors
2
individus Quali (1)(%) Quali (2)(%) Quali (1 × 2)(%)
1 13.59 77.80 91.39
2 45.81 20.84 66.65
3 49.81 13.87 63.68
4 86.83 6.84 93.67
5 92.11 7.47 99.58
6 22.05 69.29 91.34
7 0.20 99.72 99.92
8 4.21 1.82 6.03
9 44.03 52.31 96.34
10 0.00 6.96 6.96
20. Les individus 2 et 3 sont bien représentés dans le plan factoriel principal, tandis que les individus 1, 4, 5, 6, 7 et
9 sont très bien représentés dans ce plan.
21. Pour calculer les coordonnées des variables, il suffit de faire usage de la relation de transition suivante :
p
ϕα = λα uα .
On obtient alors :
−0.0738 −0.8600
−0.9527 −0.0808
ϕ1 =
0.8859
et ϕ2 =
0.2001
−0.4174 0.7612
22. La qualité de représentation des variables dans le plan factoriel principal est d’autant meilleure que les variables
sont proches du cercle des corrélations. Dans le cas présent, toutes les variables sont bien ou très bien représentées.
23. La corrélation entre une variable et un axe ou entre deux variables se mesure par l’angle direct qui existe entre
eux. Cette mesure est fiable à partir du moment où les variables présentent une bonne qualité de représentation.
24. Les variables “Info” et “Basesm” sont fortement corrélées avec l’axe 1. La variable “Info” est corrélée négativement
(-95%) tandis que la variable “Basesm” est corrélée positivement (88%). Les deux autres variables sont très peu
ou pas du tout corrélées avec cet axe (-7% et -41%). Pour l’axe 2, c’est l’inverse, c’est-à-dire que les variables
“Stats” et “Anglai” sont fortement corrélées avec cet axe tandis que les autres variables sont très peu ou pas
du tout corrélées avec cet axe. On note que la variable “Anglai” est corrélée positivement (76%) tandis que la
variable “Stats” est corrélée négativement (-86%).
25. Les deux axes sont des axes d’opposition. L’axe 1 est un axe d’opposition entre d’un côté les étudiants plutôt
bons en informatique (ouest) et de l’autre les étudiants plutôt bons en mathématiques (est). L’axe 2 est lui un
axe d’opposition entre d’un côté les étudiants plutôt bons en statistique (sud) et de l’autre les étudiants plutôt
bons en anglais (nord).
26. En faisant référence à la qualité de représentation des individus dans le premier plan factoriel, il convient
“d’éliminer” les étudiants 8 et 10. Ainsi, les étudiants 5 et 2 se distinguent de la moyenne par des notes parti-
culièrement élevées pour les variables “Info” et “Anglai”, plus faibles pour les deux autres variables. L’étudiant
4 se distingue de la moyenne par des notes particulièrement élevées pour les variables “Basesm” et “Stats” et
faibles pour les autres variables. De même, les étudiants 3 et 6 se distinguent de la moyenne par de bonnes
notes en “Basesm” et “Anglai” et de mauvaises notes pour les autres matières. Enfin, les étudiants 1, 7 et 9 se
distinguent de la moyenne par une bonne note en “Stats” et une mauvaise en “Anglai”.
3
Partie 2
4
Nuage des individus
6
1
Axe discriminant
4
1
1
2
G1 1
1
A 1
X2
0
−2 2
2 2
G2
2
−4
Droite discriminante
2
−6
−6 −4 −2 0 2 4 6
X1
(b) La matrice à diagonaliser est alors d’après les résultats d’AFG la matrice C t D2 CW −1 . Le calcul matriciel
amène à la matrice suivante :
t 6.8428 −7.4835
C D2 CW −1
=
−6.9345 7.5838
(c) Il est facile de voir que les valeurs propres sont λ1 = 14.4266 et λ2 = 0.
(d) Seule la première valeur propre est non nulle. Un vecteur propre unitaire associé est u = (−0.7024; 0.7118).
On en déduit l’équation de la droite associée à ce vecteur : X2 = −1.0134X1.
(e) Un vecteur directeur de l’axe discriminant est donc w = (−0.7859, 0.8594). L’équation de droite est alors
X2 = −1.0935X1.
8. On a
5
f (x∗ ) := d2Mp (x∗ , G∗1 ) − d2Mp (x∗ ; G∗2 )
= < x∗ ; G∗1 >Mp − < x∗ ; G∗2 >Mp
= (x∗ )t W −1 G∗1 − (x∗ )t W −1 G∗2
= (x∗ )t W −1 (G∗1 − G∗2 ).
−5.5571x∗1 + 6.0771x∗2 = 0
10. Dans le repère de centre G, les étudiants A et B ont pour coordonnées : A = (−4.0909, 0.4546) et B =
(−4.0909, −6.5454). Selon la règle géométrique d’affectation, on déduit que si f (x∗ ) > 0 alors l’individu est
associé au groupe 2 ; inversement, si f (x∗ ) < 0 alors l’individu est associé au groupe 1. Dans le cas présent, on a