chapitreIV. ACP
chapitreIV. ACP
chapitreIV. ACP
et prise de décision
analyse factorielle
2021/2022
Enseignante: Wahiba Bali Kalboussi
2 INTRODUCTION
wahiba kalboussi
3
wahiba kalboussi
Exemples
wahiba kalboussi
6 Le but des méthodes factorielles
Décrire l’information, la résumer à l’aide d’un petit nombre de dimensions
et visualiser les données à partir des graphiques simples.
Descriptif-exploratoire: visualisation de données par graphiques simples.
Synthèse: résumé de grands tableaux individus x variables.
OBJECTIFS
COMPRENDRE LE FONDEMENT DE L’ ACP
SAVOIR QUEL EST LE PROCESSUS DE CALCUL ET SES LOGIQUES
POUVOIR EXPLIQUER UNE CARTE INDIVIDU ET UNE CARTE VARIABLE
wahiba kalboussi
I.Analyse en Composantes Principales
8 ACP
On mesure sur un groupe d’individus (de taille n), un très grand nombre de
variables X1, X2, .... Xk.
Ces variables sont la plupart du temps corrélées entre elles d'une part, et
elles expliquent à peu près également, les variations observées dans les
données d'autre part.
wahiba kalboussi
9 Utilité de l’ACP
wahiba kalboussi
Objectifs
•Les liaisons les plus connues sont celles linéaires: des liaisons
simples et très fréquentes et résument de nombreuses liaisons
1 n
s xy
n i =1
( xi − x)( yi − y )
rxy = =
s xs y 1 n 2
1 n
n i =1
( xi − x) i
n i =1
( y − y ) 2
Objectifs
décorrélées
13 Corrélées négativement − 1 rxy 1
Corrélées positivement
Objectifs
Exemple: la liaison entre les variables qualité et prix peut être illustrée par l’opposition
Entre deux groupes d’individus extrêmes.
Objectifs de l’ACP
•Descriptif – exploratoire : visualisation des données par des graphiques simples
wahiba kalboussi
Analytiquement
Y=X U ; Var y=
23
Maximiser Var y, sous la contrainte le vecteur propre U soit unitaire
𝑎1
𝑎2
a2 . . ak) 𝜎11
Var y= ( a1 𝜎12 et a²1+ a²2=1
𝜎21 𝜎22 𝑎𝑘
Valeur propre
a) Var (Yi) = i, i = 1 , 2, ..., k,
1 + 2
k
: le pourcentage de variation totale (k) expliqué par les 2
premières composantes.
etc.
wahiba kalboussi
Rappel mathématique
Seuls les éléments bien projetés peuvent être interprétés
Pour mener une ACP, il faut au préalable est en mesure de répondre à trois
questions :
1. Les données sont-elles factorisables ?
2. Combien de facteurs retenir ?
3. Comment interpréter les résultats ?
wahiba kalboussi
1.Les données sont-elles factorisables ?
30
wahiba kalboussi
1.Les données sont-elles factorisables ?
31 .
wahiba kalboussi
2.Combien de facteurs faut-il retenir ?
32
Règles empiriques :
wahiba kalboussi
34 3.La signification d’un axe
wahiba kalboussi
35 4.Interprétation des résultats
L’objectif: faire une partition de la population en groupes homogènes et
différents les uns des autres et on essaie de comprendre les sources de
leurs différences.
Deux graphiques sont générés
wahiba kalboussi
36 La carte des variables
Y2
.V5 Plus la variable est proche du
cercle de corrélations (-1;+1),
mieux elle est représentée.
Une variable
proche du centre .V4 .V6 .V1
est mal représentée
dans cet espace. . V2 Y1
Un point est dit bien représenté sur un axe s’il est proche de sa projection sur
l’axe. Y2
ind4
Forte valeur sur V5
Faible valeur sur V3
ind2
ind6 ind8 ind1
Y1
ind3 ind5
Forte valeur sur V4 Individus . Faible valeur sur V4
Faible valeur sur V1 etV2
moyens Forte valeur sur V1 etV2
Pour minimiser l’effet des erreurs de mesure dans le cas d’un échantillon de
taille assez importante, faire un Test-Retest, c'est-à-dire :
découper l’échantillon et faire deux fois l’analyse
garder la structure commune observée dans les deux analyses
wahiba kalboussi