Présentation - ACP 1

Bienvenue
Analyse factorielle en composantes principales

Introduction
Les analyses factorielles sont des méthodes de

factorisation analysant les relations entre les
variables afin de mettre en évidence leur proximité
ou leur indépendance.
Double objectif :
• Résumer et condenser l’information initiale
• Organiser et structurer les liens qui existent entre
groupes de variables
Niveau conceptuel des données
Item 1 (X1)
Item 2 (X2)
… Variable Hypothèse 1
OUTPUT Y
Item i (X3) latente X
…
Item k (Xk)
Exemple de variable latente
Questionnaire
Variable latente : INTENTION D'AGIR Echelle de Likert

Item Libellé 1 2 3 4 5
Item 1 Je veux bien prendre des mesures (changer de comportement et de mode de vie)
x
pour réduire mon impact individuel sur le changement climatique
Item 2 Je veux bien changer mes habitudes de conduite en voiture pour réduire ma
x
contribution au changement climatique
Item 3 Je veux bien sacrifier un certain niveau de confort personnel (par exemple - régler
x
le thermostat à un niveau inférieur) pour aider à atténuer le changement climatique
Item 4 Je veux bien soutenir les mesures de politique liées à la réglementation sur le
changement climatique
Item 5 Je veux bien accepter les stratégies de changement climatique x
Item 6 Je veux bien mettre plus de temps et d'effort physique en faveur de ce qui pourrait
x
atténuer le changement climatique
Item 7 Je veux bien sacrifier certaines activités de loisirs pour réduire mon impact sur le
x
changement climatique
Exemple de variable latente
Données
Principe de l’ACP
n variables
2 variables 3 variables
?
Conditions d’application de l’ACP
• Nombre de variables : >= 5
• Type de variable :
« au moins échelle d‘intervalle ».
• Nombre d’observations :
> 10*nb. de variables
• « Singularité »
(pas de variables prédites par d’autres)
Les étapes de l’ACP
• Vérifier si les conditions d’application sont respectées

• Extraction des facteurs (diagonalisation/saturation)
• La rotation des facteurs
• La définition des facteurs
• L’interprétation des résultats du point de vue
décisionnel
Exemple d’application
Sept téléphones portables nommés T1, T2, …, T7 ont été comparés en

Téléphones PRIX VOLUME POIDS
observant les caractéristiques suivantes : le prix - PRIX (€), leAUTOV
volume - AUTOC
VOLUME (mmT1 3), le poids 159
- POIDS (g), l’autonomie92en veille - 450
85050 AUTOV 4,0
(heures) et l’autonomie
T2 en 299
communication
54277 - AUTOC 91(heures). Les
348 noms en3,5
italique représentent
T3 les libellés
399 des items.
94529 115 288 3,5
T4 89 80496 91 300 3,0
T5 399 98980 125 300 3,0
T6 399 80370 115 220 3,0
T7 449 75871 115 204 2,8
Conditions d’application de l’ACP
• Taille de l’échantillon : 7
• Type de variable : métrique
• Transformation en variables centrées réduites
Téléphone zPRIX zVOLUME zPOIDS zAUTOV zAUTOC

T1 -1,11554 0,25383 -0,98997 1,80724 1,75325
T2 -0,10329 -1,86732 -1,05927 0,56650 0,57318
T3 0,61974 0,90720 0,60388 -0,16335 0,57318
T4 -1,62166 -0,06008 -1,05927 -0,01738 -0,60689
T5 0,61974 1,21400 1,29686 -0,01738 -0,60689
T6 0,61974 -0,06876 0,60388 -0,99051 -0,60689
T7 0,98126 -0,37887 0,60388 -1,18514 -1,07892
Validation de la cohérence de
l’ensemble des variables
• Choix des variables
• Pertinence (S’assurer que les variables cohérentes les unes avec les autres)
• Exhaustivité (S’assurer que toutes les informations nécessaires pour l’étude du problème ont bien été
introduites)
• Matrice des corrélations /significativité
• « Singularité » des variables (liées mais non prédites)
• Test de sphéricité de Bartlett

Le principe du test est simple : l’hypothèse H0 statue la matrice de corrélation = matrice d’identité (c'est-à-
dire que toutes les corrélations sont nulles).
• Indice KMO (>0,5)

l’indice permet de vérifier si les liens spécifiques entre paires de variables (les corrélations partielles) sont
significativement faibles en mesurant la différence d’amplitude entre les coefficients de corrélation et les
corrélations partielles.
Méthodes d’extraction des facteurs
• Composantes principales (AFCP)

• Moindre carrés non pondérés
• Moindre carrés généralisés
• Maximum de vraisemblance
• Factorisation en axes principaux
• Alpha-maximisation
• Factorisation en projections
Matrice des composantes (facteurs)
Matrices des composantes ou (corrélations Facteurs – Variables ou coefficients factoriels)

Facteur1 Facteur 2 Facteur 3 Facteur 4 Facteur 5
zPOIDS 0,917 0,366 0,123 0,087 -0,040
zAUTOV -0,885 0,394 0,126 0,212 0,009
zPRIX 0,836 0,032 0,546 0,013 0,031
zAUTOC -0,786 0,423 0,424 -0,152 -0,015
zVOLUME 0,369 0,864 -0,338 -0,060 0,019
Les carrés des coefficients factoriels (variance « expliquée »)

Facteur 1 Facteur 2 Facteur 3 Facteur 4 Facteur 5 Total
zPOIDS 0,842 0,134 0,015 0,008 0,002 1,000
zAUTOV 0,784 0,155 0,016 0,045 0,000 1,000
zPRIX 0,699 0,001 0,298 0,000 0,001 1,000
zAUTOC 0,618 0,179 0,180 0,023 0,000 1,000
zVOLUME 0,136 0,746 0,114 0,004 0,000 1,000
Valeurs propres : 3,079 1,215 0,624 0,080 0,003 5,000
Variance expl. % : 61,57 24,30 12,48 1,59 0,06 100,00
Le nombre de facteurs à retenir
3,5
2,5
Valeurs propores
1,5
0,5
-0,5
1 2 3 4 5
Facteurs
La qualité de représentation
(communautés)
Matrice des saturations = facteurs significatifs de la matrices des composantes

Variables Facteur 1 Facteur 2
zPOIDS 0,917 0,366
zAUTOV - 0,885 0,394
zPRIX 0,836 0,032
zAUTOC - 0,786 0,423
zVOLUME 0,369 0,864
La qualité de représentation (= somme des carrés des coefficients factoriels ci-dessus)

Variables Initial (5 facteurs) Extraction (2 facteurs)
zPOIDS 1,000 0,976
zAUTOV 1,000 0,939
zPRIX 1,000 0,700
zAUTOC 1,000 0,797
zVOLUME 1,000 0,882
Total 4,294
Significativité des saturations
Taille d’échantillon Saturations

350 0,30
250 0,35
200 0,40
150 0,45
120 0,50
100 0,55
85 0,60
70 0,65
60 0,70
50 0,75
Rotation des facteurs
F2
F2
X3
F1
X1
X2
F1
X4
X5
Décider d’effectuer une rotation
Les saturations après la rotation « varimax »
Facteurs
Variables
1 2
zAUTOV 0,968 -0,047
zAUTOC 0,892 0,024
zPRIX -0,733 0,404
zVOLUME 0,059 0,937
zPOIDS -0,655 0,740
Les carrés des coefficients factoriels (variance « expliquée »)

Facteurs
Variables
1 2
zAUTOV 0,937 0,002
zAUTOC 0,796 0,001
zPRIX 0,537 0,163
zVOLUME 0,003 0,878
zPOIDS 0,429 0,548
 Contribution² : 2,702 1,592
Variance totale « expliquée » (en %) 54,050 31,831
Interpréter les facteurs
• Affecter les variables aux facteurs

• Dénommer les facteurs
• Identifier et interpréter les variables « ambivalentes »
Affectation d’une variable à un
facteur
Facteurs
Variables
1 2
zAUTOV 0,937 0,002
zAUTOC 0,796 0,001
zPRIX 0,537 0,163
zVOLUME 0,003 0,878
zPOIDS 0,429 0,548
Contribution : 2,702 1,592

Dénommer les facteurs
Facteurs
Variables
1 2
zAUTOV 0,937 0,002
zAUTOC 0,796 0,001
zPRIX 0,537 0,163
zVOLUME 0,003 0,878
zPOIDS 0,429 0,548

Variables « ambivalentes »
Facteurs
Variables
1 2
zAUTOV 0,937 0,002
zAUTOC 0,796 0,001
zPRIX 0,537 0,163
zVOLUME 0,003 0,878
zPOIDS 0,429 0,548

Eviter les interprétations abusives
Les variables introduites dans l’analyse doivent être justifiées en

regard de la problématique traitée et s’appuyer éventuellement sur
des concepts théoriques ou, sur des hypothèses liant le choix des
variables au problème à étudier.
Les scores factoriels
• Les méthodes de calcul

• Simples
• Somme des valeurs initiales
• Somme des valeurs initiales au dessus d’un seuil
(cut-off value)
• Somme pondérée des coefficients factoriels
• Elaborées
• Méthode de Regression
• Facteurs de Bartlett
• Méthode d'Anderson-Rubin
… et au niveau conceptuel
Item 1
Item 2
Facteur 1
Item 4
Item 6
OUTPUT
Item 3
Facteur
Item 2
2
Item 7
Les cartes perceptuelles
Projection des variables dans l’espace des facteurs après rotation

Les cartes perceptuelles
Nuage de points des téléphones dans l'espace des scores factoriels

Présentation - ACP 1

Transféré par

Droits d'auteur :

Formats disponibles

Présentation - ACP 1

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Présentation - ACP 1

Transféré par

Droits d'auteur :

Formats disponibles

Bienvenue

Analyse factorielle en composantes principales

Les analyses factorielles sont des méthodes de

Variable latente : INTENTION D'AGIR Echelle de Likert

• Nombre de variables : >= 5

• Vérifier si les conditions d’application sont respectées

Sept téléphones portables nommés T1, T2, …, T7 ont été comparés en

Téléphone zPRIX zVOLUME zPOIDS zAUTOV zAUTOC

• Matrice des corrélations /significativité

• « Singularité » des variables (liées mais non prédites)

• Test de sphéricité de Bartlett

• Indice KMO (>0,5)

• Composantes principales (AFCP)

Matrices des composantes ou (corrélations Facteurs – Variables ou coefficients factoriels)

Les carrés des coefficients factoriels (variance « expliquée »)

Matrice des saturations = facteurs significatifs de la matrices des composantes

La qualité de représentation (= somme des carrés des coefficients factoriels ci-dessus)

Taille d’échantillon Saturations

Les carrés des coefficients factoriels (variance « expliquée »)

• Affecter les variables aux facteurs

zAUTOV 0,937 0,002

zAUTOC 0,796 0,001

zPRIX 0,537 0,163

zVOLUME 0,003 0,878

zPOIDS 0,429 0,548

Contribution : 2,702 1,592

Variance totale « expliquée » (en %) 54,050 31,831

zAUTOV 0,937 0,002

zAUTOC 0,796 0,001

zPRIX 0,537 0,163

zVOLUME 0,003 0,878

zPOIDS 0,429 0,548

Contribution : 2,702 1,592

Variance totale « expliquée » (en %) 54,050 31,831

zAUTOV 0,937 0,002

zAUTOC 0,796 0,001

zPRIX 0,537 0,163

zVOLUME 0,003 0,878

zPOIDS 0,429 0,548

Contribution : 2,702 1,592

Variance totale « expliquée » (en %) 54,050 31,831

Les variables introduites dans l’analyse doivent être justifiées en

• Les méthodes de calcul

Projection des variables dans l’espace des facteurs après rotation

Nuage de points des téléphones dans l'espace des scores factoriels

Vous aimerez peut-être aussi