ECUE distribution statisque à deux dimensions 4
ECUE distribution statisque à deux dimensions 4
ECUE distribution statisque à deux dimensions 4
Il croise simultanément deux variables. Ces deux variables peuvent être quantitatives, elles peuvent
qualitatives, l’une peut être quantitative et l’autre qualitative.
Les individus sont décrits selon deux caractères quantitatifs notés X i et Yj.
Les différentes modalités de Xi sont notées X1 …………………….Xp.
Les différentes modalités de Yj sont notées Y1 ……………………..Yq.
Désignons par nij le nombre d’individus qui présentent à la fois les modalités (X = x i et Y = yj)
Yj
Xi Y1 Y2 Y3 ………… Yj Yq ni.
X1 n11 n12 n13 ………… n1j n1q n1.
Remarque
p q
∑ n i . ∑ n. j
n.. = N = i=1 = j=1 = taille de la population étudiée.
p q
∑ ∑ n ij
i j=1 = N = n..= n
q p
∑ ∑ n ij
j i=1 = N = n..
D’un tableau de contingence à deux variables on peut extraire :
Les fréquences.
Trois types de fréquences peuvent être calculés : les fréquences simples ; les fréquences
conditionnelles et les fréquences marginales.
n
1
X ∑ ni.x i
=N i=1
n 2 2
1
∑ni.x i −X
V(X) = N i=1
Distributions conditionnelles
Si ces distributions conditionnelles ne sont pas identiques, c’est qu’il y a une dépendance entre les
deux variables. En revanche, Si ces distributions conditionnelles sont identiques, c’est qu’il y a une
indépendance entre les deux variables.
Xj=
V(Xj) =
n
1
Yi = N
∑ n i .Y j
i =1
V(Yi) =
V(X) = V j( X ) + V( X j )
V j( X ) : la moyenne des variances ou variance intra-population
n
1
V j( X ) = N
∑ n. j V j ( X )
j=1
n 2
1
∑ n . j ( X j− X )
V( X j ) =N j=1
V(Y) = V i( Y ) + V( Y i )
n
1
V i( Y ) = N
∑ n i . V i (Y )
j=1
n 2
1
∑ n i . ( Y i −Y )
V( Y ) =N j=1
ƒij = ƒi . x ƒ.j
n ij n i. n. j
ƒij = N ƒi . = N ƒ.j = N
et j
Comparaison des distributions conditionnelles
Si l’on compare les distributions conditionnelles, et ces distributions conditionnelles ne sont pas
identiques, c’est qu’il y a une dépendance entre les deux variables. En revanche, Si elles sont
identiques, c’est qu’il y a une indépendance entre les deux variables.
Covariance de X et Y
La covariance de X et Y notée COV(X,Y)
Formule
Lorsque les couples d’observation sont tous distincts sans pondération
1
∑ ∑ ( x i−X )( y j−Y )
COV(X,Y) = N i j
1
N
∑ ∑ x i y j− X Y
=
Si les couples sont dans un tableau de contingence où les couples sont observés n ij fois
1
∑ ∑ n ij ( x i −X ) ( y j −Y )
COV(X, Y) = N i j
1
∑ ∑ n ij x i y j−X Y
COV(X, Y) = N i j
Propriétés
COV(X, Y) = 0 ↔ X et Y sont indépendantes. Elles n’ont aucun lien.
COV(X, Y) > 0 ↔ X et Y varient dans le même sens. Exemple : le revenu du ménage et les dépenses
de consommation.
COV(X, Y) < 0 ↔ X et Y varient en sens opposé. Exemple : le prix d’un bien et la quantité demandée
de ce bien.
Propriétés de la Covariance
COV(X, X) = V(X)
COV(X, Y) = COV (Y, X)
V(X+Y) = V(X) +V(Y) + 2 COV(X, Y)
V(X-Y) = V(X) + V(Y) – 2 COV(X, Y).
X et Y sont indépendants implique que la COV(X, Y) = 0, mais, la réciproque n’est pas toujours
vraie, COV(X, Y) = 0 n’implique pas toujours que les variables X et Y sont indépendantes.
Changement de variables
Soit un changement de variables suivant :
X i−X 0
Xi’ = a
Y j −Y 0
Yj’ = a '
Où X0 et Y0 sont les caractéristiques de tendance centrale et a et a’ représentent les amplitudes. X et
Y sont les variables.
Si l’on veut d’étudier la dépendance entre deux variables quantitatives, on a le choix entre les
différentes alternatives. On peut soit juxtaposer les distributions conditionnelles encore appelées
tableaux de profils ligne et colonne. On peut soit utiliser également la formule de l’indépendance entre
les variables. On peut également comparer la moyenne marginale et les moyennes conditionnelles. On
peut enfin calculer la covariance.
Chapitre II- Tableau de contingence à variables qualitatives
Les variables qualitatives peuvent être nominales ou ordinales. Avec les premières, on ne peut que
calculer les fréquences relatives. Quant aux secondes, on peut en plus interpréter les fréquences
relatives cumulées et les médianes.
Si l’on veut d’étudier la dépendance entre deux variables qualitatives, on a le choix entre : la formule
d’indépendance, ou la confection des tableaux profil-ligne et profil-colonne ou le test de chi-deux. Au
niveau du deuxième choix, si ces distributions conditionnelles ne sont pas identiques, c’est qu’il y a
une dépendance entre les deux variables qualitatives. En revanche, Si elles sont identiques, c’est qu’il
y a une indépendance entre les deux variables.
Le tableau profil-ligne est obtenu lorsqu’on rapporte l’effectif de chaque case au total de sa ligne. En
revanche, le tableau profil-colonne est obtenu en rapportant l’effectif de sa case au total de sa colonne.
Indépendance de deux variables qualitatives
Deux variables sont indépendantes : X et Y sont indépendantes si et seulement si :
n ij n i. n. j
ƒij = ƒi . x ƒ.j où ƒij = N ƒi . = N ƒ.j = N
et j
i et j.
Ainsi on a :
Le Khi- deux calculé est donné par la formule :
Si l’on veut d’étudier la dépendance entre deux variables dont l’une est quantitative et l’autre est
qualitative, on utilise la même méthode que lorsque les deux variables sont qualitatives .
L’analyse factorielle de correspondance (AFC) étudie également la liaison entre deux caractères
qualitatifs et détermine éventuellement les modalités des caractères qui interviennent dans la liaison
ainsi que la manière dont elles interviennent (attirance ou répulsion). L’Analyse Factorielle de
Correspondance est donc adaptée au traitement des données présentées sous la forme d’un tableau de
contingence.