0% ont trouvé ce document utile (0 vote)
11 vues8 pages

ECUE distribution statisque à deux dimensions 4

Télécharger au format docx, pdf ou txt
Télécharger au format docx, pdf ou txt
Télécharger au format docx, pdf ou txt
Vous êtes sur la page 1/ 8

ECUE II- Distribution statistique à deux dimensions

Chapitre I : tableau de contingence à deux variables

Il croise simultanément deux variables. Ces deux variables peuvent être quantitatives, elles peuvent
qualitatives, l’une peut être quantitative et l’autre qualitative.

I- Tableau de contingence à deux variables quantitatives

Les individus sont décrits selon deux caractères quantitatifs notés X i et Yj.
Les différentes modalités de Xi sont notées X1 …………………….Xp.
Les différentes modalités de Yj sont notées Y1 ……………………..Yq.

Désignons par nij le nombre d’individus qui présentent à la fois les modalités (X = x i et Y = yj)

ni. est le nombre d’individus pour lesquels X = x i


n.j est le nombre d’individus pour lesquels Y = yj

Yj
Xi Y1 Y2 Y3 ………… Yj Yq ni.
X1 n11 n12 n13 ………… n1j n1q n1.

X2 n21 n22 n23 …………. n2j n2q n2.

X3 n31 n32 n33 n3j n3q n3.


. .
. .
. .
Xi ni1 n12 …………. nij niq ni.

Xp np1 np2 …………. npi npq np.


n. j n.1 n.2 n.3 …………. n.j n.q n..

Remarque
p q

∑ n i . ∑ n. j
n.. = N = i=1 = j=1 = taille de la population étudiée.

p q

∑ ∑ n ij
i j=1 = N = n..= n

q p

∑ ∑ n ij
j i=1 = N = n..
D’un tableau de contingence à deux variables on peut extraire :
Les fréquences.

Trois types de fréquences peuvent être calculés : les fréquences simples ; les fréquences
conditionnelles et les fréquences marginales.

- Les fréquences simples


nij
On rapporte l’effectif d’une case à l’effectif total : fij= N

- Les fréquences conditionnelles


On rapporte l’effectif d’une case au total de sa ligne, ou au total de sa colonne :
nij
La fréquence conditionnelle de X sachant Y= yj est fi/j=
n. j
nij
La fréquence conditionnelle de Y sachant X= xi est fj/i =
ni .

- Les fréquences marginales


On rapporte une case d’une marge à l’effectif total :
ni .
- la fréquence marginale de X est fi.= N
n. j
- la fréquence marginale de Y est f. j= N

les distributions marginales

Distribution marginale de X : elle associe aux Xi les effectifs marginaux ( ni.)

Moyenne et variance marginales de X

n
1
X ∑ ni.x i
=N i=1

n 2 2
1
∑ni.x i −X
V(X) = N i=1

Distribution marginale de Y : elle associe aux Yj les effectifs marginaux


( n.j )

Moyenne et variance marginale de Y


n
1
Y =N
∑n. j y j
j=1
n 2 2
1
∑ n . j y j −Y
V(Y) = N j=1

Distributions conditionnelles

La distribution conditionnelle de Y est définie comme étant la distribution de Y sachant que X = x i et


la distribution conditionnelle de X est définie comme étant la distribution de X sachant que Y = y j.

Si ces distributions conditionnelles ne sont pas identiques, c’est qu’il y a une dépendance entre les
deux variables. En revanche, Si ces distributions conditionnelles sont identiques, c’est qu’il y a une
indépendance entre les deux variables.

Moyenne et variance conditionnelle de X

Xj=

V(Xj) =

Moyenne et variance conditionnelle de Y

n
1
Yi = N
∑ n i .Y j
i =1

V(Yi) =

- Relation entre les moyennes marginales et les moyennes conditionnelles


n
1
∑n. j X j
X = N j=1
n
1
Y =N
∑ n i .Y i
i=1

La moyenne marginale est la moyenne des moyennes conditionnelles.


- Relation entre la variance marginale et les variances conditionnelles

V(X) = V j( X ) + V( X j )
V j( X ) : la moyenne des variances ou variance intra-population

V( X j ) : la variance des moyennes ou variance inter-population,

n
1
V j( X ) = N
∑ n. j V j ( X )
j=1

n 2
1
∑ n . j ( X j− X )
V( X j ) =N j=1

V(Y) = V i( Y ) + V( Y i )

n
1
V i( Y ) = N
∑ n i . V i (Y )
j=1

n 2
1
∑ n i . ( Y i −Y )
V( Y ) =N j=1

Indépendance des variables et la covariance


Si l’on veut étudier le lien entre deux variables quantitatives, on utilise la règle de l’indépendance, ou
on compare les distributions conditionnelles, ou on détermine la covariance.
.
Indépendances des variables

X et Y sont indépendants si et seulement si :

ƒij = ƒi . x ƒ.j

n ij n i. n. j
ƒij = N ƒi . = N ƒ.j = N
et j
Comparaison des distributions conditionnelles
Si l’on compare les distributions conditionnelles, et ces distributions conditionnelles ne sont pas
identiques, c’est qu’il y a une dépendance entre les deux variables. En revanche, Si elles sont
identiques, c’est qu’il y a une indépendance entre les deux variables.
Covariance de X et Y
La covariance de X et Y notée COV(X,Y)
Formule
Lorsque les couples d’observation sont tous distincts sans pondération

1
∑ ∑ ( x i−X )( y j−Y )
COV(X,Y) = N i j
1
N
∑ ∑ x i y j− X Y
=

Si les couples sont dans un tableau de contingence où les couples sont observés n ij fois

1
∑ ∑ n ij ( x i −X ) ( y j −Y )
COV(X, Y) = N i j

1
∑ ∑ n ij x i y j−X Y
COV(X, Y) = N i j
Propriétés
COV(X, Y) = 0 ↔ X et Y sont indépendantes. Elles n’ont aucun lien.

COV(X, Y) > 0 ↔ X et Y varient dans le même sens. Exemple : le revenu du ménage et les dépenses
de consommation.

COV(X, Y) < 0 ↔ X et Y varient en sens opposé. Exemple : le prix d’un bien et la quantité demandée
de ce bien.
Propriétés de la Covariance
COV(X, X) = V(X)
COV(X, Y) = COV (Y, X)
V(X+Y) = V(X) +V(Y) + 2 COV(X, Y)
V(X-Y) = V(X) + V(Y) – 2 COV(X, Y).

X et Y sont indépendants implique que la COV(X, Y) = 0, mais, la réciproque n’est pas toujours
vraie, COV(X, Y) = 0 n’implique pas toujours que les variables X et Y sont indépendantes.

Changement de variables
Soit un changement de variables suivant :
X i−X 0
Xi’ = a

Y j −Y 0
Yj’ = a '
Où X0 et Y0 sont les caractéristiques de tendance centrale et a et a’ représentent les amplitudes. X et
Y sont les variables.

COV(X, Y) = a a ' COV (X’, Y’)

Si l’on veut d’étudier la dépendance entre deux variables quantitatives, on a le choix entre les
différentes alternatives. On peut soit juxtaposer les distributions conditionnelles encore appelées
tableaux de profils ligne et colonne. On peut soit utiliser également la formule de l’indépendance entre
les variables. On peut également comparer la moyenne marginale et les moyennes conditionnelles. On
peut enfin calculer la covariance.
Chapitre II- Tableau de contingence à variables qualitatives

Les variables qualitatives peuvent être nominales ou ordinales. Avec les premières, on ne peut que
calculer les fréquences relatives. Quant aux secondes, on peut en plus interpréter les fréquences
relatives cumulées et les médianes.

Distributions conditionnelles des variables qualitatives

Si l’on veut d’étudier la dépendance entre deux variables qualitatives, on a le choix entre : la formule
d’indépendance, ou la confection des tableaux profil-ligne et profil-colonne ou le test de chi-deux. Au
niveau du deuxième choix, si ces distributions conditionnelles ne sont pas identiques, c’est qu’il y a
une dépendance entre les deux variables qualitatives. En revanche, Si elles sont identiques, c’est qu’il
y a une indépendance entre les deux variables.

Le tableau profil-ligne est obtenu lorsqu’on rapporte l’effectif de chaque case au total de sa ligne. En
revanche, le tableau profil-colonne est obtenu en rapportant l’effectif de sa case au total de sa colonne.
Indépendance de deux variables qualitatives
Deux variables sont indépendantes : X et Y sont indépendantes si et seulement si :

n ij n i. n. j
ƒij = ƒi . x ƒ.j où ƒij = N ƒi . = N ƒ.j = N
et j

Test d’indépendance de deux variables qualitatives le test de Khi-deux

Ce test s’effectue en plusieurs étapes : la définition du test d’hypothèse, la détermination du nombre de


degrés de liberté, le seuil du test, la lecture de la table de Khi-deux, la construction du tableau des
valeurs théoriques, le calcul du Khi-deux et la comparaison du Khi deux calculé au chi deux lu.
Définition du test d’hypothèse
H0 : indépendance entre les variables
Contre
H1 : dépendance entre les variables.
H0 et H1 sont respectivement l’hypothèse nulle et l’hypothèse alternative.
Détermination du nombre de degrés de liberté
En statistique le degré de liberté désigne le nombre de valeurs aléatoires qui ne peuvent être
déterminées ou fixés par une équation (notamment les équations des tests )

Le nombre de degrés de liberté est donné par la formule :


(nombre de colonnes -1) (nombre de lignes -1). Il s’agit du nombre de colonnes et de lignes du tableau
de contingence.
Le seuil du test
Il est égal soit à 1%, à 5% ou à 10%. Il s’agit de l’erreur de première espèce ( α ), il s’agit en fait de
rejeter l’hypothèse nulle à tort.
La lecture de la table de Khi-deux
La table se présente comme un tableau de double entrée. En colonne, on lit l’erreur de première espèce
(α ) et en ligne, le nombre de degrés de liberté(voir en annexe).

Construction du tableau des valeurs théoriques et calcul du Khi deux


Les valeurs théoriques sont déterminées par la formule :

i et j.

Ainsi on a :
Le Khi- deux calculé est donné par la formule :

Où O et T représentent respectivement les valeurs brutes du tableau initial et les valeurs


théoriques.
Ou encore
n n
( nij −n ' ij ) 2
χ 2=∑ ∑
c i=1 j =1 n' ij
Où nij représentent les effectifs du tableau initial et n’ij les effectifs théoriques.
La règle de décision

On rejette l’hypothèse nulle si la valeur du calculé est supérieure ou égal au lu. En


revanche, l’hypothèse nulle est acceptée si la valeur du calculé est inférieure au lu.

Si l’on veut d’étudier la dépendance entre deux variables dont l’une est quantitative et l’autre est
qualitative, on utilise la même méthode que lorsque les deux variables sont qualitatives .

L’analyse factorielle de correspondance (AFC) étudie également la liaison entre deux caractères
qualitatifs et détermine éventuellement les modalités des caractères qui interviennent dans la liaison
ainsi que la manière dont elles interviennent (attirance ou répulsion). L’Analyse Factorielle de
Correspondance est donc adaptée au traitement des données présentées sous la forme d’un tableau de
contingence.

Vous aimerez peut-être aussi