Série Statistique Double

STATISTIQUE DESCRIPTIVE
BIVARIEE
Dans beaucoup de recherches statistiques, on ne s’intéresse pas qu’à un seul caractère mais
à plusieurs en même temps. Quand on étudie deux caractères X et Y sur une population
donnée, c’est en général parce qu’on cherche à savoir s’il existe un lien entre eux et qu’elle
est l’intensité du lien.
Exemple de relations possibles entre les variables suivantes : taille et âge ; diabète et poids,
taux de cholestérol et régime alimentaire, niche écologique et population, ensoleillement
et croissance végétale, toxine et réaction métabolique, survie et pollution, e¤ets et doses
...Les caractères étudiés peuvent être aussi bien qualitatifs que quantitatifs1 .
1.1 Distributions statistiques à deux variables
On considère une population de N individus mesurés simultaniment par les deux caractères
X et Y qui peuvent être qualitatives ou quantitatives, et qui peuvent ne pas être de même
nature. Les k modalités2 de X sont désignées par x1 ; : : : ; xj ; : : : ; xk ; les l modalités de Y
1
Les types de variables ont été dé…nis dans le chapitre précédent.
2
Dans le cas d’une variable quantitative continue la ieme modalité d’une variable désigne le centre de
eme
la i classe.
1
Série Statistique Double 1ère année des sciences vétérinaires 2018/2019
sont désignées par y1 ; : : : ; yj ; : : : ; yl .
1.2 Tableau statistique
La répartition des N observations, ou distribution conjointe, suivant les modalités de X et

Y se présente sous forme d’un tableau à double entrée, appelée tableau de contingence
ou tableau à double entrée ou tableau croisé ou parfois tableau de corrélation(tableau de
k lignes et de l colonnes).
XnY y1 y2 ::: yj ::: yl TOTAL

x1 n11 n12 ::: n1j ::: n1l n1
x2 n21 n22 ::: n2j ::: n2l n2
: : : : : :
: : : .... : .... : :
: : : : : :
xi ni1 ni2 ::: nij ::: nil ni
: : : : : :
: : : .... : ..... : :
: : : : : :
xk nk1 nk2 ::: nkj ::: nkl nk
TOTAL n 1 n2 ::: nj ::: nl n =N
Tab. 1.1 –Tableau de contingence.
I L’e¤ectif nij désigne le nombre de fois où la modalité xi de la variable X et la modalité

yj de la variableY ont été observées simultanément.
I L’e¤ectif ni appelé e¤ectif marginal de X, représente le nombre total d’observations de
la modalité xi de X, quelle que soit la modalité de Y.
X
l
ni = nij
j=1
I De même, L’e¤ectif n j appelé e¤ectif marginal de Y, est le nombre total d’observations

de la modalité yj de Y, quelle que soit la modalité de X.
2 Dr. S Betteka ép Ammari

X
k
nj = nij
i=1
On a évidemment :
X
k X
l X
l X
k
nij = ni = nj = N
i=1 j=1 j=1 i=1
La distribution conjointe peut aussi être dé…nie par les fréquences :
nij
fij = :
N
Exemple 1.2.1 Soit la série statistique bidimensionnelle du couple (X, Y) suivante :
X/Y -2 0 2 3 ni
2 -2 4 0 6 13
3 4 3 3 2 12
4 2 3 3 2 10
nj 9 10 6 10 35
1.3 Représentation graphique
1.3.1 Nuage de points
Il s’agit d’un graphique très commode pour représenter les observations simultanées de
deux variables quantitatives.
Si les observations de deux variables statistiques X et Y sont connues individuellement, on
commence par les visualiser en les représentant sous la forme d’un nuage de points : dans
un repère cartésien, chaque observation (xi ; yi ) est …gurée par le point Mi de coordonnées
(xi ; yi ), et la forme du nuage donne une information sur le type d’une éventuelle liaison.

Fig. 1.1 –Nuage de points.
1.4 Distributions marginales
La distribution marginale est déterminée en isolant les première et dernière colonnes du

tableau de contingence. La première colonne contient les modalités xi et la dernière, les
e¤ectifs correspondants. C’est-à-dire sur la marge du tableau de contingence, on peut
extraire les données seulement par rapport à X et seulement par rapport à Y.
Les k couples (xi ; ni ) forment la distribution marginale de la variable X.
Les l couples (yj ; n j ) forment la distribution marginale de la variable Y.
Les distributions marginales peuvent aussi être données sous forme de fréquences :
ni nj
fi = et fj =
N N
De plus, on a :
X
l X
k
fi = f j = 1:
j=1 i=1
Ces deux distributions pouvent se présenter sous forme de tableaux statistiques :

Distribution marginale de X :
Ef f ectif F requence relative

X
marginal ni marginale fi
x1 n1 f1 = n1 =N
x2 n2 f2 = n2 =N
: : :
: : :
: : :
xk nk fk = nk =N
TOTAL N 1
Distribution marginale de Y :
Ef f ectif F requence relative

Y
marginal n j marginale f j
y1 n1 f 1 =n 1 =N
y2 n2 f 2 =n 2 =N
: : :
: : :
: : :
yl nl f l = n l =N
TOTAL N 1
1.5 Description numérique
Disposant d’une distribution conjointe, on peut déduire les distributions marginales qui
permettent d’étudier séparément chaque variable en représentant graphiquement sa dis-
tribution et s’il s’agit d’une variable quantitative, en calculant ses caractéristiques de
tendance centrale et de dispersion.

1.5.1 Caractéristique des séries marginales
I Les moyennes marginales des variables X et Y sont :

1X X
k k
xM = ni xi = fi xi ;
N i=1 i=1
et
1X X
l l
yM = n j yj = f j yj :
N j=1 j=1
I Les variances marginales des variables X et Y sont données par :
1X
k
2
varM (x) = x 2 (xM ) = ni x2i (xM )2 ;
N i=1
et
1X
l
2
varM (y) = y 2 (y M ) = n j yj (y M )2 :
N j=1
I Les écarts-type marginaux de X et Y sont donnés par :
p p
X = varM (x) et Y = varM (Y ):
Exemple 1.5.1 En reprenant l’exemple 2.1.1 et on détermine la moyenne marginale de

X et de Y comme suit :
1X
k
1 102
xM = ni xi = (2 13 + 3 12 + 4 10) = = 2:914:
N i=1 35 35
et
1X
l
1 24
yM = n j yj = ( 2 9 + 0 10 + 2 6 + 3 10) = = 0:686:
N j=1 35 35
Les variances marginales des variables X et Y sont :
1X
k
1
varM (x) = ni x2i (xM )2 = (4 13 + 9 12 + 16 10) (2:914)2 = 0:650
N i=1 35
et
1X
l
1
varM (y) = n j yj (y M )2 = (150) (0:686)2 = 3:815:
N j=1 35
1.5.2 Distributions conditionnelles
La distribution de la variable Y, la variable X étant égale à xi , est appelée distribution

conditionnelle de Y pour X = xi :

Y/X=xi y1 ::: yj ::: yl Total
E¤ectif ni1 ::: nij ::: nil ni
Cette distribution des ni observations, satisfaisant à la condition X = xi , est présentée

sous la forme de fréquences conditionnelles :
nij X
l
fj=i = avec : fj=i = 1:
ni j=1
Y/X=xi y1 ::: yj ::: yl Total
Fréquence n1=i ::: nj=i ::: nl=i 1
La fréquence fj=i parfois notées et fji se lit " f indice j si i ", c’est-à-dire fréquence de yj si
X = xi . Il y a k distributions conditionnelles de Y pour (i = 1; : : : ; k):
Lorsque la variable Y est quantitative, on peut calculer pour chaque valeur xi sa moyenne
conditionnelle y i et sa variance conditionnelle vari :
X
l X
l
yi = fj=i yj et vari = fj=i (yj y i )2 :
j=1 j=1
Les k modalités de X induisant une partition des observations en k sous groupes, la

moyenne peut s’exprimer comme somme pondérée des k moyennes y i (chapitre 1) :
X
k
y= fi y i
i=1
Symétriquement, on a l distributions conditionnelles de X et on dé…nit les fréquences

conditionnelles f indice i si j :
nij X
k
fi=j = avec : fi=j = 1:
nj i=1
X/Y=yj x1 ::: xj ::: xl Total
Fréquence n1=j ::: ni=j ::: nk=j 1

Lorsque la variable X est quantitative, on peut calculer pour chaque valeur yj sa moyenne
2
conditionnelle xj et sa variance conditionnelle j :
X
k X
k
xj = fi=j xi et 2
j = fi=j (xi xj )2 :
i=1 i=1
Exemple 1.5.2 En reprenant l’exemple 2.1.1 alors pour déterminer la moyenne condi-
tionnelle de X quand Y=2, il su¢ t d’observer le comportement de X relatif à la colonne
Y=2.
X y=2
2 0
0 2+3 3+3 4
3 3 xy=2 = = 3:5
6
4 3
nj 6
Pour déterminer la moyenne conditionnelle de Y quand X=3, il su¢ t d’observer le com-
portement de Y relatif à la colonne X=3 :
y x=3
-2 4
0 3 2 4+0 3+2 3+3 2 1

y x=3 = = = 0:33:
2 3 12 3
3 2
ni 12
Remarque 1.5.1 On a la relation suivante entre la moyenne x et les l moyennes condi-

tionnelles xj :
X
l
x= f j xj
j=1

1.6 Covariance entre deux variables statistiques
Dé…nition 1.6.1 La covariance est égale à la moyenne des écarts des couples (xi ; yi ) de
X et Y par rapport au point (x; y)
1X 1X
N N
cov(X; Y ) = (xi x) (yi y) = xi yi x:y
N i=1 N i=1
Dé…nition 1.6.2 Dans le cas de données groupées dans un tableau de contingence (cova-
riance pondérée) est donnée par :
1 XX 1 XX
k l k l
cov(X; Y ) = nij (xi x) (yj y) = nij xi yi x:y
N i=1 j=1 N i=1 j=1
La covariance indique le sens de la relation entre les variables X et Y.

Ainsi, On peut distinguer les cas suivants :
- Si cov(X; Y ) > 0, alors on peut dire que la relation entre les deux variables est positive.
Dans ce cas, ces deux variables varient dans le même sens.
- Si cov(X; Y ) < 0; alors on peut dire que la relation entre les deux variables est négative.
Dans ce cas, ces deux variables varient en sens inverse.
- Si cov(X; Y ) = 0, alors on peut dire qu’il n’y a pas de relation entre les deux variables.
Dans ce cas, les variations de l’une n’entraînent pas la variation de l’autre.
Propriétés de la covariance :
1. cov(X; Y ) = cov(Y; X):
2. cov(X; X) = var(x):
3. var(X + Y ) = var(X) + var(Y ) + 2cov(X; Y ):
4. 8a; b; x0 ; y0 2 R : cov(aX + x0 ; bY + y0 ) = ab cov(X; Y ) ) var(aX + bY + c) =

a2 var(X) + b2 var(Y ) + 2ab cov(X; Y ):
p
5. jcov(X; Y )j var(X):var(Y ):

Fig. 1.2 –Covariance et la variabilité.
1.7 Coe¢ cient de corrélation linéaire
Nous allons calculer le coe¢ cient de corrélation entre deux séries de même longueur.
On suppose qu’on a les tableaux de valeurs suivants : X(x1 ; :::; xN ) et Y (y1 ; :::; yN ) pour
chacune des deux séries.
Dé…nition 1.7.1 On appelle coe¢ cient de corrélation linéaire ou coe¢ cient de Bravais-
Pearson entre deux variables statistiques X et Y, le rapport de leur covariance par le produit
de leurs écarts-types :
cov(X; Y )
r(X; Y ) = :
X Y
Remarque 1.7.1 La liaison entre deux variables numériques peut être étudiée grâce au
coe¢ cient de corrélation. Néanmoins, il faut bien garder présent a l’esprit que le coe¢ cient
de corrélation de Bravais-Pearson ne mesure que des relations linéaires, et sa valeur n’est
en rien le re‡et de l’existence d’un lien de causalité entre les deux variables.

Fig. 1.3 –Exemples de nuages de points et coe¢ cients de corrélation.
Propriétés du coe¢ cient de corrélation linéaire :
1. Le coe¢ cient de corrélation est toujours compris entre -1 et +1.
2. Si r = +1 alors les points se trouvent tous sur une même droite croissante, la
corrélation linéaire positive parfaite.
3. Si r = 1 alors les points se trouvent tous sur une même droite décroissante, la
corrélation linéaire négative parfaite.
4. Si r = 0 alors il n’y a pas une relation linéaire entre les variables X et Y.
5. On a pour tout a; b; x0 ; y0 2 R :
cov(aX + x0 ; bY + y0 ) abcov(X; Y )
r(aX + x0 ; bY + y0 ) = =
saX+x0 :sbY +y0 jabj sX :sY
8
>
< +r(X; Y ) si a et b de même signe
=
>
: r(X; Y ) si a et b de même opposé

Série Statistique Double

Transféré par

Informations du documentcliquez pour développer les informations du document

Droits d'auteur :

Formats disponibles

Série Statistique Double

Transféré par

Informations du document

Description originale:

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Série Statistique Double

Transféré par

Droits d'auteur :

Formats disponibles

STATISTIQUE DESCRIPTIVE

1.1 Distributions statistiques à deux variables

sont désignées par y1 ; : : : ; yj ; : : : ; yl .

1.2 Tableau statistique

La répartition des N observations, ou distribution conjointe, suivant les modalités de X et

XnY y1 y2 ::: yj ::: yl TOTAL

Tab. 1.1 –Tableau de contingence.

I L’e¤ectif nij désigne le nombre de fois où la modalité xi de la variable X et la modalité

I De même, L’e¤ectif n j appelé e¤ectif marginal de Y, est le nombre total d’observations

2 Dr. S Betteka ép Ammari

La distribution conjointe peut aussi être dé…nie par les fréquences :

Exemple 1.2.1 Soit la série statistique bidimensionnelle du couple (X, Y) suivante :

1.3 Représentation graphique

1.3.1 Nuage de points

3 Dr. S Betteka ép Ammari

Fig. 1.1 –Nuage de points.

1.4 Distributions marginales

La distribution marginale est déterminée en isolant les première et dernière colonnes du

Ces deux distributions pouvent se présenter sous forme de tableaux statistiques :

4 Dr. S Betteka ép Ammari

Ef f ectif F requence relative

Ef f ectif F requence relative

1.5 Description numérique

5 Dr. S Betteka ép Ammari

1.5.1 Caractéristique des séries marginales

I Les moyennes marginales des variables X et Y sont :

Exemple 1.5.1 En reprenant l’exemple 2.1.1 et on détermine la moyenne marginale de

1.5.2 Distributions conditionnelles

La distribution de la variable Y, la variable X étant égale à xi , est appelée distribution

6 Dr. S Betteka ép Ammari

Y/X=xi y1 ::: yj ::: yl Total

E¤ectif ni1 ::: nij ::: nil ni

Cette distribution des ni observations, satisfaisant à la condition X = xi , est présentée

Y/X=xi y1 ::: yj ::: yl Total

Fréquence n1=i ::: nj=i ::: nl=i 1

Les k modalités de X induisant une partition des observations en k sous groupes, la

Symétriquement, on a l distributions conditionnelles de X et on dé…nit les fréquences

X/Y=yj x1 ::: xj ::: xl Total

Fréquence n1=j ::: ni=j ::: nk=j 1

7 Dr. S Betteka ép Ammari

0 3 2 4+0 3+2 3+3 2 1

Remarque 1.5.1 On a la relation suivante entre la moyenne x et les l moyennes condi-

8 Dr. S Betteka ép Ammari

1.6 Covariance entre deux variables statistiques

La covariance indique le sens de la relation entre les variables X et Y.

1. cov(X; Y ) = cov(Y; X):

3. var(X + Y ) = var(X) + var(Y ) + 2cov(X; Y ):

4. 8a; b; x0 ; y0 2 R : cov(aX + x0 ; bY + y0 ) = ab cov(X; Y ) ) var(aX + bY + c) =

9 Dr. S Betteka ép Ammari

Fig. 1.2 –Covariance et la variabilité.

1.7 Coe¢ cient de corrélation linéaire

10 Dr. S Betteka ép Ammari

Fig. 1.3 –Exemples de nuages de points et coe¢ cients de corrélation.

Propriétés du coe¢ cient de corrélation linéaire :

1. Le coe¢ cient de corrélation est toujours compris entre -1 et +1.

4. Si r = 0 alors il n’y a pas une relation linéaire entre les variables X et Y.

11 Dr. S Betteka ép Ammari