Série Statistique Double
Série Statistique Double
Série Statistique Double
BIVARIEE
Dans beaucoup de recherches statistiques, on ne s’intéresse pas qu’à un seul caractère mais
à plusieurs en même temps. Quand on étudie deux caractères X et Y sur une population
donnée, c’est en général parce qu’on cherche à savoir s’il existe un lien entre eux et qu’elle
est l’intensité du lien.
Exemple de relations possibles entre les variables suivantes : taille et âge ; diabète et poids,
taux de cholestérol et régime alimentaire, niche écologique et population, ensoleillement
et croissance végétale, toxine et réaction métabolique, survie et pollution, e¤ets et doses
...Les caractères étudiés peuvent être aussi bien qualitatifs que quantitatifs1 .
On considère une population de N individus mesurés simultaniment par les deux caractères
X et Y qui peuvent être qualitatives ou quantitatives, et qui peuvent ne pas être de même
nature. Les k modalités2 de X sont désignées par x1 ; : : : ; xj ; : : : ; xk ; les l modalités de Y
1
Les types de variables ont été dé…nis dans le chapitre précédent.
2
Dans le cas d’une variable quantitative continue la ieme modalité d’une variable désigne le centre de
eme
la i classe.
1
Série Statistique Double 1ère année des sciences vétérinaires 2018/2019
X
l
ni = nij
j=1
X
k
nj = nij
i=1
On a évidemment :
X
k X
l X
l X
k
nij = ni = nj = N
i=1 j=1 j=1 i=1
nij
fij = :
N
X/Y -2 0 2 3 ni
2 -2 4 0 6 13
3 4 3 3 2 12
4 2 3 3 2 10
nj 9 10 6 10 35
Il s’agit d’un graphique très commode pour représenter les observations simultanées de
deux variables quantitatives.
Si les observations de deux variables statistiques X et Y sont connues individuellement, on
commence par les visualiser en les représentant sous la forme d’un nuage de points : dans
un repère cartésien, chaque observation (xi ; yi ) est …gurée par le point Mi de coordonnées
(xi ; yi ), et la forme du nuage donne une information sur le type d’une éventuelle liaison.
ni nj
fi = et fj =
N N
De plus, on a :
X
l X
k
fi = f j = 1:
j=1 i=1
Distribution marginale de X :
x1 n1 f1 = n1 =N
x2 n2 f2 = n2 =N
: : :
: : :
: : :
xk nk fk = nk =N
TOTAL N 1
Distribution marginale de Y :
y1 n1 f 1 =n 1 =N
y2 n2 f 2 =n 2 =N
: : :
: : :
: : :
yl nl f l = n l =N
TOTAL N 1
Disposant d’une distribution conjointe, on peut déduire les distributions marginales qui
permettent d’étudier séparément chaque variable en représentant graphiquement sa dis-
tribution et s’il s’agit d’une variable quantitative, en calculant ses caractéristiques de
tendance centrale et de dispersion.
p p
X = varM (x) et Y = varM (Y ):
1X
k
1 102
xM = ni xi = (2 13 + 3 12 + 4 10) = = 2:914:
N i=1 35 35
et
1X
l
1 24
yM = n j yj = ( 2 9 + 0 10 + 2 6 + 3 10) = = 0:686:
N j=1 35 35
Les variances marginales des variables X et Y sont :
1X
k
1
varM (x) = ni x2i (xM )2 = (4 13 + 9 12 + 16 10) (2:914)2 = 0:650
N i=1 35
et
1X
l
1
varM (y) = n j yj (y M )2 = (150) (0:686)2 = 3:815:
N j=1 35
nij X
l
fj=i = avec : fj=i = 1:
ni j=1
La fréquence fj=i parfois notées et fji se lit " f indice j si i ", c’est-à-dire fréquence de yj si
X = xi . Il y a k distributions conditionnelles de Y pour (i = 1; : : : ; k):
Lorsque la variable Y est quantitative, on peut calculer pour chaque valeur xi sa moyenne
conditionnelle y i et sa variance conditionnelle vari :
X
l X
l
yi = fj=i yj et vari = fj=i (yj y i )2 :
j=1 j=1
X
k
y= fi y i
i=1
nij X
k
fi=j = avec : fi=j = 1:
nj i=1
Lorsque la variable X est quantitative, on peut calculer pour chaque valeur yj sa moyenne
2
conditionnelle xj et sa variance conditionnelle j :
X
k X
k
xj = fi=j xi et 2
j = fi=j (xi xj )2 :
i=1 i=1
Exemple 1.5.2 En reprenant l’exemple 2.1.1 alors pour déterminer la moyenne condi-
tionnelle de X quand Y=2, il su¢ t d’observer le comportement de X relatif à la colonne
Y=2.
X y=2
2 0
0 2+3 3+3 4
3 3 xy=2 = = 3:5
6
4 3
nj 6
Pour déterminer la moyenne conditionnelle de Y quand X=3, il su¢ t d’observer le com-
portement de Y relatif à la colonne X=3 :
y x=3
-2 4
3 2
ni 12
Dé…nition 1.6.1 La covariance est égale à la moyenne des écarts des couples (xi ; yi ) de
X et Y par rapport au point (x; y)
1X 1X
N N
cov(X; Y ) = (xi x) (yi y) = xi yi x:y
N i=1 N i=1
Dé…nition 1.6.2 Dans le cas de données groupées dans un tableau de contingence (cova-
riance pondérée) est donnée par :
1 XX 1 XX
k l k l
cov(X; Y ) = nij (xi x) (yj y) = nij xi yi x:y
N i=1 j=1 N i=1 j=1
- Si cov(X; Y ) > 0, alors on peut dire que la relation entre les deux variables est positive.
Dans ce cas, ces deux variables varient dans le même sens.
- Si cov(X; Y ) < 0; alors on peut dire que la relation entre les deux variables est négative.
Dans ce cas, ces deux variables varient en sens inverse.
- Si cov(X; Y ) = 0, alors on peut dire qu’il n’y a pas de relation entre les deux variables.
Dans ce cas, les variations de l’une n’entraînent pas la variation de l’autre.
Propriétés de la covariance :
2. cov(X; X) = var(x):
Nous allons calculer le coe¢ cient de corrélation entre deux séries de même longueur.
On suppose qu’on a les tableaux de valeurs suivants : X(x1 ; :::; xN ) et Y (y1 ; :::; yN ) pour
chacune des deux séries.
Dé…nition 1.7.1 On appelle coe¢ cient de corrélation linéaire ou coe¢ cient de Bravais-
Pearson entre deux variables statistiques X et Y, le rapport de leur covariance par le produit
de leurs écarts-types :
cov(X; Y )
r(X; Y ) = :
X Y
Remarque 1.7.1 La liaison entre deux variables numériques peut être étudiée grâce au
coe¢ cient de corrélation. Néanmoins, il faut bien garder présent a l’esprit que le coe¢ cient
de corrélation de Bravais-Pearson ne mesure que des relations linéaires, et sa valeur n’est
en rien le re‡et de l’existence d’un lien de causalité entre les deux variables.
2. Si r = +1 alors les points se trouvent tous sur une même droite croissante, la
corrélation linéaire positive parfaite.
3. Si r = 1 alors les points se trouvent tous sur une même droite décroissante, la
corrélation linéaire négative parfaite.
5. On a pour tout a; b; x0 ; y0 2 R :
cov(aX + x0 ; bY + y0 ) abcov(X; Y )
r(aX + x0 ; bY + y0 ) = =
saX+x0 :sbY +y0 jabj sX :sY
8
>
< +r(X; Y ) si a et b de même signe
=
>
: r(X; Y ) si a et b de même opposé