Statistiques Descriptives
Statistiques Descriptives
Statistiques Descriptives
Méthodes quantitatives
Travaux dirigés
2014
Distribution à un seul caractère
Les tableaux statistiques
Les paramètres de position
Le mode
Le médiane
La moyenne
Les paramètres de dispersion
La variance et l’écart type
L’étendu et le coefficient de variation
Les paramètres de concentration
La médiale
La courbe de Lorenz
Exercice illustratif
1. Types de présentation des données
Numéro Taille Soit le caractère statistique : « la taille des étudiants »
1 158
2 177
3 181 Le tableau statistique: correspond à deux colonnes :
4 190 modalités et les fréquences (absolues et relatives)
5 163 auxquelles sont associées
6 158
Données Individuelles
La Taille (ni)
200
180
160
140
120
100
80
60
40
20
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Taille
2. Les représentations graphiques correspondantes
La Taille (ni)
9
8
7
6
5
4
3
2
1
0
[150, 160[ [160, 170[ [170, 180[ [180, 190]
3. Les Paramètres statistiques (paramètres de position)
Le Mode ( Mo )
Est la valeur la plus fréquente = Est la valeur dont la fréquence est la plus élevée.
La détermination du Mode :
x inf a
d1 d1=ni –ni-1
d1 d 2
Mo i
d2=ni –ni+1
Borne inférieure de la classe modale Amplitude de classe
3. Les Paramètres statistiques (paramètres de position)
Numéro Taille
Le Mode ( Mo ) 1 158
Cas des données individuellement observées 2 177
(cas données non groupées) 3 181
4 190
5 163
Dans ce cas nous avons une 6 158
distribution avec quatre modes : 7 165
8 164
1. 158 9 166
2. 163 10 169
3. 164 11 173
4. 166 12 175
13 174
14 180
15 164
16 166
17 172
18 163
19 188
20 150
3. Les Paramètres statistiques (paramètres de position)
Le Mode ( Mo )
Cas des données groupées
(cas données continues) modalité de X fréquence absolue fréquence relative fréquence relative
ni fi cumulée Fi
[150, 160[ 3 3/20 3/20
la classe modale est [160, 170[ [160, 170[ 8 8/20 3/20+ 8/20= 11/20
ou l’effectif est le plus
important [170, 180[ 5 5/20 16/20
[180, 190] 4 4/20 20/20 =1
Total 20 1
Mo = 160 + a(d1/(d1+d2))
Mo =160 + 10(8-3)/[(8-3)+(8-5)]
Mo = 166,25
Nb: On peur avoir plusieurs classes Modales
3. Les Paramètres statistiques (paramètres de position)
La Médiane ( Me )
Est l’observation placée au milieu d’une série classée par ordre croissant ou décroissant
La détermination du la Médiane :
ni
Cas des données groupée (cas données continues)
166 169
m 167,5
10 166
11 169
2 12 172
13 173
14 174
15 175
16 177
17 180
18 181
19 188
20 190
3. Les Paramètres statistiques (paramètres de position)
La Médiane ( Me )
Cas des données groupées
(cas données continues) modalité de X fréquence absolue fréquence relative fréquence relative
Méthode 1: ni fi cumulée Fi
le graphique de la fonction de [150, 160[ 3 3/20 3/20
répartition [160, 170[ 8 8/20 3/20+ 8/20= 11/20
[170, 180[ 5 5/20 16/20
Méthode 2 : [180, 190] 4 4/20 20/20 =1
1. TRI (classer les valeurs par ordre Total 20 1
croissant) c.à.d. calcul de Fi
160 Me 170
2. On détermine la classe
médiane [160, 170[
3. On applique extrapolation
Me 160 10 3 7 10
linéaire
Me 160 168,75
170 160 11 3 8
3/20 10/20 11/20
Numéro Taille
3. Les Paramètres statistiques (paramètres de position) 1 158
2 177
La Moyenne : la moyenne arithmétique ( X ) 3 181
158 177 ... 150
X
4 190
Cas des données individuellement observées 5 163
(cas données non groupées)
X 169,7
20 6 158
7 165
Cas des données groupées 8 164
(cas données continues) 9 166
10 169
11 173
modalité de X fréquence absolue fréquence relative fréquence relative
12 175
ni fi cumulée Fi
13 174
[150, 160[ 3 3/20 3/20
14 180
[160, 170[ 8 8/20 3/20+ 8/20= 11/20
15 164
[170, 180[ 5 5/20 16/20
16 166
[180, 190] 4 4/20 20/20 =1
17 172
Total 20 1
18 163
X 170
N N
3. Les Paramètres statistiques (paramètres de position)
G x x1 x2 .... xn
n
n n
i 1
i
Exemple :
Les prix de l'immobilier ancien ont augmente ces 10 dernières années de la façon suivante :
Variation annuelle En utilisant la moyenne arithmétique simple, on obtiendrait une évolution
Année en % moyenne de (13,8 + 12,7 + 12,8 + 11,2 + 7,7) / 5 = 55,1 / 10 = 5,51 %
1 9,2
2 12,7 mais ce résultat est faux compte tenu de la relation entretenue par les
3 8,8 taux d'une année sur l'autre.
4 7,7 L'utilisation de la moyenne géométrique permet de solutionner ce
5 3,9
problème :
6 1,7
7 0,9 G 10 9,2 12,7 8,8 7,7 3,9 1,7 0,9 2,2 2,2 4,7 3,3
G 10 1611964,46 4,18
8 2,2
9 4,7
10 3,3
3. Les Paramètres statistiques (paramètres de position)
H 9,46
n 4
n 1 1 1 1 1
i 1
xi 7,49 11,43 6,18 25,1
3. Les Paramètres statistiques (paramètres de position)
Q
1 n 2
x
n i 1
Exemple :
Considérons les nombre suivants {-2, 5, -8, 9, -4 }
Nous pouvons en calculer la moyenne arithmétique avec l'inconvénient de voir se neutraliser les
valeurs positives et négatives et d'aboutir a un résultat nul sans que cela ne nous apprenne quoi que
ce soit. En effet,
La Variance
Var ( x ) x x
Formules associées n
² 1 ²
1. Cas discret:
i 1
x i
n
1 ²
Var ( x )
n
²
n
x x
i 1
i
Var ( x) xi x ni xi x f i
2. Cas continu classé: ² 1 k ²
k
²
n i 1 i 1
x
Var ( x) xi ni x xi f i x
1 k ² ² k ² ²
n i 1 i 1
4. Les Paramètres de dispersion
Numéro taille trie croissant
La Variance 1 150
2 158
Cas des données individuellement observées
3 158
(cas données non groupées)
4 163
5 163
6 164
Calcul de la variance 7 164
Var ( x) xi x
8 165
9 166
² 1 n ²
10 166
n i 1
x
Var ( x) xi x
11 169
1 n ² ²
12 172
n i 1
13 173
14 174
1
15 175
20
17 180
18 181
19 188
20 190
4. Les Paramètres de dispersion
La Variance
Cas des données groupées
(cas données continues) modalité de X fréquence absolue fréquence relative fréquence relative
ni fi cumulée Fi
[150, 160[ 3 3/20 3/20
[160, 170[ 8 8/20 3/20+ 8/20= 11/20
[170, 180[ 5 5/20 16/20
[180, 190] 4 4/20 20/20 =1
Var ( x) x xi x ni xi x f i
Calcul de la variance Total 20 1
k k
² 1 ² ²
n i 1 i 1
Var ( x) xi ni x xi f i x
1 k ² k ²
n i 1 i 1
² ²
3 4
Var ( x) 155 ... 185 170 95
20 20
² ² ²
4. Les Paramètres de dispersion
L’écart-type
x Var ( x)
(cas données non groupées)
99,11 9,96
x Var ( x) 95 9,75
4. Les Paramètres de dispersion
Le coefficient de variation
D’où l’idée de calculer le coefficient de variation qui est égal à l’écart-type divisé par la
moyenne, c’est-à-dire :
x
Cv
x
4. Les Paramètres de dispersion
Maxx Minx
Formule associée
Cas des données individuellement observées
(cas données non groupées)
190 150 40
Exemple:
L’écart-interquartile
F
1,2
0,8 0,8
Q3=0,75
0,6
0,55
Q2=0,50
0,4
Q1=0,25
0,2
0,15
0
150 160 170 180 190
La médiale
Alors que la médiane s’applique aux valeurs de la variable (les «xi»), la médiale s’applique
aux valeurs de la variables multipliées par leurs effectifs respectifs (les « nixi»).
Cas des données groupées centre de fréquence fréquence
(cas données continues) modalité de X classe absolue relative
Xi ni fi niXi NiXi
calcul de la médiale [150, 160[ 155 3 0,15 465 465
Classe médiale [160, 170[ 165 8 0,4 1320 1785
[170, 180[ 175 5 0,25 875 2660
[180, 190] 185 4 0,2 740 3400
Total 20 1 3400
i i
n
ni 1 xi 1
n x
i 1
1,00
0,90
0,80
0,70
0,60
0,50
0,40
0,30
0,20
0,10
0,00
0 0,2 0,4 0,6 0,8 1
Distribution marginales et conditionnelles
Le tableau de contingence
Les distributions marginales
Les distributions conditionnelles
Exercice illustratif
1. Types de présentation des données
Soient le caractère statistique : « la taille des étudiants »
Numéro Taille i Poids j
Et le caractère statistique : « le poids des étudiants »
1 158 55
2 177 80
Le tableau de contingence croise les modalités de deux
3 181 72
variables X et Y relatives à une même population. Les
4 190 77
modalités d’une variable sont présentées en ligne (X) et les
5 163 53 modalités de l’autre variable (Y) sont présentées en colonne
6 158 58
7 165 74 En Effectifs nij
le poids des étudiants
8 164 64 Modalités de Yj
[45, 55[ [55, 65[ [65, 80[ Total
17 172 61
18 163 50
Calculer : n23, n32, n22, n42, n12
19 188 73
20 150 48
Exercice illustratif
2. Distributions Marginales : il y a deux distributions marginales
20 1 4 4/20 f 4.
20 1
n n x
20 1
p
f. j y j f i. xi
k
yj
y x
j 1
.j
i 1
p i. i k
n.. j 1 n.. i 1
Calculer : y Calculer : x
Exercice illustratif
3.2 Les variances marginales
Relations
n n x
20 1
p k
2
y 2
var( y ) y2 var( x) x2
j 1
.j j
i 1
i. i
n.. n..
Moyenne Conditionnelle du poids pour i=3 Moyenne conditionnelle de la taille pour j=2
Catégories du poids des étudiants pour une taille comprise Catégories de la taille des étudiants pour un poids compris entre
ente 170 et 180 cm 55 et 65 kg
Modalités des Xi Effectifs Pourcentage
Modalités des Yj Effectifs Pourcentage
[150, 160[ 2 2/8
[45, 55[ 0 0
[160, 170[ 3 3/8
[55, 65[ 2 2/5
[170, 180[ 2 2/8
[65, 80[ 3 3/5
[180, 190] 1 1/8
5 1
8 1
y3
n 3j yj
x2
n i2 xi
n3. n.2
Calculer : y1 ; y 2 Calculer : x1 ;
y4 x3
Exercice illustratif
4.2 Les variances conditionnelles
Relations
Variance Conditionnelle du poids pour i=3 Variance conditionnelle de la taille pour j=2
Catégories du poids des étudiants pour une taille comprise Catégories de la taille des étudiants pour un poids compris entre
ente 170 et 180 cm 55 et 65 kg
Modalités des Xi Effectifs Pourcentage
Modalités des Yj Effectifs Pourcentage
[150, 160[ 2 2/8
[45, 55[ 0 0
[160, 170[ 3 3/8
[55, 65[ 2 2/5
[170, 180[ 2 2/8
[65, 80[ 3 3/5
[180, 190] 1 1/8
n
5 1
n
8 1
p k
2
y xi2
var( y3 ) y32 var( x2 ) x22
j 1
3j j
i 1
i2
n3. n.2