Chapitres 1, 2 Et 3 Stat Descr New VF

Télécharger au format docx, pdf ou txt
Télécharger au format docx, pdf ou txt
Vous êtes sur la page 1sur 24

Ministère de l’Enseignement Supérieur, de la

Recherche Scientifique et des Technologies de


l’Information et de la Communication (MESRSTIC)
Ecole Supérieure Polytechnique (ESP)
Institut Supérieur des Métiers de la Statistique (ISMS)
Cours de Statistique Descriptive

Première année- Semestre 1

Partie I – Statistique descriptive uni variée

Chapitre 1) : Introduction générale : Vocabulaire et outils de base de


la Statistique

Chapitre 2) : Tableaux et Représentation Graphique

Chapitre 3) : Caractéristiques de Tendance Centrale

Chapitre 4) : Dispersion

Chapitre 5) : Les paramètres de forme, la concentration

1
Chapitre 1) Introduction générale : Vocabulaire et outils de base
de la Statistique
Comme tout discipline, la Statistique a son propre vocabulaire, ses propres concepts et
utilise un certain nombre d’outils mathématiques ou probabilistes qu’il est indispensable de
connaître avant de se lancer dans un travail statistique proprement dit.

1.1) Notions de Statistique et statistiques

Les statistiques, au pluriel, sont des chiffres relatifs à un caractère déterminé, collectés
sur des individus (l’individu au sens large du terme). Ils peuvent aussi parfois prendre la
forme de chiffres synthétiques plus élaborées, calculés selon des procédures diverses à partir
de statistiques primaires. A titre d’exemples on peut citer les statistiques de synthèse relatives
à la tendance centrale, la dispersion, à la forme, à la concentration d’une population, ou
encore celles caractérisant les tests.

La Statistique, au singulier, avec la première lettre en majuscule, peut être définie comme
étant la science de l’étude des statistiques au pluriel, ces dernières constituent sa matière
première. Il s’agit d’un ensemble de procédés et de méthodes mathématiques appliqués à
l’étude des statistiques à des fins d’informations et de décision. Elle consiste à collecter,
présenter, analyser et utiliser des observations (des données) afin d'aider à la prise de
décisions et à la résolution de problèmes;

Le premier phénomène qui ressort des observations est la variabilité des données;
On distingue 2 types d’études statistiques :
 La statistique descriptive ou statistique déductive s'occupe de la description des
données: tableau, graphique, pourcentage, ...
 et la statistique inductive ou inférence statistique qui s'occupe de tirer des conclusions
générales à partir d'expériences et de faire des prévisions.
Dans le mot Statistique il y a le mot statuts (mot grec), qui veut dire : établir, constater,
et il veut dire aussi état, avec un e en minuscule, situation. Mais il évoque également un autre
sens, celui de l’Etat, avec un E en majuscule; c’est-à-dire la personne suprême du droit public,
douée de souveraineté.
Le terme Statistique a été proposé pour la première fois en 1748 par Achenwall,
professeur à l’Université de Göttingen. L’Académie française le reconnaîtra un siècle plus
tard, en 1835.

Définition : la statistique est une méthode scientifique qui consiste à réunir des
données chiffrées sur des ensembles nombreux, puis à analyser, à commenter et à critiquer ces
données.
Cette science n’a pas pour objet la connaissance des éléments des ensembles dans ce
qui fait leur individualité, mais au contraire dans ce qu’ils ont en commun : il s’agit d’obtenir
des résultats globaux. Ainsi, une enquête statistique portant sur des personnes n’a pas besoin
de faire intervenir leurs noms, mais seulement les renseignements que l’on désire étudier : elle
permet de connaître la répartition de ces personnes par âge, par sexe, groupe sanguin …

2
1.2) Notion de population statistique
Nous appelons population statistique ou univers statistique, un ensemble d’éléments
sur lesquels porte l’étude statistique envisagée, et qui peuvent être des êtres vivants, des êtres
humains, des objets, des caractères ou autres.
Exemple :
- L’ensemble du personnel de l’entreprise ;
- L’ensemble des chèques impayés dans l’année

Une population est un ensemble d’individus (ou unités statistiques) pour lequel on considère
une ou plusieurs caractéristiques. La taille de la population est le nombre d'individus
constituant cette population, noté N.

1.3) Notion d’échantillon statistique 


Pour recueillir des informations sur une population statistique, on dispose de deux
méthodes :
- La méthode exhaustive ou recensement où chaque individu de la population est étudié selon
le ou les caractères étudiés ;
La méthode des sondages ou échantillonnage qui conduit à n’examiner qu’une fraction de la
population, un échantillon.

L’échantillonnage représente l’ensemble des opérations qui ont pour objet de prélever
un certain nombre d’individus dans une population donnée.
Pour que les résultats observés lors d’une étude soient généralisables à la population
statistique, l’échantillon doit être représentatif de cette dernière, c’est à dire qu’il doit refléter
fidèlement sa composition et sa complexité. Seul l’échantillonnage aléatoire assure la
représentativité de l’échantillon.

Un échantillon est qualifié d’aléatoire lorsque chaque individu de la population a une


probabilité connue et non nulle d’appartenir à l’échantillon.
Nous appelons échantillon statistique, un sous-ensemble prélevé dans la population,
dont il présente un minimum de caractéristiques. Pour des raisons de coûts, temps ou de
commodité, on est souvent amené à faire l’étude statistique sur une partie seulement de la
population. Si les éléments de l’échantillon sont prélevés au hasard dans la population, on
parle d’échantillon aléatoire, dans le cas contraire, on parle d’échantillon empirique ou
raisonné. Exemple : 300 comptes clients.

1.4) Notion d’unité statistique 


On appelle unité statistique ou individu statistique un élément quelconque de la
population.

1.5) Notion de caractère statistique 

Il s’agit d’une caractéristique susceptible de variations observables. Les valeurs sont les
mesures distinctes d'une caractéristique donnée. Les valeurs possibles sont tous les résultats

3
possibles a priori si on fait une observation d'une variable et la valeur observée est le résultat
a posteriori d'une observation d'une variable.

a) - Caractère qualitatif : si le caractère n’est pas mesurable on parle de caractère qualitatif ou


nominal ; Les valeurs d’une variable qualitative peuvent être des états, des opinions, des
propriétés, des modalités qui correspondent à des "qualités";

b) - Caractère quantitatif : si le caractère étudié sur l’individu est mesurable, on parle de


caractère quantitatif ou variable (les salaires des employés d’une entreprise) ; Ses valeurs sont
des nombres réels et correspondent à des quantités;

c) – Caractère Ordinal : parfois, on rencontre des caractères statistiques dont les différentes,
modalités se caractérisent, non par leurs valeurs, mais par leurs classements (variable
ordinale) exemple (fort, moyen, faible.).
d)- Caractère binaire : c’est un caractère dont les modalités ne peuvent prendre que deux
valeurs seulement : vrai ou faux, succès ou échec, 0 ou 1.

On distingue deux types de variables quantitatives :


 La variable quantitative discrète,
 la variable quantitative continue.

Une variable quantitative est dite discrète si l’étendue des valeurs possibles est dénombrable,
c’est-à-dire si les valeurs peuvent être énumérées sous la forme d’une liste de chiffre (a 1, a2,
…) ou plus souvent d’entiers naturels (0, 1, 2, 3,…).

Exemples : Nombre d’objets dans un dépôt, nombre de mots dans une phrase, nombre de
raisins sur une grappe, Nombre de mots dans un texte.

Image géométrique :

Exemple de Variable discrète :

• Population : les ménages de Nouakchott


• Unité statistique : un ménage
• Variable étudiée : X : le nombre d'individus dans le ménage
• Valeurs : xi = 1, 2, 3, 4, ... , 11 . (Valeurs observées)
Une variable quantitative est dite continue si ses valeurs a priori ne peuvent être isolées. Ses
valeurs se situent donc dans des intervalles de la droite réelle.

Exemple de variable continue :


• Population : les modèles automobiles sur le marché mauritanien
• Unité statistique : un modèle de voiture
• Variable étudiée : X : la consommation en litres sur 100 km (urbain)
• Valeurs : x Î [5, 6) ou [6, 7) ou ... ou [22, 23).

4
Ainsi, le choix de la méthode statistique se fait suivant la nature de la variable.
1. Variables qualitatives
Echelle nominale
Echelle ordinale
2. Variables quantitatives
Variables discrètes
Variables continues.

Variable qualitative:

Modalités avec des mots ou des lettres (catégories).


Exemples : ‘homme’, ‘femme’, de la variable ‘ sexe ’, ‘rouge’, ‘vert’… de la variable
‘ couleur ’; ‘non qualifié  ’, ‘ semi-qualifié ’, ‘  qualifié ’ de la variable ‘ qualification
professionnelle ’ type de silex…

Échelle nominale :
On dit d’une variable dont les catégories ne sont pas naturellement ordonnées, qu’elle est
définie sur une échelle nominale.
Exemples : sexe, types de haches, types d’amphores...

Échelle ordinale :
Si les catégories peuvent être ordonnées, on est en présence d’une échelle ordinale.
Exemples : qualification professionnelle (travail d’un potier) ‘non qualifié’, ‘semi - qualifié’,
‘qualifié  ’.

1.6) Synthèse du vocabulaire

Comme toute science, la statistique fait appel à un vocabulaire spécialisé :


- Les ensembles sont appelés populations ; Comme un ensemble, une population
statistique doit être clairement définie ;
- Les éléments de la population sont appelés individus ou unités statistiques, (que ce
soient des hommes ou des automobiles, etc.) ;
- La population est étudiée selon un ou plusieurs caractères ;
- Un caractère permet de déterminer une partition de la population selon diverses
modalités. Ainsi le sexe est un caractère à deux modalités : masculin et féminin ;
- Lorsque les modalités du caractère sont des nombres, le caractère est dit quantitatif ;
on lui donne souvent le nom de variable statistique ;
- Une variable statistique peut être discrète si elle ne prend que des valeurs isolées ou
continue si elle peut prendre n’importe quelle valeur intermédiaire entre deux valeurs
données ;
- Lorsque les modalités du caractère ne sont pas mesurables, le caractère est dit
qualitatif ; Les modalités d’un caractère qualitatif peuvent faire l’objet d’une
nomenclature ou énumération ; la nomenclature doit en principe être courte (une
dizaine pour une étude statistique simple). Mais les exigences de l’étude sont parfois
telles que la nomenclature occupe des volumes entiers : c’est le cas de nomenclatures
codées des catégories socioprofessionnelles et des professions faites par l’I.N.S.E.E.

5
Exemples : Pour des chômeurs, l’âge est un caractère quantitatif continu ; le nombre
d’enfants est un caractère quantitatif discret. Pour des automobiles, la couleur est un caractère
qualitatif.

1.7) Démarche scientifique de la Statistique

On peut évoquer que le but d’une étude statistique est de se faire une idée assez juste des
variations d'une variable dans une population. Dans ce cadre, la démarche peut être
schématisée de manière sommaire comme suit :

6
Chapitre 2) : Tableaux et Représentations Graphiques
2.1) Tableau statistique à simple entrée

Le tableau statistique à simple entrée sera celui où figurent deux colonnes réservées
respectivement :

- La première à l’inscription des modalités prises par le caractère, ou la valeur prises par
la variable, désignées par
x i  ;
- La seconde, à l’inscription des effectifs correspondants, désignés par
ni .

a) Cas des variables discrètes


Nous pourrions avoir la présentation suivante :
Exemple : Considérons la distribution statistique du personnel d’une entreprise
d’après le nombre d’enfants en charge.

Nombre d’enfants à
Effectif (
ni )
x
charge ( i )
0 4
1 15
2 29
3 18
4 10
5 3
6 1
Dans cet exemple la variable est discrète et prend les sept valeurs suivantes :
x 1=0 , x 2 =1, . .. .. . .. .. . .. .. . .. , x7 =6
A chacune de ces valeurs correspond son effectif :
n1=4 ,n2 =15 ,. ... .. .. . ..... , n7 =1
n1 + n2 +. .. . .+ n7 =∑ ni
L’effectif total N est égale à i =1

b) Cas des variables continues (données groupées en classes)


Nous pourrions avoir la présentation suivante :
Exemple : Distribution statistiques des ouvriers d’une entreprise d’après leur salaire horaire :

Salaire horaire
Effectifs (
ni )
[47.50 – 52.50 [ 10

52.5-57.5 [ 30
57.5-60.5 60
60.50-63.5 72
63.5-67.50 40
67-8-73.50 24
73.50-80.5 14

7
n
250
∑ ni
i=1
Il importe que les classes recouvrent tous les résultats et aient une intersection vide, d’où les
formulations du type « de … à moins de …» ; la différence entre les deux extrémités est
appelé amplitude de la classe.

L’amplitude de classe est alors donnée par : (Valeur maximale – Valeur minimale) / Nombre
de classes

L’effectif d’une classe est le nombre d’éléments de la population observés dans cette classe.

c) La Fréquence :
ni
=f i
C’est le quotient ∑ ni
x
est la fréquence de la mesure i du caractère
La fréquence d’une classe est le rapport de son effectif à l’effectif total de la population.
La fréquence est exprimée en pourcentage.

d) Effectifs cumulés :
À partir des effectifs ou des fréquences, on peut calculer des effectifs cumulés (croissants
ou décroissants) ou les fréquences cumulées (croît↑ ou décroît ↓) qui permettraient de
répondre aux questions suivantes, dans le cas qui nous occupe :
- Quel est le nombre d’ouvriers dont le salaire horaire est inférieur à 63.5 ? Réponse :
172
- Quel est le nombre d’ouvrier percevant au moins 63.5 ? Réponse : 78.

2.2) Tableau à double entrée :


Nous nous sommes jusqu’ici limités à l’observation, sur chaque unité statistique, d’un seul
caractère. Or il est fréquent qu’on soit conduit à observer, sur une même unité, deux ou plus
de deux caractères.
La traduction, par un tableau, de l’observation du deux caractères, se fera à l’aide d’un tableau
à double entrée.

L’âge en année
[3−4[ 4-5 5-6 Totaux
marginaux
Le poids (en Kg)
15 [ 19 1 1 27
[15−20[ 32 21 12 65
20-25 3 18 28 49
25-30 4 3 1 8
Totaux marginaux 58 49 42 149
Interprétations des nombres portés dans le tableau :

- 19 enfants, âgés de 3 ans à 4 ans, pèsent moins de 15 Kg


- 21 enfants, âgés de 4 ans à 5 ans pèsent au moins 15 Kg et moins de 20 Kg.
8
2.3) Les Constructions Graphiques
Les tableaux statistiques permettent déjà une première description des populations
étudiées. Mais il est plus pratique de présenter ces tableaux sous forme des graphiques.

L’intérêt du graphique est de donner une image qui permet de voir facilement la
tendance générale du phénomène étudié et de mettre en évidence certains faits essentiels.
Cependant, selon la nature de la variable étudié et l’objectif de l’étude, nous utilisons
différents types de constructions graphiques.

1) Les constructions sous forme de graphiques cartésiens

Cas d’une variable discrète


Exemple

En vue de promouvoir la qualité de ses services, une agence de voyages a procédé au


recensement des hôtels pouvant accueillir confortablement sa clientèle. Les résultats
de cette enquête sont présentés dans le tableau suivant :

Modalités (Nombre d’étoiles) Effectifs (Nombre d’Hôtels)

1 100
2 120
3 60
4 80
5 40

Question : représenter graphiquement cette série statistique

Cette série sera représentée en utilisant les constructions graphiques suivantes :


Diagramme en Bâtons (Diagramme des effectifs) :

La représentation se fait par l’intermédiaire de deux axes perpendiculaires. Sur l’axe


horizontal (ou axe des abscisses), on porte les différentes valeurs de la variable statistique. Sur
l’axe vertical (ou axe des ordonnées), on porte les effectifs ; à chaque valeur de la variable, on
fait correspondre un segment vertical dont la hauteur est proportionnelle à l’effectif.

9
Digramme en bâtons des effectifs

100 Effectifs

80
120
60

100
40
0
80
60

40
20

11 2 3 4 5 Modalités
Digramme en bâtons des effectifs

Digramme des fréquences :

Ici, les effectifs se trouvent sur l’axe des ordonnées sont remplacés par les fréquences
relatives. Le schéma obtenu est appelé diagramme en Bâtons des fréquences.

Modalités (Nombre d’étoiles) Effectifs (Nombre d’Hôtels) Fréquences

1 100 0.25
2 120 0.30
3 60 0.15
4 80 0.20
5 40 0.10
Total 400 1.00

10
Fréquences

0.30

0.10

11 2 3 4 5 Modalités
Digramme en bâtons des fréquences

Remarque : Si on joint les sommets des bâtons, nous obtenons un polygone des
effectifs ou de fréquences.

Diagrammes cumulatifs :

Reprenons l’exemple précèdent ; calculons et représentons graphiquement les effectifs


cumulés croissants et les fréquences cumulées croissantes.

Modalités Effectifs Fréquences Effectifs fréquences


cumulés ↑ (en cumulées ↑ (en
%) %)
1 100 0.25 100 25
2 120 0.30 220 55
3 60 0.15 280 70
4 80 0.20 360 90
5 40 0.10 400 100
Total 400 1.00

11
ni 
fi 
400

75
280

25 100

11 2 3 4 5 Nbr d’étoiles
Digramme en escaliers des effectifs cumulés croissants
Remarques :

1- Le diagramme cumulatif des fréquences ou des effectifs peut être croissant ou


décroissant.
2- Cette représentation permet de déterminer graphiquement l’effectif ayant une
intensité du caractère inférieure ou égale (cas d’un digramme cumulatif croissant),
supérieure ou égale (cas d’un digramme cumulatif décroissant) à une valeur
donnée.

Cas d’un variable continue

Exemple : les salaires horaires des 100 ouvriers d’une entreprise sont consignés
dans le tableau suivant :

Classes de salaires (en UM) Effectifs Fréquences

De 500 à moins de 1000 10 0.10


De 1000 à moins de 1500 30 0.30
De 1500 à moins de 2000 40 0.40
De 2000 à moins de 2500 20 0.20
Total 100 1.00

Représenter graphiquement cette série statistique

12
fi ni

40

0.30 30

0.10 10

51 10 15 20 25 Nbr d’étoiles
Histogramme des effectifs (classes de mêmes amplitudes)

La représentation est faite à l’aide de rectangles qui ont pour axe l’amplitude de la
classe et pour hauteur l’effectif correspondant. La figure obtenue est appelée Histogramme
des effectifs (ou des fréquences si ce sont les fréquences relatives qui sont retenues).
Le tracé reliant le milieu des sommets des rectangles permet d’obtenir le polygone des
effectifs ou des fréquences. L’aire comprise entre le polygone et l’axe des abscisses est égale
à l’aire des rectangles.
Exemple :
La répartition des salaires horaires des 200 ouvriers d’une entreprise est donnée
par le tableau suivant :

Classes de salaires (en UM) Effectifs

De 750 à moins de 1000 20


De 1000 à moins de 1500 60
De 1500 à moins de 2000 80
De 2000 à moins de 3000 40
Total 200

On constate que :
- Les deux classes centrales sont d’amplitudes égales. Elles peuvent être retenus pour
tracer l’histogramme.
- La première classe a une amplitude égale à la moitié de l’amplitude retenue, on
multipliera par deux l’effectif correspondant.
- La dernière classe a une amplitude double de l’amplitude retenue, on porte en
ordonnée un effectif moitié de l’effectif correspondant.

13
Après rectification on obtient le tableau suivant :

Classes de salaires (en UM) Effectifs Effectif rectifié

De 750 à moins de 1000 20 40


De 1000 à moins de 1500 60 60
De 1500 à moins de 2000 80 80
De 2000 à moins de 3000 40 20
Total 200

ni

80

60

20

Salaires H (eUM)
51 10 15 20 25 30
Histogramme des effectifs (classes d’amplitudes différentes)

Courbes cumulatives :

Les courbes cumulatives portent le nom de polygones des effectifs (ou de fréquences)
cumulés croissants et décroissants ; la ligne polygonale est composée de segments dont les
externalités ont pour abscisses les bords des classes et pour ordonnées les effectifs cumulés
(ou les fréquences cumulées) correspondant à ces bords de classes.

Exemple :

Les résultats d’une enquête régionale portant sur la répartition des entreprises selon
le nombre d’employés sont présentés dans le tableau suivant :

14
Nombre d’employés Nombre d’entreprises
(Effectifs)

moins de 5 employés 100


5 – 10 200
10 -20 300
20 – 40 300
40 – 60 100

- Calculons les effectifs cumulés croissants et décroissants


- Calculons les fréquences cumulées croissantes et décroissantes.
- Traçons les polygones cumulés croissants et décroissants.

Classes Effectifs Effectifs cumulés Fréquences (en %)

ni fi C ↑ D ↓ C ↑
D ↓

Moins de 5 employés 100 10 100 1000 10 100

5-10 200 20 300 900 30 90

10- 20 300 30 600 700 60 70

20 -40 300 30 900 400 90 40

40 - 60 100 10 1000 100 100 10

15
ni 
fi 
Polygone des effectifs cumulés décroissants

100 1000
Polygone des effectifs cumulés croissants

50 500

100

100 20 30 40 50 60 Classes

Polygones des effectifs (ou des fréquences)

2) Les représentations sous forme de graphiques non cartésiens

On se limite, ici, sur une seule représentation qui est celle de graphique
circulaire.

Dans le graphique circulaire, les secteurs représentatifs ont une aire, et par conséquent
un angle au centre proportionnel aux effectifs ou aux fréquences des modalités
correspondantes.

Remarque : la totalité des 360° du cercle correspond à l’effectif total ( N ). Si i


n
est l’effectif à représenter, il est traduit sur le cercle par un angle
360⊗ ni
α tel que α= =360 ⊗ f i
N Exemple :
En 2003, les crédits bancaires d’après leur terme se présentaient comme il est consigné
dans le tableau suivant :

Crédit Montant Fréquences


(million) (en %)
Crédit à court terme 43 479 73.38
Crédit à moyen terme 12 039 20.32
Crédit à long terme 3 732 6.30
Total 59 250

16
Tableau récapitulatif

Type de Crédit Montant Angles au centre (degrés)

6
10 UM En %

Crédits à court terme 43 479 73.38 264.17

Crédits à moyen terme 12 039 20.32 73.15

Crédits à long terme 3 732 6.30 22.68

Total 59 250 100 360

N.B : Le graphique peut être tracé à l’aide d’un rapporteur après que l’on aura calculé l’angle
au centre relatif à chaque type de crédit.
Par exemple, l’angle au centre représentatif des crédits à moyen terme est égal à :
(360° ⊗ 20.32)/100 = 73.15

C.C.T

73.38% C.L.T
6.30%

C.M.T

20.32%

Graphique circulaire

Le graphique circulaire permet ainsi de mettre en évidence l’intérêt relatif (en


pourcentage) des crédits à court terme.

En résumé, retenons :
Cas de distributions quantitatives
Les graphiques sont normalement réalisés en portant en abscisse la variable observée et en
ordonnée l’effectif ou la fréquence.
- dans le cas d’une variable discrète, le graphique est un diagramme à bâtons, ainsi apparaît la
discontinuité entre deux valeurs,

17
- dans le cas d’une variable continue, le graphique est un histogramme. La surface limitée par
l’histogramme doit être proportionnelle à l’effectif ou la fréquence. Il convient de prendre
garde à l’amplitude des classes (on se ramène à la plus petite amplitude, amplitude
élémentaire, et on divise la hauteur du rectangle par la mesure de l’amplitude de la classe par
rapport à cette amplitude élémentaire).

Hauteur du rectangle = (Effectif ou fréquence x Amplitude élémentaire) / amplitude de la


classe

Cas de distributions qualitatives

Diverses méthodes sont possibles, par exemple :


- on peut réaliser des diagrammes à bandes
- ou des diagrammes circulaire (à secteurs).

18
Chapitre 3 : Les caractéristiques de tendance centrale
Les résumés statistiques les plus employés sont les caractéristiques de tendance
centrale. Ils recèlent des risques d'erreurs d'autant plus pernicieux que leur calcul ne pose plus
guère aujourd'hui de problème. La vraie question est maintenant :
Quelle caractéristique doit-on calculer ?

Ainsi, par exemple, le spécialiste fiscal et l'économiste ne s'intéressent pas au même


résumé des revenus des ménages mauritaniens : toute une tranche de revenu modestes,
exonérés d'impôt, n'intéresse pas le premier alors que le second doit en tenir compte.
La variété des concepts et des définitions ne doit pas être perçue comme une difficulté,
mais comme la possibilité de répondre à une variété de situations.

3.1) La moyenne arithmétique ou moyenne de grandeur

La moyenne arithmétique d'une série statistique est le quotient de la somme de ses


valeurs par l'effectif total.
C'est ce que le langage courant appelle moyenne, tout court.
On note fréquemment une moyenne par un surlignage; si la variable statistique i x
x ,x ,....., x n , on désigne la moyenne par x̄ et la définition se traduit par
prend les valeurs 1 2
la formule suivante :
n
x 1 + x2 +.. ..+ x n 1
x̄= x̄= ∑ x i
n , écriture que l'on abrège en : n i =1

Si la série a été préalablement groupée en classes, chaque valeur de


x i doit être
comptée autant de fois que la classe contient d'éléments : si la i
ème n
classe a un effectif i ,
pour un effectif total N, la formule de définition devient :
n
n1 x 1 +n2 x 2 +. . ..+n n x n 1
x̄= = ∑ ni x i
N N i =1

Propriétés :

a) Si l'on augmente (ou si l'on diminue) d'une même quantité toutes valeurs d'une série
statistique, la moyenne arithmétique augmente (ou diminue) d'autant :
( x+k)= x̄+k.
b) Si l'on multiplie par un même nombre toutes les valeurs d'une série statistique, la
moyenne arithmétique multipliée par ce nombre : (k x)=k x̄ .
c) Lorsqu'on retranche à toutes les valeurs d'une série statistique leur moyenne
arithmétique, on obtient une nouvelle série de moyenne nulle : on dit qu'on a centré la
série donnée.

19
Exemple :

Les capacités de production en milliers de tonnes des 10 sucreries françaises en


2009 sont les suivantes : 30; 35; 35; 45; 50; 51; 78; 80; 90; 500.

30+35+35+ 45+50+51+78+80+ 90+500


x̄= =99 . 4
La capacité moyenne 10
Les 10 sucreries produisent en moyenne 99.400 tonnes de sucre.
C'est une donnée qui résume la série mais elle en cache les disparités (le grand écart
entre 30 et 500).

Exemple :

Le tableau suivant représente la répartition de 17 sociétés en fonction du capital


social exprimé en milliers d'ouguiyas;

Capital 10 20 30 50 90 100 200 300 Total


social
Nombr 2 2 1 3 1 4 3 1 17
e de
sociétés
ni x i 20 40 30 150 90 400 600 300 1.630

n
1 1
x̄= ∑ ni x i= 1 . 630=95. 88
N i=1 17
Les sociétés sont créées avec un apport moyen de 95.880 UM. Grâce à cette valeur
centrale, une comparaison rapide entre sociétés dans le temps et dans l'espace est possible.
Mais il ne faut pas oublier qu'il s'agit d'une moyenne et une moyenne qui cache des
disparités.

3.2) Le mode ou la moyenne des fréquences

Le mode Mo d’une série statistique est la valeur du caractère la plus fréquente ou


dominante dans l'échantillon. Ainsi, Le mode est la valeur de la variable statistique qui
correspond à l'effectif le plus grand. Une série peut comporter deux (série bimodale) ou
plusieurs modes (série multimodale).

Exemple (variable continue) :

Le tableau suivant représente un échantillon de 1000 personnes de la population


active occupée dans l'agriculture selon le nombre d'heures de travail par semaine.
Déterminer le mode de cette série statistique ?

Classes d'heures 0-20 20-40 40-60 60-80


Effectifs 144 233 454 169

Réponse:
Le mode s'applique à la classe qui correspond à la fréquence la plus élevée : la classe
modale ou classe dominante est 40-60 heures.

20
Nous pouvons toutefois, bien que le mode soit une valeur très instable, à partir d'un
histogramme, obtenir le mode par la formule suivante :
d1
L1 + ( L2 −L1 )
Mode = d 1 +d 2
L1 : Borne inférieure de la classe modale
L2 : Borne supérieure de la classe modale
d1 : Excédent d'effectif de la classe modale par rapport à l'effectif de la classe
inférieure la plus proche

d2 : excédent d'effectif de la classe modale par rapport à l'effectif de la classe


supérieure la plus proche. En appliquant cette formule, on obtient :

L1=40, L2=60, d1= 454-223=221, d2=454-169=285 et L1-L2= 20


221
40+ 20=48 . 735
Le mode peut donc être estimé à : Mo= 221+285
48.75 heures par semaine pourrait être, théoriquement, considéré comme le nombre
d'heures par semaine effectué par l'effectif le plus élevé (454 ouvriers).

Exemple (variable discrète) :

Répartition d'un échantillon de 1000 ménages, selon le nombre de pièces occupées en


2005 :

Nombre de pièces Ménages


1 127
2 273
3 296
4 166
5 138

L'habitation la plus fréquente est celle composée de 3 pièces. Ce type d'habitation


abrite 29.6% des ménages. Dans ce cas, les 3 pièces est la dominante ou la valeur modale car
ce nombre de pièce correspond au pourcentage le plus élevé.

Mo= 3

3.3) La médiane ou moyenne de position

La médiane est la valeur de la variable statistique telle qu'il y ait, dans la série, autant
de valeurs plus grandes que de valeurs plus petites.

Exemple (variable discrète):


3
Les données suivantes représentent le capital social en 10 d'ouguiyas de 17
sociétés mauritaniennes créées entre 01/01/2006 et 31/12/2009 :
20; 30; 50;100; 100; 100; 50;50; 200; 200; 10; 90; 200; 100; 300; 20; 10
Déterminer la médiane ?

21
Il s'agit de chercher une valeur se situant au milieu de la série statistique, c'est-à-dire
qui permette de partager la série en deux séries statistique à effectifs égaux. 10; 10; 20; 20;
30; 50; 50; 50; 90; 100; 100; 100; 100; 200; 200; 200; 300.
Le nombre de valeurs observées (capital social) est 17 (impair); dans ce cas, le capital
médian est la neuvième (90) car il divise le nombre de sociétés en 2 ensembles égaux : 8
sociétés sont créées avec un capital inférieur à 90.000 UM et 8 autres sont créées avec un
capital supérieur à 90.000UM.
Me= 90.00.

Exemple :
3
Les capacités de production de 10 sucreries en France en 2004 (en 10 tonnes) sont
les suivant : 28; 34; 35; 45; 50; 58; 60; 78; 82; 152.
Calculer la médiane ?

Le nombre de valeurs observées est 10 (pair); la capacité de production médiane est


située entre la cinquième capacités (50) et la sixième (58). Dans ce cas-là, on peut estimer la
50+58
M e= =54
production médiane à la demi-somme des valeurs 50 et 58 : 2 cette valeur
divise les 10 sucreries en deux ensembles égaux. Cette médiane ainsi calculée est artificielle.

Exemple :

La série suivante représente les échéances exprimées en jours des 11 effets détenus
par une petite entreprise : 10; 12; 18; 18; 25; 25; 25; 25; 25; 45; 52.
A première vue, 25 jours paraissent partager la série en deux, mais on remarque que 25
laissent 4 observations à gauche et uniquement 2 à droite, ce qui nous laisse dire que la série
ne possède pas de valeur médiane.

Exemple : Variable discrète

Reprenons la répartition des 1000 ménages selon le nombre de pièces occupées en 2005 :

Nombre de pièces Ménages


1 127
2 273
3 296
4 166
5 138

L’effectif est un nombre pair (1000), le rang de la médiane est 1000/2=500.


Le 500° valeur du caractère étudié est, selon l’effectif cumulé croissant, 3 pièces, mais
on peut constater que :
- 400 ménages occupent des logements de moins de 3 pièces ;
- 304 ménages (1000-696) occupent des logements de plus de 3 pièces.
La médiane, ainsi déterminée, ne divise pas l’effectif en 2 ensembles égaux. Il est donc
difficile de définir une médiane pour les séries à variable discrète. Ce sont généralement des
séries sans médiane.

Exemple (variable continue):

22
Reprenons l'échantillon de 1000 personnes de la population active occupée dans
l'agriculture selon le nombre d'heures de travail par semaine.

Calculer la médiane ?

On détermine tout d'abord le rang de la médiane = N/2 et à partir de l'effectifs cumulés


croissant ou décroissants on détermine la classe médiane, qui est, ici, (40-60).
Si on suppose que les effectifs se répartissent d'une manière uniforme à l'intérieur de la
classe, la valeur de la médiane sera :

(500−377 )
M e=40+(60−40 ) =45 . 42 heures
( 831−377 )

Détermination graphique :

La médiane peut être calculée par deux méthodes.

1° Méthode : en traçant la courbe des effectifs cumulés croissants ou décroissants et en


∑ ni
projetant du point d’ordonnée 2 (nombre pair d’observations) une parallèle à l’axe
des x coupant le polygone des effectifs cumulés croissants ou décroissants en un point. De
ce point, on projette une perpendiculaire sur l’axe des x et la médiane s’obtient par lecture
sur l’axe des abscisses.

2° Méthode : il est plus facile de représenter les effectifs cumulés croissants et décroissants et
de projeter du point de rencontre, une perpendiculaire sur l’axe des x . La médiane
correspond au point de rencontre de cette projection avec l’axe des abscisses.

3.4) La moyenne géométrique

La moyenne géométrique est d'une utilisation moins fréquente que la moyenne


arithmétique. Ainsi, elle peut être utilisée par exemple pour :
- Déterminer le taux moyen d'un placement à intérêts composés à taux variables;
- Déterminer les taux équivalents.

Exemple :

Déterminer la moyenne géométrique des données statistiques suivantes :


30; 35; 35; 45; 50; 51; 78; 80; 90; 500.
1
10 10
G= √( 30∗35∗35∗45∗50∗51∗78∗80∗90∗500 )=( 30∗35∗35∗45∗50∗51∗78∗80∗90∗500 )
= 64.17

Exemple :

Un placement est effectué à taux variable pendant 6 ans.


Successivement, le taux annuel est de 4.5% pendant 1 an, 6% pendant 2 ans et 6.5% pendant 3
ans.
Le taux moyen (t) s'obtient en effectuant les calculs suivants :

23
(1+t )6=(1.045)1(1.06 )2 (1.065)3
(1+t )6=1. 045∗1. 1236∗1.207795
(1+t )6=1. 418147
t=1. 4181471/6−1
t=0. 06=6%, c'est une moyenne géométrique.

3.5) La moyenne harmonique

La moyenne harmonique est peu employée. Elle trouve son application la plus
importante dans l'établissement des indices et quelques applications telles que : le prix moyen,
le rendement moyen… la signification exacte est souvent difficile à concevoir.

Exemple : La distribution du personnel d'une entreprise selon le salaire mensuel est


consignée dans le tableau suivant :

S. 9- 10- 11- 12- 13- 14- 15- 16- 17- 18- 19- Tota
mensuel 10 11 12 13 14 15 16 17 18 19 20 l
Nombre 6 10 12 16 20 40 60 40 30 70 20 324
du
personn
el
Centre 9. 1.05 11.5 12. 13.5 14.5 15.5 16. 17.5 18.5 19.5
de 5 5 5
classes
(c)
1/c 0. 0.09 0.08 0.0 0.07 0.06 0.06 0.0 0.05 0.05 0.05
1 5 7 8 4 8 4 6 7 4 1
1 0. 0.95 1.04 1.2 1.48 2.72 3.84 2.4 1.71 3.78 1.02 20.8
ni 6 8 2
c

ni
∑ ci
1 20.82 1 1
= =0.064 H= =15.625 H
=
H 324 0.064 ∑ ni

24

Vous aimerez peut-être aussi