Chapitres 1, 2 Et 3 Stat Descr New VF
Chapitres 1, 2 Et 3 Stat Descr New VF
Chapitres 1, 2 Et 3 Stat Descr New VF
1
Chapitre 1) Introduction générale : Vocabulaire et outils de base
de la Statistique
Comme tout discipline, la Statistique a son propre vocabulaire, ses propres concepts et
utilise un certain nombre d’outils mathématiques ou probabilistes qu’il est indispensable de
connaître avant de se lancer dans un travail statistique proprement dit.
Les statistiques, au pluriel, sont des chiffres relatifs à un caractère déterminé, collectés
sur des individus (l’individu au sens large du terme). Ils peuvent aussi parfois prendre la
forme de chiffres synthétiques plus élaborées, calculés selon des procédures diverses à partir
de statistiques primaires. A titre d’exemples on peut citer les statistiques de synthèse relatives
à la tendance centrale, la dispersion, à la forme, à la concentration d’une population, ou
encore celles caractérisant les tests.
La Statistique, au singulier, avec la première lettre en majuscule, peut être définie comme
étant la science de l’étude des statistiques au pluriel, ces dernières constituent sa matière
première. Il s’agit d’un ensemble de procédés et de méthodes mathématiques appliqués à
l’étude des statistiques à des fins d’informations et de décision. Elle consiste à collecter,
présenter, analyser et utiliser des observations (des données) afin d'aider à la prise de
décisions et à la résolution de problèmes;
Le premier phénomène qui ressort des observations est la variabilité des données;
On distingue 2 types d’études statistiques :
La statistique descriptive ou statistique déductive s'occupe de la description des
données: tableau, graphique, pourcentage, ...
et la statistique inductive ou inférence statistique qui s'occupe de tirer des conclusions
générales à partir d'expériences et de faire des prévisions.
Dans le mot Statistique il y a le mot statuts (mot grec), qui veut dire : établir, constater,
et il veut dire aussi état, avec un e en minuscule, situation. Mais il évoque également un autre
sens, celui de l’Etat, avec un E en majuscule; c’est-à-dire la personne suprême du droit public,
douée de souveraineté.
Le terme Statistique a été proposé pour la première fois en 1748 par Achenwall,
professeur à l’Université de Göttingen. L’Académie française le reconnaîtra un siècle plus
tard, en 1835.
Définition : la statistique est une méthode scientifique qui consiste à réunir des
données chiffrées sur des ensembles nombreux, puis à analyser, à commenter et à critiquer ces
données.
Cette science n’a pas pour objet la connaissance des éléments des ensembles dans ce
qui fait leur individualité, mais au contraire dans ce qu’ils ont en commun : il s’agit d’obtenir
des résultats globaux. Ainsi, une enquête statistique portant sur des personnes n’a pas besoin
de faire intervenir leurs noms, mais seulement les renseignements que l’on désire étudier : elle
permet de connaître la répartition de ces personnes par âge, par sexe, groupe sanguin …
2
1.2) Notion de population statistique
Nous appelons population statistique ou univers statistique, un ensemble d’éléments
sur lesquels porte l’étude statistique envisagée, et qui peuvent être des êtres vivants, des êtres
humains, des objets, des caractères ou autres.
Exemple :
- L’ensemble du personnel de l’entreprise ;
- L’ensemble des chèques impayés dans l’année
Une population est un ensemble d’individus (ou unités statistiques) pour lequel on considère
une ou plusieurs caractéristiques. La taille de la population est le nombre d'individus
constituant cette population, noté N.
L’échantillonnage représente l’ensemble des opérations qui ont pour objet de prélever
un certain nombre d’individus dans une population donnée.
Pour que les résultats observés lors d’une étude soient généralisables à la population
statistique, l’échantillon doit être représentatif de cette dernière, c’est à dire qu’il doit refléter
fidèlement sa composition et sa complexité. Seul l’échantillonnage aléatoire assure la
représentativité de l’échantillon.
Il s’agit d’une caractéristique susceptible de variations observables. Les valeurs sont les
mesures distinctes d'une caractéristique donnée. Les valeurs possibles sont tous les résultats
3
possibles a priori si on fait une observation d'une variable et la valeur observée est le résultat
a posteriori d'une observation d'une variable.
c) – Caractère Ordinal : parfois, on rencontre des caractères statistiques dont les différentes,
modalités se caractérisent, non par leurs valeurs, mais par leurs classements (variable
ordinale) exemple (fort, moyen, faible.).
d)- Caractère binaire : c’est un caractère dont les modalités ne peuvent prendre que deux
valeurs seulement : vrai ou faux, succès ou échec, 0 ou 1.
Une variable quantitative est dite discrète si l’étendue des valeurs possibles est dénombrable,
c’est-à-dire si les valeurs peuvent être énumérées sous la forme d’une liste de chiffre (a 1, a2,
…) ou plus souvent d’entiers naturels (0, 1, 2, 3,…).
Exemples : Nombre d’objets dans un dépôt, nombre de mots dans une phrase, nombre de
raisins sur une grappe, Nombre de mots dans un texte.
Image géométrique :
4
Ainsi, le choix de la méthode statistique se fait suivant la nature de la variable.
1. Variables qualitatives
Echelle nominale
Echelle ordinale
2. Variables quantitatives
Variables discrètes
Variables continues.
Variable qualitative:
Échelle nominale :
On dit d’une variable dont les catégories ne sont pas naturellement ordonnées, qu’elle est
définie sur une échelle nominale.
Exemples : sexe, types de haches, types d’amphores...
Échelle ordinale :
Si les catégories peuvent être ordonnées, on est en présence d’une échelle ordinale.
Exemples : qualification professionnelle (travail d’un potier) ‘non qualifié’, ‘semi - qualifié’,
‘qualifié ’.
5
Exemples : Pour des chômeurs, l’âge est un caractère quantitatif continu ; le nombre
d’enfants est un caractère quantitatif discret. Pour des automobiles, la couleur est un caractère
qualitatif.
On peut évoquer que le but d’une étude statistique est de se faire une idée assez juste des
variations d'une variable dans une population. Dans ce cadre, la démarche peut être
schématisée de manière sommaire comme suit :
6
Chapitre 2) : Tableaux et Représentations Graphiques
2.1) Tableau statistique à simple entrée
Le tableau statistique à simple entrée sera celui où figurent deux colonnes réservées
respectivement :
- La première à l’inscription des modalités prises par le caractère, ou la valeur prises par
la variable, désignées par
x i ;
- La seconde, à l’inscription des effectifs correspondants, désignés par
ni .
Nombre d’enfants à
Effectif (
ni )
x
charge ( i )
0 4
1 15
2 29
3 18
4 10
5 3
6 1
Dans cet exemple la variable est discrète et prend les sept valeurs suivantes :
x 1=0 , x 2 =1, . .. .. . .. .. . .. .. . .. , x7 =6
A chacune de ces valeurs correspond son effectif :
n1=4 ,n2 =15 ,. ... .. .. . ..... , n7 =1
n1 + n2 +. .. . .+ n7 =∑ ni
L’effectif total N est égale à i =1
Salaire horaire
Effectifs (
ni )
[47.50 – 52.50 [ 10
52.5-57.5 [ 30
57.5-60.5 60
60.50-63.5 72
63.5-67.50 40
67-8-73.50 24
73.50-80.5 14
7
n
250
∑ ni
i=1
Il importe que les classes recouvrent tous les résultats et aient une intersection vide, d’où les
formulations du type « de … à moins de …» ; la différence entre les deux extrémités est
appelé amplitude de la classe.
L’amplitude de classe est alors donnée par : (Valeur maximale – Valeur minimale) / Nombre
de classes
L’effectif d’une classe est le nombre d’éléments de la population observés dans cette classe.
c) La Fréquence :
ni
=f i
C’est le quotient ∑ ni
x
est la fréquence de la mesure i du caractère
La fréquence d’une classe est le rapport de son effectif à l’effectif total de la population.
La fréquence est exprimée en pourcentage.
d) Effectifs cumulés :
À partir des effectifs ou des fréquences, on peut calculer des effectifs cumulés (croissants
ou décroissants) ou les fréquences cumulées (croît↑ ou décroît ↓) qui permettraient de
répondre aux questions suivantes, dans le cas qui nous occupe :
- Quel est le nombre d’ouvriers dont le salaire horaire est inférieur à 63.5 ? Réponse :
172
- Quel est le nombre d’ouvrier percevant au moins 63.5 ? Réponse : 78.
L’âge en année
[3−4[ 4-5 5-6 Totaux
marginaux
Le poids (en Kg)
15 [ 19 1 1 27
[15−20[ 32 21 12 65
20-25 3 18 28 49
25-30 4 3 1 8
Totaux marginaux 58 49 42 149
Interprétations des nombres portés dans le tableau :
L’intérêt du graphique est de donner une image qui permet de voir facilement la
tendance générale du phénomène étudié et de mettre en évidence certains faits essentiels.
Cependant, selon la nature de la variable étudié et l’objectif de l’étude, nous utilisons
différents types de constructions graphiques.
1 100
2 120
3 60
4 80
5 40
9
Digramme en bâtons des effectifs
100 Effectifs
80
120
60
100
40
0
80
60
40
20
11 2 3 4 5 Modalités
Digramme en bâtons des effectifs
Ici, les effectifs se trouvent sur l’axe des ordonnées sont remplacés par les fréquences
relatives. Le schéma obtenu est appelé diagramme en Bâtons des fréquences.
1 100 0.25
2 120 0.30
3 60 0.15
4 80 0.20
5 40 0.10
Total 400 1.00
10
Fréquences
0.30
0.10
11 2 3 4 5 Modalités
Digramme en bâtons des fréquences
Remarque : Si on joint les sommets des bâtons, nous obtenons un polygone des
effectifs ou de fréquences.
Diagrammes cumulatifs :
11
ni
fi
400
75
280
25 100
11 2 3 4 5 Nbr d’étoiles
Digramme en escaliers des effectifs cumulés croissants
Remarques :
Exemple : les salaires horaires des 100 ouvriers d’une entreprise sont consignés
dans le tableau suivant :
12
fi ni
40
0.30 30
0.10 10
51 10 15 20 25 Nbr d’étoiles
Histogramme des effectifs (classes de mêmes amplitudes)
La représentation est faite à l’aide de rectangles qui ont pour axe l’amplitude de la
classe et pour hauteur l’effectif correspondant. La figure obtenue est appelée Histogramme
des effectifs (ou des fréquences si ce sont les fréquences relatives qui sont retenues).
Le tracé reliant le milieu des sommets des rectangles permet d’obtenir le polygone des
effectifs ou des fréquences. L’aire comprise entre le polygone et l’axe des abscisses est égale
à l’aire des rectangles.
Exemple :
La répartition des salaires horaires des 200 ouvriers d’une entreprise est donnée
par le tableau suivant :
On constate que :
- Les deux classes centrales sont d’amplitudes égales. Elles peuvent être retenus pour
tracer l’histogramme.
- La première classe a une amplitude égale à la moitié de l’amplitude retenue, on
multipliera par deux l’effectif correspondant.
- La dernière classe a une amplitude double de l’amplitude retenue, on porte en
ordonnée un effectif moitié de l’effectif correspondant.
13
Après rectification on obtient le tableau suivant :
ni
80
60
20
Salaires H (eUM)
51 10 15 20 25 30
Histogramme des effectifs (classes d’amplitudes différentes)
Courbes cumulatives :
Les courbes cumulatives portent le nom de polygones des effectifs (ou de fréquences)
cumulés croissants et décroissants ; la ligne polygonale est composée de segments dont les
externalités ont pour abscisses les bords des classes et pour ordonnées les effectifs cumulés
(ou les fréquences cumulées) correspondant à ces bords de classes.
Exemple :
Les résultats d’une enquête régionale portant sur la répartition des entreprises selon
le nombre d’employés sont présentés dans le tableau suivant :
14
Nombre d’employés Nombre d’entreprises
(Effectifs)
ni fi C ↑ D ↓ C ↑
D ↓
15
ni
fi
Polygone des effectifs cumulés décroissants
100 1000
Polygone des effectifs cumulés croissants
50 500
100
100 20 30 40 50 60 Classes
On se limite, ici, sur une seule représentation qui est celle de graphique
circulaire.
Dans le graphique circulaire, les secteurs représentatifs ont une aire, et par conséquent
un angle au centre proportionnel aux effectifs ou aux fréquences des modalités
correspondantes.
16
Tableau récapitulatif
6
10 UM En %
N.B : Le graphique peut être tracé à l’aide d’un rapporteur après que l’on aura calculé l’angle
au centre relatif à chaque type de crédit.
Par exemple, l’angle au centre représentatif des crédits à moyen terme est égal à :
(360° ⊗ 20.32)/100 = 73.15
C.C.T
73.38% C.L.T
6.30%
C.M.T
20.32%
Graphique circulaire
En résumé, retenons :
Cas de distributions quantitatives
Les graphiques sont normalement réalisés en portant en abscisse la variable observée et en
ordonnée l’effectif ou la fréquence.
- dans le cas d’une variable discrète, le graphique est un diagramme à bâtons, ainsi apparaît la
discontinuité entre deux valeurs,
17
- dans le cas d’une variable continue, le graphique est un histogramme. La surface limitée par
l’histogramme doit être proportionnelle à l’effectif ou la fréquence. Il convient de prendre
garde à l’amplitude des classes (on se ramène à la plus petite amplitude, amplitude
élémentaire, et on divise la hauteur du rectangle par la mesure de l’amplitude de la classe par
rapport à cette amplitude élémentaire).
18
Chapitre 3 : Les caractéristiques de tendance centrale
Les résumés statistiques les plus employés sont les caractéristiques de tendance
centrale. Ils recèlent des risques d'erreurs d'autant plus pernicieux que leur calcul ne pose plus
guère aujourd'hui de problème. La vraie question est maintenant :
Quelle caractéristique doit-on calculer ?
Propriétés :
a) Si l'on augmente (ou si l'on diminue) d'une même quantité toutes valeurs d'une série
statistique, la moyenne arithmétique augmente (ou diminue) d'autant :
( x+k)= x̄+k.
b) Si l'on multiplie par un même nombre toutes les valeurs d'une série statistique, la
moyenne arithmétique multipliée par ce nombre : (k x)=k x̄ .
c) Lorsqu'on retranche à toutes les valeurs d'une série statistique leur moyenne
arithmétique, on obtient une nouvelle série de moyenne nulle : on dit qu'on a centré la
série donnée.
19
Exemple :
Exemple :
n
1 1
x̄= ∑ ni x i= 1 . 630=95. 88
N i=1 17
Les sociétés sont créées avec un apport moyen de 95.880 UM. Grâce à cette valeur
centrale, une comparaison rapide entre sociétés dans le temps et dans l'espace est possible.
Mais il ne faut pas oublier qu'il s'agit d'une moyenne et une moyenne qui cache des
disparités.
Réponse:
Le mode s'applique à la classe qui correspond à la fréquence la plus élevée : la classe
modale ou classe dominante est 40-60 heures.
20
Nous pouvons toutefois, bien que le mode soit une valeur très instable, à partir d'un
histogramme, obtenir le mode par la formule suivante :
d1
L1 + ( L2 −L1 )
Mode = d 1 +d 2
L1 : Borne inférieure de la classe modale
L2 : Borne supérieure de la classe modale
d1 : Excédent d'effectif de la classe modale par rapport à l'effectif de la classe
inférieure la plus proche
Mo= 3
La médiane est la valeur de la variable statistique telle qu'il y ait, dans la série, autant
de valeurs plus grandes que de valeurs plus petites.
21
Il s'agit de chercher une valeur se situant au milieu de la série statistique, c'est-à-dire
qui permette de partager la série en deux séries statistique à effectifs égaux. 10; 10; 20; 20;
30; 50; 50; 50; 90; 100; 100; 100; 100; 200; 200; 200; 300.
Le nombre de valeurs observées (capital social) est 17 (impair); dans ce cas, le capital
médian est la neuvième (90) car il divise le nombre de sociétés en 2 ensembles égaux : 8
sociétés sont créées avec un capital inférieur à 90.000 UM et 8 autres sont créées avec un
capital supérieur à 90.000UM.
Me= 90.00.
Exemple :
3
Les capacités de production de 10 sucreries en France en 2004 (en 10 tonnes) sont
les suivant : 28; 34; 35; 45; 50; 58; 60; 78; 82; 152.
Calculer la médiane ?
Exemple :
La série suivante représente les échéances exprimées en jours des 11 effets détenus
par une petite entreprise : 10; 12; 18; 18; 25; 25; 25; 25; 25; 45; 52.
A première vue, 25 jours paraissent partager la série en deux, mais on remarque que 25
laissent 4 observations à gauche et uniquement 2 à droite, ce qui nous laisse dire que la série
ne possède pas de valeur médiane.
Reprenons la répartition des 1000 ménages selon le nombre de pièces occupées en 2005 :
22
Reprenons l'échantillon de 1000 personnes de la population active occupée dans
l'agriculture selon le nombre d'heures de travail par semaine.
Calculer la médiane ?
(500−377 )
M e=40+(60−40 ) =45 . 42 heures
( 831−377 )
Détermination graphique :
2° Méthode : il est plus facile de représenter les effectifs cumulés croissants et décroissants et
de projeter du point de rencontre, une perpendiculaire sur l’axe des x . La médiane
correspond au point de rencontre de cette projection avec l’axe des abscisses.
Exemple :
Exemple :
23
(1+t )6=(1.045)1(1.06 )2 (1.065)3
(1+t )6=1. 045∗1. 1236∗1.207795
(1+t )6=1. 418147
t=1. 4181471/6−1
t=0. 06=6%, c'est une moyenne géométrique.
La moyenne harmonique est peu employée. Elle trouve son application la plus
importante dans l'établissement des indices et quelques applications telles que : le prix moyen,
le rendement moyen… la signification exacte est souvent difficile à concevoir.
S. 9- 10- 11- 12- 13- 14- 15- 16- 17- 18- 19- Tota
mensuel 10 11 12 13 14 15 16 17 18 19 20 l
Nombre 6 10 12 16 20 40 60 40 30 70 20 324
du
personn
el
Centre 9. 1.05 11.5 12. 13.5 14.5 15.5 16. 17.5 18.5 19.5
de 5 5 5
classes
(c)
1/c 0. 0.09 0.08 0.0 0.07 0.06 0.06 0.0 0.05 0.05 0.05
1 5 7 8 4 8 4 6 7 4 1
1 0. 0.95 1.04 1.2 1.48 2.72 3.84 2.4 1.71 3.78 1.02 20.8
ni 6 8 2
c
ni
∑ ci
1 20.82 1 1
= =0.064 H= =15.625 H
=
H 324 0.064 ∑ ni
24