Cours Statistiques L1SA
Cours Statistiques L1SA
Cours Statistiques L1SA
L1 Sciences Alimentaires
Objectif
L’objectif du cours
est d’initier l’étudiant
aux concepts et aux méthodes
statistiques de base.
Matière : Statistiques Appliquées
Unité d’Enseignement Méthodologique : UEM 1.2
Cours : 1H30
TD : 1H30
TP : 1 TP d’initiation aux calculs assistés par ordinateur (CAO)
VHS : 42 heures
VH T.pero. : 33 heures
Crédit : 3
Coefficient : 2
Mode d’évaluation
Contrôle continu (CC) : interrogations, rapports, ….. (25 %)
Examen Final (EMD) (75 %)
Contenu du cours
1. Introduction
2. Statistique descriptive à une dimension
3. Statistique descriptive à deux dimensions
4. Les distributions d’échantillonnage
5. Théorie de l’estimation
6.
Introduction
Les tests statistiques (Notions)
Statistique
C’est un ensemble de méthodes permettant
de décrire (1) et d’analyser (2), de façon
quantifiée, des phénomènes repérés par des
éléments nombreux, de même nature, et
susceptibles d’être dénombrés et classés
Qu’est ce qu’une statistique descriptive ?
Statistique descriptive
C’est l'ensemble des méthodes et techniques
permettant de présenter (1), de décrire (2)
et de résumer (3) des données numériques
nombreuses et variées.
Présentation des données statistiques
N° Note de Nombre
âge Sexe
d’étudiant statistique de crédits
1 20 M 10,25 3
2 18 F 9,75 0
3 18 F 10,5 3
4 19 M 5,25 0
5 20 F 3,75 0
6 21 M 16,25 3
. . . .
. . . .
154 19 M 11,5 3
Présentation des données statistiques
• Chaque étudiant est
un individu ou unité statistique
• L'ensemble des n étudiants est
la population statistique
• La note de matière (/20) est
la variable statistique ou caractère
1,09 . 0,99 . 0,91 . 0,97 . 1,01 . 1,02 . 1,04 . 0,90 . 1,01 . 0,98
N° Sachet Contenu Qualité
1 1,09 Mauvaise
2 0,99 Bonne
3 0,91 Mauvaise
4 0,97 Bonne
5 1,01 Bonne
6 1,02 Bonne
7 1,04 Bonne
8 0,90 Mauvaise
9 1,01 Bonne
10 0,98 Mauvaise
Bonne
D’une façon général,
la statistique descriptive traite les
propriétés de la population statistique
étudiée, que de celles d'individus.
• Exemples de populations.
• Etudiants de L1SA (2016-2017)
• Patients au niveau du CHUC
• Les Boites de conserves dans une unité de production
• Microorganismes dans un milieu donné
Echantillon
C'est un ensemble d'individus prélevés dans une
population déterminée
Exemple d'échantillon.
L'échantillon des véhicules automobiles immatriculés dans un département.
Caractère
C'est un trait déterminé présent chez tous les
individus d'une population sur laquelle on
effectue une étude statistique.
Quantitatif Qualitatif
Mesurable Repérable
Nombre Nombre
Valeurs de Fréquences
Effectifs Fréquences % d‘enfants de familles % fi ´ 100
la variable fi
Xi ni
0 4 0,03 2,58
x1 n1 f1 = n1 / n f1 × 100
1 10 0,06 6,45
... ... ... ... 2 32 0,21 20,65
xi ni fi = ni / n fi × 100 3 44 0,28 28,39
... ... ... ... 4 29 0,19 18,71
xk nk fk = nk / n fk × 100 5 31 0,20 20,00
6 5 0,03 3,23
Total : n 1 100
Total : 155 1 100
Contenu du cours
1. Introduction
2. Statistique descriptive à une dimension
3. Statistique descriptive à deux dimensions
4. Les distributions d’échantillonnage
5. Théorie de l’estimation
6.Statistiques descriptives
Les tests statistiques (Notions) univariées
Les variables seront ensuite analysées
différemment
selon leur nature
(quantitative, qualitative, etc.),
au moyen de
Calcul de
Tableaux Graphiques
paramètres
TABLEAUX
A partir d'un tableau brut :
individus & variables,
… … … … … …
Modalités de Effectif
la variable
"Age" ni
17 01
18 66
19 47
20 19
21 14
22 07
On notera :
• x1, x2, ..., xk les différentes modalités,
• n1, n2, ... , nk les effectifs associés.
0 2
1 1
2 2 10
3 1
4 4
5 2
3 Exclus
6 1
Total 13 13 10
GRAPHIQUES
Les graphiques
Ajournés
Admis
Généralement, on utilise :
• un diagrammes en barres :
100Chaque rectangle a une base
90constante et une hauteur
Admis
80proportionnelle à l'effectif ni ou à la
70fréquence fi .
60 Adjournés
50
40
30
20 Exclus
10
0
Variable Quantitative
• La moyenne arithmétique
• La médiane
• Le mode
Paramètres de tendance centrale
1. La moyenne arithmétique ( )
1. La moyenne arithmétique ( )
0 0.0208 2.08
1 0.1458 14.58
2 0.2396 23.96
3 0.2500 25.00
4 0.1875 18.75
5 0.0938 9.38
6 0.0625 6.25
Total : 1 100
1. La moyenne arithmétique ( )
1. La moyenne arithmétique ( )
1. La moyenne arithmétique ( )
1. La moyenne arithmétique ( )
• Exemple :
Comparaison entre les 6 groupes de L1SA.
Paramètres de tendance centrale
2. La médiane (M)
2. La médiane (M)
Paramètres de tendance centrale
2. La médiane (M)
12,50
• Par exemple, 13,25
11,75
Déterminez la médiane de la 09,50
série des notes des étudiants de 14,75
L1SA ?
11,50
12,50
Quelle serait sa valeur si on 13,75
ajoute une autre note d’un 14,00
étudiant (2,50) ?
10,75
Paramètres de tendance centrale
2. La médiane (M)
2. La médiane (M)
Par exemple,
Notes ni ni cummulé
8-10 12 12
10-12 24 36
12-14 90 126
14-16 28 154
2. La médiane (M)
En général
alors
Paramètres de tendance centrale
2. La médiane (M)
3. Le Mode
3. Le Mode
3. Le Mode
• Minimum, Maximum
• Quartiles
• Déciles
• Centiles
Paramètres de tendance centrale
4. Le minimum (min)
5. Le maximum (max)
6. Les quantiles
Q1 : la plus petite des valeurs D1 : la plus petite des valeurs C1 : la plus petite des valeurs
q de (X) telles qu’au moins 25 d de (X) telles qu’au moins 10 c de (X) telles qu’au moins 1
% des termes de (X) soient % des termes de (X) soient % des termes de (X) soient
inférieurs ou égaux à q. inférieurs ou égaux à d. inférieurs ou égaux à c.
Q2 : la plus petite des valeurs D5 : la plus petite des valeurs C50 : la plus petite des valeurs
q de (X) telles qu’au moins 50 d de (X) telles qu’au moins 50 c de (X) telles qu’au moins 50
% des termes de (X) soient % des termes de (X) soient % des termes de (X) soient
inférieurs ou égaux à q. inférieurs ou égaux à d. inférieurs ou égaux à c.
Q3 : la plus petite des valeurs D9 : la plus petite des valeurs C99 : la plus petite des valeurs
q de (X) telles qu’au moins 75 d de (X) telles qu’au moins 90 c de (X) telles qu’au moins 99
% des termes de (X) soient % des termes de (X) soient % des termes de (X) soient
inférieurs ou égaux à q. inférieurs ou égaux à d. inférieurs ou égaux à c.
min Q1 Q3 max
Moyenne
Médiane
Mode
Q0 = Min Q1 Q2 Q3 Q4 = Max
Médiane
Moyenne
Moyenne
Médiane
min max
Q1 Q3
Q0 = Min Q1 Q2 Q3 Q4 = Max
Q1 Q3 max
min
Q0 = Min Q1 Q2 Q3 Q4 = Max
Q0 = Min Q1 Q2 Q3
Q4 = Max
La boite à moustaches
Boxplot
Paramètres de dispersion
Paramètres de dispersion
Dans le cas ou deux distributions ayant des
caractéristiques de tendance centrale voisines
peuvent être très différentes.
7. L’étendue (E)
E = Max.(X) – Min.(X)
Paramètres de dispersion
7. L’étendue (E)
Soit
EIQ = Q3 - Q1
Paramètres de dispersion
Var(x) =
= Var(x)
• L’âge ;
• La spécialité du Baccalauréat ;
• La mention du baccalauréat ;
• Nombre d’années à l’université ;
• La formation poursuivie ;
• ….
Le résultat est présenté sous la forme du tableau ci-
dessous , individus variables
Nombre
Age
Baccalauréat Mention d’années à Formation
Étudiant (an)
l’université
• L’âge ;
• La spécialité du Baccalauréat ;
• La mention du baccalauréat ;
• Nombre d’années à l’université ;
• La formation poursuivie ;
Mais ceci ne nous permet pas de mettre en évidence
Distribution jointe
Modalités de (X,Y) : (m1;m’1); (m2;m’2); ………..; (mp;m’q)
Effectifs associés : nij ; i = 1,…,p ; j = 1,…,q
p q
n n
i 1 j 1
ij
Distributions marginales
Distribution de X et Distribution de Y .
p
Exemple
Taux d’absence
Faible Moyen Élevé
Admis 73 15 6
Résultats Ajournés 25 18 16
Exclus 1 3 13
Une variable qualitative et une quantitative
Variable qualitative : X ; Variable quantitative : Y
Distributions conditionnelles
Représenter les distributions conditionnelles et la distribution
marginale de Y .
Décomposition de la moyenne 1 p
y ni yi
La moyenne globale de Y : n i 1
La moyenne globale n’est pas égale à la moyenne des moyennes conditionnelles
mais à une moyenne pondérée par les fréquences.
Décomposition de la variance 2
La variance globale de Y : 1 p 1 p
s ² ni si ² ni ( y i y )
n i 1 n i 1
Une variable qualitative et une quantitative
Exemple
Emploi (parents)
Sans Contrat Titulaire
0 16 17 23
1 15 14 13
Nombre
2 17 11 17
d’enfant
3 13 18 11
4 11 12 7
Deux variables quantitatives
Covariance intensité
Corrélation type de relation forme
Régression sens
Deux variables quantitatives
Exemple
Individu Poids (kg) Taille (cm)
1 3,21 48,6
2 3,03 49,3
3 2,92 47,2
4 3,46 50,5
5 3,78 51,2
6 2,87 49,9
7 3,76 52,1
8 3,34 50
9 2,97 50,2
10 3,56 52,1
Tableau de contingence
Avec :
X possède p modalités : x1, x2, x3, ..., xi, ..., xp
Y possède q modalités : y1, y2, y3, …, yj, ..., yq
Tableau de contingence
Y
y1 y2 y3 ………….….. yj …….………….... Yq ni.
X
x1 n11 n12 n13 n1j n1q n1.
x2 n21 n22 n23 n2.
. . .
. . .
. . .
xi ni1 nij ni.
. . .
. . .
. . .
xp np1 npq np.
[19 - 20[ 9 11 0 1 0 0 21
[20 - 21[ 8 8 7 0 0 0 23
[21 - 22[ 2 10 8 3 3 0 26
[22 - 23[ 1 3 12 6 4 0 26
[23 - 24[ 1 4 1 10 8 0 24
[24 - 25[ 0 2 3 11 14 1 31
> 25 0 1 4 11 10 3 29
Total 39 41 35 42 39 4 200
• On appelle distribution marginale de X la distribution à une
dimension des individus de la population qui présente une modalité
de X quelque soit la modalité de Y.
• De façon analogue, on définit celle de Y.
Réduction des données
1
x xi
n i
1
y yi
n i
1
Var ( x) ( xi x) 2
n i
1
Var (Y ) ( y j y)²
n j
Moyennes et variances marginales
Exemple
Modalités X Y
1 152 26
2 155 27 x
948
158
3 160 28 6
4 155 28
5 162 29 203
y 29
6 164 30 7
7 35
Somme 948 203
Moyennes et variances marginales
Exemple
1 p
cov( x, y)
n i 1
( xi x) ( yi y)
La covariance est :
Comment ?
La corrélation
La corrélation
Le coefficient de corrélation linéaire a pour objet de
mesurer l'intensité de la liaison linéaire entre les deux
variables X et Y :
cov( x, y )
r
( x) ( y)
objectif principal
Modèles probabilistes
Les deux aspects de la statistique se complètent
bien plus qu’ils ne s’opposent.
Exemple numérique :
AB Ab aB Ab
Observée 100 18 24 18
AB Ab aB Ab
Théorique 9 3 3 1
Observée 100 18 24 18
AB Ab aB Ab Total
Théorique 9 3 3 1 16
Observée 100 18 24 18 160
AB Ab aB Ab Total
Théorique 90 30 30 10 160
Observée 100 18 24 18 160
Test statistique
Hypothèses testées
selon les résultats du test :
Nouvelles hypothèses
peuvent être bâties et à nouveau testées.
Une série d’observations portant sur une variable
peut être décrite par :
• Tests paramétriques
Permettent de comparer des paramètres entre eux
• Tests semi-paramétriques
Permettent de comparer des distributions entre elles.
Applications des tests statistiques
Deux situations
Tests de Tests de
Comparaison Liaison
entre les séries entre deux variables
Tests de Comparaison
Existe deux situations
Principe
H1 bilatérale
Paramètre population 1 ≠ Paramètre population 2
H1 Unilatérale
Paramètre population 1 > Paramètre population 2
ou
Paramètre population 1 < Paramètre population 2
3. Calculer la valeur du test
Rejet Acceptation
H0 H1
Les types de tests de comparaison
Test Z : Ecart réduit
Deux cas :
A B
(observée) (théorique)
Caractère Répartition de A Répartition de B
1 n1 n’1
2 n2 n’2
3 n3 n’3
. . .
. . .
. . .
. . .
.
k nk n’k
∑n = N ∑n’ = N
H0 : A et B sont conformes ?
H1 : A et B sont différentes ?
Conclusion :
L’échantillon n’est pas conforme
au risque α=5 % puisque