Chapitre 5 REGRESSION LINEAIRE SIMPLE & NON LINEAIRE

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 39

Master : Management Marketing

Master : Management Stratégique et Système d’information

Module : Analyse De Données "ADD"


S3 – 2024/2025

Cours 5 :
REGRESSION LINEAIRE ET NON LINEAIRE SIMPLE

M. ZEROUTI

Professeur à l’ENSM
1
Objectifs du cours
A l’issu de ce chapitre, les étudiants devront être en mesure de :

• Connaître les étapes à suivre pour la modélisation de la relation entre


deux variables;

• Appliquer les tests statistiques les plus importants pour la validation


d’un modèle de régression;

• Comprendre l’utilité des modèles de régression non linéaire;

• Distinguer les principaux modèles non linéaire.

Pr. ZEROUTI ADD- S3-MM & MSSI- 2024/2025- ENSM 2


Plan du cours
1- Régression linéaire simple :
1- Qu’est ce qu’un modèle
2- Les étapes de construction d’un modèle économétrique
3- Présentation du Modèle de Régression Linéaire Simple "MRLS"
4- Estimation du modèle avec la méthode des Moindres Carrés Ordinaires
5- Tests de significativités des paramètres a et b
6- Analyse de la variance "ANOVA"
7- Prédiction de la variable expliquée Yi
2- Régression non linéaire :
1- Pourquoi l’ajustement non linéaire ?
2- Ajustement exponentiel ;
3- Ajustement logarithme ;
4- Ajustement puissance.

Pr. ZEROUTI ADD- S3-MM & MSSI- 2024/2025- ENSM 3


1- Régression linéaire simple
1-Qu’est ce qu’un modèle :
• Présentation formalisée d’un phénomène sous forme d’équation dont
les variables sont des grandeurs économiques.

• Représenter les traits les plus marquants d’une réalité économique;

• Hypothèse "toutes choses égales par ailleurs".

Pr. ZEROUTI ADD- S3-MM & MSSI- 2024/2025- ENSM 4


1- Régression linéaire simple
1-2- Rôle du modèle économétrique ou l’Économétrie :

A- Le modèle comme outil de validation de la théorie :

• Outil qui permet d’infirmer ou de confirmer les théories


économiques.

• Le schéma ci-après résume cette finalité.

Pr. ZEROUTI ADD- S3-MM & MSSI- 2024/2025- ENSM 5


1- Régression linéaire simple

Pr. ZEROUTI ADD- S3-MM & MSSI- 2024/2025- ENSM 6


1- Régression linéaire simple
B- Le modèle comme outil d’investigation :

• La mise en évidence de relations entre des indicateurs économiques


qui n’étaient pas à priori évidentes ou pressenties ;

• La simulation : qui permet de mesurer l’impact de la modification de


la valeur d’une variable sur une ou plusieurs autres variables ;

• La prévision (à court terme) : elle est utilisée par les décideurs afin
d’éclairer le futur et de se préparer à des éventuels changements sur
l’environnement.

Pr. ZEROUTI ADD- S3-MM & MSSI- 2024/2025- ENSM 7


1- Régression linéaire simple
2- Les étapes de construction d’un modèle économétrique :
4 étapes
A- Spécification : Cette phase est scindée en deux étapes :
• Formulation du problème économique :
– Problème spécifique à résoudre ;
– Constitution d’une banque de données.
• Formulation du modèle :
- Identification des variables dépendantes et indépendantes ; signes
attendus des coefficients ;
- Type de modèle (équation unique ou équations simultanées).

Pr. ZEROUTI ADD- S3-MM & MSSI- 2024/2025- ENSM 8


1- Régression linéaire simple

B- Estimation du modèle :

• Analyse des données : représentations graphiques, Mesures de

position et de dispersion…

• Estimation des paramètres du modèle.

Pr. ZEROUTI ADD- S3-MM & MSSI- 2024/2025- ENSM 9


1- Régression linéaire simple
C- Validation : l’économètre va focaliser son analyse sur les points
suivants :
• Pertinence économique du modèle : est ce que le modèle estimé
reflète la réalité économique ;
• Mesure de la qualité globale de l’ajustement, où on fait appel à la
théorie des tests statistique et le coefficient de détermination ;
• Mesure de la qualité individuelle des estimateurs, là encore on fait
appel aux tests statistiques ainsi que le coefficient de corrélation ;
• Analyse des résidus : ou l’analyse de la variance "ANOVA" qui a pour
objet de mesurer la masse d’information expliquée et non expliquée
par le modèle.

Pr. ZEROUTI ADD- S3-MM & MSSI- 2024/2025- ENSM 10


1- Régression linéaire simple

D- Utilisation du modèle : Une fois le modèle économétrique estimé et


validé, on peut l’utiliser afin de faire :
• Une analyse rétrospective ;
• Des prévisions à court terme.

Pr. ZEROUTI ADD- S3-MM & MSSI- 2024/2025- ENSM 11


1- Régression linéaire simple
3- Présentation du Modèle de Régression Linéaire Simple "MRLS":

• Généralités sur le MRLS : le MRLS permet d’expliquer une variable


endogène (expliquée, dépendante) "Yi" en fonction d’une autre
variable explicative (exogène, indépendante) "Xi".

• la forme générale du MRLS est suivante :

Yi= a+ b Xi + ξi. i=1…n.

Yi : est une variable endogène, inconnue et aléatoire.

Xi : Est une variable exogène, connue (mesurer sans erreur) et non


aléatoire.

Pr. ZEROUTI ADD- S3-MM & MSSI- 2024/2025- ENSM 12


1- Régression linéaire simple
• ξi : est le terme d’erreur ou l’aléa, inconnue et non observé;

• Comme la variable Xi n’explique pas pleinement la variable Yi , nous


ajoutons ce terme pour englober l’ensemble des autres variables qui
peuvent avoir un impacte (positif ou négatif) sur Yi ,

Hypothèse Toutes choses égales par ailleurs. Cétirus Paribus

• n : représente le nombre d’observation ou la taille de l’échantillon.

Pr. ZEROUTI ADD- S3-MM & MSSI- 2024/2025- ENSM 13


1- Régression linéaire simple
Exemple introductif du MRLS :
• Considérons l’analyse, pour une période donnée, des dépenses en
publicité via les réseau sociaux (Di) sur le chiffre d’affaire (CAi) d’une
entreprise.
CAi = a + b*Di + ξi.
Où :
• CAi : Chiffre d’affaire ;
• Di : dépenses en publicité via les réseau sociaux ;
• a : Le chiffre d’affaire minimum quand les dépenses en publicité via
les réseau sociaux s’annulent ;
• b : Élasticité : Le degré de sensibilité de la variation du chiffre
d’affaire suite à la variation dépenses en publicité via les réseau
sociaux ;
Pr. ZEROUTI ADD- S3-MM & MSSI- 2024/2025- ENSM 14
1- Régression linéaire simple
• ξi : le terme d’erreur : les autres variables (facteurs), non prise en
charge par le modèle, qui peuvent expliquer le chiffre d’affaire de
cette entreprise; Tel que:

 Motivation, Productivité, Digitalisation…

 Dans le modèle économétrique, ces facteurs sont pris en compte


par l’aléa ξi.

Pr. ZEROUTI ADD- S3-MM & MSSI- 2024/2025- ENSM 15


1- Régression linéaire simple
4- Estimation du modèle avec la méthode des Moindres Carrés
Ordinaires "MCO": C’est la méthode d’estimation de base des
paramètres a et b du modèle de régression linéaire simple : Yi= a+ b Xi+
ξi.

Pr. ZEROUTI ADD- S3-MM & MSSI- 2024/2025- ENSM 16


1- Régression linéaire simple
Estimation des paramètres a et b par la méthode MCO :
• Le principe de MCO consiste à minimiser la somme des résidus aux
carrés.
• On a :
• On cherche à minimiser : S= ∑ei2.
• D’après les conditions du premier ordre :
• La solution est donnée par les deux équations :

• De (1) et (2) on déduit :

Pr. ZEROUTI ADD- S3-MM & MSSI- 2024/2025- ENSM 17


1- Régression linéaire simple
5- Tests de significativités des paramètres a et b

• Test de signification du paramètre :


. La statistique du test :

• Règle de décision :
Avec « α » un risque d’erreur fixé généralement à 5%.
si:
alors l’hypothèse Ho est rejetée au seuil de α% et le paramètre peut
être considéré significativement différent de zéro.

Pr. ZEROUTI ADD- S3-MM & MSSI- 2024/2025- ENSM 18


1- Régression linéaire simple
• Test de signification du paramètre :

La statistique du test :

• Règle de décision :
Avec « α » un risque d’erreur fixé généralement à 5%.
si:

alors Ho est rejetée au seuil de α% et le paramètre peut être considéré


significativement différent de zéro.

Pr. ZEROUTI ADD- S3-MM & MSSI- 2024/2025- ENSM 19


1- Régression linéaire simple
6- Analyse de la variance "ANOVA" :

• La qualité de l’estimation est traduite par l’équation suivante :

• La somme des carrés totale (SCT)= La somme des carrés estimés


(expliqués par le modèle) "SCE" + La somme des carrés résiduelles
(non expliqués par le modèle) "SCR".

• L’équation : SCT= SCE+ SCR, s’appelle Équation d’analyse de la


variance.

Pr. ZEROUTI ADD- S3-MM & MSSI- 2024/2025- ENSM 20


1- Régression linéaire simple
• D’où le tableau d’analyse de la variance suivant :
Source de Somme des Degrés de Somme des
variation carrés liberté carrés
moyens
Modèle SCE P SCE/p

Résidus SCR n-p-1 SCR/(n-p-1)

Total SCT n-1 SCT/(n-1)

• Où : n représente la taille de l’échantillon,


• p : le nombre de paramètres du modèle (constante exclue).

Pr. ZEROUTI ADD- S3-MM & MSSI- 2024/2025- ENSM 21


1- Régression linéaire simple
Coefficient de détermination R2 :
• C’est un indicateur synthétique issu du tableau d’analyse de la
variance, il permet d’évaluer la qualité globale du modèle construit.

• Il est compris entre 0 et 1.


• Le coefficient de détermination R2 est égal au carré du coefficient de
corrélation "r".

Pr. ZEROUTI ADD- S3-MM & MSSI- 2024/2025- ENSM 22


1- Régression linéaire simple
Test de signification de R2 :

• Afin de s’assurer si le modèle est intéressant, on procède au test


d’hypothèse suivant :

• La statistique du test est :

• Règle de décision :

• Si Fcal> F(α; 1; n-2) alors l’hypothèse H0 est rejetée au seuil α% (5%,


10%...)
Pr. ZEROUTI ADD- S3-MM & MSSI- 2024/2025- ENSM 23
1- Régression linéaire simple
7- Prédiction de la variable expliquée Yi :

Dans le cadre du modèle linéaire simple : Yi= a+ b Xi +ξi, on se pose la question


suivante :

• Pour une valeur future Xi+h de Xi, quelle valeur peut-on prédire pour la
variable expliquée ?

• Soit :

le modèle de régression linéaire estimé par la méthode MCO.

• Soulignons que les paramètres â et b sont estimés sur un échantillon


comprenant les observations i=1,2….n, sans inclure la réalisation (i+h), et
puisque : Yi+h= a+ b Xi+h +ξi+h, il est naturel de proposer la prédiction :
Pr. ZEROUTI ADD- S3-MM & MSSI- 2024/2025- ENSM 24
1- Régression linéaire simple
La table de Student (t)

Pr. ZEROUTI ADD- S3-MM & MSSI- 2024/2025- ENSM 25


1- Régression linéaire simple
Table de Fisher

Pr. ZEROUTI ADD- S3-MM & MSSI- 2024/2025- ENSM 26


1- Régression linéaire simple
Exercice : Les observations concernant la quantité échangée d’un bien (Q) et
son prix (P) sont résumées dans le tableau ci-dessous :

1. Calculer les moyennes et les variances empiriques des deux variables Q et


P sachant que :

2. Calculer la covariance entre Q et P. En déduire le coefficient de corrélation


linéaire entre ces deux variables.
3. Selon le résultat de la question 2, préciser la nature de la relation entre Q et
P (s’agit-il d’une fonction d’offre ou d’une fonction de demande ?).

Pr. ZEROUTI ADD- S3-MM & MSSI- 2024/2025- ENSM 27


1- Régression linéaire simple
4. On considère à présent le modèle linéaire suivant :

Qi = α + β Pi + ξi, i =1, ··· , 10.

Où ξi, i =1, ···, 10. sont des termes aléatoires identiquement et


indépendamment distribués d’espérance mathématique zéro et de
variance σ2. , α et β sont des paramètres à estimer.

a. Donner les expressions des estimateurs de α et β obtenus par la


Méthodes des moindres carrés ordinaires.

b. Calculer les valeurs numériques des estimateurs α et β .

Pr. ZEROUTI ADD- S3-MM & MSSI- 2024/2025- ENSM 28


2- Régression non linéaire

Pr. ZEROUTI ADD- S3-MM & MSSI- 2024/2025- ENSM 29


2- Régression non linéaire
1- Pourquoi l’ajustement non linéaire ?
 Demande d’un produit : Cycle de vie d’un
produit;
- Lancement: Linéaire
- Croissance : Exponentiel
- Maturité: Logarithmique
- Déclin : Linéaire

Pr. ZEROUTI ADD- S3-MM & MSSI-


30
2024/2025- ENSM
2- Régression non linéaire

1- Pourquoi l’ajustement non linéaire ?


 Saisonnalité ;
- Répétition régulière ;
- Même pic

31

Pr. ZEROUTI ADD- S3-MM & MSSI-


31
2024/2025- ENSM
2- Régression non linéaire
1- Pourquoi l’ajustement non linéaire ?
 Crises et Effet de mode :
- Aléatoire;
- Volatile
- …

32

Pr. ZEROUTI ADD- S3-MM & MSSI-


32
2024/2025- ENSM
2- Régression non linéaire
2- Ajustement exponentiel
L’ajustement exponentiel est un ajustement de la
forme = yi
35

Exemple : 30
25

xi 0,5 1 2 3 4 5 6 7 8 9 10 20
15
yi 0,50,50,81,53,5 5 8 12 18 25 33 10
5
0
0 2 4 6 8 10 12

Question: Comment trouver les coefficients a et b


qui définissent la régression exponentielle ?
Pr. ZEROUTI ADD- S3-MM & MSSI-
33
2024/2025- ENSM
2- Régression non linéaire
• Dans la régression exponentielle
• Ainsi:
• Donc:
• Posons : y’ = ln(y),
• On a: y’= ln(a) + x ln(b)
• Une relation exponentielle entre x et y équivaut
donc à une relation affine entre x et y’ On peut
ainsi justifier la régression exponentielle en
calculant le coefficient r entre x et ln(y) = y’ 34
Pr. ZEROUTI ADD- S3-MM & MSSI-
34
2024/2025- ENSM
2- Régression non linéaire
3- Ajustement logarithme
• L’ajustement logarithme est de la forme
y = a ln(x) + b.
xi 0,50 1 2 3 4 5 6 7 8 9 10 11 12 13
Y'i 0,50 2,00 3,003,50 3,75 4,00 4,20 4,30 4,35 4,38 4,39 4,40 4,45 4,46

Y'i
5
4,5
4
3,5
3
2,5
2
1,5
1
0,5 35
0
0 2 4 6 8 10 12 14

Pr. ZEROUTI ADD- S3-MM & MSSI- 2024/2025- ENSM 35


2- Régression non linéaire
• 3- Ajustement logarithme (Suite)
• En posant x’ = ln(x) on a : y = ax’ + b.
• Ainsi, si x et y sont dans une dépendance logarithmique, x’ et y
sont dans une dépendance affine.
• Pour justifier le choix d’un ajustement logarithme, on calcule r
entre x’ et y. On détermine ensuite les coefficients a et b par la
méthode des moindres carrés entre x’ et y.
• On trouve par le calcul
• r = 0,99 d’où la légitimité de cet ajustement et a=1,555 et b =
1,777.
• Ainsi : y = 1,555 ln(x) + 1,777
36

Pr. ZEROUTI ADD- S3-MM & MSSI-


36
2024/2025- ENSM
2- Régression non linéaire
4- Ajustement puissance

• Le lien de dépendance entre x et y est : Y=

• Ainsi ln(y) = ln(a) + b ln(x), la justification de cet


ajustement se fera donc en calculant un coefficient de
corrélation linéaire r entre ln(x) et ln(y).

• Les coefficients a et b se trouvent dans la recherche de


la droite des moindres carrés pour ln(x) et ln(y). 37

Pr. ZEROUTI ADD- S3-MM & MSSI-


37
2024/2025- ENSM
2- Régression non linéaire
• Synthèse des modèles:

38

Pr. ZEROUTI ADD- S3-MM & MSSI-


38
2024/2025- ENSM
2- Régression non linéaire
• Exemple:
On s’intéresse à la quantité vendue d’un produit dans un magasin
en fonction de son prix. On a enregistré les résultats suivants :
Prix de vente 5 10 15 25 35 45
Quantité vendue 140 35 15 6 3 2
a) Représenter graphiquement cette série.
b) Est-il plus pertinent de réaliser un régression linéaire ou une
régression non linéaire?
c) Réaliser la régression qui vous semble adaptée pour
déterminer le prix de vente à fixer si on souhaite vendre 20
000 produits. 39

Pr. ZEROUTI ADD- S3-MM & MSSI-


39
2024/2025- ENSM

Vous aimerez peut-être aussi