PR - bouzAHZAH Econometrie. Notes de Cours 2
PR - bouzAHZAH Econometrie. Notes de Cours 2
PR - bouzAHZAH Econometrie. Notes de Cours 2
Notes de cours
Méthodes économétriques
Mohamed Bouzahzah
Sommaire
0. Introduction générale
0.1. Définitions
0.2. Modèle économique vs modèle économétrique
0.3. Objectifs de l’économétrie
0.5. Données et logiciels
1
19/02/2022
Bibliographie
L’ouvrage utilisé :
D’autres ouvrages peuvent être consultés (liste non exhaustive et à titre indicatif) :
Econometrics, GRENNE
Introduction
- Etymologiquement le terme économétrie signifie « mesure de l’économie ». Cette définition est trop large
pour être utilisée. En économie, on mesure les agrégats (PIB, consommation nationale, investissement,…) en
utilisant la comptabilité nationale.
- L’économétrie est un ensemble de méthodes statistiques et mathématiques qui permettent d’analyser les
données
- Il s’agit d’une discipline récente mais qui ne cesse de prendre de l’importance en sciences économiques.
- Même s’il existait quelques travaux antérieurs, l’économétrie a démarré réellement avec la constitution de
l’Econometric Society en 1930.
- En 1933 est publié le premier numéro de la revue Economtrica (la revue scientifique de référence en
économétrie).
- Aujourd’hui plusieurs prix Nobel d’économétrie Ragnar Frisch et Jan Tinbergen en 1969, Engel et Granger
(cointegration causalité, ARCH), Heckman et Mc Fadden (2000) Sims en 2011.
2
19/02/2022
Introduction
Introduction
Pour vérifier la validité empirique ce cette théorie, il faut réécrire ces hypothèses à vérifier sous forme
mathématique. Une relation simple qui rempli les trois hypothèses est la relation linéaire suivante :
𝐶 = 𝐶0 + 𝑐𝑌𝑑
avec 0<𝑐<1
H1 : 𝐶0 ≠ 0 H2 : 𝐶0 ≠ 0
On peut aussi être tenté d’évaluer la valeur de c selon qu’elle est proche de 1 (vision keynésienne) ou faible
proche de 0 (vision néoclassique) ce qui permet d’estimer la valeur du multiplicateur et donne des
indications sur l’efficacité des politiques budgétaires (voir J.O. Blanchacrd et FMI, multiplicateurs crise 2008).
3
19/02/2022
Introduction
(i) confirmer ou infirmer une théorie (voir exemple ci-dessous concernant la validité du MEDAF). Trancher
entre des théories concurrentes (voir exemple ci-dessous entre théorie keynesienne et néoclassique de la
consommation).
(ii) L’économétrie peut être considéré comme un outil d’investigation statistique. L’économétrie peut être
utilisée pour découvrir des relations entre variables économiques. Lorsque de telles relations sont assez
stables, un contenu théorique peut être donné. C’est ce qui s’est passé avec la courbe de Phillips.
(iii) L’économétrie peut être utilisée pour évaluer quantitativement les effets de politiques économiques (les
modèles macroéconométriques)
(iv) Les modèles économétriques peuvent être utilisé pour réaliser des prévisions (les modèles autoregessifs
ARIMA, VAR, etc.)
Introduction
L’économétrie fonctionne avec des modèles économétriques. Ces derniers sont la contrepartie numérique
(empirique) des modèles économiques.
- Un modèle économique est une représentation simplifiée de la réalité. Comme dans l’exemple de la
fonction de consommation keynésienne qui explique la consommation nationale par le revenu disponible.
- Bien entendu la réalité est plus complexe. D’autres variables participent à expliquer la consommation
nationale. Le modèle économique est une approximation de la réalité. Keynes lui-même, reconnaissait que
le taux d’intérêt peut expliquer la consommation mais de manière très marginale.
- Retenir le modèle économique sous forme mathématique avec des variables observables et mesurables
- Remplacer la complexité de la réalité que ne retiennent pas les modèles théoriques par un aléa
(composante stochastique)
- Avoir une idée (sa distribution) sur l’aléa (l’erreur)
4
19/02/2022
Introduction
- Les données ou coupe transversales (observations d’individus à une même période de temps).
- Les données chronologiques ou séries temporelles (time series) qui consistent à observer un individu dans
le temps
- Les données de panel qui consistent à observer plusieurs individus pendant une période de temps
Nous l’avons déjà souligné, l’économétrie utilise des outils statistiques et des données. Les calculs se font
généralement en faisant appel à des logiciels (SPSS, Eviews, SAS, RATS, GAUSS, MATLAB, etc.) Il existe des
logiciels en open source ; le plus célèbre est le logiciel R.
10
5
19/02/2022
Introduction
- Elle débute par un ensemble de propositions théoriques sur une question économique. En effet, la théorie
économique spécifie des relations théoriques entre des variables. La loi de la demande met en relation les
quantités et les prix relatifs d’un bien donné, la relation de Phillips met en relation le taux d’inflation et le
taux de chômage, la fonction de consommation keynésienne la consommation nationale et le revenu
disponible, etc.
- Certes, le coefficient de corrélation permet de détecter l’existence d’une relation statistique entre deux
variables mais ne donne aucune idée sur la nature de la relation (sens de la causalité, non linéarité, etc.). Un
coefficient de corrélation nulle (r = 0) ne signifie pas absence de relation entre les deux variables mais
absence de relation linéaire.
- L’estimation économétrique (le modèle linéaire simple) permet de décrire et d’évaluer quantitativement la
relation entre une variable donnée dite expliquée (ou dépendante ou endogène) et une variable dite
explicative (ou indépendante ou exogène).
11
La relation entre la variable expliquée y et la variable explicative x prend la forme mathématique suivante :
- Déterministe ou mathématique qui fait correspondre à chaque valeur de x une seule valeur de 𝑦 Ces
relations se rencontrent dans les sciences physiques mais pas dans les sciences humaines et sociales
12
6
19/02/2022
𝑦 = 1000 + 0,8𝑥
Cette relation est déterministe ; le niveau de la consommation peut être déterminé de manière exacte pour
chaque niveau de revenu disponible.
Mais la consommation peut varier sous l’effet d’autres causes (prix, moral des consommateurs, taux
d’intérêt, etc.). Dans ce cas, la relation s’écrira
𝑦 = 1000 + 0,8𝑥 + 𝜀
13
𝑦 = 1000 + 0,8𝑥 + 𝜀
𝑥 𝑦
0 900 1100
100 980 1180
200 1060 1260
200 1140 1340
… … …
Si 𝜀 suit une loi normale par exemple, on obtient la relation suivante entre 𝑦 et 𝑥
14
7
19/02/2022
15
Pour Keynes, la relation entre ces deux variables est gouvernée par une loi psychologique. Il écrivait dans la
théorie générale «En moyenne et la plupart du temps, les hommes tendent à accroître leur niveau de
consommation à mesure que le revenu s’accroit mais non d’une quantité aussi grande que l’accroissement du
revenu».
En plus, pour Keynes, la propension moyenne à consommer est décroissante par rapport au revenu
disponible ce qui signifie l’existence d’un minimum vital (une consommation incompressible).
Ainsi, pour Keynes, la fonction de consommation doit satisfaire les conditions suivantes :
𝜕𝑦 et 𝑥
0< <1 𝜕
𝜕𝑥 𝑦
<0
𝜕𝑦
16
8
19/02/2022
𝑦 = 𝛽0 + 𝛽1 𝑥
De plus pour les keynésiens la valeur de 𝛽0 est élevée et proche de 1 ce qui signifie un multiplicateur élevé
et donc une efficacité de la politique budgétaire.
Pour les néoclassiques, il n’existe pas de minimum vital 𝛽0 = 0 et bien que positive 𝛽1 est faible et
proche de 0.
Ce cadre offre une base pour une étude empirique qui permettrait de trancher entre la vision keynésienne
et classique.
Si on dispose des données relatives à la consommation nationale et au revenu disponible on peut estimer
les valeurs de 𝛽0 et 𝛽1 .
17
400
350
300
250
200
150
100
100 200 300 400 500
L’examen de la figure permet de voir que les données sont cohérentes avec la théorie keynésienne mais
qu’une relation déterministe ne semble pas appropriée pour décrire la relation.
On doit incorporer une composante aléatoire ou stochastique. L’approche la plus utilisée est l’approche
additive. Ainsi on obtient
𝑦 = 𝛽0 + 𝛽1 𝑥 + 𝜀
18
9
19/02/2022
- Omission d’autres variables explicatives. Dans la réalité, beaucoup d’autres variables peuvent influencer la
consommation. Elles ne sont pas introduites soit parce qu’elles ne sont pas connues, soit qu’elles ne peuvent
pas être mesurées. Certaines sont connues et sont mesurables mais leurs effets est supposé marginal
- Aggrégation des variables. La consommation nationale et le revenu disponible sont les aggegations des
consommations individuelles et des revenus disponibles individuels. Toute aggrégation est en réalité une
approximation
- Mauvaise spécification du modèle. Le modèle peut être mal spécifié dans sa structure. La consommation
peut dépendre du revenu disponible mais peut dépendre aussi du revenu futur
- Mauvaise spécification des formes fonctionnelles. La relation peut ne pas être linéaire entre la variable
expliquée et la variable explicative.
- Erreurs de mesure.
19
De manière plus précise, on suppose que chaque observation dans notre échantillon
𝑦𝑖 , 𝑥𝑖 ; 𝑖 = 1,2, . . . , 𝑛 est générée par le processus suivant :
𝑦𝑖 = 𝛽0 + 𝛽1 𝑥𝑖 + 𝜀𝑖 𝑖 = 1,2, . . . , 𝑛
-Notre objectif est d’utiliser une méthode d’estimation afin de construire des estimateurs des paramètres 𝛽0
et 𝛽1 .
- Ensuite, utiliser les données disponibles pour avoir des estimations des paramètres et examiner la validité
des propositions théoriques.
- On peut également utiliser le modèle pour réaliser les cas échéant des prévisions relatives à la
consommation.
La manière avec laquelle nous allons procéder va dépendre de la nature du processus stochastique qui sous-
tend nos données.
20
10
19/02/2022
Les hypothèses qui sous-tendent le modèle linéaire, dites hypothèses de Gauss-Markov, se présentent
comme suit :
𝑉(𝜀𝑖 ) = 𝜎 2 𝑜𝑢 𝐸(𝜀𝑖2 ) = 𝜎 2
Bien entendu 𝜎 2 n’est pas connue nous allons devoir l’estimer. Si cette condition n’est pas satisfaite,
l’estimateur ne sera pas efficace.
21
4. Absence d’autocorrélation des erreurs. Les erreurs doivent être indépendantes. Formellement cela se
traduit par
cov( 𝜀𝑖 , 𝜀𝑗 ) = 0 𝑜𝑢 𝐸(𝜀𝑖 𝜀𝑗 ) = 0
Là encore, si cette condition n’est pas satisfaite, les estimateurs des paramètres ne seront pas efficaces.
5. Absence d’autocorrélation entre l’erreur et la variable explicative. Pour l’instant on suppose que la
variable explicative n’est pas stochastique. Elle est exogène cad déterminée en dehors du modèle. Cela
revient à ce que
cov( 𝑥𝑖 , 𝜀𝑖 ) = 0 𝑜𝑢 𝐸(𝑥𝑖 𝜀𝑖 ) = 0
6. Normalité des erreurs. En plus des conditions de Gauss-Markov nous supposons que les erreurs sont
normalement distribuées (conditions nécessaire pour l’inférence statistique).
22
11
19/02/2022
Nous supposons que nos données sont générées par la relation stochastique suivante :
𝑦𝑖 = 𝛽0 + 𝛽1 𝑥𝑖 + 𝜀𝑖 𝑖 = 1,2, . . . , 𝑛
𝜀𝑖 = 𝑦𝑖 − 𝛽0 − 𝛽1 𝑥𝑖 𝑖 = 1,2, . . . , 𝑛
Les estimations à partir d’un échantillon sont notées 𝛽መ0 et 𝛽መ1 , l’erreur est estimée comme un résidu
Normalité des erreurs. En plus des conditions de Gauss-Markov nous supposons que les erreurs sont
normalement distribuées (conditions nécessaire pour l’inférence statistique).
23
𝐸(𝜀𝑖 ) = 0 𝐸(𝑥𝑖 𝜀𝑖 ) = 0
1
𝐸(𝜀𝑖Ƹ ) = 0 𝜀𝑖Ƹ = 0 𝜀𝑖Ƹ = 0
ቊ 𝑛
𝐸(𝑥𝑖 , 𝜀𝑖Ƹ ) = 0
1
𝜀𝑖Ƹ 𝑥𝑖 = 0 𝜀𝑖Ƹ 𝑥𝑖 = 0
𝑛
Equations normales
24
12
19/02/2022
𝑛𝑦 = 𝑛𝛽መ0,𝑀𝑀 + 𝛽መ1,𝑀𝑀 𝑛𝑥
𝛽መ0,𝑀𝑀 = 𝑦 − 𝛽መ1,𝑀𝑀 𝑥
25
σ 𝑥𝑖 𝑦𝑖 − 𝑦𝑛
lj 𝑥lj
𝛽መ1,𝑀𝑀 =
σ 𝑥𝑖2 − 𝑛𝑥lj 2
1
σ 𝑥𝑖 𝑦𝑖 − 𝑥lj 𝑦lj
𝛽መ1,𝑀𝑀 = 𝑛
1
σ 𝑥𝑖2 − 𝑥lj 2
𝑛
𝑐𝑜𝑣( 𝑥, 𝑦)
𝛽መ1,𝑀𝑀 =
𝑣𝑎𝑟( 𝑥)
26
13
19/02/2022
En définitive, les estimateurs par la méthode des moments sont donnés par
𝑐𝑜𝑣( 𝑥, 𝑦)
𝛽መ1,𝑀𝑀 =
𝑣𝑎𝑟( 𝑥)
𝛽መ0,𝑀𝑀 = 𝑦 − 𝛽መ1,𝑀𝑀 𝑥
27
𝑦𝑖 = 𝛽0 + 𝛽1 𝑥𝑖 + 𝜀𝑖 𝑖 = 1,2, . . . , 𝑛
𝜀𝑖 → 𝑁(0, 𝜎 2 )
𝑦𝑖 → 𝑁(𝛽0 + 𝛽1 𝑥𝑖 , 𝜎 2 )
1/2 2
1 1 𝑦𝑖 − 𝛽0 − 𝛽1 𝑥𝑖
𝑓(𝑦𝑖 ) = exp − −
2𝜋𝜎 2 2 𝜎
𝑛 1/2 2
1 1 𝑦𝑖 − 𝛽0 − 𝛽1 𝑥𝑖
𝐿(𝑦1 , . . . , 𝑦𝑛 ; 𝛽0 , 𝛽1 , 𝜎 2 ) = ෑ exp − −
2𝜋𝜎 2 2 𝜎
𝑖=1
28
14
19/02/2022
1 1
log 𝐿 (. ) = − log( 2𝜋𝜎 2 ) − 2 (𝑦𝑖 − 𝛽0 − 𝛽1 𝑥𝑖 )2
2 2𝜎
1 1
log 𝐿 (. ) = − 𝑛 log( 2𝜋𝜎 2 ) − 2 (𝑦𝑖 − 𝛽0 − 𝛽1 𝑥𝑖 )2
2 2𝜎
𝜕 log 𝐿 (. ) 1
= − 2 (2)(−1) 𝑦𝑖 − 𝛽መ0,𝑀𝑉 − 𝛽መ1,𝑀𝑉 𝑥𝑖 = 0
𝜕𝛽መ0,𝑀𝑉 2𝜎𝑀𝑉
𝜕 log 𝐿 (. ) 1
= − 2 (2) (−𝑥𝑖 ) 𝑦𝑖 − 𝛽መ0,𝑀𝑉 − 𝛽መ1,𝑀𝑉 𝑥𝑖 = 0
𝜕𝛽መ1,𝑀𝑉 2𝜎𝑀𝑉
2
𝜕 log 𝐿 (. ) 1 1 1 σ(𝑦𝑖 − 𝛽መ0,𝑀𝑉 − 𝛽መ1,𝑀𝑉 𝑥𝑖 )
2 =− 𝑛 2 + 4 =0
𝜕𝜎𝑀𝑉 2 𝜎𝑀𝑉 2 𝜎𝑀𝑉
29
𝜕 log 𝐿 (. ) 1
= − 2 (2)(−1) 𝑦𝑖 − 𝛽መ0,𝑀𝑉 − 𝛽መ1,𝑀𝑉 𝑥𝑖 = 0
መ
𝜕𝛽0,𝑀𝑉 2𝜎𝑀𝑉
𝜕 log 𝐿 (. ) 1
= − 2 (2) (−𝑥𝑖 ) 𝑦𝑖 − 𝛽መ0,𝑀𝑉 − 𝛽መ1,𝑀𝑉 𝑥𝑖 = 0
𝜕𝛽መ1,𝑀𝑉 2𝜎𝑀𝑉
2
𝜕 log 𝐿 (. ) 1 1 1 σ(𝑦𝑖 − 𝛽መ0,𝑀𝑉 − 𝛽መ1,𝑀𝑉 𝑥𝑖 )
2 =− 𝑛 2 + 4 =0
𝜕𝜎𝑀𝑉 2 𝜎𝑀𝑉 2 𝜎𝑀𝑉
Equations normales
Nous obtenons les estimateurs suivants
cov( 𝑥, 𝑦)
𝛽መ1,𝑀𝑉 = 𝛽መ0,𝑀𝑉 = 𝑦 − 𝛽መ1,𝑀𝑉 𝑥
var( 𝑥)
30
15
19/02/2022
𝜕 log 𝐿 (. ) 1
= − 2 (2)(−1) 𝑦𝑖 − 𝛽መ0,𝑀𝑉 − 𝛽መ1,𝑀𝑉 𝑥𝑖 = 0
𝜕𝛽መ0,𝑀𝑉 2𝜎𝑀𝑉
𝜕 log 𝐿 (. ) 1
= − 2 (2) (−𝑥𝑖 ) 𝑦𝑖 − 𝛽መ0,𝑀𝑉 − 𝛽መ1,𝑀𝑉 𝑥𝑖 = 0
𝜕𝛽መ1,𝑀𝑉 2𝜎𝑀𝑉
2
𝜕 log 𝐿 (. ) 1 1 1 σ(𝑦𝑖 − 𝛽መ0,𝑀𝑉 − 𝛽መ1,𝑀𝑉 𝑥𝑖 )
2 =− 𝑛 2 + 4 =0
𝜕𝜎𝑀𝑉 2 𝜎𝑀𝑉 2 𝜎𝑀𝑉
2
σ 𝜀𝑖Ƹ 2
𝜎𝑀𝑉 =
𝑛
31
La méthode des moindres carrés ordinaires consiste à choisir les estimateurs 𝛽መ0,𝑀𝐶 et 𝛽መ1,𝑀𝐶 de manière à
minimiser la somme des carrés des erreurs. C'est-à-dire faire en sorte que la droite (le modèle) soit la plus
proche de toutes les observations (la réalité)
𝑦
9
8
7 𝜀2Ƹ
6
5
4
𝜀3Ƹ
3
2
1
0 𝑥
0 1 2 3 4 5 6
32
16
19/02/2022
𝑦
9
8
7 𝜀2Ƹ
6
5
4
𝜀3Ƹ
3
2
1
0 𝑥
0 1 2 3 4 5 6
33
𝜕𝐸(. )
= (2) 𝑦𝑖 − 𝛽መ0,𝑀𝐶 − 𝛽መ1,𝑀𝐶 𝑥𝑖 (−1) = 0
𝜕𝛽መ0,𝑀𝐶
𝜕𝐸(. )
= (2) (−𝑥𝑖 ) 𝑦𝑖 − 𝛽መ0,𝑀𝐶 − 𝛽መ1,𝑀𝐶 𝑥𝑖 = 0
𝜕𝛽መ1,𝑀𝐶
Ou
𝑦𝑖 − 𝛽መ0,𝑀𝐶 − 𝛽መ1,𝑀𝐶 𝑥𝑖 = 0
Equations normales
𝑥𝑖 𝑦𝑖 − 𝛽መ0,𝑀𝐶 𝑥𝑖 − 𝛽መ1,𝑀𝐶 𝑥𝑖2 = 0
Les estimateurs par la méthode des moindres carrés sont donnés par
cov( 𝑥, 𝑦)
𝛽መ1,𝑀𝐶 = 𝛽መ0,𝑀𝐶 = 𝑦 − 𝛽መ1,𝑀𝐶 𝑥
var( 𝑥)
34
17
19/02/2022
𝑐𝑜𝑣( 𝑥, 𝑦) 𝛽1 𝑣𝑎𝑟( 𝑥)
𝛽መ1 = = = 𝛽1
𝑣𝑎𝑟( 𝑥) 𝑣𝑎𝑟( 𝑥)
Ainsi, 𝐸(𝛽መ1 ) = 𝛽1
35
Comme
𝐸(𝑦𝑖 ) = 𝛽0 + 𝛽1 𝑥𝑖 + 𝐸(𝜀𝑖 )
Ou
𝐸(𝑦𝑖 ) = 𝛽0 + 𝛽1 𝑥𝑖
𝐸(𝑦)
lj = 𝛽0 + 𝛽1 𝑥lj
En remplaçant
𝐸(𝛽መ0 ) = 𝛽0 + 𝛽1 𝑥lj − 𝛽1 𝑥lj
𝐸(𝛽መ0 ) = 𝛽0
36
18
19/02/2022
Obs. xi yi 10
8
1 1 1
6
2 2 5
4
3 3 3
2
4 4 8
0
5 5 8 0 1 2 3 4 5 6
Total 15 25
𝑦𝑖 = 𝛽0 + 𝛽1 𝑥𝑖 + 𝜀𝑖 𝑖 = 1,2, . . . , 5
Pour ce faire nous devons estimer les paramètres. Comme nous avons un modèle linéaire simple nous
savons que quel que soit la méthode d’estimation nous avons
cov( 𝑥, 𝑦)
𝛽መ1,𝑀𝐶 = 𝛽መ0,𝑀𝐶 = 𝑦 − 𝛽መ1,𝑀𝐶 𝑥
var( 𝑥)
37
Dependent Variable: y
Method: Least Squares (MC)
Date: 03/14/21 Time: 10:17
Sample: 1 5
Included observations: 5 (n)
19
19/02/2022
15 25
𝑥lj = =3 𝑦lj = =5
Ainsi 5 5
92
−3×5 et 𝛽መ0 = 5 − 1,7 × 3 = −0,1
𝛽መ1 = 5 = 1,7000
55
−3×3
5
En définitive nous avons
𝑦 = −0,1 + 1,7𝑥
39
xi yi 𝜀𝑖Ƹ
Obs.
1 1 1 -0,6
2 2 5 1,7
3 3 3 -2
4 4 8 1,3
5 5 8 -0,4
Total 15 25 0
40
20
19/02/2022
On peut mesure la qualité de la régression en examinant dans quelle mesure les variations de la variable
indépendante sont expliquées par celles de la variable expliquée ?
Un indicateur de la qualité de la régression est donné par le coefficient de détermination
Les variations de la variable indépendante sont mesurées en termes d’écarts par rapport à sa moyenne . La
somme de leurs carrées est appelée somme total des carrés (SCT).
lj 2
𝑆𝐶𝑇 = (𝑦𝑖 − 𝑦)
La somme des carrés des résidus (SCR) est donné par
2
𝑆𝐶𝑅 = 𝜀𝑖Ƹ 2 = 𝑦𝑖 − 𝑦lj − 𝛽መ1 𝑥𝑖 − 𝑥lj
𝑆𝐶𝑅 = 𝜀𝑖Ƹ 2 = 𝑦𝑖 − 𝑦lj 2
+ 𝛽መ12 𝑥𝑖 − 𝑥lj 2
− 2𝛽መ1 𝑥𝑖 − 𝑥lj 𝑦𝑖 − 𝑦lj
41
Nous avons
𝑥𝑖 − 𝑥lj 2 = 𝑛 × var( 𝑥)
𝑦𝑖 − 𝑦lj 2 = 𝑛 × var( 𝑦)
𝑥𝑖 − 𝑥lj 𝑦𝑖 − 𝑦lj = 𝑛 × cov( 𝑥, 𝑦)
Rappelons que
cov( 𝑥, 𝑦)
𝛽መ1 =
var( 𝑥)
42
21
19/02/2022
cov( 𝑥, 𝑦)2
𝑆𝐶𝑅 = 𝑛 var( 𝑦) − 𝑛
var( 𝑥)
Un indicateur de la qualité de la régression est donné par le coefficient de détermination , donné par
𝑆𝐶𝐸 𝑆𝐶𝑅
𝑅2 = =1−
𝑆𝐶𝑇 𝑆𝐶𝑇
Plus le 𝑅2 est élevé (proche de 1) plus le modèle est de bonne qualité. Cela signifie que les variations de la
variable expliquée sont attribuées aux variations de la variable explicative
43
28,9
𝑅2 = = 0,76052 ≡ 76,052%
38
44
22
19/02/2022
Pour obtenir les estimateurs de 𝛽0 et 𝛽1 , aucune hypothèse sur la distribution de l’erreur n’était
nécessaire. En effet, à partir des hypothèses de Gauss-Markov, on peut montrer que les estimateurs par la
méthode des moindres carrés ordinaires (MCO) (en anglais Ordinary Least squares OLS) sont non biaisés et
efficaces (BLUE).
Si en plus des hypothèses de Gauss-Markov on suppose que les erreurs sont normalement distribuées alors
il est possible de construire des intervalles de confiance et réaliser des tests d’hypothèses.
𝜎2
𝐸(𝛽መ1 ) = 𝛽1 𝑉(𝛽መ1 ) =
𝑛 var( 𝑥)
45
Les choses auraient été faciles si on connaissait 𝜎 2 . Bien entendu, en pratique il faut l’estimer. On peut
montrer qu’un estimateur non biaisé de 𝜎 2 est donné par
𝑆𝐶𝑅
𝜎ො2 =
𝑛−2
𝑡𝛼,𝑛−2 est lue sur la table de la loi de Student avec (n-2) degrés de libertés.
Les résultats restent valables pour un grand nombre d’observations, sinon cela pose problème.
46
23
19/02/2022
𝑡𝛼−2 est lue sur la table de la loi de Student avec (n-2) degrés de libertés.
Qu’est ce qui se passe si l’erreur n’est pas distribuée normalement ? Les résultats restent valables pour un
grand nombre d’observations, sinon cela pose problème.
𝑆𝐶𝑅 9,1
𝜎ො 2 = = = 3,0333 𝜎ො = 𝑆. 𝐸. 𝑟𝑒𝑔𝑟𝑒𝑠𝑠𝑖𝑜𝑛 = 3,0333 = 𝟏, 𝟕𝟒𝟏𝟔
𝑛−2 3
D’un autre côté nous avons
𝜎ො 2 3,033
𝑉(𝛽መ1 ) = = = 0,30333
𝑛 var( 𝑥) 5 × 2
47
1 𝑥lj 2 1 9
𝑉(𝛽0 ) = 𝜎ො 2 + = 3,03 + = 3,3366
𝑛 𝑛 var( 𝑥) 5 10
48
24
19/02/2022
Dependent Variable: y
Method: Least Squares (MC)
Date: 03/14/21 Time: 10:17
Sample: 1 5
Included observations: 5 (n)
49
𝛽0 ∈ −5,89 ; 5,69
𝛽1 ∈ −0,0501 ; 3,4501
50
25
19/02/2022
51
- Comme nous l’avons souligné dans l’introduction générale on est essentiellement intéressé à savoir si les
variations de x sont à l’origine des variations de y.
- On peut également être intéressé, comme dans les exemples de la fonction de consommation keynésienne
ou du MEDAF, de savoir si 𝛽መ0 est significativement différent de zéro. On est amené dans ce cas à réaliser
des tests d’hypothèses (tests de Student)
On testera en particulier les hypothèses nulles
𝐻0 : 𝛽𝑖 = 0 contre 𝐻1 : 𝛽𝑖 ≠ 0 ∀𝑖 = 0,1
Si cette valeur est incluse dans la zone d’acceptation définie par les valeurs lues sur la table de Student pour
un seuil 𝛼 et 𝑛 − 2 degrés de libertés, on accepte l’hypothèse nulle.
52
26
19/02/2022
𝛽መ0 −0,1000
𝑡𝑜𝑏𝑠 (𝛽መ0 ) = = 1,8266
𝑠. 𝑒. (𝛽መ0 ) 1,8266
𝛽መ1 1,7000
𝑡𝑜𝑏𝑠 (𝛽መ1 ) = = = 3,0866
𝑠. 𝑒. (𝛽መ1 ) 0,5507
La zone d’acceptation pour un seuil de 5% et 3 ddl est donnée par l’intervalle [-3,182 ; 3,182]
La zone d’acceptation pour un seuil de 10% et 3 ddl est donnée par l’intervalle [-2,363 ; 2,353]
Ainsi,
- La constante n’est pas significativement différente de 0 ni au seuil 5% ni au seuil 10%
- La pente n’est pas significativement différente de zéro au seuil 5% mais significativement différente de 0 au
seuil 10%
53
Généralement on calcule plutôt la probabilité à partir de laquelle l’hypothèse nulle est acceptée ou rejetée.
Ainsi,
54
27
19/02/2022
55
Les ratios de Student ou les erreurs standards sont donnés pour tester d’autres hypothèses
𝐻0 : 𝛽1 = 2 𝐻0 : 𝛽1 ≠ 2
Le ratio de Student est donné par
𝛽መ1 − 2 0,3000
𝑡𝑜𝑏𝑠 (𝛽መ1 ) = = = 0,545
𝑠. 𝑒. (𝛽መ1 ) 0,5507
Comme 𝑡𝑜𝑏𝑠 (𝛽መ1 ) << 3,182 on ne rejette pas l’hypothèse nulle au seuil 5%
56
28
19/02/2022
Source des variations Somme des carrés Degrés de libertés Carrés moyens
x SCE k–1 SCE / (k -1)
Résidus SCR n–2 SCR / (n – 2)
Total SCT n-1
Le but est de tester la significativité de la SCE. Dans le cas linéaire simple cela revient à tester la significativité
de la pente 𝛽1
57
𝑆𝐶𝐸/1 28,9
𝐹= = = 9,52
𝑆𝐶𝑅/(𝑛 − 2) 3,0333
58
29
19/02/2022
Dependent Variable: YI
Method: Least Squares (Gauss-Newton / Marquardt steps)
Date: 02/23/21 Time: 17:42
Sample: 1 5
Included observations: 5
YI=C(1)+C(2)*XI
59
𝑦 = 𝛽0 + 𝛽1 𝑥
Le modèle est dit linéaire non pas en termes de relation entre y et x mais en terme de manière avec laquelle
ils sont considérés dans l’équation même de manière transformées.
Considérons la figure suivante :
𝑦 𝑦 = 𝛽0 + 𝛽1 𝑒 𝑥
1
𝑦 = 𝛽0 + 𝛽1 ( )
𝑥
𝑦 = 𝛽0 + 𝛽1 𝑥
𝑦 = 𝛽0 + 𝛽0 ln( 𝑥)
60
30
19/02/2022
𝑦 𝑦 = 𝛽0 + 𝛽1 𝑣
𝑦 = 𝛽0 + 𝛽1 𝑧
𝑦 = 𝛽0 + 𝛽1 𝑥
𝑦 = 𝛽0 + 𝛽1 𝑤
61
En plus lorsque les variables sont considérées en termes logarithmiques cela donne plusieurs avantages
- Rapprochement des échelles des variables x et y
- Parfois le log suffit pour s’assurer que les données soient homoscédastiques
- Le paramètre 𝛽1 s’interprète comme une élasticité
𝑦
𝛽1 = 2 𝛽1 = 1
𝛽1 = −1
𝛽1 = 0,5
62
31
19/02/2022
- Le Nairu (non accelerating inflation rate of unemployment) ou taux de chômage n’accélérant pas l’inflation
est un concept très intéressant il s’agit d’un taux de chômage naturel (d’équilibre) proche du taux de
chômage structurel
- Lorsque le taux de chômage est au dessus du Nairu on peut mettre en place une politique expansionniste
pour réduire le taux de chômage sans que cela augmente l’inflation
-Lorsque le taux de chômage est en dessous du Nairu on doit s’attendre à des tensions inflationnistes
- On ne peut pas réduire de manière importante et durable le taux de chômage en dessous du Nairu par des
politiques conjoncturelles mais par des réformes du marché du travail
63
Taux de chômage
Taux de
chômage
Taux de chômage
naturel
Temps
64
32
19/02/2022
Le Nairu n’est pas observable, il doit être estimé. Il peut l’être à l’aide de la courbe de Phillips.
Dans sa version augmentée elle est donnée par
Dans cette équation 𝜋𝑡 est le taux d’inflation effectif, 𝜋𝑡𝑎 est le taux d’inflation anticipé, 𝑢𝑡 le taux de
chômage effectif, 𝑢𝑡𝑛 est le taux de chômage naturel, 𝜀𝑡 est un choc d’offre.
Ainsi, la courbe de Phillips identifie, dans sa version moderne, trois sources de l’inflation
1. l’inflation anticipée
2. l’écart du chômage par rapport à son taux naturel (chômage conjoncturel)
3. les chocs d’offre
Pour pouvoir utiliser la courbe de Phillips nous devons savoir de quoi dépend l’inflation anticipée.
Supposons que les agents économiques forment leurs anticipations d’inflation sur la base de l’histoire
récente de l’inflation.
65
Un exemple simple est de supposer que l’inflation anticipée est égale à l’inflation de la période précédente
𝜋𝑡𝑎 = 𝜋𝑡−1
Dans ce cas, la courbe de Phillips se réecrit
Dans cette configuration, le taux de chômage naturel est appelé NAIRU (= Non-Accelerating Inflation Rate of
Unemployment) taux de chômage n’accélérant pas l’inflation
66
33
19/02/2022
Inflation induite par les coûts (Cost Push Inflation) : L’inflation résulte des chocs sur l’offre : Un choc négatif
d’offre augmente les coûts de production ce qui augmente les prix (Exemple : choc pétrolier)
Inflation induite par la demande (Demand Push Inflation) : L’inflation peut résulter également d’un choc de
demande : un choc positif sur la demande provoque une baisse du taux de chômage en dessous du niveau
naturel ce qui cause une inflation
67
Δ𝜋𝑡 = −𝛽(𝑢𝑡 − 𝑢𝑛 ) + 𝜀𝑡
On pose
𝛽1 = −𝛽 𝛽0 = 𝛽𝑢𝑛 = −𝛽1 𝑢𝑛
Ou encore
Δ𝜋𝑡 = 𝛽0 + 𝛽1 𝑢𝑡 + 𝜀𝑡
𝛽መ0
𝑢ො 𝑛 = −
𝛽መ1
68
34
19/02/2022
Nous disposons des données suivantes relatives aux taux de chômage et au taux d’inflation
Taux de
Année chômage Taux d’inflation
1999 13,9399996 0,68478261
2000 13,5799999 1,89463457
2001 12,46 0,61980188
2002 11,5900002 2,79561967
2003 11,9200001 1,16773367
2004 10,8299999 1,49344403
2005 11,0100002 0,98264166
2006 9,67000008 3,28476167
2007 9,56000042 2,04208513
2008 9,56999969 3,70731707
2009 9,10000038 0,99482596
2010 9,06000042 0,98735533
2011 8,90999985 0,91461071
2012 8,98999977 1,28712871
2013 9,22999954 1,87232123
2014 9,69999981 0,4428698
2015 9,65999985 1,55790711
2016 9,39999962 1,63531114
2017 9,33199978 0,75466325
69
35
19/02/2022
- La courbe
𝛽መ0 0,833270
- Le taux de chômage naturel est donné par 𝑢ො 𝑛 = − = = 10,15%
𝛽መ1 0,082086
71
TCE NAIRU
15
14
13
12
11
10
9
8
7
72
36
19/02/2022
73
- Le modèle linéaire multiple (régression multiple) est une généralisation du modèle linéaire simple.
-L’essentiel des techniques qui sous-tendent le modèle linéaire simple restent valables
- Dans le modèle multiple on s’intéresse à savoir dans quelle mesure les variations de la variable expliquée
sont expliquées par les variations des variables explicatives : x1, x2,…, xk
𝑦𝑖 = 𝛽0 + 𝛽1 𝑥1 +. . . +𝛽𝑘 𝑥𝑘 + 𝜀𝑖 𝑖 = 1,2, . . . , 𝑛
4. cov( 𝜀𝑖 , 𝑥𝑖 ) = 0 5. 𝜀𝑖 → 𝑁(0, 𝜎 2 )
Les estimateurs par les moindres carrés 𝛽መ0 , 𝛽መ1 , . . . , 𝛽መ𝑘 sont non biaisés et présentent la variance la plus
petite de tous les autres estimateurs (moments et maximum de vraisemblance)
74
37
19/02/2022
Bien entendu, comme dans le cas simple, les estimateurs par les moindres carrés sont ceux qui minimisent la
somme des carrés des résidus. Soit
𝑛 𝑛
𝑖=1 𝑖=1
En plus des hypothèses précédentes (Gauss-Markov), il ne faut pas qu’il ait de colliniarité entre les variables
explicatives. C’est-à-dire qu’il n’existe pas de relation linéaire déterministe entre les variables
explicatives.
75
Ou encore
La colonne de la constante
𝑌 = 𝑋𝛽 + 𝜀
Les dimensions des matrices (n,1) = (n,k+1)*(k+1,1)+(n,1)
76
38
19/02/2022
𝜕𝑆𝐶𝑅
= −2(𝑋′𝑌) + 2(𝑋′𝑋)𝛽መ = 0
𝜕 𝛽መ
Enfin les estimateurs sont donnés par le vecteur suivant
𝛽መ = (𝑋′𝑋)−1 𝑋′𝑌
77
En distribuant,
𝛽መ = (𝑋′𝑋)−1 𝑋′𝑋𝛽 + (𝑋′𝑋)−1 𝑋′𝜀
Ou 𝛽መ = (𝑋′𝑋)−1 𝑋′𝜀
መ =𝛽
𝐸(𝛽)
78
39
19/02/2022
80
40
19/02/2022
Dependent Variable: Y
Method: Least Squares
Date: 04/08/21 Time: 11:27
Sample: 1 24
Included observations: 24
81
𝑦𝑖 = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑥2 + 𝜀
Les coefficients 𝛽መ1 et 𝛽መ2 donnent une estimation de l’influence de chacune des deux variables
explicatives sur y en contrôlant l’effet de l’autre variable explicative.
Supposons que
𝑦𝑖 = 𝛽0 + 𝛽1 𝑥1 + 𝜀
82
41
19/02/2022
𝑦𝑖 = 𝛽0 + 𝛽1 𝑥1 + 𝜀
Si x1 augmente alors
Ainsi avec un modèle simple, la valeur de 𝛽መ1 va capter tous ces effets et sa valeur sera sur-estimée par
rapport à la réalité. Donc 𝛽መ1 sera biaisé. Ainsi, lorsque certaines variables ne sont pas prises en compte
les estimateurs sont biaisés.
Ainsi, plus le nombre de variables explicatives est important, plus les estimateurs auront moins tendance à
être biaisés.
83
Malheureusement, on ne peut pas inclure toutes les variables. Et ce pour deux raisons
- Certaines ne sont pas connues ou ne sont pas mesurables
- La précision des estimations devient faible
Le choix des variables explicative à inclure dans le modèle est le problème majeur qui se pose en pratique.
Ces problèmes sont surmontés grâce à l’expérience et à la connaissance fine du domaine et de la théorie
économique.
Un autre problème se pose lorsqu’on considère un nombre important de variables explicatives. Il y a le
risque que certaines d’entre elles soient corrélées. Dans ce cas il est difficile de déterminer l’effet de
chacune d’entre elles. C’est le problème de la multicollinéarité.
Enfin se pose le problème de la stratégie d’estimation
- Du général vers le particulier
- Du particulier vers le général
84
42
19/02/2022
Comme dans le cas simple, la décision est prise en comparant l’écart observé
𝛽መ𝑖
𝑡𝑜𝑏𝑠 =
𝑠. 𝑒. (𝛽መ𝑖 )
Lorsqu’une variable explicative n’est pas significative (c.a.d. pour laquelle H0 est acceptée) on régresse le
modèle à nouveau sans la prendre en considération. Par contre, on garde la constante même si elle n’est
pas significative (Stratégie d’estimation)
85
Dependent Variable: Y
Method: Least Squares
Date: 04/08/21 Time: 11:27
Sample: 1 24
Included observations: 24
86
43
19/02/2022
Dependent Variable: Y
Method: Least Squares Dependent Variable: Y
Date: 04/15/21 Time: 13:54 Method: Least Squares
Sample: 1 24 Date: 04/15/21 Time: 13:55
Included observations: 24 Sample: 1 24
Included observations: 24
Variable Coefficien... Std. Error t-Statistic Prob.
Variable Coefficien... Std. Error t-Statistic Prob.
C -3.895437 6.810711 -0.571957 0.5734
X2 9.507400 2.427714 3.916195 0.0008 C 2.918405 1.747078 1.670449 0.1090
X3 3.526453 3.407275 1.034977 0.3125 X2 10.19755 2.338113 4.361444 0.0002
R-squared 0.489733 Mean dependent var 10.14167 R-squared 0.463705 Mean dependent var 10.14167
Adjusted R-squared 0.441136 S.D. dependent var 3.639269 Adjusted R-squared 0.439328 S.D. dependent var 3.639269
S.E. of regression 2.720616 Akaike info criterion 4.956062 S.E. of regression 2.725013 Akaike info criterion 4.922479
Sum squared resid 155.4367 Schwarz criterion 5.103319 Sum squared resid 163.3653 Schwarz criterion 5.020650
Log likelihood -56.47274 Hannan-Quinn criter. 4.995129 Log likelihood -57.06975 Hannan-Quinn criter. 4.948524
F-statistic 10.07746 Durbin-Watson stat 1.753960 F-statistic 19.02219 Durbin-Watson stat 1.601258
Prob(F-statistic) 0.000855 Prob(F-statistic) 0.000250
87
2
(𝑦𝑖 − 𝑦) lj 2 + (𝑦𝑖 − 𝑦ො𝑖 )2
lj = (𝑦ො𝑖 − 𝑦)
Source des variations Somme des carrés Degrés de libertés Carrés moyens
x SCE K–1 SCE / (k -1)
Résidus SCR n–2 SCR / (n – 2)
Total SCT n-1
𝑆𝐶𝐸 𝑆𝐶𝑅
𝑅2 = =1−
𝑆𝐶𝑇 𝑆𝐶𝑇
88
44
19/02/2022
𝑆𝐶𝑅/(𝑛 − 𝑘 − 1)
𝑅ሜ 2 = 1 −
𝑆𝐶𝑇/(𝑛 − 1)
89
24 − 1
𝑅ሜ 2 = 1 − (1 − 0,506753) = 0,432766
24 − 3 − 1
90
45
19/02/2022
𝐻0 : 𝛽1 = 𝛽2 =. . . = 𝛽𝑘 = 0
𝐻1 : 𝛽𝑖 ≠ 0
Ce test donne le pouvoir explicatif des toutes les variables prises ensemble.
On peut montrer que F suit une loi de Fisher avec (k) et (n - k - 1) d.d.l
91
𝑅2 /𝑘 0,5067/3
𝐹= = = 6,849
(1 − 𝑅2 )/(𝑛 − 𝑘 − 1) (1 − 0,5067)/(24 − 3 − 1)
Prob(𝐹) = 0,00234
92
46
19/02/2022
Economiste américain
Travaux sur la théorie de la croissance, résidu de Solow
Paradoxe éponyme
Prix Nobel 1987 pour ces travaux.
93
Présentation du modèle
- Apportent une première explication aux écarts de développement et de taux de croissance entre pays
- Constituent les bases de la théorie de la croissance
- Courant néoclassique
Le modèle de Solow utilise deux équations ; la fonction de production et celle d’accumulation du capital.
L’ économie produit un bien composite en quantité Y à partir de deux facteurs primaires K et L selon une
technologie à rendements constants
Hypothèses :
- Economie fermée et absence de l’Etat I = S
- L’épargne est une fraction fixe s du revenu S = s Y
- Fonction de production néoclassique Y = F (K, L)
* substitution entre capital et travail
* PmF décroissantes (Hypothèse très importante)
* Rendements constants
94
47
19/02/2022
Présentation du modèle
Exemple : Fonction de production Cobb-Douglas
𝐿𝑡 = 𝐴𝑡 𝑁𝑡
𝐴𝑡 est l’efficience du travail
La fonction de production s’écrit
𝑌𝑡 = 𝐹(𝐾𝑡 , 𝐿𝑡 ) = 𝐾𝑡𝛼 𝐴1−𝛼
𝑡 𝑁𝑡1−𝛼
L’efficience s’accroit au taux g et la population au taux n
𝐴𝑡 = (1 + 𝑔)𝐴𝑡−1 𝑁𝑡 = (1 + 𝑛)𝑁𝑡−1
𝐿𝑡 = (1 + 𝑛 + 𝑔)𝐿𝑡−1
95
Pour simplifier, nous présentons toutes les variables par rapport au volume de la force de travail efficient
𝑌𝑡 𝐾𝑡
Ainsi, on pose 𝑦𝑡 = et 𝑘𝑡 =
𝐿𝑡 𝐿𝑡
𝑌𝑡
Le revenu par habitant est donné par 𝑦𝑡 =
𝑁𝑡
𝑌𝑡
𝑦𝑡 = = 𝐹(𝑘𝑡 , 1) = 𝑓(𝑘𝑡 )
𝐿𝑡
𝑌𝑡 = 𝐾𝑡𝛼 𝐿𝑡1−𝛼
𝑦𝑡 = 𝑘𝑡𝛼
96
48
19/02/2022
𝑦=𝑐+𝑖
Les individus épargnent une fraction constante s du revenu et consomment la fraction restante (1-s)
𝑐 = (1 − 𝑠)𝑦
𝑦 = (1 − 𝑠)𝑦 + 𝑖
𝑖 𝑖 = 𝑠𝑓(𝑘)
= 𝑠𝑦
Δ𝑘 = 𝑠𝑓(𝑘) − (𝛿 + 𝑛 + 𝑔)𝑘
97
𝑦 = 𝑘𝛼
Δ𝑘 = 𝑠𝑓(𝑘) − (𝑛 + 𝛿 + 𝑔)𝑘
=0
𝑠𝑘 𝛼 − (𝑛 + 𝛿 + 𝑔)𝑘 = 0
𝑠𝑘 𝛼 = (𝑛 + 𝛿 + 𝑔)𝑘 𝑠𝑘 𝛼−1 = (𝑛 + 𝛿 + 𝑔)
1
𝑠 1−𝛼
𝑘𝑒𝑠 =
𝑛+𝛿+𝑔
98
49
19/02/2022
Si on remplace dans la fonction de production et on introduit le logarithme des deux côtés nous obtenons
𝛼 𝛼
ln( 𝑦) = ln( 𝐴0 ) + ln( 𝑠) − ln( 𝑛 + 𝛿 + 𝑔)
1−𝛼 1−𝛼
Le 𝐴0 reflète non seulement l’état de la technologie mais aussi les ressources, le climat, les institutions, etc. Donc
il diffère d’un pays à un autre.
On peut écrire
𝐴0 = 𝛽0 + 𝜀
99
Nous utilisons les données de MANKIW N.G., D. ROMER et D. WEIL (1992), “A contribution to the
empirics of economic growth”, The Quarterly Journal of economics, vol. 107, no.2, pp. 407-437.
100
50
19/02/2022
101
102
51
19/02/2022
Pour chacune des conditions nous allons examiner, à chaque fois que c’est possible, les éléments suivants :
103
𝜀𝑖Ƹ = 0
En réalité à chaque fois que le modèle contient une constante on est sûr que cette condition est vérifiée
104
52
19/02/2022
Nous avons supposé que la variance est constante 𝐸(𝜀 2 ) = 𝜎 2 . Dans ce cas on parle d’un modèle
homoscédastique. Dans le cas contraire on parle de modèle hétéroscédastique
. . .. . .
. .
. . . ..
0
Homoscédasticité
105
Nous avons supposé que la variance est constante 𝐸(𝜀 2 ) = 𝜎 2 nous avons à faire à un modèle
homoscédastique. Dans le cas contraire nous parlons de modèle hétéroscédastique
. .
.. . .
.. . . .
0
. .
Hétéroscédasticité
106
53
19/02/2022
Nous avons supposé que la variance est constante 𝐸(𝜀 2 ) = 𝜎 2 nous avons à faire à un modèle
homoscédastique. Dans le cas contraire nous parlons de modèle hétéroscédastique
. .
.
. . .
0
. .. .
. .
.
hétéroscédasticité
107
Si nous reprenons l’exemple du modèle de Solow, la distribution des résidus est donnée par
4
-1
-2
-3
10 20 30 40 50 60 70 80 90 100
GDP Residuals
108
54
19/02/2022
𝜀Ƹ 2 = 𝛾0 + 𝛾1 𝑥1 + 𝛾2 𝑥2 + 𝛾3 𝑥12 + 𝛾4 𝑥22 + 𝛾5 𝑥1 𝑥2 + 𝜈
Si on note 𝑅𝜀2 le coefficient de détermination de cette régression on peut montrer que sous l’hypothèse nulle
d’homoscédasticité 𝑛𝑅𝜀2 suit approximativement un Chi-deux avec q degrés de libertés (q est le nombre de
variables explicatives dans le nouveau modèle (ici 5).
Bien entendu si 𝑛𝑅𝜀2 < 𝜒𝑞,𝛼
2 on accepte l’hypothèse nulle que le modèle est homoscédastique
109
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 04/20/21 Time: 15:40
Sample: 1 106
Included observations: 106
55
19/02/2022
Solutions
- Si on connait la source de l’hétéroscédasticité (population non homogène, grand pays et petits pays, données non
stationnaires, etc.) on peut résoudre le problème (prendre des variables par tête, travailler avec des données
stationnaires, etc). Utilisation des données en log
- On estime les erreurs standards à la white
- Dans ce cas il faut être prudent pour rejeter l’hypothèse nulle de non significativité des coefficients
Dans Eviews
Estimate equation options white
111
112
56
19/02/2022
0 0
𝜀
Autocorrélation positive Autocorrélation négative
0 Absence d’autocorrélation
113
114
57
19/02/2022
-Bien entendu, il est possible d’avoir les deux types d’autocorrélations en même temps ARMA(p , q)
-Supposons que notre autocorrélation est de type AR(1)
𝜀𝑡 = 𝜌𝜀𝑡−1 + 𝜐𝑡
115
𝐻 : 𝜌=0
ቐ 0
𝐻1 : 𝜌≠0
La statistique de DW est donnée par
σ(𝜀𝑡Ƹ − 𝜀𝑡−1Ƹ )2
𝐷𝑊 = 2
σ 𝜀𝑡Ƹ
Si n est très grand alors
𝐷𝑊 → 2 − 2𝜌
-Si pas d’autocorrélation 𝜌 = 0 ⇒ 𝐷𝑊 = 2
-Si autocorrélation positive 𝜌 → 1 ⇒ 𝐷𝑊 → 0
- Si autocorrélation négative 𝜌 → −1 ⇒ 𝐷𝑊 → 4
Ainsi 0 2 4
116
58
19/02/2022
Autocorrélation
Absence négative
Autocorrélation d’autocorrélation
positive
117
59
19/02/2022
Elimination de l’autocorrélation
Supposons que le vrai modèle est
𝑦𝑡 = 𝛽0 + 𝛽1 𝑥𝑡 + 𝜀𝑡 (1)
Et
𝜀𝑡 = 𝜌𝜀𝑡−1 + 𝜐𝑡 𝜐𝑡 → 𝑁(0, 𝜎 2 )
119
Elimination de l’autocorrélation
Supposons que le vrai modèle est
𝑦𝑡 = 𝛽0 + 𝛽1 𝑥𝑡 + 𝜀𝑡 (1)
Et
𝜀𝑡 = 𝜌𝜀𝑡−1 + 𝜐𝑡 𝜐𝑡 → 𝑁(0, 𝜎 2 )
120
60
19/02/2022
Elimination de l’autocorrélation
Supposons que le vrai modèle est
𝑦𝑡 = 𝛽0 + 𝛽1 𝑥𝑡 + 𝜀𝑡 (1)
Et
𝜀𝑡 = 𝜌𝜀𝑡−1 + 𝜐𝑡 𝜐𝑡 → 𝑁(0, 𝜎 2 )
121
Elimination de l’autocorrélation
Supposons que le vrai modèle est
𝑦𝑡 = 𝛽0 + 𝛽1 𝑥𝑡 + 𝜀𝑡 (1)
Et
𝜀𝑡 = 𝜌𝜀𝑡−1 + 𝜐𝑡 𝜐𝑡 → 𝑁(0, 𝜎 2 )
122
61
19/02/2022
123
3
1 𝜀𝑖Ƹ − 𝜀Ƹ
Le Skewness est donné par 𝑆=
𝑇 𝜎
4
Le Kurtosis est donné par 1 𝜀𝑖Ƹ − 𝜀Ƹ
𝐾=
𝑇 𝜎
𝑇−𝑘 2 1
𝐾= 𝑆 + (𝐾 − 3)2
6 4
124
62
19/02/2022
𝑇−𝑘 2 1
𝐽𝐵 = 𝑆 + (𝐾 − 3)2
6 4
On peut montrer que, sous l’hypothèse nulle (les erreurs suivant une loi normale), cette quantité suit une loi de Khi-
deux avec 2 d.d.l.
Ainsi si 𝐽𝐵 on ne peut rejeter l’hypothèse nulle et les erreurs suivent une loi normale.
< 𝜒2𝛼
Sur Eviews :
View Residual diagnostics Histogram-Normality test
125
20
Series: Residuals
Sample 1 106
16 Observations 106
Mean -2.79e-16
12 Median -0.035471
Maximum 3.156154
Minimum -2.002630
8 Std. Dev. 0.813848
Skewness 0.376422
Kurtosis 4.606005
4
Jarque-Bera 13.89495
Probability 0.000961
0
-2 -1 0 1 2 3
Comme la probabilité est inférieur à 0,05, on rejette H0 : les erreurs ne sont pas normales
126
63
19/02/2022
𝑝
𝜀𝑡 = 𝛽0 + 𝛽1 𝑥1 +. . . +𝛽2 𝑥𝑘 + 𝛾1 𝑦ො𝑡2 +. . . +𝛾𝑝−1 𝑦ො𝑡 + 𝜐𝑡
127
En reprenant le modèle relatif au modèle de Solow et pour p =1, on obtient On accepte H0. Le
Ramsey RESET Test Unrestricted Test Equation:
modèle est bien
Equation: EQ01 Dependent Variable: GDP linéaire
Specification: GDP C INV POP Method: Least Squares
Omitted Variables: Squares of fitted values Date: 04/21/21 Time: 12:07
Sample: 1 106
Value df Probability Included observations: 106
t-statistic 1.431484 102 0.1553
F-statistic 2.049146 (1, 102) 0.1553 Variable Coefficie... Std. Error t-Statistic Prob.
Likelihood ratio 2.108397 1 0.1465
C -0.03257... 4.205901 -0.007746 0.9938
F-test summary: INV -2.75686... 2.958218 -0.931935 0.3536
Sum of S... df Mean Squares POP 1.836818 1.934073 0.949715 0.3445
Test SSR 1.369654 1 1.369654 FITTED^2 0.181975 0.127124 1.431484 0.1553
Restricted SSR 69.54667 103 0.675210
Unrestricted SSR 68.17702 102 0.668402 R-squared 0.481126 Mean dependent var 8.123731
Adjusted R-squared 0.465865 S.D. dependent var 1.118648
LR test summary: S.E. of regression 0.817559 Akaike info criterion 2.472017
Value df Sum squared resid 68.17702 Schwarz criterion 2.572524
Restricted LogL -128.071... 103 Log likelihood -127.016... Hannan-Quinn criter. 2.512753
Unrestricted LogL -127.016... 102 F-statistic 31.52652 Durbin-Watson stat 1.385906
Prob(F-statistic) 0.000000
128
64
19/02/2022
129
On voit qu’un des coefficients de corrélations simples élevés au carré est proche du R 2 =0,46, alors il y a risque de
multicollinéarité.
130
65
19/02/2022
Ainsi on teste
H0 : Les variables explicatives sont des variables aléatoires non-corrélées
H1 : Les variables explicatives sont des variables aléatoires corrélées.
Le test est basé sur le fait que sous H0 et avec une hypothèse de normalité, la statistique (sur 10 observations)
2
1
𝜒𝑜𝑏𝑠 = − 𝑛 − 1 − [2(𝑘 + 1) + 5] log( 𝐷)
6
Suit une loi de Khi-deux à (𝑘 + 1)𝑘/2 d.d.l.
Bien entendu si 2
𝜒𝑜𝑏𝑠 << 𝜒𝛼2 il n’y a pas de problème de multicollinéarité
131
2
1
𝜒𝑜𝑏𝑠 = − 10 − 1 − [2(3 + 1) + 5] log( 0,483) = 2,15
6
2
A comparer avec 𝜒0,05;6 = 12,59
2
Comme 𝜒𝑜𝑏𝑠 << 𝜒𝛼2 on ne rejette pas H0. Il n’ ya pas de problème de multicollinéarité
132
66