100% ont trouvé ce document utile (1 vote)
435 vues52 pages

Cours Prévision

Ce document décrit les différents types de séries chronologiques et présente des méthodes pour détecter la saisonnalité dans une série temporelle, notamment l'analyse graphique, le tableau de Buys-Ballot et l'analyse de la variance avec le test de Fisher.

Transféré par

Hajar Azzaye
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
100% ont trouvé ce document utile (1 vote)
435 vues52 pages

Cours Prévision

Ce document décrit les différents types de séries chronologiques et présente des méthodes pour détecter la saisonnalité dans une série temporelle, notamment l'analyse graphique, le tableau de Buys-Ballot et l'analyse de la variance avec le test de Fisher.

Transféré par

Hajar Azzaye
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
Vous êtes sur la page 1/ 52

Université Mohammed V

Ecole Mohammedia d’Ingénieurs


Département : Génie Industriel
Enseignant : Mohammed Salah CHIADMI
Année Académique : 2020/2021

Cours de Séries
Chronologiques

1
CHAPITRE 1 : DESCRIPTION DES SERIES CHRONOLOGIQUES

Plusieurs modèles à distinguer :

 Série temporelle : c’est le cas le plus fréquent, il s’agit de variables observées à


intervalles de temps réguliers (la consommation annuelle Totale France exprimée en
Euro sur 20 ans)
 Coupe instantanée : les données sont observées au même instant et concernent les
valeurs prises par la variable pour un groupe d’individus spécifiques (consommation
observée des agriculteurs pour une année donnée)
 Panel : la variable représente les valeurs prises par un échantillon d’individus à
intervalles réguliers (la consommation d’un échantillon de ménages de la région
parisienne sur 20 ans)
 Cohorte : très proches des données de Panel, les données de cohorte se distinguent de
la précédente par la constance de l’échantillon, les individus sondés sont les mêmes
d’une période sur l’autre.

L’étude des séries temporelles, ou séries chronologiques, correspond à l’analyse statistique


d’observations régulièrement espacées dans le temps.

Le but est ici de déterminer les différentes composantes d’une série ( ), en particulier,
obtenir la série corrigée des variations saisonnières (méthodes de désaisonnalisation). Pour les
séries stationnaires, on peut aussi chercher à modéliser la série à l’aide d’un modèle ARMA,
par exemple dans le but de faire de la prévision.

Les premières études sur les chroniques ont amené à considérer de façon standard quatre
grandes composantes :

La tendance ou Trend notée , censée décrire le mouvement de long terme, de fond ou


encore structurel du phénomène.

La composante cyclique notée (une période de 4 à 5 ans). Dans la plupart des travaux sur
les séries temporelles, la tendance et le cycle sont regroupés en une seule composante appelée
l’extra-saisonnier

La composante saisonnière notée : composante cyclique relativement régulière de période


intra-annuelle et qui correspond souvent à des phénomènes de mode, de coutume, de climat…

Séries chronolgiques 2
La composante résiduelle notée : elle rassemble tout ce que les autres composantes n’ont
pu expliquer du phénomène observé. Elle contient donc de nombreuses fluctuations en
particulier accidentelles, dont le caractère est exceptionnel et imprévisible (catastrophes
naturelles, grèves, guerres,..). Le résidu en général présente une allure aléatoire plus ou moins
stable autour de la moyenne.

L’étude de la saisonnalité est un préalable au traitement d’une série chronologique. En effet,


lorsque cette composante existe, il convient de l’isoler afin de pouvoir analyser les autres
caractéristiques. Ainsi, nous allons présenter les techniques permettant de tester l’existence
d’une composante saisonnière, puis nous examinons les méthodes de désaisonnalisation.

I) La détection de la saisonnalité

A. La représentation graphique et le tableau de Buys-Ballot

L’analyse graphique d’une chronique suffit parfois pour mettre en évidence une saisonnalité.
Néanmoins, si cet examen n’est pas révélateur ou en cas de doute, le tableau de Buys-Ballot
permet d’analyser plus finement l’historique. La figure 1.1 des ventes trimestrielles d’un
produit festif indique une saisonnalité marquée au 4ème trimestre, ce que nous pouvons
confirmer à l’aide du tableau de Buys-Ballot.

C’est un tableau à deux entrées dans lequel sont consignées les valeurs . Il est constitué en
ligne par les années et en colonne par le facteur à analyser (mois, trimestre..). Les moyennes
et les écarts type des années et des trimestres (ou des mois selon le cas) sont calculés ainsi que
pour l’ensemble des observations de la chronique.

Tableau 1.1 : exemple de constitution d’un tableau de Buys-Ballot

Dates Moyenne Ecart type

Année 1 1248 1392 1057 3159 1714 842.69

Année 2 891 1065 1118 2934 1502 831.02

Année 3 1138 1456 1224 3090 1727 795.48

Moyenne 1092 1304 1133 3061 MoyGén Ec Type Gé

Ecart type 149 171 69 94 1647.7 829.74

Nous pouvons alors classer les trimestres pour chaque année par valeurs décroissantes.

Tableau 1.2 : Classement des trimestres en fonction de leurs valeurs

Années

Année 1 T4 T2 T1 T3

Séries chronolgiques 3
Année 2 T4 T3 T2 T1

Année 3 T4 T2 T3 T1

La lecture du tableau 1.2 indique la persistance du trimestre T4 à se classer en première


position quelles que soient l’année, et la position de « creux » occupée par le trimestre T1, ce
qui nous conduit à retenir l’existence d’une saisonnalité rigide. Cette technique très simple
permet la détection de la saisonnalité et aussi d’en préciser la nature.

B. Analyse de la variance et test de Fisher

L’examen visuel du graphique ou du tableau ne permet pas toujours de déterminer avec


certitude l’existence d’une saisonnalité. Le test de Fisher à partir de l’analyse de la variance
permet de pallier à ce problème.

Ce test suppose la chronique sans tendance ou encore sans extra-saisonnalité.

Soit N le nombre d’années, et p le nombre d’observations (la périodicité que ce soit


trimestrielle, mensuelle, …)
ème ème
la valeur de la chronique pour la année ( et la période
supposée telle que : ; les sont les résidus aléatoires formés d’éléments
indépendants : .

Les sont les éléments d’une composante de la chronique qui s’écrivent :


avec : mesure l’effet année en ligne du tableau, et mesure l’effet période en colonne du
tableau.

Deux effets absents sont testés contre deux effets significativement présents :

Si l’effet période (trimestre ici) est significatif, la série est saisonnière.

Si l’effet année est significatif, ceci suggère deux interprétations :

La chronique de départ n’a pas été transformé, elle possède alors des paliers horizontaux.

La chronique a été transformée, des changements de tendance existent dans la chronique.

Le déroulement du test est le suivant :

1) calcul de la variance totale du Tableau

Soit la somme totale des carrés :

∑∑

Séries chronolgiques 4
Avec

∑∑

Est la moyenne générale de la chronique sur les observations.

∑ : Moyenne de l’année i

∑ : Moyenne de la période j

Comme : avec et

Nous obtenons :

∑ ∑( ) ∑ ∑[( ) ( ) ( )]

∑∑

∑ ∑( )

∑ ∑( )

∑ ∑( ) ∑ ∑( )

Tableau 1.3 Calculs des moyennes par année et période

Années/pér 1 …. J … P Moyennes années


1
..
i ∑

N
Moyennes
périodes ∑ ∑∑

Séries chronolgiques 5
Nous utilisons ces résultats pour effectuer l’analyse de la variance de la série.

Tableau 1.4 : Analyse de la variance pour détecter une saisonnalité et / ou une tendance

Sommes des carrés Degrés de liberté Désignation Variance

∑( ) Variance
Période

Variance
∑ année

Variance
∑ ∑( ) résidu

Variance
totale

A partir de ce tableau, nous pouvons construire les tests d’hypothèses.

2) Test de l’influence du facteur colonne, la période (mois ou trimestre)

: Pas d’influence du facteur période

Calcul du Fisher empirique : que l’on compare au Fisher lu dans la table à


et degrés de liberté.

Si le Fisher empirique est supérieur au Fisher lu dans la table, on rejette l’hypothèse , la


série est donc saisonnière.

3) Test de l’influence du facteur ligne, la tendance

: Pas d’influence du facteur année

Calcul du Fisher empirique que l’on compare au Fisher lu dans la table à


et degrés de liberté.

Si le Fisher empirique est supérieur au Fisher lu dans la table, on rejette l’hypothèse , la


série est donc affectée d’une tendance.

Application : Test de détection de la saisonnalité à partir des données du Tableau 1.1

a) test de saisonnalité :

Séries chronolgiques 6
La série est donc saisonnière.

b) Test de tendance

L’hypothèse est rejetée : la chronique est affectée d’une tendance.

C- La fonction d’autocorrélation

Lorsque deux phénomènes ont une évolution commune, nous disons qu’ils sont corrélés. La
corrélation simple mesure le degré de liaison existant entre ces deux phénomènes représentés
par des variables. Si nous cherchons une relation entre tris variables ou plus, nous ferons
appel alors à la notion de corrélation multiple.

Nous pouvons distinguer la corrélation linéaire, lorsque tous les points du couple de valeurs
des deux variables semblent alignés sur une droite, de la corrélation non linéaire lorsque
le couple de valeurs se trouve sur une même courbe d’allure quelconque.

Deux variables peuvent être :

 En corrélation positive : on constate alors une augmentation (ou diminution ou


constance) simultanée des valeurs des deux variables.
 En corrélation négative : lorsque les valeurs de l’une augmentent, les valeurs de l’autre
diminuent.
 Non corrélées, il n y a aucune relation entre les variations des valeurs de l’une des
variables et les valeurs de l’autres.

On appelle fonction d’autocorrélation d’ordre 1 le coefficient de corrélation linéaire simple


calculé entre la série chronologique et cette même série décalée d’une période de temps.

La représentation graphique de la fonction d’autocorrélation (notée FAC) est appelée


corrélogramme.

Le coefficient d’autocorrélation d’ordre k est donné par :

∑ ̅̅̅ ̅̅̅
√∑ ̅̅̅ √∑ ̅̅̅
∑ ̅̅̅̅̅̅
̅̅̅

√ ∑ ̅̅̅ ∑ ̅̅̅

Séries chronolgiques 7
Avec

̅̅̅ ∑

Et

̅̅̅ ∑

Le test de signification sur le coefficient permet de sélectionner les coefficients


d’autocorrélation significativement différents de 0 ; il peut si n est suffisamment grand,
s’effectuer pour un coefficient linéaire simple. Soit la vraie valeur de et l’hypothèse

| |
Sous cette hypothèse, la quantité √ obéit à une loi de student à n-2 degrésde

liberté (ou à une loi normale centrée réduite si n>30). Si , l’hypothèse est rejetée.

Application : Calcul d’une fonction d’autocorrélation

A partir des données relatives aux ventes du tableau 1.1, on demande de calculer la FAC et de
tester la significativité des coefficients d’autocorrélation par rapport à 0.

Solution

Nous allons détailler sur le tableau 1.6 les calculs pour un coefficient , c’est-à-dire la
corrélation entre et .

Tableau 1.6 : exemple de calcul pour un coefficient d’autocorrélation d’ordre2

t ̅̅̅̅̅ ̅̅̅̅̅ ̅̅̅̅̅ ̅̅̅̅̅

1
1057 1248
2
3159 1392
3
891 1057
4
1065 3159

Séries chronolgiques 8
5
1118 891
6
2934 1065
7
1138 1118
8
1456 2934
9
1224 1138

10 3090
1456
Somme 17132 15458

Moyenne 1713.2 1545.8 -901 668.23 7995376.17 5899300.68

∑ ̅̅̅ ̅̅̅
√∑ ̅̅̅ √∑ ̅̅̅ √ √

| |
Le t empirique est égal pour et : √

Ainsi on accepte l’hypothèse

Le tableau 1.7 indique l’ensemble des valeurs de la fonction d’autocorrélation que l’on
compare à la valeur lue dans la table de student pour un seuil de 5% à n-2 degrés de liberté.
Seul le coefficient d’autocorrélation d’ordre 4 est significativement différent de 0 ; la
périodicité des données étant trimestrielle, ce pic est attribué à la saisonnalité des données.

Retard n Ddl t lu à 0.95

0 1 12

1 -0.395 11 1.29 9 2.262

2 -0.132 10 0.38 8 2.306

3 -0.962 9 1.13 7 2.365

4 0.952 8 7.62 6 2.447

Séries chronolgiques 9
Séries chronolgiques 10
I- Modélisation d’une chronique à tendance linéaire.

Exemple : Les données sont obtenues à partir des données trimestrielles pendant 3 années
consécutives. On considère la série suivante :
t x t 
On peur représenter ces données à l’aide d’un tableau à
1 24
double entrée de la manière suivante :
2 25
3 29
4 24 J 1 2 3 4
5 24 I
6 27 1 24 25 29 24
7 30 2 24 27 30 26
8 26 3 27 29 32 29
9 27
10 29 J correspond au rang du trimestre.
11 32 I correspond au rang de l’année.
12 29

Les observations sont périodiques et la période est égale à 4.


L’étude d’une série chronologique permet d’effectuer des prévisions, c’est-à-dire d’estimer
des valeurs futures, x  t  non disponible, autrement dit pour t   .
Dans notre exemple T  12 , les valeurs x 12  h  ne sont pas disponibles  h  1, 2,..... . Pour
que ceci soit possible, il est nécessaire que le comportement général à l’aide d’un modèle
mathématique basé sur trois composantes essentielles :
a) Le mouvement conjoncturel (ou extra-saisonnier) ou la tendance (ou trend). Cette
composante, notée y  t  , décrit le mouvement de croissance général de la série.
b) Le mouvement saisonnier : cette composante, notée s  t  , décrit les variations
saisonnières de la série, qui correspondent à des fluctuations permanentes, et se
propagent de la même manière à des intervalles réguliers.
c) Le mouvement erratique : cette composante, notée e  t  , décrit les aléas, les
fluctuations accidentelles de faible amplitude dues à des causes multiples difficieles à
individualiser.

Notations : x  t  : valeur brute de la série au temps t .


y  t  : la tendance.
s  t  : le mouvement saisonnier de période p .
e  t  : les aléas.
On adopte couramment les deux schémas suivants :
- Un modèle à coefficients saisonniers additifs : x  t   y  t   s  t   e  t  .
- Un modèle à coefficients saisonniers multiplicatifs : x  t   y  t   1  s  t    e  t  .

1) Choix du modèle :
Séries chronolgiques 11
On utilise la méthode graphique :
- Si les variations saisonnières se retrouvent d’année en année avec une amplitude
constante, alors on retient le modèle additif.
- Si les variations saisonnières sont proportionnelles au niveau atteint par la série,
alors on opte pour le modèle multiplicatif.

La méthode graphique : lorsque le graphe ne permet pas de trancher dans le pratique, on


privilégie le modèle multiplicatif. La méthode graphique se base sur les « courbes annuelles
superposées ».

Modèle additifModèle multiplicatif


x t  x t 

Trimestre Trimestre

3ème année

2ème année

1ère année

Application :

Graphe de la série brute :

Séries chronolgiques 12
graphe de la série brute

35
30
25
20
x(t)
15
10
5
0
1 2 3 4 5 6 7 8 9 10 11 12

Courbe annuelle superposée :


courbe annuelle superposée

34
32
30
28 année 1
x(t)

année 2
26
année 3
24
22
20
1 2 3 4
J

On retient le modèle multiplicatif car les courbes annuelles superposées ne sont pas parallèles.

2) Estimation préliminaire de la tendance.


Lorsque la tendance est linéaire, la méthode la plus simple et la plus utilisée est le lissage par
moyenne mobile.
La moyenne mobile centrée d’ordre p est notée M p  t  .
- Si p est impair (c’est-à-dire p  2m  1 ), alors :
M p  t     x  t  m   x  t   m  1   .....  x  t   m  1   x  t  m   .
1
p
Séries chronolgiques 13
- Si p est pair (c’est-à-dire p  2m ), alors :
1  x t  m x t  m  
M p t     x  t   m  1   .....  x  t   m  1   .
p  2 2 

Illustration numérique :

t 1 2 3 4 5 6
x t  84 123 165 108 103 137

1
Calculons : M 3  t     x  t  1  x  t   x  t  1  .
3
Pour t  1 , on a : M 3 1 est non-définie car x  0  est non disponible.
1 84  123  163
Pour t  2 , on a : M 3  2     x 1  x  2   x  3    124 .
3 3
1
Pour t  3 , on a : M 3  3    x  2   x  3  x  4    132 .
3
Pour t  4 , on a : M 3  4   125.3 .
Pour t  5 , on a : M 3  5  116 .
Pour t  6 , on a : M 3  6  est non-définie car x  7  est non disponible.

On a alors :
t 1 2 3 4 5 6
x t  84 123 165 108 103 137
M 3 t  --- 124 132 125.3 116 ---
M 4 t  --- --- 122.38 126.5 --- ---

Car : Pour t  1 , on a : M 4 1 est non-définie car x  1 est non disponible.
Pour t  2 , on a : M 4  2  est non-définie car x  0  est non disponible.
1  x 1 x  5 
Pour t  3 , on a : M 4  3     x  2   x  3  x  4     122.38 .
4  2 2 

1  x  2 x  6 
Pour t  4 , on a : M 4  4      x  3  x  4   x  5     126.5 .
4  2 2 

Propriétés d’une moyenne mobile :


a) Une moyenne mobile est opérateur linéaire, c’est-à-dire :
- M p  t  X  X    M p  t  X   M p  t  X  
- M p  t    X     M p  t  X    

Séries chronolgiques 14
b) Une moyenne mobile de longueur d’ordre p arrête une fonction périodique de
période p .
c) Une moyenne mobile transforme une fonction affine de la forme y  a  t  b en elle
même.
d) Une moyenne mobile transforme la série des aléas e  t  en une série   t  moins
dispersée ou plus lisse.
1  x t  2 x t  2 
Série brute : x  t  Série : M 4  3     .....  
4  2 2 
J 1 2 3 4 J 1 2 3 4
I I
1 24 25 29 24 1 --- --- 25.5 25.75
2 24 27 30 26 2 26.125 26.5 27.125 27.75
3 27 29 32 29 3 28.75 28.875 --- ---

33
31
29
27
25 série brute
x(t)

23 série M4(t)
21
19
17
15
1 2 3 4 5 6 7 8 9 10 11 12

2) Estimation du mouvement saisonnier.

Hypothèses fondamentales sur le mouvement saisonnier : s  t  k  p   s  t  , c’est-à-dire, s


est une fonction périodique de période p .
Exemple : Pour p  4 et t  1 , on a : s 1  4  s 1  s 1  2  4  s  9

Séries chronolgiques 15
Sur tout intervalle de longueur p , la somme des aires au-dessus de la tendance est égale à la
somme des aires en dessous => Hypothèse de conservation des aires (HCA).

On a alors :

Somme des aires en dessous

Somme des aires au-dessus

3.1) Le modèle additif : x  t   y  t   s  t   e  t  .

a) On calcule les écarts saisonniers : s  t   x  t   M p  t  .


b) Estimation préliminaire des coefficients saisonniers s  J  en imposant à s  t  de
vérifier la périodicité, soit par la médiane, soit par la moyenne, en ne retenant qu’une
seule valeur.
c) Estimation définitive des coefficients saisonniers s  J  en imposant à s  t  de vérifier
p
la loi des aires, c’est-à-dire  s  t   0 , pour une intervalle de longueur
j 1
p , en
p
sJ 
remplaçant s  J  par s  J   s  J    .
j 1 p
4
sJ  0.0625
Par exemple : s 1  s 1    1.6875   1.7 .
j 1 4 4

J 1 2 3 4
I
1 --- --- 3.5 -1.75
2 -2.125 0.5 2.875 -1.75
3 -1.25 0.125 --- ---
sJ  -1.6875 0.3125 3.1875 -1.75
s  J  -1.7 0.3 3.2 -1.8

Séries chronolgiques 16
3.2) Le modèle multiplicatif : x  t   y  t  1  s  t    e  t  .

x t 
d) On calcule les écarts saisonniers : 1  s  t   .
M p t 
e) Estimation préliminaire des coefficients saisonniers 1  s  J  en imposant à 1  s  t 
de vérifier la périodicité, soit par la médiane, soit par la moyenne, en ne retenant
qu’une seule valeur.
f) Estimation définitive des coefficients saisonniers 1  s  J  en imposant à 1  s  t  de
p
vérifier la loi des aires, c’est-à-dire  1  s  t    0 , pour une intervalle de longueur
j 1

1  s t 
p , en remplaçant 1  s  J  par 1  s  J   s  J   .
p
1  s t 

j 1 p
1  s 1 1  0.94
Par exemple : 1  s 1  4   4  094 .
4.01 4.01

J 1 2 3 4
I
1 --- --- 1.14 0.93
2 0.93 1.02 1.11 0.94
3 0.96 1 --- ---
sJ  0.94 1.01 1.125 0.935
s  J  0.94 1 1.12 0.94

3) Désaisonnalisation d’une chronique.

Définition : On appelle série corrigée des variations saisonniers (série CSV) la série z  t 
obtenue de la manière suivante : z  t   x  t   s  t  , pour un modèle additif.
x t 
z t   , pour un modèle multiplicatif.
1  s  t 
z  t  représente l’estimation définitive de la tendance.

Application numérique :

Séries chronolgiques 17
Modèle additif :Modèle multiplicatif :

t x t  s  t  z t 
t x  t  1  s  t  z t 
1 24 -1.7 25.7 1 24 0.94 25.5
2 25 0.3 24.7 2 25 1 25
3 29 3.2 25.8 3 29 1.12 25.9
4 24 -1.8 25.8 4 24 0.93 25.8
5 24 -1.7 25.7 5 24 0.94 25.5
6 27 0.3 26.7 6 27 1 27
7 30 3.2 26.8 7 30 1.12 26.8
8 26 -1.8 27.8 8 26 0.93 28
9 27 -1.7 28.8 9 27 0.94 28.7
10 29 0.3 28.7 10 29 1 29
11 32 3.2 28.8 11 32 1.12 28.6
12 29 -1.8 30.8 12 29 0.93 31.2

Représentation Graphique :

34

32

30 serie brute

28
modele
x(t) , z(t) adittif
26
modele
24 multiplicatif

22

20
1 2 3 4 5 6 7 8 9 10 11 12
t

2) Prévisions :

Effectuer une prévision consiste à estimer à partir des valeurs x T  h  avec  h  1, 2,... .
1ère étape : La tendance décrite par z  t  étant linéaire, on peut donc remplacer z  t  par une
fonction ẑ  t   a  t  b qui est l’équation de la droite d’ajustement Dz .
t

2ème
étape : xˆ T  h   zˆ T  h   s T  h  si le modèle est additif.

Séries chronolgiques 18
ou xˆ T  h   zˆ T  h  1  s T  h   si le modèle est multiplicatif.
Détermination de a et de b :
cov  z  t  , t 
a et b  z  a  t ( z et t étant les moyennes respectives de z  t  et de t )
V (t )

Application numérique : Cas du modèle multiplicatif :

Déterminons les prévisions du 1er trimestre et du 2ème trimestre de la 4ème année, c’est-à-dire
cov  z  t  , t 
xˆ 13 et xˆ 14  . On détermine ẑ  t   a  t  b , avec a  et b  z  a  t .
V (t )
12

 z t 
cov  z  t  , t   t 1
z t 
12
12
z t   25.5  25  .......  31.2   27.18
Or on a : z   
t 112 12
12
t 1  2  ......  12  12  12  1
Et : t      6.5
t 1 12 12 2 12
12
z  t   t 374.19
Puis enfin :    182.4 .
t 1 12 12
Nous avons donc : cov  z  t  , t   182.4   27.18  6.5  5.76
12
t2
De plus : V (t )=   t   13 .
2

t 1 12
5.76
Nous pouvons alors trouver a et b : a   0.48 et b  27.18   0.48  6.5  24.04 .
13
Nous avons alors l’équation de la droite d’ajustement Dz : zˆ  t   0.48t  24.04 .
t

Alors nous pouvons trouver : zˆ 13  0.48 13  24.04  30.32


Et zˆ 14   0.48 14  24.04  30.8 .
Et nous pouvons en déduire :

 
xˆ 13  zˆ 13 1 s 13  zˆ 13  0.94  28.5

xˆ 14  zˆ 14 1 s 14   zˆ 14 1  30.8

Le modèle de régression simple :

Une variable endogène est expliquée par une variable exogène.

Soit la fonction de consommation keynésienne :

Séries chronolgiques 19
Où :

: Consommation ; c’est la variable expliquée (Variable endogène)

: Revenu : variable explicative (exogène )

: Propension marginale à consommer

: Consommation incompressible

: Les paramètres du modèle ou encore les coefficients de la régression.

Rôle du terme aléatoire

Le modèle tel qu’il vient d’être spécifié n’est qu’une caricature de la réalité. En effet, ne
retenir que le revenu pour expliquer la consommation est insuffisant, il existe une multitude
d’autres facteurs susceptibles d’expliquer la consommation. C’est pourquoi nous ajoutons un
terme qui synthétise l’ensemble de ces informations non explicitées dans le modèle

: représente l’erreur de spécification du modèle, c’est-à-dire l’ensemble des phénomènes


explicatifs de la consommation non liés au revenu. Le terme mesure la différence entre les
valeurs réellement observées de et les valeurs qui auraient été observées si la relation avait
été rigoureusement exacte.

Estimation des paramètres

Soit le modèle suivant

Hypothèses :

Les modèle est linéaire en

 Les valeurs sont observées sans erreur ( non aléatoire)


 , l’espérance mathématique de l’erreur est nulle, en moyenne le modèle est
bien spécifié et donc l’erreur moyenne est nulle.
 , la variance de l’erreur est constante ; le risque de l’amplitude de l’erreur
est le même quel que soit la période.
 si , les erreurs sont non corrélées (ou encore indépendantes) : une
erreur à l’instant t n’a pas d’influence sur les erreurs suivantes.
 , l’erreur est indépendante de la variable explicative.

Séries chronolgiques 20
Formulation des estimateurs

En traçant un graphique des couples de données liant le revenu et la consommation observée,


nous obtenons un nuage de points que nous pouvons ajuster à l’aide d’une droite.

L’estimateur des coefficients est obtenu en minimisant la distance au carré entre


chaque observation et la droite, d’où le nom de l’estimateur des moindres carrés ordinaires
(MCO). La résolution analytique est la suivante :

∑ ∑

∑ ̂ ̂

∑ ̂ ̂

Sommant par rapport à t il vient :

∑ ̂ ∑ ̂ ∑

∑ ̂ ̂ ∑

∑ ̅̅ ∑ ̅ ̅
̂
∑ ̅ ∑ ̅

̂ ̅ ̂ ̅

Séries chronolgiques 21
Prévision d’une série chronologique

Prévision d’une série chronologique non saisonnière

Si une chronique ne possède pas de saisonnalité ou a été désaisonnalisée, il est indispensable


de tester la présence ou non d’une tendance. Les tests relatifs à cette détection utilisent la
plupart des instruments déjà présentés pour l’existence de la saisonnalité, à savoir :

 La représentation graphique de la série brute


 La fonction d’autocorrélation

Ces instruments peuvent être nécessaires, mais ils sont insuffisants. En effet, la forme d’une
forme d’autocorrélation n’est pas toujours révélatrice d’une tendance qui néanmoins peut
exister.

A. Analyse par la régression

Si une tendance existe suite aux tests effectués sur la série brute, l’utilisation correcte des
techniques suppose que l’on puisse discriminer la tendance déterministe de la tendance
aléatoire. La tendance déterministe est celle qui se présente sous forme analytique rigide pour
l’ensemble des observations. Elle peut être linéaire ou non.
Si la tendance est linéaire, le modèle s’écrit :

La techniques des MCO fournit les estimateurs de a et b. cette méthode postule des
paramètres a et b constants dans le temps, et la prévision porte plutôt le nom d’extrapolation
de la chronique.

Si la tendance est non linéaire, nous pouvons distinguer deux cas :


La tendance non linéaire est transformable en tendance linéaire (fonction de puissance,
fonction logistique…) ; la méthode employée est celle des MCO sur les données
transformées.

La tendance non linéaire est non transformables ; on recourt à des algorithmes d’optimisation
non linéaire afin d’estimer ses paramètres.

B. Le lissage exponentiel

La technique du lissage exponentiel est utilisée dans le cas d’une chronique affectée d’une
tendance aléatoire. Le lissage regroupe l’ensemble des techniques empiriques qui ont pour
caractéristiques communes d’accorder un poids plus important aux valeurs récentes de la
chronique. Ces méthodes portent aussi le nom du filtrage, car il s’agit d’une opération
mathématique transformant un entrant en une nouvelle chronique sortante .

Séries chronolgiques 22
Les méthodes de lissage exponentiel non saisonnier supposent que la chronique de départ est
structurée de la façon suivante :

Où :

[ ] [ ] [ ]

: Fonction polynomiale de degré k dont les paramètres dépendent du temps.

les méthodes de lissages se différencient entre elles selon le degré de ; les degrés les plus
utilisés sont .

Si , la série s’écrit :

Avec

C’est ce qu’on appelle lissage exponentiel simple ou LES.

Si :

Avec et c’estlelissage exponentiel double (LED).

1-le lissage exponentiel simple

a- Formulation générale

Supposons que représente les ventes d’un produit quelconque en t. ces ventes peuvent être
considérées comme le résultat d’une combinaison linéaire infinie de ses valeurs passées, le
poids ou l’influence du passé sur le présent étant décroissant avec son ancienneté. Nous
pouvons écrire la combinaison linéaire selon :

avec

Elle représente la valeur lissée de la chronique calculée en t-1. Par hypothèse et lorsque les
paramètres sont estimés, cette valeur lissée peut être considérée comme la valeur prévue de
calculée en . Soit :

Le problème est donc de déterminer les coefficients conformément à l’hypothèse du lissage.


Pour cela, on suppose que la combinaison linéaire obéit à un modèle géométrique normalisé :

Séries chronolgiques 23
 Il est géométrique car les poids de la combinaison décroissent exponentiellement
 Il est normalisé car la somme des poids est égale à 1.

Pour que les poids décroissent exponentiellement, on écrit :

Avec et

D’où

∑ ∑

On constate donc que les poids ne sont pas normalisés.

Pour les normaliser on les divise par leur somme, tel que :

En remplaçant les poids dans le modèle géométrique infini :

̂ ∑

Cette formule peut s’écrire :

̂ [ ]

Soit :

̂ ̂

Sous cette forme, le lissage est une moyenne pondérée de la dernière réalisation et de la
dernière valeur lissée.

Ou encore
̂ ̂

Le lissage apparait comme le résultat de la dernière valeur lissée corrigé par une pondération
de l’écart entre la réalisation et la prévision.

Le paramètre appelé la constante de lissage joue un rôle important :

 Lorsque est proche de 0, la pondération s’étale sur un grand nombre de termes du


passé, la mémoire du phénomène est forte et la prévision est peu réactive aux dernières
observations.
Séries chronolgiques 24
 Lorsque est proche de 1, les observations les plus récentes ont un poids prépondérant
sur les termes anciens, la mémoire du phénomène est faible et le lissage est très réactif
aux dernières observations.

A un instant donnée de l’historique, le calcul de ̂ est réalisable puisque tous les


éléments de la formule sont connus. Pour la prévision de la chronique (
Avec l’horizon de prévision du modèle. Ca calcul ne peut être effectué que pour le
premier pas du temps.
En effet :
Pour n+1 :
̂ ̂ ( ̂
En Revanche, pour :
̂ ̂ mais la valeur de est inconnue. La seule
information dont nous disposons est sa prévision ̂ . En substituant cette valeur dans
l’équation, on obtient : ̂ ̂ et plus généralement : ̂ ̂

Utilisation du LES

Choix de la constante
La valeur optimale du coefficient de lissage à un instant donné résulte d’un compromis
entre l’inertie liée à l’intégration des données lointaines et la sensibilité aux valeurs
récentes.
En cas d’erreurs de prévision…..

La valeur du coefficient du lissage est celle qui minimise la somme des carrés des erreurs
de prévision passée :

∑ ∑ ̂

Son principe est simple : pour l’intervalle donnée [ ] des valeurs de , les prévisions
sont simulées avec un pas assez fin (0.01) par exemple, et nous retenons la valeur de qui
rend minimum la somme des carrés de prévision. L’utilisation d’un solveur sur les
tableurs permet de résoudre ce problème.

Initialisation des calculs

Dans la formule du LES :


̂ ̂
̂ ̂ , on a et ̂ inconnus.
̂ ̂ , seul ̂ inconnu.

Séries chronolgiques 25
Plusieurs solutions existent pour démarrer les calculs à la période :
Prendre la moyenne arithmétique des .
Poser ̂
Choix du nombre d’observations en fonction de
Il est possible de déterminer le nombre d’observations en fonction de . En effet, la
pondération des observations décroit de manière géométrique jusqu’à devenir négligeable
au-delà d’un temps .
Soit A cet impact proche de 0, nous avons alors :

Soit :

Intervalle de confiance de la prévision

nous avons montré précédemment que :

Le résidu ou l’erreur de la prévision effectuée en t-1 pour t est :


̂ : d’où :

̂
Car et ̂ sont indépendants.

D’où : ( )
L’intervalle de confiance à de la valeur prévue de en s’écrit :


( )

P( *̂ √ +

Avec la valeur de loi normale centrée réduite. Pour un intervalle de confiance de 95%,
nous avons :

Séries chronolgiques 26
̂ √

Application : Calcul d’une prévision par un LES

Soit les données observées de la série consignées sur le Tableau 2. On demande de


calculer une prévision par un LES assortie de son intervalle de confiance à 95% à un
horizon de trois périodes. La constante de lissage est égale à 0.3.

Solution

t ̂ ̂
1 30 30 0
2 40 30 10
3 40 33 7
4 30 35.10 -5.10
5 20 33.57 -13.57
6 20 29.50 -9.50
7 30 26.65 3.35
8 30 27.65 2.35
9 28.36
10 28.36
11 28.36
On initialise
̂
Pour (prévision calculée en t=1 pour t=2), nous avons :
̂ ̂
pour :̂ ̂
….
pour t= 8 : ̂ ̂
pour t= 9 : ̂ ̂
pour t=10, 11 : ̂ ̂ ̂

Nous avons :

et√

D’où : ̂ √ [ ]

Le lissage exponentiel double

Séries chronolgiques 27
Le modèle du lissage exponentiel double s’applique à une chronique du type :

Initialisation
En t=1 nous avons :

̂ ̂
̂
̂ ̂ ̂
̂
Comme ̂ ̂ ̂
̂ sont inconnus, les calculs débutent en où seuls ̂ ̂
̂ ne
sont pas déterminés.
Il existe plusieurs procédures d’initialisation pour le LED :
La plus simple consiste à choisir : ̂ ̂ ̂ , soit ̂
et ̂ ̂
̂

Choix de la constante
Les méthodes présentées pour le LES sont employées de manière identique pour le LED.

Les formules générales du LED sont donc les suivantes :

̂ ̂
̂
̂ ̂ ̂
̂
̂ ̂
̂

(̂ ̂
̂) ̅
̅

La prévision par un LED est donc une droite qui a pour ordonnée à l’origine et pour pente
les dernières valeurs trouvées de et . On peut par conséquent extrapoler cette droite à
l’horizon h ; mais il convient de limiter cet horizon de prévision car la qualité la prévision
se dégrade rapidement avec l’accroissement de h.

Construction d’un intervalle de confiance de la prévision

L’intervalle de confiance de la prévision de notée est calculée à partir de la


variance de l’erreur de prévision donnée :

( )
Avec : , pour et

Séries chronolgiques 28
[ ]

Avec

L’intervalle de confiance à de la valeur prévue de en ( ou de


à ) s’écrit donc :

( )

P( * +

Avec la valeur de loi normale centrée réduite. Pour un intervalle de confiance de 95%,
nous avons :

Cet intervalle de confiance dépend de l’horizon de prévision contrairement au LES.

Application : Prévision d’une chronique à partir d’un LED

Soit les données observées de la série consignées sur le tableau .on demande de
calculer une prévision par une méthode de lissage double (LED) à un horizon de 3
périodes. La constante de lissage est égale à

Solution
Tableau : Prévision à partir du modèle de lissage exponentiel double
t ̂ ̂
̂
1 10 10 10
2 20 10 10 10 0 10 10
3 20 15 12.50 17.50 2.5 20 0
4 30 17.50 15 20 2.5 22.5 7.5
5 40 23.75 19.38 28.12 4.37 32.49 7.51
6 40 31.88 25.63 38.13 6.25 44.38 -4.38
7 50 35.94 30.79 41.09 5.15 46.24 3.76
8 50 42.97 36.88 49.06 6.09 55.15 -5.15
9 46.49 41.69 51.29 4.8 56.09
10 60.89
11 65.69
12 70.49

̂
Séries chronolgiques 29
̂ ̂

̂
̂ ̂
̂
̂ ̂ ̂
̂

̂
̂ ̂ ̂
̂

La méthode avec tendance de Holt

Séries chronolgiques 30
La méthode que nous venons de présenter est celle de Brown. Nous pouvons aussi utiliser
le lissage de Holt qui comprend deux paramètres : un pour l’origine donnée à l’origine
et l’autre pour la pente

Deux lissages distincts sont effectués :


Le lissage de la moyenne a avec un coefficient de lissage [ ]
Le lissage de la tendance b avec un coefficient de lissage [ ]

On peut démontrer qu’il existe une correspondance entre le coefficient de lissage Brown
et les deux coefficients de Holt.

Formulation :
Lissage de la moyenne :
Lissage de la tendance :

Prévision calculée en à un horizon de prévision de périodes :

̂
: valeur observée de la série en t
: moyenne lissée de la série en t
: tendance estimée en t

Initialisation pour :
Initialisation de la moyenne lissée :
Initialisation de la tendance :

Prévision par lissage exponentiel de Holt Winters

Si la saisonnalité est de type aléatoire (ce qui est fréquent en économétrie) nous pouvons
recourir aux techniques de désaisonnalisation par filtrage (méthode Census ou
démodulation complexe) ou encore à des méthodes de lissage exponentiel.

Dans le prolongement du paragraphe précédent, nous pouvons considérer que la tendance


et la saisonnalité sont aléatoires et utiliser le lissage exponentiel pour en effectuer une
prévision combinée. Cette technique a été mise au point par Holt et Winters (1960). Il
s’agit d’un LED de Holt à deux paramètres pour la partie non saisonnière et d’un LE
saisonnier à un paramètre de Winters. Cette méthode comporte donc 3 paramètres à
estimer pour deux version : multiplicative et additive.

Le schéma multiplicatif
La chronique s’écrit dans ce cas :

Trois lissages distincts sont effectués :


Séries chronolgiques 31
Le lissage de la moyenne a avec un coefficient de lissage [ ]
Le lissage de la tendance b avec un coefficient de lissage [ ]
Le lissage de la saisonnalité S avec un coefficient de lissage , avec [ ].

Formulation

Lissage de la moyenne :

( )

Lissage de la tendance :

Lissage de la saisonnalité :
( )
Prévision à un horizon de h périodes :

̂
̂
Avec :
̂

: Valeur observée de la série en t


: Moyenne lissée de la série en t
: Tendance estimée en t
: Coefficient saisonnier en t
: Périodicité des données ( en mensuel, en trimestriel)

Dans certaines écritures du modèle les coefficients saisonniers vérifient la propriété :

Selon le principe de la conservation des aires.

Le schéma additif

La chronique s’écrit dans ce cas :

Séries chronolgiques 32
Formulation

Lissage de la moyenne :
( )
Lissage de la tendance :

Lissage de la saisonnalité :

Prévision à un horizon de h périodes :

̂
̂

Dans ce cas le principe de la conservation des aires implique :

Les paramètres et et sont optimisés comme pour les méthodes non saisonnières en
minimisant la somme des carrés des erreurs prévisionnelles entre la valeur observée de la
chronique et les valeurs prévues.

3) Initialisation du modèle de Holt-Winters

Comme pour les autres méthodes de lissage, dans la pratique, il y a un problème de


démarrage de la technique : les valeurs de départ peuvent être estimée par la méthode de
MCO ou plus simplement initialisée pour la première année : ( ) de la manière
suivante :

Initialisation de la saisonnalité :

Les coefficients saisonniers pour la première année sont estimés par la valeur observée en
divisée par la moyenne ̅ des p premières observations de la première année.

Pour
Initialisation de la moyenne lissée : ̅
Séries chronolgiques 33
Initialisation de la tendance :

La technique d’initialisation proposée par Montgormery et Johnson est préférable bien que
plus complexe : il s’agit de calculer les moyennes arithmétiques des k premières périodes :

̅ ̅
Puis :
̅ ̅


̅

Application : Prévision par le modèle de Holt-Winters

Utiliser la version additive du modèle de Holt Winters avec


pour calculer une prévision à un horizon de5 trimestres à partir des données du tableau 1.1

Dates Moyenne Ecart


type
Année 1 1248 1392 1057 3159 1714 842.69
Année 2 891 1065 1118 2934 1502 831.02
Année 3 1138 1456 1224 3090 1727 795.48
Moyenne 1092 1304 1133 3061 MoyGén Ec Type

Ecart 149 171 69 94 1647.7 829.74
type

Solution
Initialisation :

pour

Exemples de calcul pour la ligne :


( )

( )
Séries chronolgiques 34
Processus aléatoires stationnaires et Processus ARMA

Séries chronolgiques 35
Définition d’un processus stochastique

Un processus stochastique est une application X qui associe au couple la quantité


. Elle est telle que est une variable aléatoires définie sur un espace
probabilisé.
Un processus stochastique est donc une famille de va indicées par t noté ou encore
.
Dans la suite de l’exposé, l’espace des indices est le temps, est alors l’instant
d’observation de la va sur l’individu . Si T est l’ensemble des réels, le processus est dit
continu. Si , le processus est dit discret.

Pour fixé, porte le nom de réalisation de pour l’individu .

On suppose par la suite que la série temporelle notée : (soit une succession
d’observations régulièrement espacées dans le temps d’une valeur économique) est une
réalisation d’un processus stochastique discret univarié, de même nom et notée .

La chronique est dite échantillon ou réalisation du processus aléatoire et ce dernier est appelé
le processus générateur de la chronique.

Les processus stationnaires

La stationnarité forte

Le processus est dit strictement ou fortement stationnaire si :

( )
.

Un processus est dit strictement stationnaire si les trois conditions suivantes sont
satisfaites : si toutes ses caractéristiques (tous ses moments) sont invariants pour tout
changement de l’origine du temps :

i) , la variance est finie et indépendante du temps.


ii) , la moyenne est constante et indépendante du
temps.
iii) , la covariance est
indépendante du temps.

Séries chronolgiques 36
et corrélées.

La stationnarité faible
Le processus est dit faiblement stationnaire si seuls les moments d’ordre 1 et 2
sont stationnaires.

Le processus Bruit Blanc


Soit le processus Si pour tout n-uple du temps , les va réelles
suivantes, ,……, (différences premières) sont indépendantes, il s’agit
d’un processus à accroissements indépendants.

Le processus est dit à accroissements indépendants si de plus la loi de


probabilité ne dépend pas de t.

Un bruit blanc est un processus stochastique à accroissements non corrélés. Il est dit bruit
blanc fort si les accroissements sont indépendants. Il s’agit donc d’une suite de va réelles
homoscédastiques et indépendantes. On l’appelle aussi processus formé de va
indépendantes et identiquement distribuées.
Si la loi de probabilité de est normale alors le Bruit Blanc est dit bruit blanc gaussien
IID.

Un bruit blanc est dont tel que :

[ ]

Si : le bruit blanc est centré.

La classe des processus aléatoires ARMA linéaires et stationnaires

Il est possible de définir la classe des processus ARMA à partir d’un théorème de
décomposition des processus de Wold.

Le théorème de décomposition de Wold

Soit le processus centré réel ou complexe stationnaire et de variance finie. Il existe trois
processus qui vérifient les propriétés suivantes :

Où et sont deux processus indépendants. Le processus est dit processus singulier


(ou déterminable). Il s’agit d’une composante dont chaque valeur peut se calculer à partir
d’une combinaison linéaire finie ou infinie de ses valeurs passées. C’est donc un
processus dont nous pouvons déterminer la prévision. Par opposition au processus
précédent, porte le nom de processus indéterminable.
Séries chronolgiques 37
est un bruit balnc centré :

avec , et

un processus centré stationnaire d’ordre 2 peut s’écrire selon l’expression précédente.


Il peut être réecrit en utilisant l’opérateur de retard B tel que :

où est un processus quelconque.

: Le polynôme d’opérateur et on peut lui appliquer la plupart des théorèmes


courants de mathématiques.

Propriétés de l’opérateur retard

: L’opérateur d’une constante a est une constante.

( )

Si | | la somme infinie
Démonstration : multiplions de chaque côté la relation précédente par

Comme | | , converge vers 0 lorsque n tend vers l’infini. Ainsi, les deux
membres de la relation sont égaux.

Définition des processus ARMA


Les processus MA et AR

Séries chronolgiques 38
Le processus stationnaire défini par les formules ∑ ou est
appelé processus Moyenne mobile infini. Il est noté .
Considérons le processus simple suivant pour lequel est un polynôme de degré 1.

Posons :

Le polynôme est inversible ssi| | . Dans le cas où | | , on peut


écrire :

Nous pouvons calculer :

Cette formule est équivalente à la formule 1 pour l’écriture du processus . Pour que
soit un processus stationnaire il faut donc que ∑ soit convergente.

Il s’agit d’une progression géométrique de raison et sa convergence est assurée lorsque


| | , ou encore lorsque | | .

Considérons la formule :

Sous sa forme développée :

Et posons : , alors :

On appelle processus autorégressif noté AR l’écriture 4

Du processus et lorsque le polynôme d’opérateur particulier ) comporte une infinité de


termes, il est dit processus
Enfin, observons que la formule 4 de découle de l’écriture

Or cette écriture est celle d’une MA (1) puisque le polynôme d’opérateur a pour degré 1.

Séries chronolgiques 39
Les processus ARMA non saisonniers
Les processus ARMA mélanges de AR et MA sont nécessairement finis. Ils sont issus de
deux processus :

Le processus défini à partir de la formule :


( )

élément du polynôme d’opérateur , joue le rôle de dans le formule1.

Le processus défini par la formule 4 :

Il s’écrit aussi :( )

Élément du polynôme d’opérateur fini jour le rôle de dans la formule 4.

Le processus s’écrit alors :

Dans cette écriture le processus est centré : .Plus généralement on peut


considérer des processus avec constante :

On remarque que :

A partir de la formule :

A condition que existe. Ce qui montre qu’il est possible avec des degrés peu
élevés de p et q de définir un nombre assez important de modèles.

Exemples d’écritures :

Séries chronolgiques 40
La stationnarité et l’invisibilité des processus
Conditions de stationnarité et d’inversibilité

Considérons le précédent de la formule :

Nous avons vu qu’il peut s’écrire selon la forme d’un sous la condition que | | ,
condition qui permet d’inverser le polynôme
Dans ce cas, la racine en B du polynôme est et comme | |
alors| | . Cette condition est appelée condition d’inversibilité du processus. Ce résultat
peut être généralisé pour le polynôme des processus MA et pour le polynôme des
processus AR.

Le théorème suivant peut être énoncé :


Un processus AR est toujours inversible. Il est stationnaire lorsque les racines de
sont à l’extérieur du cercle unité du plan complexe.

Séries chronolgiques 41
Les processus aléatoires non stationnaires

Les chroniques économiques sont rarement des réalisations de processus de processus


aléatoires stationnaires.La non stationnarité des processus peut concerner aussi bien le
moment du premier ordre (espérance) que celui du second ordre (variance et covariance du
processus). Dans la procédure de Box et Jenkins, la non stationnarité est repérée
graphiquement (tendance, cycle long saisonnalité explosive, modification de structure) ou
encore au moyen de la fonction d’autocorrélation (lentement décroissante).

Les cas de non stationnarité les plus fréquents sont analysés à partir de deux types de
processus :

Les processus TS (trend Stationnary) qui représentent une non stationnarité de type
détérministe.
Les processus DS (Differencystationnary) pour les processus non stationnaires aléatoires. Ils
constituent pour des chroniques saisonnières ou non, les modèles de référence pour la
construction des tests de racine unitaire en l’absence d’hétéroscédasticité.

Description des processus TS et DS

Nous n’envisageons dans cette section que le cas des processus non saisonniers.

Le processus TS
Un processus TS s’écrit :

Où est une fonction polynomiale du temps, linéaire ou non linéaire et un processus


stationnaire de type ARMA.

Le processus TS le plus simple est représenté par une fonction polynomiale de degré 1. Ce
processus s’écrit :

Si est un bruit blanc (gaussien ou non), les caractéristiques de ce processus sont alors :

Ce processus TS est non stationnaire, car dépend du temps. comme cette espérance est
égale à , il s’agit à l’instant t d’un chiffre certain. Dans ce cas nous pouvons estimer
de façon efficace les paramètres et de la tendance, en utilisant la méthode des MCO.

Séries chronolgiques 42
Les processus DS
Les processus DS sont des processus que l’on peut rendre stationnaire par l’utilisation d’un
filtre aux différences : où est un processus stationnaire de type
ARMA ou encore un bruit blanc, une constante réelle et l’ordre du filtre aux différences.
Ces processus sont souvent représentés en utilisant le filtre aux différences Le
processus est dit alors processus du premier ordre. Il s’écrit :

Où est un processus stationnaire de type bruit blanc (gaussien ou non).


L’introduction de la constante dans le processus DS permet de définir deux processus
différents :

Les tests de stationnarité

Les tests de Dickey Filler (DF) permettent de mettre en évidence le caractère stationnaire ou
non d’une chronique par la détermination d’une tendance déterministe ou stochastique.
Les modèles servant de base à la construction de ces tests sont au nombre de 3 et s’appuient
sur un modèle AR(1). Le modèle AR(1) est un modèle autorégressif d’ordre 1. En général dans
un modèle AR(P), l’observation présente est générée par une moyenne pondérée des
observations passées jusqu’à la p-ième période. Il peut être présenté sous 3 formes :

: C’est un AR(1) avec un bruit blanc gaussien et paramètre à estimer


: C’est un AR(1) avec constante
: C’est AR(1) avec tendance (t étant le temps, b une constante)

Le principe du test est le suivant : si l’hypothèse : le processus est retenue dans


l’un des trois modèles, le processus est alors non stationnaire.

Le premier modèle :

(1.3)

Il peut s’écrire aussi sous la forme :

(1.4)

Séries chronolgiques 43
Nous obtenons la forme suivante :

(1.5)

Il est donc équivalent de tester comme hypothèse :

ou .

Nous estimons par la méthode des moindres carrés ordinaires le paramètre noté ̂ pour les
trois modèles. L’estimation des coefficients et des écarts types du modèle par les moindres
carrés ordinaires fournit qui est analogue à la statistique de Student (rapport du coefficient

sur son écart type). Si ̂ alors on accepte l’hypothèse ; il existe une racine
unitaire, le processus n’est donc pas stationnaire. A noter que le logiciel Eviews calcule
automatiquement les valeurs critiques ̂.

Cependant, dans les 3 modèles précédents, est par hypothèse un bruit blanc, donc non
corrélé. C’est une hypothèse restrictive. Pour y remédier, nous faisons appel aux tests de
Dickey- Filler Augmentés (ADF, 1981).

Sous l’hypothèse alternative,| | les tests ADF sont fondés sur l’estimation par les
moindres carrés ordinaires des trois modèles :

∑ (1.6)

(1.7)

∑ (1.8)

Avec (Independantes et identiquement distribuées) et coefficient de corrélation.

Le test se déroule de manière similaire au test DF, seules les tables statistiques sont
différentes. La valeur peut être déterminée selon les critères d’Akaike ou de Shwartz.
Cependant, compte tenu des limites du test ADF, un autre test de Philips et Perron (1988) a
été établi suite à une correction non paramétrique des statistiques de Dickey-Filler pour
prendre en compte des erreurs hétéroscédastique. Il se déroule en 4 étapes :

Séries chronolgiques 44
 Estimation par les moindres carrés ordinaires des trois modèles de base des tests de
Dickey-Filler et calcul des statistiques associés, soit le résidu estimé.

 Estimation de la variance dite de court terme ∑ (1.9)

 Estimation d’un facteur correctif (variance de long terme) établi à partir de la


structure des covariances des résidus des modèles précédemment estimés de telle sorte
que les transformations réalisées conduisent à des distributions identiques à celles du
Dickey-Filler standard :
∑ ∑ ∑ (1.10)

Pour estimer cette variance de long terme, il est nécessaire de définir un nombre de retards l
(troncature de Newey-West) estimé en fonction du nombre d’observations n, l

 Calcul de la statistique de PP :
̂ ̂
̂ √ (1.11)
̂ √

Avec :
̂ (1.12)
Cette statistique est à comparer aux valeurs critiques de la table de MacKinnon.
Les deux tests DF et ADF visent à tester la validité de l’hypothèse nulle de racine unitaire
contre l’hypothèse alternative d’absence de racine unitaire, tandis que la procédure du test
KPSS impose la stationnarité sous l’hypothèse nulle.

Kwiatkowski et al. (1991) propose d’utiliser un test du multiplicateur de Lagrange (LM) fondé
sur l’hypothèse nulle de stationnarité. Après estimation des modèles 2 et 3, nous calculons la
somme partielle des résidus:
∑ (1.13)

Nous estimons ensuite la variance du long terme .

La statistique est alors :


(1.14)

Séries chronolgiques 45
Nous rejetons l’hypothèse de stationnarité si cette statistique est supérieure aux valeurs
critiques lues dans une table élaborée par les auteurs. Le logiciel Eviews permet directement
l’utilisation de ces tests.

La méthode de Box et Jenkins

Stationnarité
Avant le traitement d’une série chronologique, il convient d’en étudier les caractéristiques
stochastiques. Si ces caractéristiques (son épsrénce et sa variance) se trouvent modifiées dans
le temps, la série chronologique est considérée comme non stationnaire, dans le cas d’un
processus stochastique invariant, la série temporelle est alors stationnaire. Cela implique que
la série ne comporte ni tendance ni saisonnalité, et plus généralement aucun facteur
n’évoluant avec le temps.

Fonction d’autocorrélation simple et partielle :


La fonction d’autocorrélation (FAC) est la fonction notée qui mesure la corrélation de la
série avec elle-même décalée de k périodes :

La fonction d’autocorrélation partielle est le calcul de l’influence de sur en éliminant les


influences des autres variables :

Test de bruit blanc et de stationnarité


Nous ne pouvons identifier clairement les caractéristiques stochastiques d’une série
chronologique que si elle est stationnaire. Cette étude de stationnarité s’effectue
essentiellement à partir de l’étude de leur représentation graphique appelée corrélogramme.
Une série chronologique est stationnaire si elle ne comporte ni tendance ni saisonnalité. Nous
allons à partir donc de l’étude du corrélogramme d’une série essayer de montrer de quelle
manière nous pouvons mettre en évidence ces deux composantes.
1) analyse des fonctions d’autocorrélation
Lorsque nous étudions la fonction d’autocorrélation d’une série chronologique, la question
qui se pose est de savoirs quels sont les termes qui sont significativementdifférents de 0.
En effet, par exemple, si aucun terme n’est significativement différent de 0, on peut conclure
que le processus étudié est sans mémoire, et donc qu’à ce titre, il n’est affecté ni de tendance
ni de saisonnalité. Ou encore si une série mensuelle présente une valeur élevée pour
(corrélation entre ), la série étudiée est certainement affectée d’un mouvement
saisonnier.

Le test d’hypothèse pour un terme est le suivant :

Séries chronolgiques 46
Nous pouvons utiliser le test d’hypothèses d’un coefficient de corrélation fondé sur la
comparaison d’un t student empirique et théorique. Toutefois, Quenouille a démontré que
pour un échantillon de taille importante , le coefficient tend de manière asymptotique
vers une loi normale de moyenne 0 et d’écart type .

L’intervalle de confiance du coefficient est alors donné par :

Si le coefficient ̂ est à l’extérieur de cet intervalle de confiance, il est significativement


différent de 0 au seuil ( en général et ).

2) statistiques de Box Pierce et Ljung Box (Test Portmanteau)


Le test de Box Pierce permet d’identifier les processus sans mémoire (suite de Va
indépendantes entre elles). Nous devons identifier donc ou .

Statistiquement, l’absence d’autocorrélation est testée à l’aide de la statistique Ljung-Box. En


effet, la statistique Q(h) de Ljung-Box (1978) permet de tester l'hypothèse d'indépendance
sérielle d'une série (ou si la série est un bruit blanc). Plus spécifiquement, cette statistique
teste l'hypothèse que les h coefficients d'autocorrélation sont nuls. Elle est basée sur la somme
des autocorrélations de la série et elle est distribuée selon une loi Chi-carrée avec h degrés de
liberté.

L'hypothèse nulle est:

: Les variables sont indépendantes et identiquement distribuées.

Contre l’hypothèse alternative :

: Les variables ne sont pas indépendantes.

Avec :

: Taille de l’échantillon

: Autocorrélation à l’ordre

Séries chronolgiques 47
: Nombre de retards à tester

Sous l’hypothèse , la statistique du test suite une loi . Pour un niveau de signification
si , nous rejetons l’hypothèse et concluons que les variables ne sont pas
indépendantes et les autocorrélations ne sont pas nulles.

3) tests de Normalité : Skewnes et Kurtosis


Le coefficient d’aplatissement ou le Kurtosis d’une variable aléatoire correspond à son
moment centré d’ordre 4. Le Kurtosis est une mesure de l’épaisseur des queues de
distributions. Cette mesure est fondée relativement à la distribution normale, considérée
comme une distribution à queue plate et qui possède un coefficient d’aplatissement égal à 3.
Si le Kurtosis excède 3, alors les queues de distribution sont épaisses et la distribution est dite
leptokurtique. Si le Kurtosis est inférieur à 3, la distribution est dite platikurtique.
La formule de Kurtosis s’écrit de la façon suivante:

[ ]
[ ]

Pour le cas de de la série des rendements de l’indice S&P 500, nous obtenons :

Par conséquent la distribution de l’indice S$P 500 est leptokurtique.

Concernant l’asymétrie, la distribution de l’évolution des cours est généralement asymétrique.


Il y a plus de mouvements forts à la baisse qu’à la hausse des cours. Autrement dit, les
rendements tendent à baisser plus qu’à monter. Cela s’explique par la récurrence des chocs.
Cette propriété met en exergue le phénomène d’asymétrie des séries financières. Nous
pouvons mesurer le degré d’asymétrie des rendements de notre série S$P 500 à l’aide du
coefficient Skewness. Rappelons qu’un test simple de l’hypothèse de symétrie consiste à
tester la nullité du moment centré d’ordre trois de la distribution. Le coefficient de Skewness
défini comme :

[ ]
[ ]

Pour un coefficient de Skewness significativement négatif, la distribution est asymétrique.


Cela veut dire que la probabilité d’obtenir des valeurs inférieures à la moyenne étant
supérieure à celle d’obtenir des valeurs plus fortes que la moyenne. Ceci est vérifié
empiriquement dans notre cas. En effet, en appliquant la formule sur notre série, nous
obtenons :
.

Séries chronolgiques 48
Nous concluons que la série des rendements de l’indice est asymétrique. En conclusion, nous
pouvons avancer que les rendements journaliers sont fortement non gaussiens avec l’excès
d’un Kurtosis et l’existence d’une asymétrie. Combinée avec la propriété sur les queues de
distributions, le test de Jarque-Bera conduit également à rejeter l’hypothèse d’une distribution
normale des rendements. Nous rappelons que ce test qui admet pour hypothèse nulle la
normalité de la distribution est construit de la façon suivante :

Avec :

: Les données suivent une loi normale.


: Les données ne suivent pas une loi normale.

La probabilité nulle de la statistique de Jarque-Bera nous pousse à rejeter l’hypothèse de la


normalité de la distribution (ProbJarqueBera<0.05).

Une autre méthode pour évaluer l’adéquation ou non des rendements avec une distribution
gaussienne est d’analyser les quantiles, en traçant les quantiles empiriques contre les quantiles
d’une loi normale (QQ-Plot).

Les modèles ARIMA


Nous allons présenter une famille de processus aléatoires qui sont censés recouvrir une
gamme très large d’évolution possible de séries chronologiques : les processus autorégressifs
et les processus de moyenne mobile.

Dans le processus autorégressifs d’ordre p, l’observation présente est générée par une
moyenne pondérée des observations passées jusqu’à la pème période sous la forme suivante :

Séries chronolgiques 49
….

Où : sont des paramètres à estimer positifs ou négatifs,


est un aléa gaussien.

Nous pouvons ajouter à ce processus une constante qui ne modifie en rien les propriétés
stochastiques. L’équation précédente peut aussi s’écrire à l’aide de l’opérateur décalage D :
( )

Caractéristiques des corrélogrammes


Il est démontré que le corrélogramme simple d’un processus est caractérisé par une
décroissance géométrique de ses termes de type :

Le corrélogramme partiel a ses seuls p premiers termes différents de 0

Dans le processus de moyenne mobile d’ordre q, chaque observation est générée par une
moyenne pondérée d’aléas jusqu’à la qème période.

….

Où : sont des paramètres à estimer positifs ou négatifs,


est un aléa gaussien.

Nous pouvons ajouter à ce processus une constante qui ne modifie en rien les propriétés
stochastiques. L’équation précédente peut aussi s’écrire à l’aide de l’opérateur décalage D :
( )
Dans ce processus, tout comme dans le modèle Autorégressif ( ), les aléas sont supposés
être engendrés par un processus de type bruit blanc. Nous pouvons interpréter le modèle MA
comme étant représentatif d’une série chronologique fluctuant autour de sa moyenne de
manière aléatoire, d’où le terme moyenne mobile car celle-ci, en lissant la série, gomme le
bruit créé par l’aléa.

On note que :

Caractéristiques des corrélogrammes

Séries chronolgiques 50
Le corrélogramme simple d’un processus est de la forme générale :


C’est-à-dire que seuls les q premiers termes du corrélogramme simple sont significativement
différents de 0.
Le corrélogramme partiel est caractérisé par une décroissance géométrique des retards.

Modèle ARMA

Les modèles ARMA sont représentatifs d’un processus généré par une combinaison des
valeurs passées et des erreurs passées. Ils sont définis par l’équation :

( ) ( )

Dans le cas d’un processus avec constante :

L’espérance du processus est :

Conditions d’utilisations
Les modèles AR, MA, ARMA ne sont représentatifs que de chroniques :
 Stationnaire en tendance
 Corrigées des variations saisonnières

L’extension aux processus ARIMA et SARIMA

Les tests de DF et DFA envisagés précédemment permettent de déterminer si la série est


stationnaire et dans le cas d’une non stationnarité de quel type il s’agit : TS et DS.

Si la série étudiée est de type TS, il convient de la stationnariser par regréssion sur le temps et
le résidu d’estimation est alors étudié selon la méthodologie de Box Jenkins. Ceci permet de
déterminer les ordres p et q.
Si la série est étudiée est de type DS, il convient de la stationnariser par passage aux
différences selon l’ordre d’intégration (c’est-à-dire le nombre de fois qu’il faut
différencier la série pour la rendre stationnaire). La série différenciée est alors étudiée selon la
méthodologie de Box Jenkins qui permet de déterminer les ordres p et q. on note ce type de
modèle

Séries chronolgiques 51
Le modèle SARIMA permet d’intégrer un ordre de différenciation lié à une saisonnalité
généralisée par la transformation :
Où s correspond à la périodicité des données ( 4 pour une série trimestrielle et 12 pour une
série mensuelle).

La méthode de Box et Jenkins

La partie autorégressive d’un processus, notée AR, est constituée par une combinaison
linéaire finie des valeurs passées du processus. La partie moyenne, notée MA, est constituée
d’une combinaison linéaire finie en t des valeurs passées d’un bruit blanc. Wold (1954)
montre que les modèles ARMA permettent de représenter la plupart des processus
stationnaires. L’approche de Box et Jenkins consiste en une méthodologie d’étude
systématique des séries chronologiques à partir de leurs caractéristiques afin de déterminer le
modèle le plus adapté à représenter le phénomène étudié.

Désaisonnalisation :
Dans le cas d’une série affectée par un mouvement saisonnier, il convient de la retirer
préalablement à tout traitement statistique.

Recherche de la stationnarité en terme de tendance

Si l’étude du corrélogramme simple et les tests s’y rapportant (statistique Q Ljung Box)
présagent d’une série affectée d’une tendance, il convient d’en étudier les caractéristiques
selon les tests de DF. La méthode d’élimination de la tendance est fonction du processus DS
ou TS sous-jacent à la chronique étudiée.

Après stationnarisation, nous pouvons identfier les valeurs des paramètres pet q du modèle
ARMA :
Si le corrélogramme simple n’a que ses q premiers termes (q=3 maximum) différents de 0 et
que les termes du corrélogramme partiel diminuent lentement, nous pouvons pronostiquer un
MA(q).

Si le corrélogramme partiel n’a que ses p premiers termes (p=3 maximum) différents de 0 et
que les termes du corrélogramme simple diminuent lentement, nous pouvons pronostiquer un
AR(p).
Si les fonctions d’autocorrélation simple et partiel ne paraissent pas tronquées, il s’agit alors
d’un ARMA.

Estimation des paramètres

L’approche de Box-Jenkins est une méthode en quatre étapes qui a pour but d’effectuer
les meilleures prévisions possibles d’une série temporelle.

1.Identification du modèle ARIMA(p, d, q) :


2. Estimation des paramètres du modèle choisi à la première étape.
3. Vérifier si le modèle choisi à la première étape est adéquat.
4. Prévisions des réalisations futures.

Séries chronolgiques 52

Vous aimerez peut-être aussi