Cours Prévision
Cours Prévision
Cours de Séries
Chronologiques
1
CHAPITRE 1 : DESCRIPTION DES SERIES CHRONOLOGIQUES
Le but est ici de déterminer les différentes composantes d’une série ( ), en particulier,
obtenir la série corrigée des variations saisonnières (méthodes de désaisonnalisation). Pour les
séries stationnaires, on peut aussi chercher à modéliser la série à l’aide d’un modèle ARMA,
par exemple dans le but de faire de la prévision.
Les premières études sur les chroniques ont amené à considérer de façon standard quatre
grandes composantes :
La composante cyclique notée (une période de 4 à 5 ans). Dans la plupart des travaux sur
les séries temporelles, la tendance et le cycle sont regroupés en une seule composante appelée
l’extra-saisonnier
Séries chronolgiques 2
La composante résiduelle notée : elle rassemble tout ce que les autres composantes n’ont
pu expliquer du phénomène observé. Elle contient donc de nombreuses fluctuations en
particulier accidentelles, dont le caractère est exceptionnel et imprévisible (catastrophes
naturelles, grèves, guerres,..). Le résidu en général présente une allure aléatoire plus ou moins
stable autour de la moyenne.
I) La détection de la saisonnalité
L’analyse graphique d’une chronique suffit parfois pour mettre en évidence une saisonnalité.
Néanmoins, si cet examen n’est pas révélateur ou en cas de doute, le tableau de Buys-Ballot
permet d’analyser plus finement l’historique. La figure 1.1 des ventes trimestrielles d’un
produit festif indique une saisonnalité marquée au 4ème trimestre, ce que nous pouvons
confirmer à l’aide du tableau de Buys-Ballot.
C’est un tableau à deux entrées dans lequel sont consignées les valeurs . Il est constitué en
ligne par les années et en colonne par le facteur à analyser (mois, trimestre..). Les moyennes
et les écarts type des années et des trimestres (ou des mois selon le cas) sont calculés ainsi que
pour l’ensemble des observations de la chronique.
Nous pouvons alors classer les trimestres pour chaque année par valeurs décroissantes.
Années
Année 1 T4 T2 T1 T3
Séries chronolgiques 3
Année 2 T4 T3 T2 T1
Année 3 T4 T2 T3 T1
Deux effets absents sont testés contre deux effets significativement présents :
La chronique de départ n’a pas été transformé, elle possède alors des paliers horizontaux.
∑∑
Séries chronolgiques 4
Avec
∑∑
∑ : Moyenne de l’année i
∑ : Moyenne de la période j
Comme : avec et
Nous obtenons :
∑ ∑( ) ∑ ∑[( ) ( ) ( )]
∑∑
∑ ∑( )
∑ ∑( )
∑ ∑( ) ∑ ∑( )
Séries chronolgiques 5
Nous utilisons ces résultats pour effectuer l’analyse de la variance de la série.
Tableau 1.4 : Analyse de la variance pour détecter une saisonnalité et / ou une tendance
∑( ) Variance
Période
Variance
∑ année
Variance
∑ ∑( ) résidu
Variance
totale
a) test de saisonnalité :
Séries chronolgiques 6
La série est donc saisonnière.
b) Test de tendance
C- La fonction d’autocorrélation
Lorsque deux phénomènes ont une évolution commune, nous disons qu’ils sont corrélés. La
corrélation simple mesure le degré de liaison existant entre ces deux phénomènes représentés
par des variables. Si nous cherchons une relation entre tris variables ou plus, nous ferons
appel alors à la notion de corrélation multiple.
Nous pouvons distinguer la corrélation linéaire, lorsque tous les points du couple de valeurs
des deux variables semblent alignés sur une droite, de la corrélation non linéaire lorsque
le couple de valeurs se trouve sur une même courbe d’allure quelconque.
∑ ̅̅̅ ̅̅̅
√∑ ̅̅̅ √∑ ̅̅̅
∑ ̅̅̅̅̅̅
̅̅̅
√ ∑ ̅̅̅ ∑ ̅̅̅
Séries chronolgiques 7
Avec
̅̅̅ ∑
Et
̅̅̅ ∑
| |
Sous cette hypothèse, la quantité √ obéit à une loi de student à n-2 degrésde
√
liberté (ou à une loi normale centrée réduite si n>30). Si , l’hypothèse est rejetée.
A partir des données relatives aux ventes du tableau 1.1, on demande de calculer la FAC et de
tester la significativité des coefficients d’autocorrélation par rapport à 0.
Solution
Nous allons détailler sur le tableau 1.6 les calculs pour un coefficient , c’est-à-dire la
corrélation entre et .
1
1057 1248
2
3159 1392
3
891 1057
4
1065 3159
Séries chronolgiques 8
5
1118 891
6
2934 1065
7
1138 1118
8
1456 2934
9
1224 1138
10 3090
1456
Somme 17132 15458
∑ ̅̅̅ ̅̅̅
√∑ ̅̅̅ √∑ ̅̅̅ √ √
| |
Le t empirique est égal pour et : √
√
Le tableau 1.7 indique l’ensemble des valeurs de la fonction d’autocorrélation que l’on
compare à la valeur lue dans la table de student pour un seuil de 5% à n-2 degrés de liberté.
Seul le coefficient d’autocorrélation d’ordre 4 est significativement différent de 0 ; la
périodicité des données étant trimestrielle, ce pic est attribué à la saisonnalité des données.
0 1 12
Séries chronolgiques 9
Séries chronolgiques 10
I- Modélisation d’une chronique à tendance linéaire.
Exemple : Les données sont obtenues à partir des données trimestrielles pendant 3 années
consécutives. On considère la série suivante :
t x t
On peur représenter ces données à l’aide d’un tableau à
1 24
double entrée de la manière suivante :
2 25
3 29
4 24 J 1 2 3 4
5 24 I
6 27 1 24 25 29 24
7 30 2 24 27 30 26
8 26 3 27 29 32 29
9 27
10 29 J correspond au rang du trimestre.
11 32 I correspond au rang de l’année.
12 29
1) Choix du modèle :
Séries chronolgiques 11
On utilise la méthode graphique :
- Si les variations saisonnières se retrouvent d’année en année avec une amplitude
constante, alors on retient le modèle additif.
- Si les variations saisonnières sont proportionnelles au niveau atteint par la série,
alors on opte pour le modèle multiplicatif.
Trimestre Trimestre
3ème année
2ème année
1ère année
Application :
Séries chronolgiques 12
graphe de la série brute
35
30
25
20
x(t)
15
10
5
0
1 2 3 4 5 6 7 8 9 10 11 12
34
32
30
28 année 1
x(t)
année 2
26
année 3
24
22
20
1 2 3 4
J
On retient le modèle multiplicatif car les courbes annuelles superposées ne sont pas parallèles.
Illustration numérique :
t 1 2 3 4 5 6
x t 84 123 165 108 103 137
1
Calculons : M 3 t x t 1 x t x t 1 .
3
Pour t 1 , on a : M 3 1 est non-définie car x 0 est non disponible.
1 84 123 163
Pour t 2 , on a : M 3 2 x 1 x 2 x 3 124 .
3 3
1
Pour t 3 , on a : M 3 3 x 2 x 3 x 4 132 .
3
Pour t 4 , on a : M 3 4 125.3 .
Pour t 5 , on a : M 3 5 116 .
Pour t 6 , on a : M 3 6 est non-définie car x 7 est non disponible.
On a alors :
t 1 2 3 4 5 6
x t 84 123 165 108 103 137
M 3 t --- 124 132 125.3 116 ---
M 4 t --- --- 122.38 126.5 --- ---
Car : Pour t 1 , on a : M 4 1 est non-définie car x 1 est non disponible.
Pour t 2 , on a : M 4 2 est non-définie car x 0 est non disponible.
1 x 1 x 5
Pour t 3 , on a : M 4 3 x 2 x 3 x 4 122.38 .
4 2 2
1 x 2 x 6
Pour t 4 , on a : M 4 4 x 3 x 4 x 5 126.5 .
4 2 2
Séries chronolgiques 14
b) Une moyenne mobile de longueur d’ordre p arrête une fonction périodique de
période p .
c) Une moyenne mobile transforme une fonction affine de la forme y a t b en elle
même.
d) Une moyenne mobile transforme la série des aléas e t en une série t moins
dispersée ou plus lisse.
1 x t 2 x t 2
Série brute : x t Série : M 4 3 .....
4 2 2
J 1 2 3 4 J 1 2 3 4
I I
1 24 25 29 24 1 --- --- 25.5 25.75
2 24 27 30 26 2 26.125 26.5 27.125 27.75
3 27 29 32 29 3 28.75 28.875 --- ---
33
31
29
27
25 série brute
x(t)
23 série M4(t)
21
19
17
15
1 2 3 4 5 6 7 8 9 10 11 12
Séries chronolgiques 15
Sur tout intervalle de longueur p , la somme des aires au-dessus de la tendance est égale à la
somme des aires en dessous => Hypothèse de conservation des aires (HCA).
On a alors :
J 1 2 3 4
I
1 --- --- 3.5 -1.75
2 -2.125 0.5 2.875 -1.75
3 -1.25 0.125 --- ---
sJ -1.6875 0.3125 3.1875 -1.75
s J -1.7 0.3 3.2 -1.8
Séries chronolgiques 16
3.2) Le modèle multiplicatif : x t y t 1 s t e t .
x t
d) On calcule les écarts saisonniers : 1 s t .
M p t
e) Estimation préliminaire des coefficients saisonniers 1 s J en imposant à 1 s t
de vérifier la périodicité, soit par la médiane, soit par la moyenne, en ne retenant
qu’une seule valeur.
f) Estimation définitive des coefficients saisonniers 1 s J en imposant à 1 s t de
p
vérifier la loi des aires, c’est-à-dire 1 s t 0 , pour une intervalle de longueur
j 1
1 s t
p , en remplaçant 1 s J par 1 s J s J .
p
1 s t
j 1 p
1 s 1 1 0.94
Par exemple : 1 s 1 4 4 094 .
4.01 4.01
J 1 2 3 4
I
1 --- --- 1.14 0.93
2 0.93 1.02 1.11 0.94
3 0.96 1 --- ---
sJ 0.94 1.01 1.125 0.935
s J 0.94 1 1.12 0.94
Définition : On appelle série corrigée des variations saisonniers (série CSV) la série z t
obtenue de la manière suivante : z t x t s t , pour un modèle additif.
x t
z t , pour un modèle multiplicatif.
1 s t
z t représente l’estimation définitive de la tendance.
Application numérique :
Séries chronolgiques 17
Modèle additif :Modèle multiplicatif :
t x t s t z t
t x t 1 s t z t
1 24 -1.7 25.7 1 24 0.94 25.5
2 25 0.3 24.7 2 25 1 25
3 29 3.2 25.8 3 29 1.12 25.9
4 24 -1.8 25.8 4 24 0.93 25.8
5 24 -1.7 25.7 5 24 0.94 25.5
6 27 0.3 26.7 6 27 1 27
7 30 3.2 26.8 7 30 1.12 26.8
8 26 -1.8 27.8 8 26 0.93 28
9 27 -1.7 28.8 9 27 0.94 28.7
10 29 0.3 28.7 10 29 1 29
11 32 3.2 28.8 11 32 1.12 28.6
12 29 -1.8 30.8 12 29 0.93 31.2
Représentation Graphique :
34
32
30 serie brute
28
modele
x(t) , z(t) adittif
26
modele
24 multiplicatif
22
20
1 2 3 4 5 6 7 8 9 10 11 12
t
2) Prévisions :
Effectuer une prévision consiste à estimer à partir des valeurs x T h avec h 1, 2,... .
1ère étape : La tendance décrite par z t étant linéaire, on peut donc remplacer z t par une
fonction ẑ t a t b qui est l’équation de la droite d’ajustement Dz .
t
2ème
étape : xˆ T h zˆ T h s T h si le modèle est additif.
Séries chronolgiques 18
ou xˆ T h zˆ T h 1 s T h si le modèle est multiplicatif.
Détermination de a et de b :
cov z t , t
a et b z a t ( z et t étant les moyennes respectives de z t et de t )
V (t )
Déterminons les prévisions du 1er trimestre et du 2ème trimestre de la 4ème année, c’est-à-dire
cov z t , t
xˆ 13 et xˆ 14 . On détermine ẑ t a t b , avec a et b z a t .
V (t )
12
z t
cov z t , t t 1
z t
12
12
z t 25.5 25 ....... 31.2 27.18
Or on a : z
t 112 12
12
t 1 2 ...... 12 12 12 1
Et : t 6.5
t 1 12 12 2 12
12
z t t 374.19
Puis enfin : 182.4 .
t 1 12 12
Nous avons donc : cov z t , t 182.4 27.18 6.5 5.76
12
t2
De plus : V (t )= t 13 .
2
t 1 12
5.76
Nous pouvons alors trouver a et b : a 0.48 et b 27.18 0.48 6.5 24.04 .
13
Nous avons alors l’équation de la droite d’ajustement Dz : zˆ t 0.48t 24.04 .
t
xˆ 13 zˆ 13 1 s 13 zˆ 13 0.94 28.5
Séries chronolgiques 19
Où :
: Consommation incompressible
Le modèle tel qu’il vient d’être spécifié n’est qu’une caricature de la réalité. En effet, ne
retenir que le revenu pour expliquer la consommation est insuffisant, il existe une multitude
d’autres facteurs susceptibles d’expliquer la consommation. C’est pourquoi nous ajoutons un
terme qui synthétise l’ensemble de ces informations non explicitées dans le modèle
Hypothèses :
Séries chronolgiques 20
Formulation des estimateurs
∑ ∑
∑ ̂ ̂
∑ ̂ ̂
∑ ̂ ∑ ̂ ∑
∑ ̂ ̂ ∑
∑ ̅̅ ∑ ̅ ̅
̂
∑ ̅ ∑ ̅
̂ ̅ ̂ ̅
Séries chronolgiques 21
Prévision d’une série chronologique
Ces instruments peuvent être nécessaires, mais ils sont insuffisants. En effet, la forme d’une
forme d’autocorrélation n’est pas toujours révélatrice d’une tendance qui néanmoins peut
exister.
Si une tendance existe suite aux tests effectués sur la série brute, l’utilisation correcte des
techniques suppose que l’on puisse discriminer la tendance déterministe de la tendance
aléatoire. La tendance déterministe est celle qui se présente sous forme analytique rigide pour
l’ensemble des observations. Elle peut être linéaire ou non.
Si la tendance est linéaire, le modèle s’écrit :
La techniques des MCO fournit les estimateurs de a et b. cette méthode postule des
paramètres a et b constants dans le temps, et la prévision porte plutôt le nom d’extrapolation
de la chronique.
La tendance non linéaire est non transformables ; on recourt à des algorithmes d’optimisation
non linéaire afin d’estimer ses paramètres.
B. Le lissage exponentiel
La technique du lissage exponentiel est utilisée dans le cas d’une chronique affectée d’une
tendance aléatoire. Le lissage regroupe l’ensemble des techniques empiriques qui ont pour
caractéristiques communes d’accorder un poids plus important aux valeurs récentes de la
chronique. Ces méthodes portent aussi le nom du filtrage, car il s’agit d’une opération
mathématique transformant un entrant en une nouvelle chronique sortante .
Séries chronolgiques 22
Les méthodes de lissage exponentiel non saisonnier supposent que la chronique de départ est
structurée de la façon suivante :
Où :
[ ] [ ] [ ]
les méthodes de lissages se différencient entre elles selon le degré de ; les degrés les plus
utilisés sont .
Si , la série s’écrit :
Avec
Si :
a- Formulation générale
Supposons que représente les ventes d’un produit quelconque en t. ces ventes peuvent être
considérées comme le résultat d’une combinaison linéaire infinie de ses valeurs passées, le
poids ou l’influence du passé sur le présent étant décroissant avec son ancienneté. Nous
pouvons écrire la combinaison linéaire selon :
avec
Elle représente la valeur lissée de la chronique calculée en t-1. Par hypothèse et lorsque les
paramètres sont estimés, cette valeur lissée peut être considérée comme la valeur prévue de
calculée en . Soit :
Séries chronolgiques 23
Il est géométrique car les poids de la combinaison décroissent exponentiellement
Il est normalisé car la somme des poids est égale à 1.
Avec et
D’où
∑ ∑
Pour les normaliser on les divise par leur somme, tel que :
̂ ∑
̂ [ ]
Soit :
̂ ̂
Sous cette forme, le lissage est une moyenne pondérée de la dernière réalisation et de la
dernière valeur lissée.
Ou encore
̂ ̂
Le lissage apparait comme le résultat de la dernière valeur lissée corrigé par une pondération
de l’écart entre la réalisation et la prévision.
Utilisation du LES
Choix de la constante
La valeur optimale du coefficient de lissage à un instant donné résulte d’un compromis
entre l’inertie liée à l’intégration des données lointaines et la sensibilité aux valeurs
récentes.
En cas d’erreurs de prévision…..
La valeur du coefficient du lissage est celle qui minimise la somme des carrés des erreurs
de prévision passée :
∑ ∑ ̂
Son principe est simple : pour l’intervalle donnée [ ] des valeurs de , les prévisions
sont simulées avec un pas assez fin (0.01) par exemple, et nous retenons la valeur de qui
rend minimum la somme des carrés de prévision. L’utilisation d’un solveur sur les
tableurs permet de résoudre ce problème.
Séries chronolgiques 25
Plusieurs solutions existent pour démarrer les calculs à la période :
Prendre la moyenne arithmétique des .
Poser ̂
Choix du nombre d’observations en fonction de
Il est possible de déterminer le nombre d’observations en fonction de . En effet, la
pondération des observations décroit de manière géométrique jusqu’à devenir négligeable
au-delà d’un temps .
Soit A cet impact proche de 0, nous avons alors :
Soit :
̂
Car et ̂ sont indépendants.
D’où : ( )
L’intervalle de confiance à de la valeur prévue de en s’écrit :
√
( )
P( *̂ √ +
Avec la valeur de loi normale centrée réduite. Pour un intervalle de confiance de 95%,
nous avons :
Séries chronolgiques 26
̂ √
Solution
t ̂ ̂
1 30 30 0
2 40 30 10
3 40 33 7
4 30 35.10 -5.10
5 20 33.57 -13.57
6 20 29.50 -9.50
7 30 26.65 3.35
8 30 27.65 2.35
9 28.36
10 28.36
11 28.36
On initialise
̂
Pour (prévision calculée en t=1 pour t=2), nous avons :
̂ ̂
pour :̂ ̂
….
pour t= 8 : ̂ ̂
pour t= 9 : ̂ ̂
pour t=10, 11 : ̂ ̂ ̂
Nous avons :
et√
D’où : ̂ √ [ ]
Séries chronolgiques 27
Le modèle du lissage exponentiel double s’applique à une chronique du type :
Initialisation
En t=1 nous avons :
̂ ̂
̂
̂ ̂ ̂
̂
Comme ̂ ̂ ̂
̂ sont inconnus, les calculs débutent en où seuls ̂ ̂
̂ ne
sont pas déterminés.
Il existe plusieurs procédures d’initialisation pour le LED :
La plus simple consiste à choisir : ̂ ̂ ̂ , soit ̂
et ̂ ̂
̂
Choix de la constante
Les méthodes présentées pour le LES sont employées de manière identique pour le LED.
̂ ̂
̂
̂ ̂ ̂
̂
̂ ̂
̂
(̂ ̂
̂) ̅
̅
La prévision par un LED est donc une droite qui a pour ordonnée à l’origine et pour pente
les dernières valeurs trouvées de et . On peut par conséquent extrapoler cette droite à
l’horizon h ; mais il convient de limiter cet horizon de prévision car la qualité la prévision
se dégrade rapidement avec l’accroissement de h.
( )
Avec : , pour et
Séries chronolgiques 28
[ ]
Avec
( )
P( * +
Avec la valeur de loi normale centrée réduite. Pour un intervalle de confiance de 95%,
nous avons :
Soit les données observées de la série consignées sur le tableau .on demande de
calculer une prévision par une méthode de lissage double (LED) à un horizon de 3
périodes. La constante de lissage est égale à
Solution
Tableau : Prévision à partir du modèle de lissage exponentiel double
t ̂ ̂
̂
1 10 10 10
2 20 10 10 10 0 10 10
3 20 15 12.50 17.50 2.5 20 0
4 30 17.50 15 20 2.5 22.5 7.5
5 40 23.75 19.38 28.12 4.37 32.49 7.51
6 40 31.88 25.63 38.13 6.25 44.38 -4.38
7 50 35.94 30.79 41.09 5.15 46.24 3.76
8 50 42.97 36.88 49.06 6.09 55.15 -5.15
9 46.49 41.69 51.29 4.8 56.09
10 60.89
11 65.69
12 70.49
̂
Séries chronolgiques 29
̂ ̂
̂
̂ ̂
̂
̂ ̂ ̂
̂
̂
̂ ̂ ̂
̂
Séries chronolgiques 30
La méthode que nous venons de présenter est celle de Brown. Nous pouvons aussi utiliser
le lissage de Holt qui comprend deux paramètres : un pour l’origine donnée à l’origine
et l’autre pour la pente
On peut démontrer qu’il existe une correspondance entre le coefficient de lissage Brown
et les deux coefficients de Holt.
Formulation :
Lissage de la moyenne :
Lissage de la tendance :
̂
: valeur observée de la série en t
: moyenne lissée de la série en t
: tendance estimée en t
Initialisation pour :
Initialisation de la moyenne lissée :
Initialisation de la tendance :
Si la saisonnalité est de type aléatoire (ce qui est fréquent en économétrie) nous pouvons
recourir aux techniques de désaisonnalisation par filtrage (méthode Census ou
démodulation complexe) ou encore à des méthodes de lissage exponentiel.
Le schéma multiplicatif
La chronique s’écrit dans ce cas :
Formulation
Lissage de la moyenne :
( )
Lissage de la tendance :
Lissage de la saisonnalité :
( )
Prévision à un horizon de h périodes :
̂
̂
Avec :
̂
Le schéma additif
Séries chronolgiques 32
Formulation
Lissage de la moyenne :
( )
Lissage de la tendance :
Lissage de la saisonnalité :
̂
̂
Les paramètres et et sont optimisés comme pour les méthodes non saisonnières en
minimisant la somme des carrés des erreurs prévisionnelles entre la valeur observée de la
chronique et les valeurs prévues.
Initialisation de la saisonnalité :
Les coefficients saisonniers pour la première année sont estimés par la valeur observée en
divisée par la moyenne ̅ des p premières observations de la première année.
Pour
Initialisation de la moyenne lissée : ̅
Séries chronolgiques 33
Initialisation de la tendance :
La technique d’initialisation proposée par Montgormery et Johnson est préférable bien que
plus complexe : il s’agit de calculer les moyennes arithmétiques des k premières périodes :
̅ ̅
Puis :
̅ ̅
∑
̅
Solution
Initialisation :
pour
( )
Séries chronolgiques 34
Processus aléatoires stationnaires et Processus ARMA
Séries chronolgiques 35
Définition d’un processus stochastique
On suppose par la suite que la série temporelle notée : (soit une succession
d’observations régulièrement espacées dans le temps d’une valeur économique) est une
réalisation d’un processus stochastique discret univarié, de même nom et notée .
La chronique est dite échantillon ou réalisation du processus aléatoire et ce dernier est appelé
le processus générateur de la chronique.
La stationnarité forte
( )
.
Un processus est dit strictement stationnaire si les trois conditions suivantes sont
satisfaites : si toutes ses caractéristiques (tous ses moments) sont invariants pour tout
changement de l’origine du temps :
Séries chronolgiques 36
et corrélées.
La stationnarité faible
Le processus est dit faiblement stationnaire si seuls les moments d’ordre 1 et 2
sont stationnaires.
Un bruit blanc est un processus stochastique à accroissements non corrélés. Il est dit bruit
blanc fort si les accroissements sont indépendants. Il s’agit donc d’une suite de va réelles
homoscédastiques et indépendantes. On l’appelle aussi processus formé de va
indépendantes et identiquement distribuées.
Si la loi de probabilité de est normale alors le Bruit Blanc est dit bruit blanc gaussien
IID.
[ ]
Il est possible de définir la classe des processus ARMA à partir d’un théorème de
décomposition des processus de Wold.
Soit le processus centré réel ou complexe stationnaire et de variance finie. Il existe trois
processus qui vérifient les propriétés suivantes :
avec , et
( )
Si | | la somme infinie
Démonstration : multiplions de chaque côté la relation précédente par
Comme | | , converge vers 0 lorsque n tend vers l’infini. Ainsi, les deux
membres de la relation sont égaux.
Séries chronolgiques 38
Le processus stationnaire défini par les formules ∑ ou est
appelé processus Moyenne mobile infini. Il est noté .
Considérons le processus simple suivant pour lequel est un polynôme de degré 1.
Posons :
Cette formule est équivalente à la formule 1 pour l’écriture du processus . Pour que
soit un processus stationnaire il faut donc que ∑ soit convergente.
Considérons la formule :
Et posons : , alors :
Or cette écriture est celle d’une MA (1) puisque le polynôme d’opérateur a pour degré 1.
Séries chronolgiques 39
Les processus ARMA non saisonniers
Les processus ARMA mélanges de AR et MA sont nécessairement finis. Ils sont issus de
deux processus :
Il s’écrit aussi :( )
On remarque que :
A partir de la formule :
A condition que existe. Ce qui montre qu’il est possible avec des degrés peu
élevés de p et q de définir un nombre assez important de modèles.
Exemples d’écritures :
Séries chronolgiques 40
La stationnarité et l’invisibilité des processus
Conditions de stationnarité et d’inversibilité
Nous avons vu qu’il peut s’écrire selon la forme d’un sous la condition que | | ,
condition qui permet d’inverser le polynôme
Dans ce cas, la racine en B du polynôme est et comme | |
alors| | . Cette condition est appelée condition d’inversibilité du processus. Ce résultat
peut être généralisé pour le polynôme des processus MA et pour le polynôme des
processus AR.
Séries chronolgiques 41
Les processus aléatoires non stationnaires
Les cas de non stationnarité les plus fréquents sont analysés à partir de deux types de
processus :
Les processus TS (trend Stationnary) qui représentent une non stationnarité de type
détérministe.
Les processus DS (Differencystationnary) pour les processus non stationnaires aléatoires. Ils
constituent pour des chroniques saisonnières ou non, les modèles de référence pour la
construction des tests de racine unitaire en l’absence d’hétéroscédasticité.
Nous n’envisageons dans cette section que le cas des processus non saisonniers.
Le processus TS
Un processus TS s’écrit :
Le processus TS le plus simple est représenté par une fonction polynomiale de degré 1. Ce
processus s’écrit :
Si est un bruit blanc (gaussien ou non), les caractéristiques de ce processus sont alors :
Ce processus TS est non stationnaire, car dépend du temps. comme cette espérance est
égale à , il s’agit à l’instant t d’un chiffre certain. Dans ce cas nous pouvons estimer
de façon efficace les paramètres et de la tendance, en utilisant la méthode des MCO.
Séries chronolgiques 42
Les processus DS
Les processus DS sont des processus que l’on peut rendre stationnaire par l’utilisation d’un
filtre aux différences : où est un processus stationnaire de type
ARMA ou encore un bruit blanc, une constante réelle et l’ordre du filtre aux différences.
Ces processus sont souvent représentés en utilisant le filtre aux différences Le
processus est dit alors processus du premier ordre. Il s’écrit :
Les tests de Dickey Filler (DF) permettent de mettre en évidence le caractère stationnaire ou
non d’une chronique par la détermination d’une tendance déterministe ou stochastique.
Les modèles servant de base à la construction de ces tests sont au nombre de 3 et s’appuient
sur un modèle AR(1). Le modèle AR(1) est un modèle autorégressif d’ordre 1. En général dans
un modèle AR(P), l’observation présente est générée par une moyenne pondérée des
observations passées jusqu’à la p-ième période. Il peut être présenté sous 3 formes :
Le premier modèle :
(1.3)
(1.4)
Séries chronolgiques 43
Nous obtenons la forme suivante :
(1.5)
ou .
Nous estimons par la méthode des moindres carrés ordinaires le paramètre noté ̂ pour les
trois modèles. L’estimation des coefficients et des écarts types du modèle par les moindres
carrés ordinaires fournit qui est analogue à la statistique de Student (rapport du coefficient
sur son écart type). Si ̂ alors on accepte l’hypothèse ; il existe une racine
unitaire, le processus n’est donc pas stationnaire. A noter que le logiciel Eviews calcule
automatiquement les valeurs critiques ̂.
Cependant, dans les 3 modèles précédents, est par hypothèse un bruit blanc, donc non
corrélé. C’est une hypothèse restrictive. Pour y remédier, nous faisons appel aux tests de
Dickey- Filler Augmentés (ADF, 1981).
Sous l’hypothèse alternative,| | les tests ADF sont fondés sur l’estimation par les
moindres carrés ordinaires des trois modèles :
∑ (1.6)
(1.7)
∑ (1.8)
Le test se déroule de manière similaire au test DF, seules les tables statistiques sont
différentes. La valeur peut être déterminée selon les critères d’Akaike ou de Shwartz.
Cependant, compte tenu des limites du test ADF, un autre test de Philips et Perron (1988) a
été établi suite à une correction non paramétrique des statistiques de Dickey-Filler pour
prendre en compte des erreurs hétéroscédastique. Il se déroule en 4 étapes :
Séries chronolgiques 44
Estimation par les moindres carrés ordinaires des trois modèles de base des tests de
Dickey-Filler et calcul des statistiques associés, soit le résidu estimé.
Pour estimer cette variance de long terme, il est nécessaire de définir un nombre de retards l
(troncature de Newey-West) estimé en fonction du nombre d’observations n, l
Calcul de la statistique de PP :
̂ ̂
̂ √ (1.11)
̂ √
Avec :
̂ (1.12)
Cette statistique est à comparer aux valeurs critiques de la table de MacKinnon.
Les deux tests DF et ADF visent à tester la validité de l’hypothèse nulle de racine unitaire
contre l’hypothèse alternative d’absence de racine unitaire, tandis que la procédure du test
KPSS impose la stationnarité sous l’hypothèse nulle.
Kwiatkowski et al. (1991) propose d’utiliser un test du multiplicateur de Lagrange (LM) fondé
sur l’hypothèse nulle de stationnarité. Après estimation des modèles 2 et 3, nous calculons la
somme partielle des résidus:
∑ (1.13)
∑
(1.14)
Séries chronolgiques 45
Nous rejetons l’hypothèse de stationnarité si cette statistique est supérieure aux valeurs
critiques lues dans une table élaborée par les auteurs. Le logiciel Eviews permet directement
l’utilisation de ces tests.
Stationnarité
Avant le traitement d’une série chronologique, il convient d’en étudier les caractéristiques
stochastiques. Si ces caractéristiques (son épsrénce et sa variance) se trouvent modifiées dans
le temps, la série chronologique est considérée comme non stationnaire, dans le cas d’un
processus stochastique invariant, la série temporelle est alors stationnaire. Cela implique que
la série ne comporte ni tendance ni saisonnalité, et plus généralement aucun facteur
n’évoluant avec le temps.
Séries chronolgiques 46
Nous pouvons utiliser le test d’hypothèses d’un coefficient de corrélation fondé sur la
comparaison d’un t student empirique et théorique. Toutefois, Quenouille a démontré que
pour un échantillon de taille importante , le coefficient tend de manière asymptotique
vers une loi normale de moyenne 0 et d’écart type .
√
L’intervalle de confiance du coefficient est alors donné par :
Avec :
: Taille de l’échantillon
: Autocorrélation à l’ordre
Séries chronolgiques 47
: Nombre de retards à tester
Sous l’hypothèse , la statistique du test suite une loi . Pour un niveau de signification
si , nous rejetons l’hypothèse et concluons que les variables ne sont pas
indépendantes et les autocorrélations ne sont pas nulles.
[ ]
[ ]
Pour le cas de de la série des rendements de l’indice S&P 500, nous obtenons :
[ ]
[ ]
Séries chronolgiques 48
Nous concluons que la série des rendements de l’indice est asymétrique. En conclusion, nous
pouvons avancer que les rendements journaliers sont fortement non gaussiens avec l’excès
d’un Kurtosis et l’existence d’une asymétrie. Combinée avec la propriété sur les queues de
distributions, le test de Jarque-Bera conduit également à rejeter l’hypothèse d’une distribution
normale des rendements. Nous rappelons que ce test qui admet pour hypothèse nulle la
normalité de la distribution est construit de la façon suivante :
Avec :
Une autre méthode pour évaluer l’adéquation ou non des rendements avec une distribution
gaussienne est d’analyser les quantiles, en traçant les quantiles empiriques contre les quantiles
d’une loi normale (QQ-Plot).
Dans le processus autorégressifs d’ordre p, l’observation présente est générée par une
moyenne pondérée des observations passées jusqu’à la pème période sous la forme suivante :
Séries chronolgiques 49
….
Nous pouvons ajouter à ce processus une constante qui ne modifie en rien les propriétés
stochastiques. L’équation précédente peut aussi s’écrire à l’aide de l’opérateur décalage D :
( )
Dans le processus de moyenne mobile d’ordre q, chaque observation est générée par une
moyenne pondérée d’aléas jusqu’à la qème période.
….
Nous pouvons ajouter à ce processus une constante qui ne modifie en rien les propriétés
stochastiques. L’équation précédente peut aussi s’écrire à l’aide de l’opérateur décalage D :
( )
Dans ce processus, tout comme dans le modèle Autorégressif ( ), les aléas sont supposés
être engendrés par un processus de type bruit blanc. Nous pouvons interpréter le modèle MA
comme étant représentatif d’une série chronologique fluctuant autour de sa moyenne de
manière aléatoire, d’où le terme moyenne mobile car celle-ci, en lissant la série, gomme le
bruit créé par l’aléa.
On note que :
Séries chronolgiques 50
Le corrélogramme simple d’un processus est de la forme générale :
∑
∑
C’est-à-dire que seuls les q premiers termes du corrélogramme simple sont significativement
différents de 0.
Le corrélogramme partiel est caractérisé par une décroissance géométrique des retards.
Modèle ARMA
Les modèles ARMA sont représentatifs d’un processus généré par une combinaison des
valeurs passées et des erreurs passées. Ils sont définis par l’équation :
( ) ( )
Conditions d’utilisations
Les modèles AR, MA, ARMA ne sont représentatifs que de chroniques :
Stationnaire en tendance
Corrigées des variations saisonnières
Si la série étudiée est de type TS, il convient de la stationnariser par regréssion sur le temps et
le résidu d’estimation est alors étudié selon la méthodologie de Box Jenkins. Ceci permet de
déterminer les ordres p et q.
Si la série est étudiée est de type DS, il convient de la stationnariser par passage aux
différences selon l’ordre d’intégration (c’est-à-dire le nombre de fois qu’il faut
différencier la série pour la rendre stationnaire). La série différenciée est alors étudiée selon la
méthodologie de Box Jenkins qui permet de déterminer les ordres p et q. on note ce type de
modèle
Séries chronolgiques 51
Le modèle SARIMA permet d’intégrer un ordre de différenciation lié à une saisonnalité
généralisée par la transformation :
Où s correspond à la périodicité des données ( 4 pour une série trimestrielle et 12 pour une
série mensuelle).
La partie autorégressive d’un processus, notée AR, est constituée par une combinaison
linéaire finie des valeurs passées du processus. La partie moyenne, notée MA, est constituée
d’une combinaison linéaire finie en t des valeurs passées d’un bruit blanc. Wold (1954)
montre que les modèles ARMA permettent de représenter la plupart des processus
stationnaires. L’approche de Box et Jenkins consiste en une méthodologie d’étude
systématique des séries chronologiques à partir de leurs caractéristiques afin de déterminer le
modèle le plus adapté à représenter le phénomène étudié.
Désaisonnalisation :
Dans le cas d’une série affectée par un mouvement saisonnier, il convient de la retirer
préalablement à tout traitement statistique.
Si l’étude du corrélogramme simple et les tests s’y rapportant (statistique Q Ljung Box)
présagent d’une série affectée d’une tendance, il convient d’en étudier les caractéristiques
selon les tests de DF. La méthode d’élimination de la tendance est fonction du processus DS
ou TS sous-jacent à la chronique étudiée.
Après stationnarisation, nous pouvons identfier les valeurs des paramètres pet q du modèle
ARMA :
Si le corrélogramme simple n’a que ses q premiers termes (q=3 maximum) différents de 0 et
que les termes du corrélogramme partiel diminuent lentement, nous pouvons pronostiquer un
MA(q).
Si le corrélogramme partiel n’a que ses p premiers termes (p=3 maximum) différents de 0 et
que les termes du corrélogramme simple diminuent lentement, nous pouvons pronostiquer un
AR(p).
Si les fonctions d’autocorrélation simple et partiel ne paraissent pas tronquées, il s’agit alors
d’un ARMA.
L’approche de Box-Jenkins est une méthode en quatre étapes qui a pour but d’effectuer
les meilleures prévisions possibles d’une série temporelle.
Séries chronolgiques 52