0% ont trouvé ce document utile (0 vote)
7 vues210 pages

T000475

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1/ 210

Université du Québec

INRS-ETE

NOUVEAUX OÉVPT,OPPEMENTS DU PROCESSUS


DE NEYMAN-SCOTT
Introduction d'une dépendance entre ltintensité et la durée des
cellules pluvieuses et non-stationnarité

par
GUILLAUME EVIN

Thèse présentée
pour I'obtention du grade de Philosophiæ doctor (Ph.D.)
en sciencesde I'eau

Jury d'évaluation

Président du jury et M. Alain Mailhot, professeur


examinateur interne INRS-ETE
Université du Québec
Examinateur externe M. Marc Redette, professeur
Service de I'enseignement des méthodes quantitatives de gestion
HEC Montréal
Examinateur externe M. Christian Onof, professeur
Dept. of Civil and Environmental Engineering
Imperial College London
Directeur de recherche Mme Anne-Catherine Favre, professeure
INRS-ETE
Université du Québec

thèseprésentéele31 Juillet 2008


Remerciements

J'aimerais remerciertout particulièrement Anne-CatherineFavre pour son soutien incondition-


nel tout au long de cette thèse. Sa confiance et ses conseils m'ont continuellement rassuré et aidé
à franchir tous les obstacles. Un grand merci au jury qui a fait un travail remarquable et dont les
remaxquesont grandement aidé à I'amélioration de la thèse.

Un sincère remerciement également à Bernard Bobée qui m'a introduit dans la Chaire en
hydrologie statistique et m'a ainsi permis de découvrir le Québec et le monde de la recherche.
Résumé

Depuis une vingtaine d'années,les modèlesde précipitations baséssur des processusponctuels


ont fait l'objet de nombreux efforts de rechercheafin de restituer les caractéristiques de la pluie à un
pas de temps court (le plus souventhoraire). La plupart des modèlesutilisent un processusponctuel
pour générerdes amas de cellulespluvieuses(ou cluster). Ces cellulescomportent elles-mêmesune
durée et une intensité aléatoire. Malgré tous les efforts fournis et les différentes variations du modèle,
des problèmes demeurent, par exemple dans la reproduction des extrêmes. De plus, certaines
limitations du modèle restreignent son application (par exemple la stationnarité temporelle de ce
type de modèle). Cette recherchepropose de nouvelles généralisationspour le modèle de pluie
connu sous Ie nom de Neyman-Scott (ou NSRPM). Plus spécifiquement,nous nous intéressons
d'une part au lien entre I'intensité et la durée des cellulespluvieuseset, d'autre part, à la possibilité
d'introduire une non-stationnarité dans la fréquence des averses.

IJne des hypothèses du modèle de Neyman-Scott généralement acceptée est I'indépendance


des caractéristiquesdécrivant les cellulesdu processusponctuel. Dans cette thèse, nous montrons
que I'introduction d'une dépendance entre les variables constituantes du modèle permet de mieux
restituer les caractéristiquesdes précipitations (période de sécheresse, valeurs extrêmes,etc.). Ce
lien est introduit à I'aide de copules cubiques et permet d'obtenir une forme de dépendancesouple.
Nous étudions I'impact de I'introduction de la dépendanceentre la durée et I'intensité des cellules
en appliquant le modèle sur de nombreux jeux de données d'origine différente (Canada, États-
Unis, Suisse,Rance et Belgique). Ces séries de pluies horaires nous permettent de comparer la
performance des modèles que nous avons développés et de plusieurs modèles existants sur des
climats variés.

La secondegénéralisationproposéepermet de prendre en compte la non-stationnarité des pro-


priétés statistiques de la pluie. Dans un contexte de changement climatique, le postulat de sta-
tionnarité dans les modèles stochastiques de pluie doit être remis en question. Nous considérons
alors un processusde Poisson non-homogèneà la base du modèle de Neyman-Scott. La théorie
de base est reconsidérée et les moments statistiques sont calculés jusqu'au troisième ordre dans
le cas général ainsi qu'avec une fonction simple pour le taux d'arrivée des averses.IJne méthode
d'estimation des paramètres est ensuite proposée et discutée, les moments observés étant obtenus
grâce aux statistiques issuesd'une fenêtre mobile et d'une méthode de régression.
Summary

Many stochastic point processesfor rainfall have been developed during the last twenty years.
Point rainfall models based upon Poisson-clusterprocesseswere deeply examined. In this type of
models, storms arrive according to a Poisson process and a cluster of rainfall cells is attached to
each storm, the intensity and the duration of these cells being themselvesrandomly distributed.
These models have been proved to be particularly efficient in simulating hourly rainfall, due to
the presence of clusters of rainfall cells in the rainfall data. However, weaknessesremain in the
reproduction of extreme events and the reproduction of dry periods. The thesis proposes ne\M
developments of this Poisson-cluster models for rainfall for the Neyman-Scott Rectangular Pulses
Model (NSRPM). More specifically,we deal with the dependencebetween the cell intensity and
the cell duration. In a second part, we study the possibility of introducing a nonstationarity in the
storm arrivals.

The independence relation between cell intensity and duration can explain the limitations of
the Neyman-Scott model. Although independence between cell intensity and duration turned out
to be a nonrealistic assumption, only a few models link these variables. Therefore, a Neyman-Scott
cluster processconsidering dependencebetween cell depth and duration is developed. We introduce
this link with a cubic copula. Thanks to this flexibility, we are able to introduce a global concept of
dependencebetween cell depth and duration. We derive the aggregated moments (first, second and
third order moments) from the new model for several families of polynomial copulas and perform
an application on datasetswith various origins (Canada, USA, Swiss,Rance and Belgium). These
rainfall series enable us to confront the proposed model with the existing ones on various climate
types.

The second development proposed to take into account the non-stationarity in the statistical
properties of rainfall. In a context of climate change, the postulate of stationarity in stochastic
models for rainfall must be discussed.We consider a non-homogeneousPoisson.processwithin the
Neyman-Scott model. The basic theory is revised and the moments are derived up to the third
order in the general caseand also with a simple function on storm arrivals. A calibration method is
proposed and discussed.Empirical moments are computed thanks to the moving window statistics
and a regressionmethod.
Table des matières
Remerciements ul

Résumé

Summary vlt

Table des matières XI

Liste des tableaux xiv

Liste des figures xvii

Nomenclature XX

1- Introduction 1

2 Théorie de base des processus ponctuels 7


2.7 Le processusde comptage 7
2.2 Le processusde Poisson B
2.2.L L'intensité B
2.2.2 La distribution des intervalles o
2.2.3 Le processusde comptage 9
2.3 Espérance,varianceetcovariance ..... 10
2.4 Le processusde cluster 11

Le modèle à cellules rectangulaires de Neyman-Scott 13


3.1 Modèles ponctuels de Poisson 13
3.2 Définition et propriétés du modèle de Neyman-Scott de base . . . . . 17

La modélisation de la dépendance avec les copules 21


4.L Généralitéssur les copules 23
4.1.1 Définitions .....23
4.L.2 Propriétés .....24
4.2 Mesuresde dépendance. 25
4.2.7 Le rho de Spearman 25
4.2.2 LetaudeKendall ..... 26
4.3 Familles de copules 27
4.3.1 Copules de références 27
4.3.2 Copulesarchimédiennes ..... 28
4.3.3 Copules polynômiales . 29

Influence de la dépendance entre I'intensité et la durée des cellules 35


5.1 La discrétisation du temps 35
5.2 Laséparationdesaverses ..... 36
5.3 L'effet cluster sur le lien entre I'intensité et la durée des averses 36
5.3.1 Influence du paramètre pp slJrrs 37
5.3.2 Influence des différents paramètres sur rÀ lorsque la durée et l'intensité des
cellules sont i,ndépendantes 39
5.3.3 Influence des différents paramètres sur 7À lorsque la durée et l'intensité des
cellules sont dépendantes . 47
5.4 Conclusion .....411

Calcul des moments du NSRPM incluant un lien intensité/durée des cellules 45

z,!}1"ff##JfiîJ,r"".'irt...' n
Méthode d'estimation des paramètres du modèle 51
7.L Méthode baséesur une fonction de vraisemblance 51
7.2 Méthode baséesur les moments 52
7.2.I Méthodegénéraliséedesmoments ..... 52
7.2.2 Méthode d'estimation des paramètrespour le cas particulier de la version de
base du NSRPM 54
7.3 Méthode d'estimation adoptée 5B

Application du NSRPM incluant un lien entre l'intensité et la durée des cellules 6 1


8.1 Description des donnéesdisponibles 61
8.1.1 Suisse 65
8.L.2 Fïance et Belgique . . . . . . . . . . . 00
8.1.3 Étuts-Ur,is 67
8.1.4 Canada 67
8 . 2 Modèles considérés 70
8 . 3 Estimation des paramètres et fonction objectif 7I
8 . 4 Dépendance B6
8 . 5 Extrêmes B9
8 . 6 Conclusion
xl

I Un modèle de Neyman-Scott non-stationnaire 101


9.1 Introductiorr .....101
9.2 Le processusde Poissonnon-stationnaire avec amas de cellules . . . . 103
9.2.I Moment du premier ordre . . . . 104
9.2.2 Variance et Autocovariance . . . 104
9.3 Unchoixderp(f) .....106
9.4 Calcul des moments empiriques . . 108
9.5 Méthode d'estimation d.esparamètres du NSRPM-NS . . . . . 115
9.6 Simulation .....L17
9.7 Application ....II7
9.8 Conclusion .....120

1-OConclusion I23
10.1 Tfavail accompli . . 723
10.1.1 NSRPM incluant un lien entre I'intensité et Ia durée des cellulespluvieuses . 123
10.7.2 NsRPMnon-stationnaire. . .. .725
10.2 Discussionet pistes des travaux à accomplir . . 125
I0.2.t Estimation des paramètres . . 725
10.2.2 Validation du modèle . . .726
1 0 . 2 . 3V e r s u n m o d è l e o a r f a i t ? . . . ..\26

Bibliographie 127

A Copules cubiques 139


4.1 Conditions nécessaires . . 139
4.2 Minimum du tau de Kendall pour une copule avec sectionscubiquesen u et v . . .I40

B Moments avec une copule cubique L4L


8.1 La fonction d'autocovarianceavec la durée et I'intensité des cellulesdépendantes . 141
8.2 Calcul du moment du troisième ordre . . I42
8.3 Moment du troisième ordre avec la copule FGM . . . . 745
8.4 Formules généralesdes moments agrégésavec une copule cubique . . I45

C Application du NSRPM avec un lien intensité/durée des cellules L47


C.1 Fonction objectif 147
C.2 Dépendance 764
C.3 Bxtrêmes 170

D Moments agrégés du processus non-stationnaire 187


D.l Variance ..187
D.2 Covariance .....189
Liste des tableaux
1.1 Résuméde la structure des pluies

4.7 Familles de copules cubiques à un paramètre ?t

?o
4.2 Degrésde dépendancedes familles de copulescubiques

8.1 Régimespluviométriques du monde 62


8.2 Description des sériesde pluie 63
8.3 Mois et stations où la méthode alternative d'estimation des paramètres a été appliquée 75
8.4 Estimations des paramètres du NSRPM $ eZuti"tt pour le mois de janvier . . . . . 78
8.5 Estimations des paramètres du NSRPM $ à Zirich pour le mois d'août B0
8.6 Estimations des paramètres du NSRPM / à Uccle pour le mois de janvier 82
8.7 Estimations des paramètres du NSRPM / à Uccle pour Ie mois d'août 82
8.8 Estimations des paramètres du NSRPM / à Val d'Or pour le mois de janvier 84
8.9 Estimations des paramètres du \ISRPM / à Val d'Or pour le mois d'août 84
8.10 Tableau récapitulatif des meilleurs modèles 85

9.1 Biais relatifs moyenset intervalles de confianceempirique . . . . 115


9.2 Choix des poids dans la procédure d'estimation des paramètres du NSRPM-NS. . . 116
9.3 Estimations des paramètres du NSRPM non-stationnaire /. . . . . . I20

C.i Estimations des paramètres du NSRPM / à Brest pour le mois de janvier . . 149
Q.2 Estimations des paramètres du NSRPM / à Brest pour le mois d'août . . . . 149
C.3 Estimations des paramètres du NSRPM / à Lyon pour le mois de janvier . . 151
C.4 Estimations d.esparamètres du NSRPM / a lyott pour le mois d'août . . . . 151
C.5 Estimations des paramètres du NSRPM / à Marseille pour le mois de janvier . . . . 153
C.6 Estimations des paramètres du NSRPM / à Marseille pour le mois d'août . . 153
C.7 Estimations des paramètres du NSRPM / à ttnd"uu pour le mois de janvier . . . . 155
C.B Estimations des paramètres du NSRPM / à TÏnd"uu pour le mois d'août . . 155
C . 9 E s t i m a t i o n s d e s p a r a m è t r e s d u N S R P M / a U i a m i p o u r l e m o i s d e j a n v i .e.r. . . 7 5 7
C.10 Estimations des paramètres du NSRPM / e Uiami pour le mois d'août . . . 157
C . 1 1E s t i m a t i o n s d e s p a r a m è t r e s d u N S R P M / à S e a t t l e p o u r l e m o i s d jea n v i e r . . . . . 1 5 9
C.12 Estimations des paramètres du NSRPM / à Seattle pour le mois d'août . . . 159
C.13 Estimations des paramètres du NSRPM / a los Angeles pour le mois de janvier . . 161
C.14 Estimations des paramètres du NSRPM / a ms Angeles pour le mois d'août . . . . 161
C.15 Estimations des paramètres du NSRPM / à Mitttr"upolis pour le mois de janvier . . 163
C.16 Estimations des paramètres du NSRPM @à Minneapolis pour Ie mois d'août . . . . 163
Liste des figures

2.t Construction d'un processusde cluster . . . . . 11

3.1 Construction des modèlesde Neyman-Scott et Bartlett-Lewis . 14


3.2 Réalisation possibledu modèle à pulsations rectangulaires 20

4.7 Deux paires d'observationsconcordantes(à gauche) et discordantes(à droite). 27


4.2 Graphe de I'espacedes paramètres dans S pour chaque copule cubique 33

5.1 q (lien durée/intensité des averses)en fonction d" po . . . . . 38


5 . 2 4 ( l i e n d u r é e / i n t e n s i t é d e s a v e r seensf)o n c t i o n d e D ..... 38
5.311V€rSUS(l,,,0),0lo,rù,(0,,ù,(o,,t),@,0)et(p,p,a)
5.4 T1 v€rsus l.16reuand intensité et durée des cellules sont liées 47
5.5 TÀversus Fo quand intensité et durée des cellules sont co-monotones . . . . . 42
q
5.6 Tr v€rsus a,B et avecun lien intensité/durée des cellules 42
5.7 Deux exemplesd'aversesdont la durée et l'intensité des cellulessont cemonotones
t- - 1
L)
\ -13
\ID

7.7 Diagramme résumant la procédure d'estimation en neuf étapes.

8.1 Carte des climats mondiaux 63


8.2 Moyennes mensuellesdes précipitations liquides 64
8.3 Carte de la Suisse(SourceHachette Multimédi,a). 65
8.4 Carte de la Fïance et de la Belgique 66
6.ô Carte des pluies totales moyennes annuelles uu* Étut.-Unis . 6B
8.6 Carte des précipitations totales moyennes annuelles au Québec 69
8 . 7 Évolution mensuellede I'autocorrélation horaire et journalière empirique à la station
Trudeau 72
8 . 8 Évolution de la fonction objectif et des estimations des paramètres du NSRPM en
fonction de I'autocovariance journalière à Tîudeau tù

8 . 9 Évolution mensuelle de l'autocorrélation horaire et journalière empirique à la station


de Brest 74
8 . 1 0Évolution de la fonction objectif et des estimations des paramètres du NSRPM en
fonction de I'autocovariancejournalière à Brest t+
8 . 1 1Fonction objectif pour les différents modèlestestés à la station de Zûrich 70
xvl

8 . 1 2Fonction objectif pour les différents modèlestestés à la station d'Uccle B1


8 . 1 3Fonction objectif pour les différents modèlestestés à la station de Val d'Or B3
8 . 1 4Tau de Kendall entre I'intensité et la durée des cellules avec Ia copule Sym2 en Europe 87
8 . 1 5Tau de Kendall entre I'intensité et la durée des cellules avec la copule Sym2 en
Amérique du Nord BB
8 . 1 6Maxima annuels journaliers à Zùrich 91
8 . 1 7Maxima annuels horaires à Zùrich 92
8 . 1 8Maxima annuels journaliers à Uccle 93
8 . 1 9Maxima annuels horaires à Uccle 94
8.20Maxima annuels journaliers à Tîudeau 95
8 . 2 7Maxima annuels horaires à Tbudeau 96
8 . 2 2Maxima annuels journaliers à Lyon avec le "méga-modèle" 97
8.23 Maxima annuels horaires à Lyon avec le "méga-modèle" 98

9.1 Approximations linéaires des moments et moments théoriques du NSRPM non-


stationnaire r09
9.2 Biais relatif moyen et intervalle de confiance empirique à 80% (10e-" et 90è-" cen-
tiles) résultant de la régressionrobuste pour la moyenne. 111
9.3 Biais relatif moyen et intervalle de confi.anceempirique à 80% (10è*" et 90è'u cen-
tiles) résultant de la régressionrobuste pour la variance. TT2
9.4 Biais relatif moyen et intervalle de confianceempirique à 80% (10u-u et 90è-" cen-
tiles) résultant de la régressionrobuste pour l'autocovariancede décalageun. 113
9.5 Biais relatif moyen et intervalle de confianceempirique à S0% (10u'"uet 90è-" cen-
tiles) résultant de la régressionrobuste pour le moment du troisième ordre (centré). t74
9.6 Exemples de fonctions g(t), Â(t) et Â-t(") pour la simulation avec À : 0.01 et
e : 0.01. 118
9.7 Moments empiriques et régressionslinéaires correspondantes à une échelle horaire
pour le NSRPM non-stationnaire 119
9.8 Moments empiriques et régressions linéaires correspondantes à une échelle jour-
nalière pour Ie NSRPM non-stationnaire 120

8.1 Illustration du calcul du moment du troisième ordre du NSRPM 744

C.l Fonction objectif pour les différents modèlestestés à la station de Brest 148
C.2 Fonction objectif pour les différents modèlestestés à la station de Lyon 150
C.3 Fonction objectif pour les différents modèlestestés à la station de Marseille . 75',2
C.4 Fonction objectif pour les différents modèles testés à la station de Tludeau 154
C.5 Fonction objectif pour les différents modèles testés à la station de Miami 156
C.6 Fonction objectif pour les différents modèles testés à Ia station de Seattle 158
C.7 Fonction objectif pour Ies différents modèles testés à la station de Los Angeles 160
C.8 Fonction objectif pour les différents modèlestestés à la station de Minneapolis 162
xvll

C.9 Tau de Kendall entre l'intensité et Ia durée des cellulesavec Ia copule Fcub en Europe164
C.10 Tau de Kendall entre I'intensité et la durée des cellules avec Ia copule Fcub en
AmériqueduNord ....165
C.11 Tau de Kendall entre I'intensité et la durée des cellules avec Ia copule Asym3 en
Europe ...166
C.12 Tau de Kendall entre I'intensité et la durée des cellules avec la cooule Asvm3 en
AmériqueduNord .... ....167
C.13 Tau de Kendall entre I'intensité et la durée des cellulesavecla copule FGM en Europel68
C.14 Tau de Kendall entre I'intensité et la durée des cellules avec la copule FGM en
Amérique du Nord 169
C.15 Maxima annuelsjournaliers à Brest 170
C.16 Maxima annuels horaires à Brest t71
C.17 Maxima annuelsjournaliers à Lyon 172
C.18 Maxima annuels horaires à Lyon l/r)

C.19 Maxima annuels iournaliers à Marseille 174


C.20 Maxima annuels horaires à Marseille
C.21 Maxima annuelsjournaliers à Val d'Or r76
C.22 Maxima annuels horaires à Val d'Or 177
C.23 Maxima annuelsjournaliers à Miami . . 178
C.24MaximaannuelshorairesàMiami ....779
C.25 Maxima annuelsjournaliers à Seattle . . 180
C.26MaximaannuelshorairesàSeattle ....181
C.27 Maxima annuelsjournaliers à Los Angeles . . . IB2
C.28 Maxima annuels horaires à Los Angeles . . . . 183
C.29 Maxima annuelsjournaliers à Minneapolis . . . 184
C.30 Maxima annuels horaires à Minneapolis . . . iB5
Nomenclature

Processus ponctuel
E espacedu processusponctuel
li(.) processusde comptage
la(.) fonction indicatrice de l'ensembleA
'llt
histoire du processusau temps t
c(.) fonction de densité de covariancedu processusponctuel

Variables aléatoires du NSRPM


D nombre de cellules par cluster
X intensité de la cellule
L durée de la cellule
Y(t) intensité de pluie au temps t
Yn pluie totale cumulée dans le ième intervalle de longueur ft,

Dépendance
C (., .) distribution copule
O(.) fonction génératricedes copules archimédiennes
At,Bù'i: I,2 paramètresdes copulescubiques
rp tau de Kendall entre I'intensité et la durée des cellules
T^ tau de Kendall entre l'intensité et la durée des averses
Paramètres
À taux du processusde Poisson stationnaire gérant les origines d'averses
P paramètre de Ia distribution exponentielleliée à la position des cellules
ltn espérancedu nombre de cellules
Tl paramètre de Ia distribution exponentielle liée à la durée des cellules
Hx espérancede I'intensité des cellules
a paramètre d'échelle lié à I'intensité des cellules
'y paramètre de forme lié à l'intensité des cellules
0 paramètre de la copule cubique
f , c et ( paramètres intensitéf ùrée des cellulesdans les modèlesDD1 et DD2
ô vecteur des paramètres du NSRPM

Moments et estimation des paramètres


q/ distribution bivariée de X lorsque L ) I
k décalagede la fonction d'autocovariance
Fx,,t>t moment d'ordre r de X lorsque ,L ) I
TrL ordre du moment
h niveau d'agrégation temporelle
cv(r) covariancede décalager du processusd'intensité pluvieuse
€n moment du troisième ordre (centré) d'un intervalle de longueur h
PD(h) probabilité d'avoir un intervalle de longueur h sans pluie
O fonction objective dans la méthode des moments
p nombre de moments considérésdans la fonction objectif
a poids des moments dans la fonction objectif
Zi,i: L..4,V,W fonctions permettant de décomposerles expressionsde la variance
et de Ia covariance dans la version de base du NSRPM
échelle de fluctuation du processus

NSRPM non-stationnaire
,p(.) taux du processusde Poissondépendant du temps
g paramètre de la distribution exponentielle liée à Ia durée des aversesdans le
modèle de Bartlett-Lewis non-stationnaire
CI longueur de la fenêtre mobile
e taux de croissancedu taux du processusde Poisson
E!, E! coefficients de I'approximation linéaire de I'espérance agrégée
U*,V! coefficients de I'approximation linéaire de la variance agrégée
Ct,Cl coefficients de I'approximation linéaire de I'autocovariance agrégée
f!,7! coefficients de I'approximation linéaire du moment du troisième ordre agrégé
^(.) fonction de cumul du taux du processusde Poisson
Chapitre L

Introduction

La répartition quantitative de I'eau à I'échelledu globe est très hétérogène.De même, la dis-
tribution spatiale de I'eau douce disponible par habitant est inégale selon les pays. Cette consta-
tation constitue la source de conflits et de tensions politiques qui ne vont pas cesserde s'accroître
dans les prochainesdécennies(conflit de I'eau au Moyen-Orient, voir Bisson & Mutin, 2000). Sans
parler de la consommation domestique de l'eau douce, la gestion de I'eau est devenueune prio-
rité dans de nombreux domaines (production hydro-électrique,agriculture, loisirs, etc.). De nom-
breux exemples montrent les conséquencesdésastreusesd'aménagements hydrauliques mal pla-
nifiés (crise écologiquede la mer d'Aral, stérilisation des sols, sédimentation et inondations suite
à la construction du complexe hydraulique de Sanmenxia en Chine, ou encore I'assèchementdes
marais de Mésopotamie en Irak, etc.). Pour de plus amples informations concernant les enjeux
de I'eau, le lecteur poura consulter un ouvrage récent sur ce sujet (Anctil, 2008) ou le dossier
sur I'eau douce du Centre National de la RechercheScientifique (CI{RS) disponible à I'adresse
ar;cuei-t . hbmL1.
irtfir: / /wutw.cnrs . fr/ r:w/d.ossiers/closeauf

Une gestion efficace de cette ressource naturelle est de première importance, notamment afin
de prévenir les catastrophesnaturelles (inondations, sécheresses). Le terme "inondation" désigne
la submersion de zones normalement sèchespar I'eau, des matériaux en suspensionou du matériau
de charriage; cette submersion étant partielle ou totale et limitée dans le temps. Au Canada, les
inondations sont dues à une ou plusieurs des causessuivantes2 :

* fonte des neiges;

'dernière consultation Ie 7 août 2008


2site dtEnvironnementCanada http://www.ec.r{c.ca/\later/fr/manage/floodgen/f--cause.htm,dernière
consultation le 7 août 2008
Introduction

pluie;
embâcleset autres obstacles;
jôkulhlaups ou inondations provoquéespar l'éclatement d'un glacier;

tempêtes sur les littoraux (tsunamis, cyclones,ouragans);


modifications du drainage dues à I'urbanisation;
défaillance d'un barrage (ou autre ouvrage hydraulique).

L'inondation constitue un risque majeur aux conséquenceshumaines et matérielles exbrêmement


préjudiciables.Au Canada, les inondations ont causé,de façon directe ou indirecte, la mort d'au
moins 198 personneset entraîné des dépensesde plusieurs milliards de dollars au cours du XXième
siècle(voir Brooks et aL.,2007).Il est donc indispensablede posséderdes outils de gestion efficaces
afin de prévenir ce type de catastrophe lors du dimensionnement des ouvrages hydrauliques (bar-
rages, digues, évacuateursde crue, égouts, etc.). Au Québec, la gestion des ressourcesen eau est
de plus particulièrement importante en vue de la production hydroélectrique, qui représente plus
de 95% de l'électricité produite.

La pluie est un des principaux acteurs du cycle de I'eau. À partir d'un modèle de pluie qui
représenteadéquatement sespropriétés statistiques (moyenne de I'intensité pluvieuse, variance, au-
tocovariance,valeurs extrêmes) à plusieurs échellesde temps (mois, jour, heure,jusqu'à un pas de
temps de cinq minutes, dépendammentdes applications), il serapossibled'utiliser de Ionguesséries
synthétiques de pluie comme intrants dans des modèles hydrologiques (pluie-débit, infiltration,
etc.). Ce sont alors les sorties de ces modèles qui permettront aux constructeurs d'ouvrages hy-
drauliques ou aux gestionnairesde disposerd'outils d'aide à la décision.Par exemple,la prédiction
des crues peut être réaliséeen couplant un modèle stochastique de pluie et un modèle hydrologique
déterministe (Overney,1997; Sinniger, 1997; Favre,200I; Overney et a\.,2005). Certains modèles
hydrologiques à base quasi-physique permettent aussi de simuler l'effet de modifications des va-
riables hydrométéorologiques (comme la pluie) dans le temps et I'espace sur les crues (voir par
exemple Sinniger, 1997).

Selon Cox & Isham (1994), les modèles de pluies (dans I'espace et Ie temps) peuvent être
regroupés en trois grandes catégories :

Les modèles statistiques empiriques dans lesquelsles relations entre les variables expli-
catives sont représentéesvia des équations empiriques (Stein, 1986);
Les modèles de météorologie dynamiques dans lesquelsles processusphysiques sont
décrits en utilisant les théories de la dynamique et de la thermodynamique des fluides. De
larges systèmesnon-linéaires d'équations différentielles doivent alors être résolus numérique-
ment (Mason, 1986). De tels modèles sont couramment appliqués dans le domaine de la
prévision météorologique et dans les modèles climatiques globaux (Global Cli,mate Models,
GCMs);
- Les modèles stochastiques dans lesquelsun nombre modeste de paramètres, qui sont
reliés à des caractéristiques physiques, sont utilisés pour représenter la variabilité temporelle
ou spatiale de la pluie.

Ces trois types de modèles ont tous un rôle important à jouer et le choix du modèle dépend
uniquement de l'objectif de I'analyse. Dans ces travaux, nous nous intéressonsexclusivementau
troisième type de modèle. Un modèle stochastique de pluie a pour but objectif de simuler des séries
chronologiques reproduisant au mieux les observations en un point donné (ou une petite région)
de la surface du globe. Les paramètres d'un tel modèle étant calibrés, il peut servir à extrapoler
des séries chronologiques existantes pour simuler le comportement à long terme d'un système
hydrologique, étudier la fréquence de ses défaillances ou d'apparition d'un phénomène particulier
(débordement d'un système d'assainissementurbain par exemple) et étudier les caractéristiques
des pluies qui les provoquent.

Il existe principalement trois types de modèles stochastiques de pluie. Le premier ensemble


de modèles se base sur des chaînesde Markov (voir par exemple Stern & Coe, 1984). L'intensité
de la pluie journalière ou horaire est alors distribuée selon une loi simple (gamma par exemple)
conditionné par un état qui peut être "sec" ou "humide", ou encore "transitionnel" pour un
choix d'espace à trois états. Ce type de modèle donne des résultats convaincants à une échelle
journalière. Il faut cependant indiquer que ces modèles n'ont pas la prétention de nous renseigner
sur la physique des processus réels. Les modèles multifractals constituent une deuxième façon
d'aborder le problème de Ia modélisation stochastique de la pluie. Ils traduisent le plus simplement
possible des propriétés d'invariance de certains paramètres (invariance spatiale, temporelle ou
spatio-temporelle) à partir d'un nombre très limité de paramètres. En particulier, dans les modèles
de cascadesmultifractales de générateur algébrique, c'est le coefficient de décroissancealgébrique
qui est un invariant d'échelle (voir \4andelbrot, 1975; Schertzer et al.,Igg7; Schertzer& Lovejoy,
2004). Le dernier grand type de modèle utilise des processus ponctuels avec amas de cellules
(cluster). Ces modèles sont particulièrement intéressantscar ils s'inspirent des caractéristiques
physiques des champs de précipitations, principalement de leur structure hiérarchique (les averses
étant représentéespar des amas de cellules pluvieuses).

Les aires de pluie peuvent être classifiéesselon leur extension spatiale (Northrop, 1996). Les
zonesplus grandes que 104km2 sont définies comme "synoptiques" et sont généralement associéesà
des pluies cycloniques. Les zones synoptiques ont une durée de vie pouvant aller de un à plusieurs
jours. Les zones de précipitations subsynoptiques les plus grandes pouvant être contenues dans
une zone synoptique sont appeléesLMSA (Large MesoScaleArea). Dans les pluies cycloniques,
les LMSA apparaissent souvent comme des bandes allongéeset ont ainsi été désignéesquelquefois
par le terme de "bande". Les LMSA, dont I'extension varie de 103 à 104km2, se construisent et se
Introduction

dissipent à I'intérieur d'une zone synoptique. Leur temps de vie est de l'ordre de quelquesheures,
et leur nombre à I'intérieur d'une zone synoptique varie de un à six. L'intensité des précipitations
à I'intérieur d'un LMSA est toujours plus élevéeque celle de la région qui l'entoure.

Chaque LMSA contient des régions identifiables de pluie convective de type cumulus, com-
munément appeléescellules "convectives".Les cellulesconvectives,dont la taille varie de 10 à 30
km2 selon le type de pluie, se construisent et se dissipent à I'intérieur d'un LMSA et apparaissent
généralement en cluster. La durée de vie d'une cellule est de I'ordre de quelques minutes à en-
viron une demi-heure. Ces cellules suivent le mouvement relatif du LMSA et I'intensité de pluie
à l'intérieur d'une cellule est toujours plus élevéeque celle de Ia région qui la domine. Certaines
observations montrent de plus la possibilité que les amas de cellules ne soient pas la seule sous-
région pouvant contenir des cellules. Ces observationssur certaines pluies indiquent I'occurrence
de SMSA (Smalt MesoScale Area), variant en taille de 102 à 103 km2, à I'intérieur d'un LMSA.
Chaque SMSA contient à son tour des cellulespluvieuses.Les SMSA se construisentet se dissipent
à l'intérieur d'un LMSA avec une durée de vie de quelquesheures.

Cette description met en évidence une structure hiérarchique dans la formation des précipita-
tions. Le Tableau 1.1 résume les différents élémentsque l'on peut retrouver.

Tae. 1.1- Résumé de la structure des pluies : aires de pluie avec leur extension et leur durée
classique
Elément de plui,e Ertens'ion spati,ale[km2] Durée class'ique
Cellulepluvieuse 10-30 jusqu'à 30 minutes
SMSA 102- 103 quelques heures
LMSA 103- 104 plusieurs heures
Zonesynoptique > 104 jusqu'à plusieursjours

Les processusstochastiquesponctuels s'avèrent être très utiles pour reproduire la variabilité


de la pluie à plusieurs niveaux d'agrégation (horaire, journalier). Un modèle stochastique de pluie
en un point de I'espacedécrit le comportement temporel des précipitations liquides. Deux modèles
à pulsations rectangulaires bien connus ont été intensivement utilisés à cette fin : les modèles de
Bartlett-Lewis et de Neyman-Scott. De nombreusesapplications ont déjà illustré I'efficacité de tels
modèlespour l'analyse de donnéescollectéesà un pas de temps court, c'est-à-direhoraire (voir par
exemple Rodriguez-Iturbe et al., I987a; Cowpertwait et al., 1996; Onof et a1.,2000). Dans cette
thèse, nous nous concentronsprincipalement sur le modèle de Neyman-Scott (Neyman-ScottRec-
tangular Pulse Model ou I.{SRPM). Pour obtenir une revue détaillée des développements avec ce
type de modèles de pluie et une discussion des performances des différentes approches, le lecteur
se référera à I'article de Onof et al. (2000\.

Afin de calculer facilement les moments théoriques de I'intensité de pluie (moyenne, variance,
autocovariance),la plupart des modèles supposent une relation d'indépendanceentre I'intensité
et la durée des cellules de pluie. Cette hypothèseest questionnablepour plusieurs raisons. D'une
part, le modèle serait plus souple sans cette condition et donc pourrait s'adapter plus facilement à
la représentationde la structure temporelle de la pluie. D'autre part, la dépendanceentre la durée
des averseset leur intensité est souvent significativement négative (De Michele & Salvadori, 2003).
Kim & Kawas (2006) remettent cette hypothèse d'indépendanceen question et citent quelques
développements(voir C6rdova & Rodriguez-Iturbe, 1985;Singh & Singh, 1991;Bacchi et a|.,7994;
Kurothe et al., 7997; Goel et a1.,2000) où les cellules de pluie, comportant une corrélation dans
leurs caractéristiques,arrivent selonun processusde Poissonsimple (c'est-à-diresansamas). Les au-
teurs citent quelquesdistributions exponentiellesbivariées [Gumbel type I (Gumbel, 1960), Down-
ton (Downton, 1970)] qui sont utilisées pour modéliser des corrélations négatives et positives entre
la durée et I'intensité pluvieuse. Cependant, ces représentations ne considèrent pas de cluster et
apparaissent limitées. Sans la superposition de cellules, Ie modèle de Poisson est incapable de
représenterplus d'une échelle de temps (Rodrfguez-Iturbe et al., lg97b). Kim & Kavvas (2006)
développent un NSRPM qui considère des corrélations positives et négatives avec une distribution
bivariée de Gumbel type-Il. Kakou (1997) inclut une dépendancedans la moyenne de I'intensité
des cellules conditionnellement à leur durée. Les moments du premier et second ordres sont calculés
et Ies proportions de périodes sèchessemblent être adéquatement reproduites à toutes les échelles
temporelles (voir Onof et a|.,2000). Dans notre cas, une copule cubique fait le lien entre I'intensité
et la durée des cellules. Ce modèle de dépendance flexible inclut comme cas particulier la distri
bution de Gumbel type-Il. Cette dernière est en fait composéede lois marginalesexponentielleset
d'une structure de dépendance modélisée par la famille de copules de Farlie-Gumbel-Morgenstern
(ou FGM) discutée par Morgenstern (1956), Gumbel (1958) et Farlie (1960). L'utilisation des
copules cubiques est d'ailleurs novatrice considérant les rares applications avec cette classe de co-
pules. Nous développons donc un NSRPM plus général et nous calculons les moments du premier,
deuxième et troisième ordres ce qui nous permet de calibrer Ie modèle avec la méthode généralisée
des moments.

Un deuxième apport de cette thèse aborde la question de la non-stationnarité de la pluie dans


le temps. En nous questionnant sur la viabilité de I'hypothèse de stationnarité dans Ies modèles
de Poisson avec cluster dans un contexte de changement climatique, nous proposons de nouveaux
développements permettant de prendre en compte une augmentation de la fréquence des averses
dans le futur.

La thèse est organisée de la façon suivante. Le chapitre 2 présente succinctement la théorie des
processusponctuels, nécessaireà la compréhensiondu modèle de Neyman-Scott. Le NSRPM est
ensuite présenté en détails dans le chapitre 3, dans sa version de base. Le chapitre 4 expose les
éléments essentielsde la théorie des copules et présente plus particulièrement la classedes copules
cubiques. Dans le chapitre 5, nous montrons pourquoi il n'est pas possible de mesurer la dépendance
entre la durée et I'intensité des cellules à partir des donnéesde pluie. Le développement du modèle
Introduction

et le calcul des moments du NRSPM avec dépendanceintra-cellules est ensuite présenté au chapitre
6. La problématique de I'estimation des paramètres du modèle est abordée au chapitre 7. Ce modèIe
est ensuite appliqué sur de nombreusesséries de pluie au Canada, u.r" États-Unis d'Amérique, en
Suisse,en Fbanceet en Belgique et une analyse des performances des différents modèIes considérés
est synthétisée au chapitre B. Le chapitre 9 présente de nouveaux développementsdu NSRPM afin
de prendre en compte une non-stationnarité de Ia pluie dans le temps. Le chapitre 10 conclut et
donne quelques pistes de travaux à réaliser.
Chapitre 2

Théorie de base des processus ponctuels

Dans ce chapitre nous exposons la théorie de base des processus ponctuels, en nous concen-
trant uniquement sur les notions nécessairespour comprendre le modèle de Neyman-Scott. Les
processus ponctuels sont des processus stochastiques particuliers dont les réalisations consistent
en des événements ponctuels dans le temps ou dans I'espace. Ils sont utilisés dans de nombreux
domainesd'applications. Les déûnitions, formules et notations utiliséesdans ce chapitre sont tirées
de Cox & Isham (1980).

2.L Le processus de comptage

Un processusponctuel est un modèle de points distribués aléatoirementdans un espaceE. Les


points peuvent représenterI'occurrenced'un événementdans le temps, la position d'objets ou des
éléments d'un espace de fonctions. En pratique, il est souvent intéressant de compter le nombre
de points dans des sous-espaces de E sur lequel le processusponctuel est défini. Un processus
de comptage est introduit dans ce but et peut être associéà tous les processusponctuels. Soit
une réalisation, notée T,d'un processusponctuel alêatoiresur E.7 est un ensembledénombrable
de points sur E. Cela signifie que 7 peut être énuméré de la façon suivante : T : {fi,12,. . .}, où
chaquefi dénote la coordonnéed'un point dans E. Soit A un sous-espace de E, et notons N(4, ?)
le nombre de points dans ? qui appartiennent à A. Formellement :

N(A,T): t n.q1), (2.1)


i
Théorie de base des processus ponctuels

où chaque ti est la coordonnéed'un point dans ? et na(t) dénote la fonction indicatrice de A définie
mathématiquement par :

(t si tcA
lIn(t) : { (2.2)
|.0 si tç4.

Quand N(A,I:) est considéré comme une fonction de A et 7, il définit un processusaléatoire


entier positif sur E, appelé processusde comptage. Afin de simplifier la notation? nous supprimons
la dépendancede N(A,T) sur 7 et désignonsle nombre de points situés dans .4 simplement par
1/(A).

2.2 Le processus de Poisson

Le processus ponctuel le plus connu et le plus utilisé est sans aucun doute le processus de
Poisson. De plus, il est l'élément de base du modèle de Neyman-Scott. La présentesection s'at-
tache à décrire les principales propriétés du processusde Poisson simple, c'est-à-dire où le taux
À est constant. Dans ce cas) le processusde Poisson est dit stationnaire ou homogène. Nous
supposonsici que E : lR. Cox & Isham (1980) définissentle processusde Poissonde trois manières
équivalentes décrites dans les sous-sectionssuivantes.

2.2.L L'intensité

L'expressiondes positions de tous les points dans I'intervalle ] - oo, rl est appeléeI'histoire du
processus au temps f et sera notée '171.Soit l/(a, b) la variable aléatoire désignant le nombre de
points dans I'intervalle ]a,b]. Le processusde Poisson de taux À est défini complètement par les
deux propriétés suivantes qui s'appliquent pour tout t lorsque ô - 0+ :

Pr{l/(,,, + ô) : 1l'l7t}: Àô+ o(ô), (2.3)


Pr{l/(t,l + ô) > Il'Hr} : sç51, (2.4)

où o(ô) désigneune fonction petit ordre de ô, c'est-à-dire qui tend vers 0 plus rapidement que ô.
Une fonction /(ô) est o(ô) ,i : 0. Par exemple,la fonction ô2 est petit ordre de ô tandis
lr$ #
que la fonction 6r/2 ne I'est pas. |{ous déduisons directement des deux propriétés précédentes la
relation suivante :

: 1 - Àô+ o(ô).
Pr{N(t, t + ô) : 0111t} (2.5)
2.2 Le processus de Poisson

IJne propriété principale résultant des équations 2.3 à 2.5 est que les probabilités définies ne
'17t.
dépendent pas de I'historique Cela signifie que la probabilité de trouver un point dans ]t, t + ô[
ne dépend pas du nombre de points qui apparaissent juste avant t. Notons aussi que I'expression
(2.4) exclut le cas d'apparition de plus d'un point en même temps. L'occurrence simultanée de
plusieurs points est une généralisationpossibledu processusde Poisson.

2.2.2 La distribution des intervalles

Considéronsles points 0 < Tr 1T2 I . . . qui définissentun processusde Poisson homogène


de taux À. Alors les variablesaléatoiresXi, 'i:2...n qui décriventI'intervalle Ti-Ti-1sont
indépendanteset distribuées de façon exponentielle.Leur densité de probabilité s'écrit f x@) :
À exp(-Àr) pour r ) 0. Dans ce caségalement,une généralisationpossibledu processusde Poisson
est d'associerune distribution différenteque l'exponentielleaux intervalles4 -T;t.Ces processus
sont appelésprocessus de renouvellement.

2.2.3 Le processus de comptage

Considérons le nombre d'événements ly'(a6,b;) du processusdont I'occurrence se situe dans


l'intervalle lon,bnl àvêc ai < bi < o;a1, alors le processus de Poisson est complètement défini par
l'équation :

b,): r,,i : r,.. . ,k}: fI {fgîff


Pr{N(ai, - o,)}.
exp{-À(ô;
i:l

De cette relation peuvent se déduire plusieurs propriétés importantes des processusde Poisson :

1. Le nombre de points dans chaque intervalle frnilai,b;l possèdeune distribution de Poisson.

2. Le nombre d'événements qui surviennent dans des intervalles de temps disjoints sont
indépendants. Un processusstochastique est à accroissements indépendants lorsqu'il
satisfait cette condition ;

Soient deux nombres réels positifs t et h. Si le nombre l/(f , t + h) d'événementsqui se produisent


pendant I'intervalle de temps )t,t+fl ne dépend pas de la valeur de I mais seulementde la longueur
de I'intervalle h, Ie processusstochastiqueN est dit stationnaire.
10 Théorie de base des processus ponctuels

2.3 Espérance, variance et covariance

Dans cette section nous présentons quelques éléments de calcul des propriétés statistiques du
processusde comptage. Considéronsles deux premiers moments du processusde comptage dans
des ensemblesarbitraires A eL B :
E {N(A)}, var {.nr(a)}et Cov{n(a), N(B)}.
Pour des processusstationnaires à taux finis et fixes À, nous déduisons directement que :

tr {N(A)}: ÀlAl,
où lAl désignela mesurede Lebesguede l'ensembleA. Considéronsla covariancepour des processus
de comptage de deux ensemblesdisjoints A eL B, nous avons :

zco v{N (.4 ),N (B) }: var { n( au B) } - var { r /( A) } - var { N( B) } ( 2.6)


Le problème revient alors à résoudre Ie calcul des variances. Pour le calcul de la variance, il est
utile de réécrire l/(t) comme la limite de la somme de comptages à travers une partition de [0, t]
en de petits intervalles :

N ( o , r:) [ ' a u 1 r 1 ,
Jo
où d.n{(z)désigneplus simplementlim N(z,z-.-,6).D'aprèsla relation (2.2), dN(z) vaut 1 s'il existe
un point en z et 0 sinon. En appliquant la relation (2.6) à la variance d'une somme de variables
aléatoires,cela conduit à :

var{,n/(0,
t)}: I var{d,n/(z)}
*2 [[, ,, cov{dN(z)
,d,N(z*r)},
Jo J J31i"2t
_"
où I'intégrale est ici considéréecomme la limite d'une somme. Nous en déduisons alors (voir
Cox & Isham, 1980,Eq. 2.25-2.26):

z + 6)) : E {N'(2,z + 6)}- f n 1lr1r,z + 6)}12


Var{rtr(2,
-
. t2
:Pr{l/(2, z+6)- 1} z+6)- 1}] +o(ô)
ler{,n'r12,
: Àô+ o(ô),
etpouru)0:

Cov {l/(2, z I 61),N (z + u, z I u + 62)}


: E -r - n
{l/(2, z 6)N(z t u, z t u tôr)} {uQ, z + 6))n{,nrr(z r u, z + u + 62)}
: Pr{N(2, z-16): N(zlu,z *u*ôr):1} - ^26162+o(ô1ô2).

Pour un processusstationnaire,Cov{l/(z,z ]- 6y),N(z *u,z * u+ 62)} dépend seulementde u


lorsque ù et 6z tendent vers 0 et est notée plus simplement c(u).La stationnarité implique que
c(-u) : c(u).La fonction c(') est appeléela densité de covariance.
2.4 Le processus de cluster 11

2.4 Le processus de cluster

Un processts de cluster est basé sur un processusponctuel caché l/o. Dans notre modèle de
pluie, ce processusponctuel caché (donc non-observé)représenteles instants de début des averses.
Ces points constituent alors des origines auxquelles sont attachés des sous-ensemblesde points. Ces
clusters forment des familles dénombrables de processusponctuels l(;y dont la superposition est
observé sur un même espacede réalisation (voir Figure 2.1). Dans notre cas, ces sous-ensembles
correspondent aux cellules pluvieuses (le concept de cellule sera développé Ionguement par la
suite). Ainsi, à chaque point primaire ou centre de cluster est associéle cluster de points secondaires
(membresdl cluster). Un processusde cluster se décrit d'une part par la connaissancedu processus
distribuant les centres des clusters et, d'autre part, par le mécanismesimulant les points à I'intérieur
des clusters. Des résultats similaires à ceux précédemment présentéspeuvent être obtenus pour les
processusde cluster. Par exemple, pour l'espérancedu processusde comptage, nous avons :

E {rtr(,A)}:
/u {n',,o,}{dNc(r)},
E

où l/s désigne le comptage relatif au processus des centres de cluster eL Nç1(A) représente Ie
nombre de points provenant d'tan cluster ayant son centre en l.

ProcessuscachéN.

Processusponctuel N..r,associéau
premier centre de cluster

Ftc. 2.1 - Composition d'un processusde cluster. Le processusdistribue d'abord des points "pa-
rents", puis un sous-ensemblede points est associéà chaqueparent.
L2 Théorie de base des processus ponctuels

Les propriétés de comptage du second-ordre du processusde Neyman-Scott peuvent être cal-


culéesà I'aide de la fonction de densité de covariancec(.). Pour ce processus,il suffit de considérer
deux cas correspondant à la position de deux points (ils peuvent appartenir au même cluster ott
non). La fonction c(.) s'écrit alors :

cl'u,l :
[ , l n 1 o ; q u a n du : 0 ,
<
- 1)]/i f@)f@ iu)dr quand u ) 0,
[,ln1l1l
où À est le taux du processusde Poisson gérant les centres de cluster, D dénote la variable aléatoire
du nombre de cellules par cluster et / représentela densité de probabilité de la distance des origines
des cellules au centre dt cluster.
Chapitre 3

Le modèle à cellules rectangulaires de


Neyman-Scott

Les processusd'amas de cellules(cluster) les plus utilisés sont baséssur Ie processusde Poisson.
Le plus simple d'entre eux est obtenu en associantune seulecellulede durée et d'intensité aléatoireà
chaquepoint d'un processusde Poisson.Un type plus sophistiquéde mécanismede cluster considère
chaque point du processusde Poisson comme point de référencepour un sous-ensemblede cellules.
Dans ce chapitre, nous présentons deux modèles de ce type souvent utilisés pour représenter Ia
pluie : le processus de Neyman-Scott et le processus de Bartlett-Lewis. Puisque dans cette
thèse nous nous concentrons principalement sur le modèle de Neyman-Scott, il est présenté plus
en détail.

3.1 Modèles ponctuels de Poisson

Les modèles de pluie présentésdans cette section utilisent la théorie des processusponctuels
de type cluster. Nous avons indiqué dans I'introduction (chapitre 1) que la structure hiérarchique
des champs de précipitations pouvait motiver I'utilisation de ce type de modèle. Comme l'in-
dique Kakou (1997), dans cesmodèlesles plus grands éléments,appelésaverses, sont générateurs
d'élémentsde plus petite échelle,appeléscellules pluvieuses. Il doit être mentionné à ce stade que
Ie concept de cellule pluvieuse n'est pas précis. Bien que nous le considéronscomme un dispositif
mathématique (plutôt qu'une entité physique) utile dans le mécanisme de cluster, il est préférable
que les paramètres qui le décrivent aient des interprétations physiques et prennent des valeurs
t4 Le modèle à cellules rectangulaires de Neyman-Scott

réalistes. En général, les valeurs que peuvent prendre les paramètres dépendent de la résolution
des données(c'est-à-direl'échelletemporelle ou spatiale utilisée) et du type de modèle. Il est alors
plutôt arbitraire et dangereux d'avoir des idées arrêtées sur les caractéristiques de ces cellules.

Neyman- Scott

Les {Xi} et {Yi} suivent classiquementune


loi exponentielle, sont indépendantset
identiquement distribués.

Bartlett- Lewis

Les {X,} et {Y,} suivent classiquementune


loi exponentielle et forment un processus
de renouvellement.

FIc. 3.1 Construction des modèlesà cellulesrectangulairesde Neyman-Scott et Bartlett-Lewis.


Les deux modèles diffèrent par le type de distribution des origines des cellules par rapport aux
origines des averses.

Kavvas & Delleur (1931) et Waymire & Gupta (1981a,b,c)sont les premiers à développer ce
type de modèle pour la pluie. Leurs travaux ont permis le développement de deux modèles :

1 . Le modèle le plus simple associesimplement une cellule à chaque point d'un processusde
Poisson. Cette cellule possède une intensité et une durée aléatoire. Rodrigtez-Itwbe et al.
(1987b) montrent cependant les limites d'un tel modèle où la probabilité que les événements
pluvieux se succèdent trop vite est forte.
2 . Kawas & Delleur (1981) considèrent un modèle de processusponctuel de type cluster, à
temps continu, où le premier niveau est le mécanismede création des pluies, par exemple
3.1- Modèles ponctuels de Poisson 15

les fronts pluvieux. Au second niveau sont générésles éléments du processusqui produisent
réellement la pluie, que I'on désigne par le nom de cellules pluvieuses. Les centres dt cluster
arrivent selon un processus de Poisson et chacun d'eux engendre un nombre aléatoire de
cellulespluvieuses.L'intervalle de temps entre I'origine de l'amas et sesmembresest distribué
exponentiellement. Ce modèle possèdeune structure de Neyman-Scott (Neyman & Scott,
1958) en temps et a été utilisé pour étudier des séquencesde pluies journalières.

Rodriguez-Iturbe ef al. (1987b) introduisent ensuite deux types de modèle utilisant les proces-
sus ponctuels de cluster pour étudier le comportement desprécipitations d'un point fixe de I'espace.
Dans les deux modèles, les origines des amas de cellules arrivent selon un processusde Poisson et
génèrent un nombre aléatoire de cellules pluvieuses, qui sont représentéespar des rectangles (durée
et intensité). IJne représentationgraphique de la structure temporelle de cesdeux types de modèles
est donnée à la Figure 3.1. Dans Ie premier, appelé le processusde Neyman-Scott, le nombre de
cellules par averse suit une distribution géométrique ou de Poisson. Les origines des cellules sont
indépendanteset identiquement distribuées (iid). Elles sont éloignéesde I'origine de I'averse se-
lon une loi exponentielle. Le second est nommé le modèle de Bartlett-Lewis. La différence avec le
précédent modèle est la distribution des origines des cellules qui forment un processusde Poisson
(c'est-à-dire que les intervalles entre chaque origine successivesuivent une loi exponentielle).

Le développement de ces modèles de pluie a été poursuivi par de nombreux auteurs, et diverses
variations des versionsde base (Rodriguez-Iturbe, 1986; Rodriguez-Iturbe et aL,1997a,b) ont été
considérées(dans la suite et tout au long de cette thèse, les versions de base des modèles de Neyman-
Scott (Neyman-Scott Rectangular Pulses Model, NSRPM) et de Bartlett-Lewis (Bartlett-Lewi,s
Rectangular Pulses Model, BLRPM) correspondront à celles décrites par Rodriguez-Iturbe et al.,
1987a).La surestimation systématiquede Ia probabilité de sécheresse, c'est-à-direla probabilité de
ne pas avoir de pluie pendant une période d'une durée quelconque, incite Rodriguez-Itvbe et al.
(1988) à modifier le modèle de Bartlett-Lewis en y ajoutant un paramètre. Le paramètre lié à
la durée des cellules est alors tiré d'une distribution gamma. Peu après, Entekhabi et al. (1989)
apportent une modification similaire au modèle de Neyman-Scott. Cowpertwait (1994) généralise
le modèle en permettant aux cellules d'être de différents types : abondante (heauy) ou Iégère
(light) selon leur nature convective ou stratiforme. La sous-estimation systématique des probabilités
d'avoir des périodes sans pluie conduit Cowpertwait et al. (1996) à introduire dans la procédure
d'estimation des paramètres du modèle les probabilités de transition entre les états sec et humide.

Plus récemment, il est important de souligner les nombreux développements qui ont été réalisés
dans le cadre des projets DEFRA (Department for Enuironment Food and Rural Affai,rs). La
plupart de ces développements sont formalisés dans des rapports internes (voir par exemple
Chandler & Onof, 2005) et s'intéressentaussi bien à I'aspect théorie qu'à I'application. Nous pou-
vons citer entre autres :
16 Le modèle à cellules rectangulaires de Neyman-Scott

la généralisation du modèle à n, types de cellules, comportant chacun 2 paramètres (intensité


et durée) ;

I'aléation (randomi,zati,on)ùt paramètre associéà la durée de la cellule avecune loi gamma;

le développementd'une procédure d'estimation des paramètresI

I'identifiabilité des paramètres;

le calcul d'intervalles de confiancedes paramètres estimés;

la validation du modèle sur les valeurs extrêmes.

Le modèle de Bartlett-Lewis à paramètre aléatoire (Random Parameter Bartlett-Lewi,sModel,


RPBLM) dans lequel le paramètre associéà la durée des cellules est distribuée selon une loi gamma
sembledonner des résultats particulièrement intéressant(Chandler & Onof, 2005) pour un nombre
de paramètresraisonnable (c'est-à-diresix paramètres dans le cas d'une distribution exponentielle
pour l'intensité des cellules). Nous notons cependant que le calcul des propriétés statistiques de
cette généralisationdu BLRPM n'est pas direct puisqu'il n'existe pas d'expressionanalytique des
moments (Onof, 2003). Par conséquent,nous n'avons pas adapté cette variation à la structure du
Neyman-Scott. Ce modèle n'a donc pas été étudié dans cette thèse.

La différence de performance entre les modèles de Neyman-Scott et de Bartlett-Lewis n'est


pas évidente et dépend des applications considérées.Kakou (1997) considèreque les comparaisons
entre les deux types de modèles n'ont pas démontré une différence significative, et le choix entre les
deux reste plutôt arbitraire. Cette remarque est confirméepar Chandler & Onof (2005). De plus,
des arguments théoriques sont fournis par Cowpertwait (1998) pour démontrer leur similarité.
Il montre en effet que les versions de base des deux modèles ont des propriétés du premier et
second ordres équivalentes.Chandler & Onof (2005) recommandent I'application de la structure
de Bartlett-Lewis car I'expression de }a probabilité de période sans pluie est disponible seulement
pour le BLRPM alors que ce calcul requiert des intégrations numériques pour le NSRPM.

Dans notre cas, nous privilégions le modèle de Neyman-Scott afin d'éviter de multiplier le
nombre de modèles à comparer par deux, puisque les généralisations peuvent souvent être intro-
duites dans les deux processus.De plus, une méthode d'estimation des paramètres développéepar
Favre et al. (200ab) est seulementdisponible pour la version de base du NSRPM. Enfin, les argu-
ments fournis par Chandler & Onof (2005) en faveur du BLRPM, à savoir le problème du temps
de calcul de la proportion de périodes sans pluie (qui doit être évalué numériquement dans le cas
du NSRPM), ne semblent pas pertinents dans notre cas. Par exemple, l'évaluation du moment du
troisième ordre avec les modèles développés (voir chapitre 6) est beaucoup plus exigeant en res-
sourcesinformatiques. Le temps de calcul lié à l'évaluation numérique des proportions de périodes
sans pluie est donc très inférieur au temps de calcul du moment du troisième ordre, en raison de
la taille de son expression,et ne nous a pas limité dans I'application du modèle de Neyman-Scott.
3.2 Définition et propriétés du modèle de Neyman-Scott de base 17

La suite de cette partie présente le processusponctuel de Neyman-Scott dans sa version de


base.

3.2 Définition et propriétés du modèle de Neyman-Scott


de base

Les mêmesnotations que Rodriguez-Iturbe et al. (I987b) sont utilisées,à I'exception du nombre
de cellules que nous désignons par D pour éviter toute confusion avec la copule que nous noterons
C par la suite. Supposonsque les temps d'arrivées des origines d'aversessuivent un processusde
Poisson de taux À. Un nombre aléatoire D de cellules est associé à chaque origine d'averse. Les
origines de cellules sont séparéesindépendamment de I'origine de I'averse selon une distance qui
suit une loi exponentielle de paramètre B. Une pulsation rectangulaire est associéeavec chaque
origine de cellule, représentant Ia cellule pluvieuse. Une représentation graphique d'une réalisation
possiblede ce modèle est donnéeà la Figure 3.2. L'intensité de la cellule est désignéepar la variable
aléatoire X et la durée de la cellule par L. L'intensité totale instantanée au temps t,Y(t), est la
somme de toutes les intensités de cellules actives au temps t. Soit Xt-"(u) une variable aléatoire
qui représente l'intensité de pluie au temps t engendréepar la cellule débutant au temps t - z, alors
Y(t) : [f,.oXr_,"(u)dl/(, - u) où dN(, - z) est un booléen indiquant la présenced'une origine
de cellule àt-u (voir équation 2.1). Quand I'intensité et ladurée des cellulessont deuxvariables
indépendantes,X1-u(u) est définie par :

avecune probabilité 7 - fu(u) : e-ru'


-u\*, : { :
Xt-ufu) (3.1)
0 avecune probabilité F"(u) :1- e-ru,
[

où la durée des cellules est exponentiellement distribuée selon le paramètre 4.

Les propriétés du second ordre de I'intensité totale f(l) du NSRPM ont été calculéespar
Rodriguez-Iturbe et ol. (1987b). Généralement,les donnéesde pluie sont disponiblesà des échelles
de temps horaire ou journalière. Il est dans ce sens plus intéressant d'étudier certaines propriétés
du modèle, comme les expressionsdes différents moments, à ces échellesd'agrégation (par exemple
afin d'estimer les paramètres du modèle par la méthode des moments). Notons Yohla quantité
totale de pluie tombée dans le ième intervalle de temps de longueur h, de telle façon que :

Y!' :
l:"^Y(t)dt.
Donc, si â est mesuré en heures, {Y! : l,: L,2,...} représententune série temporelle de pluie à un
niveau d'agrégation de h heures. Les propriétés du premier et second ordre sont exprimées par les
18 Le modèle à cellules rectangulaires de Neyman-Scott

relations suivantes :

E{VN} ^Àl-tol"*
It- (3.2)
r
n
À ( n h - L + e-{rr"E(x')."lY'p#g}
Yar{Y,h} :

-^(Bh - 1 , .ah,E(D' - D)p'*


) ^/^. - ô\ ) (3.3)
lr\lr' n')
et, pour k) 1,

:
À( 1- e- ' r r ' e-
) 2 r y( r - tl/' ? D) 12r 02
Cov{\h,Yo\o} { u,n( x2\/ *E(
' D2 ; 1
n3 ltu"\" 2(0,-n) )
-À(1 - s-anlze-P,.i-r)hn@.'l n)*i
: '. (3.4)
2B(P'-n')
où px désigneI'espérancede I'intensité des cellulesel pr,ytI'espérancedu nombre de cellules.II est
également possible d'obtenir I'expression du moment du troisième ordre (centré) qui est donné par
Cowpertwait (1998) pour le modèle de Neyman-Scott :

-
€n : El{Yh - E(y,n) }tl : 6À E(x3) p n (qh 2 + \h e-nn i2 e-nn\1r+
-t 3Àp, Ê(0' - rf)')
y E(x') E{D(D - t)} Th, 0,h)I {2rtn
+ ÀÊxE{D(D - g')ot- P)(2P
- 1)(D- 2)}g\t,P,h)l2rtnP(,r' + ù(P +2ù}, (3.5)
où lesfonctionsf (q,Ê,0,h) et g(q,Ê,d,à) s'exprimentcommesuit:

f (n,0,0,h) : - 2nu13'e-qh-2rf B2e-Ph+rf 0t e-2'1h+2na0


"-nh
12raB
"-an
-2rtnÊ e-ot+P)h
+ 2ntg, e-ot+B)h -grttÊth -f Llrf B3- 2nng
+ 2nt0' + 4qB5h+ 4rf ph - 7Bu- 4rf + 8Bss-nh-p5
"-2nh
- zhntgt e-qh-l2rf P3 e-'rh+2hrtBs rhrf e-ah,
"-nh

g (q,g, 0, h) :12rs 0 e- 9n+9rtn0' -l 72qBs e-'th+9n29n + r2qtBt e- ('t+B)h


- n'po -1213{Jse-Ph-gnuÊ - grtg' - 3r1Bs u-zqn
"-znh
- nnp' e-27h-r2rf Bz +6rf g2h - t\Barf h + 6B5q2h
"-nh
- t\B3rf h -f 4B6nh- lÊ'rto e-?h+4/rluh + tzBsrf
- 80nrt'e-nh-6rf - 6pu- 2qe -2Ba
"-zBn "-zqn
s-Pn18B6s-nn-30rf e-2ln.
I 8176

Pour l'instant,aucunchoixn'a étéfait pour la distributionde D et X. Lescandidatsclassiques


pour le nombre de cellulesassociéà chaqueaversesont la loi géométriqueet la Ioi de Poisson.
Lesrésultatssont directsdanslesdeux cas.Velgheet al. (7994)indiquentcependantune meilleure
performanceavecla loi géométrique.Pour cette raison,nousallonsprivilégiercette loi dansla suite
3.2 Définition et propriétés du modèle de Neyman-Scott de base L9

de la recherche. II est à noter qu'un changement de distribution est très facile à implémenter (par
exemple si la distribution de Poisson est considérée),principalement à cause de I'indépendance
des propriétés du processusponctuel et des cellules. Cependant, puisque la comparaisonentre la
distribution de Poisson et Ia distribution géométrique multiplie le nombre de modèles possibles
par deux et que, selon notre expérience, la différence de performance n'est pas importante, nous
n'avons pas inclus cette variation dans ces travaux.

La probabilité qu'un intervalle de temps de durée quelconque ne comporte pas de pluie (dry
probabi,li,ty)peut se révéler très utile dans la calibration des modèles. Quand la loi suivie pour
la génération du nombre de cellules est une loi géométrique, Cowpertwait (1994) exprime cette
probabilité de la manièresuivante:

P D(h): exp(-Àà) exp(-pn)G - rrù + p|}


{ ""p[- ^I,*{r - p(n)}ar], (3.6)


(n _ p) _ 11e-?t
e-P(t+h) +B e-,tt+rl _ 0
Pt(h) :
0'o - t){e - B(t + h)(P- q) + r e-et- Ue -qt} + q - 0'
L'intégrale /.*{t - p5(h)}dt dans l'expression (3.6) peut ensuite être approchée en utilisant un
développement de Taylor d" ,*r. Cette approximation paraît satisfaisante à une échelle horaire
mais pour des échellesde temps supérieures,il est préférable d'utiliser une méthode numérique
d'intégration.

En incluant une dépendanceentre les variables constituantes des cellules de pluie, les expressions
des moments du premier et second ordres ne sont plus valables (excepté la probabilité de périodes
sanspluie). Le chapitre 6 décrit comment il est possibled'inclure une dépendanceentre la durée et
I'intensité des cellules dans Ie modèle de Neyman-Scott. Nous calculons les nouvelles expressions
des moments, pour quelques familles de fonctions multivariées. Le chapitre suivant présente la
théorie associéeaux copules, les copules étant les distributions qui modélisent la dépendance.
20 Le modèle à cellules rectangulaires de Neyman-Scott

Temps

d1 = 4 cellules d2 = 3 cellules
[_] f--]
ll

o,

b4 b1 b3 b2 Temps

e.-_--_-. _____LemPS
_3
Êt

Intensité

Intensité
totale

Frc. 3.2 - Réalisation possible du modèle à pulsations rectangulaires.La procédure produit en


premier les origines des averses,puis les caractéristiquesliées aux cellules pluvieuses,c'est-à-dire
leur nombre (dù,leur position (bz),Ieur durée (ei) et leur intensité (16).
Chapitre 4

La modélisation de la dépendance avec


les copules

Les copules constituent un outil mathématique très flexible servant à modéliser la dépendance
entre plusieurs variables aléatoires. En finance, elles peuvent être appliquées à la gestion des por-
tefeuilles d'actions, I'estimation des mesures de risques (par exemple la Valeur à Risque VaR
ors Value at Ri,sk), I'agrégation du risque, les modèles de crédit (voir Embrechts el al., 2002;
Cherubini et aI., 2004). Nous pouvons également relever de nombreuses applications dans les
sciencesactuarielles(Frees& Valdez, 1998).Récemment,les copulesont fait leur apparition en hy-
drologie(voirparexempleDe Michele & Salvadori,2003;Favreef a\.,2004a;Grimaldi & Serinaldi,
2006; Genest & Favre, 2007; Renard & Lang, 2007). La représentationpar copule possèdeI'avan-
tage de séparer la structure de dépendance du comportement des marges. Pour une revue détaillée
de la théorie des copules, le lecteur pourra consulter les monographies de Joe (1997) et Nelsen
(2006).

Il est à noter qu'il n'existe pas de consensusconcernant le fait que les copules constituent la
solution optimale au problème de la modélisation de la dépendance,comme I'a récemment illustré
la discussionanimée entre plusieurs des spécialistesdes copules. L'origine de ces échangesest un
papier de Mikosch (2006) qui critique l'omniprésenceet I'utilisation "aveugle" des copulesdans la
littérature récente, comme si cesderniers fournissaient une solution à tous les problèmes impliquant
une dépendance entre plusieurs variables aléatoires. Néanmoins, de nombreux auteurs (voir par
exemple Genest & Rémillard, 2006; Joe, 2006; Embrechts, 2006) ont défendu I'importance des
travaux sur les copules. Ils ne cautionnent pas pour autant un effet de mode certainement présent.

Dans notre cas, I'idée d'appliquer des copulespolynomiales est motivée par le besoin d'obtenir
22 La modélisation de Ia dépendance avec les copules

des expressionsalgébriques pour les moments théoriques. En effet, en raison de la difficulté à obte-
nir une fonction de vraisemblanceappropriée (voir par exemple Chandler & Onof, 2005, p.11), la
méthode généraliséedes moments est la façon la plus simple d'estimer les paramètresdu NSRPM.
Les moments théoriques (espérance,variance,etc.) s'exprimant à l'aide des paramètresdu modèle,
cette méthode consiste à trouver le vecteur de paramètres pour Iequel les moments échantillonnaux
sont le plus proche possible des moments théoriques. Cependant, les différentes étapes à franchir
afin de calculer les moments limitent le choix des distributions bivariées possibles pour décrire la
structure de dépendanceentre la durée et I'intensité des cellules.Elles doivent permettre d'obtenir
à la fois une structure de dépendance souple (en permettant par exemple de reproduire des degrés
de dépendance positifs et négatifs élevés) et des expressions algébriques explicites pour les mo-
ments (c'est-à-diredirectement expriméesen fonction des paramètres du modèle). Des techniques
de développements limités ou d'approximations numériques des intégrales dans I'espace multidi-
mensionnel peuvent être difficilement envisagéesdans notre cas puisqu'elles seraient préjudiciables
à la calibration du modèle. Il semble en effet très délicat de supposer que les pertes liées à ces
approximations soient négligeables.

Classiquement, les auteurs utilisent des familles exponentielles pour décrire les distributions des
différentes variables aléatoires (voir Chapitre 3), par exemple la loi exponentielle et la distribution
gamma. De nombreuses distributions bivariées avec des lois marginales appartenant à la famille
exponentiellesont disponiblesdans la littérature (voir Hutchinson & Lai, 1990).Nous avonsessayé
de calculer les moments avec un grand nombre de ces distributions bivariées. Nous citerons entre
autre les essais réalisés avec les distributions bivariées exponentielles de Gumbel (1960) Type-
I, de Downton (1970), de Hougaard (1986) et de Cowan (1987) ou avec la distribution bivariée
Beta inversée (Lee, i9B1). Les expressionsà résoudre apparaissent rapidement très difficiles à
manipuler (somme de lois hypergéométriquespar exemple). Une alternative consisteà construire
des distributions bivariées à l'aide de la théorie des copules. Cependant, la plupart des familles
de copules (la classe des copules archimédiennes par exemple) sont construites par composition
de fonction logarithme ou exponentielle. La manipulation de telles fonctions dans les expressions
à évaluer représente alors un défi considérable. Par conséquent, nous avons étudié la possibilité
d'utiliser des produits de lois exponentiellescomme distribution bivariée de I'intensité et de la
durée des cellules,c'est-à-diredes margesexponentiellesliées par une copule cubique. Ce chapitre
présente la théorie de base sur les copules et met I'emphase sur les copules polynomiales.
4.1 Généralités sur les copules 23

4.L Généralités sur les copules

4.L.L Définitions

Définition L. Une copule C en di,mensi,ond est une foncti,on de di,stribution mult'iuariée qui,
uérifie:
- C : --+
[0,1]d [0,1].
- C est bornée (grounded), c'est-à-di,reque

: 0)
C(ur,...r1ti-r,0r'ltiat,...,ua V u t , . . . r r l i . - t , ' t t r i + 1 t . . . ,eut6V i , . (4.1)

C est d,-croissante, c'est-à-d'irequele C-uolume (différence4u[ième ordre deC) estposi,ti,f


pour tous les paués del0,1ld. Pour les copulesbiuariées,cette condi,t'ions'écrit :

C(u2,u2)-f C(u1,u) ) C(u1,uz)I C(uz,u1)pour tous 0 I u1 4 uz 3 I et 0 <. u1 I u2 3 L.


(4.2)

- C a des marges unifor-mes, c'est-à-di,reque ses dzstributi,onsmargi,nalesCi sont telles


que :

, ): u V z e [ 0 , 1 ] .
C 6 ( u:) C ( 7 , . . . , r , u , 1 , . . . 7 (4.3)

Il se déduit de cette définition que si Ft,..., Fa sont des fonctions de distribution (univariées),
alors C{f'r(rt),...,Fa(ra)} est une fonction de distribution multivariée avec les lois marginales
Fr,..., Fa (puisque Fi(r1) est distribuée selon une loi uniforme). Il est alors facile de comprendre
pourquoi les copules sont très utiles pour la construction et la simulation de distributions multi-
variées. Le théorème suivant est le plus important de la théorie des copules. Il est connu sous le
nom de théorème de Sklar (1959) et est très utilisé en pratique.

Théorème 1-. Théorème de Sklar : Soi,t F une lo'i de probabi,li,téen di,mens'iond,, auec des distri-
butions marg'inalesFt, . . . , Fa. Alors F possèdela représentati,onsu'iuante:

F("r,. .., ra) : C {F{rt),. . ., Fa(ra)}. (4.4)

De plus, la copuleC est unique si,les n'Larges


sont cont'inues.

Le théorème de Sklar illustre le fait que, dans le cas des distributions multivariées continues,
il est possible de séparer les distributions marginales et la structure de dépendance multivariée.
D'ailleurs, le corollaire suivant découledu théorème 1.
24 La modélisation de la dépendance avec les copules

Corollaire L. Soi,t F une loi, de probabi,li,téen di.mensi,ond, auec des di,stribut'ionsmarg'inales


cont'inuesFr,...,F6 et so'itC la copule correspondante(la relat'ion l./, est donc uérifiée). Alors,
p o u r t o u t ' u , l t. . , u 4 d a n s[ 0 ,1 ] d ;

C ( r r , . . . , u a ) : F { F ; r ( u r ) ,. . . , F o t @ o ) } ,

où F;r dénote I'inaerse générali,sée


d,eF6.

4.L.2 Propriétés

Dans la suite de ce chapitre, nous limitons l'exposé au cas bidimensionnel (d: Z).

Expression de la densité bidimensionnelle

Si ta distribution bivariée est absolument continue, alors elle admet une densité / qui peut
s'exprimer par :

f (q,rz) : c{fi(r1), Fr(rr)} x ft(rr) x fz(rz), (4.5)

avecc(u,'u) Ia densité de la copule C. Notons que la condition 2-croissanteest alors équivalenteà


Ia positivité de la densité c(u,u):O?,C(u,u) ) 0lorsque celle-ciexiste. À partir de la relation
(4.5), nous pouvons calculer I'expressionde la densité de la copule :

T{Frt(u), F;t(r)}
c ( u , u ):
T'{Fr' (")} x fr{F;t (u)}'

Ordre stochastique de concordance

La définition 2 permet d'introduire un ordre partiel sur Ies copules.

Définition 2. (relation d'ordre) Sozent Cr et Cz deur copules.Cr est d;ite plus peti,te que C2
(C, < C2) si,et seulementsi,C1(u,u) 1C2(u,u) pour tout (u,u) e [0,f]2.

L'ordre i est appelé ordre de concordance.Cette relation d'ordre est dite partielle parce que
Ies copules ne peuvent pas toutes se comparer entre elles. Considérons maintenant une famille de
copules paramétriques C(u,u;0), avecd un paramètre. Pour simplifier la notation) nous écrivons
4.2 Mesures de dépendance 25

C6(u,u): C(u,u;O).La famille de copulesCe est dite totalement ordonnéesi pour torft 01102,
elle vérifie :

Cs, 4 Cs" (la famille est positivement ordonnée),


C6, I C6" (la famille est négativement ordonnée).

Symétrie

Définition 3. (symétrie) Une copuleC est sgmétri,que si,C(u,u) : C(u,u) pour tout (u,u) dans
10,71'.

4.2 Mesures de dépendance

Les paramètres des familles de copules sont étroitement liés à la notion de degré de dépendance.
IJn indice souvent utilisé pour mesurer la dépendance est le rho de Pearson (dénoté r' dans ce
chapitre). Cependant, ce choix d'indicateur de la dépendancen'est viable que dans Ie cas où la
dépendanceest de type gaussienne.La suite de cette sectionest issuede I'article de Genest & Favre
(2007) et explique pourquoi il est en règle générale préférable de choisir des indicateurs non-
paramétriques pour mesurer Ia dépendance.

4.2.1 Le rho de Spearman

Imitant I'approche usuelle de Pearson pour la mesure de la dépendance, une idée intuitive est
de calculer la corrélation entre les paires (&, S,) de rangs. Cela conduit au rho de Spearman appelé
aussi corrélation des rangs puisqu'il se calcule comme :

Di:,(n-Â)(s,-s)€ [ - 1 ; 1 ] ,
Di:r@o- R)2(Si- S)2
ou
1ft1n

R::IA :;DS,: S
Z: I Z:L

Ce coefficient, qui peut être déduit de façon plus pratique par :

t2 \ ^ ^ ^ni7
Pn: .f Risi- s11- I] e [ - 1 ; 1 ] ,
n(n * 1)(" - r ) - n-L
26 La modélisation de la dépendance avec les copules

partage avecIe coefficientde corrélation de Pearsonclassique,rn,lâ propriété que son espérancede-


vient nulle quand les variables sont indépendantes. Cependaît, pn est fondamentalement supérieur
à r, pour les raisons suivantes :

E(p,) : t1 si et seulementsi X et Y sont foncti,onnellementdépendantes,c'est-à-direquand


la copule associéeest I'une des deux bornes de F}échet-Hoeffding, C- ott C+ (voir sous-section
4.3.1).

À l'irlerse, E(r,) : t1 si et seulementsi X et Y sont des fonctions li,néai,resde l'autre, ce


qui est beaucoup plus restrictif.

p, estime le paramètre d'une population qui est toujours bien défini, alors qu'il existe des
distributions à queues lourdes (celle de Cauchy par exemple) pour lesquelles une valeur
théorique de la corrélation de Pearsonn'existe pas.

pn est un estimateur asymptotiquement sans biais de :

p: 3:
u uC( u,u) dC( u,u) - n I 3.
C( u,u) clur lu-
" Ir,u, J [0,1]2

4.2.2 Le tau de Kendall

Une secondemesurenon paramétrique de dépendancetrès connue)elle aussibaséesur les rangs,


est le tau de Kendall. Sa version empirique est donnée par :

4
-' " : _ P n - Q " :_ o - 1L t
G) n@Jrn

où P" et Qn sont le nombre de paires concordantes et discordantes, respectivement. Deux paires


(Xo,Y),(Xi,Y7) sont dites concordantesquand (Xu- Xi)(U-Yi) > 0, elles sont discordantes
autrement. La notion de paires concordanteset discordantesest illustré par la Figure 4.1.

Il est évident que rn est une fonction des rangs des observations,puisque (X.i- Xi)(V-Y) > O
si et seulement si (& - R)(Sn - S;) > 0. r,, est un estimateur asymptotiquement sans biais de
I'expression théorique du tau de Kendall, donnée pa,r

' :4 - 7'
|r o,r vc( u' u) dc( u' u)
4.3 Familles de copules 27

o o

o a

Frc. 4.1 - Deux paires d'observationsconcordantes(à gauche) et discordantes(à droite).

4.3 Familles de copules

4.3.I Copules de références

Ces copules interviennent dans les définitions des structures de dépendance et représentent en
quelque sorte I'intervalle de variation des copules en considérant une relation d'ordre.

Copule indépendance
La copule indépendances'exprime comme :

C'(u,u) : uu.

Cette copule est très importante puisqu'elle représentela structure de dépendancede deux variables
indépendantes. Si X et Y sont deux variables aléatoires indépendantes de fonctions de répartition
respectivesFl et F2,la fonction de répartition jointe est caractériséepar la copule Cr, nous avons
bien -F(X,Y) : C'{Fy(X),F2(Y)} : 4(X)F2(Y).

Les bornes de F!échet-Hoeffding


La copule C- désigne la borne inférieure de trYéchetet se calcule comme :

C- (',u) : max(u * u - 1,0)'

Elle caractérisedeux variablesaléatoiresX etY qui sont contre-monotones,c'est-à-direqu'il existe


une variable aléatoire Z telle que X : f(Z) etY : g(Z) avec/ une fonction non-croissanteet g
une fonction non-décroissante.

La copule C+ dénote la borne supérieure de FYéchetet s'écrit de la manière suivante :


^Lr
U' \u, u) : mln(u' U).
28 La modélisation de la dépendance avec les copules

Elle caractérisedeux variablesaléatoiresX etY qui sont co-monotones,c'est-à-direqu'il existe une


variable aléatoire Z telle que X : f(Z) etY : g(Z) avecf et g deux fonctions non-décroissantes.

L'inégalité des bornes de FÏéchet-Hoeffdingdans le cas des copuless'écrit :

C- (u,u) < C(u,u) < C+(u,u) pour toute copuleC,V(u,l;) e [0' 1]2.

Les copules C- et C+ constituent les bornes de I'intervalle de variation des copules puisqu'elles
modélisent les structures de dépendanceles plus fortes possibles (négativementet positivement).
Le rho de Spearman et le tau de Kendall associésà ces deux copules sont égaux à -1 dans Ie cas
de la copuleC- et 1 pour la copule C F.

4.3.2 Copules archimédiennes

Définition de la façon sui,-


4. Genest €! Maclcay (1956) défini,ssentune copule archi,médi,enne
uante :
o('u)} s1o(z)+ o(u)< o(0)'
c(u,u): { :-'{o(") +
U srnon,
I
auecQ une fonction de classeC2 (c'est-à-di,re cont'inue, dériuable et de dériuée cont'inue) qui,uérifi'e
o(1) : 0, o'(z) 10 et Q"(u) > 0 pour tout u € 10,1].

O(,u) est appelé le générateur (ou la fonction génératrice) de la copule. Il est à noter qu'il
n'est pas nécessaireque ô soit une fonction de classeC2 partout sur [0,1] pour que C respecte
Ies conditions 4.1 à 4.3, voir contre-exemple4.5 dans Nelsen (2006). Cependant, la majorité des
copules archimédiennes utilisées en pratique ont une fonction génératrice de classeC2, à I'exemple
de la famille de Frank appliquée dans le chapitre 5.

Les copules archimédiennes présentent un grand intérêt, car elles sont très maniables pour les
calculs. Avec cette classede copules,I'estimation des paramètres par la méthode des moments est
par exemple facilité par le résultat suivant (voir Genest & Mackay, 1986) :

r - r -r 4 [' y,(,u),
du,
Jo a'(u)
qui exprime le tau de Kendall théorique en fonction des paramètres de la copule archimédienne.
L'estimation des paramètresde la copule par la méthode des moments consisteà faire correspondre
une estimation empirique du tau de Kendall à cette expression théorique.

De nombreux exemplesde copules archimédiennessont exposéesdans la littérature (voir Nelsen,


2006, chapitre 4). Diverses applications ont été réaliséesà l'aide de telles copules et leurs propriétés
4.3 Familles de copules 29

ne sont pas toutes détaillées ici (par exemple les méthodes d'estimation des paramètres des copules
ou les techniques de simulation). Un exemple de copules archimédiennes est la famille de Flank
(Frank, 1979) qui a Ie grand avantage de couvrir tout I'intervalle de dépendance. Cette famille va
nous permettre dans le chapitre 5 d'introduire une dépendance entre I'intensité et la durée des
cellulespour tous les degréspossibles.Le générateurde cette copule archimédiennes'écrit comme
suit :
- -h r"e -?l),
o(z) d -l\ /'
et son expression est donnée par :

-r)(e-e" -7)
: -.irr' + (e-d"
C6(u,u) {r e-o -1 )u,r""gelR-{0}
C'est une famille ordonnéepositivement. Elle est dite complète car elle comprend les trois copules
de référenceC-, C' eL C+ pour respecbivement 0: -@,0' et *oo.

4.3.3 Copules polynômiales


Dans le cas de notre modèle de pluie, la copule C formalise Ie lien entre I'intensité et la
durée des cellules pluvieuses.Les paragraphessuivants s'inspirent de la section de Nelsen (2006)
qui traite des copules s'écrivant sous la forme de polynômes. Le raisonnement se base sur les
questions suivantes : À quel point l'expression d'une copule peut être simple (par exemple, la
copule indépendanceCL(u,u) : uu est linéaire en chacunede ses variables)? Existe-t-il d'autres
copules qui peuvent s'écrire sous forme de polynômes ?

Copules à sections quadratiques

La seule famille de copules à sections quadratiques en u et u est la famille de Farlie-Gumbel-


Morgenstern (FGM) discutéepar Morgenstern (1956),Gumbel (1958) et Farlie (1960). Pour tout
d dans [-1,1], cette famille de copules s'exprime comme :

C 6 ( u , u ): u u I 0 u u ( l - u ) ( 1 - u ) .

Cette copule est très utilisée en pratique car elle possède une expression analytique très simple.
Pour cette famille, des solutions analytiques s'obtiennent facilement pour Ia plupart des calculs. Par
exemple la relation entre le tau de Kendall r et le paramètre d est directe. De même, la dépendance
de queue (tail dependence,c'est-à-dire la dépendance entre les valeurs extrêmes) s'écrit sous forme
explicite pour cette famille de copules.Elle est aussitrès simple à simuler. L'utilisation de copules
quadratiques avec des marges exponentielles est a pri,ori, un choix judicieux de distributions bi-
variées entre l'intensité et la durée des cellules. Les moments agrégés peuvent être calculés et la
1la copule de FYank n'est pas définie pour d : 0 mais elle possède cependant une continuité en 0
30 La modélisation de la dépendance avec les copules

méthode des moments peut ensuite être appliquée. La famille de copules FGM avec des marges
exponentiellesest équivalenteà la distribution Gumbel type-Il, comme introduit dans le NSRPM
par Kim & Kavvas (2006). Cependant, cette famille de copules reste limitée en raison du faible
intervalle de degré de dépendancequ'elle peut modéliser (r € [-n?;fr]). Les copules à sections
cubiques (Nelsen et,al., 1997) permettent d'augmenter les degrésde dépendanceen comparaison
des copules à sectionsquadratiques. À notre connaissance,cette classede copules n'a jamais été
utilisée en pratique.

Copules à sections cubiques

En utilisant la notation de Nelsen et al. (1997), appelons^9I'union des points contenusdans le


carré [-1, 2]x[-2,1] et despoints à l'intérieur et sur l'ellipse{(2, u) e IR2,u2-uu+u2 -32+3u : 0}.
Les copules à sections cubiques à la fois en u et u sont définies par :

C(u,u):uu*uu(L-u)(1 - u){Ap(L-u)+ A z ( 7 - u ) ( 1- u ) t B p u - r B z u ( L - u ) } , (4.6)

où 41, Az,Bt,Bz sont des constantesréellestelles que les points (Ar,At),(Bt,Br),(81,41) et


(Ar, Br) se situent tous dans ,9. Les principaux théorèmes relatifs aux copules cubiques sont dispo-
nibles dans I'Annexe A.1. Plusieurs propriétés peuvent être obtenuesde cette représentationd'une
copule cubique. Nelsen et al. (1997) ont montré que si une copule C est définie par l'expression
(4.6), les mesuresde dépendances'écrivent comme :

p:(h*Az-r&+Bz)lI2

et

, : (A, i Az -r & + Bz)ILB+ (A2& - AtB2)1450. (4.7)

Si C possèdedes sectionscubiques à la fois en tl et u, alors lpl I r/3/3. Des calculs simples nous
ont permis de trouver que nous avons aussi lrl < t/+gLt/E -2053125. Ce résultat est démontré
dans I'Annexe A.2. C est symétrique si et seulement si At : Bz. De nombreusessous-familles
peuvent être construites, si I'on souhaite par exemple obtenir une famille avec un seul paramètre.
Quand Ar : Az : Bt : Bz : 0, nous obtenons le cas particulier de la copule FGM. Lorsque
At, : Az - Bt : Bz : 0, nous obtenons le cas particulier de la copule indépendanceCL. Le
Tableau 4.1 présente plusieurs de ces familles et indique celles qui incluent I'indépendance comme
casparticulier. Le Tableau 4.2 montre les degrésde dépendancequ'ellessont capablesde reproduire.
Une représentation de I'espace des paramètres couvert dans ^Spour chaque copule cubique est
donnée à la Figure 4.2. Les copules cubiques déjà décrites par Nelsen et al. (1997) (c'est-à-dire
les familles de Sarmanov, Fïank cubique et Plackett cubique) sont introduites dans I'Annexe 4.1.
Des familles de copules cubiques à un paramètre sont faciles à construire. La dépendance entre
I'intensité et la durée des cellules étant intuitivement négative, nous avons développé les copules
suivantes dans le but d'atteindre la dépendance négative maximale.
4.3 Familles de copules 31

AMH cubique Nous calculons I'approximation du second ordre de la famille de copules


AliMikhail-Haq (AMH) (voir AIi et a1.,1978) donnéepar

C(u,u):
I-0Q-u)(1-u)

pour d € [-1,1]. Cette famille est symétrique et inclut le cas d'indépendancepour I : 0.


- Syml Une copule avecdes sectionscubiques doit respecter les conditions définies au théorème
3 (voir Annexe A.1). Nous pouvons définir une famille de copulescubiquesà un paramètre en
posant Az : Br : 0 € l-I,2) et A, : Bz : 02 - 3 de telle façon que (d, 0' - 3) se situe dans
l-L,2] x l-2,1]. Cette famille est symétrique et couvre un large intervalle de dépendance
mais n'inclut pas le cas d'indépendancecomme cas particulier.
- Syrn2 Soit A2 - Br:0 e [-1,,3] et soit At: Bz - 0q-Jd+6a:1az. Les points (Ar,Ar),
(Bt,Br), (Bt,At) et (A2,82) se situent tous dans,S et décriventle contour elliptique de S
du point [-1,-2] au point [3,0]. Cette famille est symétrique et atteint les valeurs minimales
pour p et r.
- SymB Le point dans,S atteignant la valeur minimale pour p est - J\,-t - rfS]. Wo,rt
11
considérons alors une relation linéaire entre A2 : Bt et Ar : Bz passant par ce point et
le point [0,0]. Nous obtenons une famille qui est symétrique, ayant des relations linéaires en
chacun de ses paramètres, contenant I'indépendance et atteignant la valeur minimale pour
p.
- Asyml-Asym3 Des familles asymétriques sont facilement obtenues dès que A1 I F,2.La
famille Asyml a une relation quadratique en d et couvre un large intervalle de dépendance.
Les familles Asym2 et Asym3 sont construites en posant Az : Br - Bz et en s'assurant que
At I Bz.Bien qu'elles atteignent des degrésde dépendancemoins élevés,la famille Asym3
donne parfois des résultats intéressants dans le cadre de notre problématique (voir chapitre
B).
32 La modélisation de la dépendance avec les copules

Tae. 4.1 Familles de copules à un paramètre avec des sectionscubiquesen u et u


Nom A1 A2 81 B2 0€. ccl
Sarmanov 30- loiEF 3s+ 30 - 502 l-'/z1s,'/r1s1 oul
Fbankcub. 30-02 30+02 30+02 30-02 l-\/513,'/5ft| oul
Plackett cub. 0-02 00 0-02 [-7,2] our
AMH cub. 0 o+02 o 0 [-1,1] our
Syml 0 2- 3 00 0 2- 3 l-7,21 NoN
Sym2 e z-t/Çae-zQ 00 e's-\/s!6e-iF
[-1,3] NON
Sym3 (z+ t/s)o 00 (2+ \/5)0 lr - \/3,2- {zl oul
Asyml 0-2 0-7 0-7 0213-2 [0,3] NON
Asym2 0(1-0)-1 e0 0 [-0.8525,1] NON
Asym3 00-0)+1 00 0 [-1,0] NON

Tl.e. 4.2 Degrésde dépendance(rho de Spearman et tau de Kendall) des familles de copules à
un paramètre avec des sections cubiques en u et u
Nom p€. r€
Sarmanov l-0.529,0.529]l-0.372,0.372)
Flank cubique l-0.577,0.5771[-0.400,0.400]
Plackettcubique [-0.500,0.167][-0.340,0.113]
AMHcubique l-0.250,0.4171l-0.169,0.2801
Syml [-0.542,0.500]l-0.378,0.3401
sym2 [-0.577,0.500][-0.401,0.353]
sym3 l-0.577,0.2171[-0.400,0.139]
Asyml [-0.500,0.5001[-0.340,0.340]
Asym2 [-0.425,0.167][-0.289,0.115]
Asym3 [-0.333,0.083]l-0.222,0.0561
4.3 Familles de copules 33

.05 0 0.5 | 15 2 2.5 -05 0 05 I 15 2 25


x x

(c)
1

05

-05 r

> -1r'

-05 0 0.5 I l5 2 25 3
x

Frc.4.2 - Graphe de (A2,At),(Bt,Br),(Br,Ar),(Ar,B2) dans S (surfacegrisée)pour chaque


copule cubique. Les points qui indiquent les valeurs minimales pour le tau de Kendall et le rho
'*' et un '*', respectivement. (a) Sarmanov (ligne poin-
de Spearman sont représentéspar un
tillée), Fhank cubique (ligne segmentée),Plackett cubique (ligne mixte). (b) AMH cubique (ligne
pointillée), Syml (ligne segmentée),Sym2 (ligne pleine), Sym3 (ligne mixt"). (c) Asyml (ligne
pointillée), Asym2 (ligne segmentée),SymS (ligne mixte)
34 La modélisation de la dépendance avec les copules
Chapitre 5

Influence de la dépendance entre


l'intensité et la durée des cellules

Dans ce chapitre nous expliquons pourquoi il est impossibled'obtenir une mesureempirique de


la dépendanceentre I'intensité et Ia durée des cellules. Cette grandeur serait susceptiblede nous
renseignersur la forme de la dépendance,son degré, etc. Cependant, nous n'observonspas direc-
tement ces cellules pluvieusespuisque, comme nous I'avons déjà indiqué au chapitre 3, le modèle
de Neyman-Scott est purement conceptuel. Les cellules pluvieuses doivent être considéréescomme
un dispositif mathématique, plutôt qu'une entité physique. Il est par contre possible d'estimer Ia
dépendanceentre I'intensité et la durée des averses,en fixant une période sans pluie pour séparer
ces averseset une intensité moyenne minimale qui évite de considérer du bruit (au sensstatistique).
Cela s'est déjà fait par exemple pour modéliser directement la distribution bivariée de I'intensité
et de Ia durée des averses(De Michele & Salvadori, 2003). Néanmoins, il existe plusieurs raisons
qui empêchent d'utiliser cette mesure empirique pour en dégager des informations pertinentes sur
la dépendanceintra-cellule, Iiées à Ia discrétisation du temps, à la subjectivité de la méthode de
séparationdes averseset à I'influence de chacun des paramètresdu modèle sur la dépendanceentre
la durée et l'intensité des averses.Les sectionsci-dessousreprennent et expliquent plus en détails
chacun de ces points.

5.1 La discrétisation du temps

Les mesures de pluie considèrent toujours une échelle de temps qui n'est pas continue mais
discrète. Lorsque la pluie est observéeà une échellehoraire ou journalière, une perte d'informa-
36 Influence de la dépendance entre I'intensité et la durée des cellules

tion importante résulte de la discrétisation du temps. Prenons le cas d'un orage très intense qui
commenceraità 13h50pour finir à 14h10, avec une intensité moyennede 120 [mm/h]. Une échelle
horaire pourrait par exemple indiquer qu'il est tombé 25 [mm] de 13h à 14h et 15 fmm] de 14h
à 15h. Cela a d'abord I'effet de sous-estimerles valeurs extrêmes et dans notre cas d'atténuer
la dépendanceentre Ia durée et l'intensité des averses.Rodriguez-Iturbe et al. (I987a) nomme ce
phénomèneI'effet de lissage(smoothzngeffect).Les pluviomètres à auget permettent cependantde
mesurer les intensitésde pluie à des pas de temps beaucoupplus fins (de I'ordre de la minute dans
certains cas). Cet effet peut donc être atténué si I'instrumentation permet d'obtenir des mesures
à des échellesde temps beaucoup plus fines que I'heure.

5.2 La séparation des averses

La nécessitéd'appliquer une méthode de séparation des aversesest une autre source d'incer-
titude dans I'obtention d'une estimation du degré de dépendanceentre I'intensité et la durée des
averses.La période minimale qui doit être fixée pour considérerque deux aversessont bien dis-
tinctes (voir par exemple De Michele & Salvadori, 2003) peut, o contrario, agréger deux averses
différentesen une seuleet par la même atténuer le degré de dépendanceentre I'intensité et la durée
des averses.De plus, il est évident que développerune méthode de séparationdes aversesnécessite
de nombreux choix très subjectifs (choix de la durée minimale sans pluie entre deux averses,in-
tensité moyenne minimale de I'averseafin de ne pas retenir un bruit de mesure) qui ont tous une
grande influence sur les valeurs d'intensité et de durée des aversesobtenues.

5.3 L'effet cluster sur le lien entre l'intensité et la durée


des averses

Dans cette section, nous nous intéressonsà étudier I'influence des différents paramètres du
modèle sur le lien (exprimé en terme de tau de Kendall) entre I'intensité et la durée des averses
(noté q dans la suite de la section). Afin d'isoler cet effet, nous procédonspar simulation en temps
continu, ce qui nous permet d'éviter les effets de la discrétisation du temps et de ne pas procéder
à une méthode de séparation des averses.Nous simulons donc des cellules,et la durée de I'averse
correspondanteest simplement le temps qui sépare le début de la première cellule de la fin de
la dernière (il est donc impossible que les cellules associéesà une origine d'averse chevauchent
les cellules associéesà I'origine d'averse suivante). L'intensité moyenne de I'aversecorrespond au
volume de pluie produit par l'ensemble des cellules divisé par la durée de I'averse.Le degré de
dépendanceentre la durée et I'intensité des cellulesest noté rp.
5.3 L'effet cluster sur le lien entre I'intensité et la durée des averses 37

5.3.1 Influence du paramètre l.to sur lt

Pour étudier I'effet des différents paramètres sur 11, nous avons procédé à un plan de simulation
d'averses.Nous avons simulé 10,000aversespour différentesvaleurs de po, paramètre qui régit le
nombre de cellules avec une loi géométrique (pp € 11;10,000]).La densité de points est adaptée
aux variations de la courbe et les valeurs de 4, B et a (paramètre de la loi exponentielle utilisée pour
générerI'intensité des cellules)sont fixéesrespectivementà 3 [h-1], 0.2 [h-1] et 0.15 [mm] (ceschoix
de valeurs pour T, B et a, bien qu'arbitraires, correspondentà des ordres de grandeur rencontrésen
pratique). Nous avonsensuite calculé 11 pour ces 10,000 averses.La Figure 5.1(a) décrit I'influence
du paramètre pp sur q. L'effet de la superposition des celluless'observeclairement. Quand il est
absent (po : 1), I'indépendance entre I'intensité et la durée des cellules (r, : 0) se mesure
directement sur le lien entre I'intensité et la durée des averseset nous obtenons rÀ : 0. Cependant,
pour un nombre de cellules faibles (c'est-à-direp,D eître 2 et 10),7; est négatif. Il est important
de noter qu'avec une taille d'échantillon n : 10,000, la valeur seuil qui permet de rejeter une
hypothèsenulle "r : 0" est d'environ +0.0131 à un risque de première espècede 5%. En pratique,
les estimations du paramètre prr se situent le plus souvent entre 3 et 10. Pour de telles valeurs, nous
observonssur la Figure 5.1(a) eue 11 est significativementdifférent de 0. Il est délicat d'interpréter
cette dépendanceen raison du caractère aléatoire de tous ces paramètres. Un début d'explication
est que, lorsque les cellulesne se superposentpas et sont très éloignéesles unes des autres, la durée
de I'averseest d'autant plus grande que ces cellules sont éloignées.De la même manière, lorsque
les cellules sont très éloignées, I'intensité moyenne est d'autant plus faible puisque le volume de
pluie produit par les cellules va se répartir sur toute cette durée, d'où une dépendancenégative.
La Figure 5.1(b) illustre ce phénomèneen montrant le type de superposition que I'obtient avec
4 : 3 [ h - t ] , 0 : 0 . 2 [ h - 1 ]e t o : 0 . 1 5[ m m ] e t D : 2 .

La courbe de la Figure 5.1(a) croît ensuite à une vitesse logarithmique et tend vers une
dépendancepositive d'intensité supérieureà 0.4 pour rs.La Figure 5.1(c) nous aide à interpréter
cette croissanceen illustrant Ie type de superpositionque I'obtient avecn:3[h-r], P:0.21h-rl
et o : 0.15 [mm] et D :10,000. La dépendancepositive peut alors être expliquéepar le caractère
aléatoire du nombre de cellules. Un nombre de cellules important crée une averse de longue durée
et avec une intensité moyenneplus élevée,d'où une dépendancepositive. Pour se persuaderde cet
effet du caractèrealéatoire, nous répétonsla procédurequi a permis de dessinerla Figure 5.1(a) en
fixant le nombre de cellules.La Figure 5.2 représenterÀ en fonction de D. La courbe ne décrit plus
la croissancede la Figure 5.1(a), ce qui est cohérent avec les remarques précédentes.Elle décrit
même une décroissanceimportante puisque 11 diminue jusqu'à environ -0.9 pour D : 10,000.
38 Influence de la dépendance entre I'intensité et la durée des cellules

(a)

t0- to'
pD

E
€oo
È È
E E
c
0)
r 300
o
p P .oo
o o
C E
g
c Ë'*
r t5 2 25 3 35 '10 20 3() ilo
Tomps(en heures) Temps(en heures)

FIc. 5.1 - (u) mesurele lien entre la durée et I'intensité des aversesen fonction d" pr. L'abscisse
"^
représente pD sur une échelle logarithmique. Le nombre d'averses simulées pour chaque point est
10,000.Les ligneshorizontalesen pointillé indiquent les seuilsinférieur et supérieurde significativité
du tau de Kendall. (b) Exemple d'averses et les cellules correspondantes avec D : Z. (c) Exemple
d'averses et Ies cellules correspondantes avec D : 10,000. La zone en gris représente la durée et
l'intensité moyennede I'averse.Nous fixons ? : 3 [h-1], Ê :0.2 [h-1] et o : 0.15 [mm].

TSoz

-08 \
-1
roo rot rd to" to'
D

Ftc. 5.2 - TÀ mesure le lien entre la durée et I'intensité des aversesen fonction de D. L'abscisse
représente D sur une échelle logarithmique. Le nombre d'averses simulées pour chaque point est
10,000.Nous fixons ? : 3 [h-1], Ê :0.2 [h-1] et a : 0.15 [mm]. Les lignes horizontalesen pointillé
indiquent les seuils inférieur et supérieur de significativité du tau de Kendall.
5.3 L'effet cluster sur le lien entre I'intensité et la durée des averses 39

5.3.2 Influence des différents paramètres sur 11 lorsque la durée et


I'intensité des cellules sont i,ndépendantes

Dans cette section, nous allons réaliser le même type de simulations, mais pour différentes
valeurs de couples de paramètres. Cela va nous permettre de visualiser et de comprendre plus
facilement les interactions entre les paramètres et les effets de chacun de ceux-ci sur Ia superposition
des cellules.

Sur la Figure 5.3(a), le paramètre B varie de 0.1 [h-t] à 10 [h-1], de telle façon que la su-
perposition des cellules augmente avec B (les origines de toutes les cellules étant plus proches de
I'origine de I'averse). Le paramètre p,n varie de 1 à 20, faisant augmenter lui aussi les chances
de superposition des cellules. q et a sont fixés respectivementà 3 [h-1] et 0.15 [mm] de façon
arbitraire (cela correspond cependant à des valeurs réalistes). II semble, dans ce cas aussi, que
des valeurs de paramètres contribuant à une plus grande superposition des cellules font tendre la
dépendanceentre I'intensité moyenneet la durée de I'averseà une valeur d'environ 0.4 pour le tau
de Kendall. La Figure 5.3(b) représente1À en fonction du paramètre 4 et de po. 0 est fixé à 0.2
[h-1] et o à 0.15 [mm]. Les interprétations de la Figure 5.3(a) restent valables.Quand le paramètre
4 augmente, les cellules pluvieuses sont très courtes et ne se superposent que si p,p est très élevé.
Inversement, quand [t,p est faible, la superposition des cellules ne se fait que lorsque 4 est très
faible. Les Figures 5.3(a) et 5.3(b) illustrent bien le fait que n et P ont une grand influence sur 11.
Ces deux paramètres présentent une interaction importante sur la superposition des cellules. La
Figure 5.3(c) représenteî1 pour Ê et rt variant de 0.01 [h-t] à 10 [h-1] 1to:5). Il est à souligner
qu'en pratique, le paramètre 4 est en généraltrès supérieur à B. L'allure de cette figure s'explique
bien d'après les précédentesremarques.Les cellules se superposentd'autant plus que B est élevé
(les origines de cellulessont proches)et que 4 est faible (les cellulessont plus longues).Les Figures
5.3(d) à 5.3(f) représententI'effet du paramètre a (lié à I'intensité des cellules) sur q. Ces figures
représentent bien le fait que ce paramètre a peu d'influence sur la corrélation entre I'intensité et
la durée des aversespuisque 7À reste constant en fonction de a. Cela semble parfaitement logique
avec les remarques précédentespuisque ce paramètre n'influence pas la superposition des cellules.

Les paramètres 4, 0 et po ont donc une influence conjointe sur la superposition des cellules.
Ainsi, même Iorsque la durée et I'intensité des cellules sont i,ndépendantes,11,0 et po ont un effet
sur la valeur de q, les cellules se superposant d'autant plus que r7 est petit et que B et p,p sont
grands. Le paramètre o n'â par contre aucun effet sur 1.
40 Influence de la dépendance entre I'intensité et la durée des cellules

0.5 1

T^
^o ^0

-0.5
20 20

Ê
(c)
0.5
I
^0

-0.5
1

0.5 1
T^
^o ^0

-0.5
1 20

Ftc. 5.3 - rÀ en fonction de différentesvaleurs des couplesde paramètres (a) (po,p), (b) (po,ù,
k) (0,rù, (d) (o,ry), (") (",0) er (1) Q,r4,a). L'intensité et la durée des cellules sont considérées
comme des variables aléatoires indépendantes. Dans chacune des figures, nous fixons 4 : 3 [h-l],
0 :0.2 [h-'], o : 0.15 [mm] et Fo : S lorsque cesparamètres ne va,rientpas. Le nombre d'averses
simuléespour chaquepoint est 10,000.
5.3 L'effet cluster sur le lien entre I'intensité et la durée des averses 4T

5.3.3 Influence des différents paramètres sur 11 lorsque la durée et


I'intensité des cellules sont dépendantes

Nous nous intéressonsmaintenant à I'introduction d'une dépendanceentre I'intensité et la durée


des cellules, à I'aide de Ia famille de copules de Fbank (voir sous-section4.3.2). Cette famille a le
grand avantage de couvrir tout I'intervalle de dépendance. Nous avons ainsi généré 10,000 averses
pour plusieurs valeurs de rp,le paramètre p,p étant également variable. Les autres paramètres sont
fixés aux mêmes valeurs que précédemment(rl : 3 [h-t], B : 0.2 [h-t], c : 0.15 [mm] et po :5).
La Figure 5.4 illustre les valeurs de q qui résultent de chacune de ces simulations. La relation
d'égalité est très nette lorsqu'il n'y a pas de superposition de cellules (c'est-à-dire que lorsque
Fo : I, nous avons rx : ro). Quand le nombre de cellules augmente, 11 est largement atténué et
semble converger vers Ie profil de Ia Figure 5.1 (ceci a été vérifié en traçant la même courbe avec
cette fois Ies variables aléatoires intensité et durée des cellules co-monotones, voir Figure 5.5).

Frc. 5.4 - TÀ en fonction de différentes valeurs du paramètre gérant le nombre de cellules pt6r.
L'intensité et la durée des cellules sont des variables aléatoires liées par la copule de Fbank à un
degré indiqué par 16r.Nous fixons ? : 3 [h-1], Ê :0.2 [h-r] et o : 0.15 [mm]. Le nombre d'averses
simuléespour chaque point est 10,000.

Nous avons réitéré cette procédure en faisant varier les autres paramètres. Les résultats des
simulations sont présentésà la Figure 5.6. Lorsque a et rD varient ensemble,q évolue dans un plan
et nous retrouvons le fait que a n'influence pas r.r. Pour Ies paramètres 0 et n,l'allure des graphiques
est cohérente avec les remarques exposéesprécédemment. Lorsque les chancesde superposition des
cellules augmentent (c'est-à-dire pour B supérieur à a) et que la durée et I'intensité des cellules
sont directement liées (ro :1), 1 est très élevé. Dans ces cas, il y aura très souvent une cellule
prépondérantequi contribuera pour beaucoup à I'allure de I'averse(voir Figure 5.7). Le volume de
pluie produit par I'averse seïa en grande partie due à une cellule de grande durée et intensité.
42 Influence de la dépendance entre ltintensité et la durée des cellules

TÀ"

..: \
4,
,0" ro.

,;:

Frc. 5.5 - 11 €Il fonction de différentes valeurs du paramètre po avec cette fois I'intensité et la
durée des cellules co-monotones (r2 : 1) représenté en trait plein, à comparer avec la courbe de la
Figure 5.1 (intensité et durée des cellulesindépendantes)en trait pointillé. Nous fixons ? : 3 [h-t],
g :0.2 [n-1] et o : 0.15 [mm]. Le nombre d'aversessimuléespour chaque point est 10,000.

des cellules sont des variables aléatoires liées par la copule de Flank à un degré indiqué par rp.
Dans chacunedes figures, nous fixons T : 3 [h-1], 0 :0.2 [h-t], o : 0.15 [mm] et lto : S lorsque
ces paramètres ne varient pas.
5.4 Conclusion 43

-c
E
E
c
o
\o

o
c
o
E o.4 0.6 0.8 1
Temps(en heures)
-c
E
E
c
o
\o
at
c
o
c,

FIc. 5.7 - Deux exemples d'aversesdont la durée et I'intensité des cellules sont co-monotones
( r o : 1 ) . E n h a u t , B : 1 0 [ h - 1 ]1, 1: 2 l h - ' l , t t o : 5 e t a : 0 . 1 5 [ m m ] , e n b a s , 6: 0 . 2 1 h - L l , r l :
0.1[h-1], po : 5 et e. :0.2 [mm]. La zone en gris représentela durée et I'intensité moyenne de
I'averse.

5,4 Conclusion

Dans les chapitres 1 et 3, nous avons mentionné le fait que les cellules pluvieuses ne sont pas
directement observéeset doivent être plutôt considéréescomme un concept mathématique. Les
figures précédentesmontrent de plus qu'il est problématique de déduire une information pertinente
de façon empirique en ce qui concerne I'allure de la dépendance entre la durée et l'intensité des
cellules lorsque tous les paramètres qui interviennent dans la formation de la durée et de I'intensité
des aversessont considérés(pr,11,Ê, n et a). Les paramètresFo, Ê et 4 agissentconjointement sur la
forme des amas de cellules (cluster) et ont ainsi une influence sur rÀ. Nous notons pax exemple que
?-; peut prendre une valeur de 0.4 sans qu'il n'y ait aucune dépendance entre I'intensité et la durée
des cellules (ro:0). De plus, pour des valeurs d" Ito rencontréesen pratique (entre 3 et 10), la
dépendance introduite entre I'intensité et la durée des cellules est considérablement atténuée par
leur agrégation;avecpar exemplerD: \ et p,p:5, nous obtenonsq ev -0.1 (voir Figure 5.5).

À la lumière des ces remarques, il apparaît extrêmement difficile de développer une méthode
permettant d'avoir une mesure empirique de dépendance entre l'intensité et la durée des cellules à
cause du grand nombre de paramètres du modèle de Neyman-Scott intervenant dans ce processus.
Il n'est donc pas possible d'inclure un moment statistique directement lié à la dépendance entre
l'intensité et la durée des cellules dans la méthode généraliséedes moments.
Influence de la dépendance entre I'intensité et la durée des cellules
Chapitre 6

Calcul des moments du NSRPM


incluant un lien intensitê/durée des
cellules

Dans ce chapitre, nous développons Ie calcul des moments du Neyman-Scott quand une copule
cubique modélise le lien entre l'intensité et la durée des cellules (les détails de ces calculs sont
disponibles àl'Annexe B). Quand un lien existe entre X et L,la relation (3.1) n'est plus valable.
Nous souhaitons obtenir la distribution de l'intensité des cellules X lorsque L > l. Nous notons
cette distribution bivariée V x,r,. La copule C désigne la distribution jointe de X et tr. Nous avons
que :

V x,r(r,l) : Pr(X I r, L > l)


:Pr(X <r)-Pr(X< r,L<l)
: Fx(r) - c{r"(r), F"(t)}, (6.1)

où -F.x et Fr, désignent les distributions univariées de X et tr, respectivement. Il est important
de souligner qu'à ce stade, la relation (t5.I) ne limite pas le choix de Ia distribution bivariée de
I'intensité et de la durée des cellules.N'importe quelle distribution bivariée peut s'exprimer à partir
d'une copule bivariée et des distributions marginales selon le théorème de Sklar. Cependant, Ies
distributions bivariées classiques rendent le calcul des moments agrégés très complexe et même
impossible. L'utilisation des copules cubiques et des marges exponentielles est un moyen élégant
d'obtenir une classe flexible de distributions bivariées pour lesquelles les moments agrégés sont
facilement calculables.
46 Calcul des moments du NSRPM incluant un lien intensité/durée des cellules

6.1 Espérance, Variance et Covariance

Le moment d'ordre m de la pluie agrégéeY! peut s'exprimer comme suit :


ph th 7h
E {(yo n )^: } I I I n { v( t) y( tr ) ...Y( t*) \dtr dtz...dt*
"/o Jo Jo
th 7h 7h
-*t I I I E{v(r,)y(tr)...v(r-)}dhdt2...dt*,
Jo Jtt Jt^,

avec fr 1 tz I ... < t*. Une des propriétés des processusponctuels est I'indépendanceentre la
génération du processusponctuel dN(r- - u*) et Ia distribution de l'intensité Xr*-u^(u*). Nous
pouvons alors écrire :

E {v(rl)v(tz). . .Y(t^)\
: [* [* .. f E { & , - u ,( u , ) x , , - , , ( u r ) . . . x , ^ - u * ( u * ) }
Jur:oJuz:o Ju^:g
x o {alr(r, - u)dN(t2- u"). .. dN(t^ - (6.2)
"*)}.
L'espérancede Y(t) peut alors être représentéecomme le produit du taux d'apparition des cellules
et de l'espérancede la quantité de pluie produite par une cellule (Rodrfguez-Iturbe et al.,1987b,
paragraphe 3.2), à savoir :


-
E {v(r)} : / n {x,-"(u)}n {atu1t
J u:o ")}
: Àpn[* u { r r - ,( z) } dz
JO

: Àpn [* ,r,"a,riu,
Jo

désigne[i
oi 1tsç,,7>u fr'ryëJ9!ùdr. L'autocovariancede I'intensité pluvieuse avecun décalager
est donnée par :

cv(r) : Cov{Y(t),Y (t + r)}


fæ ræ
: E{X1-"(u)Xr*,-,(u)} Cov{d.n/(t- z), dN(t -r r - u)}, (6.3)
Jo J,
où I'autocovariancedu processusde comptage peut être exprimé selon Cox & Isham (1980, p.7B)
comme suit :
rrui'
Cov{dru(t- u),d.n{(tt r -t,)} : .fpp t u - u1+ E {D(D- 1)}t
llo1"
t u -u))] azat,
B e-g("+u-,)1r- 116(r (6.4)
6.1 Espérance, Variance et Covariance 47

quand r lu- u ) 0. [6(.) est la fonction indicatricedéfiniepar Is(0) :1et IIs(r):0 autrement
(voir ladéfinition 2.2).En introduisant cette expressiondans I'équation (6.3), nous obtenons (voir
Annexe 8.1) :

cy(r): ^ro _ r)\Bllr*


p,xz,'>udu+)n1nçn Fx,t>uryx,r>-ue--Ê(u+'--')drd,
I, lr*"
* .
dudzl (6.5)
"-g(u-u-r)
Ir*f ,*,r",".urx,r>u
Notons a et q les paramètres respectifs des distributions exponentielles de I'intensité et de la durée
des cellules. Avec Ie choix d'une copule cubique (avec un paramètre d) et de marges exponentielles
pour modéliser la distribution bivariée de l'intensité et de la durée des cellules, une expression
analytique est facilement calculable. Avec la copule FGM, nous obtenons :

cy(r):Àp,p{-30 +2(4+ 3ù e-n"1 -r p^E{D(D- t)}[zBe-,"(g' - 4rt')


1ç4a2q)
"-'r'
(z+ 0)(a+ 0)- Pe-2'"(P- ù(P + rù7(s+ 0)+ 6e-4"q{-2p + n@+ 0)}{28
+ q(4+0)ll{asa2q(pn - ;A'rf + nn)).

Finalement, I'espérance, la variance et I'autocovariance du processus agrégé {â peuvent être cal-


culées (Rodriguez-Iturbe et a\.,7984) en utilisant les expressionssuivantes :

E(Yn): hE
.{Y(t)},
Yat{Y,h}:' - u) cv(u)du,
[" @
JO

Cov{Yoh,\\r}: [" ""grn + u)(h- lul)du,


J_h

où k est un entier représentant le décalage de Ia fonction d'autocovariance. Pour la copule FGM


et des marges exponentielles, des expressions assezsimples peuvent être obtenues comme suit :

hÀtto(++0)
E(Yon): 1 (6.6)
Aan
Yar(Ynh):\p,pl-80 +Beqh( + Bd)+ -2r0 +2nh(r6+ od)}l/(sa"
"znn{-32 "'rhrl")
- +n\G-rn+qh- 1X2+ a)(6+ A)
+ ÀE{D(D- 1)}[88'(B'
- P3@- Tù(P-r r)(e-2nn*2qh - 1)d(8+ 0) + z+rt3(e-1n
1Bh - 7)
{rt'@+ 0)' - 4p'';1l{96a2rf
(85- 5Ê'rt'+ a7qn)}, (6.7)
Cov(Yoh,Y,\r): Àpp{-Z(e2'ln -I)201g"nâ(r+k) @'1h-D2G+30))l$6a2 e%lh(r+k)qs)
- À E{D(D - 1)} -\2 (p, - 4n\(2 + d)(6 + d)
[-SB' e(-?)â(1+k)
@'th
I Bz çegn-D2 rf {zB
_D" (p - rù(p + q)0(8+ 0) + 24"-gh(r+k)
"-%lno+k)ç"znn
- q(4+ 0)\{28+ n(4+ 0)}ll{tsza'rf(Pu- 50"n'+ 4Pq4)}. (6.8)
48 Calcul des moments du NSRPM incluant un lien intensité/durée des cellules

6.2 Moment du troisième ordre

Le moment du troisième ordre nous donne des informations sur l'asymétrie d'une distribution.
Selon Cowpertwait (1998) et Onof (2003), la reproduction des extrêmesest grandement améliorée
quand le moment du troisième ordre est inclus dans la procédure d'ajustement du modèle. À
I'exemple de Cowpertwait (1993), nous calculons les expressionsde ce moment dans le cas d'une
dépendanceentre I'intensité et la durée des cellules.Nous considéronsà cette fin l'expression(6.2)
ayecrn:3. Soient h ltz ( t3 les positions de trois origines de cellules.L'espérancedu processus
de comptage est exposédans l'article de Cowpertwait (1998, équation 2.7) et s'écrit comme suit :

E{d.^i (tl)d,^i (r,)dN(rs)} : \3 tfndtrdtzdtz


1^ p(t"-tt) p(ta-tz) p(tz-t')
* ; X' B, E(D' - D) {e- 1 a } dt rdtrdt,
" "- "-
*IxB'tr{(D' - D)(D - 2)}e-o$"*tz-2tù dttdtzdts+ o(drldr2dr3), (6.9)
3
où t1 1 t2 1 13. II nous reste à exprimer E{Xr,-u,(ut)Xrr-ur(u2)X4-u"(q)}. Nous devons
considérer différents cas selon la position des trois origines des cellules (par exemple le cas où
tt - ut - t2 - u2 polJr prendre en compte le cas où Xu-u, et X1r-u" concernentla même cellule).
Ainsi,

E {X r,-,, (r t) X r"-," (u2)X 4 - u"(q)}

I ItrXs,L>ut+ts-1^ quand tr - ut - tz - uz : tz - us
FX,L>u1p1çz,Lluz*tz-tz quand u3 : 1tr2 I tz - tz,uz I ut I tz - tt
- -
Fx,L>uz\xz,Llull.ltu-t1 quand u3 : lJr I ts h,uz * ur I tz tt

I trrx,r>ur\x,L>_u2pxp>usquand tr -
-
l-Ix,t>uspx2,L)u1]it2-l quand rL2: lJt I tz h,us I ut * ts tt
-
ut I tz u2 t' ts us-

Les détails de ces calculs sont donnés dans I'Annexe 8.2. Avec la copule FGM et des marges
-

exponentielles,I'expression du moment du troisième ordre (centré) se réduit à :

€n: El{Yn- E(}in)}'l : 3Àp,o{-2re-2nh(7 + r7h)0 + 24e-qh(2 + qh)(B+ 70)+ 3(-128-r 64qh
- 1 05 0 ++sq h ï)j l (7 6 a 3 q a) + ÀE{ D( - L)
D} fh,p,0,h) l{ 38+o"r np( p+ 2ù' ( Ê+4) 2}+Àx
E { D ( D- 1 ) ( D - 2 ) } g f u , 8 , 0 , h ) l { 1 2 a o q 4 a 3 B ( B - 2 r ù ' , @ - , , ù " ( 2 p + ù ( p + r ù ( p + 2 r ù ( 0 + z n )
(Ê+ +q1Y, (6.10)

où "f(ry,P,0,h) el g(rl,P,0,h) sontdéfinisdansl'Annexe8.3.

Quand d : 0 pour la copule FGM, nous avonsC(u,u) : ulu)ce qui correspondau cas particulier
de I'indépendanceentre l'intensité et la durée des cellules. Pour 0 : 0,I'équation (6.10) est en
accord avec celle obtenue par Cowpertwait (1998). Les formules générales des moments agrégés
(excepté le moment du troisième ordre dont I'expression est trop fastidieuse pour être présentée
6.3 Probabilité de période sans pluie 49

dans ce document) obtenues en utilisant les copules cubiques peuvent être consultéesdans l'Annexe
B.zl.

6.3 Probabilité de période sans pluie

Comme indiqué dans Kakou (1997), les autres propriétés d'intérêt, telles que la probabilité
d'avoir une intensité nulle de pluie durant un intervalle de temps arbitraire ou les probabilités de
transition entre les intervalles secs et humides ne sont pas des fonctions de I'intensité des cellules
de pluie. Cela signifie en particulier que leurs expressions(comme I'expression3.6) sont les mêmes
que X et tr soit dépendants ou non.
50 Calcul des moments du NSRPM incluant un lien intensité/durée des cellules
Chapitre 7

Méthode d'estimation des paramètres


du modèle

La méthode d'estimation des paramètres du modèle de Neyman-Scott la plus répandue, et


qui paraît la plus naturelle, se base sur les moments. Les autres approches classiques sont plus
difficiles à appliquer. Par exemple, I'expression de la fonction de vraisemblance de l'intensité de
pluie agrégéeest impossible à obtenir pour ce type de modèle en raison de la grande complexité
de la structure de dépendancetemporelle (voir Smith & Karr, 1985a,b;Obeysekeraet aL, 7987;
Chandler & Onof, 2005). Diggle (1983) propose une méthodologie qui consisteà choisir une fonc-
tion score (par exemple la densité spectrale ou la distribution du plus proche voisin) et à mini-
miser ensuite l'erreur quadratique moyenne intégrée (Mean Integrated Square Error, MISE) entre
les valeurs théoriques et observées.Cependant, cette méthode dépend de constantes d'étalonnage
arbitraires.

7.L Méthode basée sur une fonction de vraisemblance

La méthode d'estimation des paramètres qui consiste à maximiser une fonction de vraisemblance
comporte de nombreux avantages.En particulier, la distribution asymptotique des estimateurs du
maximum de vraisemblance permet le calcul d'intervalles de confiance pour les paramètres incon-
nus. Chandler (1995) développeune approchebaséesur le théorèmede la représentationspectrale,
en construisant une fonction de vraisemblance basée sur les coefficients de Fourier. Onof et a/.
(2000) qualifient cette méthode en cestermes :
- objective, parce qu'il n'est pas nécessairede choisir quelles statistiques, obtenues à partir
52 Méthode d'estimation des paramètres du modèle

des données, sont utilisées pour I'ajustement des pa,ramètres (comme dans la méthode des
moments),
* exhaustive dans I'utilisation des données, puisque le théorème de Fourier assure qu'il n'y a
pas de perte d'information dans le changementde domaine temps/fréquence)
- flexible et facilement réutilisable pour différents modèles.

Chandler (1997) applique cette approche sur les versions de base du BLRPM et du NSRPM.
Onof et al. (2000) recommandent alors de combiner cette méthode et celle des moments. Cepen-
dant, I'utilisation de cette 'vraisemblancespectrale' approchée nécessiteune simplification im-
portante des modèles afin d'obtenir cette fonction. Pour cette raison, Chandler & Onof (2005)
conseillent d'appliquer la méthode généraliséedes moments. Même si ce choix représenteI'in-
convénient de ne pas pouvoir utiliser les propriétés asymptotiques des estimateurs du maximum
de vraisemblance, nous notons que des méthodes alternatives existent dans le cas de ia méthode
généraliséedes moments, afin par exemple de construire des intervalles de confiance sur les esti-
mations des paramètres (voir Chandler, 2003).

7.2 Méthode basée sur les moments

7.2.L Méthode généralisée des moments

La méthode généraliséedes moments est décrite dans Rodrfguez-Iturbe et al. (I987b). Les
fonctions sont hautement non-linéaires en chacun des paramètres de telle sorte qu'une solution
exacte n'est pas disponible. Notons @le vecteur des paramètres du modèle. Une solution approchée
peut être obtenue en minimisant Ia fonction obiectif

o(ù:Ë(,_#)', (7.1)

où p est le nombre de moments inclus dans la procédure. Les quotients entre les expressions
ffi
théoriques des statistiques et les estimations correspondantesissuesde l'échantillon ne doivent pas
trop s'éloigner de 1. L'utilisation de ces rapports nous assureque de grandes valeurs numériques
ne dominent pas la procédure d'ajustement des paramètres. Le choix des statistiques observées
126constitue alors une étape cruciale. Plusieurs possibilités s'ofirent à nous, parmi les statistiques
dont nous possédonsles expressionsthéoriques, à savoir :
- la moyenneE(foh) (expressions
3.2, 6.6 et 8.1),
la variance Yar(Yoh),(expressions3.3, 6.7 et 8.2),
- l'autocovariancede décalagek, Cov(Y!,Y,\), aveck ) 1 (expressions3.4,6.8 et 8.3),
7.2 Méthode basée sur les moments 53

la probabilité d'intervalle de temps sec (3.6), la probabilité de transition de l'état sec à


humide,

- le moment centré d'ordre 3,El{Yn - E(\n)}'] (expressions


3.5 et 6.10).

Exceptée la moyenne, puisque E(Yrn) : kÛ(Yth),les moments calculés à différents niveaux


d'agrégation (de I'heure à deux jours) peuvent être introduits dans le système d'équations.
Calenda & Napolitano (1999) font une présentation exhaustive des méthodes d'estimation des
paramètres et s'intéressent pa,rticulièrement à l'étude de I'influence des niveaux d'agrégation sur
I'estimation des moments. Calenda & Napolitano (1999) montrent aussi I'importance de bien choi-
sir les échellesd'agrégation pour deux raisons principales :

- les caractéristiques de la fonction objectif (7.1) changent substantiellement avec l'échelle


d'agrégation;

- les résultats de l'algorithme d'optimisation varient quand les points de départ de la recherche
changent, et ceci tout spécialement quand les échellessont trop similaires.

Cowpertwait et al. (1996)suggèrentd'utiliser un ensemblede moments qui dépassenten nombre


les paramètres du modèle en accordant des poids à chaque statistique, selon I'importance souhaitée
dans la procédure d'estimation. Un dernier calcul permet enfin de réduire I'espacede minimisation
d'une dimension. En effet, poursuivant le travail de Vanmarcke (1983), Calenda & Napolitano
(1999) définissentl'échelle de fluctuation du processusobservépar :

X: h-f
T+oo
I
Iv-{nt I-
Var
T
l'--z Y (t) d, )

l
Pour la version de base du processusde Neyman-Scott, avec une distribution géométrique pour
le nombre de cellules,Rodriguez-Iturbe (1986) démontre que :

L -l tto
X:iF;ffi (7.2)

L'échelle de fluctuation peut alors être utilisée pour exprimer un des trois paramètres présents
dans l'équat\on (7.2) en fonction des deux autres. Pour réduire encore l'espace de minimisation
d'une dimension, une technique consiste à réécrire I'équation (3.2) afin d'exprimer un des pa-
ramètres en fonction de la moyenne E({h) et des autres paramètres restants (voir Cowpertwait,
1998), utilisant Ie fait que cette équation permet facilement d'isoler un paramètre, même lorsque
la durée et l'intensité des cellules sont des variables aléatoires dépendantes.
54 Méthode d'estimation des paramètres du modèle

7.2.2 Méthode d'estimation des paramètres pour le cas particulier de


la version de base du NSRPM

Pour le cas précis du NSRPM de base, Favre ef al. (200ab) ont développé une approche basée
sur les moments qui permet de réduire I'espace de minimisation à un espace à deux dimensions.
Cette algorithme développé par Favre et al. (2004b) est très performant mais est cependant limité
à un choix bien précis de moments.Les auteurs proposentI'utilisation des donnéesde pluie horaires
et journalières dans Ia procédure d'estimation, ce choix étant appuyé par Calenda & Napolitano
(1999). Comme indiqué précédemment, il est important que les échellesde temps soient assezdis-
tinctes afin d'assurer Ia stabilité de l'algorithme d'optimisation de la fonction objectif. En utilisant
les échelleshoraires et journalières, nous nous assuronségalement que les propriétés statistiques de
la pluie seront bien reproduites pour ces pas de temps, ce qui est de première importance lors des
applications hydrologiques. Cependant, il va de soit que certaines applications nécessitent I'utilisa-
tion d'échellesde temps beaucoupplus fines (par exemplejusqu'à un pas de temps de cinq minutes
en milieu urbain). Dans cette thèse,nous nous sommeslimités à des applicationssur des mesuresde
pluie à un pas de temps horaire, principalement afin d'obtenir plusieurs longues séries de données
provenant de sites aux régimes pluviométriques variés (voir chapitre B). Favre et al. (2004b) pro-
posent d'inclure I'espérancehoraire, la variance horaire et journalière et I'autocovariancehoraire
et journalière de décalageun (1) dans la fonction objectif (7.1).

Concernant Ia minimisation de la fonction objectif (7.1), des méthodestelles que la convergence


quadratique de Powell (Press et al., 7986) ont été prônéespar plusieurs auteurs (Velghe et al. , 1994;
Calenda & Napolitano, 1999) afin de résoudrece problème non-linéaire d'optimisation. La princi-
pale difficulté réside dans le choix des paramètres initiaux. En effet, la convergencede I'algorithme
est fortement dépendante de son point de départ. En outre, la minimisation est opérée dans un
espace à cinq dimensions et les minima locaux sont ainsi difficiles à éviter. Ces limitations in-
citent, par conséquent, à choisir une approche alternative. Au lien de considérer I'optimisation des
cinq paramètres du NSRPM, Ie système formé par les équations (3.2) à (3.4) peut être séparé.
Considéronsles variablesV, W et,Zi, (i,:1,...,4) apparaissantdans les formulesde lavariance
et de I'autocovariance:

v.' (Ut) :vzt(n,p,h) +wZ2(q,B,h), (7.3)

cou(Yn,Y\) : v Zs(n,
P,h)+ w z a(q,
B,h). (7.4)
7.2Mét}rode basée sur les moments oo

Nous pouvons maintenant identifier V, W et Zi en fonctions des paramètres du NSRPM, à


partir des relations (3.3) et (3.a) :

V(\,ltn, px) : ZÀppE(X2), (7.5)


W(\, tro, px) : ^E(D2 - D)t'*, (7.6)
'
Z r ( r l , 0 , h: ) 7h-I+r'-'n)' (7.7)
n0
Zz(rl, p,h)& -
0,h): Zr(rt, , (7.8)
1
ftffi
Zt(n, 0, h) : - (7.s)
ù(l "-nh12
"-n&-t)h,
z^t,7, (1 - e-An\z"-B(k-r)h
z4\,11P1,oJ - - = 7 V - B,h)82 (7.10)
rp' - rt') 20(0' - n')

Cela suggèrede séparerI'ensembledes paramètres en deux sous-espaces {n, 0} et {À, Fo, Fx).
La procédure commence avec un choix arbitraire d" (4, B) à partir duquel les valeurs des 26, (i :
1,...,4) définiespar les relations (7.5) à (7.10) peuvent être calculées.En utilisant les variances
observéeshoraires (h : 1) et journalières (ft. : 24), Ia relation (7.3) conduit à deux équations à
deux inconnues,qui peuvent être résoluespour V et W . La relation (7.4) permet ensuite d'obtenir
des estimations des autocovariances horaires et journalières de décalage un. Les deux moments
calculés sont ensuite comparés avec les moments empiriques par le biais d'une fonction objectif,
similaire à la fonction 0 de la relation (7.1). La fonction objectif est évaluéeet utilisée afin de
choisir de nouvellesvaleurs d" (?, P).La procédure réduit ainsi le nombre de paramètres obtenus
par minimisation. La méthode d'optimisation utilisée est basée sur le simplex de Nelder-Mead
(Nelder & Mead, 1965). En combinant les valeurs optimales pour V et W avec l'expressionde la
moyennehoraire (équation 3.2), nous obtenons les trois paramètres restants :

w
ît":2*+I,
V
în
-;----,
Fx:
+Frrl

\: ,F\û , ,
FcFxn
où p1 dénote Ia moyenneissue de l'échantillon des pluies horaires. Le diagramme de la Figure 7.1
résume cet algorithme. Cette méthode a été appliquée sur des données de pluie d'origine variée
et est beaucoup plus stable que la procédure classique de minimisation directe dans I'espace des
paramètres. Ainsi, la solution obtenue avec cette méthode est contrainte (puisqu'elle implique une
égalité stricte de le la relation (7.3) à une échellehoraire et journalière) et n'est pas théoriquement
équivalente à la minimisation de la fonction objectif dans I'espaceà cinq dimensions. Des approxi-
mations d'intervalles de confiance sur ces estimations ont de plus été données par Favre ef al.
56 Méthode d'estimation des paramètres du modèle

(2004b) en utilisant la méthode delta (Halperin & Mantel, 1963). Cependant, nous pouvons noter
que cette approche (que ce soit l'estimation des paramètres ou I'approximation des intervalles de
confiance) se base sur une séparation algébrique qui n'est possible que grâce à la forme particulière
du système d'équations avec cet ensemblede moments. Avec I'ajout d'un lien entre la durée et
l'intensité des cellules,cette séparation ne peut plus avoir lieu et cette méthode ne peut donc plus
s'appliquer.
7.2Métl:ode basée sur les moments o,

(1) Choixinitial de 4(o),B(o),i : -1

(2) j : j - l 1 C a l c u dl e sZ u ( r 1 ( i ) , B U ) , h ) , h : I i2: 4
L ,. . . 4

Résolution du système :
(3) V Z { r t ,p , I ) + WZ z ( n , 0 , 1: ) V a r ( { ' )
V Z{n, p, 24)+ W Zz(q,p, 24): Yar(Ynza)

(4)

Calcul de
(5)
Cov(Y,l,1l*,,) Cov(\24,V,!l
"t

Détermination de
(6)
o(ô):
{'- Hff*ti}'+ { 1 -
Cov(vo2a
,Yl|r) )2
V24 V24 \

Nouvellesvaleursde
rLon
---+
(7) Est-ce qtrc O est minimal ? ,(i+r) & BU+r1
aller en (2)

:,

(B)
t-" ;1
tn,pl

(e) Calcul de À, ft p, [r,;;

FIc. 7.1 - Diagramme résumant Ia procédure d'estimation en neuf étapes.


58 Méthode d'estimation des paramètres du modèle

7.3 Méthode d'estimation adoptée

Les modèles sont généralement ajustés en utilisant une combinaison de moyennes, variances,
autocorrélations et proportions d'intervalle sans pluie à des échellesvariant de th à 24h. Pour un
modèle à six paramètres, six expressionsthéoriques de moments sont suffisantes pour contraindre
le problème d'optimisation. Cependant,tel que suggérépar Cowpertwait ef al. (1996),un ensemble
plus grand de moments permet de forcer le modèle à s'adapter au minimum à ces propriétés. De
plus, Chandler & Onof (2005) indiquent que les problèmes d'identiflabilité des paramètres dimi-
nuent lorsque le nombre de propriétés de la fonction objectif augmente. Nous choisissonsd'inclure
Ia moyenne horaire, la variance horaire, I'autocovariancehoraire de décalageun (1), la variance
journalière, l'autocovariancejournalière de décalageun, le moment centré d'ordre trois à une échelle
horaire et la probabilité de période sans pluie à une échelle horaire et journalière. Nous utilisons
alors huit moments (p : 8). Ce nombre de propriétés conduit généralement à des résultats sa-
tisfaisants (Chandler & Onof, 2005). Cowpertwait (1998) indique que I'introduction du moment
d'ordre trois dans la méthode d'estimation permet une meilleure adéquation du modèle aux valeurs
extrèmes.

La minimisation de O n'est pas aiséeet doit être réaliséenumériquement. De nombreusesétudes


ont montré que les estimations obtenues sont très sensibles au point de départ de la recherche
(Calenda& Napolitano, 1999).

Plusieurs méthodes,telles que le Shuffied Compler Euolut'ion,SCE-UA (voir Duan et a1.,1992,


1993) ou les approchesbaséessur les algorithmes génétiques(Mitchell, 1996), ont été envisagéeset
brièvement testées lors de cette étape de minimisation. Ces méthodes ont I'avantage de parcourir
un espaceimportant en multipliant les directions de la recherche ou les points de départ de façon
aléatoire. Elles sont très performantes pour des espacesde très grandes dimensions (c'est-à-dire
supérieur à vingt). Cependant, nous nous sommes rapidement aperçus que, dans notre cas, le
problème n'est pas tant de parcourir un espacetrès grand que d'explorer très finement un domaine
de taille réduite en dehors duquel la fonction objectif est très aplatie. Ces méthodes ne donnaient
finalement pas de meilleurs résultats et nous avons préféré développer un algorithme qui ciblait
adéquatementI'espacede variation des points de départ de I'optimisation. La procédure d'optimi-
sation que nous avons adoptée s'inspire de l'algorithme développépar Chandler & Onof (2005) et
peut être résumée par les points suivants :

1 . Une solution dans I'espaceà cinq dimensions est obtenue grâce à la méthode généraliséedes
moments décrite à la seclion 7.2.2.
2 . La solution obtenue à l'étape 1 est utilisée comme valeur de départ pour les paramètres
\,Ê,rl,l.ro,a.La valeur de départ du sixième paramètre (par exemple d dans le cas des
modèles utilisant une copule cubique) a été fixée de telle façon qu'il corresponde au NSRPM
7.3 Méthode d'estimation adoptée 59

dans sa version de base quand c'était possible (par exemple pour les copules cubiques
qui comprennent le cas d'indépendance). Dans les autres cas, le choix est plus arbitraire.
La procédure d'optimisation contraint I'espacedes paramètres dans une région large mais
r é a l i s t e : 0 . 0 0 0 0 1< À < 0 . 1 l h - 1 1 ; 0 . 0 0 0 1< p < 0 . 9 9 [ h - 1 ] ; 0 . 0 1 < q < 2 0 0 [ h - r ] ;
1a tto < 500; 0.01 < o < 1000 [mm]. La restriction des paramètres entre ces bornes nous
garantit que les estimations obtenues ne sont pas physiquement invraisemblables. Cependant
les bornes sont larges et l'expérience montre que les paramètres sont toujours contenus dans
un petit sous-espace de cet espacedes valeurs possibles(Cowpertwait, 1998). Un premier en-
semblede ces paramètres est estimé en minimisant I'expression(7.1) à I'aide d'une méthode
de programmation séquentiellequadratique (sequenti,alquadrati,cprogramm'ing,SQP), voir
Fletcher (1987).
3 . Les étapes 4 à 7 sont répétéesplusieurs fois (par exemple cinq fois).
4. Nous effectuons 50 optimisations contraintes. Les points de départ sont généréspar le biais de
perturbations aléatoirestirées d'une distribution beta, l'espérancede cette loi étant constituée
du meilleur vecteur de paramètres obtenu à I'itération précédente. Le support de cette dis-
tribution est défini par les bornes courantes (les bornes sont définies à l'étape 2 et évoluent
à l'étape 6). Cette étape nous permet donc de tirer des points de départ aléatoiresautour de
la meilleure solution obtenue à ce stade.
5 . Nous rejetons tous les vecteurs de paramètres pour lesquels la fonction objectif dépasse
10O1s01, est la valeur de fonction objectif, trouvées à l'étape 4, de rang 50.
où O1so1
b. Les bornes évoluent selon les meilleurs ensemblesde paramètres trouvés jusque-là (à savoir
ceux qui minimisent la fonction objectif). Si les meilleurs ensemblessont proches les uns
des autres, les bornes sont restreintes.Si elles sont prochesd'une borne existante, les bornes
sont espacées.Ces choix sont arbitraires mais tiennent compte de l'échelle de valeurs des
paramètres et sont motivés par le souhait d'aider I'algorithme à sortir du domaine d'attraction
de minima locaux, en tenant compte du fait que I'adaptation de cesbornes ne s'efiectue qu'un
faible nombre de fois (cinq fois dans notre cas).
7. Seuls les 50 meilleurs ensemblesde paramètres sont conservés.Le meilleur ensemble de pa-
ramètres parmi ces 50 ensemblesdevient le point de départ des futures optimisations.

Cet algorithme possèdecomme premier avantage de parcourir un important sous-espacede I'espace


des paramètres, notamment grâce à l'évolution des bornes et des points de départ aléatoires. Sa
secondeforce consiste à éviter l'échec de I'algorithme de minimisation. Cela peut arriver lorsque
de mauvais points de départ sont fournis, la fonction objectif devenant alors trop aplatie.
Méthode d'estimation des paramètres du modèle
Chapitre 8

Application du NSRPM incluant un lien


entre l'intensité et la durée des cellules

Dans ce chapitre, nous comparons les performances de différentes variantes du NSRPM (voir
section 8.2) afin de savoir si le modèle est amélioré de façon significative quand la corrélation entre
I'intensité et Ia durée des cellules pluvieuses est prise en compte. Nous disposonspour cela de
plusieurs ensemblesde donnéesde pluies horaires provenant de régimes pluviométriques différents.

Dans cette thèse, nous nous intéressons uniquement à la modélisation stochastique des
précipitations liquides, le type de modèle utilisé n'étant pas adéquat pour caractériser les
précipitations solides. Par exemple, la modélisation de la neige implique nécessairementun couplage
avec un modèle de températures. Cette limitation revêt une grande importance dans les régions
nordiques, notamment au Québec, où les précipitations hivernales sont principalement constituées
de neige. De plus, la successionde précipitations solides et liquides durant le même événement y
est très courante selon l'évolution de la température. Dès lors, les interprétations des modèles de
pluie pour les stations du Québec sont limitées pour les mois de novembre à avril.

8.1 Description des données disponibles

A partir des seulesdonnéesde pluie (principalement à échellesmensuelle et annuelle), certains


auteurs ont dresséun portrait global des régimes pluviométriques dans le monde. Pour identifier et
classer les diverses régions pluviométriques du globe, on recourt habituellement aux précipitations
(liquides et solides) mensuelles ou annuelles évaluées sur une longue période et leurs variations.
62 Application du NSRPM incluant un lien entre I'intensité et la durée des cellules

Une classification pluviométrique générale basée sur les données annuelles est fournie au Tableau
8.1. Elle distingue sept régimes différents, le plus humide étant le régime équatorial humide avec
plus de 200 [cm] de précipitation annuelle moyenne, et le plus secétant le régime polaire et arctique
avec moins de 30 [cm] de précipitation annuelle moyenne.

Tae. 8.1 Régimes pluviométriques du monde (Tiré de Champoux & Toutant, 1988)
(précipitations liquides et solides).
P. annuelles Région
Régime Caractéristiques
moyennes typique
équatori,al à I'intérieur des contr- bassin de
> 200cm
humi,de nents et sur les côtes I'Amazone
subtropi,cal à I'intérieur des contr- pointe sud-est de
100-150
cm
humi,de nents et sur les côtes I'Amérique du Nord
subtropical à I'intérieur des conti- Ie sud du
125 cm
sec nents et sur les côtes ouest Maghreb
sur des zonescôtières côtes est de
intertropical > 150cm
étroites; humidité I'Amérique centrale
cont'inental à I'intérieur des conti- Plaines de I'ouest
10-50cm
tempéré nents; désertsou steppes de l'Amérique du Nord
océan'ique sur les côtes ouest la Colombie Britan-
> 100 cm
tempéré des continents nique, l'Europe
polai,re nord du 60e parallèle; le Grand Nord
(30cm
et arctique grands déserts froids canadien

La carte de la Figure 8.1 donne un aperçu global des climats de ce monde. En nous intéressant
à l'Amérique du Nord et à I'EuropeJ nous possédonsdéjà un bon éventail des différents climats.
En utilisant les séries de pluie provenant de la Suisse, de la Belgique, de la FTance,du Canada
(province de Québec) et des États-Unis, presque tous les climats sont représentés, exceptés les
climats équatorial et de mousson.

Le Tableau 8.2 donne les détails de ces sériesde donnéesqui ont été choisiespour leur longueur
et la situation géographique de leur station. La Figure 8.2 présente les moyennes mensuelles des
précipitations liquides pour les différents jeux de donnéessur lesquelsnous appliquons les modèles
de pluie. Nous nous sommes limités à 11 jeux de donnéespour des raisons de temps de calcul.
Nous disposons cependant d'une grande variation de type de climats avec ces seules 11 stations,
certaines étant très arrosées(par exemple Miami), d'autres recevant de la pluie assezrégulièrement
tout au long de I'année (à Ziirich ou à Uccle) et enfin certaines avec des saisonstrès marquées (par
exemple à Los Angeles ou à Val d'Or).

La suite de la section détaille les climats des différents pays considérés.


8.1 Description des données disponibles 63

Tne. 8.2 - Description des sériesde pluie horaire sur lesquellessont appliquésles différentsmodèles
de Neyman-Scott.
Station Pays Coordonnées Période couverte Durée
Ziiri,ch Suisse -
47.22N\8.32E 07I 0rI re7e 31I 72I reee 21 ans
Uccle Belgique 50.48N\4.20E 01/01/1e68 - 31I 72I rees 28 ans
Brest France 48.23|t\4.29O 0rI 07I rees- 37I 1212005 13 ans
Lyon France 45.45|r\4.50E 2eI 07I leeo- 31I 12I 2oo5 15.4ans
Marseille FYance 43.17N\5.22E 01/01/1ee3 - 37I L2I 2005 13 ans
Trudeau Canada 45.31N\73.3eO27I 03I re43- 07I 17I 7ee4 51.6 ans
Val d'Or Canada 48.06N\77.4700rl05l1e6r - }rl]llress 34.5 ans
Mi,ami. USA 26.00N\80.00O07I 01. I 1s4e- 31I 12I 1ee8 50 ans
Seattle USA 48.00N\122.5O0rI 07I re{e - 37I 12I rees 50 ans
Los Angeles USA I 01I 1e4e- 3rI 12I 7ee8 50 ans
3 4 . 0 0 N \ 1 1 7 . 5 001,
Mznneapolzs USA 46.00N\92.5O07I 07I 7e4e- 37I 12I rees 50 ans

t
f
ffi ËquatorialEMousson f,Ooéaniquef---l Aride I Montagnard
l-l Polaire
l-lChinols ffi] Continental
FIc. 8.1 Carte des climats mondiaux (Source Wikimedia Commons, disponible à
h t t p : / / f r . w l ' k i p e d i a .o r g l w l k i / I m a g e : C l i m a t s - d a n s -Ie-Monde.svg, dernièreconsultation le
7 août 2008).
64 Application du NSRPM incluant un lien entre I'intensité et la durée des cellules

200 200 200

150
(a) 150
(b) 150

100 100 100

50 50 50

0 0 0
JFMAMJJASOND JFMAMJJASOND JFMAMJJASOND

200 200

150
(d)
150
(e) (f)
E
E 100 100

o 50 50
Io 0 0
J JFMAMJJASOND JFMAMJJASOND JFMAMJJASOND
o
c
o 200 200 200
E 150
(g) 150
(h)
150
o
C
o 100 100 100

'a
G 50 50 50

(,
.o
0
JFMAMJJASOND
0
JFMAMJJASOND
0
JFMAMJJASOND

o.
200 200

1 5 0 0) 150
(k)
'100 100

50

JFMAMJJASOND JFMAMJJASOND

Ftc. 8.2 - Moyennesmensuellesdesprécipitations liquides pour (a) Zu.rich: climat semi-continental


(b) Uccle : climat océanique (c) Brest : climat hyper-océanique (d) Lyon : climat océanique de
transition (e) Marseille : climat méditerranéen (f) Tbudeau : climat continental humide (g) Val
d'Or : climat continental (h) Miami : climat tropical (i) Seattle : climat tempéré de type océanique
fi) Los Angeles : climat méditerranéen (k) Minneapolis : climat continental. La ligne horizontale
en pointillé indique pour chaque station la moyenne annuelle divisée pat t2 à titre de comparaison.
Remarque : ces moyennes n'ont pas été calculées sur les mêmes périodes selon les mois considérés
à cause des données manquantes.
8.1 Description des données disponibles 65

8.1.1 Suisse

Le réseauANETZ (Automati,schesmeteorologi,sches Mess-und Beobachtungsnetz)comporte 72


stations de pluie Les
automatisées. premières stations ont été misesen serviceà la fin des années70
(23it'-" siècle).Une grande partie des stations ANETZ ont remplacé les stations conventionnelles.
Le réseau ANETZ couvre toutes les régions et altitudes de la Suisse.Les mesuressont effectuées
automatiquementtoutes les 10 minutes et transmisesà I'ordinateur central à Zùrich. Pour certaines
stations, des mesuressont efiectuéespar les observateurstrois à huit fois par jour. À I'aide de ce
réseau,MétéoSuisse(l'institut national de Météorologie)a en particulier collectédes pluies horaires
pour une vingtaine de stations du plateau Suisse,pour les années 1979 à 1999. Nous disposons
pour notre part de dix sériesde donnéesde pluies horaires.

La Suisseest un pays montagneux et les stations disponibles sont toutes situéessur le plateau
dans Ia partie la plus plate du pays (voir carte de la Figure 8.3). Le climat est de type semi-
continental avec des influencesocéaniqueset méditerranéennesdans une moindre mesure.La pluie
est assezrégulièrement répartie tout au long de I'année. Les variations du climat sont cependant
importantes en raison des grandesdifférencesd'altitude et d'exposition'

AGtrÊ

fRANGS
l\'
\
'"t I
Lr'
AUTR tc HE

FFAilCE
t . ôohm
| ,aLlE
\

FIc. 8.3 Carte de la Suisse(SourceHachetteMulti,médi,a).


66 Application du NSRPM incluant un lien entre I'intensité et la durée des cellules

8.1-.2 FYanceet Belgique

Le service national de météorologie de Flance, MétéoFYance,nous a fourni dix sériesde données


de pluies horaires pour des périodesde 13 à 15 ans. Cette région de I'Europe est complétéepar la
série des données de pluie à Uccle en Belgique. La station de collecte de ces données est gérée par
I'Institut Royal Météorologique (IRM). Les intensités de pluies horaires sont disponibles sur une
période de 28 ans, couvrant 1968 à 1995.

La Flance, par sa latitude, est globalement située dans une zone tempérée, cependant différents
types de climat peuvent être distingués (voir Figure 8.4 à gauche).Le climat est océaniqueà I'ouest,
avec des pluies fréquentes toute I'année, continental à I'est avec une légère influence océanique.
Au sud-est, le climat méditerranéen est caractérisé par des pluies irrégulières et peu nombreuses,
ainsi qu'une sécheresse durant l'été. Les régions montagneuses(Alpes, Pyrénées,Massif central,
Massifs des Vosges et Massif du Jura) possèdent aussi un climat particulier, les pluies étant plus
nombreuseset Ies températures variant beaucoup en fonction de I'altitude. Le climat du centre de
la Fhancecorrespond à un climat océaniquedégradé où I'influence océanique est encore perceptible,
mais dû à l'éloignement de Ia côte, il se rapproche d'un climat continental avec des pluies plus
faibles.

En raison de I'influence maritime, la Belgique présente un climat océanique dans la grande


région de Bruxelles (voir carte de la Figure 8.4 à droite). Dans le sud du pays, le relief fait obstacle
aux massesnuageusesqui se déversent sur les plateaux ardennais, les cumuls moyens de pluie y
sont donc plus faibles.

FIc. 8.4 - Carte de la Flance et de son climat (à gauche, Source Encarta) et de la Belgique (à
droite, Source Hachette Multiméd,ia).
8.1 Description des données disponibles 67

8.1.3 Etats-Unis

Aux Etats-Unis, nous disposons des données de pluies horaires dr Cli,mate Predi,cti,onCenter,
qui fait partie dt Nati,onal Oceani,cand Atmospheric Admi,nzstration(NOAA)/Office of Oceanic
and Atmospheric Research(OAR)/Earth System ResearchLaboratory @SRL)- Physi,calSc'iences
Di,uiszon(PSD), Boulder, Colorado, USAI. Les stations sont disponibles sur une grille qui qua-
drille la région 140W-60W, 20N-60N avec des rectanglesde 2.0o x 2.5" en utilisant un schémade
Cressman modifié. Les séries couvrent une période de 50 ans, de 1949 à 1998 et sont obtenues
à partir de techniquesd'interpolation et de réanalyses(une description détaillée est disponible à
http: //uutw.cdc.noaa.gov/cdc/data.cpc-hour.htnl, dernièreconsultationle 7 août 2008).

Il serait très long de décrire complètement le climat de ce territoire immense. Dans notre cas,
il est cependant important de souligner que l'étalement latitudinal et la disposition du relief nous
procurent une grande diversité de climats. Du froid polaire du nord de I'Alaska au climat tropical
de Floride, presque tous les climats sont représentésaux États-Uttis. La carte de la Figure 8.5
représente les pluies totales annuelles moyennes un* États-Unis à partir des données reconstituées
dont nous disposons.Nous distinguons très nettement les différents régimes de pluie, qui vont de
régions très arroséesen Floride (>150 [cm]) à des régions très sèchesdans le désert de l'Arizona
par exemple(<20 [cm]).

8.1.4 Ca n a d a

Au Canada, nous nous intéressonsà la province de Québec pour des raisons de disponibilité
de données. Les données de pluies horaires nous ont été fournies par Environnement Canada qui
produit ce service via le Service météorologiquedu Canada. Nous disposons de 13 stations qui
couvrent des périodes s'étendant de 26 à 52 ans.

Quatre types de climat principaux se distinguent dans la totalité du territoire québecois(une


carte des précipitations totales moyennesannuellesau Québec est fournie à la Figure 8.6) : conti-
nental humide, au sud du 50iè*" degré; subarctique, entre les 50iè'" et 58iè'" degrés; arctique, à
I'extrême nord; maritime de I'Est aux îles de la Madeleine.Les conditions climatiques québécoises
sont influencéespar la position septentrionale de la province et par une double exposition aux eaux
froides de la baie d'Hudson et aux courants océaniquesfroids, le long de la côte du Labrador. Nous
nous intéressonsici à la région du Québec la plus au Sud et la plus habitée qui correspond donc au
premier type de climat. Les saisonsles plus marquéesrestent l'été et I'hiver. Les étés sont chauds
et souvent très humides. Les hivers sont froids, plutôt longs et neigeux. Nous notons d'importantes

ldisponible à http: / /vtw,,t. cdc.noaa. gov/ cdc/data. cpc-hour. html, dernière consultation le 7 août 2008
68 Application du NSRPM incluant un lien entre I'intensité et la durée des cellules

précipitations (solideset liquides) annuelles,dont un tiers environ sous forme de neige.

I Moimaes ! olso
lsaro lsoloo
lrolrs flcolzo
ff rslzo ! zolro Modélisationréaliséepar ChrislopheDaly
flzolx lrolroo d'aprèslo modèlePFISM,basé sur l€s
n25à30 lroolrao nqmal€s 1961- 1990 d€s slalions
Irolrs D14oà1so Co@erativedu NOOAet sur les sites
NBCSSNOTEL.CommanditéDarUSDA-
135à40 Inwaerm NRCSWaterand ClimaleCenter,Ponland,
Oregon
Période (1961-1990)
OregonClimalsS€ryics
GeorgeTaylor,Climatologisto
d'état
(541)737-5705

FIc. 8.5 - Carte des pluies totales moyennesannuellesaux États-Unis (SourceNOAA, disponible
sur leur site à http://wwv.wrcc.dri.edu/pcpn,/us-precip.gif, dernièreconsultationle 7 août
2008).
8.1 Description des données disponibles 69

'' ft legenoe
,''/ | r 100 mm et morns
+'-l-
Fl;' ,,:..:::101 à 200 mm
201 à 400 mm
401 à 600 mm
001 à 800 mm
8 0 1 à 1 2 0 0m m
6:s! 1201 à 1600 mrn
4;;i3 1601 à 2000 mm
il*i 2001 à 3000 mm
r 3001 a 4000 mm
--,/-------\
{---- --'' Lieux habités
. 1_4999
. 5000-49999
Iï. . 5O0OO- 99 999
. 1O0OOO et plus
ri o
Capttale
provrrlc rale €l
t6rntorale
* Caprtale natronale
Frontièreset
limites
A/ Fronl{ére
t'( ûrtefilatronale
Ltmrtes
,tf, provtnctales et
t€rfltoflal€s
ZEE (2OOmrlles)
Lrgne oe
lj I SeParatlon.
t\ Canada i Kalaalht
Nlunaat

Frc. 8.6 - Carte des précipitations (solides et liquides) totales moyennes an-
nuelles [--] au Québec (Source Ressources naturelles Canada), disponible à
1n 'l +f p+ :^/ ./ a /I /I ^a +St.^n^f C a . .F y - - n o(- . 2 / e i l o / f r s n ^ -- i-^- /- -C- -d^t /S^/-l 'l .l ;d- P^ -s m
/ eêl nl Vf .l /l cUl li hn rar iEo r/ rnur /açrr-rt r- .rr! o^ u! :c^/ -y r y u L P l L d u l u ] l .

dernière consultation le 7 août 2008.


70 Application du NSRPM incluant un lien entre I'intensité et la durée des cellules

8.2 Modèles considérés

Nous allons appliquer le NSRPM incluant une dépendanceintra-cellule sur différentes séries
de pluie en utilisant les familles de copulesdécrites au Tableau 4.1. Pour éviter de surchargerles
figures et les tableâux, nous montrons les résultats pour seulement quatre familles de copules, à
savoir FGM, Flank cubique (Fcub), Sym2 et Asym3. Il doit être noté que plusieursfamilles peuvent
donner des résultats similairesen raison de leur proximité dans I'espacedes fonctionspour certaines
valeurs de d. Par exemple, les copules Flank cubique, Sym2 et Sym3 peuvent être équivalentes
puisqu'elles atteignent toutes les trois la valeur minimale du rho de Spearman pour une copule
cubique (voir Figure 4.2). Les familles Fbankcubique (Fcub), Sym2 et Asym3 sont sélectionnéesen
raison de résultats intéressantssur des essaispréliminaires. L'application de Ia copule FGM nous
permet d'analyser la différence de performance entre cette famille de copule quadratique et les
familles de copules cubiques. Les distributions marginalespour la durée et I'intensité des cellules
sont supposéesexponentielles.Nous obtenons ainsi une distribution bivariée à trois paramètres
pour caractériserle comportement de I'intensité et de la durée des cellules.Nous rappelons que la
copule FGM avecdes margesexponentiellescorrespondà la distribution bivariée de Gumbel Type-
IL Ce modèle particulier nous permet donc de comparer les performances des différents modèles
avec l'approche développéepar Kim & Kavvas (2006). Nous notons cependantplusieurs erreurs de
calcul dans I'article de Kim & Kavvas (2006) et des résultats décevantslors de I'application (sans
doute liés aux expressionserronées des moments). Nous ne comparerons donc pas nos résultats à
ceux illustrés dans cet article. Afin de compareréquitablementles modèlesavecet sansdépendance,
il est nécessairede considérer des modèles ayant le même nombre de paramètres. Nous appliquons
dans ce but une distribution gamma à deux paramètres pour I'intensité des cellulesdans le cas de
I'indépendance(densitéde probabilité f (r) - a"Yft-r"-"" ll(l),r ) 0,? > 0).Nous examinons
égalementle cas d'une distribution de Pareto de densité de probabilité f (r) : 1at f (a*r)0+r) ,r )
0,'y ) 0 pour I'intensité des cellules, où a est le paramètre d'échelle et 7 le paramètre de forme.
Ces deux distributions possèdentI'avantage de pouvoir posséderune queue inférieure lourde. De
plus, la distribution de Pareto comporte une queuesupérieurelourde, ce qui intervient directement
sur les propriétés des valeurs extrêmesdu modèle. Même si nous souhaitonscomparer des modèles
comportant le même nombre de paramètres,il nous a sembléintéressantd'étudier égalementle cas
classiqued'une distribution exponentiellesimple pour I'intensité des cellules.Ce modèlecorrespond
donc à la version de base présentéeà la section 3.2 et comporte cinq paramètres.

Le dernier type de modèle considéréest le modèle 'Intensité-Durée Dépendantes' (Dependent


Depth-Duration Model) développépar Kakou (1997). Ce modèle conservela même forme d'occur-
rence pour les averseset les cellules.L'intensité des cellulesX possèdeune forme exponentielle.La
structure de dépendanceentre I'intensité et la durée des cellules est introduite par le biais d'une
intensité moyenne de cellule dépendante de tr, c'est-à-dire que E(XII) : g(L).La distribution
exponentielle de paramètre 4 pour la durée des cellules tr est conservée.Deux versions pour Ia
8.3 Estimation des paramètres et fonction objectif 7l

fonction g(tr) sont considéréesI g(L): f s-cL et g(L): f Le-"', où f et c sont des scalaires
positifs. Par la suite, les modèles DD1 et DD2 désigneront respectivementces deux versions du
modèle 'Intensité-Durée Dépendantes'. Dans le modèle DDl, Ies variables X et L sont toujours
négativement corrélées, avec comme fonction de corrélation (rho de Pearson) :

(+1 2<2+2e+L'
où ( : cf q (Kakou, 1997). Avec le modèle DD2, la fonction de corrélation (rho de Pearson)entre
I'intensité et la durée des cellulespluvieusess'exprime comme suit :

1-(@
(+1\/((+1)'-(2(+1),

Pour ce dernier type de modèle, nous calculons donc l'ensemble des moments impliqués dans
la fonction objectif (voir chapitre 7). En particulier, le moment centré d'ordre trois n'était pas
disponible dans la littérature pour ces modèles et a donc fait I'objet d'un travail important.

Pour l'ensemble de ces modèles, nous rappelons que la durée des cellules suit une distribution
exponentielle et que le nombre de cellules suit une loi géométrique.

8.3 Estimation des paramètres et fonction objectif

Nous nous sommes heurtés à plusieurs difficultés lors de I'estimation des paramètres pour cer-
taines stations de la Flance, du Canada et des Étatr-Ut is. Nous avons mentionné au chapitre 7 que
nous utilisons la moyenne horaire, les variance horaire et journalière et les autocovariance horaire
et journalière de décalageun (1) comme premier ensemblede moments dans la procédure d'es-
timation des paramètres. Cependant, il apparaît que I'autocorrélation journalière échantillonnée
prend parfois des valeurs très faibles (par exemple pour les mois d'été dans certaines régions du
Québec,voir Figure 8.7).

La procédure d'estimation décrite dans la sous-section7.2.2 devient instable lorsqu'elle est ap-
pliquée avec une autocorrélation journalière très faible. Si I'autocovariance journalière de décalage
un varie alors que les autres moments sont fixes, les estimations obtenues ne sont satisfaisantes
que si I'autocovariance journalière dépasseun certain seuil. Nous avons appliqué cette procédure
aux données de pluie de Ia station Tludeau pour Ie mois de juillet. La Figure B.B représente les
valeurs de la fonction objectif O(fi et des estimations des paramètres du NSRPM (\,û, P, tro,d)
en fonction de I'autocovariance journalière variant de 0 à 10 [mm/h] (l'espérance horaire, les va-
riance horaire et journalière et les autocovariances horaire et journalière de décalageun conservant
72 Application du NSRPM incluant un lien entre l'intensité et la durée des cellules

Mois

Frc. 8.7 - Evolution intra-annuelle (mensuelle) de I'autocorrélation horaire (trait plein) et de


I'autocorrélation journalière (trait pointillé) empiriques de décalageun à la station Tludeau.

leurs valeurs calculéessur l'échantillon). Les estimations deviennent cohérentespour des autocova-
riancesjournalières dépassant2 lmmlhl2. Le même phénomènes'est reproduit plusieurs fois dans
nos applications et se retrouve par exemple à Brest (voir Figures 8.9 et 8.10). Certaines limites du
modèle de Neyman-Scott apparaissentici puisqu'il n'est pas en mesure de reproduire des struc-
tures de pluie où I'autocorrélation journalière décalageun de I'intensité pluvieuse est trop faible. Il
est par exemple impossible au NSRPM de reproduire des autocovariancesnégatives (l'expression
théorique de I'autocovariance est le résultat de la sommation de quantités positives, voir chapitre
6, équation 6.5), ce qui pourrait être observé en réalité. Il est également possible que les diffi-
cultés rencontrées soient liées à la forme de Ia fonction objectif 7.1 qui évalue les quotients entre
les moments théoriques et échantillonnaux. Le rapport entre deux quantités très faibles pourrait
alors exploser et rendre la procédure d'optimisation instable. Ce problème particulier peut être
résolu en remplaçant la fonction 7.I par une somme quadratique des différences entre les moments
théoriques et échantillonnaux. Il s'agit alors d'associer un poids à chaque terme de la somme afin
de tenir compte des différences d'échelle des divers moments statistiques considérés.
8.3 Estimation des paramètres et fonction objectif 73

0.5

0.4

,Q o.s
O o.z
t,
0.1

0
0 2468
-u.w

-0.1 L
0
I 2468
Autocovariance joumalière Autocovariance joumalière
x loo

't.5 0

0.4

0.5 o.2

0 0
2468
journalière
Autocovariance

o.25

0
o.2

I
0.'15
-5000
+ 0.1
-10000
0.05
-15000 0L
2468 0 2468
Aulocovariance
ioumalière Autocovariance ioumalière

Frc. 8.8 - Evolution de la fonction objectif et des estimations des paramètres du NSRPM dans
sa version de base pour le mois de juillet à la station Thudeau en fonction de I'autocovariance
journalière de décalage un.
74 Application du NSRPM incluant un lien entre I'intensité et la durée des cellules

0.7

u.o

u.c

0.4

0.3

o.2

0.1

0
12
Mois

Frc. 8.9 - Évolution intra-annuelle (mensuelle)de I'autocorrélation horaire (trait plein) et jour-
nalière (trait pointillé) empiriques de décalageun à la station de Brest.

0.

0.
h
^
0.1 -0.05

-0.1 L
flr-
2468 0 2468
Autoævariarce joumalière Aul@variance journalière

0.4

0.3

,Q- 0.2

0.1

0
468 0 2488
Aul@vâdance iournalière Auloævariarce ioumalière

0.8

0.6

,O 0.4

o.2

0
o 2 4 6 I 10 o 2 4 6 8 10

Frc. 8.10 - Evolution de la fonction objectif et des estimations des paramètres du NSRPM dans
sa version de base pour le mois de juillet à la station de Brest en fonction de I'autocovariance
journalière de décalageun.
8.3 Estimation des paramètres et fonction objectif IO

Lorsque la méthode d'estimation décrite dans la sous-section7.2.2 ne fonctionnait pas, nous


avons adapté la procédure explicitée au chapitre 7 en remplaçant I'autocovariance journalière de
décalage un par I'autocovariance semi-journalière (12h) de décalage un (de façon à augmenter la
valeur de I'autocorrélation). Cette légère différence dans le choix des moments semble avoir des
conséquencespositives sur les estimations des paramètres. En effet, les résultats sont beaucoup plus
cohérents pour les mois et les stations concernéspar ce changement dans la méthode d'estimation.
Ces mois et cesstations sont décrits dans le Tableau 8.3 et représententune proportion de 2L.2I%.
Seules les stations de Ziirich, Uccle et de Miami n'ont pas nécessité de modifications dans la
procédure d'estimation des pa,ramètres.Nous devons noter sur ce point que, même s'il aurait été
peut-être plus logique de considérer pour toutes les applications I'autocovariance semi-journalière
de décalageun (afin par exempled'utiliser le même ensemblede moments pour toute l'année), nous
avons préféré conserver, autant que possible, Ie choix des échelles horaires et journalières motivé
au chapitre 7. Il semblede plus que ce choix ait peu d'implications sur les résultats pour les mois
où. I'autocovariance journalière de décalage un est suffisamment élevée.

Tle. 8.3 - Mois et stations où la


a méthode alternative
VC d'estimation
n des amèt res a été appliquée.
Mois
Station
JFMAMJ JASOND
Zûrich
Uccle
Brest X
Lyon XXX
Marsei,lle XXXX
Tradeau XXXXX
Val d'Or XX
Mi,ami,
Seattle
Los Angeles XXX
Minneapoli,s XXXXXXX
76 Application du NSRPM incluant un lien entre l'intensité et la durée des cellules

Les valeurs de la fonction objectif donnent une mesure globale de I'adéquation du modèle. Cela
indique donc que les modèles qui minimisent cette fonction surpassent les autres modèles pour ce
critère (c'est-à-direI'adéquation du modèle aux propriétés statistiques considéréesdans la fonction
objective) et pour cette application. Il est important de souligner que plusieurs modèlesappliqués
ici incluent comme cas particulier le modèle de base où I'intensité des cellules est distribuée ex-
ponentiellement. Il s'agit des modèles gamma, FGM, Fcub et DD1 (les copules cubiques Sym2
et Asym2 n'incluant pas I'indépendance,voir Tableau 4.1). Cela signifie donc que, avec I'ajout
d'un paramètre supplémentaire, ces modèles devraient obtenir une valeur plus faible de fonction
objectif, ou au pire, égale. Dans le cas contraire, cela indique que I'algorithme d'optimisation a
rencontré des problèmes numériques importants (voir par exemple le modèle Fcub à Los Angeles
pour le mois d'août au Tableau C.14).

Pour chaque station, nous représentonsles valeurs minimales de fonctions objectif atteintes par
les différents modèles dans les Figures 8.11-8.13et en annexe dans les Figures C.1-C.8. Afin de
faciliter la lecture de ces fi.gures,nous ne dessinons pas les courbes associéesaux modèles FGM,
DD1 et DD2, la performance de ces modèles étant généralement inférieure aux autres modèles. Plus
précisément, la copule FGM semble être limitée par le degré de dépendancequ'elle peut reproduire
puisque ce modèle ne se distingue pas particulièrement. Il est aussi important de souligner que nous
avons rencontré de grandes difficultés à estimer les paramètres des modèles DD1 et DD2. Dans la
plupart des applications, le modèle DD1 est équivalent au modèle à cinq paramètres avec la loi
exponentiellesimple pour I'intensité des celluleset le modèle DD2 donne de très mauvaisesvaleurs
de fonctions objectif, ce qui semble montrer que cette distribution conditionnelle pour I'intensité
des cellulesn'est pas adaptée à Ia structure des donnéesde pluie considérées.De manière générale,
trois modèles semblent présenter de meilleures performances par leur adéquation aux moments
statistiques utilisés dans la méthode d'estimation des paramètres : les distributions gamma et de
Pareto pour I'intensité des cellules et la famille de copules Sym2 pour lier I'intensité et la durée
des cellules.Le NSRPM avec la distribution de Pareto donne par exemple de bons résultats tout
au long de I'année sur les donnéesde pluie de Zùrich (voir Figure 8.11), de Uccle (voir Figure
8.12), de Miami (voir Figure C.5), pour le début de l'année à Seattle (voir Figure C.6) et surpasse
nettement les autres modèles sur certains mois, par exemple pour le mois de Juillet à Marseille
(voir Figure C.3). Nous noterons cependantque la distribution de Pareto montre parfois seslimites
(voir Figure C.7) et que ces bonnes performancessont souvent surpasséespar d'autres modèles.
La distribution gamma pour I'intensité des cellules présente aussi des résultats intéressants,par
exemple dans le cas de I'application à Lyon (voir Figure C.2) et surpzrssetous les autres modèles
pour Ie mois de mars à Zùrich (voir Figure 8.11). Concernant les modèlesutilisant des familles de
copules cubiques, Ia famille Sym2 se distingue particulièrement. Elle minimise la fonction objectif
par rapport aux autres modèles de façon nette à de nombreusesreprises :

- pour les mois de mars, avril, mai, juin, août, octobre, novembre et décembreà Ztrich (voir
F i g u r e8 . 1 1 ) ;
8.3 Estimation des paramètres et fonction objectif 77

- pour les mois de janvier, février, mars, avril, juillet, septembre et novembre à Uccle (voir
F i g u r eB . 1 2 ) ;
pour les mois de avril, août et juin à Val d'Or (voir Figure 8.13);
pour les mois de septembreet novembre à Marseille (voir Figure C.3);
- pour les mois de juin, août, octobre et décembreà Seattle (voir Figure C.6) ;

pour les mois de mai et de décembreà Minneapolis (voir Figure C.B).

Nous notons également que la copule Asym3 donne des résultats intéressants dans certains cas,
par exemple pour le mois de janvier à Zùrich (voir Figure 8.11) ou le mois de décembreà Uccle
(voir Figure 8.12).

Les Tableaux 8.4 à 8.9 et en annexe les Tableaux C.1 à C.16 reportent les estimations des
paramètres pour les mois de janvier et août, pour chaque station. Nous pouvons ainsi examiner les
valeurs des paramètres qui minimisent la fonction objectif pour les mois de janvier et août, pour
toutes les stations. Par exemple, nous pouvons constater que lorsque la modèle avec la copule Sym2
surpasse les autres modèles au regard de la fonction objectif, le tau de Kendall atteint souvent
-0.4, ce qui est sa valeur minimale possiblepour cette structure de dépendance(voir Tableau 4.2).
Cette remarque se vérifie pour les mois de janvier et août à Zùrich (voir Tableaux 8.4 et 8.5), pour
le mois de janvier à Uccle (voir Tableau 8.6) ou pour le mois d'août à Val d'Or (voir Tableau 8.9).
Les estimations des paramètres À et B (relatifs au processus ponctuel proprement dit) sont très
stables. Les valeurs de ces paramètres varient peu d'un modèle à I'autre. Ce constat est cohérent
avec le fait que les différentes variantes du NSRPM considéréesici ne s'intéressent qu'aux propriétés
des cellules (durée et intensité) et pas à la distribution des origines de cellules. Le paramètre À
semble être directement lié à I'intensité moyenne de pluie, puisque i est faible lorsque la station
reçoit peu de pluie (en toute logique puisque les expressionsde I'espérancede I'intensité de pluie
sont linéaires en À). Les valeurs rencontrées pour B sont en général inférieures à 4 et se situent
en-dessousde 0.5. rj varie classiquementdans I'intervalle [0.5,5] fuo dans I'intervalle [1,15]. Il
"t
arrive cependant quelquefois que les estimations dépassentlargement les bornes supérieures de ces
intervalles. Pour plusieurs applications, les valeurs obtenues pour f tto sont très élevées (voir
"t
par exemple les Tableaux C.5, C.11, C.14 et C.15). Cela pose de nombreux problèmesnumériques
(voir par exemple les estimations pour la famille de copules Frank cubique (Fcub) dans le Tableau
C.14). Nous pouvons de plus nous questionner sur I'interprétation de ces paramètres lorsque par
exemple le nombre moyen de cellules par averse dépassela centaine, comme à Los Angeles pour
le mois d'août (voir Tableau C.14). Pour ces applications, aucun modèle ne se distingue vraiment
et la fonction objectif n'atteint pas des valeurs très faibles. Un début d'explication se situe dans
le fait que lorsque le modèle de Neyman-Scott produit un grand nombre de cellules très courtes
à chaque averse, les propriétés des distributions inhérentes à I'intensité des cellules se confondent
dans I'amas de cellules (voir chapitre 5). Dans ce cas, il est aussi probable que la façon dont le
modèle de Neyman-Scott distribue les origines de cellules n'est pas adapté.
78 Application du NSRPM incluant un lien entre I'intensité et la durée des cellules

Le NSRPM avec une distribution gamma pour I'intensité des cellules montre de très bons
résultats lorsque son paramètre de forme 7 est inférieur à 1. Par exemple, pour le mois d'août
à Brest (voir Tableat C.2), nous obtenons I : 0.13. Cela semble indiquer que, dans certains
cas, la forme des aversesnécessiteune distribution avec une dépendance de queue inférieure très
forte, que ne permet pas de reproduire une simple distribution exponentielle. Le modèle avec une
distribution gamma surpasse les autres modèles dans ces applications (par exemple pour le mois
d'août à Lyon, voir Tableau C.4 ou pour le mois de janvier à Miami, voir Tableau C.9) et fait
alors ressortir les limites de la distribution de Pareto ou des distributions construites à partir
de copules cubiques. Au contraire, nous observons parfois les limites de la distribution gamma
face aux autres modèles.Pour le mois de janvier à Brest, le modèle avecla distribution gamma est
presqueéquivalentau modèle de base avecla distribution exponentielle(voir Tableau C.7, i : 0.96
pour le modèle gamma). Rappelons que la distribution gamma est équivalente à une distribution
exponentielle lorsque son paramètre de forme 7 vaut 1. Pour cette application, c'est la copule Sym2
qui minimise la fonction objectif avec une dépendance négative (r : -0.25). Dans certains cas,
l'introduction de la dépendanceaméliore donc nettement l'adéquation du NSRPM à la structure
de la pluie, le plus souvent pour des dépendancesnégatives (pour le mois d'août à Seattle, voir
Tableau C.12 ou pour le mois de janvier à Minneapolis, voir Tableau C.15).

Le Tableau 8.10 reporte les meilleurs modèles(au sensde la minimisation de la fonction objectif)
pour chaque site et chaque mois. Nous notons ainsi qu'il est difficile de discerner d'éventuels
"patrons" mensuels. Ce résultat n'est pas surprenant et confirme la difficulté dans ce genre de
modélisation à obtenir des conclusionssystématiques.

Tee. 8.4 - Estimations des paramètres du NSRPM ô à Zûrich, les degrésde dépendance(tau de
Kendall Pearson p) et les valeurs
all r et rho de Pearson valeurs de la fonction O(Q) pour le mois de jjanvier.
obiectif O($)
fonction obiectif
Distribution de X À rl n
lJ t"o 1 t
'v T 0( ô )
Ind. Bxponentiel 0.0105 1 . 3 0 0.068 1 3 . 1 0 7.27 0 8.19e-004
Ind. Gamma 0.0106 1.33 0.068 1 1 . 8 3 7.4r L . 2 5 0 4.58e-004
Ind. Pareto 0.0105 r . 2 7 0.068 13.59 19.91 27.78 0 1.16e-003
Famille de copules À rl lto a. 0 I
o(ô)
FGM 0.0106 L . I 2 0.067 11.83 7.77 -0.50 -0.11 4.75e-004
Fcub 0.0106 1.08 0.067 11.65 L.14 -0.23 -0.15 4.72e-004
Sym2 0.0109 0.67 0.061 7.85 0.89 -0.61 -0.40 2.34e-004
Asym3 0.0107 0.92 0.065 9.86 1.05 -0.93 -0.20 1.30e-004
modèle DD À n o
L) lto ï cp o(ô)
DD1 0.0105 1 . 3 0 0.068 1 3 . 1 0 0.78 0.00 -0.00 8.19e-004
DD2 0.0105 0.92 0.094 2 L . L 4 8.79 2.55 -0.34 3.11e-002
8.3 Estimation des paramètres et fonction objectif 79

<ê.

\J

bo

Ftc. 8.11 - Logarithme de Ia fonction objectif pour les différents modèles testés à la station de
Zijrich. Les modèles où I'intensité et la durée des cellules sont des variables aléatoires indépendantes
sont indiqués en ligne pleine (avec des carrés pour la distribution exponentielle, des cercles pour
Ia loi gamma et des croix pour la loi de Pareto). Les copulescubiquessont dessinéesà I'aide d'une
Iigne pointillée (avec des carrés pour la copule Flank cubique, des cercles pour la copule Sym2 et
des croix pour la copule AsymS).
80 Application du NSRPM incluant un lien entre l'intensité et la durée des cellules

Tae. 8.5 - Estimations des paramètres du NSRPM $ à Zuti"h,les degrésde dépendance(tau de


Kendall r et rho de Pearson et les valeurs de la fonction objectif O($ ur le mois d août.
Distribution de X À Tl o ^l î 0(ô)
îto
Ind. Exponentiel 0.0156 2.07 0.729 4 . 7 6 0 . 2 8 0 4.09e-003
Ind. Gamma 0.0156 2.08 0 . 1 3 4 4.89 0.26 0.76 0 3.38e-003
Ind. Pareto 0.0157 2.04 0 . 1 3 7 4.99 24.79 9.47 0 1.76e-003
Famille de copules ) û
a
tto a 0 T o(ô)
FGM 0.0157 r .77 0.126 3.77 0.25 -0.59 -0.13 3.08e-003
Fcub 0.0158 1.44 0.122 3.31 0.22 -0.45 -0.30 1.51e-003
Sym2 0.0160 7.4r 0.125 3.38 0.20 -0.52 -0.40 4.32e-004
Asym3 0.0157 1.78 0.724 3.64 0.25 -0.69 -0.12 3.76e-003
modèle DD À n lJ lto J
r c p o(ô)
DD1 0.0156 2.07 0.129 4 . 1 6 3.52 0.00 -0.00 4.09e-003
DD2 0.0150 0.47 0.726 3.37 2 I . I B 1 . 6 1 -0.37 3.31e-003
8.3 Estimation des paramètres et fonction objectif 81

(€_
\J

bo

Mois

FIc. 8.12- Logarithme de la fonction objectif pour les différentsmodèlestestés à la station d'Uccle.
Les modèles où I'intensité et la durée des cellules sont des variables aléatoires indépendantes sont
indiqués en ligne pleine (avec des carrés pour la distribution exponentielle, des cercles pour la loi
gamma et des croix pour la loi de Pareto). Les copulescubiquessont dessinéesà I'aide d'une ligne
pointillée (avec des carrés pour la copule FYank cubique, des cercles pour Ia copule Sym2 et des
croix pour la copule Asym3).
82 Application du NSRPM incluant un lien entre I'intensité et la durée des cellules

Tae. 8.6 Estimations des paramètres du NSRPM / à Uccle, Ies degrésde dépendance(tau de
I r ret rho de Pearsonp) et les valeurs de la fbnction objectif O(Q) pov le mois de
Kendall ier.
Distribution de X ) rl lJ l-to a ^v T o(ô)
Ind. Exponentiel 0.0256 1 . 6 0 0 . 1 0 2 6.75 1 . 1 5 0 2.97e-003
Ind. Gamma 0.0259 1 . 6 1 0 . 1 0 0 6 . 7 4 L.25 1,.20 0 2.55e-003
Ind. Pareto 0.0255 1 . 5 8 0 . 1 0 3 7.08 2I.48 27.25 0 3.23e-003
Famille de copules À n ltP a 0 T o(ô)
FGM 0.0262 1 . 1 8 0.097 5 . 3 1 0.97 -0.85 -0.19 1.33e-003
Fcub 0.0268 O.BB 0.090 4.23 0.83 -0.54 -0.37 3.26e-004
Sym2 0.0269 0 . 8 5 0.089 4.r3 0.80 -0.65 -0.40 1.78e-004
Asym3 0.0263 1 . 1 3 0.095 5.07 0.95 -0.93 -0.20 1.32e-003
modèle DD À n lto
I
.l c p o(ô)
DD1 0.0256 1 . 6 0 0 . 1 0 2 6.75 0.87 0.00 -0.00 2.97e-003
DD2 0.0248 1 . 1 5 0 . 1 4 8 1 1 . 9 9 1 9 . 9 1 4.00 -0.37 6.2Ie-002

Tae. 8.7 - Estimations des paramètres du NSRPM / à Uccle, les degrésde dépendance(tau de
Pearsor p) et les valeurs de la fonction objectif (?(/ pour le mois d août.
Kendallll r et rho de Pearson
Distribution de X À rl p ttn a 'l T o(ô)
Ind. Exponentiel 0.0192 2.83 0 . 1 1 0 2.82 0.23 0 3.61e-003
Ind. Gamma 0.0192 2.89 0 . 1 2 8 3 . 8 1 0 . 1 9 0.62 0 6.01e-004
Ind. Pareto 0.0193 2.82 0 . 1 2 6 3.40 30.58 9 . 5 1 0 2.87e-004
Famille de copules À rl b ltn a 0 "r CI(ô)
FGM 0.0192 2.69 0 . 1 1 0 2.76 0.22-0.29 -0.07 3.27e-003
Fcub 0.0192 2.52 0 . 1 1 0 2.70 0.20-0.23 - 0 . 1 5 2.82e-003
Sym2 0.0192 3.39 0 . 1 3 3 4.02 0.251 . 3 8 -0.74 3.87e-004
Asym3 0.0192 2.72 0 . 1 0 7 2.66 0.27-0.42 -0.05 4.61e-003
modèle DD À 'tl IJ lto f c p o(ô)
DD1 0.0192 2.83 0 . 1 1 0 2.82 4.37 0.00 -0.00 3.61e-003
DD2 0.0190 3.40 0 . 1 3 2 4.32 1 1 . 3 9 0.88 0.43 1.41e-003
8.3 Estimation des paramètres et fonction objectif 83

,-Q..

\J
bo

Mois

Frc. 8.13 Logarithme de Ia fonction objectif pour les différents modèlestestés à Ia station de Val
d'Or. Les modèles où I'intensité et la durée des cellules sont des variables aléatoires indépendantes
sont indiqués en ligne pleine (avec des carrés pour la distribution exponentielle, des cercles pour
la loi gamma et des croix pour la loi de Pareto). Les copulescubiquessont dessinéesà I'aide d'une
ligne pointillée (avec des carrés pour la copule Flank cubique, des cercles pour la copule Sym2 et
des croix pour la copule Asym3).
84 Application du NSRPM incluant un lien entre I'intensité et la durée des cellules

Tae. B.B- Estimations des paramètresdu NSRPM / à Val d'Or, les degrésde dépendance(tau de
obiectif (2(@
KendallI r et rho de Pearsonp) et les valeurs de la fonction objectif 0(6) pour le mois de ianvier.
Distribution de X À rl a a .Y T 0(ô)
ûo
Ind. Exponentiel 0.0009 0.38 0 . 0 1 1 4.73 1.39 0 2.87e-004
Ind. Gamma 0.0009 0.39 0 . 0 1 2 4.34 1.44 1.08 0 2.74e-004
Ind. Pareto 0.0010 0.38 0 . 0 1 2 4.53 24.53 36.62 0 5.16e-004
Famille de copules ,\ n
n
lJ ltn o 0 I o(ô)
FGM 0.0009 0.37 0 . 0 1 1 4.66 7.37 -0.09 -0.02 2.62e-004
Fcub 0.0009 0.37 0.010 4.76 r.37 -0.04 -0.03 2.60e-004
Sym2 0.0008 0.46 0.008 7.32 L.46 1 . 5 6 - 0 . 1 0 6.15e-004
Asym3 0.0009 0.37 0 . 0 1 1 4.55 t . 3 2 -0.31 -0.02 2.15e-004
modèle DD À û
a
t-tn J c p o(ô)
DD1 0.0009 0.38 0 . 0 1 1 4.73 0.72 0.00 -0.00 2.BTe-004
DD2 0.0507 0.07 0.001 1 . 0 0 r0.42 1 . 9 6 -0.24 1.99e*000

Tas. 8.9 - Estimations des paramètres du NSRPM / à Val d'Or, les degrésde dépendance(tau
ndall r et rho de Pearson p) et les valeurs
de Kendall va de la fonction objectif (? /) pour le mois d' août.
Distribution de X À rl IJ l'rD a ^Y T o(ô)
Ind. Exponentiel 0.0198 3.25 0.273 4 . 1 5 0 . 2 0 0 L.04e-002
Ind. Gamma 0.0194 4 . 7 6 0.262 9.42 0 . 1 3 0.37 0 3.99e-003
Ind. Pareto 0.0194 5.93 0.297 1 0 . 1 8 74.25 4.58 0 1.09e-003
Famille de copules À n l-tn a 0 T o(ô)
FGM 0.0198 2 . 9 9 0.2L2 3.97 0.18 -0.44 -0.10 9.30e-003
Fcub 0.0199 2.5r 0.2L4 3.58 0.15 -0.45 -0.31 6.51e-003
Sym2 0.0199 4.L7 0.264 6.53 0.16 0.08 -0.34 2.61e-004
Asym3 0.0198 2.97 0.206 3.78 0.18 -0.55 -0.08 1.11e-002
modèle DD À rl p lto ï c p o(ô)
DD1 0.0198 3.25 0 . 2 1 3 4 . 1 5 5.08 0.00 -0.00 1.04e-002
DD2 0 . 0 1 9 1 7.69 0.286 14.98 15.74 0.47 0.55 2.51e-003
8.3 Estimation des paramètres et fonction objectif

€a
0)

<g

\J

€ ôl
- .-l ôl
- - ; c\l
d
ôl
-d
tô -
.-l
x Ë d
x
I F
I
I a
h (n
r % Èa>, !o^
orJ bo a a
I ôi ci ôn c'l -o ,.' ;
€ It z d
X
-
ôl
Ê-
X (Ë
>, h ri: X x >> >:P ri- cÉ X
- I a a a c,? Fi bo
I
I N j ôt
.-l
{6
lI o h X X X d
d x X X
zl (t) bo 0
- I
II ôl
.r ôn ôl
- !
ôtN
d lo d
x X d >,
cÈ X X > , >(n,
a I (n bo a a (n
I
- II ô:l
- .ôl Ôn .r .r ô! -o ôl
- .t<
L -
(nl >, Â:x >, d x-v
d
>' X
€l a 0 ap a
ql
a) d l ôl .ôl
.i _o ôl
$r
,a) . >: l t h - .-! ! d ri 9{
€ il
-.1
-
>r À: .i: }, d X _(JX
9r
.a)l ct) b0 bo na
q) AI
-l ôn ci -o .r 4 .'.
ôl
.i
rrl r
>: .v
X d X X xÂ-
qI (n CD LI boH
a
H
tal .ôl .ôl ôl ôl c\
ot. !d .1
a) x- l t > .i: }' ô. >, X X >, À: X >, d X
€l O a
-.'l H I
ol
- ûl ôl
d
ôl
d
ôl
- ôi
- ;- il
ô! -o
a Et<
- l >, >, X
bo
d X >5 -v
H ,OI a cl) O a a14
frl
c) él ôl
j

al>
d
-
aa
X X
-H !
d X X
Sr
c'3
æ >, d
ol) cn l-r, l.rr
a :l
cl
<* ;t.
(Elllr
()l X
-ôl ôl
.-l .i -
6 X X
! >, >,
(n x d d
bo
d çn a bo
- al
{)l
€ 'j ôl ôl N
d
€l

- .-l j -
\c)
o lFr >: ll
>, X X X X d d X x
H Y I
â,â a (t)
d l

d H I
c) ^-l I

€ {) (e
XI -
E to +J
d
.-l
€ a)
-
r.:
-r ;oll C)
a
()
d CN
É< €-J €
9i U)
I Fll
k ! o
.l
N
F-
aô ,-1 Fr À a Fl
r--{ \q)
lr
æ

a
d

F
86 Application du NSRPM incluant un lien entre I'intensité et la durée des cellules

8.4 Dépendance

Dans cette section, nous nous intéressons aux degrés de dépendance que reproduisent les
modèlesavec copulescubiques.Dans les Figures 8.14 et 8.15, nous représentonsle tau de Kendall
entre la durée et I'intensité des cellules avec Ia copule Sym2, pour les différentesapplications (en
considérantdeux ensemblesde stations, c'est-à-direl'Europe et I'Amérique du Nord). Il est à noter
que le tau de Kendall est compris dans l'intervalle 10.4006,0.3533] pour cette copule (voir Tableau
a.2). La borne inférieure de cet intervalle est atteinte de nombreusesfois, par exemple pour les
mois de janvier, avril, août et décembre à Ztrich (voir Figure 8.14) ou les mois de mai, juillet,
août et novembre à Tfudeau (voir Figure 8.15). Le lien entre l'intensité et la durée des cellules
est très nettement négatif dans de nombreux cas, même si ce lien n'est mesuré qu'indirectement
(voir chapitre 5). À Seattle et à Tfudeau, le degré de dépendanceest très proche de -0.4 tout au
iong de I'année (excepté en Février à Tludeau), suggérant que le lien pourrait être parfois plus
fortement négatif s'il n'était pas limité par la structure des copulescubiques.Bien qu'il est en règle
générale négatif, comme nous pouvons en avoir I'intuition (une cellule est d'autant plus courte
que son intensité est élevée), le degré de dépendance est parfois nettement positif. Par exemple,
pour le mois d'août à Marseille (voir Figure 8.14), le tau de Kendall s'élève à 0.3433. De plus,
pour cette application et ce mois particulier, le NSRPM avec la copule Sym2 surpasse les autres
modèles au niveau de la fonction objectif (voir Tableau C.6). Cela suggèreque cette dépendance
positive n'est pas due à un problème dans Ia procédured'estimation des paramètres.Cependant, Ie
fait que le tau de Kendall puisse varier énormément d'un mois à I'autre comme à Marseille semble
peu vraisemblable en pratique. Nous pouvons alors nous demander ce qui cause cette irrégularité.
l{otre opinion est que cette variation est liée aux difficultés à estimer les paramètr"s. À Marseille,
nous pouvons par exemple constater que les valeurs de fonction objectif varient beaucoup d'un
mois à I'autre, tout comme le tau de Kendall. Il suffit pour s'en persuader de comparer les figures
8 . 1 4e t C . 3 .

Il n'est pas possible d'appliquer un test d'hypothèse afin de vérifier la significativité des valeurs
obtenuespour le tau de Kendall puisqu'ellesne sont pas observéesdirectement. Cependant, nous
remarquons sur les Figures 8.14 et 8.15 que le tau de Kendall se situe très rarement autour de
0, justifiant la pertinence de la prise en compte de la dépendanceentre la durée et I'intensité des
cellules.

Dans I'Annexe C.2,les Figures C.9 à C.i4 représententle tau de Kendall correspondant aux
copules Fcub, Asym3 et FGM pour les différentes applications. Les remarques précédentesrestent
valides, mais elles sont cependant moins visibles pour les copules Asym3 et FGM puisque le degré
de dépendanceque peuvent reproduire ces deux structures de dépendance est limité (voir Tableau
4.2).
8.4 Dépendance 87

0.4

0.3

o.2

0.1

/ri

-0.1

b..

-o.2

-0.3

123456789r01112
Mois

FIc. 8.14 - Tau de Kendall (mensuel)entre I'intensité et la durée des cellulesavec la copule Sym2
pour Ies stations de Zûrich, Uccle, Brest, Lyon et Marseille. Des lignes en pointillé indiquent les
bornes du tau de Kendall pour cette copule.
88 Application du NSRPM incluant un lien entre I'intensité et la durée des cellules

^i
T1
-1
o
i\
il
,l
:l
9(J- 0 .
t.-
il 9
:/ -,
,t
l.

:/:
:/ j -r!
.r!
;/ : ,l

- - ,i l- - . - - - t - - '
ii

FIc. 8.15 - Tau de Kendall (mensuel)entre I'intensité et la durée des cellulesavec la copule Sym2
pour les stations de Tludeau, Val d'Or, Miami, Seattle, Los Angeleset Minneapolis. Des lignes en
pointillé indiquent les bornes du tau de Kendall pour cette copule.
8.5 Extrêmes 89

8.5 Extrêmes

Comme indiqué par Onof et al. (2000), une des faiblessesmajeures du NSRPM dans sa version
de base est la reproduction des valeurs extrêmes. Une tendance généraleprésente dans la littérature
de la modélisation stochastique de la pluie est la sous-estimation des valeurs extrêmes à une
échellehoraire (Entekhabi et a|.,1989). La capacité du modèle à reproduire les extrêmesconstitue
pourtant un aspect prépondérant du point de vue de la gestion des risques. Afin de visualiser
les performances des différents modèles concernant ce critère, nous simulons 100 séries de pluie
d'une durée de 100 ans) pour chaque modèle et chaque station. Nous calculons ensuite Ies maxima
annuels à des échelleshoraires et journalières. Qu'il s'agissedes donnéesobservéesou simulées,
nous considéronsles maxima sur les donnéeshoraires ou journalières brutes, c'est-à-dire que nous
n'appliquons pas de fenêtres mobiles. Ces dernières sont souvent utilisées afin de construire des
courbes Intensité-Durée-FYéquence(IDF) et exigent des données enregistrées à un pas de temps
très inférieur à I'heure. Dans notre cas, les sériesgénéréessont découpéesen tranches d'une heure
(ot24 heures).Les cumuls de pluie sont ensuite estiméssur chacunede cesdurées.Finalement, le
maximum pour chaque année est retenu, à un pas de temps horaire et journalier.

Les Figures B.18 à 8.21 (et les Figures C.15 à C.26 dans l'Annexe C.3) permettent de compa-
rer les maxima observés et simulés pour les différents modèles considérés et pour chaque station.
L'abscissedonne la période de retour en annéessur une échellede Gumbel. Nous utilisons essen-
tiellement cette échelle afin de faciliter la représentation des maxima et nous ne prétendons pas ici
que la distribution de Gumbel modélise adéquatement les valeurs extrêmes de pluie. En réalité, de
récentesanalyses(voir par exempleKoutsoyiannis, 2004; Neppel et a\.,2006) tendent à démontrer
au contraire que la distribution de Gumbel n'est en général pas appropriée pour modéliser les
maxima annuels de pluie. Les quantiles empiriques des maxima sont obtenus avec la formule de
Hazen Êlt i*f] : (k - 0.5)ln or) t'[r1 est le maximum annuel à une échelle horaire ou journalière cor-
respondant au rang k. Un intervalle de confiance empirique à 95% des maxima simulés est obtenu
à partir des 100 simulations de 100 ans. Nous pouvons observerI'importance du type et du degré
de dépendance en examinant les intervalles de couverture empiriques.

De manière générale, nous retrouvons une sous-estimation des extrêmes annuels à une échelle
horaire pour les périodesde retour de 1 à 10 ans (voir par exemple les Figures 8.19, 8.21 ou C.1B).
Les valeurs extrêmes à une échelle journalière sont bien restituées par les différents modèles dans
la plupart des cas (voir Figures 8.16, 8.18, 8.20 et C.29). Ils sont cependant sous-estiméspour les
périodesde retour de 1 à 10 ans à Val d'Or (voir Figure C.21) et à Los Angeles (voir Figure C.27)
et pour les périodes de retour de 5 à 100 ans à Miami (voir Figure C.23). À Lyott, les maxima
annuelsjournaliers observésne semblent pas suivre une loi de Gumbel. En effet à la Figure C.17,
les maxima observés ne décrivent pas une droite mais plutôt une tendance logarithmique. Or il
semble que le NSRPM reproduise presque systématiquement des maxima selon une distribution de
90 Application du NSRPM incluant un lien entre l'intensité et la durée des cellules

type Gumbel. Dans ce cas particulier, les maxima journaliers observéssont ainsi surestiméspour
les périodes de retour Ies plus fortes.

La distribution de Pareto pour I'intensité des cellules reproduit mieux Ies extrêmes que les
autres modèles dans plusieurs cas, par exemple à Miami pour les échelles horaire et journalière
(voir Figures C.23 et C.24) ou à Brest (voir Figure C.16) et Minneapolis (voir Figure C.30) à
une échelle horaire. De plus, I'intervalle de confiance empirique obtenu à partir des 100 répétitions
de simulations de 100 ans est plus large avec la distribution de Pareto, ce qui permet de mieux
couvrir les extrêmesobservés.Les modèlesavecdépendanceentre I'intensité et la durée des cellules
donnent de bons résultats à Zûrich avec les copulescubiquesFcub et Sym2 (voir les Figures 8.16
et 8.17). Le modèle DD1 livre des résultats très décevantsà de nombreusesreprises,par exemple
à Tîudeau et Val d'Or à une échellejournalière (voir Figures 8.20 et C.21). À Seattle et à Los
Angeles, les maxima simulés à partir du modèle DD1 sont complètement aberrants et surestiment
très fortement les maxima observés(voir les Figures C.25 à C.2B).

Nous avons également jugé pertinent de procéder à un plan de simulation de séries de pluies
annuelles en sélectionnant les meilleurs modèles mois par mois. La station choisie est Lyon car, à
cette station, les meilleurs modèles sont très divers d'un mois à I'autre. La construction de ce "méga-
modèle" utilise ainsi les modèles indiqués au Tableau 8.10. Les Figures 8.22 et 8.23 permettent
donc de comparer les maxima horaires et journaliers observéset simulés pour ce "méga-modèle" à
Lyon (à compareî avec les Figures C.17 et C.1B obtenuespour chaque modèle séparément).Nous
notons qu'il semble y avoir une amélioration intéressante de la reproduction des extrêmes horaires
pour les périodes de retour les plus faibles, ce qui indiquerait Ia pertinence d'utiliser les modèles qui
montrent les meilleures performances pour chaque mois, et non pas un unique modèle pour toute
l'année. Généralement,nous avons vu (voir Tableau 8.10) qu'un modèle peut donner de très bons
résultats certains mois, et de beaucoup moins bons pour d'autres (à titre d'exemple, le modèle
sans dépendance avec distribution de Pareto à Los Angeles s'avère le plus performant en décembre
mais le pire en avril et en mai, voir Figure C.7).
8.5 Extrêmes 91

lnd. Exp. lnd. Gamma lnd.Pareto

E E 150 E
E E. E
-c Ë roo .9
:
:À À o-

2 10 2 't0 50100 2 10 s0 100


50100
Péliodede retour lannéesl Périodede retour [annéêsl Pé.lodede retour lannéesl
FGM FrankCub. Sym2

E E E
ç E E
.9 .9 .9
! = :
o- À À

2 10 5 01 0 0 2 10 50100 2 10 s0 100
Pérlodede retour [annees] Pérlodede retour lannées] Pé.iodede retour lannéesl
Asym3 DD1 DD2
200

E lcu
E 150 a
E .E E
Ë roo '$ roo .c
E
È À À
50 5U

2 10 2 'lo 50100 2 10 50100


5 01 0 0
Périodede.etour [annéês] Pérlodede retour [annéæ] Pé.iodede retour lannéesl

FIc. 8.16 - Maxima annuelsjournaliers à Zùrich. L'abscissedonne Ia période de retour en années


sur une échelle de Gumbel. La courbe en trait continu avec les symboles * représente les maxima
observés.Les courbes en trait pointillé représentent la moyenne (avec o) et un intervalle de confiance
empirique à 95% des maxima simulés obtenus à partir de 100 simulations de 100 ans.
92 Application du NSRPM incluant un lien entre I'intensité et la durée des cellules

Ind.Exp. lnd. Gamma


't00

80
Ê a Ê
E F
ô0
E
.c o .9
:È a
À 40
i
o.

20

2 10 50100 2 1Q 50100
Périodede retour lannéesl Périodede retour [annéesl

FrankCub. Sym2
100 100

-80 80
Ê Ê E
Éoo E E
ô0
.9 .9 .9
J : :À 40
ô.
d40

20
Æ'e:l 20

2 10 50100 2 10 50100
Périodede retou. lannês] Pé.lodede retour lannées]

Asym3 DDz
100 100

-80 80
E E Ê
Eoo E E
60
.9 .9 .9
: .o t !
d40 À 40
f 9."-
G

20 20

2 'to 50100
2 10 50100 2 10 50100
Pérlodede retour lannéesl Pé,iodede.etou. lannéesl Périodede.etour lannéesl

FIc. 8.17 Maxima annuels horaires à Zùrich. L'abscissedonne la période de retour en années
sur une échelle de Gumbel. La courbe en trait continu avec les symboles f représente les maxima
observés.Les courbes en trait pointillé représentent la moyenne (aveco) et un intervalle de confiance
empirique à 95% des maxima simulés obtenus à partir de 100 simulations de 100 ans.
8.5 Extrêmes 93

Ind. Exp. lnd. Pareto


140
120
t ç E roo
E E E
.g .9 Ëa B o
! !
À À d60

2 10 50100 2 10 50100
Périodêde retour [annéesl Périodede retour lannées]
FrankCub. Sym2

F E
E E
.9 .9
2 t
À À

2 10 50100
Périodede retour [années]
DD1
'140

120
E 100 E E
E E E
(, 80 .9 .9
e
È 60 :G !
o.
40
20
2 10 2 't0 50100 2 10 s0 100
50100
Périodedê retour lannêsl Pérlodede retour lanneêsl Périodede retour lannées]

FIc. 8.18 - Maxima annuelsjournaliers à Uccle. L'abscissedonne la période de retour en années


sur une échelle de Gumbel. La courbe en trait continu avec les symboles * représente les maxima
observés.Les courbes en trait pointillé représentent la moyenne (avec o) et un intervalle de confiance
empirique à 95% des maxima simulés obtenus à partir de 100 simulations de 100 ans.
g4 Application du NSRPM incluant un lien entre I'intensité et la durée des cellules

Ind.Exp. lnd. Gamma lnd.Pareto


70 70
60 60
-50
E E E
E40 E E 40
.9 ^^ .9 .9
!JU :À :o.
d
20 20
.t0
10

2 'lo 50 100
Péliode de retour lannéesl

FGM
70 70
60 60
-50 -50
E Ê E
g40 E+o E
o
'5
30
.c ^^
fJU
.g
t
À E À
20 20
10 10

2 10 s0 100 2 10 50100 2 10 50 100


Périodede retour [annéesl Périodede retour lannées] Pérlodede retour lannées]

Asym3 DD1 DD2


70 70
60 60 60
-50 50 -50
E E E
E40 E 40 E40
o
'5 .9 o
30 : 30 E30
À À G
20 20 20
10 10 10

2 10 50100 2 10 50't00 2 10 50 100


Pérlodede retour [annéesl Pérlodede retour [annéæ] Pérlodede retour lannées]

FIc. 8.19 - Maxima annuels horaires à Uccle. L'abscissedonne la période de retour en années
sur une échelle de Gumbel. La courbe en trait continu avec les symboles * représente les maxima
observés.Les courbes en trait pointillé représentent la moyenne (aveco) et un intervalle de confiance
empirique à 95% des maxima simulés obtenus à partir de 100 simulations de 100 ans.
8.5 Extrêmes 95

Ind. Exp. lnd. Gamma

E E 150 E
a
.E E
.c .3roo :" ^..o .9
!
À À :È

2 10 50100 2 10 50100 2 'lo 50100


Périodede retour lannées] Périodede retour lannéêsl Pérlodede retour [annéesl
FGM FrankCub. Sym2
200

a E 150 E
E .E E
o
= .o .$ roo .9
:
o. À À
50

2 10 50100 2 10 50100 2 'to 50100


Périodede retour [annéês] Pé.iodede relour lannéesl Pérlodede retour lannées]
Asym3 DD'I DD2
200 200

E rso E 150 E
, .E E

E'*
G
.$ roo
À
.9
:
4

50 50

2 10 50100 2 10 50100 2 10 50100


Pé.iodede retour lannéesl Périodede retour [années] Périodede relour lannéesl

Frc. 8.20 - Maxima annuelsjournaliers à T[udeau. L'abscissedonne la période de retour en années


sur une échelle de Gumbel. La courbe en trait continu avec les symboles f représente les maxima
observés.Les courbes en trait pointillé représentent la moyenne (avec o) et un intervalle de confiance
empirique à 95% des maxima simulés obtenus à pa.rtir de 100 simulations de 100 ans.
96 Application du NSRPM incluant un lien entre I'intensité et la durée des cellules

Ind. Exp. Ind.Gamma Ind. Pareto

80

E60 E E
E E E
o .c -9
=40 ! !
À À c

ta-o'
5'o' 5o' 't0
2 10 50100 2 10 50100 2 50100
Pérlodede retour lannées] Périodede retour lannéesl Périodede retour lannées]

FGM FrankCub. Sym2

80

É E Eoo o
E E E
.9
a
.9 o
'E 40
!
È À o.
20

2 10 5 01 0 0 2 10 50100
Périodede retour [années] Pérlodede retour lannéesl

DD1 DD2

80

E E E60
E E E
.9 .9 ;,
'-
! 3 40
o. G À
20

'lo
F,o'
2 50 100 2 10 50100 2 10 50100
Pérlodede retour [annéesl Périodede retoul lannéesl Périodede retour lannéesl

Ftc. 8.21 - Maxima annuels horaires à Tfudeau. L'abscissedonne la période de retour en années
sur une échelle de Gumbel. La courbe en trait continu avec les symboles f représente les maxima
observés.Les courbes en trait pointillé représentent la moyenne (aveco) et un intervalle de confiance
empirique à 95% des maxima simulés obtenus à partir de 100 simulations de 100 ans.
8.5 Extrêmes 97

E
E
.9
2
À

10
Pé.lode de retour [années]

Ftc. 8.22 - Maxima annuelsjournaliers à Lyon avecle "méga-modèIe".L'abscissedonne la période


de retour en années sur une échelle de Gumbel. La courbe en trait continu avec les symboles *
représente les maxima observés.Les courbes en trait pointillé représentent la moyenne (avec o) et
un intervalle de confiance empirique à 95% des maxima simulés obtenus à partir de 100 simulations
de 100 ans.
98 Application du NSRPM incluant un lien entre l'intensité et la durée des cellules

E
E
.e
!
4

10
Périodede retour lannéesl

Ftc. 8.23 - Maxima annuels horaires à Lyon avec le "méga-modèIe".L'abscissedonne la période


de retour en années sur une échelle de Gumbel. La courbe en trait continu avec les symboles *
représente les maxima observés.Les courbes en trait pointillé représentent la moyenne (avec o) et
un intervalle de confianceempirique à95% des maxima simulésobtenus à partir de 100 simulations
de 100 ans.
8.6 Conclusion 99

8.6 Conclusion

Les nombreuses applications réalisées ont permis de dresser un portrait global des perfor-
mances des diverses variantes du modèle de Neyman-Scott pour différents types de climats. Le
grand nombre de stations étudiées a permis de mettre en évidence certaines difficultés dans la
procédure d'estimation. Lorsque I'autocorrélation journalière de décalage un est trop faible, la
méthode généraliséedes moments est instable. Cela nous a conduit à remplacer I'autocovariance
journalière de décalageun par I'autocovariancesemi-journalière (12h) de décalageun dans les
propriétés statistiques prises en compte dans la méthode des moments.

Nous retiendrons de ces applications que le modèle avec la copule cubique Sym2 donne de très
bons résultats sur l'adéquation du modèle aux propriétés statistiques utilisées dans l'estimation
des paramètres. Pour ce critère, les modèles avec les distributions de Pareto et gamma peuvent
également donner de bons résultats dans certains cas. La copule cubique semble permettre de re-
produire les caractéristiques temporelles de la pluie grâce à sa capacité à modéliser des dépendances
négatives.Nous nous apercevonsd'ailleurs que le tau de Kendall entre l'intensité de la durée des
cellules (lié à I'estimation du paramètre de la copule Sym2) est très souvent négatif.

Les valeurs extrêmes sont généralement bien reproduites par la plupart des modèles à une
échelle journalière. À utre échelle horaire, nous retrouvons parfois une sous-estimation des valeurs
extrêmes, qui peut être importante pour les périodes de retour de 1 à 10 ans. Il semblerait alors
qu'en simulant les séries annuelles à partir des meilleurs modèles pour chaque mois, les valeurs
exbrêmessoient mieux restituéespour ces périodesde retour.

Une hypothèse sous-jacente à la formulation du modèle avec I'intensité et Ia durée des cellules
dépendantes était que ce lien devait permettre une meilleure reproduction des extrêmes. En ef-
fet, nous pouvions nous attendre à augmenter la capacité du modèle à produire des événements
intenses puisque des cellules de courte durée accordent dans ce cas des probabilités plus fortes
aux intensités élevées.D'après les résultats de ce chapitre, nous concluons qu'il n'en est pas
systématiquement ainsi. Cependant, nous constatons également que la dépendance est presque
systématiquement négative, et que le degré de dépendance atteint souvent la borne inférieure de
I'intervalle de dépendance couvert par les copules cubiques. Nous pouvons alors supposer que des
formes de dépendance atteignant des degrés de dépendance plus faibles encore auraient permis
d'améliorer la performance de ces modèles, et notamment une meilleure reproduction des valeurs
extrêmes en serait sans doute amélioré.

Le modèle avec la distribution de Pareto sur I'intensité des cellules permet de réduire la sous-
estimation des valeurs extrêmes pour les périodes de retour les plus fortes dans plusieurs cas,
vraisemblablement grâce à sa queue supérieure de distribution lourde. Fort de cette constatation,
100 Application du NSRPM incluant un lien entre I'intensité et la durée des cellules

une idée intéressante serait de combiner la distribution de Pareto avec une copule permettant de
reproduire des degrés de dépendance très fortement négatifs. Cependant, même si la théorie des
copulespermet directement de construire une telle distribution (voir chapitre 4), I'application d'un
tel modèle est difficile à envisager puisque le calcul des moments se heurterait alors à de grandes
difficultés.

Il est important de souligner qu'il est également possible que les difficultés à reproduire des
valeurs extrêmes soient dues à des propriétés extérieures à celles étudiées dans cette thèse. Pa,r
exemple, Ia distribution de la durée des cellules a été souvent modifiée dans la littérature et
semble avoir un impact sur la reproduction des valeurs extrêmes (voir Onof & Wheater, 1994;
Chandler & Onof, 2005). Comme nous I'avons vu, ce sont le plus souvent des contraintes calcu-
latoires qui limitent les généralisations, mais nous pourrions également penser que le processus
ponctuel pourrait être modifié de manière à améliorer les propriétés du modèle. Par exemple si
le processusde Poisson était généraliséà un processusde renouvellement (voir chapitre 2), cela
permettrait peut-être à des averses de se succéder plus fréquemment, et de donner lieu à des
événementspluvieux très intenses. Nous pourrions supposer qu'une loi gamma à la place d'une
loi exponentielle pour régir la distance entre les origines des cellules et celles des aversescorres-
pondantes permettrait I'occurrence de nombreusescellules très proches tout en autorisant qu'elles
soient disperséesdans d'autres cas (afin de générerdes aversesstratiformes). Les idées sont nom-
breuses mais leurs applications demeurent limitées par les expressionsmathématiques à résoudre
qu'elles impliquent (voir Onof, 2003).
Chapitre I

Un modèle de Neyman-Scott
non-stationnaire

9.1 Introduction

Une des hypothèses fondamentales sur laquelle se base le modèle de Neyman-Scott concerne la
stationnarité des sériesde pluie générées.Cependant, la grande majorité des scientifiques intéressés
par le climat semblent maintenant s'accorder sur I'existence d'un changement climatique exhibant
des tendances nettes dans les séries de température et de précipitation. Ces hypothèses sont forte-
ment appuyées par Ie quatrième rapport d'évaluation (AR4) du Groupe d'experts Intergouverne-
mental sur l'Évolution du Climat (GIEC, 2007).Il sembledonc naturel de reconsidérerle postulat
de stationnarité et d'explorer les possibilités d'introduire une non-stationnarité dans les modèles
de pluie.

Les modifications des propriétés de la pluie induites par Ies changements climatiques sont très
complexes et de nombreux efforts doivent encore être mis en oeuvre pour bien les comprendre,
le phénomène pluvieux étant très variable spatialement et temporellement. Selon Tlenberth et al.
(2007, voir troisième chapitre du groupe de travail I du quatrième rapport d'évaluation (AR4)
du GIECI) , les obseruat'ionsmontrent que les changements'intera'iennenten quanti,té,i,ntensi,té,
fréquence et type de préci,pi,tations.Des tendancesà long terme très prononcées de 1900 à 2005
ont été obseruéespour les préci,pi,tationstotales dans plus'ieurs endroits : signi,ficati,aement
plus
humi,de dans le Nord-Est et Ie Sud de I'Amérique, I'Europe du Nord et dans I'Asi,e centrale et

tdisponible à h t t p : / / u w w . i p c c . c h l p d r , uâ s s G S . : ' r r ê Tr let p


- ort/ar4/wgI/ar4-wgl-chapter3.pdf, dernière
consultation le 7 août 2008
102 Un modèle de Neyman-Scott non-stationnaire

d,u Nord,, mais si,gnificat'iuementplus sec dans Ie Sahel, le sud de I'Afrique, la Méditerranée et le
sud de I'As,ie. Les précipitati,onstombent ma'intenant en plus grande quanti'tésousforme de plui'e
que sous forme de nei,gedans les régions nordiques. Au cours des dernières années, de nombreux
articles ont montré des tendances dans les séries de précipitations (voir par exemple Karl ef al.,
1995), principalement à un pas de temps journalier. En Amérique du Nord, nous pouvons entre
autre citer les contributions de Karl & Knight (1998) aux États-Unis et Vincent & Mekis (2006)
au Canada.

De nombreux articles tendent à démontrer également la présencede tendances dans les extrêmes
journaiiers (mensuelsou annuels). Plusieurs études ont montré que cestendances existaient à partir
de difiérents jeux de données dans Ie monde. Le lecteur pourra consulter Arnbjerg-Nielsen (2006)
au Danemark, Hundecha & Bârdossy (2005) en Allemagne, Schmidli & F}ei (2005) en Suisse,
Iwashima & Yamamoto (1993) au Japon, Zhai et al. (2005)en Chine, New et al. (2006)en Afrique,
Plummer et al. (1999) en Australie et Nouvelle-Zélandeet enfin Vincent & Mekis (2006) au Ca-
nada. Si I'on considère des pas de temps inférieurs, Vaes et al. (2002) analysent une série de pluie
de 100 ans (la résolution temporelle variant du jour à dix minutes) en Belgique, sans détecter de
tendances significatives. Rauch & DeToffol (2006) analysent des séries jusqu'à une résolution de
cinq minutes en Autriche, au Danemark et en Allemagne. Blanckaert & Willems (2006) détectent
des cycles dans l'occurrence des valeurs extrêmes à partir de I'analyse d'une série de pluie à un
pas de temps de dix minutes. La nature souvent chaotique des précipitations complexifie I'observa-
tion de ces changements(GIEC,2007). Si les multiples dimensionsqui influencent ce phénomène
(région, saison, effet inter-annuel) sont prises en compte, des schémasclairs dans les dynamiques
des précipitations sont difficiles à exhiber. La principale difficulté de l'analyse des tendances pour
les extrêmes demeure toutefois les séries courtes et la srande variabilité de ces événements.

Concernant I'aspect prévisionnel pour le 21iè'" siècle, le résultat central des modèles clima-
tiques est que I'augmentation croissante des concentrations de gaz à effet de serre et d'aérosols,
ainsi que des changements dans I'aménagement du territoire affectent directement les processus
d'interaction dans I'atmosphèreet les dynamiquesde pluie (voir par exempleAvissar & Liu, 1996).
Avec I'augmentation de la température, il est plus probable que les précipitations tombent sous
forme de pluie plutôt que de neige dans certaines régions (par exemple au Québec), spécialement
en automne et au printemps au début et à Ia fin de la saison neigeuse, et dans certaines zones
où les températures sont proches de zéro (GIEC, 2007). Cependant, les impacts appréhendés sur
les précipitations vont bien au-delà de la simple augmentation de la quantité de pluie en hiver.
Nlailhot et al. (2007) présentent un compte-rendu de l'état de la situation au Québec en ce qui
concerne I'analyse des tendances, les impacts des changementsclimatiques sur les précipitations et
Ia modélisation climatique.

À notre connaissance,il y a très peu d'articles qui concernentle domaine de la modélisation


non-stationnaire en temps de Ia pluie. Cela souligne sans doute la difficulté d'une telle approche et
9.2 Le processus de Poisson non-stationnaire avec amas de cellules 103

la complexité à valider de tels modèles. Nous notons cependant la contribution de Sansd & Guenni
(2000) qui tiennent compte de la non-stationnarité à la fois dans le temps et dans I'espace.Le
modèle proposé représente I'intensité de pluie observée par une variable latente tronquée qui suit
un modèle linéaire dynamique multivarié. Cette structure leur permet de tenir compte de la saison-
nalité, des tendances et des corrélations spatiales à travers les paramètres du modèle. La validation
de ce modèle est ensuite exécutéesur des donnéesagrégéesà un pas de temps de dix jours. Cet
article ne met cependant pas I'emphase sur la reproduction des tendances observéesdans les pro-
priétés de la pluie et n'exploite pas le potentiel théorique du modèle.

Nous proposons dans ce chapitre de nouveaux développements des modèles de pluie basés sur
les processusponctuels qui considèrent une fonction de non-stationnarité pour I'arrivée des averses
et qui supposent que les averses seront plus fréquentes dans Ie futur. Cette hypothèse est en
accord avec I'augmentation des précipitations annuelles moyennes. Afin de formuler correctement
ce modèle de Neyman-Scott non-stationnaire (NSRPM-NS), la théorie de base de Cox & Isham
(1980) est reconsidéréeet les moments sont calculésjusqu'au troisième ordre dans le cas général
puis avec une fonction simple pour les arrivées des averses.Cependant, ces développementsmettent
en lumière d'autres difficultés dans Ia façon dont les moments théoriques peuvent être liés aux
moments empiriques. Si on considère que les propriétés statistiques varient dans le temps, le calcul
des moments empiriques n'est plus direct. Dans les sections9.4 et 9.5 de ce chapitre, une méthode
d'estimation des paramètres est proposéeet discutée.

9.2 Le processus de Poisson non-stationnaire avec amas de


cellules

Les modèles de Poisson avec amas de cellules (cluster) que nous avons présentésjusqu'à présent
supposent que les origines d'aversesse produisent selon un processusde Poisson de taux À constant.
Nous désirons ici introduire une fonction <p(t)telle que le taux d'arrivée des aversessoit dépendant
du temps. Nous devonssouligner ici qu'il s'agit d'une façon très particulière d'introduire une non-
stationnarité, puisque nous modifions la fréquence des aversesmais pas leur intensité. Une autre
façon de modifier Ie NSRPM serait de considérer une dépendance temporelle dans la génération
des intensités de cellules. Cependant, la nécessitéd'obtenir des expressions analytiques (afin d'es-
timer les paramètres par la méthode des moments, voir section 9.5) nous contraint à retenir des
hypothèses très simples pour la forme de la non-stationnarité. Nous modifions donc les relations
(2.3) et (2.a) de telle façon que Ie processusde Poisson de taux p(t) est maintenant défini de la
manière suivante, pour tout f, quand ô -- 0+ :

Pr{l/(t,, + ô) : Ll'}lt} : e(t)6 + 0(6), ( e.1)


Pr{N(f, t + ô) > tlllt) : o(6), (e.2)
ro4 Un modèle de Neyman-Scott non-stationnaire

où cp(t) est une fonction à déterminer. Nous conserveronsles mêmes notations que dans Ie reste
du document pour les autres variables aléatoires (voir chapitre 3).

9,2.L Moment du premier ordre

Comme nous l'avons mentionné au chapitre 6, une des propriétés des processusponctuels se
rapporte à l'indépendanceentre la génération du processusponctuel d,^f(t - u) et la distribution
de l'intensitéX;,(u). D'après Cox & Isham (1980,p.75) et les équations(9.1-9.2),nous obtenons
E{,Af(r,r+ô)} : p,og(t)6. En particulier, l'espérancede I'intensité de pluie au temps t est :

(r*')
E{v(f)}:E -
t J,:oxt_"(u)dl/(,") }
/Poo
: E{dN(t - ,rl)}
J,:oE{X1-"(u))
/- - u)du'
:ro (e.3)
J,:oB{X1-"(u)}e(t

L'espérancede processusagrégéY;h s'obtient à partir de I'expressionsuivante

E(4n): ['n E{v(r)}dr. (e.4)


J (i.-r\h.

9.2.2 Variance et Autocovariance

L'autocovariancede décalager de I'intensité de pluie instantanéeY(t) peut être exprimé (voir


Rodriguez-Iturbe et a1.,1987b, équation 3.2) en fonction de la covariancedu processusponctuel
c(t,u): Cov {lr(t, f f ô1),N(, + u,t I u1 6r)} commesuit :

cov{y(r),y(t +r)} : [* [* E{x;,(u) xr*"-,(r)}c(t,r - u * u)dudu.


Jo Jo

Les propriétés du second-ordre du processusagrégésont alors obtenues avec les relations suivantes :

,(fih'l
Var({h):Yarl I v(r)drl
\ J(r_t)h )

- 2 tt Y(t+r)}dtdr,
cov{Y(r),
JJ
(i-1)h<t<ih
O1r(i.h-t
9.2 Le processus de Poisson non-stationnaire avec amas de cellules 105

. rih f (i+k)h \
:Cov{ v(t v(r)dr
\ JI 1t-t1n )dt,JI( i + k - l ) h
Cov(Ynh,Y,Àno) I
)

: JJ Cov{Y (t1), Y (t2)} dt Àt2.


(i-r)h<tt<ih
(i+k-r)h<t2<(i+k)h

Afin de calculer les propriétés du second-ordre du processusagrégé, nous avons donc besoin d'ex-
primer la covariancec(t,u). Comme nous I'avons vu au chapitre 3, la façon dont les cellules sont
distribuées dans le temps peut varier selon que le processussoit de Neyman-Scott ou de Bartlett-
tewis. La covariancedu processusde comptage entre t1 et f2 s'écrit (Cox & Isham, 1980, p.33) :

cov{lrr(t1,tr * ôr), N(t2,t21 ôr)} : rr {lr(tr, tr f ôr) : N(t",tz -f 6z): 1}


- er :
{ . n r ( t 1 , t r* ô r ) 1 } P r { w ( t r , t z r 6 z ) : 1 } + o ( 6 $ 2 ) .
Suivant Cox & Isham (1980, p.77), deux points localisésen 11et t2) fi peuvent :
1. appartenir à différents clusters, auquel cas ils sont indépendants;
2. appartenir au même cluster de centre f".
Dans la version de base du processusde Neyman-Scott, les origines de cellules sont indépendam-
ment séparéesde l'origine des aversespar des distances qui sont identiquement distribuées selon
une loi exponentielle de paramètre B. Nous pouvons donc écrire :

er{.n'r(tr,tr * ôr) - 1ç(t?,tz-r 6z)- 1} : p2nçQ)çQz)6$,


^ ftt
+ E{D(D - l)} P' 6ôzdt.I o(6162).
J _*vQ) "-e(tt'-t')"-Ê(tz-t')
Par conséquent,la covarianceentre deux points en f et t * u s'exprimecomme:
c ( t , u ): C o v{ l r ( t , l f ô 1 )l,/ ( , + u , t I u 1 ô r ) }
(n1o1n - r))P' Ï!*ç(t") e-P(2t+u-2t') quandu ) 0
6r6rdt"* o(ô1ô2)
:t
- 1))P' 6r6rdt"+ o(ô1ô2)quand z ( 0.
,p(t")e-P(2t+u-2t')
Iql1l f*
Le modèle de Bartlett-Lewis distribue les origines de cellules différemment, c'est-à-dire selon un
processus de Poisson de taux B. Dans la version de base de ce modèle, la durée d'activité des
aversesa une durée aléatoire qui est distribuée selon une loi exponentielle de paramètre 4r.Dans
ce cas, nous obtenons :

quandu > 0
6r6zdt"to(ô1ô2)
, : I roï I!*çU) "-e?+u-t")
quandu < 0.
lp"B |li p(t") e-e(t-t")6r62dt.to(ô1ô2)
Quand u :0,Ia variance du processusde comptage à I'instant f s'écrit :

c ( t , o ) : V a r{ l r ( t , , + ô ) } : p o p ( t ) 6+ o ( ô ) . (e.5)
Notons que (9.5) est valide à la fois pour le processusde Neyman-Scott et pour Ie processusde
Bartlett-Lewis.
106 Un modèle de Neyman-Scott non-stationnaire

9.3 IJn choix de p(t)

<p(t)peut être simplement défini comme une fonction linéaire du temps t de la manière suivante :

ç(t) : À(1 + et), (9.6)

où e correspondau taux de croissancede g(t) et dépend de l'échelle considérée.Au temps t :0,


cp(t) est équivalent à À. Cependant, avec cette définition rp(t) < 0 pour t < -[le ce qui est
mathématiquement incorrect. Ainsi, nous posons :

, ^ ( + \ --
Y\u)
I x pouï , < 0 (e.7)
+.ry pour , > 0.
\.11r
Cette définition de g(l) peut être interprétée comme un modèle de rupture, en supposant par
exemple que la non-stationnarité est déclenchéepar I'industrialisation au temps t : 0. Le choix
de I'instant pour lequel t : 0 étant arbitraire, nous le faisonscorrespondreau début de la période
d'observation.

Pour calculer I'expression de I'intensité moyenne agrégée à un pas de temps â, nous devons
choisir la distribution bivariée entre l'intensité et la durée des cellules. Dans ce chapitre, nous
supposonsque I'intensité des cellules X et leur durée -L sont des variables aléatoires indépendantes
et distribuées exponentiellement. Les paramètres respectifs de ces distributions exponentielles sont
a et 11.D'après (9.3) et (9.4), nous obtenons :

n/r.h\ Àpp{2e"-n$-r)n(I - + 2q2h+ enh(2hqi,- hq - z)}


"-rh)
""n"
Cette fonction non-linéaire peut être adéquatement approchée par une relation linéaire en i,
c'est-à-dire que l'augmentation de l'intensité moyenne agrégée,en fonction du temps, est presque
constante.Bn fait, cette propriété est vérifiéepour chaquemoment lorsquela fonction linéaire (9.7)
est utilisée pour g(t), t > 0. En effet, quand t est assezgrand, I'effet des aversesavant I : 0 devient
négligeable. Dans ce cas, puisque le processusde Poisson approche un taux linéaire, l'approxima-
tion des moments par une relation linéaire est judicieuse. Cette propriété peut être utile pour
I'estimation des paramètres, c'est pourquoi nous considérons une approximation du premier ordre
des moments agrégéesà t : nn, où n7, dénote un nombre arbitraire d'heures. Les approximations
suivantes peuvent donc être appliquées dès que n6 ) 1000, puisqu'il est très peu vraisemblable
que la durée d'une averse soit plus grande que 1000 heures (quand n6 augmente, la différence
entre les fonctions (9.6) et (9.7) pour cp(f) disparaît, puisque I'effet des aversesavant t ( 0 devient
négligeable).Pour I'espérancedu processusagrégé,nous obtenons :

E(yo)xn!+n!6 (e.8)
9.3 Un choix de rp(t) to7

où la fonction E! et E! ne dépendent pas de i et sont donnés par :


e-'t"h(qnn - r)(7_+ r[Ln) - qh(q + z)] + zn2nl
un _pDÀle{2
2an3
et
Lt,n\eh{e-n"h(7-- enh)+ hq} .
,n -
aq2
L'expression de la variance du processusagrégé à un pas de temps h s'écrit :
h,i) + E{D(D - I)) g"(r,q,13,
\ltto T \, 13, h,i))
var(Y!): "k, ) (e.e)
Ê"qao'(n+ Ê)2(n+ zÊ)(rt+ 30)@'- Tt')
où l,(e , \, Ê,h,i) et g,(e,\,0,h,i) sont définisdans I'AnnexeD.1. L'expressionde I'autocovariance
de décalage fr du processusagrégé à un pas de temps â est :
\ l p o g " ( r , T , 0 , h , i , k+)E { D ( D - 1 ) } / " ( . q
, ,B , h , i , k ) l
Cov(Y!,\\ù : , (9.10)
(,t
40'qna' + 0)2 + (q zÊ)(Ê - rù
sont définisdans I'AnnexeD.2. Comme pour I'espérance
où /"(e,T,Ê,h,i,,k) et g"(e,11,Ê,,h,i,k)
(9.8), des approximations du premier ordre peuvent être calculéespour la variance et l'autocova-
riance de décalagek du processusagrégéafin d'obtenir les décompositionsVar(Yoà)x V! +Vlt et
Cov{Yoh,Ylir} = C! +Clt. Cependant, les expressionssont trop fastidieusespour être présentées
dans cette thèse. Nous avons aussi calculé le moment du troisième ordre (centré) du processus
agrégé.La formule obtenue s'écrit :

+ 6n -r 6r7ih- 3rf h" + 6rf ih2


€Y: El{Vn - E(v,n)}'l: 6po^le(-2q3hs
+ zqïlhs) e-'lih -6e{rlh(i - L) - 1} e-n(z-t)h+(6ei,h2rt2- 18e* 72ei,hq
+ 6rfh - 6eq2h2- LSeqh+ L2rùe-nh -r2rl * 18e- l2eqi,h - 3eq2h2
+ 6eq2ih2+ 6hrf11çrsa3)- eÀ E{D', - D}feQt, g,e,h,i)/{srf a3(rt2- 0\2
x 92(q+ p)\ + E{(D2- D)(D- 2)}\geot,
g,€,h,i)l{36rf - p")',
a3B',(rf
+ p)'\,
x ('l + zp)'(2rt
où /e (ry,0,€,h,i) et ga(q,0,e,h,i) sont desexpressionstrop Ionguespour être présentéesdans cette
thèse. Nous avons égalementcalculé la décomposition {f xT! +Tli potr cette expression.

Suivant Cowpertwait (1994), nous calculonsla probabilité PD(h) qu'un intervalle de longueur
ô ne comporte pas de pluie, c'est-à-dire Pr(Yoh: 0). Dans le cas d'une distribution géométrique
pour le nombre de cellules,I'expressionest une modification de Cowpertwait (7994, équation 2.16)
et est donnée par :

Pr(Y!- 0): 1)- r)}{1- p1,(t)}dt


"*oI f, v{nfi,-
- 1)+ r)}{1- a(o)}at], ( e.11)
f"nv{n{t-
108 Un modèle de Neyman-Scott non-stationnaire

ou
e-P(t+h)(n- 0) +n - 13- \e-?t *Be-nt
Pn(t) :
(1 - p"){u-B(t+h)(q - P) - q e-st +B e-rr} + n - 0
est la probabilité que I'intervalle (t,t + h) soit sec avec une origine d'averseà I'instant zéro. Avec
rp(t) exprimée par (9.7), I'expression (9.i1) requiert des évaluations numériques pour les deux
intégrales.Puisqu'aucuneformule explicite n'est disponible pour Pr(Yrn: 0), des approximations
linéaires ne peuvent pas être appliquéespour cette propriété statistique. La Figure 9.1 représente
les valeurs théoriques de l'espérance,de la variance, de I'autocovariance de décalageun, du moment
du troisième ordre et de la proportion de périodes sèches(obtenue par intégration numérique) à
une échellehoraire,pour I'ensemblede paramètressuivant{À :0.01 ) Ê:0.I; q:1; l-tn:5;
a : 0.25; e : 0.001). Nous noteronsque les approximations linéairessont adéquatesdès que i > 6.

L'obtention de moments empiriques est nécessairesi l'on veut appliquer la méthode généralisée
des moments. Dans notre cas, nous rencontrons un problème majeur puisque la non-stationnarité
introduite dans le NSRPM implique une variation temporelle des moments. Nous ne pouvons alors
plus calculer une seule estimation empirique pour chaque moment et une méthode alternative doit
être développée.Nous proposons de construire une approche baséesur les approximations linéaires
des moments, c'est-à-dire de segmenterle temps d'observation en intervalles réguliers, de calculer
chaquestatistique à partir des précipitations tombéesdans ces intervalles de temps et d'estimer la
pente et l'origine des relations linéaires à partir de ces statistiques.

9.4 Calcul des moments empiriques

LessériesobservéesdepluieàuneéchelleâsontnotéesYun,i:1,...,1.Considéronsunefenêtre
mobile qui segmente l'intervalle [1,1] en sous-intervalles de longueur C) qui ne se chevauchent pas.
Nous calculons alors les statistiques (cela peut être la moyenne empirique, la variance, I'auto-
covariance de décalage k ou le moment du troisième ordre) sur les données de pluie de chaque
intervalle. Une régressionrobuste de ces statistiques (en fonction de i) est appliquée afin d'obtenir
une estimation empirique des paramètres impliqués dans les approximations linéaires des moments
théoriques. Plusieurs limitations doivent cependant être mentionnées :
Le calcul des statistiques est appliqué sur des observations qui ne sont pas identiquement
distribuées en raison de la non-stationnarité de Y6h;
une hétéroscedasticité apparaît pour chaque statistique, la variabilité augmentant avec i.
Pour ces raisons nous appliquons une méthode de carrés pondérés afin d'obtenir les paramètres
de la régression. Cette régression robuste utilise un algorithme des moindres carrés itératif où les
poids accordés aux observations évoluent à chaque itération en appliquant une fonction quadra-
tique sur les résidus de chaque itération précédente (voir par exemple Rousseeuw& Leroy, 1987;
9.4 Calcul des moments empiriques 109

0.2025

0.292.

^ 0.2015
ùi 6
o.2or
1.47
0.2005

0.2 465
0

0.93

17
1 0.925
.1
-\n- 17.9

o 0.92 ^o
o "_,/ 17.85

0.915 '10 1 7 . 8L
0

o-

FIc. 9.1 - Approximations linéaires des moments (ligne pleine) et moments théoriques (cercles)
(espérance, variance, autocovariance de décalage un, moment du troisième ordre centré et pro-
portion de périodes sans pluie) à une échelle horaire en fonction du temps i pour I'ensemblede
p a r a m è t r ef si x é : { À : 0 . 0 1; 1 3: 0 . L ; r l : I i F o : 5 1 a : 0 . 2 5 ; e : 0 . 0 0 1 } .

Maronna et a1.,2006). Pour les raisons citées plus haut, il est nécessaired'analyser I'efficacité de
la régression et d'examiner Ie biais possible. Nous simulons à cette fin 100 mois de pluies ho-
raires pour 100 différents ensembles de paramètres tirés aléatoirement d'une loi uniforme entre
les bornes définies ci-dessous.Une longueur de 100 mois est représentative d'une très longue série
de pluies horaires, le NSRPM étant habituellement ajusté mensuellement afin de préserver Ia va-
riation saisonnière. Nous contraignons les paramètres dans un espace des paramètres réaliste :
0 . 0 0 2< À < 0 . 0 2 [ h - 1 ] ; 0 . 0 5 < P < 0 . 5 [ h - 1 ] ; 0 . 5 < r 7< 5 [ à - t ] ; 3 1 t " c < 2 0 ; 0 . 2 < a < 2 ;
0.000001< € < 0.00001 [h-1]. L'expérience montre que les paramètres évoluent généralementà
I'intérieur de ces bornes. Les bornes sur € correspondent à un augmentation de la fréquence des
aversesde 0.9% à 8.8% pax an. Il est à noter qu'avec une augmentation de 8.8%, la fréquencedes
aversesdouble en 8 ans.
11_0 Un modèle de Neyman-Scott non-stationnaire

Une régressionrobuste est ensuite appliquéepour différentesvaleurs de C) (200 heuresà 20,000


heures pour l'échelle horaire et 100 jours à 800 jours pour l'échellejournalière). Cette procédure
est répétée1,000fois afin d'observerla variabilité des estimations d'une simulation à I'autre (pour
un ensemble spécifique de paramètres).

Pour chaque ensemble de paramètres, nous estimons Ie biais relatif des estimateurs par :

. 1000
rar Kk - t<,
1000 2:

où rc est une pente ou une origine théorique, Â6 est I'estimation empirique correspondanteet k est
I'indice du réplicat. Nous représentonsle biais moyen relatif et un intervalle de confiance empirique à
B0% (10è*'et 90è-" centiles)pour chaquestatistique et pour différentesvaleursde Q sur les Figures
9.2 à 9.5. Nous pouvons d'abord noter que, généralement,le biais diminue avec Q pour les échelles
horaires et journalières. Sa variabilité diffère selon le moment et l'échelle temporelle considérés
mais est plus faibie pour les grandes valeurs de 0. Cependant, quand f) est grand, Ia régression
s'applique sur un faible nombre de points. Pour Q :20,000 heures (ou 0 : 800 jours), 100 mois
de pluies horaires (ou journalières) correspondent à trois intervalles de valeurs. La régression est
donc appliquée avec seulement trois points lorsque (l : 20,000 heures ou f) : 800 jours. Nous
reportons la valeur moyenne et les intervalles de confiance empiriques à 80% correspondants pour
les différentes statistiques à une échelle horaire et journalière au Tableau 9.1 pour f) : 20,000
heures et 0 : 800 jours. Nous pouvons constater que pour chaque statistique, la pente semble
plus difficile à estimer, tout spécialement pour I'autocovariance de décalage un et le moment du
troisième ordre à une échellejournalière. Bien que le biais semble disparaître lorsque f,) augmente,
la variabilité est très élevée lorsque le nombre de points utilisés dans la régression est trop petit
(c'est-à-dire moins que dix points). Par conséquence,un bon choix pour Q semble être la plus
haute valeur pour laquelle au moins dix intervalles sont disponibles et dépend donc de la longueur
de la série de donnéesde pluie.
9.4 Calcul des moments empiriques 111

0.1 0.01
0 0.00s

-0.1 0
d -o.oo5
-0.2 I
<, -0.01
-0. ?s
Lrl l-o.ors
-o.4
Ei .'r:Y -0.02
-0.5 -0.025
-0.6 -0.03

-0.7L -0.035 L
2W 10000 100

o ç)

0.05
0.04
0.03
-0.1
È 0.02
Ê I 0.01
I Nâ
tl 0
trl
-0.01
Ni
-0.02
-0.03
-0.04
-0.ô- -0.05 L
200 10000 100

o o

FIc. 9.2 - Biais relatif moyen et intervalle de confianceempirique à 80% (10u'" et g0è-"centiles)
résultant de la régression robuste pour la moyenne.
LT2 Un modèle de Neyman-Scott non-stationnaire

0.1 0.02
0 0
-0.1 -o.02
-o.2
-0.04
-0.3 I
I -0.0€
N^
-0.4
-0.08
-u.5
-0.1
-0.6
-0-7 -0.12

-0.8 -0.14
-0.9L - 0 . 1 6L
200 10000 100

çà çl

0.15

0.1

0.05
I
I -o.2
N

-o.4
N
<!> .S -0.1

-0.8 -0.1

200 10000

o o

Frc. 9.3 - Biais relatif moyen et intervalle de confiance empirique à B0% (10a*" et g0è*' centiles)
résultant de la régression robuste pour la variance.
9.4 Calcul des moments empiriques 113

Ê
ri
-0
I
?c
tt -0

(t -0.ô
NO
.Q

-0.

2@ 10000

ç)

0.4 0.6

o.2 0.4

Ê o.2
È
I -0.2 0
N Ê
a\
a\ -0.4 -o.2
Ni
tt -0.6
.O -0.4

-0.8 -0.6

_1L -0.8L
200 10000 100

O a

FIc. 9.4 Biais relatif moyen et intervalle de confiance empirique à 80% (10u*" et g0è'" centilesT
résultant de la régression robuste pour I'autocovariance de décalage un.
tL4 Un modèle de Neyman-Scott non-stationnaire

0.2

0.1

0
Ê
-0.1
I
ù-l
Fi- -0.2

'F.r- -0.3

-0.4

-0.5 L
100

0.4 0.2

0.2 0-1

0 0

-o.2 I -0.1
I N J

Fr -0.4
Ë -o.2
N-
.Fi -0.6
tFr'
-0.3

-0.8 -0-4

-0.5 -
200 10000 100

O o

FIc. 9.5 - Biais relatif moyen et intervalle de confianceempirique à S0% (10u-" et 90è*" centiles)
résultant de la régressionrobuste pour le moment du troisième ordre (centré).
9.5 Méthode d'estimation des paramètres du NSRPM-NS 115

Tae. 9.1 - Biais relatif moyen et intervalle de confiance empirique à 80% (10u-u et 90è^" centiles
entre parenthèses)des 100 ensemblesde paramètres aléatoires pour Q : 20,000 à une échelle
horaire et f) : 800 à une échelle iournal rere.
Horaire Journalière
E3 -0.0002(-0.0066;0.0057) -0.0007(-0.0062;0.0056)
E(YN)
E? 0.0011 (-0.0382
;0.0a96) 0.0038(-0.0351 ;0.0aa7)
var(Y!)
vt -0.0004(-0.0082;0.0084) -0.0002(-0.0105;0.0103)
vi -0.0010(-0.0511;0.0591) 0.0017(-0.0825 ;0.0795)
eov(Y!,Y!fi)
ct 0.0001(-0.00s3
;0.0110) 0.0034(-0.0235 ;0.0a27)
cr -0.0017(-0.0585;0.065a) 0.0028(-0.2504; 0.2285)
Èb
rt -0.0010(-0.0157;0.0147) -0.0024(-0.021
1 ;0.019a)
\2
ri -0.0015(-0.0914;0.0932) -0.0100(-0.2100 ;0.1606)

9.5 Méthode d'estimation des paramètres du NSRPM-NS

Dans cette section nous décrivons une méthode permettant d'estimer les paramètres impliqués
dans les approximations linéaires de chaque moment. Nous proposons d'inclure ces estimations
empiriques dans la méthode des moments décrite au chapitre 7. Soit / I'ensemble des paramètres
(À,0,rt, Fc,e,e). La méthode généraliséedes moments consisteà minimiser (? définie par :

0(ù: (e.12)
*Ë-,,(a-ù',
où rci est une origine ou une pente des approximations linéairesdonnéesà la section 9.3, c'est-à-dire
E*,El,U*,V!,C&,C?,7! ott { pour différenteséchellesde temps. Â6est I'estimation empirique
correspondante et c,,'idénote un poids positif. p représente le nombre de moments inclus dans la
procédure. Le Tableau 9.2 indique nos choix des poids cl.ieui représententun compromis entre le
souhait d'accorder une import ance égaleà chaque moment et la difficulté à obtenir une estimation
empirique de ces moments spécifiques(voir Tableau 9.1). Précisément,nous pouvons penser qu'il
sera plus facile d'obtenir des estimations empiriques pour les origines des relations linéaires que
pour les pentes. Il n'est pas évident en effet que des pentes positives nettes seront observéespour
tous les moments statistiques sur des données observées.C'est pourquoi nous accordons des poids
plus élevés aux origines n!, V! , C( et T! qu'aux pentes El, V! , C! et f! . Par exemple, la somme
des poids du Tableau 9.2 étant égal à 1, la somme des poids associésaux origines est 0.685, alors
que les poids associésaux pentes totalisent 0.315. Les poids associésà I'espérance,à la variance,
à I'autocovariance de décalage un et au moment d'ordre trois totalisent respectivement des poids
de 0.4, 0.3, 0.17 et 0.13. Suite aux interprétations des Figures 9.2 à 9.5, nous accordonsainsi des
116 Un modèle de Neyman-Scott non-stationnaire

Tte. 9.2 - Choix des poids dans la procédure d'estimati


ct estlmatron des amètresdu NSRPM-NS.
Horaire Journalier
Es 0.2 0.1
E(Yun)
Er 0.05 0.05
Vs 0.1 0.1
var(Y!)
Vr 0.05 0.05
Cs 0.07 0.05
Cov(Yuh,\\r)
Cr 0.03 0.02
Ts 0.05 0.015
Frl
>?,
T1 0.05 0.015

poids importants aux origines et pentes liées à I'espérance et à la variance et des poids beaucoup
plus faibles à I'origine et à la pente du moment d'ordre trois. O est minimisée numériquement à
l'aide de la procédure d'optimisation suivante qui est adaptée de la méthode explicitée au chapitre

1. Nous réalisons 1,000 optimisations contraintes dans l'espace des paramètres suivants :
0 . 0 0 0 1< À < 0 . 1 [ â - 1 ] ; 0 . 0 0 1< P < 0 . 9 9 l h - 1 1 ;0 . 0 1 < 1 7< 6 0 [ â - ' ] ; 1 < p 6 ' < 5 0 0 ;
0.01 < a < 1000i 10-g < € < 10-4. Les paramètres sont contraints afin de rester dans un
espacedes paramètres physiquement vraisemblable. Les points de départ sont générésd'après
une loi beta entre sesbornes. Un premier ensemblede ces paramètres est estimé en minimi-
sant I'expression (9.12) à l'aide d'une méthode de programmation quadratique séquentielle
(sequenti,alquadrati,cprogramm'ing,SQP, voir Fletcher, 1987). Nous obtenons ainsi 1,000
ensemblespréliminaire de solutions.
2. Les étapes 3 à 6 sont répétéesplusieurs fois (par exemple dix fois);
3. Seuls les 500 meilleurs ensembles de paramètres sont conservés. Le meilleur ensemble de
paramètres obtenu devient le point de départ des futures optimisations.

4. Nous réalisons 500 optimisations contraintes. Les points de départ sont obtenus à I'aide de
perturbations aléatoires autour du vecteur de paramètres précédemment obtenu. La pertur-
bation aléatoire est tirée d'une distribution beta sur les bornes courantes (les bornes sont
définies à l'étape 1 et évoluent à I'étape 6).
5. Nous rejetons tous les vecteurs de paramètres pour lesquels la fonction objectif dépassela
médiane des valeurs de fonctions objectives obtenues jusque-là.
6. Les bornes évoluent selon les meilleurs ensemblesde paramètres trouvés jusque-là (c'est-à-
dire ceux qui minimisent la fonction objectif). Si les meilleurs ensemblessont proches, Ies
bornes sont restreintes.Si elles sont prochesd'une borne existante, les bornes sont espacées.
Ces choix sont arbitraires mais tiennent compte de l'échelle de valeurs des paramètres et
sont motivés par le souhait de contraindre I'algorithme à sortir du domaine d'attraction de
9.6 Simulation tI7

minima locaux, en tenant compte du fait que I'adaptation de ces bornes ne s'effectue qu'un
faible nombre de fois (dix fois dans ce cas).
Le nombre d'optimisations contraintes réaliséesà l'étape 1 est élevé afin de parcourir un espace
important de paramètres, le point de départ de I'algorithme du chapitre 7 ne pouvant plus être
obtenu avecI'introduction de la non-stationnarité. Cet algorithme conservenéanmoins les avantages
de la précédenteprocédure d'estimations des paramètres,puisqu'il parcourt un important espace
de paramètres, évitant ainsi que la solution obtenue soit un minimum local.

9.6 Simulation

Le processus de Poisson non-stationnaire est généré à I'aide de la méthode de transformation


inverse (voir par exemple Devroye, 1986; Harrod & Kelton, 2006) et s'effectue en deux étapes,
c'est-à-dire :
- Générer des temps d'arrivée si selon un processusde Poissonstationnaire de taux 1,
- retourner le i-ème temps d'arrivée d'averse du processusde Poisson non-stationnaire t; :
Â-t("e),
où Â(t) : I:*g(s)ds est la fonction associéeau taux cumulé. Dans notre cas, une borne inférieure
finie doit être fixée afin d'éviter la divergencede À(t). Par conséquent,nous devons choisir une
borne inférieure suffisamment éloignée du point de départ des simulations pour que I'influence des
averses qui précèdent cette borne devienne négligeable. Nous donnons un exemple de fonctions
9(t), |t(t) et A-l(s) avecÀ : 0.01 et € : 0.01 à Ia Figure 9.6.

9.7 Application

Dans cette section, nous réalisons une application du NSRPM non-stationnaire. Idéalement,
nous aurions souhaité appliquer ce modèle sur des données de pluies exhibant clairement une non-
stationnarité temporelle. Nous n'avons malheureusement pas trouvé de série suffisamment Iongue
et pertinente pour notre application. Il est prévu de réaliser une application sur des données
simulées à partir d'un modèle climatique développé par Ie Consortium Ouranos. L'extraction de
ces simulations nécessite I'utilisation d'un robot qui manipule les disques de stockage contenant
les données simulées pour chaque journée. Cette opération de récupération des données est donc
particulièrement longue (plus de trois mois) et cette application n'a pas pu être réalisée dans le
cadre de cette thèse.

Il est clair qu'il est absolument nécessaired'analyser de façon détaillée des données observées
118 Un modèle de Neyman-Scott non-stationnaire

0.06

oo*
S
0.02

15

-100 200
t

tl

z 8101214161820
S

Frc. 9.6 - Exemplesde fonctionsg(t), À(l) et A-t(") pour la simulationavecÀ : 0.01 et e : 0.01.

ou issues de modèles climatiques avant de procéder à des applications. De nombreuses questions


doivent en effet être résolues,telles que I'application du modèle mois par mois, puisque les propriétés
du modèle changent d'une année à I'autre. Il faudrait alors réfléchir à une façon de "lisser" cette
non-stationnarité.

Nous sommesdonc contraints d'appliquer les méthodesdécrites aux sections9.4 et 9.5 sur des
pluies simulées à un pas de temps horaire à partir de I'ensemble de paramètres arbitraire suivant :
{À : 0.01, T : t.5, 0 :0.2, pD :7, e.:0.25 et e : 0.000001}.Pour cette application,200
mois sont simulés, ce qui correspond à une série de pluies horaires très longue. Des régressions
linéaires robustes sont appliquées sur les statistiques calculées à partir de la méthode décrite à
la section 9.4, les résultats sont représentésaux Figures 9.7 et 9.8. Les difficultés à estimer les
pentes des relations linéaires apparaissent clairement, la pente obtenue étant même négative pour
I'autocovariance journalière de décalage un. Même si le biais des estimateurs proposés tend à
être nul (voir Tableau 9.1), leur variabilité rend I'estimation des paramètres plus complexe. Cette
variabilité semble être plus forte pour les pentes des relations linéaires, et plus encore à une échelle
journalière, justifiant ainsi le choix des poids du Tableau 9.2. Les paramètres sont ensuite estimés
9.7 Application 119

o
o
lll ' ..'e"""""

oo

100 100
Années Années

1.5

'|
.t.1

1 o

oo o
0 F-
0.7 ooo
0.6
u.5
100 100
Années Années

Ftc. 9.7 - Moments empiriques (moyenne, variance, autocovariance de décalage un et moment


d'ordre trois) et régressions linéaires correspondantes (trait plein) à une échelle horaire. Nous
représentons la relation linéaire théorique en trait pointillé.

en utilisant la méthode décrite dans la section 9.5 avec 0 : 5000 à une échelle horaire et O : 500 à
une échellejournalière. Les estimations obtenuessont reportéesdans le Tableau 9.3. Les paramètres
sont globalement estimés correctement, surtout pour À et e liés au taux du processusde Poisson.
L'estimation des paramètres B et pp est plus approximative. II est à souligner que les estimations
des paramètres donnent une valeur plus petite pour la fonction objectif (0.2735) qu'avec le vrai
vecteur de paramètre Q Q.37I4) ce qui indique bien que les écarts entre les estimations et les vraies
valeurs de paramètres sont principalement causéespar la variabilité des propriétés statistiques
d'une simulation à I'autre.
L20 Un modèle de Neyman-Scott non-stationnaire

280

260
o.5

240

?20

N_ Sl zoo
Y
[rJ -(d 180
r
1ô0

140
oe
120

100
100 100
Années Années

x 104

^20
N , I

L-' u N . _

oto o

100 100
Années Années

FIc. 9.8 - Moments empiriques (moyenne, variance, autocovariance de décalage un et moment


d'ordre trois) et régressionslinéaires correspondantes (trait plein) à une échelle journalière. Nous
représentons la relation linéaire théorique en trait pointillé.

AB. 9.3 - Estimations des resdu SKPM non-stationnaire


À rl p lto a €. o(ô)
Vraies valeurs 0.01 1.5 0.2 7 0.25 10.e-007 0.3774
Estimations 0.012 1 . 1 5 9 0 . 1 1 6 4.29r 0.237 9.0846e-0070.2735

9.8 Conclusion

Dans ce chapitre, nous avons développé un modèle de Neyman-Scott non-stationnaire qui


respecte les contraintes liées à I'application d'un tel modèle. Nous proposons ainsi une fonction
dépendante du temps pour le taux d'arrivée des aversesqui permet d'obtenir des expressionsana-
9.8 Conclusion r2r

lytiques pour I'espérance, la variance, I'autocova,rianceet le moment d'ordre trois de I'intensité de


pluie. Avec la fonction de taux d'occurrence des averseschoisie, les propriétés statistiques peuvent
être approchées par une relation linéaire en fonction du temps. Cette propriété est exploitée afin
de développer une méthode d'estimation des paramètres. Cette approche est ensuite testée sur des
donnéessimulées.

Il est clair que I'application d'un tel modèle est limitée par la forme de l'évolution temporelle
des propriétés statistiques, c'est-à-dire une croissancelinéaire dans notre cas. De plus, I'approche
proposée afin de modéliser les relations linéaires des propriétés statistiques soufire d'une certaine in-
stabilité. Ce travail ne représentecependantqu'une première étape dans l'élaboration d'un NSRPM
non-stationnaire. De nombreux efforts sont encore à fournir afin de décrire clairement l'évolution
future des propriétés de Ia pluie, les prévisions n'étant pour I'instant que des réalisations possibles
d'un scénario climatique. Il s'agirait notamment de déterminer la validité de nos hypothèsessur
des donnéesobservées.
Un modèle de Neyman-Scott non-stationnaire
Chapitre 10

Conclusion

10.1 TYavail accompli

Cette thèse porte sur la modélisation des précipitations à un pas de temps court (horaire et
journalier) à l'aide de processus stochastiques ponctuels. Nous proposons des généralisations au
modèle dit de Neyman-Scott,(Neyman-ScottRectangularPulsesMod,el,NSRPM). Dans ce modèle,
les aversessont simulées sous la forme d'amas de cellules pluvieuses.

10.1-.1 NSRPM incluant un lien entre l'intensité et la durée des cellules


pluvieuses

Une première généralisation permet de considérer une dépendance entre I'intensité et la


durée des cellules pluvieuses, ces deux composantes étant classiquement considérées comme
indépendantes. Nous présentons alors plusieurs types de distributions bivariées englobant comme
cas particulier la version de base du NSRPM. Ces distributions bivariées sont construites à I'aide
de copules cubiques (pour modéliser la dépendance) et de lois exponentielles (pour les lois mar-
ginales), ce qui permet d'atteindre des degrésde dépendanceélevéset d'introduire une forme de
dépendancesouple.

Plusieurs modèles sont comparés avec des séries de pluies horaires d'origine variée (Suisse,
Belgique, Rance, Canada et États-Unis d'Amérique). La disponibilité de longues sériesde pluies
horaires et le coût de calcul limitent en général I'application de ce type de modèles sur des données
L24 Conclusion

de pluie avec une telle variété de climats. Un algorithme exploitant la méthode généraliséedes
moments est proposé afin d'estimer les paramètres des différents modèles. Les difficultés rencontrées
lors des applications ont mis en lumière certaines limitations du NSRPM lorsque I'autocovariance
journalière de décalageun de l'intensité pluvieuse est faible.

Concernant les forces et les faiblessesdes différents modèles considérés,nous retiendrons une très
bonne performance globale du modèle avec la copule cubique Sym2, particulièrement lorsque I'on
considèreI'adéquation du modèle aux propriétés statistiquesutiliséesdans la méthode d'estimation
des paramètres. Pour plusieurs stations et mois particuliers, nous notons également que nous
obtenons de bons résultats à l'égard du même critère avec les modèles utilisant les distributions
de Pareto et gamma.

Un des objectifs de cette thèse est également de donner des informations sur la forme de la
dépendanceentre I'intensité et la durée des cellules, indirectement observéepar le biais des applica-
tions. Principalement grâce à leur capacité à modéliser des dépendancesnégatives et positives dans
un intervalle important, les copules cubiques employéessemblent souvent améliorer la reproduction
des propriétés de la pluie. Sur la plupart des applications, le tau de Kendall entre I'intensité de la
durée des cellules (lié à I'estimation du paramètre de la copule cubique) est négatif. Les structures
de dépendance qui donnent les meilleurs résultats sont les copules cubiques Sym2, Fcub et Asym3
dans une moindre mesure. Le fait que ce degré de dépendance soit presque systématiquement
négatif (et de plus atteint souvent la borne inférieure de I'intervalle de dépendance couvert par les
copules cubiques) prouve bien I'importance de tenir compte de ce lien entre I'intensité et la durée
des cellules.

Le critère de reproduction des valeurs extrêmes est particulièrement important à prendre en


compte lors du choix d'un modèle de pluie. Nous montrons que les maxima annuels à une échelle
journalière sont généralementbien reproduits par la plupart des modèles. Cependant, nous re-
trouvons parfois une légère sous-estimation de ces valeurs extrêmes à une échelle horaire pour les
périodes de retour les plus élevées.Pour ce problème particulier, lorsque I'intensité des cellules est
distribuée selon une loi de Pareto, l'écart entre les maxima simulés et observésest réduit, vraisem-
blablement grâce à sa queue supérieure de distribution lourde. Bien que I'on pouvait s'attendre
à une amélioration de la reproduction des valeurs extrêmes en tenant compte de la dépendance
entre I'intensité et la durée des cellules,ce n'est pas systématiquementle cas. Nous pouvons alors
nous demander si ce n'est pas simplement la limitation du degré de dépendance couvert par les
copules cubiques qui empêche le modèle de mieux restituer les extrêmes. Autrement dit, avec
d'autres formes de dépendance plus souples, nous pourrions peut-être nous attendre à obtenir un
lien encore plus fort et pouvoir ainsi simuler des aversesextrêmement courtes et intenses.
10.2 Discussion et pistes des travaux à accomplir 125

LO.L.2 NSRPM non-stationnarre

Ce mémoire de thèse propose de nouveaux développements des processusponctuels afin d'ob-


tenir un modèle de Neyman-Scott non-stationnaire, en gardant à I'esprit les contraintes qu'impose
I'application d'un tel modèle. Dans ce NSRPM non-stationnaire, le taux d'arrivée des aversesest
une fonction linéaire du temps. Avec cette fonction simple, nous obtenons des expressionsexplicites
pour I'espérance, la variance, I'autocovariance et le moment d'ordre trois de I'intensité de pluie.
Ces propriétés statistiques du modèle dépendent alors du temps. Nous montrons qu'avec notre
choix de fonction du taux d'occurrence des averses,ces fonctions du temps peuvent être judicieu-
sement approchéespar une relation linéaire. Nous proposons également une méthode d'estimation
des paramètres qui s'appuie sur les approximations linéaires des moments pour lier les propriétés
statistiques du modèle aux données observées.Une illustration de la méthode est exposéesur des
donnéessimulées.Cependant, il est évident que la validation du modèle devra également s'effectuer
à travers une application sur des donnéesobservéesou issuesd'un modèle climatique.

Le NSRPM non-stationnaire développé présente deux principales limitations sur lesquelles il


sera nécessairede poursuivre les efforts. En effet, les applications de ce modèle sont contraintes
par la forme de l'évolution temporelle des propriétés statistiques, à savoir une relation linéaire
avec le temps. La secondeproblématique principale est I'instabilité de la méthode d'estimation
des paramètres. Il est donc indispensable de continuer Ia réflexion sur la façon de lier les moments
empiriques à ceux issus du modèle.

1-O.2 Discussion et pistes des travaux à accomplir

De nombreux efforts mériteraient d'être poursuivis afin de tirer tous les avantagesdes modèles
représentant les aversessous formes d'amas de cellules pluvieuses. Cette section propose quelques
éléments de réflexion et des pistes de travaux à poursuivre.

LO.2.L Estimation des paramètres

L'estimation des paramètres constitue un premier obstacle à I'application de ce modèle puis-


qu'il nécessiteactuellement de grandes ressourcesde calcul lors de la minimisation de la fonction
objectif. La difficulté à obtenir une fonction de vraisemblance empêche I'utilisation de méthodes
bayésiennesou Ie recours direct à des donnéesde pluie. Plusieurs approches ont déjà été proposées
comme alternatives à la méthode généralisée des moments mais leur application semble limitée
puisqu'ellesrequièrent généralementune simplification du modèle (Rodriguez-Iturbe et a\.,1988),
L26 Conclusion

à I'image de la méthode des séries de Fourier de Chandler (1995). La méthode des moments est
pertinente puisqu'elle permet de lier un grand nombre de propriétés statistiques au modèle. Je
pense personnellement que des travaux devraient examiner en détail le lien entre Ies paramètres
du modèle et les propriétés statistiques de la pluie. Par exemple, la structure du modèle oppose les
propriétés des averseset celles des cellules pluvieuses. Nous pourrions étudier les interactions entre
le taux du processusde PoissonÀ, la distance entre les originesde celluleset l'origine d'aversep et
le nombre de cellules po par rapport aux propriétés statistiques des pluies journalières (À semblant
être lié à la moyenne). trst-ce que le paramètre 4 gérant la durée des cellules ne pourrait pas être
lié assez directement à I'autocovariance horaire de décalage un ? Cette problématique concerne
directement I'identifiabilité des paramètres.

LO.2.2 Validation du modèle

De nouvelles approches concernant la validation des modèles ont été proposéesdans le rapport
de Chandler & Onof (2005). Cesdéveloppementspermettent par exemplede tester la significativité
de la différence des valeurs de fonctions objectif entre plusieurs modèles. Une méthode permettant
de prendre en compte la qualité de reproduction des valeurs extrêmes est aussi présentée.L'appli-
cation de ces approches à diverses séries de pluies me paraît importante puisque cela permettrait
de les valider et d'illustrer leur pertinence sur différents climats.

10.2.3 Vers un modèle parfait ?

Les différentes applications réalisées au cours de cette thèse ont fait clairement apparaître
qu'un modèle particulier ne peut pas être adapté à toutes les formes de champs de précipitation.
En quelque sorte sorte tous les modèles ne sont que de pâles reflets de la réalité, comme I'indique
le célèbre adage (voir Box & Draper, 1987, p.74). La question pratique est de savoir quels éléments
du modèle sont les plus importants et doivent être conservés afin que ces modèles soient le plus
vraisemblablespossibleet conserventleur utilité.

Idéalement, la distribution bivariée parfaite entre la durée et I'intensité des cellules permet-
trait à la fois de reproduire une densité de probabilité forte pour les faibles valeurs d'intensité de
cellules (queue inférieure lourde) et un degré de dépendance important, surtout pour les valeurs
négatives. Cette distribution bivariée idéale combinerait alors les forces de la distribution de Pareto
ou gamma pour I'intensité des cellules et posséderaitune structure de dépendancecapable d'at-
teindre des corrélations (mesuréepar le biais du tau de Kendall ou du rho de Spearman) négatives et
positives fortes. La reproduction des extrêmes semble aussi nécessiterune queue supérieure lourde
pour la distribution de I'intensité des cellules,telle que reproduite par la loi de Pareto. Le couplage
1-0.2 Discussion et pistes des travaux à accomplir I27

entre une copule cubique et une distribution de Pareto semble ainsi particulièrement intéressant.
Cependant, nous avons constaté que les contraintes calculatoires limitent le choix de la distribu-
tion bivariée afin d'obtenir une expression explicite des moments théoriques issus du modèle. Il
faudrait alors étudier les possibilités d'approximation des moments, à I'image des développements
réaliséspour le calcul des propriétés statistiques du modèle de Bartlett-Lewis à paramètre aléatoire
(Random Parameter Bartlett-Lewis Model,,RPBLM), voir Onof (2003).

Un type de généralisation possible, qui pourrait permettre de s'approcher de la physique du


phénomène pluvieux, agit au niveau du processus ponctuel. Nous proposons dans cette thèse la
prise en compte de la non-stationnarité au niveau de l'arrivée des averses.La généralisation à un
processusde renouvellement est également un aspect intéressant à approfondir. D'autres variantes
des modèles de Neyman-Scott et de Bartlett-Lewis ont été proposéeset testées dans la littérature,
par exemple la prise en compte de plusieurs types de cellules ou l'aléation (randomizati,on)du
paramètre lié à la durée des cellules. Ces développements semblent cependant difficiles à combiner
avec ceux proposés dans cette thèse. La question est alors de savoir quelles hypothèses sont les
plus importantes à conserver pour chaque application.

Il me semble important de noter que les récentes applications de ce type de processusponctuels


modélisent les champs de précipitations à la fois en temps et en espace. La prise en compte
de la dimension spatiale du phénomène de pluie semble maintenant concentrer tous les efforts,
notamment en raison de I'accès aux données obtenues par satellite. La variabilité spatiale du
phénomène pluvieux doit évidemment être considérée. Cependant, la complexité de cette tâche
nécessited'abord de résoudre les problèmes rencontrés en un point de I'espace,ou à de petites
échellesspatiales.

Il est certain que ce type de modèle ne peut pas se complexifier à I'infini. Lorsque le nombre de
paramètres du modèle augmente, de nombreux problèmes numériques apparaissent, principalement
avecI'estimation des paramètres (lors de la minimisation de la fonction objectif). Chandler & Onof
(2005) conseillentpour cette raison de privilégier les modèlescomportant au plus six paramètres.
De plus, les problèmes de calculs limitent le type de généralisation que I'on peut apporter (par
exemple, la méthode généraliséedes moments nécessitedes expressionsdirectes des moments). La
généralisation à un modèle spatio-temporel et à des non-stationnarités temporelles et spatiales ne
se fera alors qu'après une réflexion profonde sur les aspects les plus importants à privilégier et
passera par le développement de nouvelles méthodes d'estimation des paramètres, par exemple à
l'aide d'approchesen plusieurs étapes (d'abord en chaque station de mesure, puis sur des régions
par l'intégration de statistiques spatiales).
Conclusion
Bibliographie

Ar,I, M. M., MIxuRIl, N. N., & Haq, M. S. 1978. A classof bivariate distributions including
the bivariate logistic. Journal of Multi,uariateAnalysi,s,8(3), 405-412.

ANcrIl, F. 2008. L'eau et ses enjeun.De Boeck.

ARws.IpRc-NInLSeN, K. 2006. Significant climate changeof extreme rainfall in Denmark. Water


Sc,ience€4 Technology,54(6-7),1-8. doi :70.2766fwst.2006.572.

AvISSaR, R., & Lru, Y. 1996. Three-dimensionalnumerical study of shallow convectiveclouds


and precipitation induced by land surface forcing. Jounr,al of GeophysicalResearcli,101(D3),
7499-7578.

BAccHI, 8., Bnccru, G., & KortpconA, N. T. 1994. Bivariate exponentialmodel applied to
intensities and durations of extreme rainfall. Journal of Hydrology, L55(I-2),225-236.

BtssoN, J., k MutIN, G. 2000. L'eau dans Ie monde arabe. Carrefours de Géographie. Paris :
Ellipses Éditior, Marketing SA.

Br,aucxapRT, \M., & WItlprr,ts, P. 2006. Statistical analysis of clusters and cycles in the long-
term historical rainfall seriesat Uccle. Pages 124-128 o/: MolNnR, P., EINFALI, T., BUR-
LANDo, P., SnvRuK, B., & ScHuIn, W. (eds), 7th ertreme preci,pitati,on: Multi,sourcedata
TLeasurernentand unceriai,nty. International Workshop on Precipitation in Urban Areas.

Box, G. E. P., & Dnnppn, N. R. 7987. Empirical model-bui,ldingand responsesurfaces.Wiley


Series in Probability and Mathematical Statistics : Applied Probability and Statistics. New
York : John Wiley & Sons Inc.

BRooxs, G.R., EvAwS,S.G., & Clacuo, J.J.2001. Floodi,ng. ASynthesisof NaturalGeological


Hazards in Canada, GeologicalSurvey of Canada Bulletin 548. Ottawa, Ontario : G.R. Brooks
(ed). Pages101-143.

CaloNDA, G., & Napor,rraNo, F. 1999. Parameter estimation of Neyman-Scott processesfor


temporal point rainfall simulation. Journal of Hydrology,225(I-2), 45-66.

Les éditions Le Griffon d'argile.


Cnaurpoux, A., & Tou:rANr, C. 1988. Éléments d,'hyd,rologi,e.
130 BIBLIOGRAPHIE

CHaivnlpR, R. E. 7995. Parameter estimati,onfor po'int processmodels.Technicalreport no. !42.


Dept. of Statistical Science,University College,London.

CsaxnlpR, R. tr. 1997.A spectral method for estimating parametersin rainfall models. Bernoull'i,
3(3), 301-322.

models. Internal
CHRi.tol,pR, R. E. 2003. Moment-basedznferencefor stochasti,c-mechani,stic
report no. 7. DEFRA Project Improued Methods for Nati,onal Spati,al-Temporal Rai,nfall and,
Euaporat'ion Modelli,ngfor BSM.

select'ionandtesti,ng.Internalreportno.
CHaNnlpR, R. E., & ONon, C.2005. Si,ngle-si,temod,el
11. DEFRA Project Improaed Methodsfor Nati,onalSpati,al-TemporalRai.nfall and Euaporation
Modelli,ngfor BSM.

CnpRuerNt, U., LucIANo, E., & VpccHrATo, W. 2004. Copula method,s'in finance. Wiley
Finance Series. Chichester : John Wiley & Sons Ltd.

C6Rnova, J.R., & RonnfcuEz-IruRBn, I. 1985.Ontheprobabilisticstructureof stormsurface


runofl. Water ResourcesResearch,2l(5), 755 763.

Cowax, R. 1987. A bivariate exponential distribution arising in random geometry. Annals of the
cal M athemati,cs,39 (7), 103-1 11.
Insti,tute of Stati,sti,

CowppRrwllt, P. S. P. 1994. A generalizedpoint processmodel for rainfall. Proceedi,ngs


of the
Royal Society. London. Series A. Mathemat'ical,Physi,caland Engi,neeri,ng
Sc'iences,447(1929),
23-37.

CowppRrwLlT, P. S. P. 1998. A Poisson-clustermodel of rainfall : high-order moments and


of The Royal Socr,etyof London : Series A, 454,885-898.
extreme values. Proceedi,ngs

CowppRrwalT, P. S.P., O'CoNNpr,L,P. E., Mprcalnp, 4.V., & Mawnslny, J. A. 1996.


Stochastic point process modelling of rainfall. I. Singie-site fitting and validation. Joumal of
Hydrology,L75(l-4), L7 4!6.

Cox, D. R., & IsHAIr,t,V. S. 1980. Poi,nt processes.London and New-York : Chapman and Hall.

for the enu'ironment2 : Water related issues.Yol.


Cox, D. R., & IsHalr,t,V. S. 1994. Stati,sti,cs
2. Chichester : Wiley. Chapter Stochastic models of precipitation, pages3-18.

Dp Mtcupl,tr, C., & SalvanoRl, G. 2003. A generalized Pareto intensity-duration model


of storm rainfall exploiting 2-Copulas. Journal of Geophys'icalResearch,108(D2). 4067,
doi : 10.1029I 2002JD002534.

Dnveoyo, L. 1986. Nonuniform random uariate generat'ion.New York : Springer-Verlag.


BIBLIOGRAPHIE 131

analysis of spati,alpoi,ntpatterns. Mathematics in Biology. London :


DIGGle, P. J. 1983. Stati,sti,cal
Academic Press Inc. fHarcourt Brace JovanovichPublishers].

Dowivtox, F. 1970. Bivariate exponential distributions in reliability theory. Journal of the Royal
Stati,sti,calSoci,ety: Series 8,32, 408-417.

DuaN, Q., SonoosHIAN, S., & GuetA, V. 1992. Effective and efficient global optimization for
conceptual rainfall-runoff models. Water ResourcesResearch,2S(4),1015-1031.

DuAi.i, Q. Y., GuerA, V. K., & SonoosHIAN, S. 1993. Shuffied complex evolution approach
for effective and efficient global minimization. Joumal of Opti,mizati,onTheory and Appli,cati,ons,
76(3), 501-521.

ENteRpcHrs, P. 2006. Discussionof : "Copulas:tales and facts" by T. Mikosch [2006,Extremes


9(1), 3 20; MR2327842]-Ertremes,g(7),45-47.

EMeRpcHrs, P., McNoIt, A., & SrRaurraRNN,D. 2002. Ri,skmanagement: Value at Ri,slcand
beyond.Cambridge : Cambridge University Press.

ENrpxH.q.er,D., Roonfcupz-IruRBe, I., & BacLESoN, P.S. 1989. Probabilistic representa-


tion of the temporal rainfall process by a modified Neyman-Scott rectangular pulses model :
Parameter estimation and validation. Water ResourcesResearch,2S(2),295-302.

FARLIo, D.G.J. 1960. The performance of some correlation coefficientsfor a general bivariate
distribution. Bi,ometrika.47. 307-323.

FRVRe, A.-C. 2001. Single and multi,-si,temodelli,ngof rainfall basedon the Neyman-Scottprocess.
Ph.D. thesis no.2320, École Polytechnique Fédérale de Lausanne.

FAVRE,A.-C., El ArlouNr, S., PpRRpRulr, L., TuIÉuoNGE, N., & BoeÉn, B.2004a. Mul-
tivariate hydrological frequencyanalysisusing copulas. Water ResourcesResearch,40. W01101,
doi :10.1029/2003WR002456.

FrvRe, A.-C., Musv, 4., & MoRcpNrsALER, S. 2004b. Unbiasedparameter estimation of


the Neyman-Scott model for rainfall simulation with related confidence interval. Journal of
Hyd,rology,286(1-4), 168-178.

FlprcHpR, R. 1987. Practi,calmethodsof optimi,zalzon.Secondedn. A Wiley-IntersciencePubli-


cation. Chichester : John Wiley & Sons Ltd.

FRANK, M.J. 1979. On the simultaneousassociativityof f (r,g) and r+A - T@,A). Aequati,ones
M athematicae.L9. Lg4-226.

FRnos, E. W., k Yl.ror.z, E. A. 1998. Understanding relationships using copulas. North


American Actuarial J ournal, 2(7), 1-25.
r32 BIBLIOGRAPHIE

GoNnst, C., & FAVRn, A.-C. 2007. Everything you always wanted to know about copula
modeling but were afraid to ask. Journal of Hydrologi.cEngi,neering,L2(4),347-368.

GoNnst, C., & MAcxAy, R. J. 1986.Copulesarchimédienneset familles de lois bidimensionnelles


dont les marges sont données. La reuue canad'iennede stati,stique,L4(2),145 159.

GnNnst, C., k RÉlulIl,lano, B. 2006. Discussionof : "Copulas : tales and facts" by T. Mikosch
[2006,Extremes 9(1), 3-20 MR2327842]. Ertremes, 9(1), 27-36.

GIEC. 2007. Climate change 2007 - the phgsi,calsc'iencebas'is: Worki,ng group I contributi,on to
the fourth assessmentreport of the IPCC (climate change 2007). Cambridge University Press.

Goel, N. K., KuRorHn, R. S., MRTHUR, B. S., & Vocor,, R. M. 2000. A derived flood
frequency distribution for correlated rainfall intensity and duration. Joumal of Hydrology,228(I-
2),56 67.

GRuvtalu, S., & SpRIN.q.lnt, F. 2006. Design hyetograph analysis with 3-copula function. 1/g-
drologi,calSc'iences J ournal, 5L (2), 223-238.

GuMnnl, E. J. 1958. Stati,sti,csof ertremes. New York : Columbia University Press.

Guvtenl, E. J. 1960. Bivariate exponential distributions. Journal of the American Stati,sti,cal


Associ,ation,55, 698-707.

HAltnRIN, M., & MANtnl, N. 1963. Interval estimation of non-linear parametric functions.
Journal of the American Stati,sti,calAssoc'iat'ion,58, 6LI 627.

HARRon, S., & KnLtoN, W. D. 2006. Numerical methods for realizing nonstationary poisson
processeswith piecewise-constantinstantaneous-ratefunctions. Si,mulation,82(3), 147-157.

HoucnaRo, P. 1986. A class of multivariate failure time distributions. Bi,ometri,lca,73(3),67L-


678.

HuNopcua, Y.,, k BÂnoossv, A. 2005. T[ends in daily precipitation and temperature extremes
across western Germany in the second half of the 20th century. Internati,onal Joumal of Clima-
tology, 25 (9), 7789-1202.doi :10.1002I joc.1182.

HurcHtxsoN, T. P., & Lar, C. D. 1990. Cont'inuousbi,aari,atedistributi,ons,emphas'isingappli,-


cat'ions. Adelaide : Rumsby Scientific Publishing.

T., & Yarr,ralroro, R. 1993. A statistical analysisof the extreme events : Long-term
IwasHIIr,t.R.,
trend of heavy daily precipitation. Journal of the Meteorologi,calSoci,ety of Japan. Series II,
7L(5),637-640.

Jon, H. 1997.Multi,aariatemodelsand dependenceconcepfs.Monographson Statistics and Applied


Probability, vol. 73. London : Chapman & Hall.
BIBLIOGRAPHIE 1_33

Joo, H. 2006. Discussion of : "Copulas : tales and facts" by T. Mikosch [2006,Extremes g(1),
3-20 ; MR2327842]. Ertremes, 9(1), 37-4I.

KAKou, A. 1997. Poi,ntprocessbasedmodelsfor rainfalL Ph.D. thesis,University College,London.

KARI, T. R., & KNIcHr, R. W. 1998. Secular trends of precipitation amount, frequency,and
intensity in the United States. Bulleti,n of the American MeteorologicalSoci,ety,79(2),23L-247.

KRRI, T. R., KNtcHr, R. W., & PlururvtpR, N. 1995. Tlends in high-frequencyclimate varia-
bility in the twentieth century. N ature, 377 (6546), 217-220. doi :10.1038I 377217a0.

KevvRS, M.L., & DptlnuR, J. W. 1981.Astochasticclustermodelofdailyrainfallsequences.


Water ResourcesResearch,L7 (4), 1151 1160.

KIM, S., & Kevvas, M. L. 2006. Stochastic point rainfall modeling for correlated rain cell
intensity and duration. Journal of Hydrologi,cEngi,neertng,LL(I), 29-36.

KoursovIaNNIS, D. 2004. Statistiques de valeurs extrêmes et estimation de précipitations


extrêmes : II. Rechercheempirique sur de longues séries de précipitations. Journal des Sc'iences
Hy drologi,ques, 49(4), 591 610.

KuRotHn, R. S., Gonl, N. K., & ManrsuR, B. S. 1997.Derived flood frequencydistribution


for negatively correlated rainfall intensity and duration. Water ResourcesResearch,33(9),
2703 2107.

Lno, P. A. 1981. Thecorrelatedbivariateinvertedbetadistribution. Bi,ometricaljournal,2S(7),


693-703.

MAIlHor, 4., DucunsNo, S., Cava, D., k TAlnor, G. 2007. Assessmentof fu-
ture change in intensity-duration-frequency (IDF) curves for Southern Quebec using the
Canadian Regional Climate Model (CRCM). Journal of Hydrology, 347(I-2), Ig7-2L0.
doi :10.1016/j.jhydrol.2007.09.019.

MRNopl,gRot, B. 1975. Les objets fractals. Paris : Flammarion Editeur. Forme, hasard et
dimension, Nouvelle Bibliothèque Scientifique.

MARoNNA, R. 4., MARIIN, R. D., & YoueI, V. J. 2006. Robust statistics. Wiley Seriesin
Probability and Statistics. Chichester : John Wiley & Sons Ltd. Theory and methods.

MASoN, J. 1986. Numerical weather prediction. Proceedi,ngsof the Royal Society of London.
Series A, Mathemati,caland,Physi,calSc'iences,407(1832),51 60.

MIKoscH, T. 2006. Copulas : tales and facts. Ertremes, g(1), 3-20.

MItcuol,t, M. 1996. An i,ntroductionto genetic algorithm. MIT press.


L34 BIBLIOGRAPHIE

MoRcpNsrnRN, D. 1956. Einfache BeispieleZweidimensionalerVerteilungen. Mitteili,ngsblattfiir


M athemati,sche Statistik. 8. 234-235.

NnLDoR, J. A., & Moan, R. 1965. A simplex method for function minimization. Computer
Journal, T, 308 313.

NusnN, R. B. 2006. An i,ntroducti,onto copulas.Secondedn. Springer Seriesin Statistics. New


York : Springer.

NusoN, R. 8., Quosana-MoLINA, J. J., & RonnfcuEz-LALLENA, J. A. 1997. Bivariate


T(3),205-220.
copulas with cubic sections. Joumal of Nonparametric Stati,sti,cs,

Nnppol, L., BouvInR, C., & NInl, H. 2006. Quelquesillustrations des sourcesd'incertitudes
dans l'analyse de I'aléa pluvieux/ some examples of uncertainties in rainfall hazard study. .La
Houille Blanche, 6, 22 26.

Nnw, M., HnwIrsoN, 8., Srppnpi{soN, D. B., TstcA, A., KRucnR, 4., MaxHtque, 4.,
Golroz, B., ConlHo, C. A. S., MASIST,D. N., Kur,ulaNcA,E., MeRN{saLaLA,E., Ann-
SINA,F., SALEH,H., KaruvRNGA,J., Aoost, J., BulaNtr, L., FoRruNara, L., MDoKA,
M. L., & La;oIn, R. 2006. Evidenceof trends in daily climate extremesover southern and west
Research,ILL(D74702), L47-157. doi :I0.702912005JD006289.
Africa. Journal of Geophysi,cal

NeyMAtt, J., k Scolrlr, E. L. 1958. Statistical approach to problems of cosmology. Joumal of


the Royal Stati,sti,calSociety. Series B. Methodological,20, I-43.

NonrHnop, P. 1996. Modelli,ngand stati,sti,calanalys'isof spati,al-temporalrai,nfall fi,elds. Ph.D.


thesis, University College London.

OspyspxpRA, J. T. 8., Taetos III, G. Q., & Sar,as, J. D. 1987. On parameterestimation


of temporal rainfall models. Water ResourcesResearch,2S(10),1837-1850.

ONor, C. 2003. Mathematical erpress'ionsof generalisedmoments used i,n si,ngle-siterainfall


models. Internal report no. B. DEFRA Project Improued,Methods for Nati,onal Spati,al-Temporal
Rai,nfall and Euaporati,onModelli,ngfor BSM.

ONor, C., k WHoRteR, H. S. 1994. Improvementsto the modelling of British rainfall using a
modified Random Parameter Bartlett-Lewis Rectangular Pulses Model. Journal of Hydrology,
L57(r-4),177 795.

Ouon, C., CnaNoLER,R. E., KRxou, A., NoRrHRop, P., WHranER, H. S., & IsHalu, V.
2000. Rainfall modelling using Poisson-cluster processes: a review of developments. Stochastic
Enu'ironmentalResearchand Ri,slcAssessment,L4(6), 384-411.

OvoRnny, O. 1997. Prédicti,on des cru,espar modéli,sati,on :


coupléestochastiqueet déter"mi,ni,ste
Ph.D. thesis no. 1751, École Polytechnique Fédérale de
méthod,eet analyse d,esi,ncerti,tud,es.
Lausanne.
BIBLIOGRAPHIE 135

OvnRNev, O., CousuncRa, D., Musv, 4., LAZARo, P., BoILLAT, J-L., k Sttti.tt-
cER, R.O. 2005. Infl,uence des changements cli,mati,quessur le régi,me hydrologi,queet
hydraulique des cours d'eau. Infoscience - Ecole Polytechnique Fédérale de Lausanne
j - e n t i f i c c o m m o n so.r g / 2 ' l 9 9 8 8 2 ' / 1 .
l h l .t ; p : 77 i i c .s c

Pl-ecxurr, R. L. 1965. A class of bivariate distributions. Journal o.f the American Stati,sti,cal
A ssoci,ati,on,60,, 516-522.

PtultlteR, N., SRT,INGER, M.J., Ntcuol,ls, N., SueeIRH,R., HnxNpssv, K.J., LntcultoN,
R.M., TRnwIN, 8., PAGn, C.M., & LoucH, J.M. 1999. Changesin climate extremesover
the Australian region and New Zealand during the twentieth century. Cli,matic Change, 42(7),
783 202. doi :10.1023lA:1005a724I8209.

PRnss, W. H., FlaruNpRv, B. P., Tpuxor,sxy, S. 4., & VarrpnlrNc, W. T. 1986.Numeri,cal


rec'ipes.Cambridge : Cambridge University Press. The art of scientific computing.

R.R.ucu,W., & DpTonrol, S. 2006. Climate change induced trends in high resolution rainfall.
Pages119-123o/:MotNlR, P.,EINnALT, T., BunlaNDo, P., Snvnut<,B., & Scuturn, W.
(eds),7th ertreme preci,pitation: Multisource data rneasurenlentand uncertai,nty.International
Workshop on Precipitation in Urban Areas.

ReNaRn, B., & LaNG, M. 2007.Use of a Gaussiancopula for multivariate exbremevalue analysis:
Some casestudies in hydrology. Aduancesi,n Water Resources,30(4), 897-912.

Roonfcupz-ItuRen, I. 1986. Scale of fluctuation of rainfall models. Water ResourcesResearch,


22(9S),15S-37S.

Ronnfcupz-IruRBE, I., Gurrl, V. K., & Wavivtrno, E. 1984. Scale considerations in the
modelingof temporal rainfall. Water ResourcesResearch,20(11),1611-1619.

Ronnicupz-IruRBtr, I., FneRns DE PowER,8., k ValoÈs, J. B. 1987a.Rectangularpulses


point process models for rainfall : Analysis of empirical data. Journal of Geophysi,calResearch,
e2(DB), 9645-9656.

Roonfcupz-ItuRnn, I., Cox, D. R., & Isualt, V.S. 1987b.Somemodelsfor rainfall basedon
stochastic point processes.Pràceedi,ngs of the Royal Soci,ety.London. Series A. Mathemat'ical,
Physi,cal and Engi,neeri,ngSci,ences,410 ( 1839), 269 288.

Roonicupz-IruRBtr, L, Cox, D. R., & IsHRrvt,V.S. 1988. A point processmodel for rain-
fall : further developments. Proceedi,ngsof the Royal Soci,ety.Lond,on. Series A. Mathemati,cal,
Phy si,caland Engineeri,ngSci,ences,4L7 (7853), 283-298.

Roussppuw, P . J ., & LnRov, A. M. 7987. Robust regress'ionand outli,erdetection.Wiley Series


in Probability and Mathematical Statistics : Applied Probability and Statistics. New York :
John Wiley & Sons Inc.
136 BIBLIOGRAPHIE

S.lNsô, B., & GunuNI, L. 2000. A nonstationary multisite model for rainfall. Journal of the
A m eri can Stati,sti,calA ssoci ati,on, 95 (452), 1089- 1100.

SaRrvlauov, I. O. 1974. New forms of correlation relationships between positive quantities ap-
plied in hydrology. Mathemati,calModels i,n Hydrology,I04 L09. (International Association of
Hydrological Sciences,Paris).

ScHpRrzpR, D., k Lovn.roy, S. 2004. Space-time complexity and multifractal predictability.


Physi,caA. Statisti,calMechani,csand i,ts Appli,cati,ons,
338(1-2), 173-186.

ScupRrzpR, D., LoveJoy, S., Scurvrrrr, F., CurcrRtNSKAyA,Y., & MARSAN,D. 1997.MUI-
tifractal cascadedynamics and turbulent intermittency. Fractals, 5(3), 427-477.

Sctttutott, J., k FRoI, C. 2005. Ttends of heavy precipitation and wet and dry spells in Swit-
zerland during the 20th century. Internati,onal Journal of Climatology, 25(6), 753-77t. doi :
10.1002/joc.7L79.

SINGH, K., & Stivcu, V. P. 1991. Derivation of bivariate probability density functions with
exponential marginal. Stochast'icHy drology and Hy drauli,cs,5 (7), 55-68.

SINNIGER,R.O. (ed). 1997. Recherchedans le doma'ine des barrages- crues ertrêmes. Com-
munication 5. EPFL, Laboratoire de constructions hydrauliques, Département de génie civil,
Lausanne,Academic Press.

Srr,aR, A. 1959.Fonctions de répartition à n dimensionset leurs marges. Publi,cati,ons


de I'Institut
de Stati,sti,que
de l'Uni,uersi,té
de Pari,s,8,229 23I.

SMItu, J. A., & KRRR, A. F. 1985a. Parameter estimation for a model of spacetimerainfall.
Water ResourcesResearch,26(8), 7257-L257.

SltIru, J. A., & KanR, A. F. 1985b. Statistical inferencefor point processmodels of rainfall.
21(1), 73-79.
Water ResourcesResearch.,

Sruu, M. 1986. A simple model for spatial-temporal processes. Water ResourcesResearch,


22(73), 2107-2rL0.

StnRu, R.D., & Con, R. 1984. A model fitting analysisof daily rainfall data. Proceedingsof the
Royal Soci,ety.London. Seri,esA. Mathematical, Physical and Eng'ineeri,ngSci,ences,I47,7-34.

TRpNspRTH,K.E., JoNes, P.D., AutnnxJn, P., Bo;aRIU, R., EasrpRt tNG,D., Kt pIN TANK,
A., PaRxnR, D., Raurrr,rzaoEH, F., RnNwICx, J.4., Rusucuccl, M., Sonou,B., kZuAt,,
P . 2007. Obseruat'ions: Surface and Atmospheric Cli,mateChange.In : Climate Change2007 :
The Physi,cal Science Basi,s. Cambridge University Press, Cambridge, United Kingdom and
New York, NY, USA. Contribution of Working Group I to the Fourth AssessmentReport of the
Intergovernmental Panel on Climate Change [Solomon, S., D. Qin, M. Manning, Z. Chen, M.
Marquis, K.B. Averyt, M. Tignor and H.L. Miller (eds.)]. Chapitre 3, pages 235 336.
BIBLIOGRAPHIE L37

VAns, G., WIr,lnMS, P., & BpnlaltoNr, J. 2002. 100 years of Belgian rainfall : are there
trends? Water Sci,ence€1 Technology,4S(2),5561.

VaxvaRcxn, E. 1983. Random fields. Cambridge, MA : MIT Press. Analysis and synthesis.

VoLcHo, T., TRocH, P. A., Dp Tnocu, F. P., & VaN DE VELDE, J.1994. Evaluationof
cluster-based rectangular pulses point process models for rainfall. Water Resources Research,
30( 10), 2847-2857.

VINCeNT, L.A., & MnKIS, É. ZOOO. Changesin daily and extreme temperature and precipitation
indices for Canada over the twentieth century. Atmosphere-Ocean,44(2),177-793.

WAvtvltRn, E., & GuptA, V. K. 1981a. The mathematical structure of rainfall representations
1. A review of the stochastic rainfall models. Water ResourcesResearch,17(5), L261 7272.

WAyMIRn, E., & GuetA, V. K. 1981b. The mathematical structure of rainfall representations
2. A review of the theory of point processes.Water ResourcesResearch,77(5), 1273-1285.

WAyMIRo, E., & GuetA, V. K. 1981c.Themathematicalstructureof rainfallrepresentations3.


Some applications of the point processtheory to rainfall processes.Water ResourcesResearch,
1-7(5),7287 L294.

ZHAI, P., ZHaNc, X., WAN, H., & PnN, X. 2005. Tfends in total precipitation and fre-
quency of daily precipitation extremes over China. Joumal of Cli,mate,18(7), 1096 1108. doi:
r0.1175lJCLI-3318.1.
BIBLIOGRAPHIE
Annexe A

Copules cubiques
Dans cet annexe, certains aspects théoriques relatifs aux copules cubiques sont exposés, en
complémentsdu chapitre 4.

4.1 Conditions nécessaires

Le théorème 2 donne les conditions nécessairespour que la fonction C(u,u), définie par la
relation (4.4), soit une copule cubique.

Théorème 2. Soi,enta, B : [0,1] ---+R deur foncti,onssati,sfai,sant


a(0): a(1) : B(0) : B(l) : 0,
par :
et soi,tC(u,u) une foncti,an défi,ni,e

C ( u , u ) : r r 1r) u ( \ - u ) l a ( u ) ( 1- u ) + 0 ( u ) u ) , ( u , r ) € [ 0 ,1 ] 2 .

Alors C est une copule s'i et seulements'i :


- a(u) et B(u) sont absolumentcont'inues,et
- pour presquetout u €
[0,1], le point {o' (r),0'@)} se s'ituedans S.
De plus, C est absolumentcont'inue.

Maintenant, limitons-nous aux copules avec des sections cubiques à Ia fois en z et u, c'est-à-dire
Ies copules s'exprimant sous la forme d'un polynôme bivarié d'ordre 3. Le théorème 3 caractérise
ce type de copules.

Théorème 3. Supposonsque C ai,t des sect'ionscubiquesen u et en u ; c'est-à-dire que pour tout


u)1)e [0,1], C s'écri,tcommesu'it :
- u) + 0(u)uJ
C(u,u): u't)r u(I- u)la(u)(1
et

c(u,u) : uu-r u(t - u)[1(u)(1


- u) + 6(u)u],
140 Copules cubiques

où a,8,1 et 6 sont des foncti,ons qui, sati,sfontles hypothèsesdu théorème 2. Alors C(u,u) peut
être erpri,méde la même façon que dans l'équation 1.6.

Les trois sous-familles suivantes appartiennent à la classe des copules cubiques et sont citées
dans Nelsen et al. (1997).
- Sarmanov Cas (i) dans Nelsen et al. (7997). La famille de Sarmanov (Sarmanov, 1974) est
symétrique et inclut I'indépendancecomme cas particulier.
- Flank cubique Cas (iv) dans Nelsen et al. (7997). Cette famille inclut I'indépendancepour
0 : 0 et atteint les valeurs extrêmes pour p. Le nom que nous avons attribué à cette famille
vient du fait qu'elle constitue une appïoximation du second ordre de la famille de Flank (voir
expression4.3.2).
Plackett cubique Cas (v) dans Nelsen et al. (7997). Cette famille est symétrique et inclut
le cas d'indépendancepour 0 : 0. Le nom que nous avons attribué à cette famille vient
du fait qu'elle représente une approximation du second ordre de la famille de Plackett (voir
Plackett, 1965) donnée par :

C(u,u):
I+0(u+u)- lr + 0(u+ r)l' - 4(0+ 1)0uu
20
pour d € [-1,2].
Ces copules cubiques ont été développées par Nelsen et aI. (1997) (excepté pour la famille de
Sarmanov).

4.2 Minimum du tau de Kendall pour une copule avec


sections cubiques en u et v

La valeur minimale du r de Kendall pour des copules avec des sections cubiques à la fois en u et
u est la solution du problème de minimisation suivant : minimiser l'équation (4.7) où At, Az, Br, Bz
remplissent les contraintes décrites dans le théorème (3). Nous notons directement qlueA1 et 82
sont interchangeables. Cela vaut aussi pour Az et Br. Cela revient donc à trouver :

+b){tls + (a- b)1450lr


Ëiî(,
en o et b quand(a,ô) e ^9de telle façonque
avec(a,6) e ^9.(a+b){119+(a-b)l+50} estcroissante
la solutionse situe sur I'ellipsea2-ab+b2 - 3a*3b : 0. En posant$ : {a-3- J -3o' t 6a * 9} 12,
a est une racine de -1250 -14002 +60022 +2223 + 24.Finalement, Ie point dans ,Squi minimise
r est{(-11+ 3119_}!_le-!}6\re) p, (11- 3/1e- 3 -1,I2 + 26\hg)l2j et nouspouvons
écrireque lrl < 1/+s+/ig - 205312b.
Annexe B

Moments avec une copule cubique

Dans les sections suivantes, nous présentons les éléments complémentaires au calcul des mo-
ments du NSRPM (voir chapitre 6).

E|.1 La fonction d'autocovariance avec la durée et ltinten-


sité des cellules dépendantes

La démonstration suivante donne le calcul de la covariance du I'intensité du processusde pluie


à un décalagez (voir section 6.1) :

cv(r) : Cov{Y(t),Y(t + r)}


:E{Y(t)Y (, + 1)} - E{r(r)} E{v(' + r)}
foo roo
: E {&-"(u)Xr*"-,(r)}E{d,^/(, + r - u)}
- z)d.n/(t
Jo J,
/n- f*
- px,L>uuxl>,E{d.^/(t- u)} E{dN(t + r - u)}
J" J"
: Ir- Iz
L42 Moments avec une copule cubique

Mais,

,r : E {x?+,-,(u)} t + r - u)2}
n {a,nr(
f,*
- + r - u)}
* [*
Jo Jo
[* u {rr-,(u)Xp,,-,(u)} E{dN(, z)d.nr(t

E n + r - u)}
J, {x?*,_,(u)}{alt(t
+f*f* tr{dN(t - z)dlr(t + r - u)}
Fx,r>uttx,r,>,
J, J,
grâce à I'indépendanceentre Xr-,(u) et X11,-o(u) quand r I u - u + O,et d-ô/2: dN. De plus,

-
b: [* [* u? r u u)1'4r.2urrx,12oÀ21t2odudu
t or*t
|^'-
* E{dl{(i - u)} E{dN(t + r -T-')}
Lrx,L>uttx,L>,
J" J,
et ff - 0 en raisonde la théoriede la mesurede Lebesgue.
O(" Tu-u)trry,L>upx,L>u^21.firdudu
"ff
Alors
/Êæ
cv(r) : I E {X|*"_,(r)} E{dl/(, -r r - u)2}
J.
Cov{dlr(, - z), dN(f + r - u)}
n [* [* ,","r-ur.,g,1,>,
Jo Jo
f* f
ff- furr
: \tro F*,,rruaur ÇE{D(D- D}pl l" dudu
Fx,t>u4x,t>us-etu+'-')
JIr " Jl"
o
lJo
næ ræ

+ | l-- P","r-,trx,L>oe-Ê@-"-")dudu] -l
Jo Ju+,
puisqueCov{d.n/(t-u),d,n/(t lr - r.')} est exprimé par (6.4) lorsqueu <uf r. Autrement, nous
avonsCov{d,n/(t- u),dN(t+r-u)} : Cov{dl/(t+ r-r),dN(t-u)} par symétriede Ia covariance.
Cela conduit à l'équation 6.5.

8.2 Calcul du moment du troisième ordre

Cette section fournit quelques éléments utiles à la compréhension du calcul du moment du


troisième ordre du NSRPM (voir section 6.2). Puisque l'équation (6.9) n'est valide que lorsque
fi 1t2 ( ts, différents cas doivent être considérés afin de calculer Ie moment du troisième ordre.
Par exemple, quand tr : tz et ts I f1, le moment d'ordre trois du processusde comptage s'exprime
comme:

} : E{dl/(rr )'zdN(r3)} : E{dr/ (rr)d.^,r(r3)


E{dr/(r1)dN (rr)d.^/(r3) },
8.2 Calcul du moment du troisième ordre L43

ce qui correspond au cas de deux cellules distinctes. Quand fi, t2 et f3 appartiennent à la même
cellule, le moment d'ordre trois du processusde comptage s'exprime comme :

} : E{dN(rr )3} : E{dN (tr)} : \ t' o.


E{d.^/(rl )d,^/(rr)d,^\r(r3)

Nous devonsconsidérerI'expression(6.9) en remplaçant ti, par t6-u; pour être en accord à I'expres-
sion (6.2).Nous intégronsE{Y(f1)Y(t2)Y(h)} selonI'ordrede f3 - ur)t2-u2etfi -ul, puisque
l'équation (6.9) n'est valide que lorsque h l tz < t3. Puisque 13 et f2 sont interchangeablesdans
(6.9), I'espaced'intégration peut se diviser de la manière suivante :

( u3€ [0,ts-hIut]
I( t r - u 1 1 t 2 - u 2 quano u2el},tz-h-fut)
tr-u11fu-u3
I u1 € JR+

tz-uz1t1 -u1
ouano I u3€[0,ts-tzluz]
u2€lt2-hlur,ooI
tz-uzlts-us
I z1 € JR.+

z1 e [0,h-te*ue]
(
I rr-u31fi-u1 quano u2 € l},tz - ts -f ue)
tt-uzltz-uz
t w e lts- tr, ool

Ce point est illustré dans la Figure 8.1.


I44 Moments avec une copule cubique

t1
.h\
u

Ut
tl^ _
*- u"
u1

Ftc. 8.1 Illustration des trois cas à distinguer lors du calcul du moment du troisième ordre du
NSRPM. (u) ,, - u1 z-t2 - u2 et tt - ur 4 tz - us. (b) tz - uz 1tt, - uy et t2 - uz 1fu - q. (c)
h - uz I tt - u1 et ts - us I tz - uz.
8.3 Moment du troisième ordre avec la copule FGM t45

8.3 Moment du troisième ordre avec la copule FGM

Dans le moment du troisièmeordre (centré)avecla copuleFGM et desmargesexponentielles


(voir équation6.10),f ?t,0,0,h) et g(r1,0,d,h) sontdonnéspar :
-483(8661d2+
r@,g,e,D:-tr52?+4)(s0+r6)(ph-r)qs+288081r6+21qq8+Map2Gaop02h-3440-5r2+ro4opeh+n8oph-6302)rt7
-ZZBa6ZrcB0h-r320+2g7 p02h+2r12ph-r802-320)q5+sp5(4093d2+2585
552g6+505520)q6 6+23520qn4+r44p6(260p0h_r6+32}Bh

+45Be2h-60)n3-6p7 (2orge2+n864+rr5040)q2-72ps h(0+4)(s0+r6)n+Pe(r24s02+eoea+7rc60)+128?10aq4


P4e+36rt7802-864tt6
p302+72r1a02+28ùf0_rcO8B6eq2+548802+tS4p80+L206p4n402
x8202+72q5p3|_rzqs Bs6_rn68n6p20-361t5 _t'S6,B2q6
_4688602q2

-86tr72
+2zo4p4n4 96-tz92q7 02h1zt6B4qs qh+zaBsehq+zz
eh-18Baf 02h-t4aB6q3eh-sap2r77 94q502h+3B802hq+so72ttE+96P8)
lnh-288Pq3(30
xe-2\h+2Tp302(p-2ù@+zrù(p-rù2(Ê+rr)'.-nnn-sz0B3(B-fi(B+zq)(B-zù(B1rù(rop2+6ep'-28tt2-r50q2)e

+ùG-ù@-zù(Ê+a17212B-4q-0q)e-h(p+n) +$28n30(B-ù(g-zq)(0+ù2(2p-4q-0n)e-h(P+2n) +Mans@a2r111+,ù(6840+16

x94 -3p302q-6483q-ZOBs6rt-80q2 +230n302


Ê2*rs69q3e+ZSABqs e-Bh -s6B(p+2îù(p+ù@-2n)2 (r8
-2081140-36q4e2-256n4)

h+96BBq-44P21130h-24aP2q2
xp402+94p40+zzB4oqn+zBL02hrt+24p4qh+9674+t8B302tl+gLB\en+22P30q2h+g93e2hn2+z4B3q2
nh
-6p2n302h-2g60n2Bz-4gBz6zrf-4882hq7-72pn3-6681t30-gpn302+9q402+48n4+48q40)e

et

g(rt,9,e,ù:5(3tt+ô@n+OQp+rù@-ù2 (g-zù2 (0+4)(4P302qh-z -218202n+L2l32rf


ptgz-uutU3+zzB30qh+6n7snh-s673 e2h
-l2q3e2 -96q30-192n3)-80
+g6p2rf0h-r68p2eq-288p2n+tSzB2q2h-nBq20218Br1302h+64pn30h-r44prfe+tzapqsh-288pq2

xrts(p-rù(p-2ù(28-+q-0q)(48p4+nP4e+rzeB30q+4rc0sn+602rtP3 +116802n2
+4502r72 9+544
Bz+484P2eq2+r184?n3+62027t3
-4p3(28+ù@-zq)(70385+z4B502at6op5+znoBse+soLB{02n+420384q+r44o74eq+s6o74
xg0q3+z4n40z+984n4+rs20n4)e-Ph

xq+8400Ê3rf+z8BB302q21za0z -169202
Bt\f148on293-4L6op2n3-1620392rt7-lg44B2q3e2-8640P20q3-5o4oePn4 Pr4-1-4t03Pq4
-ztOBsq3elzB+ù(9-rù(29-+tt-0q)(29+ar+er)e-h(Ê+zù -P402(P+2rù(3q+Ê)(29
-z84OPq4+3003q5596Oq5e1360n502)e-2tth

+ù@+ù@-ù2(12+q e-4nh883(2+0)(P-q)@n+0@+rù(9-2q)2(1402
P2+r^oeP2+320P2+u\oPq+630213n+63oeqP+6002n2

s6oB3q3(z1q@q+0(9-zù(zP+art+,ù(zB-+q-'rt) e-h(Ê+n)8B4e9+Lo)(2+e)(9-rù(0+zrù(0-zù(an
+6oo0n2+r44orz1s-nh
zF
+ Ê)(zg+ù@+q) e-snn -40q4(4q+p)(p+2q)(sq+p)(48+eq+4q)(20-4q-0q)2e n -

8.4 Formules générales des moments agrégés avec une co-


pule cubique

Les formules généralesdes moments agrégés avec une copule cubique telle que définie dans Ie
théorème (3) s'expriment de la manière suivante :

E ( V n ) : ( 3 6+ 2 A r - r A z * 4 B r 1 2 F , 2 ) h À p , p l 7 6 a r ù , (8.1)
L46 Moments avec une copule cubique

cv(r) : Àp,
o{2 (5Ar - 5Az+ 22& - 2282)- t At - 5Az + 44& - 2282)+ 6
"-en" "-zr(10
* 7) + D( D- 1) } (
+5 A r+2 2 r,1 )j l ( 108a2rP^E{ Azï2Bt- 282){Ar
" -'i " (3 6 "- t' "( Ar -
+ 2(45t Az t & * 2Bz)jB(Bn- 50'rt' + 4rf) - (2Ar- Az -r 4Bt - 2r,2)(120 + 2Ar
"-zn"
+ 3A2+ 4Br + 682)P(84- 7013'rt' + }qn)+ 5e-a'(6* At -r zBr){h -r Az -l 2(r8+ Br
+ Br)\g@n- L30'rf -l z6rt4) - 30e-Ê"qW6P4 - {468- 24Att Az2- 4BBr+ 96B2t 4Bz2

+ 4 A 2 (1 2 +B r)j T 'rt" +(3 6+ 2Ar +Az- r 4Bt+ 2Br ) 2r f1) l{ 2r 60a2r 1( Pu- t +gnr t'+49B2r f
- 36qu)),

var(Yoh): ), p,pl-7776- 850AL - 95A2 - 3740& - 478Bz * Be-3nt' {5 At - 5 Az + 22 (Br


- Br)j - 27 e-2'1h(70Ar - 5 Az * 44Br - 22 82)+ 2t6 â(36+ 5 Ar + 22 BL)+ 6 (1296
"-"
+ 110Ar * 25Az -r 4B4Br* 110 r,2)q hll{L944C2q3)+ À E{D(D - r1} (rOSOe-phq3[g6p4
- { 4 6 8- 2 4 A r * A z 2- 4 8 B r + 9 6 8 2 + 4 8 2 2+ 4 A 2 ( 1 2 + B 2 ) } P ' r l ' +( 3 6+ 2 A r * A z * 4
x Br * 2 Br)' ra\ çÊh(t - 13h)- 1) + 180(6+ Ar -r 2 Bt){A,,* Az *2 (ls + at + Bz)}02(Ê5
- B Psrf + g6P rtn)("-, h rq h - 1) - 9(2Ar - Az I 4Br - 282)(120+ 2 Ar + 3 A2 + 4 BL
-r +2qh) + 4(Ar - Az -r2 Br - 2 82){AL +2(45
- 70P"rt'+9 Bq4)(e-z'1h
+6 E,2)82(Bu
i Az -r & * 2 Br)jg' (Êu- 50"t' + +p qn)("-t' n -1 + 34 n)) /{SSSA p n3usu- t+ pnrt"
0o2
+ 49p2?n- 36?u)), (8.2)

et

Cov(\h,Y,|o) : Àtro("ro-1)'?[10A1(4+ Be'th+I2e2'th+8e3'tâ+ ea'th-27 *108e2l'z(t+'b)


"nh(r+k)
- byeqh(2+k) -27 - bAz{-27 (I + ennf + g(1 + unh1"znh1z}+ 2{3gBSe2qh(r+k)
"nn?+x)) "nh(r+k)
+ 2 g T B 2 e r h ( 1 +(kr)+ e n n f - B B B r ( 1 + e n h + " z n n 1 l2z 2 B r ( 4 * 8 e a â + L 2 e 2 ' t h * 8 e 3 '+? 4h e 4 ' t h - 2 7
Q -54"nh(z+k)-27 - tlt (,
x e?à(1+È)
*10g ezql,(r+ n"} + ^ E{D(D
"uqh(r+k)
"nn?+*)1111{3888o2
* Az-f2Bt-282){4+2(45t Az-r &+2Bz)}Bt("t n -D'@n -5Ê'rl'+4nn)
"-3aâ(1+e)(Ar-
- - Az + 4Br - 2Bù(120 +2Ar + 3A2+ 4Br +682)83(eznn-172çpa- 70P'
Q12)e-2'1th(L+k)(2Ar
x n2 +gqn) +99"-rrâ(r+k)(6+ A1 +28){AL* Az*2(1s + h+ Bz))Ê"(en -D"@n -731'rl'

+J6qa) - b40e-Ph(r+k) -t)2rf\\pn - - - 48&+968"+48r"


çsÊh {468 24AL+ Ar' +4A2(r2
-LhÊnrt"r49B2qa- 36qu)}.
+ Br)\g'rf + (36+ 2Ar+ Azr4Bt+znz)2r741)l{3s880c2Brt"(Pu
( 8.3)
Annexe C

Application du NSRPM avec un lien


inten sitê/ durée des cellules

Cet annexe présente les figures permettant d'analyser la performance des NSRPM incluant une
dépendanceentre I'intensité et la durée des cellules (voir chapitre 8).

C.l Fonction objectif

Les figures suivantes présentent les valeurs de fonctions objectif minimales pour chaque modèle
considéréet chaque mois, pour les applications réaliséesavec les sériesde pluie des stations de Brest,
Lyon, Marseille, Tludeau, Miami, Seattle, Los Angeles et Minneapolis (en complément des figures
de la section 8.3). Pour chaquesite, nous présentonségalementles estimations des paramètrespour
les mois de janvier et d'août.
148 Application du NSRPM avec un lien intensité/durée des cellules

Mois

FIc. C.1 Logarithme de Ia fonction objectif pour les différents modèles testés à la station de
Brest. Les modèles où I'intensité et la durée des cellules sont des variables aléatoires indépendantes
sont indiqués en ligne pleine (avec des carrés pour la distribution exponentielle, des cercles pour
la loi gamma et des croix pour la loi de Pareto). Les copulescubiquessont dessinéesà I'aide d'une
ligne pointillée (avec des carrés pour la copule Flank cubique, des cercles pour la copule Sym2 et
des croix pour la copule Asym3).
C.L Fonction objectif L49

Tae. C.l Estimations des paramètres du NSRPM / à Brest, les degrés de dépendance (tau de
Kend all r et rho de Pearson p) et les valeurs de la fonction objectif
ctil O(Q) pow le mois de jjanvier.
O($) pour
Distribution de X À rl lJ î,n a i o(ô)
Ind. Exponentiel 0.0143 7.02 0.017 72.51 0.89 0 2.52e-004
Ind. Gamma 0.0141 r .02 0 . 0 1 6 12.83 O.BB 0.96 0 2.39e-004
Ind. Pareto 0.0140 0.99 0 . 0 1 6 13.20 25.55 25.40 0 5.49e-004
Famille de copules À rl n
lJ lto Q, 0 t o(ô)
FGM 0.01,42 1 . 1 0 0.017 12.82 0.93 0.38 0.09 L.44e-004
Fcub 0.0141 7 . 1 2 0.017 12.99 0.94 0 . 1 5 0 . 1 0 1.25e-004
Sym2 0.0132 1 . 0 4 0.014 17.35 0.87 0.73 -0.25 3.58e-003
AsymS 0.0144 1 . 0 8 0.017 72.77 0.88 0.00 0.06 2.98e-004
modèle DD À n lto r c p 0(ô)
DD1 0.0143 r.02 0 . 0 1 7 L 2 . 5 7 1 . L 2 0.00 -0.00 2.52e-004
DD2 0.0194 0.84 0.064 73.54 72.33 2.25 -0.34 1.31e-001

Tae. C.2 - Estimations des paramètres du NSRPM / à Brest, Ies degrésde dépendance(tau de
e rho de Pearson p) et les valeurs de la fonction objectif (?(/ pour le mois d août.
KendallI r et
Distribution de X À û lto a ^l o(ô)
Ind. Exponentiel 0.0171 2.72 0.034 5.96 0.34 0 2.50e-001
Ind. Gamma 0.0128 2.24 0.036 25.L6 0.20 0 . 1 3 0 5.77e-002
Ind. Pareto 0.0157 7 . 9 7 0.036 9.65 3.97 3 . 9 6 0 1.05e-001
Famille de copules À rl lJ Itn a 0 I 0(ô)
FGM 0 . 0 1 7 1 2.72 0.034 5.96 0.34 -0.01 -0.00 2.50e-001
Fcub 0.0171 2.7L 0.034 5.95 0.34 -0.01 -0.00 2.50e-001
Sym2 0.0162 2.78 0.034 7.85 0.34 0.66 -0.26 1.45e-00i
Asym3 0.0L72 2.80 0.034 5.79 0.34 -0.07 0.04 2.64e-001
modèle DD À 11 fun f c p o(ô)
DD1 0 . 0 1 7 1 2.72 0.034 5.96 2.9L 0.00 -0.00 2.50e-001
DD2 0.0137 3.87 0.036 18.07 2.86 0.00 0.58 5.28e-002
150 Application du NSRPM avec un lien intensité/durée des cellules

<ê.

\J

bo

Ftc. C.2 Logarithme de la fonction objectif pour les différents modèles testés à la station de
Lyon. Les modèles où I'intensité et la durée des cellules sont des variables aléatoires indépendantes
sont indiqués en ligne pleine (avec des carrés pour la distribution exponentielle, des cercles pour
la loi gamma et des croix pour la loi de Pareto). Les copulescubiquessont dessinéesà I'aide d'une
ligne pointillée (avec des carrés pour la copule trYank cubique, des cercles pour la copule Sym2 et
des croix pour la copule AsymS).
C.l Fonction objectif 151

Tae. C.3 - Estimations d.esparamètres du NSRPM 4 à Lyon, les degrés de dépendance (tau de
Kendallr e
et rho de Pearson p) et les valeurs de la fonction objecti d) pour le mois de vler.
Distribution de X À û p l-LD a, 'l T 0(ô)
Ind Exponentiel 0.0108 14.83 0.274 39.57 0.43 0 3.09e-002
Ind Gamma 0.0107 16.72 0.272 70.13 0.27 0.39 0 2.76e-002
Ind Pareto 0.0109 13.96 0.272 46.32 T2.T3 7.48 0 2.85e-002
Famille de copules À 11 fun a 0 T o(ô)
FGM 0.0109 14.52 0.273 38.89 0.41 -0.27 -0.05 3.08e-002
Fcub 0.0109 9.74 0.272 33.37 0.4I -0.36 -0.25 3.10e-002
Sym2 0 . 0 1 1 1 9.64 0.270 39.87 0.44 -0.72 -0.37 2.72e-002
Asym3 0.0109 9.77 0.272 34.87 0.55 -0.35 -0.03 3.20e-002
modèle DD À rl p lto J
f c p o(ô)
DD1 0.0108 26.30 0.275 4L.78 3.94 0.00 -0.00 3.04e-002
DD2 0.0108 19.09 0.27r 7L.34 24.39 2.93 0.50 2.77e-002

Tae. C.4 - Estimations des paramètres du NSRPM 4 à Lyon, les degrés de dépendance (tau de
Kendall e rho de Pearson p) et Ies valeurs de la fonction objectif O(ô) poul le mois d août.
I r et
Distribution de X À û IJ lto a i T o(ô)
Ind. Exponentiel 0 . 0 1 0 1 3.09 0 . 1 2 5 4 . L 7 0 . 1 6 0 9.56e-003
Ind. Gamma 0.0106 3.57 0.170 10.23 0 . 1 0 0.29 0 8.47e-004
Ind. Pareto 0.0106 3.24 0 . 1 5 4 ô . ô J 29.29 7.02 U 3.80e-003
Famille de copules À rl IJ lto a 0 0(ô)
FGM 0 . 0 1 0 1 2.98 0.726 4 . T I 0 . 1 5 -0.26 -0.06 9.29e-003
Fcub 0 . 0 1 0 1 2.80 0 . 1 2 8 4.02 0 . 1 4 -0.22 - 0 . 1 5 8.84e-003
Sym2 0.0106 3.77 0 . 1 5 3 6 . 0 1 0 . 7 7 1 . 1 3 - 0 . 1 8 2.77e-003
Asym3 0.0100 2.99 0.L23 3.96 0 . L 4 -0.39 -0.04 1.08e-002
modèle DD À rl n
lJ I'to f c p 0(ô)
DD1 0.0096 0.27 0 . 1 4 1 4.39 2 2 . 1 6 L.46 -0.35 9.12e-003
DD2 0.0106 4.89 0.169 9.38 L4.49 0.59 0.52 8.91e-004
L52 Application du NSRPM avec un lien intensité/durée des cellules

(€_
\J
h^

Ftc. C.3 * Logarithme de la fonction objectif pour les différents modèlestestés à la station de Mar-
seille. Les modèles où I'intensité et la durée des cellules sont des variables aléatoires indépendantes
sont indiqués en ligne pleine (avec des carrés pour la distribution exponentielle, des cercles pour
la Ioi gamma et des croix pour la loi de Pareto). Les copulescubiquessont dessinéesà I'aide d'une
ligne pointillée (avec des carrés pour la copule Flank cubique, des cercles pour la copule Sym2 et
des croix pour Ia copule Asym3).
C.l Fonction objectif

Tas. C.5 - Estimations des paramètres du NSRPM / à Marseille, les degrésde dépendance(tau
valeurs de la fonction objectif O($) pot;r le mois de anvler.
ndall r et rho de Pearson p) et les vale
de Kendall
Distribution de X À rt l-LD a i I o(ô)
Ind Exponentiel 0.0067 12.r9 0.204 50.08 0.40 0 9.73e-003
Ind Gamma 0.0067 10.00 0.204 54.15 0.43 0.82 0 9.54e-003
Ind Pareto 0.0067 9.99 0.205 53.42 35.41 1 9 . 1 8 0 9.77e.003
Famille de copules À û p fuo a 0 T o(ô)
FGM 0.0067 12.45 0.205 57.72 0.43 0.37 0.08 9.60e-003
Fcub 0.0067 9.43 0.204 48.57 0.67 0.45 0 . 3 1 9.58e-003
Sym2 0.0067 7.80 0.203 57.32 0.77 2 . L \ 0.03 9.29e-003
Asym3 0.0067 9.77 0.204 47.22 0.49 -0.03 0.05 9.87e-003
modèle DD À rl tto f c p o(ô)
DD1 0.0067 13.35 0.205 D I . I I 2.70 0.03 -0.00 9.67e-003
DD2 0.0066 9 . 3 7 0.204 60.99 19.46 3.49 0.35 9.01e-003

Tas. C.6 - Estimations des paramètres du NSRPM / à Marseille, les degrésde dépendance(tau
de Kendall r et rho de Pearson p) et les valeurs de la fonction objectif (? d) pour le mois d' août.
Distribution de X À rl a ltn a i T 0(ô)
Ind. Exponentiel 0.0032 2.28 0.726 3.35 0 . 1 3 0 4.68e-003
Ind. Gamma 0.0029 2.32 0.723 2.83 0 . 1 6 1 . 6 1 0 4.05e-003
Ind. Pareto 0.0032 2.23 0 . 1 3 1 3.69 8 5 . 1 0 13.83 0 7.66e-003
Famille de copules À n a
U ttn a 0 t
o(ô)
FGM 0.0031 2.52 0.724 3 . 3 1 0.15 1.00 0.22 3.09e-003
Fcub 0.0031 2.75 0 . 1 2 3 3.36 0.16 0.58 0.40 2.51e-003
Sym2 0.0032 2 . 8 0 0.124 3.54 0.16 3.00 0.34 2.39e-003
Asym3 0.0031 2.37 0.725 3 . 2 7 0.13 0.00 0.06 4.14e-003
modèle DD À n a lto f c p o(ô)
DD1 0.0030 1 . 9 6 0.124 2.97 9.20 0.18 -0.08 4.09e-003
DD2 0.0032 2.05 0.129 3 . 5 7 23.09 1.07 0.26 3.73e-003
L54 Application du NSRPM avec un lien intensité/durée des cellules

<ê-

\)

Frc. C.4 Logarithme de la fonction objectif pour les différentsmodèlestestés à la station de Tfu-
deau. Les modèles où I'intensité et la durée des cellules sont des variables aléatoires indépendantes
sont indiqués en ligne pleine (avec des carrés pour la distribution exponentielle, des cercles pour
la loi gamma et des croix pour la loi de Pareto). Les copulescubiquessont dessinéesà I'aide d'une
ligne pointillée (avec des carrés pour la copule Flank cubique, des cercles pour la copule Sym2 et
des croix pour la copule Asym3).
C.1 Fonction objectif 155

Tae. C.7 - Estimations des paramètresdu NSRPM / à Tfudeau, les degrésde dépendance(tau de
I r et rho de Pearson p) et les valeurs de la fonction objectif O($) potn le mois de j anvler.
Distribution de X À rl ttn a i T o(ô)
Ind. Exponentiel 0.0043 0.96 0.366 72.49 r.67 0 1.98e-003
Ind. Gamma 0.0044 0.86 0.363 9.04 1 . 5 0 1.09 0 1.58e-003
Ind. Pareto 0.0078 0.38 0.006 r.07 64.98 43.61 0 6.06e-004
Famille de copules À rl lto L.I. 0 r o(ô)
FGM 0.0043 0.99 0.359 11.35 1.65 0.44 0 . 1 0 1.82e-003
Fcub 0.0044 1.01 0.350 9.55 1.63 0.38 0.25 1.65e-003
Sym2 0.0044 0.84 0.376 72.71 1.33 0.06 -0.35 2.48e-003
Asym3 0.0043 0.92 0.366 10.51 7.52 -0.08 0.04 1.75e-003
modèle DD À û tto t p o(ô)
DD1 0.0043 0.96 0.366 72.49 0.60 0.00 -0.00 1.98e-003
DD2 0.0042 0 . 5 1 0.362 3 4 . 1 8 2.47 1 . 6 9 -0.37 6.80e-003

Tle. C.8 - Estimations des paramètres du NSRPM / à Ttudeau, les degrés de dépendance (tau
de Kendall ho de Pearson p) et les valeurs
all r et rho rS de la fonction
tion objectiï O($) pour
objectif O(Q) potr le mois d'août.
Distribution de X À 11 p tto a i o(ô)
Ind. Exponentiel 0.0161 3.48 0.205 3 . 1 1 0.13 0 5.38e-003
Ind. Gamma 0.0163 4 . 1 8 0.259 5.66 0.09 0.46 U 1.60e-003
Ind. Pareto 0.0164 3.99 0.257 4.57 35.98 6.76 0 1.48e-006
Famille de copules À û p ltn o 0 T o(ô)
FGM 0 . 0 1 6 1 3.22 0.204 2.99 0.\2 -0.44 -0.10 4.51e-003
Fcub 0.0160 2 . 8 7 0.208 2.82 0.10 -0.40 -0.27 2.76e-003
Sym2 0.0161 2.77 0.225 2.86 0.08 -0.62 -0.40 2.83e-003
Asym3 0.0160 3.20 0.197 2.86 0.11 -0.55 -0.08 5.89e-003
modèle DD ) rl a
I'tn f cp o(ô)
DD1 0 . 0 1 6 1 3.48 0.205 3 . 1 1 7.98 0.00 -0.00 5.38e-003
DD2 0 . 0 1 6 1 6.48 0.283 8.09 25.62 0.76 0.52 1.55e-003
156 Application du NSRPM avec un lien intensité/durée des cellules

<ê.

\J

bo

FIc. C.5 - Logarithme de la fonction objectif pour les différents modèles testés à la station de
Miami. Les modèles or) I'intensité et la durée des cellules sont des variables aléatoires indépendantes
sont indiqués en ligne pleine (avec des carrés pour la distribution exponentielle, des cercles pour
la loi gamma et des croix pour la loi de Pareto). Les copulescubiquessont dessinéesà I'aide d'une
ligne pointillée (avec des carrés pour la copule FÏank cubique, des cercles pour la copule Sym2 et
des croix pour la copule Asym3).
C.l Fonction objectif

Tas. C.9 - Estimations des paramètres du NSRPM / à Miami, les degrésde dépendance(tau de
Kendall r et rho de Pearsonp) et les valeurs de la fonction objectif (2(@ r le mois de vier.
Distribution de X ) rl p l-to o 'v T 0(ô)
Ind. Exponentiel 0.0076 L.92 0 . 1 1 4 15.28 0.96 0 2.39e-002
Ind. Gamma 0.0074 L.64 0 . 1 1 4 44.57 0.63 0 . 1 9 0 8.69e-003
Ind. Pareto 0.0078 1 . 5 9 0 . 1 1 6 22.06 2.00 4.41 0 1.17e-002
Famille de copules À rl p fun a 0 I
0(ô)
FGM 0.0076 1.89 0.114 -0.09 -0.02 2.39e-002
1 5 . 1 3 0.95
Fcub 0.0077 1.83 0.114 14.86 0.92 -0.08 -0.05 2.39e-002
Sym2 0.0078 7.97 0.113 L9.20 0 . 9 1 0.60 -0.27 I.44e-002
Asym3 0.0076 1.95 0.115 L4.79 0.92 -0.18 0.01 2.57e-402
modèle DD À rl lJ fun f c p o(ô)
DD1 0.0072 0.18 0 . 1 1 6 72.78 3.22 0.74 -0.37 2.22e-002
DD2 0.0077 2.52 0 . 1 1 0 32.33 0.95 0 . 1 5 0.55 B.B3e-003

Tae. C.10 - Estimations des paramètres du NSRPM / à Miami, les degrésde dépendance(tau de
Kendall r et rho de Pearson p) et les valeurs de la fonction objectif (?(/ le mois d' août.
Distribution de X À n lJ ltn a i ,r o(ô)
Ind Exponentiel 0.0457 2.07 0.037 6.06 0.55 0 1.76e-001
Ind Gamma 0.0375 1,.72 0.037 II.T4 0.38 0.33 0 9.48e-002
Ind Pareto 0.0414 1 . 5 3 0.038 8.29 3.60 4.53 0 9.49e-002
Famille de copules À ïl tto d 0 0(ô)
FGM 0.0457 2.07 0.037 6.070.55 0.03 0 . 0 1 1.76e-001
Fcub 0.0457 2.07 0.037 6.060.55 0 0 1.76e-001
Sym2 0.0422 2.08 0.037 7.820.53 0.70 -0.26 1.05e-001
Asym3 0.0461 2.t5 0.037 5.920.54 -0.02 0.05 1.86e-001
modèle DD ) rl p l-tn
+
c p o(ô)
DD1 0.0457 2.07 0.037 6.06 t . 8 2 0.00 -0.00 1.76e-001
DD2 0.0364 2.69 0.038 13.39 1 . 9 1 0 . 1 9 0.54 8.08e-002
158 Application du NSRPM avec un lien intensité/durée des cellules

<e.
\., -J

b0

678910
Mois

FIc. C.6 - Logarithme de la fonction objectif pour les difiérents modèles testés à la station de
Seattle. Les modèles où I'intensité et la durée des cellules sont des variables aléatoires indépendantes
sont indiqués en ligne pleine (avec des carrés pour la distribution exponentielle, des cercles pour
la loi gamma et des croix pour la loi de Pareto). Les copulescubiquessont dessinéesà I'aide d'une
ligne pointillée (avec des carrés pour la copule Flank cubique, des cercles pour la copule Sym2 et
des croix pour la copuleAsym3).
C.1 Fonction objectif 159

Tas. C.11 Estimations des paramètresdu NSRPM / à Seattle, les degrésde dépendance(tau de
Kendal I r et rho de Pearson p) et les valeurs de la fonction obiectif (2 le mois de anvter.
Distribution de X À û
n
fun a 'l T o(ô)
Ind. Exponentiel 0.0155 9 . L 2 0.056 44.58 0.41 0 1.38e-001
Ind. Gamma 0.0134 5.76 0.053 86.52 0.37 0 . 3 1 0 1.06e-001
Ind. Pareto 0.0137 3 . 1 4 0.050 74.48 1 . 3 3 3.48 0 3.88e-002
Famille de copules À Tl n
l-LD a 0 T o@)
FGM 0.0156 8.93 0.056 42.8r 0.36 -0.44 - 0 . 1 0 1.34e-001
Fcub 0.0157 8 . 9 1 47.72 0 . 3 1 -0.28 - 0 . 1 9 7.27e-007
0.056
Sym2 0.0155 9.38 47.55 0.27 -0.31 -0.38 7.22e-002
0.056
Asym3 0.0757 9.09 4I.75 0.36 -0.50 -0.07 1.41e-001
0.057
modèle DD À n p llD f c p o(ô)
DD1 0.0154 9 . 1 3 0.056 44.60 2.44 0.00 -0.00 1.38e-001
DD2 0.0130 5.43 0.047 82.85 2.82 0.37 0.55 9.77e-002

Tae. C.12- Estimations des paramètres du NSRPM / à Seattle, les degrésde dépendance(tau
de Kendall z et rho de Pearson
earson p) et les valeurs IOn objectif 0($) pour re
vareurs de Ia fonction Ie mors
mois d'août.
Distribution de X À rl lJ
n
lto a i T o(ô)
Ind. Exponentiel 0.0049 2.86 0.068 37.67 L.87 0 1.48e-002
Ind. Gamma 0.0049 2.72 0.068 49.01 r .57 0.61 0 1.36e-002
Ind. Pareto 0.0043 6.77 0.088 1 0 1 . 9 6 114.55226.30 0 6.68e-002
Famille de copules À û l-rD o 0 T o(ô)
FGM 0.0050 2.54 0.068 34.45 1.66 -0.57 -0.13 1.39e-002
Fcub 0.0051 2.58 0.071 30.96 1.03 -0.58 -0.40 1.04e-002
Sym2 0.0051 2.50 0.068 37.33 1.36 -0.30 -0.38 5.59e-003
Asym3 0.0050 2.58 0.068 33.55 1.60 -0.67 -0.72 I.45e-002
modèle DD À û l-tn f c p o(ô)
DD1 0.0049 2 . 8 6 0.068 37.67 0.53 0.00 -0.00 1.48e-002
DD2 0.0048 2.83 0.066 50.28 1.16 0.78 0.42 1.51e-002
160 Application du NSRPM avec un lien intensité/durée des cellules

(s-
\,
b0

Ftc. C.7 - Logarithme de la fonction objectif pour les différents modèles testés à la station
de Los Angeles. Les modèles où l'intensité et la durée des cellules sont des variables aléatoires
indépendantes sont indiqués en ligne pleine (avec des carrés pour Ia distribution exponentielle, des
cercles pour la loi gamma et des croix pour la loi de Pareto). Les copules cubiques sont dessinées
à I'aide d'une ligne pointillée (avec des carrés pour la copule Flank cubique, des cercles pour la
copule Sym2 et des croix pour la copule Asym3).
C.1 Fonction objectif 161

Tae. C.13 - Estimations des paramètres du NSRPM / à Los Angeles, les degrés de dépendance
(tau de Kendall r et rho de Pearson p) et les valeurs de Ia fonction objectif O(/) pour le mois de
janvier.
Distribution de X Àrl ltn a 1 r o(ô)
Ind. Exponentiel 0.0043 0.59 0.053 3 2 . 1 0 2.08 0 1.59e-003
Ind. Gamma 0.0043 0 . 6 1 0.053 30.57 2.32 L.22 0 1.15e-003
Ind. Pareto 0.0041 7 . 6 2 0.066 188.29 33.56 146.60 0 1.63e-002
Famille de copules À rl Ito a 0 T 0(ô)
FGM 0.0044 0.50 0.053 27.96 1 . 8 7 -0.51 - 0 . 1 1 1.15e-003
Fcub 0.0044 0.49 0.053 27.57 1 . 8 4 -0.20 -0.13 1.16e-003
Sym2 0.0044 0.42 0.054 26.r0 7.52 -0.31 -0.38 9.28e-004
AsymS 0.0044 0.47 0.054 26.54 7 . 7 6 -0.80 - 0.16 7.92e-004
modèle DD À û tto r p c 0(ô)
DDl 0.0043 0.59 0.053 32.70 0.48 0.00 -0.00 1.59e-003
DD2 0.0064 r.76 0.063 59.74 r.0.81 3.07 -0.22 7.24e-00I

Tas. CJA- Estimations des paramètres du NSRPM / e Los Angeles,les degrésde dépendance
(tau de Kendall r et rho de Pearson p) et les valeurs de la fonction objectif (?(ô) pour le mois
d'
Distribution de X À û lto a i T o(ô)
Ind Exponentiel 0.0005 20.08 0.096 64.t| 0.37 0 1.33e-002
Ind Gamma 0.0005 23.77 0.096 r03.24 0.24 0.46 0 l.L7e-002
Ind Pareto 0.0006 L8.29 0.096 82.23 9 . 3 1 5.94 0 1.07e-002
Famille de copules ) n p ltn a 0 T o(ô)
FGM 0.0005 74.r7 0.095 64.45 0.46 -0.25 -0.06 1.33e-002
Fcub 0.0004 0.09 0.990 105.13 65.56 -0.58 -0.40 2.07e-001
Sym2 0.0006 9..63 0.094 68.36 0.55 -0.06 -0.36 1.05e-002
Asym3 0.0005 9.77 0.094 55.92 0.65 -0.28 -0.01 L.42e-002
modèle DD À n l-to r p o(ô)
DD1 0.0005 21.76 0.096 64.04 2.92 0.00 -0.00 1.32e-002
DD2 0.0005 L5.32 0.094 102.08 16.60 2.94 0.47 7.25e-002
L62 Application du NSRPM avec un lien intensité/durée des cellules

FIc. C.B - Logarithme de la fonction objectif pour les différents modèles testés à la station
de Minneapolis. Les modèles or) I'intensité et la durée des cellules sont des variables aléatoires
indépendantes sont indiqués en ligne pleine (avec des carrés pour la distribution exponentielle, des
cerclespour la loi gamma et des croix pour la loi de Pareto). Les copulescubiques sont dessinées
à l'aide d'une ligne pointillée (avec des carrés pour la copule trYank cubique, des cercles pour la
copule Sym2 et des croix pour la copule AsymS).
C.l Fonction objectif 163

Tae. C.15 - Estimations des paramètres du NSRPM / à Minneapolis, les degrés de dépendance
(tau de Kendall r et rho de Pearson p) et les valeurs de la fonction objectif O(S) pottr le mois de
janvier.
Distribution de X À n It Fo a i 0(ô)
I

Ind. Exponentiel 0.0071 72.90 0.107 23.32 0 . 5 1 0 4.55e-002


Ind. Gamma 0.0068 16.38 0 . 1 1 0 79.07 0.26 0 . 1 9 0 2.87e-002
Ind. Pareto 0.0076 9 . 6 1 0 . 1 0 6 32.03 3.92 4.88 0 1.81e-002
Famille de copules À û ltn a 0 I
o(ô)
FGM 0.0072 13.79 0 . 1 0 8 22.47 0.4L -0.49 -0.11 4.3Ie-002
Fcub 0.0075 9.77 0.107 18.02 0.32 -0.58 -0.40 3.16e-002
Sym2 0.0075 9.77 0 . 1 0 6 24.34 0.46 -0.33 -0.38 7.44e-002
Asym3 0.0071 9.77 0.104 20.7r 0.53 -0.60 -0.10 4.63e-002
modèle DD ) n lto t c p o(ô)
DD1 0.0071 12.90 0.107 23.32 1 . 9 6 0.00 -0.00 4.55e-002
DD2 0.0070 13.04 0.103 69.77 4.38 0 . r 2 0 . 5 7 1.82e-002

Tee. C.16 - Estimations des paramètres du NSRPM / à Mitrt"upolis, Ies degrésde dépendance
(tau de Kendall r et rho de Pearson p) et les valeurs de la fonction objectif O($) pour le mois
d'ao
Distribution de X À q o
ltn a "Y t
o(ô)
Ind. Exponentiel 0.0248 2.74 0.746 8.77 0.62 0 4.95e-002
Ind. Gamma 0.0230 3.00 0 . 1 6 5 22.61 0.4r 0.29 0 2.97e-002
Ind. Pareto 0.0247 3.59 0 . 1 8 9 24.44 2.08 3.67 0 7.60e-003
Famille de copules À q t3 îto o 0 T o(ô)
FGM 0.0248 2.53 0.144 8.32 0.58 -0.37 -0.08 4.82e-002
Fcub 0.0257 9.77 0.203 13.19 0.15 -0.58 -0.40 3.80e-002
Sym2 0.0250 3.02 0.L62 1 1 . 5 1 0.49 -0.06 -0.36 1.89e-002
Asym3 0.0249 2.54 0.143 7.98 0.56 -0.49 -0.07 5.15e-002
modèle DD À n a
ltn f c p o(ô)
DD1 0.0248 2.74 0.146 8 . 7 7 1 . 6 1 0.00 -0.00 4.95e-002
DD2 0.0225 6.22 0 . 1 8 3 39.13 2.66 0.00 0.58 1.98e-002
L64 Application du NSRPM avec un lien intensité/durée des cellules

C.2 Dépendance

Les figures suivantes rapportent les degrés de dépendance (mesuré par le tau de Kendall)
entre la durée et I'intensité des cellules pour chaque application et pour les copules Frank cubique
(Fcub), Asym3 et FGM (en complément des figures de la section B.a). Pour chaque structure de
dépendance, Ies résultats sont présentés en deux parties, la première étant liée aux applications
des modèlesen Europe, la secondeen Amérique du Nord.

Æl

!
,'*--- rl-r
c) tt o
:Z -..---;Ê.1---a
u'l

t-
i,,
i; It
l.
t.è'l'-
.zr I
tlt
lf
l,
.. ....1.......

FIc. C.9 - Tau de Kendall (mensuel)entre I'intensité et la durée des cellulesavec la copule Fcub
pour les stations de Zûrich, Uccle, Brest, Lyon et Marseille. Des lignes en pointillé indiquent les
bornes du tau de Kendall pour cette copule.
C.2 Dépendance 165

Frrrdea;l
'-è'Val
| d'or I
l- r -Miami I
.1"'O,'seatfle
lg
| + L o s A n g e l e s F
,,'O,' Minneapolis
| I

Æ 0.1
-
\t 0

71

b.-

FIc. C.10 - Tau de Kendall (mensuel)entre I'intensité et Ia durée des cellulesavec la copule Fcub
pour les stations de Tbudeau,Val d'Or, Miami, Seattle, Los Angeles et Minneapolis. Des lignes en
pointillé indiquent les bornes du tau de Kendall pour cette copule.
166 Application du NSRPM avec un lien intensité/durée des cellules

7t----{r\r

t
I
I
t
I
t
t
,
t) ç,,.
-o.os !"r
{
.'1

V
,l :

tI
rJt
'L/ -0.1 il :
F T:
l';-. ;
t--_ ,
l'. t

i u,'
| 1",,
lf

- -is,. l1

l, -.
. . . . . . 1 .... . .

Mois

Ftc. C.11 - Tau de Kendall (mensuel)entre I'intensité et la durée des cellulesavecla copule Asym3
pour les stations de Zùrich, Uccle, Brest, Lyon et Marseille. Des lignes en pointillé indiquent les
bornes du tau de Kendall pour cette copule.
C.2 Dépendance L67

^i
u1
cl

t-

Ftc. C.72 Tau de Kendall (mensuel)entre l'intensité et la durée des cellulesavecla copule Asym3
pour les stations de Tfudeau, Val d'Or, Miami, Seattle, Los Angeles et Minneapolis. Des lignes en
pointillé indiquent les bornes du tau de Kendall pour cette copule.
168 Application du NSRPM avec un lien intensité/durée des cellules

0.05
^i
-1
-. j* -t
.tt*' -
V 0
r - - - - . ! - - - - \-,r
.r-
,aI '\
,a
'r.
ot
t-

FIc. C.13 - Tau de Kendall (mensuel)entre I'intensité et la durée des cellulesavec la copule FGM
pour les stations de Zùrich, Uccle, Brest, Lyon et Marseille. Des lignes en pointillé indiquent les
bornes du tau de Kendall pour cette copule.
C.2 Dépendance 169

il
r
il
il
t!
il
tl
-l
t

c-l

O
-r'1

t- -o
I
I
---!'
I
N.
l_
l.
I
t
I
r_!
o

Mois

FIc. C.14 Tau de Kendall (mensuel)entre I'intensité et la durée des cellulesavec la copule FGM
pour les stations de tudeau, Val d'Or, Miami, Seattle, Los Angeles et Minneapolis. Des lignes en
pointillé indiquent les bornes du tau de Kendall pour cette copule.
L70 Application du NSRPM avec un lien intensité/durée des cellules

C.3 Extrêmes

Les figures suivantes illustrent la reproduction des valeurs extrêmes d'intensité pluvieuse aux
stations de Brest, Lyon, Marseille, Tbudeau, Miami, Seattle, Los Angeles et Minneapolis (en
complément des figures de la section 8.5).

Ind.Exp. Ind.Gamma
150 150 150

E t E
.Eroo ,Eroo .E too
.9 .9 .9
:G E
o.
!
À
50 50 50

2 'lo 50100 2 10 50100 2 10 50100


Péliodede retour [annéæ] Pérlodede retour (annéesl Périodede retou. lannéesl
FGM FrankCub. Sym2
150 150

E E Ê
,Eroo E .9 roo
,9 .tP .9
E f !
q À 4
50 50

2 'lo 50100 2 10 50100 2 10 50100


Pérlodede retour lannéesl Pé.iodede.etou. lanneesl Période de retour lannéês]
Asym3 DD1 DD2
150 150

E E
Ê
a
,9roo .Eroo
.9 .9 .9
:! a a
o. À À
50

2 10 50100 2 'lo 50100 2 10 50100


Pé.iodede retour [annéesl Pérlodede retour [anné6] Pérlodê de retou. [annéês]

Ftc. C.15 Maxima annuelsjournaliers à Brest. L'abscissedonne la période de retour en années


sur une échelle de Gumbel. La courbe en trait continu avec les symboles * représente les maxima
observés.Les courbes en trait pointillé représentent la moyenne (aveco) et un intervalle de confiance
empirique à 95% des maxima simulés obtenus à partir de 100 simulations de 100 ans.
C.3 Extrêmes 17r

Ind.Exp. lnd. Gamma

CU

E E E
Ê Èro E
.9 .9
:
À Ë.0
È )i :À

10
2 10 50100 2 10 50100
Périodêde retour lannéesl Pérlodede retour lannéesl

FrankCub. Sym2

E E E
E , Ê
.9 .c
= .9
! E
4 À À

2 10 s0 r00 2 10 50100 2 10 50100


Pérlodederetourlannéesl Périodede retour lannêsl Périodedê retour lannéesl

Asym3 DD2

E E E 40
Èq o Ê E
.9m -g o 30
f ' * 5 I
d C À
2Q

10
2 10 50 100 2 10 50100 2 10 50100
Période de retour lannées] Périodede retour lannéesl Péllode de retour [annéesl

FIc. C.16 - Maxima annuels horaires à Brest. L'abscissedonne la période de retour en années
sur une échelle de Gumbel. La courbe en trait continu avec les symboles f représente les maxima
observés.Les courbes en trait pointillé représentent la moyenne (avec o) et un intervalle de confiance
empirique à 95% des maxima simulés obtenus à partir de 100 simulations de 100 ans.
L72 Application du NSRPM avec un lien intensité/durée des cellules

lnd. Exp. Ind.Gamma

200 _ 20o
E E E
E rso Ë rso E
.9 .9 .9
I = :È
d 100 d 100

50 5U

2 10 50100 2 10 50100
Périodede retour lannées] Périodede retour lannéesl
FGM FrankCub.
250

200
E E E
E € rso E
.9 .9 .9
I : !
À E 100 e

50

2 10 50100 2 10 50100 2 10 50100


Périodede retour [annéesl Pérlodede retour lannéesl Périodede retour lannéesl

Asym3 DD1 DD2


250 250 250

200 200 200


E E E
.Erso E rso É rso
.E .9 .9
: f a
d 100 E 10O d 10o

5U 50

2 'to 50100 2 10 50100 2 10 50100


Pâlode de retou. Iannéesl Pérlodede retour lannéesl Périodede retour lannées]

Frc. C.17 - Maxima annuelsjournaliers à Lyon. L'abscissedonne la période de retour en années


sur une échelle de Gumbel. La courbe en trait continu avec les symboles f représente les maxima
observés.Les courbes en trait pointillé représentent la moyenne (aveco) et un intervalle de confiance
empirique à 95% des maxima simulés obtenus à partir de 100 simulations de 100 ans.
C.3 Extrêmes L73

Ind.Exp. Ind. Pareto


120
100
E E E 80
E E Ê
.9 .9 .9 60
E t !
o. À À 40
20

2 10 50 100 2 10 50100 2 'lo 50 100


Pérlodede retour lannéesl Périodede retour lannéesl Pérlodede retour [années]

FGM FrankCub. Sym2


124
100
E E - 80
t E E
.9 .9 ô0
= a "9
f
À c o-
40

2 10 50100 2 10 50100
Péllode de retour lannées] Pérlodede letou. [années]

DD1 DD2

E E E
E E. E
.9 .9
: .c
2
G o-

2 10 2 'lo 50100 2
5 01 0 0 10 50 100
Pérlodede.etour [annees] Pé,iodede fetoul lannées] Pé.lodede retour [annéæ]

FIc. C.lB - Maxima annuels horaires à Lyon. L'abscissedonne la période de retour en années
sur une échelle de Gumbel. La courbe en trait continu avec les symboles f représente les maxima
observés.Les courbes en trait pointillé représentent la moyenne (aveco) et un intervalle de confiance
empirique à 95% des maxima simulés obtenus à partir de 100 simulations de 100 ans.
t74 Application du NSRPM avec un lien intensité/durée des cellules

Ind.Exp. lnd.Gamma lnd Pareto


400 400 400

E 300 E 30o
: E 300
Ê
Ë eoo
E
À 100
.E
.g 2@
:4 tr"] .E
.9 20O
!
c
100 100
['**-..#'tt. , 2 10 50100
2 10 50100 2 10 s0100
Pérlodede retour [annéesl Périodedè retour lannéesl Pérlode de retou. [années]
FGM FrankCub. Sym2
400 400

E 30o E 30o
.E2@ .E20O
.g .9
E a
G 't00
100

2 10 50100 2 10 50100 2 10 50100


Périodede retour lannéesl Pé.lodede retour lannéesl Péilodede retou. [annéæ]
Asym3 DD1 DD2

E E 300
E
.E,
.9 .g 20O
I !
À À 100

2 10 50100 2 'to s0100 2 10 50100


Pérlodede retour lannéesl Périodede.etour lannées] Pérlodede retour lannéesl

FIc. C.19 - Maxima annuels journaliers à Marseille. L'abscisse donne la période de retour en
années sur une échelle de Gumbel. La courbe en trait continu avec les symboles f représente les
maxima observés. Les courbes en trait pointillé représentent la moyenne (avec o) et un intervalle
de confiance empirique à 95% des maxima simulés obtenus à partir de 100 simulations de 100 ans.
C.3 Extrêmes L75

Ind.Exp. Ind.Gamma lnd. Pareto


'150
150 150

Ê E E
E roo E 100 .i .o
E 1oo .' .o
.9 .g
= .c
:G ' , o .o"o'
..,,.,,." I .o,'o'
À À
50 50
:.9" ""
2 10 50100 2 'to 50100 2 'lo 50100
Périodede retou. lannéesl Pérlodedê retour [annêsl Pérlode de rctour lannéesl
FGM FrankCub. Sym2
150 150 .t50

Ê E E
E 1oo g 1oo 100 '.o
'""' o ..o E
.9 .9
= .9
:
3
À 4:33 o-
50
.o.o.
:,o.,..,....."
À
50 Ëî3
2 10 50100 2 10 50100 2 10 50100
Pérlodede retour [annês] Pé.lodede retour lannées] Périodêde.etour lannéesl

Asym3 DD1 DD2

E a E
g 100 E roo E 1oo
.9 .9 .9
2 E Ë.roo :À
o-
G
50 .o. : .,.,".".".' , . . 50

2 10 50100 2 10 50100 2 10 50100


Périodede retour lannéesl Périodedê retour [annêsl Périodede retour lannéesl

Frc. C.20 - Maxima annuelshoraires à Marseille. L'abscissedonne la période de retour en années


sur une échelle de Gumbel. La courbe en trait continu avec les symboles f représente les maxima
observés.Les courbes en trait pointillé représentent la moyenne (avec o) et un intervalle de confiance
empirique à 95% des maxima simulés obtenus à partir de 100 simulations de 100 ans.
176 Application du NSRPM avec un lien intensité/durée des cellules

Ind.Exp. Ind.Gamma lnd. Pareto


200 200

= 150 E 150
Ë Ê, t

E E Ê
.g 100 .9 .9 100
E
À !
o.
:4
50 50

2 10 50100 2 10 50100 2 10 50100


Périodede retour [années] Pérlodede retour lannées] Pérlodede retou. [années]

FGM FrankCub. Sym2

=, 150
E È E
E .E .E
.9 o 1ôn .E
E t 2
4 È o.
5U

2 10 50100 2 10 50 t00
Périodede retour [années] Pédodede retour [années]

DD1 DD2
200

150
E È 15O
=
E
Ê
E .E
.c .g 100 o 100
:À zG È
50 CU

2 10 50100 2 10 50100 2 10 50100


Périodede retour [annês] Périodede retour lannéesl Périodedê retour [annéesl

FIc. C.21 - Maxima annuels journaliers à Val d'Or. L'abscissedonne la période de retour en
années sur une échelle de Gumbel. La courbe en trait continu avec les symboles * représente les
maxima observés. Les courbes en trait pointillé représentent la moyenne (avec o) et un intervalle
de confiance empirique à 95% des maxima simulés obtenus à partir de 100 simulations de 100 ans.
C.3 Extrêmes 177

Ind.Exp.
80

Eoo E
Ê E
.E E
.c .9
Ë
Àoo !
À !
À
20

2 10 50 t00 2 10 50100 2 10 s0100


Périodede relour fannees] Périodede retour lannêsl Pérlodede retour [annéæ]

FGM FrankCub. Sym2


80

Ê 60 E E
E E E
.9 40 c: .9
2 f

À À À

2 10 50100
Pé.iodede retour lannês]

Asym3

E E60 E
E .E E
.9
: Ë oo "9
a
À 4 o.

20

2 10 50 100 2 10 s0100 2 10 50100


Pérlodede retour [annêsl Périodede retour lannéesl Pérlodede retoul lannées]

Ftc. C.22 - Maxima annuels horaires à Val d'Or. L'abscissedonne la période de retour en années
sur une échelle de Gumbel. La courbe en trait continu avec les symboles f représente les maxima
observés.Les courbes en trait pointillé représentent la moyenne (avec o) et un intervalle de confiance
empirique à 95% des maxima simulés obtenus à partir de 100 simulations de 100 ans.
1_78 Application du NSRPM avec un lien intensité/durée des cellules

Ind.Exp. lnd. Gamma lnd. Pareto

200 200
E E E
g
E 150 E 150
.9 .9 .9
fr roo !
f roo
50 #,É'":: À
50

2 10 50.t00 2 10 50100 2 10 50100


Pérlodede retour lannées] Périodede retour lannéesl Périodede retour lannéesl

FGM FrankCub. Sym2

200
Ë E ç
E E 150 t

.c .9 .9
:
!
È Ë 'oo o-

50

2 10 50 '100 2 10 50100 2 10 50100


Pérlodede.etour lannéesl Pérlodede retour lannéesl Périodede retour [annéesl

Asym3 DD1 DD2

200
Ê E E
E E 150 E
.9 o .c
:
!
fr roo
À
50
ffi:::r: À

2 'to s0100 2 10 50100 2 10 50100


Pé.iodederetou;lannês] Périodede retour lannéesl Pérlodede retour [annéæl

Ftc. C.23 Maxima annuelsjournaliers à Miami. L'abscissedonne la période de retour en années


sur une échelle de Gumbel. La courbe en trait continu avec les symboles * représente les maxima
observés.Les courbes en trait pointillé représentent la moyenne (aveco) et un intervalle de confiance
empirique à 95% des maxima simulés obtenus à partir de 100 simulations de 100 ans.
C.3 Extrêmes L79

Ind. Exp. lnd. Gamma

80
E E
g60
E
960 E
(, .9 .g
!
Ëoo Ëoo À
20 20
'to 50100 2 'lo 50 100
2 10 50100 2
Pérlodede retoul [annéæ] Périodede retour lannéesl Pé,lodêde letour [années]

FGM FrankCub. Sym2


100 100 100

80 80 80
E E a
E60 .g 60 E 60
.9 o .9
f :
À 40
. ^
d4u Ëoo
20 20 20

2 10 50100 2 'lo 50 100


2 10 50100
Périodede,etour lannéesl Pérlodede retour [annéesl Péliodede.elour [années]

AsymS DD1 DD2


r00 100 100

80 80 80
E E E
E 60 E OU .g 60
.9 .9 .9
! 5
40
À 40 À Ëno
20 20 20

2 10 50100 2 'lo 50100


2 1Q 50100
Périodede retour lannéesl Pé.iodede retour lannéesl Pérlodede retour lannéesl

Frc. C.24 - Maxima annuels horaires à Miami. L'abscissedonne la période de retour en années
sur une échelle de Gumbel. La courbe en trait continu avec les symboles * représente Ies maxima
observés.Les courbes en trait pointillé représentent Ia moyenne (avec o) et un intervalle de confiance
empirique à 95% des maxima simulés obtenus à partir de 100 simulations de 100 ans.
180 Application du NSRPM avec un lien intensité/durée des cellules

Ind.Exp. lnd. Gamma lnd.Pareto


120
100

E80 a E
E Ê ç
.;o o U o .9
E40 È
a :È
20
0 'lo
2 10 50100 2 50 100 2 10 50 100
Périodede retour [annéesl Pérlodede retour lannées] Pédodedê retour lannéesl

FGM FrankCub. Sym2

É E
E uo Ê E
o o .9
E40 f E
À o. 4

2 'lo 50 100
2
Périodede retour lannéesl Périodede retour lannéesl

DD1 DD2
3000
2500

E E 2000 E
E E t

.9 ;.1500 .c
a
À
a :À
E iooo
500
0 'to
2 10 50100 2 50 100 2 10 50100
Périodede retour lannéêsl Pérlodede retour lannées] Pédodede retoul [années]

Ftc. C.25 Maxima annuelsjournaliers à Seattle. L'abscissedonne la période de retour en années


sur une échelle de Gumbel. La courbe en trait continu avec les symboles * représente les maxima
observés.Les courbes en trait pointillé représentent la moyenne (aveco) et un intervalle de confiance
empirique à 95% des maxima simulés obtenus à partir de 100 simulations de 100 ans.
C.3 Extrêmes 181

Ind.Exp. lnd. Gamma lnd. Pareto

30
E E E
E E E
o1u E',20 840
E
G
2
c
!
o-
10

2 'lo 50 100 2 10 50100 2 10 50100


Périodede.etour lannées] Pé.iodede fetour lannées] Périodede.etour [années]

FGM FrankCub. Sym2

30 30 30
E E
Ê E
E É
E',20 ozu E'20
!
À E
4
2
o.
10 't0

2 'lo 50 100 2 10 50100 2 10 50100


Pérlodede.etour [annêsl Périodede retour lannéesl Pérlodede retour lannéesl

Asym3 DD1 DD2

200 40
30 o
E E
.r.o.o' Ê 30
É E 150 ..:.o,'.,...."' E
E',20 ; o:.' .c
:G E roo = 20
À ii'
À
50 10

2 10 s0 100 2 10 50100 2 'lo 50 100
Périodede retou. lannéesl Pérlodede retour lannéesl Pérlodede retou. lannées]

Ftc. C.26 - Maxima annuels horaires à Seattle. L'abscissedonne la période de retour en années
sur une échelle de Gumbel. La courbe en trait continu avec les symboles * représente les maxima
observés.Les courbes en trait pointillé représentent la moyenne (avec o) et un intervalle de confiance
empirique à 95% des maxima simulés obtenus à partir de 100 simulations de 100 ans.
182 Application du NSRPM avec un lien intensité/durée des cellules

lnd. Exp. lnd. Gamma lnd. Pareto

200
E Ê
E i tso E
.9

rE 1oo .9

G

50
-o\
2 10 50100 2 'lo 50100 2 10 50100
Pé.lodede retour lannées] Pérlodede retour lannéesl Pérlodede retour [années]

FGM FrankCub. Sym2

150
E
Ê E
Ê E
E
.c Et loo E',
100
!
È c

lot' iot'
2 10 50100 2 10 50100 2 10 s0 100
Périodede retour [annees] Pérlodede retour lannées] Périodêde retour [annéesl

Asym3 DD1 DD2

1s0
P ''uo E
t
E É
o .c E',100
E 1oo ! E
G À À

,Ot'

2 10 50100 2 10 50100 2 10 50 r00


Péllodede retou, lannéêsl Pérlodede.etour lannéesl Pérlodede.etour lannéêsl

Ftc. C.27 Maxima annuelsjournaliers à Los Angeles. L'abscissedonne la période de retour en


années sur une échelle de Gumbel. La courbe en trait continu avec les symboles 1 représente les
maxima observés. Les courbes en trait pointillé représentent la moyenne (avec o) et un intervalle
de confiance empirique à 95% des maxima simulés obtenus à partir de 100 simulations de 100 ans.
C.3 Extrêmes 183

Ind.Exp. lnd. Gamma lnd. Pareto

E E E
É .E E
.e .9 .9
! ! 3
À À À

2 10 50100 2 10 50100 2 10 50100


Périodede retour lannées] Périodede retour [années] Périodede retour lannées]

FGM FrankCub. Sym2

Ê E =
E Ê E
8I 4 0 .c
5
.9
:
À c À

2 10 50100 2 10 50100 2 10 50100


Péliodede retour lannées] Périodede retour lannées] Périodede.etour lanné€s]

Asym3 DD1 DD2

60
€ E E
E E E
î40
'5 .9 8I 4 0
a
À À À

2 'lo 50 100 2 10 50100 2 10 50100


Pé.iodede reiour [annéesl Pérlodede retour lannêsl Pérlodede retour [années]

FIc. C.2B - Maxima annuels horaires à Los Angeles. L'abscissedonne la période de retour en
années sur une échelle de Gumbel. La courbe en trait continu avec les symboles * représente les
maxima observés. Les courbes en trait pointillé représentent la moyenne (avec o) et un intervalle
de confi.anceempirique à 95% des maxima simulés obtenus à partir de 100 simulations de 100 ans.
184 Application du NSRPM avec un lien intensité/durée des cellules

Ind.Exp. lnd. Gamma


140 140
120 120

E E 100
E Eao
.9 o
! :60
o. o.
40
20

2 10 50 t00 2 10 50100
Périodede retour lannéesl Péfiodede retour lannées]

FrankCub. Sym2
140 140 140
120 120 120

E 100 E 100 E 100


,E ao ,E ao ,E eo
o o o
E
o.
oo E
Èoo
E60
À
40 40
20 20

2 10 50100 2 10 50 100
Périodede retour lannéesl Pé,iod6de retour lannéesl

DD1 DD2
'140

120
F E 100
F
Eao
o .9
: !q 6 0
À
40
20

2 10 50100 2 10 50100 2 10 50100


Pérlodede retour [annees] Périodede retour lanneesl Péliodede retour [annéæl

FIc. C.29 - Maxima annuelsjournaliers à Minneapolis. L'abscissedonne la période de retour en


années sur une échelle de Gumbel. La courbe en trait continu avec les symboles * représente Ies
maxima observés. Les courbes en trait pointillé représentent la moyenne (avec o) et un intervalle
de confiance empirique à 95% des maxima simulés obtenus à partir de 100 simulations de 100 ans.
C.3 Extrêmes 185

lnd.Exp.
60
50
=40 E E
E E
Eso .9 s
!
À20
:È 2
o.

10
0
2 10 50100 2 10 50100 2 10 50100
Pérlodede.etour [années] Périodede.etoul lannês] Pérlode de retour lannéesl

FGM FrankCub. Sym2


60
50
E Ê E
È4 0 E E
Ego "9 .9
5 ! f
dzo È À
10
0 'to
2 50100 2 10 50100
Périodede retour lanneesl Périodede.etour lannêsl
Asym3 DD1
60
s
E Ê
Èo o
E
E E
Eso .9 .9
E 5 2
L20 À À
10
0
2 10 50100 2 10 50100 2 10 50100
Périodede retour [années] Pérlodede retour lannées] Périodede retour [annéæl

Ftc. C.30 Maxima annuels horaires à Minneapolis. L'abscissedonne la période de retour en


années sur une échelle de Gumbel. La courbe en trait continu avec les symboles * représente les
maxima observés. Les courbes en trait pointillé représentent la moyenne (avec o) et un intervalle
de confiance empirique à 95% des maxima simulés obtenus à partir de 100 simulations de 100 ans.
Application du NSRPM avec un lien intensité/durée des cellules
Annexe D

Moments agrégés du processus


non-stationnaire

Cet annexe donne les formules impliquées dans les expressionsde la variance et de la covariance
de I'intensité de pluie agrégéepour le NSRPM non-stationnaire (voir chapitre 9).

D.1 Variance

Dans la formule (9.9) de la variancedu processusnon-stationnaireagrégé,fo(e,r1,B) et g"(e,11,B)


sont données par :

-96r1BEeh-32or73e
B5-224n5eP3+544q87e-32q6eB2+176q4P6h+272nsPr h+96r..2
fo(e ,q,g,h,i):352r12e86

xpah-r6on5 pEh_16q8B2h-2s6q6 p4h-LL2q7 pBh+tao1'rt4+tert7 B2 -saB8qa2s6tl5 p4 -t76p6rt3 -zzzB7

xq2 +8qBeB2h2-t6r18eB2ih2-sr2r14eB4-2s6q6eBAih2-tt2q7 ,B3ih2 att2q6 eBsh+L28rt6e7ah2


+256q5eBa

ih2 -t76tf eB6h- 13643e


xh+80q5 eBth2-t6on5eptih2+t6otl4€B5h-88q4ep6h2+!76t14€P6i,h2a272r13e87

x 97 h2 +96rfeBai\rz -272rz rBt h+r6n7 e?2h-48q2 eBBh2+r92eB8 -96qeBgth-z72tt2 eB7ih+ll2qô e93i.h*16

eB!h2+(27287 q2+96PEq-l92e78 -160


xq7 eB2ih+Lt2t16P3-176113196ih+256q5eB4ih+L6oqae05ih*56q7

xgsna+t7aB6rt7 -256p4n5 -g6qeBgh-256qs eBAlhasar\eBsih-544q€P7 +l76tl3eB6i,h-L60qa eBsih+256q5

xeB4h-ss2rf eB6+a2oq3eB'+272q2€p7ih+t6oq4eB'h+5l2q4eBn-L76q"rBun-272n2eP7 h+224n5Pse+lr2

xn6pseh+L6n7p2eh-t6q7 B2eih-Lt2q6 Bseih-l\2qa B2e-l6B2q7 -LI2p3n6) e-,th +e(286q5p4h-L76n2 96

+tr2q5 93-27271Bt arc}q3 B5*256n4 p4-96p8 -272q2 p7 h+Ll2tla Bzh-SAqBsh+L6Oq4 B5h-1761t3 p6h+tO

xr77B2h+t6r76 92) e-qih +e(2z2rt97 -tl2n5 Ê3+vaq, Ba _t6on3 p5 -16q6 p2 -256q4 p4+9688) e-no-7)h
188 Moments agrégés du processus non-stationnaire

et

go(e,q,A,h,i):52q3e85-lo2q5eBs+ll2q2eB6a92qB7 e-42q7 eB-Lo2q6eB2+44q496h+asq397 h+24n2PEh

-4oq5 p5h-4q8 92h-64q6 p4h-28q7 pBh-4p5rt4 +zar7792 -zaBgn+64n5 P4 -68Êurf -aa7'n'+2q8eBht2

xqEeB2h2-4q8eB2ih2-28q4eB4+4q8B-64tt6eB4ih2-28q7 eBsih2+34q6e/sh+32q6 eB4h2+30q5eP4h+20

xqs eB\h2 -4oq5epsih2 -t2n4ep5h-22r1rBa6z*44q4eB6ih2a68qs efr ih2 -44113ep6h-24q3 epI h2 +24112e

x B8ih2-24112e
97h-6q8 e+t4q7 e02h-tzrf 6Ba7rz Psih+28q7eB2ih
*24eBE-24qeB8ih-68n2e97,i,h+68q6e

+68T683-68?3 eB6ih+64qseB4ih-tAqB
eBi,h-4114eBsih+t4q7
eBth2+(as97 n2+24Ê8n-24e0E+28P5q4+68

x 96q3+4Baq5-24tlep8h+4T5ep4ih+zaqeBslh-g2qep7+6SqseBaih+28n4eB'ih-4q5 eB4h-ll2q2eB6 -52

xrfeBs 168q2e87ih-28qaeP\ h-8r14e84 -68rf eB6h-68r12rB7h) e-nh 1(28q7 eh-4q8 P-68n6 P3 -68q5 P4

-24n4p5+6rfe-2aq7 p2-4n8eih7+tozqseBea6*qsehBa-68116eih7!+68q6eh7s-6SqEeihBa-z\qaeBsih

-28117eih72+24qaep5h14qEehB+36q4eB4+42117
eg+lo2q6 eÊ2) e- Fh +r(zq8 +34n6 92+r4rt7 l3+34r15PB

+r2rt4Bre-Bh(2i-7) +€(24p8-24qp8h+4q5pLih-Arf A4h+2art4P5ih-28\4P5h-68ï386b+68r,Ê7++rf

xB4+6Bn2p7àh+6gn3p6ih+24nB8ih-64n2pzh+28q3p5+61rf p6)enh(r-2i) -€e-2Bi'h(n8+t7tttp3+Ttl7

xp+6q4 p4+r7qa B\Q1e2Êh)+e(5qB B5-aB8+zar7297 h+tzr7B8h-5q87 +srf P6-L2n7gih+n4 P4+2q5P4

xh-21t5 p4ih-L4tl4 psih-B4tt2 p7 th+zff 2nQ 1)à -e (t8É8+3arf


Bah-24n3 p6ih+L4n4 pih) e P6ih+3t

xrf BTth+zq' B4ih+t4tt4 Bs ih+r2qp8ih+qA p4+gns pE+3grtB7 +29n2 B6)e-2nih +e(28q6P3h+l1ra Bz -28

xr76Blih1aaq4 B5h+6ïrl5 B4h+4q7p2h-4r12B2th-68t15p4ih+6q5 p3 -34n4 p4+2n7 p+ztq" Buh-24qs P6ih

-24q286-56nsp5-AZT4Bsthlel-n1 r) Pilh-r(Zq7A+Mn'pe1t\q6B2-l6qaP4)e-rth(i'-r)-Ph(3i-2)

Ie(8q6B2a1gns1l+artaBalzqzB)e-nh(i \-P;h'si 3)-e(


naga+44y1zBaazlr1B7az4q3ps)e-tth(2i-r)

+€(2n4B4+4q5psLr2raBz) s-@+s9)ih +e(24naBa-4q7 92h+24q4P5àh+44n5B4ih-44n5 p4h+24n6l33ih+4

93 -I2n6 p2-t2q4 p4 -2117B) e-@+B)ç-r)h +ee24


xr17B2ih+ar7692+ZOq\Bs -Z+rlu A"h-Z4qo Bu1"-221t5

xqa Ba-4177B2ih-24q4 psih-44q5 B{hlaaqn BsthJ68q5 Baih{24n3p6ih+29tt6 psih+a6q4 p4+\aqe ps

+2q6 P2+16q5 93 +tn7 P2th+ztq2 96 -4q6 P2 -24t16Psih-20n5 Ps)e-@+B)ih.


D.2 Covariance 189

D.2 Covariance

Dans la formule (9.10) de la covariancedu processusnon-stationnaireagrégé,T.(e,q,B,h,i,k)


et g.(e,rl,0,h,i, k) sont donnéespar :

l"k,n,A,h,t,te):{24q2 P5-24e P5q+8e74T2+l6P6q+8B2eqa-2493q4 -t6B6e-8P2n5 +24PBeq3-8q3 94

+e(2403n8-sÊ4q3ih18Baq2 -z4P5q+24B5q2ih-lt6p6nih-2403qaihas92qa -Bp2q5ih-i,6P6)|

xe ?h(k-l) +(8eg4n2-zlt95n*24B5nzagB2rqa+24Bseq3-f696e-2aBzra-gp2rt'-Brl3p4+t6|6rt

l-1606rti,h-l606qh-8B4q3ih+24|5n2ih+8|4n2+aB4q3h-zaB6q2h-24p5tl+2tBsq3+8B2qa -8B2q5

xih+24|3tt4h+8B2q5h-zaBsrt4ih-L6P6)e-nh@+t) a(166Baqh-*ep4q3h+24eB5q2h-3zeB6qih-22

xeBaq2+96eB5q+t6e/4q3ih-A\eBsq2lh+teB2q5 +1682 eqsih+48B3eq4ih-BB2eq'h-zaBg eq4h-\zBz

xeqa-96Bserf+48Psn4+l6q3P4r64eB6-3286q-4895rf)e-nhk +e(24psn4h+spansh+8p2n5h-t6p6

xnh-24P5n2h) e-n?+'k)h *eO6B6qh-gBzrs1r-24Bsqah-8paq3ha24Bsn2h) e-n1+h-1)h

et

ge(e,r1,B,h,i,k):(arf +r{-4n3P3-6q4Bsh(i-I)-2qsP2
B5-4eBsq-2eB4q2+486q+2q3Pre-nh(k-r)

xh(i-r)+n'p+q4p2-4n3B4h(i_u_aq2BA]te nh(i-r)-Êh(t+k)G_,e0h)+{-art4p3-2q6p-6q5p2

+r(q6+2q4p2+Jrt'p+4r14
B3h-4q4psih+6q5p2h+4tt492+6n5p-2q6ihp+2q6hp+2q6-6qs
p2ih)\

x e Bh(È+l)+e(485q*2Batt2)e-\h(2i.-2+tc)
-r(Jn'p+2q482+q6)e-Ph(2i-2+k)+{e(4p6q,ih-4p6

xnh+2|AnBih+6Bsrfth-zBnrz-zB4q3h-685r12h-6P5n-4P6
-2p4q2-4p5n+2g4q3m-zpLrf-a

xgsq+6g5n2th+406qih-496)+4BGq+685q2+2q3BAje-nh(k+r)
+(4n6p-Zrt6rhp-4q4ep3h-6qse
-6q6e+8q4
x92h-L8q5€P+4q6ei.hBaSqaeBeih+l2qsep2ih-t2t14eB2 p3+r2n5p2)e-Bhk+e(8É6-G

x B5q2h-2Baq3h-4Ê6qh*I2Ê5rf
ih+8B6nih+Agan2 -8P5q)e-\h(2i'+h-r)
+tzBsr,14Ê4n3ih-4p4rt2

*e(-4B61aBsq2h+zB4qsh-aB6qih-l4B6qh-68542th-zBaq2-6P5tl-274qsih)s-nh(zi'+k-z)
a74.

Ê4+grÊ6-sÊ6rt
x B6r1hl2eBaq3h+6eB5q2h-8eB6qiha8eBan2+2oeB5q-AeBar73ih-t2epsq2ih-aq\
_l2B5n2)e-qhk_e(q'p_q4p2)e nh(i-r)-ph(3i.+tc-2)
+e(q'p+n4p2)e nih Bh(3i.+k)
+r(tlLp2+tl'

xp)e-nh(i-L)-Ph(3i+t4-3)
a6s-nlh-Fh(tIo)eqnpr+ZrtuB";,h-n"p+ttrB4+tTsBtehaerttpsih+
-e9nlte(47\q*2Baq2-aÊ5n+aÊ'n2ih+274qsih+274n2
xq3 B311t +4B6qih+Apa]).-nnQt+N)
1e

x e-Ph(2i+k)(gq"g+znnp"*rur1ze?n -t11-aqs Bz-2qaB-4qalj3+r1zqaBza3q5B+q6+2r,6-2qa


-e(qïP+qap2)e-qi'h-Ph(3i+k-1).
xih7-4n4p3ih+4q482+AnEB-Aqip2ih)je-Ph(k-r)

Vous aimerez peut-être aussi