Poly-2M216

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 71

Université Pierre et Marie Curie – Paris 6

Licence de Mathématiques, 2ème année

Fonctions de plusieurs variables,


analyse vectorielle,
intégrales multiples
2M216
Jean-François Babadjian
Table des matières

1 Notions de topologie dans Rn 5


1.1 Propriétés algébriques de Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Normes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3 Suites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.4 Topologie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4.1 Ensembles ouverts, fermés . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4.2 Ensembles compacts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.4.3 Ensembles connexes et convexes . . . . . . . . . . . . . . . . . . . . . . . . 12

2 Fonctions continues 13
2.1 Définitions, propriétés fondamentales . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2 Exemples importants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.2.1 Fonctions Lipschitziennes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.2.2 Applications linéaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.2.3 Polynômes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.2.4 Applications partielles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.3 Continuité et compacité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

3 Différentiabilité et dérivées partielles 21


3.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.2 Propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.3 Fonctions de classe C 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.4 Dérivées partielles d’ordre deux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.5 Points critiques et extrema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

4 Courbes et surfaces paramétrées 39


4.1 Théorème des fonctions implicites . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.2 Courbes paramétrées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.3 Surfaces paramétrées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

5 Equations aux dérivées partielles 47


5.1 Equations elliptiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
5.2 Equations paraboliques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
5.3 Equations hyperboliques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
5.3.1 Equation de transport . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
5.3.2 Equation des ondes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

3
4

6 Intégrales multiples 51
6.1 Pavés, ensembles pavables et quarrables . . . . . . . . . . . . . . . . . . . . . . . . 51
6.2 Définition et propriétés de l’intégrale multiple . . . . . . . . . . . . . . . . . . . . . 53
6.3 Théorème de Fubini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
6.4 Formule de changement de variables . . . . . . . . . . . . . . . . . . . . . . . . . . 62
6.4.1 Coordonnées polaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
6.4.2 Coordonnées cylindriques . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
6.4.3 Coordonnées sphériques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

7 Intégrales curvilignes et surfaciques 65


7.1 Intégrale curviligne et formules de Stokes-Ostrogradski . . . . . . . . . . . . . . . . 65
7.1.1 Longueur d’un arc orienté . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
7.1.2 Intégrale curviligne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
7.1.3 Formules de Stokes-Ostrogradski . . . . . . . . . . . . . . . . . . . . . . . . 68
7.2 Intégrale surfacique et formule de la divergence . . . . . . . . . . . . . . . . . . . . 69
7.2.1 Aire d’une surface . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
7.2.2 Intégrale de surface . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
7.2.3 Formule de la divergence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
Chapitre 1

Notions de topologie dans Rn

1.1 Propriétés algébriques de Rn


L’ensemble Rn est un espace vectoriel sur R de dimenson finie égale à n ∈ N∗ . Ses éléments sont
appelés des vecteurs. En tant qu’espace vectoriel de dimension n, il existe une base {e1 , . . . , en },
i.e. une famille libre et génératrice, de sorte que tout vecteur x ∈ Rn peut s’écrire
n
X
x= xi ei ,
i=1

où x1 , . . . , xn ∈ R désignent les coordonnées de x dans la base {e1 , . . . , en }. Une fois fixée la base
(la plupart du temps, on utilisera la base canonique définie par eij = δij pour tout 1 ≤ i, j ≤ n),
on identifiera le vecteur x avec la matrice colonne de taille n × 1
 
x1
 .. 
 . .
xn

et on écrira  
x1
x =  ...  = (x1 , . . . , xn )T .
 

xn
AVERTISSEMENT : Le fait de représenter un vecteur de Rn sous forme d’un vecteur colonne
sera essentiel lorsque l’on devra effectuer des produits matrices/vecteurs. Dans les autres situations,
la représentation d’un vecteur sous forme d’une colonne ou d’une ligne ne sera pas particulièrement
importante et pour cette raison, nous ferons parfois des abus de notations.
En tant qu’espace vectoriel, Rn possède
– une loi interne (l’addition) : si x = (x1 , . . . , xn )T ∈ Rn et y = (y1 , . . . , yn )T ∈ Rn , alors

x + y := (x1 + y1 , . . . , xn + yn )T ∈ Rn ;

– une loi externe (la multiplication par un réel) : si x = (x1 , . . . , xn )T ∈ Rn et λ ∈ R, alors

λx = (λx1 , . . . , λxn )T ∈ Rn .

5
6 CHAPITRE 1. NOTIONS DE TOPOLOGIE DANS RN

1.2 Normes
L’ensemble Rn est un espace euclidien ce qui signifie qu’il possède un produit scalaire : si x =
(x1 , . . . , xn )T ∈ Rn et y = (y1 , . . . , yn )T ∈ Rn , le produit scalaire euclidien entre x et y est défini
par
Xn
x · y := xi yi ,
i=1

et la norme euclidienne qui en est héritée est donnée par

n
!1/2
√ X
kxk := x·x= x2i .
i=1

Notons que si x ∈ Rn et λ ∈ R, alors

n
!1/2 n
!1/2
X √ X
kλxk = (λxi )2 = λ2 x2i = |λ|kxk. (1.2.1)
i=1 i=1

Par ailleurs, on a clairement que k0k = 0 et réciproquement, si kxk = 0 alors xi = 0 pour tout
i = 1, . . . , n ce qui montre que

kxk = 0 si et seulement si x = 0. (1.2.2)

Montrons deux inégalités fondamentales dont l’usage sera systématique dans la suite de ce cours.
Théorème 1.2.1 (Inégalité de Cauchy-Schwarz). Pour tout x et y ∈ Rn , on a

|x · y| ≤ kxkkyk.

L’égalité |x · y| = kxkkyk a lieu si et seulement si x = λy pour un λ ∈ R.


Démonstration. Pour tout t ∈ R, on définit
n
X n
X
P (t) := kx + tyk2 = (xi + tyi )2 = (x2i + 2txi yi + t2 yi2 ) = kxk2 + 2tx · y + t2 kyk2 .
i=1 i=1

La fonction P est un donc un trinôme du second degré et son discriminant est donné par ∆ =
4(x · y)2 − 4kxk2 kyk2 . Comme P (t) ≥ 0 pour tout t ∈ R, alors nécessairement ∆ ≤ 0 car sinon le
polynôme P possèderait deux racines réelles distinctes et il changerait de signe. La condition sur
le discriminant implique donc (x · y)2 ≤ kxk2 kyk2 , soit |x · y| ≤ kxkkyk.
En ce qui concerne le cas d’égalité, on constate que ∆ = 0 si et seulement s’il existe un unique
t0 ∈ R tel que P (t0 ) = 0, soit kx + t0 yk2 = 0, ce qui est encore équivalent au fait que x = −t0 y.
Théorème 1.2.2 (Inégalité triangulaire). Pour tout x et y ∈ Rn , on a

kx + yk ≤ kxk + kyk.

Démonstration. On développe le carré et on utilise l’inégalité de Cauchy-Schwarz,

(kxk + kyk)2 = kxk2 + 2kxkkyk + kyk2 ≥ kxk2 + 2x · y + kyk2 = kx + yk2 ,

ce qui établit l’inégalité souhaitée par passage à la racine carrée.


1.3. SUITES 7

De façon générale, on a la
Définition 1.2.3. On appelle norme sur Rn une application N : Rn → [0, +∞[ telle que
i) (Séparation) N (x) = 0 si et seulement si x = 0 ;
ii) (Homogénéité) N (λx) = |λ|N (x) pour tout x ∈ Rn et tout λ ∈ R ;
iii) (Inégalité triangulaire) N (x + y) ≤ N (x) + N (y) pour tout x et y ∈ Rn .
La conjonction de (1.2.1), (1.2.2) et de l’inégalité triangulaire montre bien que la norme eucli-
dienne est effectivement une norme au sens de la définition 1.2.3. De façon générale, on considère
les quantités
n
!1/p
X
p
kxkp := |xi | , pour tout 1 ≤ p < ∞, kxk∞ = max |xi |.
1≤i≤n
i=1

On peut alors montrer que les applications k · kp (1 ≤ p ≤ ∞) définissent des normes sur Rn .
Notons au passage que la norme euclidienne correspond à p = 2.
La définition suivante fournit un critère de comparaison entre deux normes distinctes.
Définition 1.2.4. Soient N1 et N2 deux normes sur Rn . On dit que N1 et N2 sont équivalentes
s’il existe deux constantes α > 0 et β > 0 telles que
αN1 (x) ≤ N2 (x) ≤ βN1 (x), pour tout x ∈ Rn .
Cette propriété signifie intuitivement qu’un vecteur “petit” selon la norme N1 le sera aussi selon
l’autre norme N2 . On peut vérifier à titre d’exercice (en utilisant l’inégalité de Cauchy-Schwarz)
que pour tout x ∈ Rn , √
kxk2 ≤ kxk1 ≤ nkxk2
et
1
√ kxk2 ≤ kxk∞ ≤ kxk2 .
n
En fait, la propriété suivante, que nous démontrerons à la fin du chapitre 2 nous permet de
travailler indifféremment avec une norme ou une autre. Sauf mention du contraire, nous utiliserons
systématiquement la norme euclidienne.
Théorème 1.2.5. Toutes les normes sur Rn sont équivalentes entre elles.

1.3 Suites
Définition 1.3.1. Soit (xk )k∈N une suite de Rn . On dit que (xk )k∈N converge vers a ∈ Rn , et on
note xk → a, si pour tout ε > 0 il existe un N ∈ N tel que pour tout k ≥ N , on a kxk − ak < ε.
AVERTISSEMENT : Si (xk )k∈N est une suite de Rn , l’indice en haut désigne l’indice de la suite.
En revanche, l’indice en bas désigne la composante du vecteur. Ainsi, xki est la i-ème composante
du vecteur xk .
Proposition 1.3.2. La limite, si elle existe, est unique.
Démonstration. Soient a et b ∈ Rn deux limites de la suite (xk )k∈N . Alors, pour tout ε > 0 il existe
un Na ∈ N tel que pour tout k ≥ Na , on a kxk − ak < ε. De même, il existe un Nb ∈ N tel que pour
tout k ≥ Nb , on a kxk − bk < ε. Notons N := max(Na , Nb ), en vertu de l’inégalité triangulaire,
pour tout k ≥ N , on a
ka − bk ≤ ka − xk k + kxk − bk < 2ε,
ce qui montre que a = b, puisque ε est arbitraire.
8 CHAPITRE 1. NOTIONS DE TOPOLOGIE DANS RN

Le résultat suivant montre que la convergence d’une suite de Rn est équivalente à la convergence
de chacune de ses composantes dans R.

Proposition 1.3.3. Soit (xk )k∈N une suite de Rn et a ∈ Rn . Alors

xk → a ⇐⇒ xki → ai pour tout 1 ≤ i ≤ n.

Démonstration. Si xk → a, alors pour tout ε > 0, il existe un N ∈ N tel que pour tout k ≥ N , on
a kxk − ak < ε. Comme |xki − ai | ≤ kxk − ak pour tout 1 ≤ i ≤ n, on en déduit que |xki − ai | < ε
pour tout k ≥ N et tout 1 ≤ i ≤ n, ce qui montre que xki → ai dans R.
k
Réciproquement, supposons que pour tout 1 ≤ i ≤ n, on a x √i → ai . Alors pour tout ε > 0, il
k
existe un Ni ∈ N tel que pour tout k ≥ Ni , on a |x√i − ai | < ε/ n. Posons N = max(N1 , . . . , Nn )
de sorte que pour tout k ≥ N , on a |xki − ai | < ε/ n. En élevant cette inégalité au carré, puis en
sommant par rapport à i, on obtient que pour tout k ≥ N ,

n
!1/2
X
k
kx − ak = |xki 2
− ai | < ε,
i=1

ce qui montre bien que xk → a.

Tout comme dans R, l’inconvénient majeur est que pour savoir qu’une suite converge, il est
nécessaire de calculer et donc de connaı̂tre sa limite. Nous définissons maintenant un critère qui
s’avère extrêmement pratique car il nous permet de nous affranchir de la connaissance a priori de
la limite d’une suite pour savoir si celle-ci est convergente.

Définition 1.3.4. Une suite (xk )k∈N de Rn est dite de Cauchy si pour tout ε > 0, il existe un
N ∈ N tel que pour tout k, l ≥ N , on a kxk − xl k < ε.

Proposition 1.3.5. Une suite de Rn converge si et seulement si elle est de Cauchy. On dit alors
que Rn est complet.

Démonstration. Soit (xk )k∈N une suite de Rn telle que xk → a. Alors, pour tout ε > 0, il existe
un N ∈ N tel que pour tout k ≥ N , kxk − ak < ε/2. Si k et l ≥ N , d’après l’inégalité triangulaire,
on a
ε ε
kxk − xl k ≤ kxk − ak + ka − xl k < + = ε,
2 2
ce qui montre bien que (xk )k∈N est de Cauchy.
Réciproquement, supposons que (xk )k∈N est une suite de Cauchy dans Rn . Pour tout ε > 0, il
existe un N ∈ N tel que pour tout k, l ≥ N , on a kxk − xl k < ε. Comme |xki − xli | ≤ kxk − xl k
pour tout 1 ≤ i ≤ n, on en déduit que |xki − xli | < ε pour tout k, l ≥ N et tout 1 ≤ i ≤ n. Par
conséquent, la suite numérique (xki )k∈N est de Cauchy dans R qui est lui même un espace complet.
Pour tout 1 ≤ i ≤ n, il existe donc un ai ∈ R tel que xki → ai dans R, et la proposition 1.3.3
permet de conclure que xk → a = (a1 , . . . , an )T dans Rn .

1.4 Topologie
1.4.1 Ensembles ouverts, fermés
La notion de boules dans Rn remplace celle d’intervalles dans R.
1.4. TOPOLOGIE 9

Définition 1.4.1. Soient N une norme sur Rn , x ∈ R et r > 0. On définit la boule ouverte de
centre x et rayon r par
BN (x, r) = {y ∈ Rn : N (y − x) < r}
et la boule fermée de centre x et rayon r par

B N (x, r) = {y ∈ Rn : N (y − x) ≤ r}.

Dans le cas où N est la norme euclidienne, on notera simplement B(x, r) et B(x, r) les boules
ouvertes et fermées.
Définition 1.4.2. Un ensemble U ⊂ Rn est dit ouvert si pour tout x ∈ U , il existe un r > 0 tel
que B(x, r) ⊂ U . Par convention, l’ensemble vide ∅ est ouvert.
Définition 1.4.3. Un ensemble F ⊂ Rn est dit fermé si son complémentaire c F est ouvert.
Remarque 1.4.4. Evidemment, l’ensemble tout entier Rn est ouvert, ce qui montre que Rn et ∅
sont tout deux à la fois ouverts et fermés.
Proposition 1.4.5. 1. Toute union d’ouverts est ouverte ;
2. Toute intersection finie d’ouverts est ouverte ;
3. Toute intersection de fermés est fermée ;
4. Toute union finie de fermés est fermée.
S
Démonstration. Soit (Ui )i∈I une famille d’ensembles ouverts. Montrons que V := i∈I Ui est
ouvert. Pour ce faire, on considère un x ∈ V . Par définition de l’union, il existe un i0 ∈ I tel que
x ∈ Ui0 . L’ensemble Ui0 étant lui même ouvert, il existe un r > 0 tel que B(x, r) ⊂ Ui0 et comme
Ui0 ⊂ V , on en déduit que B(x, r) ⊂ V , ce qui montre bien que Tp V est ouvert.
Soient U1 , . . . , Up des ouverts de Rn montrons que W := i=1 Ui est ouvert. Soit x ∈ W , alors
par définition de l’intersection x ∈ Ui pour tout 1 ≤ i ≤ p. Les ensembles U1 , . . . , Up étant ouverts,
pour tout 1 ≤ i ≤ n, il existe un ri > 0 tel que B(x, ri ) ⊂ Ui . Notons r = min(r1 , . . . , rp ) de sorte
que r ≤ ri pour tout 1 ≤ i ≤ n et donc B(x, r) ⊂ B(x, ri ) pour tout 1 ≤ i ≤ n. Par conséquent,
B(x, r) ⊂ Ui pour tout 1 ≤ i ≤ n et donc B(x, r) ⊂ W ce qui montre que W est ouvert.
Pour les propriétés concernant les fermés, il suffit de remarquer que si (Fi )i∈I est une famille
d’ensembles fermés, alors !
\ [
c c
Fi = Fi
i∈I i∈I
T
qui est ouvert d’après 1., et donc i∈I Fi est fermé.
De même, si F1 , . . . , Fp sont des fermés de Rn , alors
p p
!
[ \
c c
Fi = Fi
i=1 i=1
Sp
qui est ouvert d’après 2., et donc i=1 Fi est fermé.
Définition 1.4.6. Soit E un sous-ensemble quelconque de Rn . On dit que x est un point intérieur
à E s’il existe un r > 0 tel que B(x, r) ⊂ E. L’ensemble des points intérieurs à E est noté E̊ et est
appelé intérieur de E.
Proposition 1.4.7. Soit E un sous-ensemble quelconque de Rn , alors E̊ ⊂ E. De plus
1. E̊ est le plus grand ouvert inclus dans E ;
10 CHAPITRE 1. NOTIONS DE TOPOLOGIE DANS RN

2. E est ouvert si et seulement si E = E̊.

Démonstration. Par définition, si x est un point intérieur à E, alors x ∈ E ce qui montre que
E̊ ⊂ E
Etape 1 : E̊ est un ouvert. Si x ∈ E̊, il existe un r > 0 tel que B(x, r) ⊂ E. Soient y ∈ B(x, r)
et z ∈ B(y, r − kx − yk). Alors par l’inégalité triangulaire, kz − xk ≤ kz − yk + ky − xk <
(r − kx − yk) + ky − xk = r, ce qui montre que B(y, r − kx − yk) ⊂ B(x, r) ⊂ E. Par conséquent,
y ∈ E̊ pour tout y ∈ B(x, r) et donc B(x, r) ⊂ E̊, ce qui montre E̊ est ouvert.
Etape 2 : E̊ est le plus grand ouvert inclus dans E. Soit U un ouvert contenu dans E. Si x ∈ U ,
il existe un r > 0 tel que B(x, r) ⊂ U ⊂ E ce qui montre que x est un point intérieur de E et que
U ⊂ E̊.
Etape 3 : E est ouvert si et seulement si E = E̊. On a déjà vu que E̊ ⊂ E, il s’agit alors de
montre l’inclusion opposée. Si x ∈ E et E est ouvert, alors il existe un r > 0 tel que B(x, r) ⊂ E
ce qui montre que x ∈ E̊ et donc E ⊂ E̊.

Définition 1.4.8. Soit E un sous-ensemble quelconque de Rn . On dit que x est un point adhérent
à E s’il existe une suite (xk )k∈N d’éléments de E telle que xk → x. L’ensemble des points adhérents
de E est noté E et est appelé adhérence ou fermeture de E.

Proposition 1.4.9. Soit E un sous-ensemble quelconque de Rn , alors E ⊂ E. De plus


1. E est le plus petit fermé contenant E ;
2. E est fermé si et seulement si E = E.

Démonstration. Si x ∈ E, on prend la suite stationnaire xk = x pour tout k ∈ N qui converge


évidemment vers x, ce qui montre que x ∈ E et donc que E ⊂ E.
Etape 1 : On montre que x ∈ E ⇐⇒ B(x, r) ∩ E 6= ∅ pour tout r > 0.
=⇒ : Si x ∈ E, il existe une suite (xk )k∈N dans E telle que xk → x. Donc pour tout r > 0, il
existe un N ∈ N tel que pour tout k ∈ N, on a kxk − xk < r, autrement dit xk ∈ B(x, r). Ceci
montre que B(x, r) ∩ E 6= ∅ pour tout r > 0 puisque xk ∈ B(x, r) ∩ E dès que k ≥ N .
⇐= : Choisissons r = 1/k pour k ∈ N∗ . Comme B(x, 1/k) ∩ E 6= ∅ pour tout k ≥ 1, il existe un
x ∈ B(x, 1/k) ∩ E. Par conséquent, la suite (xk )k∈N est dans E et satisfait kxk − xk < 1/k → 0,
k

d’où x ∈ E.
T
Etape 2 : E est le plus petit fermé contenant E. Notons Ẽ := {F fermé, F ⊃ E}, alors Ẽ est
fermé car c’est une intersection de fermés et E ⊂ Ẽ.
c
Ẽ ⊂ c E : Si x 6∈ Ẽ, comme c Ẽ est ouvert, il existe un r > 0 tel que B(x, r) ⊂ c Ẽ ⊂ c E et donc
B(x, r) ∩ E = ∅. Ceci montre par l’étape 1 que x 6∈ E.
c
E ⊂ c Ẽ : Si x 6∈ E, d’après l’étape 1, on a B(x, r) ∩ E = ∅ pour un certain r > 0. Alors
E ⊂ c B(x, r) et c B(x, r) est fermée, d’où Ẽ ⊂ c B(x, r) ce qui montre que x 6∈ Ẽ.
On en déduit que E = Ẽ et donc, si F est un fermé contenant E, on a E ⊂ F .
Etape 3 : E est fermé si et seulement si E = E. On a déjà vu que E ⊂ E. Si E est fermé,
d’après l’étape 2, on a E ⊂ E.

La proposition 1.4.9 permet de caractériser séquentiellement le fait qu’un ensemble soit fermé.

Proposition 1.4.10. Un ensemble F de Rn est fermé si et seulement si pour toute suite (xk )k∈N
dans F telle que xk → x, alors x ∈ F .
1.4. TOPOLOGIE 11

Démonstration. ⇐= : Il s’agit de montrer que F est fermé, autrement dit que F = F . On a toujours
l’inclusion F ⊂ F , montrons l’inclusion opposée. Soit x ∈ F , alors il existe une suite (xk )k∈N de F
telle que xk → x. Par hypothèse, on a donc que x ∈ F soit F ⊂ F .
=⇒ : Supposons F fermé de sorte que son complémentaire U := c F est ouvert. Considérons
une suite (xk )k∈N de F telle que xk → x. Si x ∈ U , celui-ci étant ouvert, il existe un r > 0 tel
que B(x, r) ⊂ U . Par définition de la limite, il existe un N ∈ N tel que pour tout k ≥ N , on a
kxk −xk < r, soit xk ∈ B(x, r) ⊂ U , ce qui est absurde puisque xk ∈ F . Par conséquent, x ∈ F .

Définition 1.4.11. Soit E un sous-ensemble quelconque de Rn . On définit la frontière de E par

∂E := E \ E̊.

1.4.2 Ensembles compacts


Définition 1.4.12. Un sous-ensemble K de Rn est compact si toute suite d’éléments de K admet
une sous-suite convergente dans K.

Théorème 1.4.13. Un ensemble K dans Rn est compact si et seulement s’il est à la fois fermé
et borné, i.e., s’il existe un R > 0 tel que K ⊂ B(0, R).

Démonstration. =⇒ : Supposons que K est compact. Montrons d’abord que K est fermé. Soit
(xk )k∈N une suite d’éléments de K telle que xk → x. De (xk )k∈N on peut extraire une sous-suite
qui converge dans K. Par unicité de la limite, on en déduit que la limite de la sous-suite ne peut
être que x ce qui implique que x ∈ K et donc que K est fermé en vertu de la proposition 1.4.10.
Montrons à présent que K est borné. Supposons par l’absurde que tel n’est pas le cas. Alors
pour tout k ∈ N, il existerait un xk ∈ K tel que kxk k ≥ k. Or la suite (xk )k∈N ainsi construite
ne peut admettre de sous-suite convergente ce qui est impossible. Par conséquent K est borné.
Finalement on en déduit que K est compact en tant qu’ensemble fermé et borné.
⇐= : Supposons K fermé et borné. Soit (xk )k∈N une suite d’éléments de K. L’ensemble K étant
par définition borné, il existe un R > 0 tel que K ⊂ B(0, R) et donc kxk k ≤ R. En particulier,
comme |xki | ≤ kxk k pour tout 1 ≤ i ≤ n, on en déduit que |xki | ≤ R et les suites numériques
(xki )k∈N sont bornées dans R. Par conséquent elles admettent chacune une sous-suite convergente.
Plus précisément :
– pour i = 1, il existe une extraction ϕ1 : N → N strictement croissante et a1 ∈ R tels que
ϕ (k)
x1 1 → a1 ;
ϕ (k)
– pour i = 2, la suite (x2 1 )k∈N étant bornée dans R, il existe une extraction ϕ2 : N → N
ϕ ◦ϕ (k)
strictement croissante et a2 ∈ R tels que x2 2 1 → a2 ;
– ···
– On suppose qu’il existe des extractions ϕ1 , . . . , ϕn−1 : N → N strictement croissantes et des
ϕ ◦···◦ϕ1 (k)
réels a1 , . . . , an−1 ∈ R tels que pour tout 1 ≤ i ≤ n − 1 on a xi i → ai . La suite
ϕn−1 ◦···◦ϕ1 (k)
(xn )k∈N étant bornée dans R, il existe une extraction ϕn : N → N strictement
ϕ ◦ϕ ◦···◦ϕ1 (k)
croissante et an ∈ R tels que xn n n−1 → an .
Posons ϕ := ϕn ◦· · ·◦ϕ1 : N → N qui est strictement croissante. De plus, pour tout 1 ≤ i ≤ n, la suite
ϕ(k) ϕ ◦···◦ϕ1 (k)
(xi )k ∈N est une sous-suite de (xi i )k∈N . Comme cette dernière converge vers ai dans R,
ϕ(k)
on en déduit que xi → ai dans R, et d’après la proposition 1.3.3, xϕ(k) → a = (a1 , . . . , an )T
dans Rn . Enfin comme K est fermé, la proposition 1.4.10 assure que a ∈ K.

AVERTISSEMENT : La caractérisation des ensembles compacts établie dans le théorème 1.4.13


reste vraie dans un espace vectoriel de dimension finie mais est fausse en dimension infinie.
12 CHAPITRE 1. NOTIONS DE TOPOLOGIE DANS RN

1.4.3 Ensembles connexes et convexes


Définition 1.4.14. Un sous-ensemble E de Rn est dit convexe si pour tout x et y ∈ E, le segment

[x, y] := {ty + (1 − t)x, t ∈ [0, 1]} ⊂ E.

Définition 1.4.15. Un sous-ensemble E de Rn est dit connexe s’il n’existe aucune paire d’ouverts
non vides (U1 , U2 ) tels que

E ⊂ U1 ∪ U2 , (E ∩ U1 ) ∩ (E ∩ U2 ) = ∅.

Autrement dit, un ensemble est connexe si on ne peut pas le séparer en deux parties disjointes
en l’intersectant avec deux ouverts disjoints.
Remarque 1.4.16. En dimension n = 1, les notions de convexité et connexité coı̈ncident.

Dans le cas d’un ensemble lui-même ouvert, cela se traduit par la propriété plus intuitive suivante.
Théorème 1.4.17. Un ensemble ouvert U de Rn est connexe si et seulement si, pour tout x et
y ∈ U , il existe une ligne brisée contenue dans U qui les relie, i.e., il existe un nombre fini de points
x1 , . . . , xp ∈ U tels que x = x1 , y = xp et les segments [xi , xi+1 ] ⊂ U pour tout 1 ≤ i ≤ p − 1.
Démonstration. =⇒ : On suppose que U 6= ∅. Soit donc x0 ∈ U et V l’ensemble des points de U
que l’on peut joindre à x0 par une ligne brisée dans U .
– V est ouvert : Soit a ∈ V , alors il existe une ligne brisée L ⊂ U qui relie x0 et a ∈ U . L’ensemble
U étant ouvert, il existe un r > 0 tel que B(a, r) ⊂ U . Donc pour tout x ∈ B(a, r), le segment
[a, x] ⊂ B(a, r) ⊂ U et donc L0 = L ∪ [a, x] ⊂ U est une ligne brisée joignant x0 et x. Ceci
montre que x ∈ V , soit B(a, r) ⊂ V , et donc V est ouvert.
– V est fermé dans U : Soit b ∈ V ∩ U , alors il existe un r > 0 tel que B(b, r) ⊂ U car U est
ouvert et il existe un a ∈ V tel que ka − bk < r car b est adhérent à V . Soit L ⊂ U une ligne
brisée joignant x0 et a, alors L0 = L ∪ [a, b] est une ligne brisée dans U joignant x0 et b, ce
qui montre que b ∈ V et donc V = V ∩ U . La proposition 1.4.9 montre alors que V est fermé.
On écrit alors que U = (U \ V ) ∪ V où V et U \ V = U \ V sont ouverts et disjoints. Comme U est
connexe, alors soit V = ∅ soit U \ V = ∅. Comme x0 ∈ V , on en déduit que V 6= ∅, et donc que
V = U . Enfin, si x et y ∈ U , il existe une ligne brisée Lx ⊂ U joignant x0 et x, et une ligne brisée
Ly ⊂ U joignant x0 et y. Finalement L := Lx ∪ Ly est une ligne brisée dans U qui relie x et y.
⇐= : Soit U un ouvert de Rn , supposons que U n’est pas connexe. Alors il existe deux ouverts
non vides disjoints U0 et U1 tels que U = U0 ∪ U1 . Soient x0 ∈ U0 , x1 ∈ U1 et γ : [0, 1] → U une
fonction continue désignant la paramétrisation d’une ligne brisée telle que γ(0) = x0 et γ(1) = x1 .
Par continuité de γ, on a que γ −1 (U0 ) et γ −1 (U1 ) sont deux ouverts (voir la proposition 2.1.8 du
chapitre 2) non vides disjoints de [0, 1] et [0, 1] = γ −1 (U0 ) ∪ γ −1 (U1 ) ce qui implique que [0, 1] n’est
pas connexe.
Remarque 1.4.18. – En vertu du théorème 1.4.17, on en déduit que tout ensemble ouvert
convexe est nécessairement connexe.
– En dimension n = 1, les ensembles convexes et connexes coı̈ncident et ce sont précisément les
intervalles. En effet, si E ⊂ R est connexe, et x, y ∈ E (avec par exemple x < y), alors tout
a ∈ [x, y] appartient à E. Sinon, il existerait un a ∈ [x, y] tel que a 6∈ E et on pourrait écrire
que E ⊂] − ∞, a[ ∪]a, +∞[, où les ensembles E∩] − ∞, a[ et E∩]a, +∞[ sont disjoints ce qui
contredirait la connexité de E. Par conséquent, E est un intervalle et il est donc convexe.
Chapitre 2

Fonctions continues

2.1 Définitions, propriétés fondamentales


On s’intéresse à des fonctions de n ≥ 2 variables à valeurs réelles (R) ou vectorielles (Rm ,
m ≥ 2) :
f : Rn −→ Rm
x = (x1 , . . . , xn )T 7−→ (f1 (x), . . . , fm (x)).
Quand m ≥ 2 on parle aussi de champ de vecteurs. Quand n = 2 (resp. 3), on notera souvent
f (x, y) (resp. f (x, y, z)) au lieu de f (x1 , x2 ) (resp. f (x1 , x2 , x3 )).
Une fonction f n’est pas forcément définie sur tout Rn .
Définition 2.1.1. On appelle ensemble de définition d’une fonction f : Rn → Rm l’ensemble

Df := {x ∈ Rn : f (x) existe}.

Exemple 2.1.2. La fonction f : R2 → R définie par f (x, y) =√ln(3 − x2 − y 2 ) est bien définie
√ si
et seulement si 3 − x2 − y 2 > 0, autrement dit si (x, y) ∈ B(0, 3). Dans ce cas, Df = B(0, 3).
Définition 2.1.3. Une fonction f : Rn → Rm admet une limite ` ∈ Rm en a ∈ Rn si pour tout
ε > 0, il existe un δ > 0 tel que pour tout x ∈ Rn ,

kx − ak < δ =⇒ kf (x) − `k < ε.

On note alors
` = lim f (x).
x→a

Définition 2.1.4. Une fonction f : Rn → Rm est continue en a ∈ Df si

lim f (x) = f (a),


x→a

autrement dit, pour tout ε > 0, il existe un δ > 0 tel que pour tout x ∈ Rn ,

kx − ak < δ =⇒ kf (x) − f (a)k < ε. (2.1.1)

Une fonction f : Rn → Rm est continue sur un ensemble E ⊂ Rn si elle est continue en tout
point de E. L’ensemble des fonctions continues de E dans Rm sera noté C(E; Rm ) ou C 0 (E; Rm ).
Si m = 1, on notera simplement C(E) ou C 0 (E).

13
14 CHAPITRE 2. FONCTIONS CONTINUES

AVERTISSEMENT : Dans la formule (2.1.1), la norme kx − ak désigne la norme sur Rn puisque


x − a est un élément de Rn . En revanche la norme kf (x) − f (a)k désigne la norme sur Rm étant
donné que f (x) − f (a) ∈ Rm .

Remarque 2.1.5. Compte tenu de l’équivalence des normes sur Rn , on peut remplacer la norme
euclidienne k · k par n’importe quelle autre norme.

Donnons à présent deux caractérisations de la continuité, l’une séquentielle (i.e. à l’aide des
suites) et l’autre topologique (i.e. en terme d’ouverts et de fermés).

Proposition 2.1.6. Soient f : Rn → Rm et a ∈ Df . Alors les propriétés suivantes sont équivalentes :


i) f et continue en a ;
ii) Pour toute suite (xk )k∈N de Rn telle que xk → a dans Rn , alors f (xk ) → f (a) dans Rm .

Démonstration. i) ⇒ ii) : Soient ε et δ comme dans la définition de la continuité en a et (xk )k∈N


une suite de Rn telle que xk → a. Alors, par définition de la limite d’une suite, il existe un N ∈ N
tel que pour tout k ≥ N , kxk − ak < δ, puis par définition de la continuité, kf (xk ) − f (a)k < ε.
Ceci montre bien que f (xk ) → f (a) dans Rm .
ii) ⇒ i) : Supposons que f n’est pas continue en a. Il existe alors un ε0 > 0 tel que pour tout
δ > 0, on peut trouver un xδ ∈ Rn ayant les propriétés kxδ − ak < δ et kf (xδ ) − f (a)k ≥ ε0 .
En prenant δ = 1/k, avec k ∈ N∗ , on obtient une suite (xk )k∈N telle que kxk − ak < 1/k et
kf (xk ) − f (a)k ≥ ε0 pour tout k ∈ N∗ . Par conséquent xk → a dans Rn mais f (xk ) 6→ f (a) dans
Rm .

Cette caractérisation séquentielle de la continuité est particulièrement utile en pratique pour


montrer la continuité d’une fonction en un point.
La caractérisation topologique, qui fait l’objet du résultat suivant, nécessite de définir la notion
d’image réciproque d’un ensemble par une fonction.

Définition 2.1.7. Soit f : Rn → Rm et E ⊂ Rm . On appelle image réciproque de E par f le


sous-ensemble de Rn défini par

f −1 (E) := {x ∈ Rn : f (x) ∈ E}.

Proposition 2.1.8. Soit f : Rn → Rm . Alors les propriétés suivantes sont équivalentes :


i) f et continue sur Rn ;
ii) Pour tout ouvert U ⊂ Rm , f −1 (U ) est ouvert dans Rn ;
iii) Pour tout fermé F ⊂ Rm , f −1 (F ) est fermé dans Rn .

Démonstration. i) ⇒ ii) : Supposons f continue sur Rn et soit U un ouvert de Rm . Si f −1 (U ) = ∅


c’est un ouvert de Rn et il n’y a rien à montrer. Si en revanche f −1 (U ) 6= ∅, il existe un a ∈ f −1 (U ),
i.e., f (a) ∈ U . L’ensemble U étant ouvert dans Rm , il existe un ε > 0 tel que B(f (a), ε) ⊂ U . Soit
δ > 0 en correspondance avec cet ε donné par la définition de la continuité de f en a. Alors pour
tout x ∈ Rn avec kx − ak < δ, on a que kf (x) − f (a)k < ε, ce qui montre que pour tout x ∈ B(a, δ),
f (x) ∈ B(f (a), ε), i.e., x ∈ f −1 (B(f (a), ε)). Par conséquent, B(a, δ) ⊂ f −1 (B(f (a), ε)) ⊂ f −1 (U )
et donc f −1 (U ) est ouvert dans Rn .
ii) ⇒ i) : Pour tout ε > 0 et pour tout a ∈ Rn , l’ensemble B(f (a), ε) est ouvert dans Rm . Par
conséquent f −1 (B(f (a), ε)) est ouvert dans Rn et a ∈ f −1 (B(f (a), ε)) puisque f (a) ∈ B(f (a), ε).
Il existe donc un δ > 0 tel que B(a, δ) ⊂ f −1 (B(f (a), ε)), autrement dit, pour tout x ∈ Rn avec
kx − ak < δ, on a x ∈ f −1 (B(f (a), ε)) soit f (x) ∈ B(f (a), ε) ou encore kf (x) − f (a)k < ε, ce qui
établit la continuité de f en a.
2.2. EXEMPLES IMPORTANTS 15

ii) ⇒ iii) : Soit F un fermé de Rm , alors U := c F est ouvert dans Rm et f −1 (U ) est ouvert dans
R . Donc f −1 (F ) = f −1 (c U ) = c f −1 (U ) est un fermé.
n

iii) ⇒ ii) : Idem.


Cette caractérisation topologique de la continuité est fort utile en pratique pour montrer qu’un
ensemble est ouvert ou fermé. Il suffit de montrer que c’est l’image réciproque d’un ouvert ou d’un
fermé par une fonction continue.
Exemple 2.1.9. Soit U := {(x, y) ∈ R2 : x2 − y 2 > 0}. La fonction f : (x, y) 7→ x2 − y 2 est
continue sur Rn et U = f −1 (]0, +∞[) avec ]0, +∞[ ouvert dans R. On en déduit que U est ouvert
dans R2 .
Propriétés 2.1.10. i) Toute combinaison linéaire de fonctions continues est continue. Autre-
ment dit, C(E; Rm ) est un espace vectoriel pour tout sous-ensemble E de Rn ;
ii) Si m = 1, le produit de deux fonctions continues est continu. Autrement dit C(E) est une
algèbre pour tout sous-ensemble E de Rn ;
iii) Si f : Rn → Rm est continue en a ∈ Rn , et g : Rm → Rp est continue en f (a), alors
g ◦ f : Rn → Rp est continue en a ;
Démonstration. Nous allons utiliser la caractérisation séquentielle de la continuité établie dans la
proposition 2.1.6.
i) Soient f et g : Rn → Rm continues en a ∈ Rn et λ, µ ∈ R. Si (xk )k∈N est une suite de Rn telle
que xk → a dans Rn , alors f (xk ) → f (a) et g(xk ) → g(a) dans Rm et donc λf (xk ) + µg(xk ) →
λf (a) + µg(a) dans Rm ce qui montre que λf + µg est continue en a.
ii) Si f et g : Rn → R sont continues en a ∈ Rn et (xk )k∈N est une suite de Rn telle que xk → a
dans Rn , alors f (xk ) → f (a) et g(xk ) → g(a) dans R et donc f (xk )g(xk ) → f (a)g(a) dans R ce
qui montre que f g est continue en a.
iii) Si (xk )k∈N est une suite de Rn telle que xk → a dans Rn , par continuité de f en a, on a que
f (xk ) → f (a) dans Rm , puis par continuité de g en f (a), il vient g(f (xk )) → g(f (a)) dans Rp , ce
qui montre que g ◦ f est continue en a.
Remarque 2.1.11. Si f : Rn → R est continue en a ∈ Df et f (a) 6= 0, alors la fonction 1/f est
bien définie et continue en a.
2 2 2
Exemple 2.1.12. √ On a déjà vu que la fonction f : R → R, (x, y) 7→ ln(3 − x − y ) est bien
définie sur B(0, 3). Elle y est également continue comme composée de fonctions continues.

2.2 Exemples importants


2.2.1 Fonctions Lipschitziennes
Définition 2.2.1. Une fonction f : Rn → Rm est dite Lipschitzienne s’il existe une constante
L > 0 telle que
kf (x) − f (y)k ≤ Lkx − yk, pour tout x, y ∈ Rn . (2.2.1)
Si L < 1, on dit que f est contractante.
Si L est la plus petite constante vérifiant (2.2.1), on dit que f est L-Lipschitzienne et L est
appelée la constante de Lipschitz). On constate que toute fonction L-Lipschitzienne est continue.
En effet, si ε > 0, on pose δ = ε/L de sorte que si x et y ∈ Rn et kx−yk < δ, alors kf (x)−f (y)k < ε.
Ceci montre de plus que f est uniformément continue (voir la définition 2.3.1 plus loin).
Un exemple typique est la fonction norme qui définit une fonction 1-Lipschitzienne. En effet,
pour tout x et y ∈ Rn , l’inégalité triangulaire assure que kxk = kx − y + yk ≤ kx − yk + kyk ce
16 CHAPITRE 2. FONCTIONS CONTINUES

qui montre que kxk − kyk ≤ kx − yk. De même en échangeant les rôles de x et y, on obtient que
kyk − kxk ≤ kx − yk ce qui établit

|kxk − kyk| ≤ kx − yk.

Le résultat suivant d’existence et d’unicité d’un point fixe a des applications importantes en ana-
lyse. C’est dessus qu’est basée la démonstration du théorème d’inversion locale et du théorème de
Cauchy-Lipschitz qui assure l’existence et l’unicité d’une solution à certaines équations différentielles.
Théorème 2.2.2 (Picard). Soit F ⊂ Rn un ensemble fermé et f : F → F une fonction contrac-
tante. Alors f admet un unique point fixe, i.e., il existe un unique x ∈ F tel que f (x) = x.
Démonstration. Existence : Soit x0 ∈ F , on définit par récurrence la suite (xk )k∈N par xk+1 =
f (xk ) pour tout k ∈ N. Par construction, pour tout k ∈ N, on a que xk ∈ F et

kxk+1 − xk k = kf (xk ) − f (xk−1 )k ≤ Lkxk − xk−1 k ≤ Lk kx1 − x0 k.

Ainsi, pour tout l ≥ k, l’inégalité triangulaire montre que


l−1 l−1
X X Lk − Ll
kxl − xk k ≤ kxi+1 − xi k ≤ kx1 − x0 k Li = kx1 − x0 k .
1−L
i=k i=k

Comme L < 1, on en déduit que Lk → 0 quand k → +∞, et donc il existe un N ∈ N tel que pour
tout l ≥ k ≥ N , on a kxl − xk k < ε. Ceci montre que la suite (xk )k∈N est de Cauchy dans Rn
et donc, par la proposition 1.3.5, qu’elle converge vers un x. Comme F est fermé, la proposition
1.4.10 assure que x ∈ F . Enfin, par passage à la limite dans la relation de récurrence xk+1 = f (xk ),
on en déduit par continuité de f que x = f (x), ce qui montre que x est un point fixe de f
Unicité : Soient x et y ∈ F deux points fixes de f , alors f (x) = x et f (y) = y, d’où

kx − yk = kf (x) − f (y)k ≤ Lkx − yk,

ce qui montre que x = y puisque L < 1.

2.2.2 Applications linéaires


Définition 2.2.3. On note L (Rn , Rm ) l’ensemble des applications linéaires de Rn dans Rm , i.e.,
l’ensemble des fonctions f : Rn → Rm telles que f (λx + µy) = λf (x) + µf (y) pour tout x, y ∈ Rn
et λ, µ ∈ R.
Si {e1 , . . . , en } désigne la base canonique de Rn , i.e., eij = δij pour tout 1 ≤ i, j ≤ n, alors
n
X n
X
x= xi ei =⇒ f (x) = xi f (ei ),
i=1 i=1

et d’après les inégalités triangulaire et de Cauchy-Schwarz, on a que


n n
!1/2
X X
i i 2
kf (x)k ≤ |xi |kf (e )k ≤ kxk kf (e )k = M kxk,
i=1 i=1

Pn 1/2
où l’on a posé M := i=1 kf (ei )k2 . En appliquant cette formule à x − y, on obtient

kf (x) − f (y)k = kf (x − y)k ≤ M kx − yk,


2.2. EXEMPLES IMPORTANTS 17

et donc f est Lipschitzienne donc continue. On note, pour tout f ∈ L (Rn , Rm ),

kf (x)k
|||f ||| := sup ,
x6=0 kxk

et on peut montrer qu’il s’agit de la plus petite constante C > 0 telle que kf (x)k ≤ Ckxk pour
tout x ∈ Rn . Autrement dit, d’après la linéarité de f , |||f ||| n’est autre que la constante de Lipschitz
de f .

2.2.3 Polynômes
Définition 2.2.4. Un polynôme est une fonction p : Rn → R de la forme
X
p(x) = ak xk11 · · · xknn , pour tout x ∈ Rn ,
k∈Nn ,
k1 +···+kn ≤m

où les ak ∈ R. On note deg(p) = m le degré du polynôme p.


Un polynôme est continu sur Rn comme produit et combinaison linéaire de fonctions continues.
Exemple 2.2.5. En dimension n = 2, un polynôme de degré 2 s’écrit sous la forme

p(x, y) = a0 + a1 x + a2 y + a3 x2 + a4 xy + a5 y 2 , pour tout (x, y) ∈ R2 ,

où a0 , . . . , a5 ∈ R.

2.2.4 Applications partielles


Une façon naturelle d’étudier une fonction f : Rn → Rm consiste à fixer n − 1 variables et
à étudier ensuite la fonction par rapport à l’unique variable restante. Ainsi, on définit la i-ème
application partielle au point a par

fi,a (t) = f (a1 , . . . , ai−1 , ai + t, ai+1 , . . . , an ) = f (a + tei ), pour tout t ∈ R.

Proposition 2.2.6. Si f : Rn → Rm est continue sur Rn , alors l’application partielle fi,a est
continue sur R.
Démonstration. Soient a ∈ R et t ∈ R. Si tk → t, alors le vecteur a+tk ei → a+tei quand k → +∞,
et donc, par continuité de f ,

fi,a (tk ) = f (a1 , . . . , ai−1 , ai + tk , ai+1 , . . . , an ) → f (a1 , . . . , ai−1 , ai + t, ai+1 , . . . , an ) = fi,a (t),

ce qui montre que fi,a est continue en t.


En général, la réciproque est fausse comme le montre l’exemple suivant :
Exemple 2.2.7. Soit f : R2 → R, définie par

 xy

si (x, y) 6= (0, 0),
f (x, y) := x2 + y 2
0 si (x, y) = (0, 0).

Si y = 0, l’application x 7→ f (x, 0) = 0 est constante donc continue sur R. Si y 6= 0, comme dans


ce cas x2 + y 2 > 0, on en déduit que x 7→ f (x, y) est également continue sur R. Comme x et y
18 CHAPITRE 2. FONCTIONS CONTINUES

jouent des rôles symétriques, on en déduit que y 7→ f (x, y) est continue sur R pour tout x ∈ R. En
revanche, nous allons montrer que f n’est pas continue (0, 0). En effet, pour tout x 6= 0,

x2 1
f (x, x) = =
2x2 2
et donc
1
lim f (x, x) = 6= 0 = f (0, 0),
x→0 2
ce qui montre que f n’est pas continue en (0, 0).

2.3 Continuité et compacité


Définition 2.3.1. Une fonction f : Rn → Rm est dite uniformément continue sur un sous-ensemble
E de Rn si, pour tout ε > 0, il existe un δ > 0 tel que pour tout x, y ∈ E,

kx − yk < δ =⇒ kf (x) − f (y)k < ε.

La différence entre continuité et uniforme continuité est subtile et réside dans l’ordre des quan-
tificateurs. Dans la définition de la continuité en un point a, le δ dépend à la fois de a et de ε. En
revanche, dans la définition de l’uniforme continuité, le δ est indépendant du point ; il ne dépend
que de ε.

Théorème 2.3.2 (Heine). Soit f : Rn → Rm une fonction continue sur un compact K de Rn .


Alors f est uniformément continue sur K.

Démonstration. On raisonne par l’absurde. Supposons que f n’est pas uniformément continue sur
K. Alors il existe un ε0 > 0 tel que pour tout δ > 0, on peut trouver xδ et y δ ∈ K avec les propriétés
kxδ − y δ k < δ et kf (xδ ) − f (y δ )k ≥ ε0 . En choisissant δ = 1/k, avec k ∈ N∗ , on obtient alors deux
suites (xk )k∈N et (y k )k∈N dans K telles que kxk − y k k < 1/k et kf (xk ) − f (y k )k ≥ ε0 . L’ensemble
K étant compact, le théorème de Bolzano-Weierstrass assure que (xk )k∈N et (y k )k∈N admettent
des sous-suites convergentes. Plus précisément, il existe une extraction ϕ1 : N → N strictement
croissante et x ∈ K tels que xϕ1 (k) → x dans K. Ensuite (y ϕ1 (k) )k∈N étant dans K, il existe une
nouvelle extraction ϕ2 : N → N strictement croissante et y ∈ K tels que y ϕ2 ◦ϕ1 (k) → y dans K. On
définit alors ϕ := ϕ2 ◦ ϕ1 : N → N qui est strictement croissante. Alors y ϕ(k) → y dans K et comme
(xϕ(k) )k∈N est une sous-suite de (xϕ1 (k) )k∈N , on en déduit que xϕ(k) → x dans K. Comme f est
continue, on en déduit que f (xϕ(k) ) − f (y ϕ(k) ) → f (x) − f (y) et donc que kf (x) − f (y)k ≥ ε0 > 0.
Par ailleurs, comme kxϕ(k) − y ϕ(k) k ≤ 1/ϕ(k) → 0, on en déduit que kx − yk = 0, soit x = y et
donc f (x) = f (y) ce qui est impossible.

Les résultats qui suivent représentent une première incursion vers la recherche d’extrema d’une
fonction à valeurs réelles. Nous avons besoin, tout d’abord d’introduire un peu de vocabulaire.
Soient f : Rn → R et E un sous-ensemble de Rn . On dit que f est minorée sur E s’il existe un
réel m ∈ R tel que f (x) ≥ m pour tout x ∈ E. Le plus grand des minorants de f , appelé borne
inférieure ou infimum, est noté
α := inf f (x).
x∈E

Il est caractérisé par les deux propriétés suivantes :


– pour tout y ∈ E, f (y) ≥ α ;
– il existe une suite (xk )k∈N de E telle que f (xk ) → α.
2.3. CONTINUITÉ ET COMPACITÉ 19

Si l’infimum est atteint, i.e., s’il existe un a ∈ E tel que f (a) = α, alors on dit que f admet un
minimum sur E en a et on note
α = f (a) = min f (x).
x∈E

De façon similaire, on dit que f est majorée sur E s’il existe un réel M ∈ R tel que f (x) ≤ M pour
tout x ∈ E. Le plus petit des majorants de f , appelé borne supérieure ou supremum, est noté

β := sup f (x).
x∈E

Il est caractérisé par les deux propriétés suivantes :


– pour tout y ∈ E, f (y) ≤ β ;
– il existe une suite (xk )k∈N de E telle que f (xk ) → β.
Si le supremum est atteint, i.e., s’il existe un b ∈ E tel que f (b) = β, alors on dit que f admet un
maximum sur E en b et on note
β = f (b) = max f (x).
x∈E

Théorème 2.3.3. Soit f : R → R une fonction continue sur un compact K de Rn . Alors f


n

admet un maximum et un minimum sur K. Autrement dit, il existe un a ∈ K et un b ∈ K tels que

f (a) = min f (x), f (b) = max f (x).


x∈K x∈K

Démonstration. Nous montrons ici seulement l’existence du minimum. Des arguments similaires
permettent de traiter le cas du maximum. Par définition de la borne inférieure, il existe une
suite (xk )k∈N de K telle que f (xk ) → inf x∈K f (x). Comme K est compact, d’après le théorème
de Bolzano-Weierstrass, on peut extraire de (xk )k∈N une sous-suite convergente : il existe une
extraction ϕ : N → N strictement croissante et a ∈ K tels que xϕ(k) → a dans K. Comme f est
continue, on a que f (xϕ(k) ) → f (a), et par unicité de la limite, on a nécessairement que

f (a) = inf f (x).


x∈K

Ceci montre que l’infimum de f sur K est atteint, et donc que f admet un minimum sur K en
a.
Pour finir ce chapitre, nous présentons à présent une démonstration du théorème 1.2.5 sur
l’équivalence des normes dans Rn .
Démonstration du théorème 1.2.5. Soit N une norme sur Rn . Nous allons montrer qu’elle est
équivalente à la norme euclidienne k · k.
Etape 1 : Montrons que l’application N : (Rn , k · k) → (Rn , N ) est Lipschitzienne. En effet,
pour tout x et y ∈ Rn , d’après l’inégalité triangulaire et l’homogénéité de N et l’inégalité de
Cauchy-Schwarz, on a
n
! n n
X X X
i
N (x − y) = N (xi − yi )e ≤ N ((xi − yi )ei ) = |xi − yi |N (ei ) ≤ M kx − yk,
i=1 i=1 i=1

i 2 1/2
Pn 
où l’on a noté M := i=1 N (e ) . Une nouvelle application de l’inégalité triangulaire montre
que |N (x) − N (y)| ≤ N (x − y), et donc

|N (x) − N (y)| ≤ M kx − yk, pour tout x, y ∈ Rn .

Etape 2 : Montrons que l’ensemble S := {x ∈ Rn : kxk = 1} est compact. Tout d’abord, comme
S ⊂ B(0, 2), on en déduit que S est borné. Ensuite, on introduit la fonction f : Rn → R définie par
20 CHAPITRE 2. FONCTIONS CONTINUES

f (x) = kxk pour tout x ∈ Rn qui est une fonction continue. Comme S = f −1 ({1}) et {1} est un
ensemble fermé dans R, la proposition 2.1.8 montre que S est fermé et donc finalement compact.
Etape 3 : Comme N est continue sur Rn , elle l’est en particulier sur le compact S. Le théorème
2.3.3 montre alors l’existence d’un minimum a ∈ S et d’un maximum b ∈ S tels que

kak = kbk = 1, N (a) ≤ N (x) ≤ N (b), pour tout x ∈ S.

Notons m = N (a) et M = N (b). Comme kak = 1, on en déduit que a 6= 0 (car sinon kak = 0) et
donc N (a) > 0 (car sinon a = 0). Par conséquent, m > 0, M > 0 et pour tout y ∈ Rn (y 6= 0), on
a y/kyk ∈ S, ce qui implique  
y
m≤N ≤ M.
kyk
Par la propriété d’homogénéité de la norme N , on en déduit que

mkyk ≤ N (y) ≤ M kyk, pour tout y 6= 0. (2.3.1)

Cette inégalité reste bien évidemment vraie si y = 0, ce qui montre que les normes k · k et N sont
équivalentes.
Enfin si N1 et N2 sont deux normes quelconques sur Rn , en combinant les inégalités (2.3.1)
appliquées à N1 et N2 , on en déduit que N1 et N2 sont effectivement équivalentes.
Chapitre 3

Différentiabilité et dérivées
partielles

3.1 Définitions
Toujours dans l’esprit d’étudier les variations d’une fonction f : Rn → R en fixant n − 1
variables et en étudiant les applications partielles, nous introduisons la notion de dérivée partielle.
Dans la suite de ce chapitre, on notera {e1 , . . . , en } la base canonique de Rn et {η 1 , . . . , η m } la
base canonique de Rm .
Définition 3.1.1. Soit U un ouvert de Rn et f : U → R. On dit que f admet une dérivée
partielle en a ∈ U par rapport à sa i-ème variable si la i-ème application partielle fi,a est dérivable
en t = 0. On note alors
∂f 0 f (a1 , . . . , ai−1 , ai + h, ai+1 , . . . , an ) − f (a) f (a + hei ) − f (a)
(a) := fi,a (0) = lim = lim .
∂xi h→0 h h→0 h
∂f
Le calcul de ∂xi (a) consiste donc à ne dériver l’expression de f que par rapport à la variable xi .

Exemple 3.1.2. Si f : R3 → R est définie par f (x, y, z) = −2x cos y, on a que


∂f ∂f ∂f
(x, y, z) = −2 cos y, (x, y, z) = 2x sin y, (x, y, z) = 0.
∂x ∂y ∂z
Le calcul de la i-ème dérivée partielle consiste à regarder les variations de la fonction f suivant la
direction ei . L’inconvénient majeur de la notion de dérivée partielle est qu’elle nécessite a priori le
choix d’une base dans Rn . La différentielle introduite ci-dessous permet au contraire d’introduire
une notion intrinsèque permettant de quantifier les variations d’une fonction au voisinage d’un
point. Nous donnons ici la définition directement pour les fonctions à valeurs vectorielles.
Définition 3.1.3. Soit U un ouvert de Rn et f : U → Rm . On dit que f est différentiable en
a ∈ U s’il existe une application linéaire L ∈ L (Rn , Rm ) telle que
kf (a + h) − f (a) − L(h)k
lim = 0.
khk→0 khk
Autrement dit, pour tout ε > 0, il existe un δ > 0 tel que si h ∈ Rn est tel que khk < δ, alors

kf (a + h) − f (a) − L(h)k < εkhk.

21
22 CHAPITRE 3. DIFFÉRENTIABILITÉ ET DÉRIVÉES PARTIELLES

Dans ce cas, l’application linéaire L est noté df (a) et est appelée différentielle ou application linéaire
tangente de f en a. Nous renvoyons au chapitre 4 pour une interprétation géométrique de cet objet.

Remarque 3.1.4. Une autre façon de vérifier la différentiabilité d’une fonction f en un point a
est de montrer l’existence d’une fonction ε : R → Rm satisfaisant ε(t) → 0 quand t → 0 et telle
que
f (a + h) = f (a) + df (a)(h) + khkε(khk), pour tout h de norme assez petite,
ou encore

f (a + h) = f (a) + df (a)(h) + o(khk), pour tout h de norme assez petite.

Notons que cette dernière expression n’est autre que le développement limité de f à l’ordre 1 au
voisinage de a.

AVERTISSEMENT : L’application a 7→ df (a) est une fonction de Rn dans L (Rn , Rm ). Il faudra


bien se garder de croire que cette application est linéaire. Dans la définition de la différentielle, le
point a est fixé et la différentielle au point a est une application linéaire qui dépend de a dont la
dépendance peut être totalement arbitraire. Dans cette définition, l’application qui est linéaire est
h 7→ df (a)(h) ; c’est l’application linéaire df (a) appliquée au vecteur h.

Remarque 3.1.5. Dans le cas d’une fonction f : R → R, la différentielle, qui est une application
linéaire de R dans R, peut être identifiée à un réel noté f 0 (a) et on a

df (a)(h) = f 0 (a)h, pour tout h ∈ R.

Autrement dit, l’application linéaire h 7→ df (a)(h) n’est autre que la multiplication du réel h par
le réel f 0 (a).

Proposition 3.1.6. Si f : Rn → Rm est différentiable en a ∈ Rn , alors f est continue en a.

Démonstration. On a pour tout h ∈ Rn , f (a + h) − f (x) = df (a)(h) + o(khk) → 0.

Remarque 3.1.7. Notons qu’en général, l’existence des seules dérivées partielles n’implique pas
la continuité. Pour s’en convaincre on peut considérer la fonction f : R2 → R définie par

 x2 y 2

4
x +y 2 si y 6= 0,
f (x, y) =
0 si y = 0.

En effet,
∂f ∂f
(0, 0) = (0, 0) = 0,
∂x ∂y
mais f n’est pas continue en (0, 0) car, par exemple, f (x, x2 ) = 1/2 pour tout x 6= 0.

Le résultat suivant nous fournit un premier lien entre les notions de différentielle et dérivées
partielles.

Proposition 3.1.8. Soit U un ouvert de Rn et f : U → Rm . Si f est différentiable en a ∈ U ,


alors pour tout 1 ≤ i ≤ m, les fonctions fi admettent des dérivées partielles et on a
m X n
X ∂fi
df (a)(h) = (a)hj η i , pour tout h ∈ Rn .
i=1 j=1
∂xj
3.1. DÉFINITIONS 23

Démonstration. Comme pour tout 1 ≤ i ≤ m et tout h ∈ Rn , on a |fi (a+h)−fi (a)−[df (a)(h)]i | ≤


kf (a + h) − f (a) − df (a)(h)k, on en déduit que

|fi (a + h) − fi (a) − [df (a)(h)]i |


lim = 0.
khk→0 khk

En particulier, en prenant h = tej pour 1 ≤ j ≤ n, il vient que

|fi (a + tej ) − fi (a) − t[df (a)(ej )]i |


lim = 0,
t→0 t
soit
fi (a + tej ) − fi (a)
[df (a)(ej )]i = lim .
t→0 t
Ceci montre que, pour tout 1 ≤ i ≤ m, les fonctions fi admettent des dérivées partielles et on a
∂fi j n m
∂xj (a) = [df (a)(e )]i . Comme h ∈ R et df (a)(h) ∈ R , on écrit que

n
X m
X
j
h= hj e , df (a)(h) = [df (a)(h)]i η i ,
j=1 i=1

et par linéarité de h 7→ df (a)(h), il vient que


m X
n m X n
X X ∂fi
df (a)(h) = hj [df (a)(ej )]i η i = (a)hj η i ,
i=1 j=1 i=1 j=1
∂xj

ce qui conclut la preuve du résultat.

Ainsi, une fonction différentiable en un point a admet des dérivées partielles. La réciproque est
fausse en général comme le montre l’exemple suivant.

Exemple 3.1.9. Soit f : R2 → R définie, pour tout (x, y) ∈ R2 , par


( 2
y
si x 6= 0,
f (x, y) = x
0 si x = 0.

Alors
∂f f (t, 0) − f (0, 0) ∂f f (0, t) − f (0, 0)
(0, 0) = lim = 0, (0, 0) = lim = 0,
∂x t→0 t ∂y t→0 t
ce qui montre que f admet des dérivées partielles en (0, 0). Si f était différentiable en (0, 0), la
proposition 3.1.8 montrerait que sa différentielle df (0, 0) est l’application linéaire nulle. Or

f (h, h) − f (0, 0) − df (0, 0)(h, h)


=1
h
qui ne tend pas vers 0 lorsque h → 0. On en déduit que f n’est pas différentiable en (0, 0).

Si f : Rn → Rm est une fonction différentiable en a ∈ Rn , sa différentielle df (a) est une


application linéaire de Rn dans Rm . Les bases {e1 , . . . , en } de Rn et {η 1 , . . . , η m } de Rm étant
fixées, l’application linéaire df (a) peut être représentée par une matrice de taille m × n notée
Df (a). D’après la proposition 3.1.8, la composante (i, j) de cette matrice est donnée par la j-ème
dérivée partielle de la i-ème composante de f .
24 CHAPITRE 3. DIFFÉRENTIABILITÉ ET DÉRIVÉES PARTIELLES

Définition 3.1.10. Soit f : Rn → Rm une fonction qui admet des dérivées partielles au point
a ∈ Rn . On appelle la matrice jacobienne de f en a la matrice
 
∂fi
Df (a) := .
∂xj 1≤i≤m
1≤j≤n

Lorsque m = n, Df (a) est une matrice carrée et on note

Jf (a) := det Df (a),

le jacobien de f en a.
Remarque 3.1.11. Si f : Rn → Rm est différentiable en a ∈ Rn , la proposition 3.1.8 montre que
pour tout h ∈ Rn , on a
n
X ∂fi
[Df (a)h]i = hj = [df (a)(h)]i , pour tout 1 ≤ i ≤ m.
j=1
∂xj

Autrement dit,
Df (a)h = df (a)(h),
où dans le membre de gauche, on note Df (a)h le produit de la matrice Df (a) par le vecteur
colonne h, et dans le membre de droite on note df (a)(h) l’application linéaire df (a) appliquée à h.
Par conséquent, on a la formule de Taylor suivante

f (a + h) = f (a) + Df (a)h + o(khk), pour tout h de norme assez petite.

Les fonctions f : Rn → R à valeurs scalaires (m = 1) est un cas particulier qu’il convient de


distinguer. En effet, dans ce cas, la différentielle df (a) est une application linéaire de Rn dans R
(i.e. une forme linéaire sur Rn ) et la matrice jacobienne est une matrice ligne à n composantes qui
sont les dérivées partielles de f que l’on peut représenter sous forme d’un vecteur colonne.
Définition 3.1.12. Soit f : Rn → R une fonction qui admet des dérivées partielles au point
a ∈ Rn . Le vecteur colonne
 T
∂f ∂f
∇f (a) := (a), . . . , (a)
∂x1 ∂xn

est appelé gradient de f en a.


Remarque 3.1.13. Si f : Rn → R est différentiable en a ∈ Rn , la proposition 3.1.8 montre que
pour tout h ∈ Rn , on a
df (a)(h) = Df (a)h = ∇f (a) · h,
où ∇f (a) · h désigne le produit scalaire entre les vecteurs ∇f (a) et h. De plus, on a la formule de
Taylor suivante

f (a + h) = f (a) + ∇f (a) · h + o(khk), pour tout h de norme assez petite.


 T
∂ ∂
Il est fréquent d’identifier le symbole ∇ à un “vecteur” de coordonnées ∂x 1
, . . . , ∂xn que
l’on “applique” à une fonction f pour obtenir ∇f . Notons bien que cette identification est pu-
rement symbolique et n’a rien de rigoureux, mais elle peut être très utile d’un point de vue
mnémotechnique.
3.2. PROPRIÉTÉS 25

Définition 3.1.14. Soit f : Rn → Rm une fonction qui admet des dérivées partielles en a ∈ Rn .
On définit
– la divergence : Si m = n, on note
n
X ∂fi
div f (a) := ∇ · f (a) = (a) = tr Df (a).
j=1
∂xi

– le rotationnel : Si m = n = 3, on note
 
∂f3 ∂f2 ∂f1 ∂f3 ∂f2 ∂f1
rot f (a) := ∇ ∧ f (a) = − , − , − (a),
∂x2 ∂x3 ∂x3 ∂x1 ∂x1 ∂x2
et si m = n = 2,
∂f2 ∂f1
rot f (a) := − .
∂x1 ∂x2

3.2 Propriétés
Comme le calcul des dérivées partielles se ramène au calcul de dérivées classiques, celles-ci
jouissent des mêmes règles que celles connues pour les fonctions d’une seule variable. Les propriétés
suivantes sont présentées sans démonstration.
Propriétés 3.2.1. Soient f , g : Rn → R deux fonctions admettant une dérivée partielle par
rapport à la i-ème variable en a ∈ Rn et soient λ, µ ∈ R. Alors
∂f
i) si f est indépendante de xi , ∂x i
(a) = 0 ;
ii) λf + µg admet une dérivée partielle en a par rapport à la i-ème variable et
∂(λf + µg) ∂f ∂g
(a) = λ (a) + µ (a);
∂xi ∂xi ∂xi
iii) f g admet une dérivée partielle en a par rapport à la i-ème variable et
∂(f g) ∂g ∂f
(a) = f (a) (a) + g(a) (a).
∂xi ∂xi ∂xi
Montrons à présent des propriétés analogues pour la différentielle.
Propriétés 3.2.2. Soient f , g : Rn → Rm deux fonctions différentiables en a ∈ Rn et soient λ,
µ ∈ R. Alors
i) si f est constante, alors df (a) = 0 pour tout a ∈ Rn ;
ii) si f ∈ L (Rn , Rm ) est une application linéaire, alors df (a) = f pour tout a ∈ Rn ;
iii) λf + µg est différentiable en a et d(λf + µg)(a) = λdf (a) + µdg(a) ;
iv) Si m = 1, alors f g est différentiable en a et d(f g)(a) = f (a)dg(a) + g(a)df (a).
Démonstration. i) Si f est constante, alors il existe c ∈ Rn tel que f (x) = c pour tout x ∈ Rn
et donc f (a + h) − f (a) = 0 pour tout a, h ∈ Rn , ce qui montre que df (a)(h) = 0.
ii) Si f ∈ L (Rn , Rm ) est une application linéaire, alors f (a + h) − f (a) = f (h) pour tout a,
h ∈ Rn . Comme f est linéaire, ceci montre que df (a)(h) = f (h).
iii) Si f , g : Rn → Rm sont deux fonctions différentiables en a ∈ Rn , alors il existe ε1 et
ε2 : R → Rm telles que ε1 (t) → 0 et ε2 (t) → 0 quand t → 0 telles que pour tout h ∈ Rn assez
petit,
f (a + h) − f (a) = df (a)(h) + khkε1 (khk),
g(a + h) − g(a) = dg(a)(h) + khkε2 (khk),
26 CHAPITRE 3. DIFFÉRENTIABILITÉ ET DÉRIVÉES PARTIELLES

et par conséquent,
λf (a + h) + µg(a + h) = λf (a) + µg(a) + λdf (a)(h) + µdg(a)(h) + khk[λε1 (khk) + µε2 (khk)].
Comme h 7→ λdf (a)(h) + µdg(a)(h) est linéaire et ε(t) := λε1 (t) + µε2 (t) → 0 quand t → 0,
on en déduit que λf + µg est différentiable en a avec d(λf + µg)(a) = λdf (a) + µdg(a).
iv) Si de plus m = 1, alors

f (a + h)g(a + h) − f (a)g(a)
= f (a + h)[g(a + h) − g(a)] + g(a)[f (a + h) − f (a)]
= f (a + h)[dg(a)(h) + khkε2 (khk)] + g(a)[df (a)(h) + khkε1 (khk)].
Par conséquent,

kf (a + h)g(a + h) − f (a)g(a) − f (a)dg(a)(h) − g(a)df (a)(h)k


khk
k[f (a + h) − f (a)]dg(a)(h) + f (a + h)khkε2 (khk) + g(a)khkε1 (khk)k
=
khk
≤ |f (a + h) − f (a)||||dg(a)||| + |f (a + h)|ε2 (khk) + |g(a)|ε1 (khk) → 0,
car, d’après la proposition 3.1.6, f est continue en a. Ceci montre que f g est différentiable en
a et d(f g)(a) = f (a)dg(a) + g(a)df (a).

Nous établissons à présent une formule de différentiation des fonctions composées.


Proposition 3.2.3. Soit f : Rn → Rm une fonction différentiable en a ∈ Rn et g : Rm → Rp une
fonction différentiable en f (a) ∈ Rm . Alors g ◦ f : Rn → Rp est différentiable en a ∈ Rn et
d(g ◦ f )(a) = dg(f (a)) ◦ df (a). (3.2.1)
Démonstration. Notons b = f (a). Il existe alors des fonctions ε1 : R → Rm et ε2 : R → Rp
satisfaisant ε1 (t) → 0 et ε2 (t) → 0 quand t → 0 et telles que pour tout h ∈ Rn et k ∈ Rm assez
petits,
f (a + h) − f (a) = df (a)(h) + khkε1 (khk), (3.2.2)
g(b + k) − g(b) = dg(b)(k) + khkε2 (kkk). (3.2.3)
Utilisons (3.2.3) avec kh = f (a+h)−f (a). Par (3.2.2), on voit qu’il existe c > 0 tel que kkh k ≤ ckhk
pour h assez petit. Il vient alors, en reportant dans (3.2.3), que

g(f (a + h)) = g(f (a) + kh ) = g(f (a)) + dg(f (a))(kh ) + kkh kε2 (kkh k)
= g(f (a)) + dg(f (a))[df (a)(h) + khkε1 (khk)] + kkh kε2 (kkh k).
Par conséquent,

kg(f (a + h)) − g(f (a)) − [dg(f (a)) ◦ df (a)](h)k


khk
khkdg(f (a))ε1 (khk) + kkh kε2 (kkh k)
=
khk
≤ |||dg(a)|||kε1 (khk)k + ckε2 (khk)k → 0,
ce qui conclut la preuve de la proposition.
3.2. PROPRIÉTÉS 27

AVERTISSEMENT : Contrairement aux fonctions d’une seule variable l’ordre d’apparition des
différentielles dans la formule (3.2.1) est extrêmement important. En effet, comme g ◦ f : Rn → Rp ,
sa différentielle en a ∈ Rn (quand elle existe) doit être une application linéaire de Rn dans Rp .
Comme df (a) ∈ L (Rn , Rm ), on en déduit que pour tout h ∈ Rn , df (a)(h) ∈ Rm , et comme
dg(f (a)) ∈ L (Rm , Rp ), alors dg(f (a))(df (a)(h)) ∈ Rp ce qui montre bien que dg(f (a) ◦ df (a) ∈
L (Rn , Rp ). Ceci peut se voir également en terme de matrices jacobiennes. En effet, on a

D(g ◦ f )(a) = Dg(f (a))Df (a).

Comme Df (a) est une matrice m × n et Dg(f (a)) est une matrice p × m, la multiplication de
matrices Dg(f (a))Df (a) a un sens car Dg(f (a)) a m colonnes et Df (a) a m lignes. En revanche,
le produit de matrices dans l’ordre inverse n’est pas bien défini.

Remarque 3.2.4. Il est intéressant d’écrire la formule (3.2.1) en terme de dérivées partielles. Si
l’on note u ∈ Rm la variable de g, alors pour tout 1 ≤ i ≤ p et 1 ≤ j ≤ n, on a
m
∂(g ◦ f )i X ∂gi ∂fk
(a) = (f (a)) (a).
∂xj ∂uk ∂xj
k=1

Le calcul consiste donc à dériver gi par rapport à la variable uk et d’évaluer le résultat en f (a),
de multiplier par la dérivée de fk par rapport à la variable xj évaluée en a, puis de sommer par
rapport à k.

Exemple 3.2.5. Soient g : R2 → R une fonction différentiable et Φ : R2 → R2 la fonction définie


par
 
ax + by
Φ(x, y) := , pour tout (x, y) ∈ R2 .
cx + dy

La fonction Φ est différentiable sur R2 car c’est une application linéaire. On définit f : R2 → R
par f = g ◦ Φ, i.e.,

f (x, y) = g(ax + by, cx + dy), pour tout (x, y) ∈ R2 .

Alors f est différentiable sur R2 et


 ∂f ∂g ∂g
 (x, y) = a (ax + by, cx + dy) + c (ax + by, cx + dy),

∂x ∂u ∂v
 ∂f (x, y) = b ∂g (ax + by, cx + dy) + d ∂g (ax + by, cx + dy).

∂y ∂u ∂v

Le théorème des accroissements finis, bien connu pour les fonctions d’une seule variable, se
généralise aux fonctions de plusieurs variables. Dans les résultats qui suivent, les notions de
convexité et connexité introduites au chapitre 1 vont se montrer particulièrement utiles.

Théorème 3.2.6 (Accroissements finis). Soit U ⊂ Rn un ouvert convexe et f : U → Rm une


fonction différentiable. Alors, pour tout x, y ∈ U ,

kf (x) − f (y)k ≤ sup |||df (z)|||kx − yk,


z∈[x,y]

où [x, y] := {ty + (1 − t)x, t ∈ [0, 1]} désigne le segment dans Rn d’extrémités x et y.
28 CHAPITRE 3. DIFFÉRENTIABILITÉ ET DÉRIVÉES PARTIELLES

Démonstration. Soient x et y ∈ U , l’ensemble U étant convexe, le segment [x, y] est bien inclu
dans U . Pour tout t ∈ [0, 1], on pose
m
X
g(t) := f (ty + (1 − t)x) · [f (y) − f (x)] = fi (ty + (1 − t)x)[fi (y) − fi (x)].
i=1

Notons que g est bien définie sur [0, 1] puisque ty + (1 − t)x ∈ U et elle y est par ailleurs continue.
De plus, f étant différentiable sur U et t 7→ ty + (1 − t)x étant dérivable sur ]0, 1[, on en déduit
par la formule de différentiation des fonctions composées que g est dérivable sur ]0, 1[ et

g 0 (t) = [df (ty + (1 − t)x)(y − x)] · [f (y) − f (x)], pour tout t ∈]0, 1[.

D’après le théorème des accroissements finis en dimension 1, pour tout 1 ≤ i ≤ m, il existe un


t0 ∈]0, 1[ tel que g(1) − g(0) = g 0 (t0 ), soit

kf (y) − f (x)k2 = [df (t0 y + (1 − t0 )x)(y − x)] · [f (y) − f (x)].

Par conséquent, d’après l’inégalité de Cauchy-Schwarz,

kf (y) − f (x)k ≤ |||df (t0 y + (1 − t0 )x)||| ky − xk ≤ sup |||df (z)|||kx − yk,


z∈[x,y]

ce qui établit le résultat.

Théorème 3.2.7. Soit U ⊂ Rn un ouvert connexe et f : U → Rm telle que df (x) = 0 pour tout
x ∈ U . Alors f est constante sur U , i.e., il existe c ∈ Rm tel que f (x) = c pour tout x ∈ U .

Démonstration. Soient x et y ∈ U . L’ensemble U étant connexe, le théorème 1.4.17 assure l’exis-


tence d’une ligne brisée contenue dans U qui relie x et y : il existe x1 , . . . , xp ∈ U tels que x = x1 ,
y = xp et les segments [xi , xi+1 ] ⊂ U pour tout 1 ≤ i ≤ p − 1. D’après le théorème des accroisse-
ments finis,
kf (xi+1 ) − f (xi )k ≤ sup |||df (z)|||kxi+1 − xi k = 0,
z∈[xi ,xi+1 ]

puisque df (z) = 0 pour tout z ∈ [xi+1 , xi ] ⊂ U . D’après l’inégalité triangulaire,

p−1
X
kf (x) − f (y)k ≤ kf (xi+1 ) − f (xi )k = 0,
i=1

ce qui montre que f est constante dans U .

L’hypothèse de connexité est réellement nécessaire comme le montre l’exemple suivant.

Exemple 3.2.8. On note x0 = (−1, 0) et y0 = (1, 0). On définit l’ensemble U = B(x0 , 1/2) ∪
B(y0 , 1/2). Il s’agit d’un ensemble ouvert car c’est la réunion de deux boules ouvertes mais non
connexe puique U est lui même l’union de deux ouverts disjoints. Si l’on définit la fonction f : U →
R par f (x, y) = −1 si (x, y) ∈ B(x0 , 1/2) et f (x, y) = 1 si (x, y) ∈ B(y0 , 1/2) alors df (x, y) = 0
pour tout (x, y) ∈ U , mais pourtant f n’est pas constante sur U .
3.3. FONCTIONS DE CLASSE C 1 29

3.3 Fonctions de classe C 1


Nous avons vu précédemment qu’une fonction dont toutes les dérivées partielles sont partout
définies n’est pas forcément différentiable. La situation est différente lorsque les dérivées partielles
sont continues.

Définition 3.3.1. Soient U ⊂ Rn un ouvert et f : U → Rm . On dit que f est de classe C 1 sur


∂fi
U si f admet des dérivées partielles et ∂x j
sont continues sur U pour tout 1 ≤ i ≤ m et tout
1 ≤ j ≤ n. On note C (U ; R ) l’ensemble des fonctions de classe C 1 sur U à valeurs dans Rm et,
1 m

plus simplement C 1 (U ) quand m = 1.

Théorème 3.3.2. Soient U ⊂ Rn un ouvert et f : U → Rm . Si f ∈ C 1 (U ; Rm ), alors f est


différentiable sur U .

Démonstration. Soit a ∈ U , montrons que f est différentiable en a. Par continuité des dérivées
partielles, pour tout ε > 0, il existe un r > 0 tel que B(a, r) ⊂ U et

∂fi ∂fi ε
(x) − (a) < , pour tout x ∈ B(a, r), (3.3.1)
∂xj ∂xj n

pour tout 1 ≤ i ≤ m et tout 1 ≤ j ≤ n. Soit h ∈ Rn avec khk ≤ r, on pose

v (0) = 0, v (j) = h1 e1 + · · · + hj ej , pour tout 1 ≤ j ≤ n

de sorte que
n
X
f (a + h) − f (a) = [f (a + v (j) ) − f (a + v (j−1) )]. (3.3.2)
j=1

Comme kv j) k ≤ r pour tout 0 ≤ j ≤ n, on en déduit que a + v (j) ∈ B(a, r) pour tout 0 ≤ j ≤ n.


Par ailleurs, la boule B(a, r) étant convexe, les segments [a + v (j−1) , a + v (j) ] sont contenus dans
B(a, r) pour tout 1 ≤ j ≤ n. Posons

gj (t) = f (a + v (j−1) + thj ej ) · [f (a + v (j−1) ) − f (a + v (j) )], pour tout t ∈ [0, 1].

Notons que gj est bien définie car a + v (j−1) + thj ej = a + tv (j) + (1 − t)v (j−1) = t(a + v (j) ) + (1 −
t)(a + v (j−1) ) ∈ B(a, r). De plus gj est continue sur le fermé [0, 1] et, par définition des dérivées
partielles, gj est dérivable sur l’ouvert ]0, 1[ avec
m
X ∂fi
gj0 (t) = (a + v (j−1) + thj ej )hj [fi (a + v (j−1) ) − fi (a + v (j) )], pour tout t ∈]0, 1[.
i=1
∂xj

En vertu du théorème des accroissements finis en dimension 1, on en déduit l’existence d’un θj ∈


[0, 1] tel que gj (1) − gj (0) = gj0 (θj ), soit
m
X ∂fi
kf (a + v (j−1) ) − f (a + v (j) )k2 = (a + v (j−1) + θj hj ej )hj [fi (a + v (j−1) ) − fi (a + v (j) )].
i=1
∂xj

Comme ka + v (j−1) + θj hj ej − ak = kv (j−1) + θj hj ej k ≤ khk ≤ r, (3.3.1) montre que

∂fi ∂fi ε
(a + v (j−1) + θj hj ej ) − (a) < .
∂xj ∂xj n
30 CHAPITRE 3. DIFFÉRENTIABILITÉ ET DÉRIVÉES PARTIELLES

Par conséquent, d’après (3.3.2), il vient

n
X ∂f X ∂f ∂f
f (a + h) − f (a) − hj (a) ≤ |hj | (a) − (a + v (j−1) + θj hj ej )
j=1
∂xj j=1
∂xj ∂xj

n
ε X
≤√ |hj | ≤ εkhk, pour tout h ∈ B(0, r).
n j=1
Pn ∂f
Ceci montre que f est différentiable en a et df (a)(h) = j=1 hj ∂x j
(a) pour tout h ∈ Rn .

Le théorème 3.3.2 est fort utile en pratique. En effet, il est généralement difficile de montrer
directement qu’une fonction f est différentiable sur un ouvert U . Une possibilité consiste donc à
montrer que f admet des dérivées partielles sur U et que celles-ci sont continues sur U . Le théorème
précédent assure alors la différentiabilité de f sur U .
Exemple 3.3.3. Soit f : R2 → R la fonction définie par
2 2
(
xy xx2 −y
+y 2 si (x, y) 6= (0, 0),
f (x, y) =
0 si (x, y) = (0, 0).

La fonction f est bien définie, continue et admet des dérivées partielles sur R2 \ {(0, 0)}. De plus,
pour tout (x, y) 6= (0, 0), on a

∂f x4 + 4x2 y 2 − y 4 ∂f x4 − 4x2 y 2 − y 4
(x, y) = y , (x, y) = x .
∂x (x2 + y 2 )2 ∂y (x2 + y 2 )2

Par ailleurs, le calcul des dérivées partielles en (0, 0) donne

∂f f (x, 0) − f (0, 0) ∂f f (0, y) − f (0, 0)


(0, 0) = lim = 0, (0, 0) = lim = 0.
∂x x→0 x−0 ∂y y→0 y−0
∂f ∂f
Les fonctions ∂x et sont continues R2 \{(0, 0)}. Pour étudier la continuité des dérivées partielles
∂y p
en (0, 0) on pose x = r cos θ et y = r sin θ où r = x2 + y 2 > 0 et θ ∈ [0, 2π[. Notons que (x, y) → 0
si et seulement si r → 0. Il vient
∂f ∂f
(x, y) ≤ r| sin θ|| cos4 θ + 4 cos2 θ sin2 θ − sin4 θ| ≤ 6r → 0 = (0, 0)
∂x ∂x

quand (x, y) → (0, 0) ce qui prouve que ∂f ∂f


∂x est continue en (0, 0). On montre de même que ∂y est
continue en (0, 0). Finalement les dérivées partielles de f sont continues sur R2 ce qui assure que
f est différentiable sur R2 .
Pour les fonctions de Rn dans lui-même, on introduit la notion suivante.
Définition 3.3.4. Soit U ⊂ Rn un ouvert, f : U → Rn de classe C 1 sur U . On dit que f réalise un
C 1 -difféomorphisme s’il existe un ouvert V ⊂ Rn tel que f : U → V soit bijective et si sa fonction
réciproque f −1 : V → U est également de classe C 1 sur V .
Comme (
f ◦ f −1 (y) = y, pour tout y ∈ V,
f −1 ◦ f (x) = x, pour tout x ∈ U,
3.4. DÉRIVÉES PARTIELLES D’ORDRE DEUX 31

d’après la formule de différentiation des fonctions composées, on en déduit que


(
df (f −1 (y)) ◦ d(f −1 )(y) = Id, pour tout y ∈ V,
d(f −1 )(f (x)) ◦ df (x) = Id, pour tout x ∈ U,

ce qui montre que df (x) est une application linéaire inversible, et son inverse est donnée par

[df (x)]−1 = d(f −1 )(f (x)), pour tout x ∈ U.

En particulier le déterminant jacobien Jf (x) 6= 0 pour tout x ∈ U .

AVERTISSEMENT : Si la notion de fonctions de classe C 1 est définie pour les fonctions de


Rn → Rm , celle de C 1 -difféomorphisme ne l’est que pour des fonctions de Rn dans lui-même. La
dimension de l’espace de départ et d’arrivée doit être la même.

En dimension n = 1, si f : R → R est une fonction de classe C 1 et f 0 (a) 6= 0, alors f est


strictement monotone dans un voisinage de a. Autrement dit, il existe un intervalle ouvert I
contenant a, un intervalle ouvert J contenant f (a) tels que f réalise un C 1 -difféomorphisme de I
sur J. Le théorème d’inversion locale étend ce résultat en n’importe quelle dimension. Il s’agit d’un
résultat difficile dont la démonstration est admise.

Théorème 3.3.5 (Inversion locale). Soit U un ouvert de Rn et f : U → Rn une fonction de


classe C 1 . On suppose qu’il existe un a ∈ U tel que Jf (a) 6= 0. Alors il existe deux ouverts V et W
de Rn tels que a ∈ V ⊂ U , f (a) ∈ W et f réalise un C 1 -difféomorphisme de V sur W .

Il existe une version globale de ce résultat permettant d’établir qu’une fonction est un C 1 -
difféomorphisme global.

Théorème 3.3.6 (Inversion globale). Soit U un ouvert de Rn et f : U → Rn une fonction


injective et de classe C 1 . On suppose que pour tout x ∈ U , Jf (x) 6= 0. Alors f (U ) est un ouvert de
Rn et f réalise un C 1 -difféomorphisme de U sur f (U ).

Démonstration. Montrons tout d’abord que f (U ) est ouvert dans Rn . Soit y ∈ f (U ), alors il existe
un x ∈ U tel que y = f (x). Comme par hypothèse Jf (x) 6= 0, le théorème d’inversion locale
assure l’existence de deux ouverts Vx et Wy tels que x ∈ Vx ⊂ U , y ∈ Wy et f réalise un C 1 -
difféomorphisme de Vx sur Wy . En particulier, pour tout y 0 ∈ Wy , il existe un x0 ∈ Vx tel que
y 0 = f (x0 ), ce qui montre que y 0 ∈ f (U ) et donc Wy ⊂ f (U ). Comme Wy est un ouvert qui
contient y, il existe un r > 0 tel que B(y, r) ⊂ Wy ⊂ f (U ), ce qui établit que f (U ) est ouvert.
Montrons maintenant que f réalise un C 1 -difféomorphisme de U sur f (U ). On sait tout d’abord
que f est de classe C 1 sur U . Comme f est injective, on en déduit que f : U → f (U ) est bijective. Il
reste donc à voir que son application réciproque f −1 est de classe C 1 sur f (U ). Or, par le théorème
d’inversion locale, on sait que pour tout y ∈ f (U ), il existe deux ouverts V et W de Rn tels que
V ⊂ U , y ∈ W et f réalise un C 1 -difféomorphisme de V sur W , ce qui montre que f −1 est de classe
C 1 sur W . Ceci étant vrai pour tout y ∈ f (U ), on en déduit que f −1 est de classe C 1 sur f (U ).

3.4 Dérivées partielles d’ordre deux


Tout comme pour les fonctions d’une seule variable, nous avons aussi des notions de dérivées
d’ordre supérieur pour les fonctions de plusieurs variables. Nous nous limitons ici à la notion de
dérivée partielle d’ordre deux même s’il est possible de définir la différentielle d’ordre k ≥ 2.
32 CHAPITRE 3. DIFFÉRENTIABILITÉ ET DÉRIVÉES PARTIELLES

Définition 3.4.1. Soit U ⊂ Rn un ouvert et f : U → R une fonction de classe C 1 . On dit que


∂f ∂f
f admet des dérivées partielles d’ordre 2 en a ∈ U si les fonctions ∂x 1
, . . . , ∂x n
admettent des
dérivées partielles en a. On note alors pour tout 1 ≤ i, j ≤ n,
∂2f
 
∂ ∂f
(a) := (a)
∂xi ∂xj ∂xi ∂xj
la i-ème dérivée partielle de la j-ème dérivée partielle de f en a. La matrice formée des dérivées
partielles d’ordre 2 en a est notée
∂2f
 
D2 f (a) = (a)
∂xi ∂xj 1≤i,j≤n

est appelée matrice hessienne de f au point a.


Un résultat fondamental est la relation de Schwarz qui affirme que lorsque les dérivées partielles
secondes sont continues, l’ordre des variables n’importe pas.
Théorème 3.4.2 (Schwarz). Soit U ⊂ Rn un ouvert et f : U → R une fonction de classe C 1
qui admet des dérivées partielles secondes sur U qui sont continues en a ∈ U . Alors pour tout
1 ≤ i, j ≤ n,
∂2f ∂2f
(a) = (a).
∂xi ∂xj ∂xj ∂xi
En particulier, la matrice D2 f (a) est symétrique.
Démonstration. L’ensemble U étant ouvert, il existe un r > 0 tel que B(a, r) ⊂ U .
Etape 1 : Le cas n = 2. Pour tout h ∈ R2 avec khk ≤ r, on pose

∆h := [f (a + h) − f (a1 + h1 , a2 )] − [f (a1 , a2 + h2 ) − f (a)].

Soit ϕ : [a1 − r, a1 + r] → R la fonction définie par ϕ(x) = f (x, a2 + h2 ) − f (x, a2 ). La fonction ϕ


est continue sur le fermé [a1 − r, a1 + r] et dérivable sur l’ouvert ]a1 − r, a1 + r[ avec
∂f ∂f
ϕ0 (x) = (x, a2 + h2 ) − (x, a2 ), pour tout x ∈]a1 − r, a1 + r[.
∂x ∂x
Le théorème des accroissements finis montre alors l’existence d’un θ1 ∈ [0, 1] tel que ϕ(a1 + h1 ) −
ϕ(a1 ) = h1 ϕ0 (a1 + θ1 h1 ), soit

∆h = [f (a + h) − f (a1 + h1 , a2 )] − [f (a1 , a2 + h2 ) − f (a)]


 
∂f ∂f
= h1 (a1 + θ1 h1 , a2 + h2 ) − (a1 + θ1 h1 , a2 ) .
∂x ∂x

Soit ψ : [a2 − r, a2 + r] → R la fonction définie par ψ(y) = ∂f ∂x (a1 + θ1 h1 , y). La fonction ψ est
continue sur le fermé [a2 − r, a2 + r] et dérivable sur l’ouvert ]a2 − r, a2 + r[ avec

∂2f
ψ 0 (x) = (a1 + θ1 h1 , y), pour tout y ∈]a2 − r, a2 + r[.
∂y∂x
Le théorème des accroissements finis montre alors l’existence d’un θ2 ∈ [0, 1] tel que ψ(a2 + h2 ) −
ψ(a2 ) = h2 ψ 0 (a2 + θ2 h2 ), soit

∂2f
∆h = h1 h2 (a1 + θ1 h1 , a2 + θ2 h2 ).
∂y∂x
3.4. DÉRIVÉES PARTIELLES D’ORDRE DEUX 33

En échangeant les rôles de x et y, le même argument montre que

∂2f
∆h = h1 h2 (a1 + η1 h1 , a2 + η2 h2 ),
∂x∂y

où η1 et η2 ∈ [0, 1]. Ainsi, pour tout h 6= (0, 0) avec khk ≤ r, il existe θ1 , θ2 , η1 et η2 ∈ [0, 1] tels
que
∂2f ∂2f
(a1 + θ1 h1 , a2 + θ2 h2 ) = (a1 + η1 h1 , a2 + η2 h2 ).
∂y∂x ∂x∂y
∂2f ∂2f
Comme k(θ1 h1 , θ2 h2 )k ≤ khk, k(η1 h1 , η2 h2 )k ≤ khk et les dérivées partielles secondes ∂y∂x et ∂x∂y
sont continues en a, on en déduit par passage à la limite quand h → (0, 0) que

∂2f ∂2f
(a) = (a).
∂y∂x ∂x∂y

Etape 2 : Le cas n ≥ 3. Soient 1 ≤ i, j ≤ n. Pour tout (x, y) ∈ R2 avec k(x, y)k ≤ r, on pose
g(x, y) := f (a + xei + yej ). La fonction g est de classe C 1 sur B(0, r) et elle admet des dérivées
partielles première et seconde données, pour tout (x, y) ∈ B(0, r), par

∂g ∂f ∂g ∂f
(x, y) = (a + xei + yej ), (x, y) = (a + xei + yej )
∂x ∂xi ∂y ∂xj
et
∂2g ∂2f ∂2g ∂f 2
(x, y) = (a + xei + yej ), (x, y) = (a + xei + yej ).
∂x∂y ∂xi ∂xj ∂y∂x ∂xj ∂xj
2 2
∂2g ∂2g
Comme, ∂x∂i ∂x f
j
et ∂x∂j ∂x
f
i
sont continues en a, on en déduit que ∂x∂y et ∂y∂x sont continues en
(0, 0). L’étape 1 montre alors que

∂2f ∂2g ∂2g ∂2f


(a) = (0, 0) = (0, 0) = (a),
∂xi ∂xj ∂x∂y ∂y∂x ∂xj ∂xi

ce qui conclut la preuve du théorème.


Définition 3.4.3. Soit U ⊂ Rn un ouvert et f : U → R une fonction de classe C 1 . On dit que
f est de classe C 2 sur U si f admet des dérivées partielles secondes en tout point de U qui sont
continues sur U . On note C 2 (U ; Rm ) l’ensemble des fonctions de classe C 2 sur U à valeurs dans Rm
et, plus simplement C 2 (U ) quand m = 1.
De façon générale, on a la définition suivante :
Définition 3.4.4. Soit U ⊂ Rn un ouvert et f : U → R une fonction. On dit que f est de classe
C k (k ∈ N) si f admet des dérivées partielles sur U d’ordre inférieur ou égal à k qui sont continues
sur U . On dit que f est de classe C ∞ sur U si f est de classe C k sur U pour tout k ∈ N. On note
C k (U ; Rm ) (resp. C ∞ (U ; Rm )) l’ensemble des fonctions de classe C k (resp. C ∞ ) sur U à valeurs dans
Rm et, plus simplement C k (U ) (resp. C ∞ (U )) quand m = 1.
Définition 3.4.5. Soit U ⊂ Rn un ouvert et f : U → R une fonction de classe C 2 sur U . On
définit le Laplacien de f en a par
n
X ∂2f
∆f (a) = (a) = trD2 f (a).
i=1
∂x2i
34 CHAPITRE 3. DIFFÉRENTIABILITÉ ET DÉRIVÉES PARTIELLES

La connaissance de dérivées partielles d’ordre 2 permet de donner une formule de Taylor à l’ordre
2 pour les fonctions de plusieurs variables.
Théorème 3.4.6 (Formule de Taylor). Soit U ⊂ Rn un ouvert et f : U → R une fonction de
classe C 2 sur U . Pour tout a ∈ U , on a pour h assez petit,
1
f (a + h) = f (a) + ∇f (a) · h + [D2 f (a)h] · h + o(khk2 ),
2
AVERTISSEMENT : Le terme [D2 f (a)h] · h est le produit scalaire du vecteur D2 f (a)h avec
h. En effet, comme la matrice hessienne D2 f (a) est une matrice n × n, le produit matrice/vecteur
D2 f (a)h est un vecteur de Rn . En terme de dérivées partielles, on peut écrire
n n X
n
X X ∂2f
[D2 f (a)h] · h = [D2 f (a)h]i hi = (a)hj hi .
i=1 i=1 j=1
∂xi ∂xj

Démonstration. L’ensemble U étant ouvert, il existe un r > 0 tel que B(a, r) ⊂ U . Pour h ∈ Rn
avec h 6= 0 et khk < r, on pose g(t) = f (a + th/k|hk) pour tout t ∈ [0, r]. La fonction g est de
classe C 2 sur ]0, r[ et d’après la formule de Taylor, on a pour tout t ∈]0, r[

t2 00
g(t) = g(0) + tg 0 (0) + g (0) + o(t2 ).
2
Calculons les dérivées première et seconde de g en fonction de f . D’après la formule de différentiation
des fonctions composées, on a pour tout t ∈ [0, r],
n    
0
X hi ∂f h h h
g (t) = a+t = ∇f a + t ·
i=1
khk ∂xi khk khk khk

et
n X n
hi hj ∂f 2
 
X h
g 00 (t) = a + t
i=1 j=1
khk2 ∂xi ∂xj khk
n        
X hi 2 h h 2 h h h
= D f (a + t = D f a+t · .
i=1
khk khk khk i khk khk khk

Par conséquent, en prenant t = khk < r, il vient


1
f (a + h) = f (a) + ∇f (a) · h + [D2 f (a)h] · h + o(khk2 ),
2
ce qui conclut la preuve de la formule de Taylor.

3.5 Points critiques et extrema


Définition 3.5.1. Soit U ⊂ Rn et f : U → R une fonction de classe C 1 sur U . On dit que a ∈ U
est un point critique de f si ∇f (a) = 0.
Définition 3.5.2. Soit f : Rn → R une fonction et E un sous-ensemble de Rn . On dit que f admet
un minimum global sur E au point a ∈ E si f (a) ≤ f (y) pour tout y ∈ E. On dit que f admet un
minimum local sur E en a ∈ E s’il existe un ouvert V ⊂ Rn contenant a tel que f (a) ≤ f (y) pour
tout y ∈ E ∩ V .
3.5. POINTS CRITIQUES ET EXTREMA 35

Définition 3.5.3. Soit f : Rn → R une fonction et E un sous-ensemble de Rn . On dit que f admet


un maximum global sur E au point a ∈ E si f (a) ≥ f (y) pour tout y ∈ E. On dit que f admet un
maximum local sur E en a ∈ E s’il existe un ouvert V ⊂ Rn contenant a tel que f (a) ≥ f (y) pour
tout y ∈ E ∩ V .
Nous utilisons la dénomination d’extremum pour désigner sans distinction un maximum ou un
minimum. Nous avons déjà établi l’existence d’un maximum et d’un minimum global pour toute
fonction continue sur un compact (voir le théorème 2.3.3). Nous montrons à présent une condition
nécessaire qui assure que tout extremum local est forcément un point critique
Théorème 3.5.4. Soit U ⊂ Rn et f : U → R une fonction de classe C 1 sur U . Si f admet un
extremum local sur U en a ∈ U , alors ∇f (a) = 0.
Démonstration. Supposons que f admet un minimum local sur U en a ∈ U . Alors il existe un
ouvert V de Rn contenant a tel que f (a) ≤ f (y) pour tout y ∈ U ∩ V . L’ensemble U ∩ V étant
ouvert, il existe un r > 0 tel que B(a, r) ⊂ U ∩ V . Pour tout t ∈ [−1, 1] et h ∈ Rn avec khk ≤ r,
on a que a + th ∈ B(a, r) de sorte que la fonction g :] − 1, 1[→ R définie par g(t) = f (a + th) pour
tout t ∈] − 1, 1[ est bien définie et de classe C 1 sur ] − 1, 1[. De plus g admet un minimum local sur
] − 1, 1[ en 0 car
g(0) = f (a) ≤ f (a + th) = g(t), pour tout t ∈] − 1, 1[.
Si t > 0, on a alors
g(t) − g(0)
≥ 0,
t
et par passage à la limite quand t → 0+ , on obtient g 0 (0) ≥ 0. De même si t < 0,
g(t) − g(0)
≤ 0,
t
et par passage à la limite quand t → 0− , on obtient g 0 (0) ≤ 0. Finalement, il vient que g 0 (0) = 0 et
la formule de différentiation des fonctions composées montre que g 0 (t) = df (a + th)(h) pour tout
t ∈] − 1, 1[, et donc
df (a)(h) = 0, pour tout h ∈ B(0, r).
Par conséquent, pour tout v ∈ Rn , en posant h = rv/kvk ∈ B(0, r), on obtient que df (a)(v) = 0
et donc df (a) = 0, ou encore ∇f (a) = 0.
Etre un point critique est donc une condition nécessaire pour être un extremum. Elle n’est
cependant pas suffisante au regard de l’exemple suivant.
Exemple 3.5.5. Soit f : R2 → R la fonction définie par f (x, y) = x2 − y 2 pour tout (x, y) ∈ R2 .
Il s’agit d’une fonction de classe C ∞ puisque c’est un polynôme. Cherchons d’abord les points
critiques de f . Pour ce faire, on résoud l’équation ∇f (x, y) = 0, i.e.,
∂f ∂f
(x, y) = 2x = 0, (x, y) = −2y = 0,
∂x ∂y
et on trouve que (x, y) = (0, 0). La fonction f admet donc un unique point critique qui est (0, 0).
Par ailleurs, on constate que f n’admet ni un minimum local ni un maximum local sur R2 en (0, 0).
En effet, si U est un ouvert de Rn contenant (0, 0), alors pour ε > 0 assez petit B((0, 0), ε) ⊂ U et
(ε, 0) ∈ U, f (ε, 0) = ε2 > 0 = f (0, 0) =⇒ (0, 0) n’est pas un point de maximum local,
et
(0, ε) ∈ U, f (0, ε) = −ε2 < 0 = f (0, 0) =⇒ (0, 0) n’est pas un point de minimum local.
36 CHAPITRE 3. DIFFÉRENTIABILITÉ ET DÉRIVÉES PARTIELLES

Afin d’identifier plus précisément les extrema parmi les points critiques, il convient d’utiliser le
développement de Taylor à l’ordre 2 pour les fonctions de classe C 2 .
Théorème 3.5.6. Soit U ⊂ Rn et f : U → R une fonction de classe C 2 sur U . Alors
– Si f admet un minimum local sur U au point a ∈ U , alors les valeurs propres de la matrice
hessienne D2 f (a) sont toutes positives ou nulles ;
– Si f admet un maximum local sur U au point a ∈ U , alors les valeurs propres de la matrice
hessienne D2 f (a) sont toutes négative ou nulles.
Démonstration. D’après le théorème de Schwarz, la matrice hessienne D2 f (a) est symétrique. Un
résultat d’algèbre linéaire montre qu’elle est diagonalisable dans une base orthonormée de vecteurs
propres : il existe des valeurs propres λ1 ≤ · · · ≤ λn et des vecteurs propres v 1 , . . . , v n ∈ Rn tels que
la famille {v 1 , . . . , v n } est une base orthonormée de Rn et D2 f (a)v i = λi v i pour tout 1 ≤ i ≤ n.
D’après la formule de Taylor, on a
t2 2
f (a + tv i ) = f (a) + t∇f (a) · v i + [D f (a)v i ] · v i + o(t2 ), pour tout 1 ≤ i ≤ n.
2
Comme f admet un extremum local sur U en a ∈ U , le théorème 3.5.4 montre que ∇f (a) = 0.
De plus en utilisant le fait que les vecteurs v i sont unitaires, on a que [D2 f (a)v i ] · v i = λi v i · v i =
λi kv i k2 = λi et il vient
t2
f (a + tv i ) − f (a) = λi + o(t2 ), pour tout 1 ≤ i ≤ n.
2
Si f admet un minimum local sur U en a ∈ U , il existe un ouvert V de Rn tel que f (a) ≤ f (x)
pour tout x ∈ U ∩ V . L’ensemble U ∩ V étant ouvert, on peut trouver un r > 0 tel que B(a, r) ⊂
U ∩ V . Pour tout t ∈] − r, r[ et tout 1 ≤ i ≤ n, on a que a + tv i ∈ B(a, r) et f (a) ≤ f (a + tv i ) ce
qui montre, après division par t2 que λi + o(t2 )/t2 ≥ 0 pour tout 1 ≤ i ≤ n. Enfin, par passage à
la limite quand t → 0, il vient que λi ≥ 0 pour tout 1 ≤ i ≤ n.
Si f admet un maximum local sur U en a ∈ U , un argument similaire montre que les valeurs
propres λi ≤ 0 pour tout 1 ≤ i ≤ n.
Dans le cas où la matrice hessienne est non dégénérée, on peut aussi obtenir une condition
suffisante assurant qu’un point critique est un point d’extremum local.
Théorème 3.5.7. Soit U ⊂ Rn , f : U → R une fonction de classe C 2 sur U et a ∈ U un point
critique de f .
– Si les valeurs propres de la matrice hessienne D2 f (a) sont toutes strictement positives, alors
f admet un minimum local sur U en a ∈ U ;
– Si les valeurs propres de la matrice hessienne D2 f (a) sont toutes strictement négatives, alors
f admet un maximum local sur U en a ∈ U .
Démonstration. Comme l’ensemble U est ouvert et a ∈ U , il existe un r > 0 tel que B(a, r) ⊂ U .
Par ailleurs, soient λ1 ≤ · · · ≤ λn les valeurs propres de la matrice hessienne D2 f (a) et v 1 , . . . , v n ∈
Rn les vecteurs propres associés tels que la famille {v 1 , . . . , v n } est une base orthonormée de Rn et
D2 f (a)v i = λi v i pour tout 1 ≤ i ≤ n. Pn i
Pour tout h ∈PB(0, r), il existe donc des n ∈ R tels que h =
Pn réels h1i, . . . , hP i=1 hi v et donc
2 n 2 i n 2
[D f (a)h] · h = i=1 hi [D f (a)v ] · h = i=1 λi hi v · h = i=1 λi |hi | . Le point a étant un point
critique de f , il vient d’après la formule de Taylor
1
f (a + h) − f (a) = ∇f (a) · h + [D2 f (a)h] · h + o(khk2 )
2
n
1X
= λi |hi |2 + o(khk2 ).
2 i=1
3.5. POINTS CRITIQUES ET EXTREMA 37

Si les valeurs propres sont toutes strictement positives, alors


 
λ1
f (a + h) − f (a) ≥ khk2 + ε(khk) ,
2

où ε(t) → 0 quand t → 0. Il existe donc un δ > 0 tel que pour tout 0 ≤ t < δ, on a |ε(t)| ≤ λ1 /2,
ce qui implique que
f (a + h) − f (a) ≥ 0, pour tout h ∈ B(0, δ).
En posant V := B(a, δ), on a donc montré que f (a) ≤ f (y) pour tout y ∈ V , ce qui assure que f
admet un minimum local sur U en a ∈ U .
Si les valeurs propres sont toutes strictement négatives, un argument similaire montre que f
admet un maximum local sur U en a ∈ U .
Remarque 3.5.8. En dimension n = 2, la matrice hessienne est une matrice symétrique 2 × 2 et il
est facile de connaı̂tre le signe des valeurs propres λ1 et λ2 . Il suffit de remarquer que detD2 f (a) =
λ1 λ2 et que tr D2 f (a) = λ1 + λ2 . On constate alors que si a est un point critique et detD2 f (a) > 0
alors, les deux valeurs propres sont non nulles et de même signe, ce qui implique que a est un
extremum local. Si tr D2 f (a) > 0 alors les deux valeurs propres sont strictement positives et a est
un point de minimum local, et si tr D2 f (a) < 0 alors les deux valeurs propres sont strictement
négatives et a est un point de maximum local.
38 CHAPITRE 3. DIFFÉRENTIABILITÉ ET DÉRIVÉES PARTIELLES
Chapitre 4

Courbes et surfaces paramétrées

4.1 Théorème des fonctions implicites


Si g : R → R, alors le graphe de g
G := {(x, y) ∈ R2 : y = g(x)}
définit une courbe dans le plan donné par les solutions (x, y) ∈ R2 de l’équation f (x, y) = y−g(x) =
0. Réciproquement, si f : R2 → R est une fonction de classe C 1 , on considère l’équation cartésienne
f (x, y) = 0
et on cherche à comprendre dans quelle mesure cette équation est équivalente à y = g(x), où
g : R → R. L’exemple suivant montre qu’en général, ceci n’est possible que localement.
Exemple 4.1.1. Pour tout (x, y) ∈ R2 , on pose f (x, y) = x2 + y 2 − 1. L’ensemble des solutions √ à
l’équation f (x, y) = 0√n’est autre que le cercle unité. Si y > 0, alors on peut écrire que y = 1 − x2 ,
si y < 0, alors y = − 1 − x2 . Par contre, si y = 0, alors nécessairement x = ±1 et les portions du
cercle unité au voisinage de ces points ne peuvent pas s’écrire comme un graphe.
Le théorème des fonctions implicites donne certaines conditions suffisantes assurant que tout
l’ensemble de niveau d’une fonction de n variables peut être localement donné par le graphe d’une
fonction de n − 1 variables.
Théorème 4.1.2 (Fonctions implicites). Soit U un ouvert de Rn et f : U → R une fonction
de classe C 1 . On suppose qu’il existe x0 ∈ Rn−1 et y0 ∈ R tels que
∂f
(x0 , y0 ) ∈ U, f (x0 , y0 ) = 0 et (x0 , y0 ) 6= 0.
∂xn
Alors, il existe un ouvert V ⊂ Rn−1 , un ouvert W ⊂ R tels que
V × W ⊂ U, x0 ∈ V, y0 ∈ W
et il existe une fonction g : V → W de classe C 1 telle que pour tout (x, y) ∈ V × W ,
f (x, y) = 0 ⇐⇒ y = g(x).
De plus, on a que pour tout x ∈ V et pour tout 1 ≤ i ≤ n − 1,
∂f
∂g ∂xi (x, g(x))
(x) = − ∂f .
∂xi ∂x (x, g(x))
n

39
40 CHAPITRE 4. COURBES ET SURFACES PARAMÉTRÉES

Démonstration. Pour simplifier, nous présentons la preuve uniquement en dimension n = 2. On


définit la fonction F : U → R2 par F (x, y) = (x, f (x, y)) pour tout (x, y) ∈ U . Il est clair que F
est de classe C 1 sur U et pour tout (x, y) ∈ U ,
 
1 0 ∂f
DF (x, y) = ∂f ∂f , JF (x, y) = (x, y).
∂x (x, y) ∂y (x, y) ∂y

En particulier, JF (x0 , y0 ) 6= 0 et le théorème d’inversion locale montre l’existence d’un ouvert


U 0 ⊂ U tel que (x0 , y0 ) ∈ U 0 et F réalise un C 1 -difféomorphisme de U 0 sur son image. Par ailleurs,
comme ∂f ∂f ∂f
∂y (x0 , y0 ) 6= 0 et ∂y est continue, on peut supposer que ∂y (x, y) 6= 0 pour tout (x, y) ∈ U .
0
0 0 0 0
Soient I et J deux intervalles ouverts de R tels que x0 ∈ I , y0 ∈ J et I × J ⊂ U . Comme
F (I 0 × J) est un ouvert de R2 qui contient le point F (x0 , y0 ) = (x0 , f (x0 , y0 )) = (x0 , 0), on peut
encore trouver un intervalle ouvert I ⊂ I 0 tel que x0 ∈ I et I × {0} ⊂ F (I 0 × J). Par conséquent,
pour tout x ∈ I, il existe un unique (x0 , y) ∈ I 0 × J tel que (x, 0) = F (x0 , y) = (x0 , f (x0 , y)), ce qui
implique que x = x0 et f (x, y) = 0. On pose alors g(x) := y de sorte que pour tout (x, y) ∈ I × J,

y = g(x) ⇐⇒ f (x, y) = 0.

Montrons à présent que g est de classe C 1 sur I. Comme pour tout x ∈ I, (x, 0) = F (x, g(x)) et F
réalise un C 1 -difféomorphisme de I ×J sur son image, on en déduit que (x, g(x)) = (F |I×J )−1 (x, 0).
Ceci montre bien que g est de classe C 1 sur I. De plus comme

f (x, g(x)) = 0, pour tout x ∈ I,

la formule de dérivation des fonctions composées montre que


∂f ∂f
(x, g(x)) + (x, g(x))g 0 (x) = 0,
∂x ∂y
soit
∂f
(x, g(x))
g 0 (x) = − ∂f
∂x
,
∂y (x, g(x))

ce qui conclut la preuve du théorème.

4.2 Courbes paramétrées


Définition 4.2.1. Un arc orienté de classe C 1 est défini par la donnée d’un couple (I, γ), où I est
un intervalle fermé de R et γ : t ∈ R 7→ γ(t) = (x(t), y(t)) ∈ R2 est une fonction de classe C 1 telle
que γ|I est injective et γ̇(t) 6= (0, 0) pour tout t ∈ I. On note alors

Γ := {γ(t) ∈ R2 : t ∈ I} = γ(I).

On dit que γ est un paramétrage de Γ. Si I = [a, b], γ(a) = γ(b) et γ|[a,b[ est injective, on parle
alors de courbe fermée orientée de classe C 1 .
Le vecteur γ̇(t) est alors tangent à Γ en γ(t). On appelle tangente en (x0 , y0 ) := γ(t0 ) la droite
passant par ce point et parallèle au vecteur γ 0 (t0 ).
Proposition 4.2.2. Soit (I, γ) un arc orienté de classe C 1 , t0 ∈ I et (x0 , y0 ) = γ(t0 ) ∈ Γ. Alors
la tangente à Γ en (x0 , y0 ) admet comme équation paramétrique

t ∈ R 7→ γ(t0 ) + tγ̇(t0 ).
4.2. COURBES PARAMÉTRÉES 41

Remarque 4.2.3. – Si γ̇(t) = (0, 0), la courbe n’admet pas forcément de tangente. Par exemple
la courbe dont un paramétrage est donné par
 3
t
γ(t) := 2 , pour tout t ∈ [−1, 1]
t

n’admet pas de tangente en (0, 0) qui est un point singulier.


– L’hypothèse d’injectivité signifie que la courbe Γ ne se croise pas elle-même : t 6= t0 =⇒
γ(t) 6= γ(t0 ).
– L’orientation de l’arc Γ précise le sens dans lequel on le parcourt : de A = γ(a) vers B = γ(b)
si I = [a, b]. Si l’on définit µ(t) = γ(a + b − t) pour tout t ∈ [a, b], alors µ([a, b]) = γ([a, b]) = Γ,
µ(a) = γ(b) = B et µ(b) = γ(a) = A. On obtient ainsi un autre paramétrage du même arc,
orienté dans le sens opposé (de B vers A). Il n’existe que deux sens de parcours possible :
le sens inverse “des aiguilles d’une montre” dit aussi aussi sens direct, et le sens inverse dit
indirect.
Comme le montre le résultat suivant, une paramétrisation n’est pas forcément unique.
Proposition 4.2.4. Soient ([a, b], γ) un arc orienté de classe C 1 et ϕ : R → R une fonction de
classe C 1 telle que ϕ|[c,d] est strictement croissante, ϕ([c, d]) = [a, b] et ϕ(c) = a, ϕ(d) = b. On
définit la fonction µ : R → R2 par µ = γ ◦ ϕ. Alors ([c, d], µ) définit le même arc orienté que
([a, b], γ) avec la même orientation.
Démonstration. Si µ = γ ◦ ϕ : R → R2 , alors µ est de classe C 1 et µ|[c,d] est injective. Par ailleurs,
ϕ étant strictement croissante sur [c, d], on a ϕ0 (t) > 0 pour tout t ∈ [c, d] et on en déduit que
µ̇(t) = γ̇(ϕ(t))ϕ0 (t) 6= (0, 0) pour tout t ∈ [c, d]. Par conséquent,([c, d], µ) définit le même arc
orienté que ([a, b], γ). De plus, comme µ(c) = γ(ϕ(c)) = γ(a) et µ(d) = γ(ϕ(d)) = γ(b), on en
déduit que l’orientation est préservée.
2 2
Exemple 4.2.5. 1. L’ellipse d’équation cartésienne xa2 + yb2 = 1 est un arc orienté de classe C 1
dont une paramétrisation est  
a cos t
t ∈ [0, 2π] 7→ .
b sin t
2 2
2. L’hyperbole d’équation cartésienne xa2 − yb2 = 1 est la réunion de deux arcs orientés de classe
C 1 dont les paramétrisations sont
   
a cosh t −a cosh t
t ∈ R 7→ , t ∈ R 7→ .
b sinh t b sinh t

3. La parabole d’équation cartésienne y 2 − x = 0 est un arc orienté de classe C 1 dont la pa-


ramétrisation est  2
t
t ∈ R 7→ .
t
Remarque 4.2.6. 1. Le cas des graphes : si f : R → R est une fonction de classe C 1 , on définit
 
t
γ(t) := , pour tout t ∈ R.
f (t)
Alors    
1 0
γ̇(t) := 6=
f 0 (t) 0
ce qui montre que le graphe de f est un arc orienté de classe C 1 .
42 CHAPITRE 4. COURBES ET SURFACES PARAMÉTRÉES

2. Le cas des ensembles de niveau : Soit g : R2 → R une fonction de classe C 1 . On définit


C := {(x, y) ∈ R2 : g(x, y) = 0}
∂g
l’ensemble de niveau 0 de la fonction g. On suppose que (x0 , y0 ) ∈ C et que ∂y (x0 , y0 ) 6= 0.
Le théorème des fonctions implicites assure alors l’existence d’intervalles ouverts I et J tels
que x0 ∈ I, y0 ∈ J et d’une fonction f : I → J de classe C 1 telle que pour tout (x, y) ∈ I × J,
(x, y) ∈ C ⇐⇒ y = f (x).
Autrement dit, localement, l’ensemble de niveau 0 de g est le graphe d’une fonction f et
donc un arc paramétré. De plus comme g(x, f (x)) = 0 pour tout x ∈ I, on en déduit par la
formule de dérivation des fonctions composées que
 
∂g ∂g 1
(x, f (x)) + f 0 (x) (x, f (x)) = ∇g(x, f (x)) · = 0, pour tout x ∈ I.
∂x ∂y f 0 (x)

Comme le vecteur (1, f 0 (x))T est tangent à C en (x, f (x)), on en déduit que ∇g(x, f (x)) est
un vecteur orthogonal à C au point (x, f (x)).

4.3 Surfaces paramétrées


La définition des surfaces paramétrées dans l’espace R3 s’inspire de celle des courbes paramétrées,
à la différence notable qu’elles ne sont pas paramétrées par des intervalles, mais pas des sous-
ensembles de R2 . On rappelle que le produit vectoriel de deux vecteurs x et y dans R3 est donné
par  
x2 y3 − x3 y2
x ∧ y = x3 y1 − x1 y3  .
x1 y2 − x2 y1
Quand x et y sont linéairement indépendants, le vecteur x ∧ y est non nul et orthogonal à x et y,
i.e. x · (x ∧ y) = y · (x ∧ y) = 0.
Définition 4.3.1. Une surface orientée de classe C 1 est définie par la donnée d’un couple (D, Φ),
où D est un fermé de R2 et (s, t) ∈ R2 7→ Φ(s, t) = (x(s, t), y(s, t), z(s, t)) est une fonction de classe
C 1 telle que Φ|D est injective, et pour tout (s, t) ∈ D, les vecteurs
∂Φ ∂Φ
(s, t), (s, t)
∂s ∂t
sont linéairement indépendants dans R3 . On note
Σ := {Φ(s, t) ∈ R3 : (s, t) ∈ D} = Φ(D).
On dit que Φ est une paramétrisation de Σ.
Pour tout (s, t) ∈ D, les vecteurs ∂Φ ∂Φ
∂s (s, t) et ∂t (s, t) sont tangents à la surface Σ au point Φ(s, t).
Par ailleurs, comme ils sont linéairement indépendants, ils sont non nuls et donc le vecteur
∂Φ ∂Φ
(s, t) ∧ (s, t)
∂s ∂t
est également non nul et est orthogonal à la surface Σ en Φ(s, t). On note
∂Φ ∂Φ
∂s (s, t) ∧ ∂t (s, t)
N (s, t) := ∂Φ ∂Φ
∂s (s, t) ∧ ∂t (s, t)
4.3. SURFACES PARAMÉTRÉES 43

le vecteur normal unitaire. Comme Φ est de classe C 1 , ce vecteur dépend continûment de (s, t).
Nous dirons que la surface Σ est orientée suivant le vecteur N .
On appelle plan tangent en (x0 , y0 , z0 ) := F (s0 , t0 ) le plan affine passant par ce point et parallèle
au sous-espace vectoriel engendré par les vecteurs
∂Φ ∂Φ
(s0 , t0 ), (s0 , t0 ).
∂s ∂t
Il est donc orthogonal au vecteur N au point (x0 , y0 , z0 ).
Proposition 4.3.2. Soit (D, Φ) une surface orientée de classe C 1 . Soit (s0 , t0 ) ∈ D et (x0 , y0 , z0 ) =
Φ(s0 , t0 ) ∈ Σ. On note N0 := N (s0 , t0 ) le vecteur unitaire orthogonal Σ en (x0 , y0 , z0 ). Alors le
plan tangent à Σ en (x0 , y0 , z0 ) admet comme équation

(x − x0 , y − y0 , z − z0 ) · N0 = 0.

Remarque 4.3.3. – Tout comme dans le cas des courbes, l’hypothèse d’injectivité empèche la
surface de se croiser.
– Quand les vecteurs ∂Φ ∂Φ
∂s (s, t) et ∂t (s, t) sont liés, alors leur produit vectoriel est nul et la
normale n’est pas définie.
– C’est le vecteur normal N qui précise l’orientation de Σ. Pour changer l’orientation, il suffit de
changer N en −N et donc de définir un nouveau paramétrage. Par exemple, on peut permuter
les variables s et t, de sorte que la surface est paramétrée par (t, s) 7→ Φ(s, t) en sens inverse.
Tout comme dans le cas des courbes, la paramétrisation d’une surface orientée n’est pas unique.
Proposition 4.3.4. Soient (D1 , Φ1 ) une surface orientée de classe C 1 et ϕ : R2 → R2 un C 1 -
difféomorphisme tel que ϕ(D2 ) = D1 et Jϕ (s, t) > 0 pour tout (s, t) ∈ D2 . On définit la fonction
Φ2 : R2 → R3 par Φ2 := Φ1 ◦ ϕ. Alors (D2 , Φ2 ) définit la même surface orientée que (D1 , Φ1 ) avec
la même orientation.
Démonstration. Si Φ2 = Φ1 ◦ ϕ : R2 → R3 , alors Φ2 est de classe C 1 et Φ2 |D2 est injective. De plus
la formule de dérivation des fonctions composées montre que pour tout (s, t) ∈ D2 ,

∂Φ2 ∂Φ1 ∂ϕ1 ∂Φ1 ∂ϕ2
(s, t) = (ϕ(s, t)) (s, t) + (ϕ(s, t)) (s, t),


∂s ∂u ∂s ∂v ∂s

(4.3.1)
∂Φ ∂Φ1 ∂ϕ1 ∂Φ1 ∂ϕ2
 2 (s, t) =

 (ϕ(s, t)) (s, t) + (ϕ(s, t)) (s, t).
∂t ∂u ∂t ∂v ∂t
Soient λ et µ ∈ R tels que
∂Φ2 ∂Φ2
λ (s, t) + µ (s, t) = 0,
∂s ∂t
alors, on en déduit que
   
∂ϕ1 ∂ϕ1 ∂Φ1 ∂ϕ2 ∂ϕ2 ∂Φ1
λ (s, t) + µ (s, t) (ϕ(s, t)) + λ (s, t) + µ (s, t) (ϕ(s, t)) = 0,
∂s ∂t ∂u ∂s ∂t ∂v
∂Φ1 ∂Φ2
ce qui implique, comme ∂u (ϕ(s, t)) et ∂v (ϕ(s, t)) sont linéairement indépendants, que

∂ϕ1 ∂ϕ1 ∂ϕ2 ∂ϕ2


λ (s, t) + µ (s, t) = λ (s, t) + µ (s, t) = 0.
∂s ∂t ∂s ∂t
Par suite, comme Jϕ (s, t) > 0, alors les vecteurs colonnes de la matrice jacobienne de ϕ sont
linéairement indépendants, ce qui montre que λ = µ = 0, autrement dit que ∂Φ ∂Φ2
∂s (s, t) et ∂t (s, t)
2
44 CHAPITRE 4. COURBES ET SURFACES PARAMÉTRÉES

sont linéairement indépendants pour tout (s, t) ∈ D2 . On a donc montré que (D2 , Φ2 ) définit
la même surface orientée que (D1 , Φ1 ). Pour montrer que l’orientation est préservée, pour tout
(s, t) ∈ D2 , on calcule à l’aide de (4.3.1)
 
∂Φ2 ∂Φ2 ∂Φ1 ∂Φ1
(s, t) ∧ (s, t) = Jϕ (s, t) (ϕ(s, t)) ∧ (ϕ(s, t)) ,
∂s ∂t ∂u ∂v

et donc, comme Jϕ (s, t) > 0, on en déduit que N2 (s, t) = N1 (ϕ(s, t)).

Exemple 4.3.5. 1. La sphère centrée à l’origine et de rayon R représentée par l’équation


cartésienne x2 + y 2 + z 2 = R2 est une surface orientée de classe C 1 dont la paramétrisation
est donnée par  
R cos φ cos θ
(θ, φ) ∈ [0, 2π] × [−π/2, π/2] 7→  R cos φ sin θ  .
R sin φ

2. Le cylindre centré à l’origine, d’axe vertical et de rayon R, représenté par l’équation cartésienne
x2 + y 2 = R2 est une surface orientée de classe C 1 dont la paramétrisation est donnée par
 
R cos θ
(θ, z) ∈ [0, 2π] × R 7→  R sin θ  .
z

Remarque 4.3.6. 1. Le cas des graphes : si f : R2 → R est une fonction de classe C 1 , on


définit  
s
Φ(s, t) :=  t  , pour tout (s, t) ∈ R2 .
f (s, t)
Alors les vecteurs
   
1 0
∂Φ ∂Φ
(s, t) =  0  , (s, t) =  1 
∂s ∂f ∂t ∂f
∂s (s, t) ∂t (s, t)

sont linéairement indépendants et le vecteur normal est donné par


 ∂f 
− ∂s (s, t)
1  ∂f 
N (s, t) = q − (s, t) ,
∂t
2 2
1 + ∂f + ∂f
   
∂s (s, t) ∂s (s, t) 1

ce qui montre que le graphe de f est une surface orientée de classe C 1 .


2. Le cas des ensembles de niveau : Soit g : R3 → R une fonction de classe C 1 . On définit

S := {(x, y, z) ∈ R3 : g(x, y, z) = 0}

l’ensemble de niveau 0 de la fonction g. On suppose que (x0 , y0 , z0 ) ∈ S et que ∂g


∂z (x0 , y0 , z0 ) 6=
0. Le théorème des fonctions implicites assure alors l’existence d’ouverts U ⊂ R2 et V ⊂ R
tels que (x0 , y0 ) ∈ U , z0 ∈ V et d’une fonction f : U → V de classe C 1 telle que pour tout
(x, y, z) ∈ U × V ,
(x, y, z) ∈ S ⇐⇒ z = f (x, y).
4.3. SURFACES PARAMÉTRÉES 45

Autrement dit, localement, l’ensemble de niveau 0 de g est le graphe d’une fonction f et donc
une surface orientée de classe C 1 . De plus comme g(x, y, f (x, y)) = 0 pour tout (x, y) ∈ U ,
on en déduit par la formule de dérivation des fonctions composées que pour tout (x, y) ∈ U ,
 
1
∂g ∂g ∂f
(x, y, f (x, y)) + (x, y, f (x, y)) (x, y) = ∇g(x, y, f (x, y)) ·  0  = 0
∂x ∂z ∂x ∂f
∂x (x, y)

et
 
0
∂g ∂g ∂f
(x, y, f (x, y)) + (x, y, f (x, y)) (x, y) = ∇g(x, y, f (x, y)) ·  1  = 0.
∂y ∂z ∂y ∂f
∂y (x, y)

On en déduit que ∇g(x, y, f (x, y)) est un vecteur orthogonal à S au point (x, y, f (x, y)).
46 CHAPITRE 4. COURBES ET SURFACES PARAMÉTRÉES
Chapitre 5

Equations aux dérivées partielles

De nombreux phénomènes mécaniques, physiques, biologiques ou économiques se modélisent


à l’aide d’équations dont l’inconnue est une fonction de plusieurs variables (on peut penser à
la variable temporelle t et à la variable d’espace x) qui fait intervenir les dérivées partielles de
la fonction. De telles équations s’appellent équations aux dérivées partielles. Dans ce chapitre,
nous présentons quelques exemples d’équations aux dérivées partielles ainsi que des méthodes de
résolution dans des cas très particuliers.

5.1 Equations elliptiques


Le prototype des équations elliptiques est l’équation de Laplace. Etant donnée une fonction
f : Rn → R, on cherche une fonction u : Rn → R qui satisfait

− ∆u(x) = f (x), pour tout x ∈ Rn . (5.1.1)

En électrostatique, f désigne la densité de charge électrique et u est le potentiel électrique. Quand


f = 0, les solutions de l’équation ∆u(x) = 0 pour tout x ∈ Rn sont appelées fonctions harmoniques.
En dimension n = 1, les fonctions harmoniques sont tout simplement les solutions de l’équation
différentielle u00 (x) = 0 pour tout x ∈ R, et il est immédiat de voir que toutes les solutions sont des
fonctions affines de la forme u(x) = ax + b pour tout x ∈ R, où a et b ∈ R. L’ensemble des solutions
forme donc un espace vectoriel de dimension 2. En revanche, la structure des fonctions harmoniques
se complexifie considérablement quand n ≥ 2. Par exemple pour n = 2, si l’on identifie R2 avec
l’ensemble des nombres complexes, on peut montrer que les parties réelles et imaginaires de toute
fonction holomorphe (i.e. dérivable au sens des nombres complexes) sont harmoniques.

5.2 Equations paraboliques


L’équation de la chaleur est un exemple typique d’équation parabolique. Etant donnée une
fonction u0 : Rn → R, on cherche u : Rn × [0, +∞[→ R telle que

 ∂u
(x, t) − ∆u(x, t) = 0, pour tout (x, t) ∈ Rn ×]0, +∞[,
∂t
u(x, 0) = u (x),
0 pour tout x ∈ Rn .

47
48 CHAPITRE 5. EQUATIONS AUX DÉRIVÉES PARTIELLES

L’inconnue u(x, t) représente la température mesurée à la position x ∈ Rn et au temps t > 0. En


dimension n = 1 d’espace, on peut montrer que si u0 est une fonction de classe C 2 sur R telle que

sup {|u0 (x)| + |u00 (x)|} < +∞,


x∈R

alors la solution est donnée pour tout (x, t) ∈ R × [0, +∞[ par la formule
Z +∞
1 y2
u(x, t) = √ u0 (x − y)e− 4t dy.
4πt −∞

y2
Remarquons que l’intégrale impropre converge puisque u0 est bornée
√ sur R et y 7→ e− 4t est
intégrable sur R. En effectuant le changement de variable z = y/ 4t dans l’intégrale précédente,
il vient que
1
Z +∞ √ 2
u(x, t) = √ u0 (x − 2z t)e−z dz,
π −∞
+∞ 2
ce qui montre que u(x, 0) = √1π −∞ e−z dz u0 (x) = u0 (x). Par ailleurs, en dérivant (formelle-
R 

ment) sous le signe somme, on montre que

∂2u 1
Z +∞ √ 2

2
(x, t) = √ u000 (x − 2z t)e−z dz,
∂x π −∞

et
∂u 1
Z +∞ √ 2
(x, t) = − √ u00 (x − 2z t)ze−z dz.
∂t πt −∞

En intégrant par parties (les termes de bord s’annulent car u00 est bornée sur R et l’exponentielle
s’annule à l’infini), on obtient que

∂u 1
Z +∞ √ 2 ∂2u
(x, t) = √ u000 (x − 2z t)e−z dz = (x, t),
∂t π −∞ ∂x2

ce qui montre que u est une solution de l’équation de la chaleur.

5.3 Equations hyperboliques


5.3.1 Equation de transport
Soit a ∈ Rn \ {0} et u0 : Rn → R une fonction de classe C 1 donnée. L’équation de transport
consiste à chercher une fonction u : Rn × [0, +∞[ → R telle que

 ∂u
(x, t) − a · ∇u(x, t) = 0, pour tout (x, t) ∈ Rn ×]0, +∞[,
∂t
u(x, 0) = u (x), pour tout x ∈ Rn .
0

Pour résoudre cette équation, on utilise la méthode des caractéristiques que nous présentons pour
n = 1. Dans ce cas, a ∈ R \ {0} et l’équation de transport devient

∂u ∂u
(x, t) − a (x, t) = 0, pour tout (x, t) ∈ R×]0, +∞[.
∂t ∂x
5.3. EQUATIONS HYPERBOLIQUES 49

Pour tout (x, t) ∈ R2 , on pose  


x − at
Φ(x, t) = .
x + at
On vérifie aisément que Φ est une application linéaire dont le déterminant de la matrice est donné
par 2a 6= 0. Par conséquent, Φ est inversible et
   z+y 
y
= Φ(x, t) ⇐⇒ Φ−1 (y, z) = z−y 2 .
z 2a

Par conséquent, Φ réalise un C 1 -difféomorphisme de R2 dans R2 . Posons v(y, z) = u ◦ Φ−1 (y, z)


pour tout (y, z) ∈ R2 . La formule de dérivation des fonctions composées montre que

∂Φ−1
1  
∂v −1 −1 1 ∂u ∂u
(y, z) = ∇u(Φ (y, z)) · (y, z) = ∇u(Φ (y, z)) · 1 =2 a + (Φ−1 (y, z)).
∂z ∂z 2a 2a ∂x ∂t

Ainsi, u est solution de l’équation de transport si et seulement ∂v ∂z (y, z) = 0. Autrement dit, si


et seulement s’il existe une fonction f : R → R telle que v(y, z) = f (y) pour tout (y, z) ∈ R2 .
Par conséquent, les solutions de l’équation de transport sont les fonctions u de la forme u(x, t) =
v(Φ(x, t)) = f (x − at) pour tout (x, t) ∈ R × [0, +∞[. Pour déterminer la fonction f , on utilise la
condition initiale qui assure que pour tout x ∈ R, on a que u(x, 0) = u0 (x) et donc f (x) = u0 (x).
Ceci montre que la solution de l’équation de transport est donnée par

u(x, t) = u0 (x − at), pour tout (x, t) ∈ R × [0, +∞[.

5.3.2 Equation des ondes


L’équation des ondes régit la propagation d’une onde électromagnétique. Etant donné un réel
a 6= 0 et des fonctions u0 : Rn → R continue et u1 : Rn → R de classe C 1 , elle s’écrit
 2
∂ u 2 n
 ∂t2 (x, t) − a ∆u(x, t) = 0, pour tout (x, t) ∈ R ×]0, +∞[,



u(x, 0) = u0 (x), pour tout x ∈ Rn ,
 ∂u (x, 0) = u (x),


pour tout x ∈ Rn .

1
∂t
Tout comme l’équation de transport, elle peut se résoudre grâce à la méthode des caractéristiques.
De nouveau, en dimension n = 1, l’équation des ondes devient

∂2u 2
2∂ u
(x, t) − a (x, t) = 0, pour tout (x, t) ∈ R×]0, +∞[.
∂t2 ∂x2
Avec les mêmes notations qu’à la section précédente, on calcule

∂2v
   1   2 2

1 ∂u 1 ∂u −1 1 ∂ u 2∂ u
(y, z) = ∇ + (Φ (y, z)) · 2
1 = 2 (x, t) − a (Φ−1 (y, z)).
∂y∂z 2 ∂x 2a ∂t − 2a 4a ∂t2 ∂x2
2
∂ v
Ainsi, u est solution de l’équation des ondes si et seulement ∂y∂z (y, z) = 0. Il existe donc une
∂v
fonction g : R → R telle que ∂z (y, z) = g(z). En intégrant cette nouvelle équation différentielle, on
trouve que v(y, z) = F (y) + G(z), où F et G : R → R et donc

u(x, t) = F (x − at) + G(x + at), pour tout (x, t) ∈ R × [0, +∞[.


50 CHAPITRE 5. EQUATIONS AUX DÉRIVÉES PARTIELLES

De nouveau, on utilise les conditions initiales pour déterminer F et G. En effet, pour tout x ∈ R,
∂u
u0 (x) = u(x, 0) = F (x) + G(x), u1 (x) = (x, 0) = −aF 0 (x) + aG0 (x).
∂t
On peut résoudre facilement ce système différentiel en dérivant la première équation, en la multi-
pliant par a, puis en l’additionnant et la soustrayant à la seconde équation. Il vient alors que

au00 (x) + u1 (x) au00 (x) − u1 (x)


G0 (x) = , F 0 (x) = ,
2a 2a
soit Z x Z x
1 1 1 1
G(x) = u0 (x) + u1 (y) dy + β, F (x) = u0 (x) − u1 (y) dy + α,
2 2a 0 2 2a 0

où α et β ∈ R sont des constantes. Par conséquent, pour tout (x, t) ∈ R × [0, +∞[
Z x+at Z x−at
1 1 1 1
u(x, t) = u0 (x + at) + u1 (y) dy + u0 (x − at) − u1 (y) dy + c,
2 2a 0 2 2a 0

où c = α + β. En utilisant de nouveau la condition initiale u(x, 0) = u0 (x), on trouve que c = 0 et


donc que la solution de l’équation des ondes est donnée par la fonction
Z x+at Z x−at
1 1 1 1
u(x, t) = u0 (x + at) + u1 (y) dy + u0 (x − at) − u1 (y) dy
2 2a 0 2 2a 0

pour tout (x, t) ∈ R × [0, +∞[.


Chapitre 6

Intégrales multiples

6.1 Pavés, ensembles pavables et quarrables


Nous introduisons tout d’abord une notion d’ensemble élémentaire dans Rn .

Définition 6.1.1. On dit qu’une partie P de Rn est un pavé s’il existe a = (a1 , . . . , an ), b =
(b1 , . . . , bn ) ∈ Rn tel que
n
Y
P := [ai , bi ] = {x ∈ Rn : ai ≤ xi ≤ bi pour tout 1 ≤ i ≤ n}.
i=1

Remarque 6.1.2. 1. Un pavé est un ensemble fermé et borné, donc compact.


2. En général, si P1 et P2 sont deux pavés, P1 ∪ P2 et P1 \ P2 ne sont pas de pavés (faire un
dessin pour s’enQnconvaincre). Par contreQn l’intersection de deux pavés en est toujours un. En
effet, si P1 := i=1 [a1i , b1i ] et P2 := i=1 [a2i , b2i ] sont deux pavés, alors
n
Y
P1 ∩ P2 = [max(a1i , a2i ), min(b1i , b2i )].
i=1

Nous définissons à présent la mesure d’un pavé qui correspond intuitivement à la longueur d’un
intervalle quand n = 1, à l’aire d’un rectangle quand n = 2 et au volume d’un parallélépidède
rectangle quand n = 3.
Qn
Définition 6.1.3. Soit P = i=1 [ai , bi ] un pavé de Rn . On appelle mesure de P le réel
n
Y
m(P ) := (bi − ai ).
i=1

On pose, par convention, m(∅) = 0.

La seule notion de pavé est insuffisante pour décrire une classe raisonnable de sous-ensembles
de Rn dont on souhaite définir la notion de mesure car celle-ci n’est pas stable par les opérations
ensemblistes élémentaires (voir la Remarque 6.1.2–2). Une classe plus satisfaisante est celle formée
de toutes les unions finies de pavés.

51
52 CHAPITRE 6. INTÉGRALES MULTIPLES

Définition 6.1.4. Une partie A de Rn est dite pavable s’il existe des pavés P1 , . . . , PN d’intérieurs
deux à deux disjoints, i.e., P̊i ∩ P̊j = ∅ pour tout i 6= j, et tels que
N
[
A= Pi .
i=1

On définit alors la mesure de A par


N
X
m(A) := m(Pi ).
i=1

Remarque 6.1.5. La représentation d’un ensemble pavable en une union finie de pavés d’intérieurs
deux à deux disjoints n’est pas unique. On peut alors démontrer que la définition de la mesure
d’un ensemble pavable est indépendante de la représentation.

Comme le montre le résultat suivant, les ensembles pavables sont stables par les opérations
ensemblistes usuelles, ce qui les rend beaucoup plus flexibles à manipuler que les pavés.

Proposition 6.1.6. Soient A et B deux ensembles pavables de Rn . Alors A ∪ B, A ∩ B et A \ B̊


sont pavables.

Démonstration. Soient A et B deux ensembles pavables de Rn . Alors il existe des pavés P1 , . . . , PN


et Q1 , . . . , QM tels que P̊i ∩ P̊i0 = ∅ si i 6= i0 , Q̊j ∩ Q̊j 0 = ∅ si j 6= j 0 et
N
[ M
[
A= Pi , B= Qj .
i=1 j=1

Par conséquent,
!   !  
N
[ M
[ N
[ M
[ N [
[ M
A∪B = Pi ∪ Qj  , A∩B = Pi ∩ Qj  = Pi ∩ Qj
i=1 j=1 i=1 j=1 i=1 j=1

où Pi ∩ Qj est un pavé de Rn , ce qui montre que A ∪ B et A ∩ B sont pavables. Par ailleurs,
N \
[ M
A \ B̊ = Pi \ Q̊j
i=1 j=1

et comme Pi et Qj sont des pavés, alors Pi \ Q̊j est pavable, ce qui montre que A\ B̊ est pavable.

Intuitivement, une partie de Rn a une mesure que l’on peut “calculer” si l’on peut l’approcher
par la mesure d’une union de pavés. La définition suivante clarifie cette approximation.

Définition 6.1.7. Soit D un ensemble compact de Rn tel que D̊ 6= ∅. On note

m+ (D) := inf{m(B) : B ⊃ A avec B pavable},



m (D) := sup{m(A) : A ⊂ D avec A pavable}.

On dit que D est quarrable si m+ (D) = m− (D) ∈ R. La valeur commune est notée |D| et est
appelée mesure de D.
6.2. DÉFINITION ET PROPRIÉTÉS DE L’INTÉGRALE MULTIPLE 53

Remarque 6.1.8. Un ensemble pavable est quarrable et on a |D| = m(D). Autrement dit, les
deux notions de mesures introduites précédemment coı̈ncident pour les ensembles pavables.
Exemple 6.1.9. Soient f et g : [a, b] → [0, +∞[ deux fonctions continues telles que f ≤ g sur
[a, b] et
D := {(x, y) ∈ R2 : a ≤ x ≤ b, f (x) ≤ y ≤ g(x)}.
Rb
Alors D est quarrable et par définition de l’intégrale de Riemann |D| = a [g(x) − f (x)] dx.
Nous montrons ci-dessous que tout ensemble quarrable a une frontière de mesure arbitrairement
petite. Il s’agit en fait d’une caractérisation, néanmoins comme dans la suite nous n’aurons besoin
que de la condition nécessaire, nous n’énonçons et ne démontrons que cette implication.
Proposition 6.1.10. Soit D ⊂ Rn un ensemble quarrable. S Alors, pour tout ε > 0 il existe des
N
pavés P1 , . . . , PN tels que P̊i ∩ P̊j = ∅ pour tout i 6= j, ∂D ⊂ i=1 Pi et
N
X
m(Pi ) ≤ ε.
i=1

Démonstration. Comme D est quarrable, alors m+ (D) = m− (D) ∈ R. Par conséquent, pour tout
ε > 0 il existe deux ensemble pavables A et B tels que A ⊂ D ⊂ B et m(B) − m(A) ≤ ε. D’après
la Proposition 6.1.6, B \ Å est un ensemble pavable et ∂D ⊂ B \ Å. Soient P1 , . . . , PN des pavés
SN SN
tels que P̊i ∩ P̊j = ∅ pour tout i 6= j et B \ Å = i=1 Pi . Comme B = A ∪ (B \ Å) = A ∪ i=1 Pi ,
on a que
X N
m(B) = m(A) + m(Pi )
i=1

ce qui montre effectivement que


N
X
m(Pi ) ≤ ε,
i=1

comme annoncé.

6.2 Définition et propriétés de l’intégrale multiple


Définition 6.2.1. Soit U ⊂ Rn un ouvert, f : U → R une fonction et D ⊂ U un ensemble
quarrable. On définit
(N N
)
X  [

I (f, D) = sup inf f m(Pi ) : P1 , . . . , PN pavés avec P̊i ∩ P̊j = ∅ si i 6= j et Pi ⊂ D
Pi
i=1 i=1
( N  N
)
X  [
I + (f, D) = inf sup f m(Pi ) : P1 , . . . , PN pavés avec P̊i ∩ P̊j = ∅ si i 6= j et Pi ⊃ D .
i=1 Pi i=1

On dit que f est Riemann-intégrable sur D si

I + (f, D) = I − (f, D) ∈ R.

Dans ce cas, la valeur commune est appelée intégrale (de Riemann) de f sur D et est notée
Z Z
··· f (x1 , . . . , xn ) dx1 · · · dxn
D
54 CHAPITRE 6. INTÉGRALES MULTIPLES

ou plus simplement Z
f (x) dx.
D

Si n = 2, on note aussi ZZ
f (x, y) dx dy
D

et si n = 3, ZZZ
f (x, y, z) dx dy dz.
D

Nous énonçons tout d’abord des premières propriétés élémentaires qui découlent directement de
la définition.

Propriétés 6.2.2. i) Si f (x) = c pour tout x ∈ Rn est une fonction constante, alors les
Définitions 6.1.7 et 6.2.1 de la mesure et de l’intégrale montrent que
Z
c dx = c|D|.
D

ii) D’après la définition, il est clair que

I + (−f, D) = −I − (f, D), I − (−f, D) = −I + (f, D)

de sorte que si f est Riemann-intégrable sur D, alors


Z Z
(−f (x)) dx = − f (x) dx.
D D

iii) Monotonie. Si f et g : U → R sont des fonctions Riemann-intégrables sur D telles que


f (x) ≤ g(x) pour tout x ∈ U , on obtient immédiatement que
Z Z
f (x) dx ≤ g(x) dx.
D D

Vérifier l’intégrabilité au sens de Riemann d’une fonction à partir de la définition seule est
une chose difficile en général. Le résultat suivant montre que les fonctions continues sont toujours
Riemann-intégrables.

Théorème 6.2.3. Soit U ⊂ Rn un ouvert, f : U → R une fonction continue et D ⊂ U un


ensemble quarrable. Alors f est Riemann-intégrable sur D. De plus, si, pour tout δ > 0, {Piδ }i∈N
désigne une famille de pavés de Rn tels que
[
Rn = Piδ , diam(Piδ ) ≤ δ pour tout i ∈ N, P̊iδ ∩ P̊jδ = ∅ pour tout i 6= j,
i∈N

et
Iδ := i ∈ N tels que Piδ ⊂ D Jδ := i ∈ N tels que Piδ ∩ D 6= ∅ ,
 
et
alors Z X  X 
f (x) dx = lim inf f m(Piδ ) = lim sup f m(Piδ ).
D δ→0 Piδ δ→0 Piδ
i∈Iδ i∈Jδ
6.2. DÉFINITION ET PROPRIÉTÉS DE L’INTÉGRALE MULTIPLE 55

Démonstration. Etape 1 : La fonction f étant continue sur D compact, f est bornée sur D et
donc il existe une constante C > 0 telle que |f (x)| ≤ C pour tout x ∈ D. On en déduit alors de la
Remarque 6.2.2 que
−C|D| ≤ I ± (f, D) ≤ C|D|
d’où
I ± (f, D) ∈ R.

Etape 2 : Comme f est continue et D est compact, f est uniformément continue sur D. Par
conséquent, pour tout ε > 0 il existe un δ0 > 0 tel que pour tout x et y ∈ D, si kx − yk < δ0 alors
|f (x) − f (y)| < ε.
Pour tout δ < δ0 , soit {Piδ }i∈N une décomposition de Rn comme dans l’énoncé du théorème.
Alors les ensembles pavables
[ [
Aδ := Piδ et Bδ := Piδ
i∈Iδ i∈Jδ

satisfont les propriétés Aδ ⊂ D ⊂ Bδ ⊂ U pour δ assez petit et ∂D ⊂ Bδ \ Åδ = i∈Jδ \Iδ Piδ .
S

La fonction f étant continue sur Piδ qui est compact, elle atteint ses bornes : il existe donc xδi
et yiδ ∈ Piδ tels que
f (xδi ) = inf f = mδi , f (yiδ ) = sup f = Miδ .
xPiδ Piδ

Par conséquent, comme Miδ − mδi = f (yiδ ) − f (xδi ) < ε pour tout i ∈ Iδ et Miδ ≤ C pour tout
i ∈ Jδ \ Iδ , il vient alors que
X X X X
0 ≤ I + (f, D) − I − (f, D) ≤ Miδ |Piδ | − mδi |Piδ | ≤ C |Piδ | + ε |Piδ |. (6.2.1)
i∈Jδ i∈Iδ i∈Jδ \Iδ i∈Iδ

Piδ , on en déduit
S
D’après la Proposition 6.1.10, comme D est quarrable et ∂D ⊂ Bδ \ Åδ = i∈Jδ \Iδ
que X
lim |Piδ | = 0.
δ→0
i∈Jδ \Iδ

Par ailleurs, la Définition 6.1.7 de la mesure d’un ensemble pavable montre que
X
|Piδ | ≤ |D|.
i∈Iδ

En regroupant les deux informations précédent, on obtient par passage à la limite quand δ → 0
que
I + (f, D) − I − (f, D) ≤ ε|D|,
soit I + (f, D) = I − (f, D) ∈ R puisque ε > 0 est arbitraire, ce qui montre que f est Riemann-
intégrable sur D. De plus, d’après (6.2.1), on a également
X X X X
I + (f, D) − mδi |Piδ | ≤ C |Piδ | + ε|D|, Miδ |Piδ | − I − (f, D) ≤ C |Piδ | + ε|D|
i∈Iδ i∈Jδ \Iδ i∈Jδ i∈Jδ \Iδ

soit par passage à la limite d’abord quand δ → 0 puis ε → 0,


Z X X
f (x) dx = lim mδi |Piδ | = lim Miδ |Piδ |,
D δ→0 δ→0
i∈Iδ i∈Jδ

ce qui termine la preuve du théorème.


56 CHAPITRE 6. INTÉGRALES MULTIPLES

Nous établissons maintenant un certain nombre de propriétés utiles en pratique.


Propriétés 6.2.4. 1. Additivité. Soient U ⊂ Rn un ouvert, D1 et D2 ⊂ U deux ensembles
quarrables tels que D̊1 ∩ D̊2 = ∅, et f : U → R une fonction Riemann-intégrable sur D1 et
D2 . Alors f est Riemann-intégrable sur D1 ∪ D2 et
Z Z Z
f (x) dx = f (x) dx + f (x) dx.
D1 ∪D2 D1 D2

2. Linéarité. Soient U ⊂ Rn un ouvert, D ⊂ U un ensemble quarrable, f et g : U → R des


fonctions Riemann-intégrables sur D et λ ∈ R. Alors f + λg est Riemann-intégrable sur D et
Z Z Z
[f (x) + λg(x)] dx = f (x) dx + λ g(x) dx.
D D D

3. Inégalité triangulaire. Soient U ⊂ Rn un ouvert, D ⊂ U un ensemble quarrable et f : U → R


une fonction Riemann-intégrable sur D telle que |f | est aussi Riemann-intégrable sur D.
Alors, Z Z
f (x) dx ≤ |f (x)| dx.
D D
SMk SN k
Démonstration. 1. Pour k = 1, 2, soient Ak = i=1 Pik et Bk = i=1 Qkj des ensembles pavables
tels que Ak ⊂ Dk ⊂ Bk ⊂ U et

P̊ik ∩ P̊jk = Q̊ki ∩ Q̊kj = ∅ si i 6= j.


SM1 1 SM2 2
Alors A1 ∪ A2 = i=1 Pi ∪ j=1 Pj est pavable et A1 ∪ A2 ⊂ D2 ∪ D2 . Comme A1 ∩ A2 = ∅,
1 2
on a que P̊i ∩ P̊j = ∅ pour tout 1 ≤ i ≤ M1 et 1 ≤ j ≤ M2 de sorte que
M1 
X  M2 
X 
I − (f, D1 ∪ D2 ) ≥ inf1 f m(Pi1 ) + inf2 f m(Pj2 ),
Pi Pj
i=1 j=1

puis par passage au sup en {Pi1 }1≤i≤M1 et {Pj2 }1≤j≤M2 , il vient


Z Z
I − (f, D1 ∪ D2 ) ≥ f (x) dx + f (x) dx.
D1 D2
SN 1 SN2
L’ensemble B1 ∪ B2 = i=1 Q1i ∪ j=1 Q2j est pavable et B1 ∪ B2 ⊃ D1 ∪ D2 . Cependant
comme B1 ∩ B2 6= ∅, les cubes Q1i et Q2j ne sont pas forcément d’intérieurs deux à deux
disjoints. On écrit alors que
B1 ∪ B2 = (B1 \ B̊2 ) ∪ B2
SN 3 3
où B1 \ B̊2 = i=1 Qi est un ensemble quarrable avec Q̊3i ∩ Q̊3j = ∅ si i 6= j de sorte que,
maintenant Q̊3i ∩ Q̊2j = ∅ pour tout 1 ≤ i ≤ N3 et 1 ≤ j ≤ N2 . Par conséquent,
N3 
X  N2 
X 
I + (f, D1 ∪ D2 ) ≤ sup f m(Q3i ) + sup f m(Q2j )
i=1 Q3i j=1 Q2j

et comme, pour tout 1 ≤ i ≤ N3 il existe un 1 ≤ i0 ≤ N1 tel que Q3i ⊂ Q1i0 , on en déduit que
N1 
X  N2 
X 
+
I (f, D1 ∪ D2 ) ≤ sup f m(Q1i ) + sup f m(Q2j ).
i=1 Q1i j=1 Q2j
6.2. DÉFINITION ET PROPRIÉTÉS DE L’INTÉGRALE MULTIPLE 57

Par passage à l’inf en {Q1i }1≤i≤N1 et {Q2j }1≤j≤N2 , il vient


Z Z
I + (f, D1 ∪ D2 ) ≤ f (x) dx + f (x) dx.
D1 D2

On en déduit alors que f est Riemann-intégrable sur D1 ∪ D2 car


Z Z
I + (f, D1 ∪ D2 ) = I − (f, D1 ∪ D2 ) = f (x) dx + f (x) dx
D1 D2

et aussi que Z Z Z
f (x) dx = f (x) dx + f (x) dx.
D1 ∪D2 D1 D2

2. D’après
SNla Remarque 6.2.2,
SN2 il2 suffit donc de montrer la linéarité pour des λ > 0. Soient
B1 = i=1 1
Q1j et B2 = i=1 Qj des ensembles pavables tels que D ⊂ B1 ⊂ U et D ⊂ B2 ⊂ U
et
Q̊1i ∩ Q̊1j = Q̊2i ∩ Q̊2j = ∅ si i 6= j.
SN
Alors B1 ∩ B2 est toujours un ensemble pavable de la forme i=1 Qj avec Q̊i ∩ Q̊j = ∅ si
i 6= j. En particulier, pour tout 1 ≤ i ≤ N , il existe 1 ≤ i1 ≤ N1 et 1 ≤ i2 ≤ N2 tels que
Qi ⊂ Q1i1 et Qi ⊂ Q2i2 . Par conséquent,
N 
X  N1 
X  N2 
X 
I + (f + λg, D) ≤ sup(f + λg) m(Qj ) ≤ sup f m(Q1j ) + λ sup g m(Q2j )
j=1 Qj j=1 Q1j j=1 Q2j

et par passage à l’inf en {Q1i }1≤i≤N1 et {Q2i }1≤i≤N2 , il vient

I + (f + λg, D) ≤ I + (f, D) + λI + (g, D).

On montre de façon identique que

I − (f + λg, D) ≥ I − (f, D) + λI − (g, D).

La combinaison des deux inégalités précédentes et le fait que f et g sont toutes deux Riemann-
intégrables sur D montre que
Z Z
I + (f + λg, D) = I − (f + λg, D) = f (x) dx + λ g(x) dx
D D

et donc que f + λg est Riemann-intégrable sur D avec


Z Z Z
[f (x) + λg(x)] dx = f (x) dx + λ g(x) dx.
D D D

3. Comme −|f (x)| ≤ f (x) ≤ |f (x)| pour tout x ∈ U , d’après la monotonie et la linéarité de
l’intégrale de Riemann, on obtient que
Z Z Z
− |f (x)| dx ≤ f (x) dx ≤ |f (x)| dx,
D D D

ce qui montre que Z Z


f (x) dx ≤ |f (x)| dx.
D D
58 CHAPITRE 6. INTÉGRALES MULTIPLES

6.3 Théorème de Fubini


En dimension n = 1, le calcul d’intégrales est lié à la recherche d’une primitive de la fonction
que l’on cherche à intégrer. Le calcul d’intégrales multiples se heurte au fait qu’il n’y a pas de
notion de primitive en dimension n ≥ 2. Le(s) théorème(s) de Fubini permet(tent) de ramener le
calcul d’une intégrale multiple à celui de plusieurs intégrales simples, et donc d’utiliser les règles
classiques de calcul intégral.
Qn
Théorème 6.3.1 (Fubini sur un pavé). Soit P = i=1 [ai , bi ] un pavé de Rn et f : P → R une
fonction continue sur P . Alors
! ! !
Z Z b1
Z b2Z Z bn−1 bn
f (x) dx = ··· f (x1 , . . . , xn ) dxn dxn−1 · · · dx2 dx1
P a1 a2 an−1 an

et l’ordre d’intégration peut être arbitrairement permuté sans altérer le résultat.


Démonstration. Nous donnons une preuve de ce résultat dans le cas simplifié de la dimension
n = 2. On note P = [a, b] × [c, d]. Pour tout k ∈ N∗ et tout 0 ≤ i, j ≤ k, on pose

b−a d−c
ai := a + i , cj := c + j ,
k k
et pour tout 1 ≤ i, j ≤ k
Pij = [ai−1 , ai ] × [cj−1 , cj ],
Z cj Z cj
1 k
mij = inf f, Mij = sup f, µij = f (ai , y) dy = f (ai , y) dy.
Pij Pij cj − cj−1 cj−1 d − c cj−1
Alors
k k k
X (b − a)(d − c) X (b − a)(d − c) X (b − a)(d − c)
2
mij ≤ Sk := 2
µij ≤ Mij .
i,j=1
k i,j=1
k i,j=1
k2

Comme d’après le Théorème 6.2.3 f est Riemann-intégrable sur P , on en déduit que


k k
(b − a)(d − c) (b − a)(d − c)
X X ZZ
lim mij = lim Mij = f (x, y) dx dy,
k→+∞
i,j=1
k2 k→+∞
i,j=1
k2 P

ce qui implique que ZZ


Sk → f (x, y) dx dy.
P
Par ailleurs,
k k Z cj k d
b−aX b−a
X X Z
Sk = f (ai , y) dy = f (ai , y) dx.
i=1
k j=1 cj−1 i=1
k c

Pour tout x ∈ [a, b], posons


Z d
ϕ(x) := f (x, y) dy.
c

Notons que ϕ est bien définie car f étant continue sur P , alors pour tout x ∈ [a, b], la fonction
partielle y 7→ f (x, y) est continue sur [c, d] et donc intégrable sur [c, d]. Montrons maintenant que
6.3. THÉORÈME DE FUBINI 59

ϕ est continue sur [a, b]. Comme f est continue sur le compact P , elle est uniformément continue.
Par conséquent, pour tout ε > 0 il existe un δ > 0 tel que pour tout (x, y), (x0 , y 0 ) ∈ P avec
k(x, y) − (x0 , y 0 )k < δ, alors |f (x, y) − f (x0 , y 0 )| < ε. En particulier, pour tout y ∈ [c, d] et pour tout
x, x0 ∈ [a, b] avec |x − x0 | < δ, on a |f (x, y) − f (x0 , y)| < ε. En intégrant cette dernière inégalité
par rapport à y ∈ [c, d] et en appliquant l’inégalité triangulaire, on obtient que
Z d
0
|ϕ(x) − ϕ(x )| ≤ |f (x, y) − f (x0 , y)| dy ≤ ε(d − c),
c

ce qui montre que ϕ est continue sur [a, b]. Par définition de l’intégrale de Riemann en dimension
n = 1, il vient alors que
k Z b Z b Z d !
X b−a
Sk = ϕ(ai ) → ϕ(x) dx = f (x, y) dy dx,
i=1
k a a c

puis, par unicité de la limite, que


!
ZZ Z b Z d
f (x, y) dx dy = f (x, y) dy dx.
P a c

On montre de même que


!
ZZ Z d Z b
f (x, y) dx dy = f (x, y) dx dy,
P c a

ce qui conclut la preuve du théorème.


AVERTISSEMENT : Dans le calcul d’intégrales multiples, il sera essentiel d’écrire explicitement
les dx, dy, dz, dt, etc... En effet, contrairement aux intégrales simples en dimension n = 1, une
fonction f : Rn → R est susceptible d’être intégrée par rapport à plusieurs variables. L’omission
de la mention explicite de la variable d’intégration pourrait donc donner lieu à ambiguı̈té.
Une version plus générale du théorème de Fubini est donnée par le résultat suivant.
Théorème 6.3.2 (Fubini). Soit D ⊂ Rn un ensemble quarrable de la forme

D = {x = (x1 , . . . , xn−1 , xn )T ∈ Rn : x0 ∈ D0 , ϕ(x0 ) ≤ xn ≤ ψ(x0 )},


| {z }
x0

où D0 ⊂ Rn−1 est un ensemble quarrable et ϕ, ψ : D0 → R sont des fonctions continues telles que
ϕ(x0 ) ≤ ψ(x0 ) pour tout x0 ∈ D0 . Soit également f : D → R une fonction continue. Alors
!
Z Z Z ψ(x1 ,...,xn−1 )
f (x) dx = f (x1 , . . . , xn−1 , xn ) dxn dx1 · · · dxn−1 .
D D0 ϕ(x1 ,...,xn−1 )

Démonstration. De nouveau, nous montrons ce résultat en dimension n = 2 où D = {(x, y) ∈


R2 : a ≤ x ≤ b, ϕ(x) ≤ y ≤ ψ(x)}. L’idée consiste à approcher l’ensemble D par une union finie
de pavés. Pour ce faire, pour tout k ∈ N∗ , on subdivise [a, b] en k sous-intervalles de longueur
(b − a)/k. Pour tout 0 ≤ i ≤ k, on pose

b−a
ai = a + i ,
k
60 CHAPITRE 6. INTÉGRALES MULTIPLES

et on définit les fonctions constantes par morceaux ϕk , ψk : [a, b] → R par

ϕk (x) = sup ϕ, ψk (x) = inf ψ, pour tout x ∈ [ai , ai+1 [ si 0 ≤ i ≤ k − 1


[ai ,ai+1 ] [ai ,ai+1 ]

et ϕk (b) = ϕ(b) et ψk (b) = ψ(b).


Etape 1. Montrons que ϕk converge uniformément vers ϕ sur [a, b] et que ψk converge uni-
formément vers ψ sur [a, b]. La fonction ϕ étant continue sur le compact [a, b] elle est uniformément
continue. Pour tout ε > 0 il existe donc un δ > 0 tel que pour tout x et x0 ∈ [a, b], si |x − x0 | < δ
alors |ϕ(x) − ϕ(x0 )| < ε. Par ailleurs ϕ atteint ses bornes sur le compact [ai , ai+1 ] et donc en
particulier, il existe un ci ∈ [ai , ai+1 ] tel que

ϕ(ci ) = sup ϕ = ϕk (x) pour tout x ∈ [ai , ai+1 [.


[ai ,ai+1 ]

Soit k0 ∈ N (qui ne dépend que de δ et donc ε) tel que (b−a)/k0 < δ et k ≥ k0 . Pour tout x ∈ [a, b],
il existe un 0 ≤ i ≤ k − 1 tel que x ∈ [ai , ai+1 [ et donc |ci − x| ≤ ai+1 − ai = (b − a)/k < δ. Par
conséquent, |ϕ(x) − ϕk (x)| = |ϕ(x) − ϕ(ci )| < ε et par passage au sup en x ∈ [a, b], il vient que

sup |ϕ(x) − ϕk (x)| ≤ ε, pour tout k ≥ k0 ,


x∈[a,b]

ce qui montre bien que ϕk converge uniformément vers ϕ sur [a, b]. On démontre de même que ψk
converge uniformément vers ψ sur [a, b].
Etape 2. Notons

Dk = {(x, y) ∈ R2 : a ≤ x ≤ b, ϕk (x) ≤ y ≤ ψk (x)}.

Comme les fonctions ϕk et ψk sont constantes sur chaque sous-intervalle [ai , ai+1 [ de [a, b], on en
déduit que Dk est un ensemble pavable de la forme
k−1
[
Dk = [ai , ai+1 ] × [bi , bi+1 ],
i=0

où bi = sup[ai ,ai+1 ] ϕ et bi+1 = inf [ai ,ai+1 ] ψ. De plus, comme ϕ(x) ≤ ϕk (x) et ψk (x) ≤ ψ(x) pour
tout x ∈ [a, b], on en déduit que Dk ⊂ D. Par conséquent,
Z b Z b
|D \ Dk | = (ϕ(x) − ϕk (x)) dx + (ψk (x) − ψ(x)) dx
a a
≤ (b − a) sup |ϕ − ϕk | + (b − a) sup |ψ − ψk | → 0,
[a,b] [a,b]

d’après l’étape 1.
Etape 3. Par additivité de l’intégrale double, on a que
Z k−1
XZ
f (x, y) dx dy = f (x, y) dx dy.
Dk i=0 [ai ,ai+1 ]×[bi ,bi+1 ]

Par suite, le théorème de Fubini sur un pavé montre que


! !
Z Z ai+1 Z bi+1 Z ai+1 Z ψk (x)
f (x, y) dx dy = f (x, y) dy dx = f (x, y) dy dx
[ai ,ai+1 ]×[bi ,bi+1 ] ai bi ai ϕk (x)
6.3. THÉORÈME DE FUBINI 61

et donc
k−1
! !
Z XZ ai+1 Z ψk (x) Z b Z ψk (x)
f (x, y) dx dy = f (x, y) dy dx = f (x, y) dy dx. (6.3.1)
Dk i=0 ai ϕk (x) a ϕk (x)

Etape 4. Comme f est continue sur le compact D, il existe une constante M > 0 telle que
|f (x, y)| ≤ M pour tout (x, y) ∈ D. Par conséquent, d’après l’inégalité triangulaire, le fait que
Dk ⊂ D et l’étape 2, il vient
Z Z Z
f (x, y) dx dy − f (x, y) dx dy = f (x, y) dx dy
D Dk D\Dk
Z
≤ |f (x, y)| dx dy ≤ M |D \ Dk | → 0. (6.3.2)
D\Dk

De même, pour tout x ∈ [a, b], l’inégalité triangulaire montre que


Z ψ(x) Z ψk (x) Z ϕk (x) Z ψ(x)
f (x, y) dy − f (x, y) dy = f (x, y) dy + f (x, y) dy
ϕ(x) ϕk (x) ϕ(x) ψk (x)

≤ M sup |ϕ − ϕk | + M sup |ψ − ψk |,
[a,b] [a,b]

puis en intégrant par rapport à x ∈ [a, b], on obtient que


Z b Z ψ(x) ! Z b Z ψk (x) !
f (x, y) dy dx − f (x, y) dy
a ϕ(x) a ϕk (x)
Z b Z ψ(x) Z ψk (x)
≤ f (x, y) dy − f (x, y) dy dx
a ϕ(x) ϕk (x)

≤ M (b − a) sup |ϕ − ϕk | + M (b − a) sup |ψ − ψk | → 0, (6.3.3)


[a,b] [a,b]

d’après l’étape 1. Finalement, par passage à la limite dans (6.3.1) et en utilisant (6.3.2) et (6.3.3),
on obtient que !
Z Z b Z ψ(x)
f (x, y) dx dy = f (x, y) dy dx,
D a ϕ(x)

ce qui conclut la preuve du théorème.


AVERTISSEMENT : Dans l’énoncé précédent, l’ordre d’intégration est important. Comme la
variable xn est donnée en fonction des variables x1 , . . . , xn−1 , il faut d’abord intégrer par rapport
à xn sur un ensemble qui dépend de x1 , . . . , xn−1 . Le résultat du calcul est alors une quantité qui
dépend de x1 , . . . , xn−1
Z ψ(x1 ,...,xn−1 )
f (x1 , . . . , xn−1 , xn ) dxn
ϕ(x1 ,...,xn−1 )
que l’on intègre ensuite par rapport aux variables x1 , . . . , xn−1 .
RR
Exemple 6.3.3. Calculons I := D xy dx dy où D est la partie du plan limitée par les paraboles √
d’équation y = x2 et x = y 2 . On a donc que D = {(x, y) ∈ R2 : 0 ≤ x ≤ 1, x2 ≤ y ≤ x} et
d’après le théorème de Fubini,
Z 1 Z √x ! Z 1  2 √x ! Z 1  1
x x4
 3
x6

y x 1
I= xy dy dx = x dx = x − dx = − = .
0 x 2 0 2 x2 0 2 2 6 12 0 12
62 CHAPITRE 6. INTÉGRALES MULTIPLES

6.4 Formule de changement de variables


Outre le théorème de Fubini, le second outil majeur dans le calcul d’intégrales multiples est la
formule de changement de variables que nous admettrons.

Théorème 6.4.1 (Changement de variables). Soient U et V des ouverts de Rn et Φ : U → V


un C 1 -difféomorphisme. Soit également D ⊂ V un ensemble quarrable. Alors Φ−1 (D) ⊂ U est
quarrable et pour toute fonction f : V → R Riemann-intégrable sur D, la fonction f ◦ Φ est
Riemann-intégrable sur Φ−1 (D) et on a
Z Z
f (y) dy = f ◦ Φ(x) |JΦ (x)| dx.
D Φ−1 (D)

Remarque 6.4.2. – On écrit symboliquement que y = Φ(x) et l’élément de volume dy =


|JΦ (x)| dx. Notons que c’est la valeur absolue du déterminant jacobien qui intervient dans
l’expression de la formule de changement de variables.
– Soit Φ(x) = Ax une application linéaire où A est la matrice diagonale A = diag(λ1 , . . . , λn )
avec λi 6= 0 pour tout 1 ≤ i ≤ n. Alors A est inversible ce qui assure que Φ : Rn → Rn est un
C 1 -difféomorphisme. Soit P = [0, 1]n le pavé unité, alors y ∈ Φ(P ) si et seulement si yi = λi xi
pour tout 1 ≤ i ≤ n, où x ∈ P , ce qui est encore équivalent à écrire que 0 ≤ yi ≤ λi si λi > 0
et 0 ≤ yi ≤ −λi si λi < 0. Autrement dit,
n
Y
Φ(P ) = [0, |λi |]
i=1

est un pavé et dont la mesure est donnée par


n
Y
m(Φ(P )) = |λi | = |detA| = |JΦ (x)|m(P ).
i=1

6.4.1 Coordonnées polaires


On définit l’application Φ : R2 → R2 par Φ(r, θ) = (r cos θ, r sin θ) pour tout (r, θ) ∈ R2 . La
fonction Φ est de classe C 1 sur R2 , de plus, pour tout (r, θ) ∈ R2 , sa matrice jacobienne est donnée
par  
cos θ −r sin θ
DΦ(r, θ) = ,
sin θ r cos θ
et donc JΦ (r, θ) = r. Par conséquent, pour tout (r, θ) ∈ ]0, +∞[×R, le déterminant jacobien
JΦ (r, θ) > 0. Enfin si (r, θ) et (r0 , θ0 ) ∈ ]0, +∞[×R sont tels que Φ(r, θ) = Φ(r0 , θ0 ), alors r2 = r02 ,
ce qui implique que r = r0 . Par suite, on a que cos θ = cos θ0 et sin θ = sin θ0 ce qui implique θ = θ0
modulo 2π. On en déduit que Φ est injective sur ]0, +∞[ ×]0, 2π[. Le théorème d’inversion globale
assure donc que Φ est un C 1 -difféomorphisme de ]0, +∞[ ×]0, 2π[ sur son image R2 \([0, +∞[ ×{0}).
La formule de changement de variable montre alors que
Z Z
f (x, y) dx dy = f (r cos θ, r sin θ)r dr dθ.
D Φ−1 (D)

Exemple 6.4.3. Calculons I = D 1+x12 +y2 dx dy où D est le disque fermé de centre (0, 0) et de
RR

rayon 1. On a donc que D = {(x, y) ∈ R2 : x2 + y 2 ≤ 1}. En effectuant le changement de variables


6.4. FORMULE DE CHANGEMENT DE VARIABLES 63

en coordonnées polaires, on remarque que (x, y) ∈ D si et seulement si (r, θ) ∈ [0, 1] × [0, 2π]. Il
vient alors que Z
r
I= dr dθ.
[0,1]×[0,2π] 1 + r2
D’après le théorème de Fubini sur un pavé, on peut intégrer d’abord par rapport à θ. Comme
l’intégrande est indépendante de θ, on obtient
Z 1
r 1
dr = π ln(1 + r2 ) 0 = π ln 2.

I = 2π 2
0 1+r

6.4.2 Coordonnées cylindriques


On définit l’application Φ : R3 → R3 par Φ(r, θ, z) = (r cos θ, r sin θ, z) pour tout (r, θ, z) ∈ R3 .
La fonction Φ est de classe C 1 sur R3 , de plus, pour tout (r, θ, z) ∈ R3 , sa matrice jacobienne est
donnée par  
cos θ −r sin θ 0
DΦ(r, θ) =  sin θ r cos θ 0 ,
0 0 1
et donc JΦ (r, θ) = r. Par conséquent, pour tout (r, θ, z) ∈ ]0, +∞[×R × R, le déterminant jacobien
JΦ (r, θ, z) > 0. Enfin si (r, θ, z) et (r0 , θ0 , z 0 ) ∈ ]0, +∞[×R × R sont tels que Φ(r, θ, z) = Φ(r0 , θ0 , z 0 ),
alors évidemment z = z 0 et on montre comme dans le cas des coordonnées polaires que r = r0
et θ = θ0 modulo 2π. On en déduit que Φ est injective sur ]0, +∞[ ×]0, 2π[×R. Le théorème
d’inversion globale assure donc que Φ est un C 1 -difféomorphisme de ]0, +∞[ ×]0, 2π[×R sur son
image R3 \ ([0, +∞[ ×{0} × R). La formule de changement de variable montre alors que
Z Z
f (x, y, z) dx dy dz = f (r cos θ, r sin θ, z)r dr dθ dz.
D Φ−1 (D)

Exemple 6.4.4. Soit D p = {(x, y, z) ∈ R3 : x2 + y 2 ≤ 1, z 2 ≤ 4(x2 + y 2 )}, on veut calculer


RRR
l’intégrale triple I = D
x2 + y 2 dx dy dz. On passe en coordonnées cylindriques et on note que
(x, y, z) ∈ D si et seulement si r ∈ [0, 1], θ ∈ [0, 2π] et −2r ≤ z ≤ 2r. Par conséquent, la formule
de changement de variable couplée au théorème de Fubini donne
Z 1 Z 2π Z 2r   Z 1
I= r · r dz dθ dr = 2π 4r3 dr = 2π.
0 0 −2r 0

6.4.3 Coordonnées sphériques


On définit l’application Φ : R3 → R3 par Φ(r, θ, ϕ) = (r cos θ sin ϕ, r sin θ sin ϕ, r cos ϕ) pour tout
(r, θ, ϕ) ∈ R3 . La fonction Φ est de classe C 1 sur R3 , de plus, pour tout (r, θ, ϕ) ∈ R3 , sa matrice
jacobienne est donnée par
 
cos θ sin ϕ −r sin θ sin ϕ r cos θ cos ϕ
DΦ(r, θ) =  sin θ sin ϕ r cos θ sin ϕ r sin θ cos ϕ  ,
cos ϕ 0 −r sin ϕ

et donc JΦ (r, θ) = r2 sin ϕ. Par conséquent, pour tout (r, θ, z) ∈ ]0, +∞[×R×]0, π[, le déterminant
jacobien JΦ (r, θ, z) > 0. Enfin si (r, θ, ϕ) et (r0 , θ0 , ϕ0 ) ∈ ]0, +∞[×R×]0, π[ sont tels que Φ(r, θ, z) =
Φ(r0 , θ0 , z 0 ), alors r2 = r02 , soit r = r0 . De plus, on a r2 sin2 ϕ = r02 sin2 ϕ0 et r cos ϕ = r0 cos ϕ0 ,
ce qui implique, comme ϕ et ϕ0 ∈]0, π[ que cos ϕ = cos ϕ0 et sin ϕ = sin ϕ0 soit ϕ = ϕ0 . Enfin,
64 CHAPITRE 6. INTÉGRALES MULTIPLES

comme sin ϕ 6= 0 et sin ϕ0 6= 0, il vient que cos θ = cos θ0 et sin θ = sin θ0 ce qui implique que θ = θ0
modulo 2π. Par conséquent, le théorème d’inversion globale assure que Φ est un C 1 -difféomorphisme
de ]0, +∞[ ×]0, 2π[×]0, π[ sur son image R3 \ ([0, +∞[ ×{0} × R). La formule de changement de
variable montre alors que
Z Z
f (x, y, z) dx dy dz = f (r cos θ sin ϕ, r sin θ sin ϕ, r cos ϕ)r2 sin ϕ dr dθ dϕ.
D Φ−1 (D)

3 2 2 2
RRR 6.4.5. Soit D = {(x, y, z) ∈ R : 1 ≤ x +y +z ≤ 4, z ≥ 0}. Calculons l’intégrale triple
Exemple
I= D
z dx dy dz à l’aide d’un changement de variables en coordonnées sphériques. Remarquons
que (x, y, z) ∈ D si et seulement si (r, θ, ϕ) ∈ [1, 2] × [0, 2π] × [0, π/2]. Il vient donc par la formule
de changement de variables et le théorème de Fubini
ZZZ Z 2  Z π/2 !
2 3 15π
I= r cos ϕ · r sin ϕ dr dθ dϕ = 2π r dr sin ϕ cos ϕ dϕ = .
[1,2]×[0,2π]×[0,π/2] 1 0 4
Chapitre 7

Intégrales curvilignes et
surfaciques

L’objet de ce chapitre est de définir la notion d’intégrale sur des courbes dans le plan ou des
surfaces dans l’espace et de relier ces notions aux intégrales multiples introduites au chapitre
précédent.

7.1 Intégrale curviligne et formules de Stokes-Ostrogradski


A la section 4.2, nous avons défini ce qu’est un arc orienté de classe C 1 . Nous allons présenter
une notion d’intégrale sur de tels objets géométriques appelée intégrale curviligne.

7.1.1 Longueur d’un arc orienté


Soit ([a, b], γ) un arc orienté. Pour calculer la longueur L de Γ = γ([a, b]), nous allons adopter
le point de vue du numéricien en subdivisant la courbe en un nombre fini de points et approcher
la longueur de la courbe entre deux de ces points par leur distance.
Soit donc a = t0 < t1 < · · · < tN = b une subdivision de l’intervalle [a, b]. Les points
γ(t0 ), . . . , γ(tN ) sont donc des points de Γ. Une propriété classique de géométrie euclidienne affirme
que la distance minimale entre deux points est la ligne droite. Par conséquent, la longueur de la
courbe Γ qui joint les points γ(ti ) et γ(ti+1 ) est plus grande que kγ(ti+1 ) − γ(ti )k. En sommant
ces quantités, on obtient que la longueur de Γ est plus grande que
N
X −1
kγ(ti+1 ) − γ(ti )k.
i=0

Pour approcher L encore faut il “faire tendre” la distances entre chacun des points de la subdivision
vers zéro, à ceci près que rien n’assure l’existence de la limite. Par contre, l’inégalité précédente
ayant lieu pour n’importe quelle subdivision, on peut passer au sup parmi toutes les subdivisions
possibles. Ceci motive la définition suivante.
Définition 7.1.1. Soit ([a, b], γ) un arc orienté. La longueur de Γ = γ([a, b]) est définie par
(N −1 )
X
`(Γ) := sup kγ(ti+1 ) − γ(ti )k : N ∈ N, a = t0 < t1 < · · · < tN = b .
i=0

65
66 CHAPITRE 7. INTÉGRALES CURVILIGNES ET SURFACIQUES

Proposition 7.1.2. Soit ([a, b], γ) un arc orienté de classe C 1 . Alors


Z b
`(Γ) = kγ̇(s)k ds.
a

Démonstration. Soit a = t0 < t1 < · · · < tN = b une subdivision de l’intervalle [a, b]. Comme γ
est de classe C 1 , on a pour tout 0 ≤ i ≤ N − 1,
Z ti+1
γ(ti+1 ) − γ(ti ) = γ̇(s) ds
ti

et donc d’après l’inégalité triangulaire pour les intégrales vectorielles,


Z ti+1
kγ(ti+1 ) − γ(ti )k ≤ kγ̇(s)k ds,
ti

ce qui implique que


N
X −1 Z ti Z b
kγ̇(s)k ds = kγ̇(s)k ds.
i=0 ti−1 a

Par passage au sup par rapport à toutes les subdivisions possibles de [a, b] dans le membre de
gauche de l’inégalité précédente, on obtient que
Z b
`(Γ) ≤ kγ̇(s)k ds.
a

Montrons à présent l’inégalité opposée. Comme γ est de classe C 1 , γ̇ est uniformément continu
sur le compact [a, b]. Pour tout ε > 0 il existe donc un δ > 0 tel que pour tout s, t ∈ [a, b], si
|s − t| < δ, alors kγ̇(s) − γ̇(t)k < ε. Soit a = t0 < t1 < · · · < tN = b une subdivision de l’intervalle
[a, b] telle que
max (ti+1 − ti ) < δ.
0≤i≤N −1

D’après le théorème des accroissements finis, pour tout 0 ≤ i ≤ N − 1, il existe un si ∈]ti , ti+1 [ tel
que γ(ti+1 )−γ(ti ) = γ̇(si )(ti −ti−1 ). De plus, pour tout s ∈]ti , ti+1 [, on a que |s−si | ≤ |ti+1 −ti | < δ
ce qui montre que kγ̇(s) − γ̇(si )k < ε, ou encore
Z ti+1 Z ti+1
γ̇(s) ds − γ̇(si )(ti − ti−1 ) = (γ̇(s) − γ̇(si )) ds
ti ti
Z ti+1
≤ kγ̇(s) − γ̇(si )k ds ≤ ε(ti+1 − ti ).
ti

Par conséquent,
N
X −1 N
X −1
`(Γ) ≥ kγ(ti+1 ) − γ(ti )k = kγ̇(si )k(ti − ti−1 )
i=0 i=0
N
X −1 Z ti+1  Z b
≥ kγ̇(s)k ds − ε(ti+1 − ti ) = kγ̇(s)k ds − ε(b − a).
i=0 ti a

Comme ε > 0 est arbitraire, on en déduit que


Z b
`(Γ) ≥ kγ̇(s)k ds,
a

ce qui conclut la preuve de la proposition.


7.1. INTÉGRALE CURVILIGNE ET FORMULES DE STOKES-OSTROGRADSKI 67

Remarque 7.1.3. 1. La longeur est indépendante de la paramétrisation. En effet, si µ = γ ◦ ϕ,


où ϕ : [c, d] → [a, b] est une fonction strictement croissante et de classe C 1 , alors d’après la
formule de changement de variables,
Z d Z d Z b
kµ̇(s)k ds = kµ̇(ϕ(s))kϕ̇(t) ds = kγ̇(t)k dt.
c c a

2. La longueur est également indépendante de l’orientation. En effet, si µ(t) = γ(a + b − t), µ


est une paramétrisation de Γ en sens inverse car µ(a) = γ(b) et µ(b) = γ(a) et la formule de
changement de variable montre de nouveau que
Z b Z b Z a Z b
kµ̇(t)k dt = kγ̇(a + b − t)k dt = − kγ̇(s)k ds = kγ̇(s)k ds.
a a b a

7.1.2 Intégrale curviligne


Définition 7.1.4. Soient ([a, b], γ) un arc orienté de classe C 1 et f : R2 → R une fonction continue.
On définit l’intégrale curviligne de f sur Γ par
Z Z b
f (x, y) d` := g(γ(t))kγ̇(t)k dt.
Γ a

Remarque 7.1.5. Tout comme la longueur d’une courbe, l’intégrale curviligne ne dépend ni de
la paramétrisation, ni de l’orientation de la courbe.

Grâce aux propriétés classiques de l’intégrale simple on peut montrer facilement les propriétés
suivantes.

Propriétés 7.1.6. Soient (I, γ) un arc orienté de classe C 1 , Γ = γ(I), f , g : R2 → R des fonctions
continues et λ ∈ R.
1. Linéarité. Z Z Z
[f (x, y) + λg(x, y)] d` = f (x, y) d` + λ g(x, y) d`.
Γ Γ Γ

2. Monotonie. Si f (x, y) ≤ g(x, y) pour tout (x, y) ∈ Γ, alors


Z Z
f (x, y) d` ≤ g(x, y) d`.
Γ Γ

3. Additivité. Si Γ = Γ1 ∪ Γ2 avec Γ1 ∩ Γ2 = ∅, alors


Z Z Z
f (x, y) d` = f (x, y) d` + f (x, y) d`.
Γ Γ1 Γ2

γ̇(t)
Définition 7.1.7. Soit ([a, b], γ) un arc orienté de classe C 1 , Γ = γ([a, b]). On note τ (x, y) = kγ̇(t)k
le vecteur tangent unitaire à Γ au point (x, y) = γ(t). Si V : R2 → R2 est un champ de vecteurs
continu, la circulation de V le long de Γ est définie par l’intégrale curviligne de la composante
tangentielle de V sur Γ :
Z Z b
V (x, y) · τ (x, y) d` := V (γ(t)) · γ̇(t) dt.
Γ a
68 CHAPITRE 7. INTÉGRALES CURVILIGNES ET SURFACIQUES

AVERTISSEMENT : Bien qu’étant définie à l’aide de l’intégrale curviligne, la circulation d’un


champ de vecteur dépend de l’orientation de l’arc car il dépend de la tangente. En effet si l’on
définit µ(t) = γ(a + b − t) pour tout t ∈ [a, b], alors µ est une paramétrisation de Γ en sens inverse
et un simple changement de variable montre que
Z b Z b
V (µ(t)) · µ̇(t) dt = − V (γ(t)) · γ̇(t) dt.
a a

7.1.3 Formules de Stokes-Ostrogradski


Les formules de Stokes-Ostrogradski sont d’autres outils permettant de calculer des intégrales
doubles à l’aide d’intégrales curvilignes.
Théorème 7.1.8 (Formule de Stokes). Soit D un ensemble quarrable dont la frontière Γ = ∂D
est une courbe fermée orientée de classe C 1 dans le sens direct. Soit également V = (v1 , v2 ) : R2 →
R2 un champ de vecteurs de classe C 1 . Alors
ZZ Z
rot V (x, y) dx dy = V (x, y) · τ (x, y) d`.
D Γ

Démonstration. Nous démontrons le théorème dans le cas simplifié où


D = {(x, y) ∈ R2 : a1 ≤ x ≤ b1 , α1 (x) ≤ y ≤ β1 (x)}
= {(x, y) ∈ R2 : a2 ≤ y ≤ b2 , α2 (y) ≤ x ≤ β2 (y)},
où a1 , a2 , b1 , b2 ∈ R et α1 , α2 , β1 et β2 : R → R sont des fonctions de classe C 1 . On rappelle que
rot V (x, y) = ∂v ∂v1 2
∂x (x, y) − ∂y (x, y) pour tout (x, y) ∈ R . On calcul l’intégrale double à l’aide du
2

théorème de Fubini
ZZ Z b1 Z β1 (x) ! Z b1
∂v1 ∂v1
(x, y) dx dy = (x, y) dy dx = (v1 (x, β1 (x)) − v1 (x, α1 (x)) dx.
D ∂y a1 α1 (x) ∂y a1

Par ailleurs, notons Γα1 et Γβ1 les deux portions de Γ définis par les paramétrisation γα1 (t) =
(t, α1 (t)) et γβ1 (t) = (t, β1 (t)) pour tout t ∈ [a1 , b1 ]. L’arc Γα1 est orienté dans le sens direct, alors
que Γβ1 est orienté dans le sens indirect. Par conséquent, comme Γ est orienté dans le sens direct,
il vient
Z Z b1 Z b1 ZZ
∂v1
v1 (x, y)τ1 (x, y) d` = v1 (t, α1 (t)) dt − v1 (t, β1 (t)) dt = − (x, y) dx dy. (7.1.1)
Γ a1 a1 D ∂y

On montre de même que


Z ZZ
∂v2
v2 (x, y)τ2 (x, y) d` = (x, y) dx dy, (7.1.2)
Γ D ∂x
et le résultat suit en additionnant (7.1.1) et (7.1.2).
AVERTISSEMENT : Il est important de noter la dissymétrie des rôles joués par les variables
x et y par la présence du signe moins dans l’intégrale double. Dans le cas d’une courbe orientée
dans le sens indirect il faut changer le signe devant l’intégrale curviligne.
Théorème 7.1.9 (Formule d’Ostrogradski). Sous les mêmes hypothèses que le théorème de
Stokes, on a ZZ Z
divV (x, y) dx dy = V (x, y) · ν(x, y) d`,
D Γ
1 T
où ν(x, y) = kγ̇(t)k (ẏ(t), −ẋ(t)) est la normale unitaire extérieure à Γ au point (x, y) = γ(t).
7.2. INTÉGRALE SURFACIQUE ET FORMULE DE LA DIVERGENCE 69

Démonstration. Il suffit d’appliquer la formule de Stokes au champ de vecteur Ṽ : (x, y) 7→


(−v2 (x, y), v1 (x, y)) et de remarquer que Ṽ (x, y)·τ (x, y) = V (x, y)·ν(x, y) pour tout (x, y) ∈ Γ.

Exemple 7.1.10. Soit Γ la courbe fermée orientée dans le sens direct, constituée des deux portions
de courbes comprises entre les points d’intersection des paraboles d’équations x = y 2 et y = x2 .
Soit également le champ de vecteurs V : R2 → R2 défini par V (x, y) = (xy, 0) pour tout (x, y) ∈ R2 .
On se propose de calculer de deux manières différentes la circulation de V le long de Γ.
– Tout d’abord, l’application γ : [0, 2] → R2 définie par γ(t) = (t, t2 ) si 0 ≤ t ≤ 1 et γ(t) =
((2 − t)2 , 2 − t) si 1 ≤ t ≤ 2 est une paramétrisation de Γ. Par conséquent, la définition de la
circulation de V donne
Z Z 2 Z 1 Z 2
3 3
V (x, y) · τ (x, y) d` = V (γ(t)) · γ̇(t) dt = t dt − 2 (2 − t)4 dt = − .
Γ 0 0 1 20

– On cherche par ailleurs à appliquer


√ la formule de Stokes. Pour ce faire, on note D := {(x, y) ∈
R2 : 0 ≤ x ≤ 1, x2 ≤ y ≤ x} le domaine du plan délimité par la courbe Γ. La formule de
Stokes et le théorème de Fubini montrent alors que
Z ZZ
V (x, y) · τ (x, y) d` = rot V (x, y) dx dy
Γ D
√ !
Z 1 Z x Z 1
3
= −x dy dx = − (x3/2 − x3 ) dx = − .
0 x2 0 20

7.2 Intégrale surfacique et formule de la divergence


Dans cette section, nous introduisons les notions d’aire et d’intégrale de surface de façon analogue
au point de vue utilisé pour les courbes. Toutefois, la difficulté technique nécessaire pour rendre
rigoureuses les notions introduites ci-après nous conduit à ne présenter que formellement les outils
en question.

7.2.1 Aire d’une surface


Soit (D, Φ) et Σ = Φ(D) une surface orientée de classe C 1 et (s, t) ∈ D. Nous désignons par R
un rectangle élémentaire contenu dans D de côtés (s, t), (s + δs, t), (s, t + δt) et (s + δs, t + δt).
D’après la formule de Taylor, on a pour tout (u, v) ∈ [0, 1]2 ,

∂Φ ∂Φ
Φ(s + uδs, t + vδt) = Φ(s, t) + uδs (s, t) + vδt (s, t) + o(k(δs, δt)k).
∂s ∂t
Par conséquent, au premier ordre, l’image de R par Φ est “proche” du parallèlogramme d’origine
Φ(s, t) engendré par les vecteurs

∂Φ ∂Φ
δs (s, t) et δt (s, t)
∂s ∂t
et dont l’aire est donnée par
∂Φ ∂Φ
δs δt (s, t) ∧ (s, t) .
∂s ∂t
Il en résulte que si l’on subdivise D en petits rectangles de côté δs et δt, que l’on somme sur tous
les rectangles et enfin que l’on fait tendre δs et δt vers zéro, on obtient l’aire de la surface Σ.
70 CHAPITRE 7. INTÉGRALES CURVILIGNES ET SURFACIQUES

Définition 7.2.1. Soit (D, Φ) et Σ = Φ(D) une surface orientée de classe C 1 où D ⊂ R2 est un
ensemble quarrable. L’aire de Σ = Φ(D) est définie par
ZZ
∂Φ ∂Φ
σ(Σ) := (s, t) ∧ (s, t) ds dt.
D ∂s ∂t
Remarque 7.2.2. L’aire d’une surface est indépendante de la paramétrisation et de l’orientation.
En effet, si (D1 , Φ1 ) est une surface orientée de classe C 1 et ϕ : R2 → R2 un C 1 -difféomorphisme
tel que ϕ(D2 ) = D1 et Jϕ (s, t) 6= 0 pour tout (s, t) ∈ D2 , on définit la fonction Φ2 : R2 → R3 par
Φ2 := Φ1 ◦ ϕ de sorte que (D2 , Φ2 ) définit la même surface orientée que (D1 , Φ1 ). La formule de
différentiation des fonctions composées implique que pour tout (s, t) ∈ D2 ,
 
∂Φ2 ∂Φ2 ∂Φ1 ∂Φ1
(s, t) ∧ (s, t) = Jϕ (s, t) (ϕ(s, t)) ∧ (ϕ(s, t)) ,
∂s ∂t ∂u ∂v
il vient
ZZ ZZ
∂Φ2 ∂Φ2 ∂Φ1 ∂Φ1
(s, t) ∧ (s, t) ds dt = (ϕ(s, t)) ∧ (ϕ(s, t)) |Jϕ (s, t)| ds dt
D2 ∂s ∂t D2 ∂u ∂v

et en effectuant le changement de variables (u, v) = ϕ(s, t), on en déduit que


ZZ ZZ
∂Φ2 ∂Φ2 ∂Φ1 ∂Φ1
(s, t) ∧ (s, t) ds dt = (u, v) ∧ (u, v) du dv.
D2 ∂s ∂t D1 ∂u ∂v

7.2.2 Intégrale de surface


Définition 7.2.3. Soient (D, Φ) et Σ = Φ(D) une surface orientée de classe C 1 où D ⊂ R2 est un
ensemble quarrable, et f : R3 → R une fonction continue. On définit l’intégrale de surface de f sur
Σ par ZZ ZZ
∂Φ ∂Φ
f (x, y, z) dσ := f (Φ(s, t)) (s, t) ∧ (s, t) ds dt.
Σ D ∂s ∂t
Remarque 7.2.4. De nouveau, la formule de changement de variable montre que l’intégrale de
surface est invariante par changement de paramétrisation qui préserve l’orientation.
Grâce aux propriétés classiques de l’intégrale double on peut montrer les propriétés suivantes.
Propriétés 7.2.5. Soient (D, Φ) une surface orientée de classe C 1 où D ⊂ R2 est un ensemble
quarrable, Σ = Φ(D), f , g : R3 → R des fonctions continues et λ ∈ R.
1. Linéarité.
ZZ ZZ ZZ
[f (x, y, z) + λg(x, y, z)] dσ = f (x, y, z) dσ + λ g(x, y, z) dσ
Σ Σ Σ

2. Monotonie. Si f (x, y, z) ≤ g(x, y, z) pour tout (x, y, z) ∈ Σ, alors


ZZ ZZ
f (x, y, z) dσ ≤ g(x, y, z) dσ.
Σ Σ

3. Additivité. Si Σ = Σ1 ∪ Σ2 avec Σ1 ∩ Σ2 = ∅, alors


ZZ ZZ ZZ
f (x, y, z) dσ = f (x, y, z) dσ + f (x, y, z) dσ.
Σ Σ1 Σ2
7.2. INTÉGRALE SURFACIQUE ET FORMULE DE LA DIVERGENCE 71

7.2.3 Formule de la divergence


Nous avons vu dans le théorème 7.1.9 la formule d’Ostrogradski qui relie le flux d’un champ de
vecteurs sur une courbe de R2 à l’intégrale (double) de la divergence de ce même champ de vecteur
sur la partie du plan délimitée par cette courbe. Nous allons à présent généraliser cette formule en
dimension n = 3.
Théorème 7.2.6 (Formule de la divergence). Soient Ω ⊂ R3 un ensemble quarrable tel que
son bord ∂Ω = Σ est une surface orientée de classe C 1 . Soit également V : R3 → R3 un champ de
vecteurs de classe C 1 . Alors
ZZZ ZZ
divV (x, y, z) dx dy dz = V (x, y, z) · N (x, y, z) dσ,
Ω Σ

où N (x, y, z) est la normale unitaire sortante à Σ en (x, y, z) définie (si Φ est une paramétrisation
de Σ) par
∂Φ ∂Φ
∂s (s, t) ∧ ∂t (s, t)
N (x, y, z) := ∂Φ ∂Φ
pour (x, y, z) = Φ(s, t).
∂s (s, t) ∧ ∂t (s, t)

Vous aimerez peut-être aussi