Analyse Vectorielle: Antoine Gournay
Analyse Vectorielle: Antoine Gournay
Analyse Vectorielle: Antoine Gournay
Antoine Gournay
Institut de Mathématiques,
Université de Neuchâtel
Suisse
Décembre, 2011
Notes de Cours
Table des matières
Introduction v
1 L’espace euclidien. 1
1.1 Espace vectoriel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Produit scalaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Norme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.4 Produit vectoriel ou extérieur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4.i Dans R2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.A Produit extérieur dans Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.A.i Puissances extérieures supérieures . . . . . . . . . . . . . . . . . . . . . . 7
1.B Espaces vectoriels abstraits et axiomes du choix . . . . . . . . . . . . . . . . . . . 8
3 Dérivées et dérivabilité 23
3.1 Dérivées partielles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.2 Application linéaire et dérivabilité . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.3 Gradient et matrice de Jacobi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.4 Dérivation composée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.4.i Un théorème d’Euler sur les fonctions homogènes . . . . . . . . . . . . . 35
3.5 Dérivées d’ordres supérieurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.6 Interprétation géométrique quand m = 1 ou n = 1 . . . . . . . . . . . . . . . . . . 39
3.6.i Dérivée directionnelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.6.ii Potentiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.6.iii Vitesse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.7 Espace(s) tangent(s) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.7.i Tangence aux ensembles de niveau . . . . . . . . . . . . . . . . . . . . . . 42
i
TABLE DES MATIÈRES
4 Courbes 57
4.1 Paramétrage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.2 Longueur ; cas Lipschitz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.3 Longueur ; cas C 1 par morceaux . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.4 Paramétrage par la longueur d’arc . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4.5 Intégrale curviligne et travail . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
4.6 Courbure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
4.A Torsion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
4.B Théorème fondamental de l’algèbre . . . . . . . . . . . . . . . . . . . . . . . . . 82
5 Approximation et étude I 85
5.1 Formule de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
5.2 Points critiques et singuliers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
5.3 Matrice de Hesse ou hessienne . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
5.3.i Lorsque même la dérivée seconde ne suffit plus... . . . . . . . . . . . . . . 97
6 Résolution et étude II 99
6.1 Méthode de Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
6.2 Théorème des applications implicites . . . . . . . . . . . . . . . . . . . . . . . . . 103
6.2.i Calcul de la dérivée d’une fonction implicite . . . . . . . . . . . . . . . . 106
6.2.ii Approximation de Taylor pour les fonctions implicites . . . . . . . . . . . 109
6.3 Espace tangent et sous-variétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
6.3.i Cas particuliers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
6.4 Multiplicateurs de Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
6.4.i Étude de fonction avec le bord du domaine. . . . . . . . . . . . . . . . . . 123
6.4.ii Inégalité arithmétique-géométrique et théorème spectral . . . . . . . . . . 127
6.4.iii Forme quadratique du lagrangien . . . . . . . . . . . . . . . . . . . . . . 128
6.4.iv Les contraintes via les paramétrages . . . . . . . . . . . . . . . . . . . . . 133
6.A Dimension . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
6.B La conjecture du Jacobien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
ii
TABLE DES MATIÈRES
8 Surfaces 155
8.1 Vecteur normal et orientabilité dans R3 . . . . . . . . . . . . . . . . . . . . . . . . 156
8.2 L’orientabilité dans Rm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
8.3 Surfaces à bord et orientation induite . . . . . . . . . . . . . . . . . . . . . . . . . 166
8.4 Première forme quadratique : longueur et aire . . . . . . . . . . . . . . . . . . . . 170
8.5 Deuxième forme fondamentale : courbure . . . . . . . . . . . . . . . . . . . . . . 175
8.A Le calcul fonctionnel pour les matrices symétriques . . . . . . . . . . . . . . . . . 183
8.B Combinatoire et courbure négative . . . . . . . . . . . . . . . . . . . . . . . . . . 185
Biblographie 205
iii
TABLE DES MATIÈRES
iv
Introduction
La présente version des notes n’est pas encore une version achevée (portions incomplètes,
quelques incohérences dues à des changement de notations/définitions, des erreurs qui survivent
toujours). Dessins et exemples viennent parfois à manquer ; l’index est incomplet et il faudrait pro-
bablement raccourcir certains passages (ou en mettre en appendice). L’honorable lecteur est ainsi
prié de transmettre à l’auteur les erreurs qu’il y trouvera, les références qui lui semblent faire défaut
dans l’index, et les passages qui lui semblent trop confus ou trop peu illustrés.
Ces notes sont faites pour un cours de 14 × 2 heures. Le matériel contenu dans ces notes dépasse
largement 28 heures.
Ce cours succède normalement au[x] premier[s] cours d’analyse qui porte[nt] sur l’étude des
applications de la droite réelle dans elle-même. Le sujet en est maintenant les applications de Rn
dans Rm (où m, n ∈ Z≥1 ). En un certain sens, l’analyse de fonctions à plusieurs variables fait appa-
raître beaucoup de phénomènes nouveaux. D’un côté, comprendre certains sous-ensembles de Rm
mène éventuellement à la géométrie différentielle. D’un autre, le remplacement adéquat de certains
concepts en dimension 1 à la dimension supérieure prépare le (ou invite au) voyage vers l’analyse
fonctionnelle. Les motivations pour étudier ces fonctions sont abondantes ; par exemple, dans le mo-
dèle de la physique newtonienne, le potentiel est une fonction de R3 dans R et la force qu’il engendre
une fonction de R3 dans R3 . Il est aussi possible de percevoir les fonctions de C dans C comme
des fonctions de R2 dans R2 ; ainsi ce cours entretient aussi un lien avec l’analyse complexe.
La plupart des applications seront laissées en exercices, pour des raisons de manque de temps
en cours et parce que l’auteur suppose que la curiosité du lecteur le poussera à s’y intéresser de
lui-même.
Les buts de ce cours sont
Chapitre 1 : Rappels sur Rm , espace vectoriel et topologique.
Chapitre 2 : Rappels d’analyse en plusieurs dimensions : limite et continuité.
Chapitre 3 : Introduire les dérivées (une approximation linéaire d’une application). Les sous-ensembles
de Rm peuvent aussi être mieux compris en les “linéarisant”, ceci mènera à l’introduction
du concept de plan tangent.
Chapitre 4 : Un des objets d’intérêt en plusieurs dimensions sont les courbes. Quelques exemples de
questions typiques : comment calculer la longueur d’une courbe ? comment faire un pendule
dont la période d’oscillation ne dépend pas de l’amplitude ? comment tracer une voie de
chemin de fer afin de minimiser la tension sur les rails ? comment faire un arc de voûte de
v
Introduction
sorte à minimiser les forces présentes ? Les outils analytiques vont servir pour étudier ces
problèmes.
Chapitre 5 : Des approximations plus fines pour les fonctions sont aussi possibles (formule de Taylor),
ce qui permet le début de l’étude de fonction.
Chapitre 6 : La linéarisation des fonctions permet en quelque sorte de linéariser les équations, et en
quelque sorte de résoudre des systèmes d’équations non-linéaires (méthode de Newton,
théorème des fonctions inverses, théorème des fonctions implicites). Il se trouve que ceci
permet d’unifier les différentes notions de plan tangent (dans certains cas). Comme les sous-
ensembles de Rm sont subtils, tout cela est en fait nécessaire pour pouvoir faire des études
de fonctions lorsque le domaine de définition est contraint.
Chapitre 7 : L’intégration requiert aussi quelques raffinements par rapport au cas des fonctions réelles
à valeurs réelles. En particulier, la formule de changement de variable devient plus sub-
tile. Entre autres, certaines intégrales en une variable ne peuvent être évaluées qu’avec des
R ∞ −x2
méthodes de deux variables (la célèbre intégrale de Poisson, −∞ e dx).
Chapitre 8 : Les questions sur les surfaces sont plus subtiles que sur les courbes. Les théorèmes sur les
plans tangents permettront de bien caractériser le genre d’objet qui se porte a l’étude. Seules
seront ici traitées les questions d’orientabilité, de calcul d’aire et de flux.
Chapitre 9 : En électromagnétisme, les champs de vecteurs jouent un rôle primordial. Ce chapitre s’ap-
puie sur tous les précédents pour montrer les théorèmes de base qui servent (théorème de
la divergence, de Green et de Stokes). Puisqu’il n’est pas donné à tous d’étudier l’électro-
magnétisme, le lecteur peut se rassurer en sachant que ceux-ci sont aussi utiles en analyse
complexe.
Dans ce cours, les sections qui commencent par une lettre ne seront (au mieux) que partiellement
traitées en classe ; leur présence vise plus à présenter de la culture générale ou à approfondir certains
thèmes abordés. Le texte des preuves ne contrastant pas beaucoup avec le reste, un en marque la
fin. Pour les mêmes raisons, un F termine le texte des définitions, un ♣ clôt les exemples, un ♠
boucle les remarques et les énoncés (lemme, théorème, etc...) sont légèrement encadrés.
Ceci est aussi le moment opportun pour mettre de l’avant quelques bizarreries dans les notations
et les concepts de ce texte.
— Une bizarrerie commune vient du fait que les éléments d’un produit cartésien sont écrits
comme (a, b, c) [une ligne] alors que les vecteurs (des éléments de Rn , un produit carté-
sien) sont notés comme des colonnes. Cette bizarrerie est malheureusement entrée dans les
moeurs...
— Au chapitre 6, les sous-variétés de Rn possèdent déjà une structure différentielle canonique
héritée de Rn , ainsi il n’y aura pas de références aux cartes (la définition habituelle d’une
variété différentielle “abstraite”) ; ce concept sera probablement traité dans un cours de géo-
métrie différentielle. C’est l’application inverse d’une carte, appelée ici paramétrage, qui
prendra sa place. Cette perspective est plus naturel et accessible (voir par exemple le livre
Milnor, “Topology from the differentiable viewpoint”). D’autre part, un théroème difficile
vi
Introduction
montre qu’une variété lisse est toujours une sous-variété de RN , cette restriction n’est donc
pas si grande qu’on pourrait le croire.
— Le chapitre 7 sur l’intégration sera très court. Trois raisons à cela : (a) manque de temps, (b)
il est déjà traité dans un cours précédent (calcul différentiel et intégral à plusieurs variables),
et (c) il sera de nouveau abordé dans un cours ultérieur (mesure et intégration).
— Au chapitre 8, les partitions de l’unité ne seront pas utilisées (encore une fois, on relègue
cette technologie à un cours de géométrie différentielle).
Voici quelques notations qui seront employées tout au long de ce texte :
Z pour l’ensemble des entiers (positifs, négatifs ou nul). R pour l’ensemble réel. Quelques
notations qui seront utilisées pour des sous-ensembles de ceux-ci sont Z≥a (des entiers supérieurs
ou égaux à a), R<a ou ] − ∞, a[ (des réels strictement inférieurs à a), ]a, b] (pour les réels strictement [[
plus grand que a et plus petits ou égaux à b), etc...
Pour n ∈ Z>0 , n signifie l’ensemble {1, 2, 3, . . . , n} des entiers compris entre 1 et n (inclusive-
ment).
Lorsqu’un symbole qui n’a pas été préalablement défini apparaît dans une égalité := c’est qu’il
s’agit là de sa définition.
La composition de deux fonctions f : A → B et g : B → C, notée g ◦ f , est la fonction
g◦ f : A → B
x 7→ g( f (x))
Si A, B sont deux ensembles, S ⊂ B un sous-ensemble et F : A → B une application, alors
F −1 (S):= {a ∈ A | ∃s ∈ S, F(a) = s} est appelé l’image réciproque de S par F.
Si U est un intervalle ouvert de R, k ∈ Z≥0 et f : U → R est une fonction, alors f [k] est la dérivée
d’ordre k de f . En particulier, f [0] = f et f [1] est plus communément notée f 0 .
Finalement, quelques mots sur certaines abréviations :
1. i.e. (lat. id est) signifie plus ou moins “c’est la même chose que”, “de manière équivalente”,
“en d’autres mots”, ...
2. e.g. (lat. exempli gracia) signifie par exemple “par exemple”.
3. c’àd. (fr. c’est-à-dire) est un peu comme i.e. mais en moins chic.
4. “ou (équiv.)” pour préciser que la conjonction “ou” qui précède est en fait une équivalence
mais que l’auteur n’a pas la motivation nécessaire pour la démontrer.
5. “... X (resp. Y) ... Z (resp. W) ...” signifie qu’on peut lire une première fois la définition/le
théorème avec X et Z, puis une seconde fois mais avec Y et W au lieu de X et Z.
6. mutatis mutandis = “ce qui devait être changé ayant été changé”, une phrase très utile,
comme le lecteur peut s’en douter, car il faut deviner ce qui doit être changé.
7. ceteris paribus [sic stantibus] = “toute chose égale par ailleurs”, pour bien spécifier qu’on
change une quantité, mais que toutes les autres restent égales.
L’auteur aimerait remercier Béatrice de Tilière qui lui a donné les notes de cours des années
précédentes, notes dont il s’est inspiré. Il tient à mentionner que les citations en début de chapitre
sont sans but subversif.
vii
Introduction
viii
Chapitre 1
L’espace euclidien.
Le but de ce chapitre est d’introduire/de rappeler plusieurs structures sur l’ensemble Rn qui,
étant les plus communément employées, ne seront probablement pas étrangères au lecteur. Lorsque
Rn est équipé de toute la panoplie (plus ou moins canonique) qui sera introduite dans ce chapitre, il
est alors appelé l’espace euclidien de dimension n (parfois noté En ).
L’ensemble Rn est l’ensemble des n-uplets de nombres réels. Les éléments de Rn seront écrits
en gras , tandis que ceux de R en italique (police usuelle dans les formules mathématiques). Ainsi
x ∈ Rn est la donnée de n nombres réels : x = (x1 , x2 , . . . , xn )T , les xi (i ∈ n) sont appelées les
coordonnées du point x.
La présence d’un T après la parenthèse vient du fait que les vecteurs sont traditionnellements
des colonnes. Ainsi, il faut prendre la transposée de la matrice de taille 1 × n [ou vecteur ligne] pour
obtenir une matrice [ou vecteur colonne ou vecteur tout court]. Ce T apparaîtra souvent, car il est
rarement commode de caser une colonne dans un texte...
Comme dans tous les produits cartésiens, il y a des projections canoniques : soit i ∈ n, alors la
ième projection canonique est définie par
πi : Rn → R
T
(x1 , x2 , . . . , xn ) 7→ xi
Rn peut être muni de plusieurs opérations. Ici, il sera muni seulement de la somme vectorielle
et de la multiplication par un scalaire.
— soit x = (x1 , x2 , . . . , xn )T et y = (y1 , y2 , . . . , yn )T ∈ Rn alors la somme vectorielle de x et y,
notée x + y, est définie par x + y = (x1 + y1 , x2 + y2 , . . . , xn + yn )T .
— soit x = (x1 , x2 , . . . , xn )T ∈ Rn et a ∈ R, la multiplication de x par le scalaire a est ax =
(ax1 , ax2 , . . . , axn )T .
1
1.1 - Espace vectoriel
La somme vectorielle est plus simplement appelée somme (lorsque n = 1 il n’y a en effet pas
de différence) et les éléments de R sont souvent nommés scalaires (la multiplication scalaire est
un changement d’échelle). Deux notations naturelles qui seront employées dans ce texte sont 0 =
(0, 0, . . . , 0) (qui sera parfois appelé[e] l’origine ou l’élément neutre) et −x = (−x1 , −x2 , . . . , −xn ).
Les deux opérations ci-dessus font de Rn un espace vectoriel, c’àd. que les propriétés suivantes
sont vérifiées : soient x, y, z ∈ Rn et a, b ∈ R alors
EV1. (x + y) + z = x + (y + z) (associativité de la somme)
EV2. x + y = y + x (commutativité)
EV3. a(bx) = (ab)x (associativité du produit)
EV4. a(x + y) = ax + ay (distributivité vectorielle)
EV5. (a + b)x = ax + bx (distributivité scalaire)
EV6. x + 0 = x (existence d’un l’élément neutre pour la somme)
EV7. x + (−x) = 0 (existence d’un inverse pour la somme)
EV8. 1x = x (existence d’un élément neutre pour le produit)
La vérification de ces propriétés est une conséquence directe des propriétés de R et des définitions
utilisées.
Il existe une autre méthode courante pour écrire le vecteur x ∈ Rn . En effet, soit
1 1
deux points de R2 . Les représenter graphiquement ainsi que
E XERCICE 1: Soit x = 2 et y = −1
les points x + y et x − y.
E XERCICE 2: Soit V = {v ∈ R3 |v · (2, −1, 3)T = 0}. Montrer que V est un sous-espace vectoriel de
R3 et en trouver une base.
2
Chapitre 1 - L’ ESPACE EUCLIDIEN .
Encore une fois, de cette définition et des propriétés de R, il est simple de montrer que le produit
scalaire possède les propriétés suivantes : soit z ∈ Rn et a, b ∈ R, alors
PS1. x · x ≥ 0 et x · x = 0 ⇔ x = 0 (défini positif)
PS2. x · y = y · x (commutativité)
PS3. (ax + by) · z = ax · z + by · z (linéarité)
[La bilinéarité, c’àd. la propriété de linéarité sur les deux termes, est ici conséquence de la linéarité
et de la symétrie.] Deux vecteurs x, y ∈ Rn tels que x · y = 0 sont dits orthogonaux.
Les propriété PS1 à 3 peuvent se démontrer sans trop de souci depuis les propriétés du produit
matriciel. Avant de passer à la suite, il est bon de rappeler en quoi ce produit scalaire est un peu
arbitraire. En effet, le lecteur se rappellera peut-être qu’étant donné une matrice définie positive (la
définition en est rappelée au chapitre 4, définition 5.3.2) notée Q de taille n × n, la quantité x ·Q y
définie par xT Qy est aussi un produit scalaire (i.e. satisfait aussi PS1 à 3). De cette façon, il y a
moyen de créer beaucoup de produits scalaires différents.
E XERCICE 3: Soit Λ une matrice diagonale dont les coefficients sont tous strictement positifs. Soit
·Λ : Rn × Rn → R l’application définie par x ·Λ y = xT Λy. En utilisant les propriétés de R, montrer
que cette application satisfait :
PS1. x ·Λ x ≥ 0 et x ·Λ x = 0 ⇔ x = 0 (défini positif)
PS2. x ·Λ y = y ·Λ x (commutativité)
PS3. (ax + by) ·Λ z = ax ·Λ z + by ·Λ z (linéarité)
R1
E XERCICE 4: Considérer l’espace des fonctions continues sur [−1, 1]. Soit h f | gi = −1 f (x)g(x)dx.
Montrer que h· | ·i est un produit scalaire. Calculer h f | f i lorsque f (x) = x3 .
3
1.3 - Norme
1.3 Norme
Le produit scalaire induit une norme ; la norme (induite) d’un vecteur x est notée kxk et se
définit par
√ q
(1.3.1) kxk = x · x = x12 + x22 + . . . + xn2 ∈ R≥0 .
Dans le cas n = 2, cette définition coïncide avec celle de longueur par le biais du théorème de
Pythagore. Soit x ∈ Rn et a ∈ R, alors
No1. kxk ≥ 0 et kxk = 0 ⇔ x = 0 (positivité)
No2. kaxk = |a|kxk (multiplicativité)
No3. kx + yk ≤ kxk + kyk (inégalité du triangle)
La troisième propriété est un peu plus difficile à démontrer (elle s’appelle aussi parfois propriété
d’Archimède). Elle se représente graphiquement par le fait que dans un triangle le chemin direct
entre deux sommets est plus court que celui qui passe par les deux autres cotés. La démonstration
sera présentée sous peu, en utilisant l’inégalité de Cauchy-Schwarz :
Théorème 1.3.2 (Inégalité de Cauchy-Schwarz)
∀x, y ∈ Rn , x · y ≤ kxkkyk.
Parenthèse : une des grandes beautés de l’inégalité de Cauchy-Schwarz est qu’elle se généralise à
tous les espaces vectoriels munis d’un produit scalaire (et de la norme induite).
Cette fonction est en fait un polynôme de degré 2 en t qui est positive ou nulle pour tout t. Son
discriminant 4(x · y)2 − 4kxk2 kyk2 est donc négatif ou nul, ce qui permet de conclure.
Remarquez que cette preuve fournit aussi le résultat suivant : deux vecteurs sont orthogonaux si
et seulement si kx + yk = kxk + kyk.
Il est aussi maintenant possible de parler d’angle entre deux vecteurs : soit x, y ∈ Rn , alors
l’angle entre x et y est
x·y
∠(x, y) = arccos ∈ [0, π].
kxk kyk
La définition est cohérente, car l’inégalité de Cauchy-Schwarz nous assure que l’argument de l’arccos
est dans [−1, 1]. L’angle obtenu est quant à lui compris entre 0 et π. Une fois montrée l’invariance
4
Chapitre 1 - L’ ESPACE EUCLIDIEN .
du produit scalaire lorsque les deux vecteurs subissent une rotation, il est assez facile de voir que
cette notion correspond à la notion d’angle usuel.
E XERCICE 5: Soit x = (2, 0, 1)T et y = (1, −1, −1)T deux points de R3 . Calculer x + y, x − y, −2y.
Calculer cos ∠(x, y).
Deux dessins : à gauche celui d’une inégalité du triangle, à droite le calcul d’un angle dans le
cube (grâce au produit scalaire)
E XERCICE 6: Calculer
E XERCICE 7: Soient x, y deux vecteurs non nuls de Rn . Supposons que pour tout a ∈ R, kx + ayk ≥
kxk. Montrer que x et y sont orthogonaux.
Il existe un autre produit dans R3 : le produit vectoriel ou extérieur. Il associe à une paire
de vecteurs un autre vecteur. Soit x, y ∈ R3 alors le produit extérieur de x = (x1 , x2 , x3 )T et y =
(y1 , y2 , y3 )T , noté x × y ou x ∧ y ou encore [x, y], est défini par
x2 y3 −x3 y2
x∧y = x3 y1 −x1 y3 ∈ R3 .
x1 y2 −x2 y1
Voici deux aides-mémoire pour se souvenir de la formule ci-dessus. Le premier consiste à remarquer
que dans la ième coordonnée aucun terme en xi ou yi n’apparaît (et chaque terme contient exactement
une coordonnée de x et de y). Ensuite, quand un terme est écrit avec le “x” d’abord, son signe
est positif si les indices sont dans le “bon ordre” (1, 2, 3, 1) et négatif sinon (1, 3, 2, 1). Le second
5
1.4 - Produit vectoriel ou extérieur
provient d’une autre manière plus concise (et plus malpropre) est d’écrire le produit comme
e1 x1 y1
x y x y x y
2 2 1 1 1 1
x∧y = e1 − e2 + e3 = e2 x2 y2 .
x3 y3 x3 y3 x2 y2
e3 x3 y3
PV1. x ∧ y = −y ∧ x (anti-symétrie)
PV2. (ax + by) ∧ z = ax ∧ z + by ∧ z (linéarité)
PV3. (x ∧ y) · x = 0 = (x ∧ y) · y (orthogonalité)
1.4.i Dans R2
Dans R2 , le produit extérieur permet de définir aussi un produit (qui aura pour résultat un réel).
En effet, deux éléments x = xx12 , y = yy12 de R2 peuvent être perçus comme des éléments de R3 en
ajoutant une coordonnée nulle. Le produit extérieur de (x1 , x2 , 0)T et (y1 , y2 , 0)T n’aura alors qu’une
coordonnée non-nulle, la troisième, dont la valeur sera x1 y2 − x2 y1 . Cette quantité est (éventuelle-
ment à un signe près) l’aire du parallélogramme appuyé sur les deux segments reliant l’origine à x
et y.
6
Chapitre 1 - L’ ESPACE EUCLIDIEN .
À noter qu’il faut s’assurer de l’ordre des composantes (ici e4 ⊗e2 = −e2 ⊗e4 ) est toujours le même.
Muni de ce produit scalaire sur Λ2 Rn (et de la norme qu’il induit) la proposition 1.4.1 reste
vraie.
et de voir que l’égalité a en effet lieu. Cette démonstration est particulièrement non-géométrique.
Un autre argument est de procéder dans le sens inverse (montrer 1 et en déduire 2). Toutes
ces opérations se comportent bien sous l’action des transformantions orthogonales (par définition
des transformations orthogonales pour ·, il faut travailler un peu plus pour ∧), ce qui fait qu’il
est possible de ramener le problème au cas où x et y sont dans le plan. Alors, kx ∧ yk est l’aire
du parallélogramme. La hauteur h du parallélogramme est (en prenant y pour la base) est h2 =
√
kxk2 − |x · y|2 /kyk2 . Ainsi, l’aire du parallélogramme est aussi kxk kyk 1 − cos2 θ. Égaliser ces
deux quantités montre la première partie de la proposition.
7
1.B - Espaces vectoriels abstraits et axiomes du choix
et − pour une permutation impaire). Ceci permet de définir deux produits, le premier ayant pour
entrée n − 1 éléments de Rn et pour sortie un élément de Rn (i.e. (Rn )(n−1) → Rn ). Soit j ∈ n − 1 et
x( j) ∈ Rn , il est défini par :
e
1 e2 ... en
(1) (1) (1)
x1
x2 . . . xn
(1) (2) (n−1) x(2) (2)
x2 . . . xn
(2)
x ∧x ∧...∧x = 1 ,
.
.. .
.. . .. .
..
(n−1) (n−1) (n−1)
x
1 x 2 . . . xn
et a pour propriété que, ∀ j ∈ n − 1, x( j) · (x(1) ∧ x(2) ∧ . . . ∧ x(n−1) ) = 0, c’àd. que son résultat est
orthogonal à ses entrées. De manière amusante pour n = 2, le précédent produit est en fait une
application J : R2 → R2 (J(x1 , x2 ) = (−x2 , x1 )) qui est une anti-involution (i.e. ∀x ∈ R2 , J J(x) =
−x).
Le second (le produit mixte) prend quant à lui n éléments de Rn pour leur associer un scalaire :
soit j ∈ n et soit x( j) ∈ Rn ,
(1) (1) (1)
x
1 x2 . . . x n
(2) (2) (2)
x 1 x2 . . . x n
[x(1) , x(2) , . . . , x(n) ] = .
. . ,
.
.. .. .. ..
(n) (n) (n)
x
1 x2 . . . xn
8
Chapitre 1 - L’ ESPACE EUCLIDIEN .
La seconde construction est l’ensemble de base lui-même. Il est possible de montrer que cet en-
semble n’est pas mesurable, c’àd. qu’il est impossible de lui donner une taille qui soit consistance
avec le fait que la taille de l’intervalle [a, b] soit b − a. Ceci n’est pas choquant en soi, mais c’est
à partir de ces ensembles que le “paradoxe” de Banach-Tarski est fait. Ce “paradoxe” 1 dit qu’il
est possible de découper une sphère en un nombre fini de sous-ensembles F1 , F2 , . . . , FN puis de dé-
placer (par des rotations, symétries et translations) ces sous-ensembles pour reformer deux sphères
identiques à la première. Ce “paradoxe” n’en est pas un ; c’est en fait un théorème en bonne et due
forme, si l’axiome du choix est accepté.
Parmi les conséquences notoires de l’axiome du choix, citons le Lemme de Zorn, le théorème
de compacité de Tychonoff, l’existence d’un bon ordre sur tous les ensembles, les ultrafiltres non-
principaux, ... Il en existe des versions plus faibles (l’axiome du choix dénombrable) qui n’ont pas
de conséquences désagréables et suffisent pour la plupart des mathématiques. Les mathématiques
dites “constructivistes” se passent normalement de tout axiome du choix.
Parfois des implications subtiles communément admises nécessitent un axiome du choix : il y
a deux définitions habituelles de la continuité pour les fonctions de R dans R, celle dite de Cauchy
(avec les ε et δ) et celle dite de Heine ( lim f (xn ) = f (lim xn )). Si une fonction est Cauchy-continue
en x elle est aussi Heine-continue. Si elle est Heine-continue sur tout un voisinage de x ou si x ∈
Q elle est aussi Cauchy-continue en x. Cependant, en absence de l’axiome du choix, il n’est pas
possible de montrer qu’une fonction Heine-continue en x ∈ R r Q est Cauchy-continue en x...
1. Les guillemets proviennent tout simplement du faite que ceci n’est absolument pas paradoxal : si l’axiome du choix
est accepté, c’est en une conséquence et elle ne mène à aucun contradiction connue.
9
1.B - Espaces vectoriels abstraits et axiomes du choix
10
Chapitre 2
Soit S un sous-ensemble de Rm . Une application F de S dans Rn est une règle qui associe à
chaque élément x ∈ S un élément F(x) ∈ Rn (formellement, c’est un sous-ensemble de S × Rn tel
que la projection sur le premier facteur est bijective). La représentation usuelle de F se fait en
coordonnées : pour i ∈ n, soit Fi (x) = πi ◦ F(x), appelée fonction coordonnée de F, alors
F1 (x)
F2 (x)
(2.0.1) F(x) = . .
..
Fn (x)
11
2.1 - Représentations graphiques des fonctions
— courbe paramétrée (n = 1), qui sera représentée par une lettre grecque minuscule, e.g. γ, φ, σ,
... ;
— surface paramétrée (n = 2), dont la notation sera une lettre grecque majuscule, e.g. Φ, Ψ, Ξ
...
Finalement, lorsque m = 2, il est commun d’utiliser x et y plutôt que x1 et x2 comme nom des
variables, et, lorsque m = 3, x, y et z au lieu de x1 , x2 et x3 . Il va sans dire qu’il ne s’agit là que de
notations, en particulier, elles sont probablement très différentes dans d’autres textes.
Deux notions qui se définissent avec une aise uniforme pour toutes les applications sont les
limites et les questions de continuité. Le slogan pour passer des fonctions R → R aux applications
Rm → Rn est “remplacer les valeurs absolues | · · · | par des normes k · · · k”.
L’exemple typique serait de penser au domaine S de la fonction comme une parcelle de terrain et la
valeur de F(x, y) comme l’altitude (par rapport au niveau de la mer) au point (x, y). Le graphe d’une
telle fonction aura l’air de la surface que décrit la terre à cet endroit.
12
Chapitre 2 - A PPLICATIONS , LIMITES ET CONTINUITÉ
[À gauche la représentation de F(x, y) = en graphe, à droite par les ensembles de niveau (les
courbes, et parfois quelques points, dans le dessin).]
La seconde représentation est celle des ensembles de niveaux. Pour poursuivre dans l’idée de la
fonction qui donne l’altitude d’une parcelle de terrain, les ensembles de niveaux seraient alors les
courbes de niveaux de la carte topographique de cette parcelle. Mathématiquement, soit c ∈ R, alors
l’ensemble de niveau Sc de la fonction F : S → R définie sur S ⊂ Rm est Sc = {x ∈ S | F(x) = c} =
F −1 (c).
Il est tout à fait possible de représenter les ensembles de niveaux d’applications de F : Rm → Rn
tant que m ≤ 3. Par contre, la dimension attendue (ici seulement en un sens intuitif) de l’ensemble
de niveau de F défini par F−1 (c) où c ∈ Rn est m − n. En particulier, lorsque n devient trop grand, la
plupart des ensembles de niveaux de la fonction sont vides. Si m = n il ne s’agira (“génériquement”)
que de points. Deux cas “exotiques” qui se rencontrent relativement régulièrement sont ainsi
1. m = 3 et n = 2. Les ensembles de niveaux auront la plupart du temps dimension 1, c’àd. ils
formeront une famille de courbes paramétrées par deux réels : la courbe associée à (c1 , c2 )
est définie par les points (x1 , x2 , x3 ) satisfaisant F(x1 , x2 , x3 ) = (c1 , c2 ).
2. m = 4 et n = 1 : les ensembles de niveaux sont alors “génériquement” de dimension 3 ;
chacun de ces ensembles est alors représenté comme une famille de surfaces. Pour décrire
l’ensemble de niveau de c ∈ R, il est alors commode de fixer (c’àd. de paramétrer par) une
des coordonnées (par exemple x4 ). Il faut alors chercher la surface (dans R3 ) donnée par
F(x1 , x2 , x3 , x4 ) = c et de regarder comment elle évolue lorsque x4 varie.
Exemple 2.1.1. Pour illustrer le premier cas “exotique”, soit F : U → R2 définie (sur U = R3 r
{(0, 0)} × R) par F(x, y, z) = (x2 + y2 + z2 , arctg √ 2z 2 ) alors si r ∈ R>0 et φ ∈ [] −π π
2 , 2 [] alors
x +y
−1
F (r, φ) est un cercle centré en (0, 0, r sin φ) de rayon r cos φ et orienté de sorte que tout segment
qui relie le centre à un de ses points est parallèle au plan xy.
La dernière méthode de représentation est de ne regarder que l’image de la fonction. Elle porte
le nom de paramétrage car il s’agit de décrire un ensemble non pas par une équation, mais comme
ce qui est balayé en faisant varier des paramètres. La représentation graphique par paramétrage
d’une application F : S → Rn où S ⊂ Rm est alors G(S) = {y ∈ Rn | ∃x tel que F(x) = y} ⊂ Rn .
Pour faciliter la visualisation, il est alors fréquent de marquer certains points de l’image de manière
particulière. Typiquement, quelque chose comme F(Z ∩ S) si le domaine est contenu dans R, ou
encore, F(Z × R ∩ S) et F(R × Z ∩ S) si le domaine est contenu dans R2 .
13
2.2 - Topologie dans Rn
cost
Exemple 2.1.2. La courbe paramétrée F : R → R2 définie par F(t) =
sint décrit un cercle de
rayon 1 dans R2 .
π
[À gauche un paramétrage marqué (un point est fait à chaque 8 du cercle, à droite le paramétrage
de l’hyperboloïde décrit ci-dessous.])
Pour bien marquer comment est paramétrée la surface (un hyperboloïde) de
sh r cos θ
F(r, θ) = sh r sin θ ,
ch r
Afin de parler de limites, il faut introduire la notion qui remplacera l’intervalle autour d’un point
{y ∈ R | |x − y| < ε}, et comme le veut le slogan, son remplaçant sera la boule ouverte centrée en
x ∈ Rn de rayon r. Pour ce faire, il faudra utiliser le fait qu’une norme induit (à son tour) une notion
de distance entre deux points. Soient x, y ∈ Rn , alors la distance entre x et y est définie par la norme
du vecteur qui les relie :
d(x, y) = kx − yk ∈ R≥0 .
Étant donné les propriétés précédentes, il est facile de vérifier que, ∀x, y, z ∈ Rn ,
14
Chapitre 2 - A PPLICATIONS , LIMITES ET CONTINUITÉ
Ceci étant fait, les boules remplaceront la no- une mauvaise chose).
tion d’intervalle : la boule de rayon r en x est
En topologie, les boules forment une base pour une topologie de Rn (et permet aussi d’induire
une topologie sur ses sous-ensembles). Ceci permet de faire une série de définitions à saveur topo-
logique :
Définition 2.2.1. Soit S un sous-ensemble de Rn .
1. Un point p ∈ S est dit point isolé si ∃r ∈ R>0 tel que Br (p) ∩ S = {p}.
2. Un point p ∈ Rn est dit point frontière (ou point de bord) de S, si ∀r ∈ R>0 , Br (p) ∩ S 6= ∅
et Br (p) ∩ (Rn r S) 6= ∅.
3. Un point p ∈ S est dit point d’intérieur de S si ∃r ∈ R>0 tel que Br (p) ⊂ S.
4. Un point p ∈ Rn est dit point d’accumulation de S si ∀r ∈ R>0 , Br (p) ∩ S 6= ∅.
5. Un point p ∈ Rn est un point limite de S si p est un point d’accumulation mais n’est pas un
point isolé.
6. Le bord de S, noté ∂S, est l’ensemble des points frontières de S.
7. L’intérieur de S, noté S̊, est l’ensemble des points d’intérieur de S.
8. L’adhérence de S, notée S̄, est l’ensemble des points d’accumulation de S.
9. S est dit [un] ouvert si S̊ = S.
10. S est dit [un] fermé si S̄ = S.
11. Un voisinage d’un point p (resp. d’un ensemble S) est un ouvert U tel que p ∈ U (resp.
S ⊂ U). L’ensemble des voisinages de p (resp. S) est noté Voisp (resp. VoisS). F
Attention : dans les définitions ci-dessus, un point d’accumulation de S (et par conséquent, un
point limite de S) n’appartient pas forcément à S. Par contre, dans le cours topologie, il est fort
probable que la distinction ne soit pas faite entre point d’accumulation et point limite. D’ailleurs,
cette différence ne devrait en général pas trop nous perturbé, car les ensembles S seront le plus
souvent des ouverts.
1/n
Exemple 2.2.2. L’ensemble S = { (n−1)/n) }n∈Z≥1 ⊂ R2 qui n’est fait que de points isolés possède
un seul point limite : 01 .
sin n 2 x 2
Par contre, l’ensemble { cos n }n∈Z≥1 ⊂ R possède comme point limite tout point y ∈ R tel
que x2 + y2 = 1 (pas évident à montrer). ♣
Quelques résultats de topologie seront maintenant énoncés ; les démonstrations ne seront pas
faites car elles seront normalement abordées dans (et appartiennent plutôt à) un cours de topologie.
15
2.2 - Topologie dans Rn
Proposition 2.2.3
Soit S ⊂ Rn .
1. S̊ = S r ∂S.
2. S est ouvert si et seulement si S ∩ ∂S = ∅.
3. ∂S ⊂ S̄, S ⊂ S̄ et S̄ = S ∪ ∂S.
4. S est fermé si et seulement si ∂S ⊂ S.
5. S est fermé si et seulement si Rn r S est ouvert.
6. ∂S est un fermé et S̊ est un ouvert.
7. Une union arbitraire d’ouverts est un ensemble ouvert.
8. Une intersection finie d’ouverts est un ouvert.
Le théorème suivant (qui est normalement la définition d’un compact en toute généralité) est
mentionné par souci de complétude.
Théorème 2.2.5
K est compact si et seulement si pour toute collection d’ouverts {Ui }i∈I telle que ∪i∈I Ui ⊃ K,
∃n ∈ Z≥0 et ∃{ik }k∈n tel que ∪k∈nUik ⊃ K.
Remarque 2.2.6. Toute boule Br (x) ⊂ Rm est contenue dans un ensemble “carré” (un produit
d’intervalles, qui sera appelé plus tard un pavé). En effet, si y ∈ Br (x) alors |yi − xi | < r, ainsi
y ∈ ∏ [xi − r, xi + r]. Inversement, soit ri ∈ R≥0 (où i ∈ m) et P = ∏ [xi − ri , xi + ri ]. Si y ∈ P alors
i∈m i∈m
2
1/2
ky − xk ≤ ∑ ri =: r. Ainsi P ⊂ Br (x). ♠
i∈m
Ce paragraphe a surtout pour but de souligner une particularité de Rn , qui est celle d’être à la
fois un espace topologique et un espace vectoriel (il y a même une certaine compatibilité entre les
deux structures). Cependant, en parlant d’applications de Rm dans Rn , il est généralement préférable
de ne penser qu’à l’aspect topologique de la chose. En effet, le domaine de l’application n’est en
général pas tout Rn , de la même façon que les fonctions des réels dans les réels ne sont pas, en
général, définies sur tout R et n’ont pas pour image tout R.
Ainsi, lorsque la discussion aura lieu au niveau du domaine et de l’image de la fonction, Rm
ou ses sous-ensembles seront à proprement parlé un espace topologique. Par contre, comme l’idée
fondatrice du cours est d’approcher les fonctions par des objets linéaires, il sera très souvent utile
16
Chapitre 2 - A PPLICATIONS , LIMITES ET CONTINUITÉ
d’utiliser Rm comme un espace vectoriel (ou ses sous-espaces vectoriels). D’où la formule, légè-
rement alambiquée, de définir la distance entre deux points de Rm (espace topologique) comme la
norme du vecteur dans Rm (espace vectoriel) qui les relie. D’où aussi l’insistance pour bien séparer
un point (élément de l’espace topologique) d’un vecteur (élément de l’espace vectoriel), même si a
priori il s’agit dans les deux cas d’un élément de Rm .
2.3 Limites
Dire que la limite de F(x) lorsque x tend vers a existe et vaut p c’est, intuitivement, demander
à ce que les valeurs de F dans des voisinages de a de plus en plus petits deviennent de plus en plus
proches de p. Ceci est formalisé par la définition de continuité (de Cauchy) suivante :
Définition 2.3.1. Soit S ⊂ Rm et soit a ∈ Rm tel que a est un point limite de S. L’application
lim F(x) = p, si
F : S → Rn admet la limite p ∈ Rn au point a, notée x→a
En remplaçant les boules par leur définition et les distances par leur expression en norme, cette
définition se résume à une incarnation du slogan :
∀ε ∈ R>0 , ∃δ ∈ R>0 tel que ∀x ∈ S satisfaisant 0 < kx − ak < δ, on ait kF(x) − pk < ε.
À noter que la définition de limite ci-dessus ne prend pas en compte la valeur au point a en tant que
tel, ni l’appartenance ou non de a au domaine de définition de F.
Cette section se termine sur quelques propriétés des limites ; leur démonstration est identique au
cas des fonctions R → R (à application du slogan près) d’où
E XERCICE 9: Faire les démonstrations des énoncés de cette section. [Indice : aller voir la démons-
tration de l’énoncé correspondant pour les fonctions R → R.]
Proposition 2.3.2
Soit m, n, ` ∈ Z≥1 , soit S ⊂ Rm et S0 ⊂ Rn .
1. Soient F : S → S0 et G : S0 → R` deux applications telles que x→a
lim F(x) = p et lim G(y) =
y→p
q. Alors lim G(F(x)) = q.
x→a
lim F(x) = 0 et G : S → R une fonction telle
2. Soit F : S → Rn une application telle que x→a
lim F(x)G(x) = 0.
que |G(x)| ≤ K pour un K ∈ R. Alors x→a
Parmi les autres propriétés très utiles, notons le fait que la limite est déterminée par la limite sur
chaque coordonnée. Un premier préliminaire est nécessaire, celui de parler de suites convergentes.
Le concept de suite est toujours bien défini et utile dans Rm . Il s’agit juste d’éléments de Rm indicés
par un entier positif, ou d’une application de Z≥1 ⊂ R dans Rm .
Définition 2.3.3. Une suite {x(i) }i∈Z≥1 d’éléments de Rm est dite convergente si l’application F :
S → Rm , où
S = {c ∈ R | c−1 ∈ Z>0 } = { 1k | k ∈ Z>0 },
17
2.3 - Limites
définie par F( 1k ) = x(k) admet une limite en 0 ∈ S̄ (en fait 0 est le seul point limite de S). La suite
lim F(c) = p. La notation correspondante est lim F(x(k) ) = p.
converge vers p si c→0 F
k→∞
ou encore :
Lemme 2.3.5
Une suite {x(i) }i∈Z≥1 converge vers p si et seulement si l’ensemble S = {x(i) }i∈Z≥1 est borné et
p est l’unique point limite de S.
Au passage, il vaut mieux mentionner que si K ⊂ Rm est compact alors toute suite {x(n) }n∈Z≥1 admet
une sous-suite {x(nk ) }k∈Z≥1 convergente. Il faut vérifier d’autres énoncés naturels :
Lemme 2.3.6
Soit i ∈ n et πi : Rn → R une fonction coordonnée, et {x(i) }i∈Z≥1 une suite convergeant vers p.
Alors la suite πk x(i) converge vers πi (p) =: pi .
En réalité, les propriétés précédentes permettent de déduire à très peu de frais, les propriétés sui-
vantes (et beaucoup d’autres).
Corollaire 2.3.8
lim F(x) = p et lim G(x) = q. Alors
Soient F, G : S → Rn deux applications telles que x→a x→a
lim (F(x) + G(x)) = p + q.
x→a
lim F(x) = p et lim G(x) = q. Alors
Soient F, G : S → Rn deux applications telles que x→a x→a
lim (F(x) · G(x)) = p · q.
x→a
lim F(x) = p et G : S → R une fonction telle que
Soit F : S → Rn une application telle que x→a
lim G(x) = q 6= 0. Alors lim F(x)
x→a
= 1 p.
x→a G(x) q
Finalement, voici un critère très utile pour montrer qu’il n’y a pas continuité :
Proposition 2.3.9
Étant donné deux suites {x(k) }k∈Z≥0 et {y(k) }k∈Z≥0 , si
lim
x lim y(k) et lim F(x(k) ) 6= lim F(y(k) ),
= p = k→∞
k→∞ (k) k→∞ k→∞
18
Chapitre 2 - A PPLICATIONS , LIMITES ET CONTINUITÉ
Par contraposition, si la limite de F en p existe, k→∞ lim F(x(k) ) = lim F(y(k) ). En particulier, si une
k→∞
limite existe, il est complétement inutile de regarder les suites pour en montrer l’existence : il est
impossible d’essayer toutes les suites possibles...
Exemple 2.3.10. Soit F(x, y) = x2xy définie pour tout xy 6= 0. Cette fonction ne possède pas de
+y2
limite en 0. En effet, F( 1k , 1k ) = 21 et F( 1k , − 1k ) = − 12 . ♣
2.4 Continuité
Définition 2.4.1. Soit S ⊂ Rm et soit a ∈ S. Une application F : S → Rn est dite continue en a ∈ S
un point limite si et seulement si
lim F(x) = F(a).
x→a
Si a est un point isolé, alors la fonction est continue en a. Elle est dite continue sur S0 ⊂ S si elle
est continue en tout point de S0 . Si la limite existe mais ne vaut pas F(a) alors l’application a une
discontinuité réparable en a. Si la limite n’existe pas, la locution discontinuité irréparable est alors
employée. F
Le nom de discontinuité réparable provient de ce que l’application peut alors être modifiée (en
changeant sa valeur en a) pour devenir une application continue en ce point. Les résultats principaux
sur la continuité sont tous corollaires des propriétés des limites.
Corollaire 2.4.2
Soit S ⊂ Rn , soit S0 ⊂ Rm , soit F : S → S0 continue en a ∈ S et G : S0 → R` continue en F(a).
Alors G ◦ F : S → R` est continue en a. En particulier, la somme et le produit de fonctions
continues sont continues.
log(1 + x2 + y2 )
19
2.4 - Continuité
La liberté qu’offre la dimension supérieure joue parfois des tours au calculateur trop cavalier. En
effet, pour une fonction f : R → R, il suffit de vérifier que la limite à gauche et à droite concorde pour
savoir que la fonction a, dans le pire des cas, une discontinuité réparable. Ceci est malheureusement
faux en dimension supérieure.
20
Chapitre 2 - A PPLICATIONS , LIMITES ET CONTINUITÉ
Le dernier corollaire se déduit du précédent et du théorème 2.2.5. S’il est besoin de le préciser un
maximum absolu (resp. minimum absolu) d’une fonction F : S → R est un point p de S tel que
∀x ∈ S, F(x) ≤ F(p) (resp. F(x) ≥ F(p)).
Corollaire 2.4.9
Soit S ⊂ Rn compact. Toute fonction F : S → R admet un maximum absolu et un minimum
absolu.
E XERCICE 11: En utilisant la définition de la continuité de Cauchy (avec les ε et δ), montrer que la
fonction F : R3 → R définie par : F(x, y) = 2xy + x2 est continue en (1, 1). [Indice : 2xy + x2 − 3 =
2(x − 1)y + (x − 1)2 + 2(y − 1) + 2(x − 1)].
x2 −x3 +y2
E XERCICE 12: Soit F : R2 r {0} → R la fonction définie par F(x, y) = x2 +y2
. Est-il possible
d’étendre F par continuité en 0 ?
[Indice : démontrer d’abord |x|3 ≤ (x2 + y2 )3/2 .]
4 −x4 5
E XERCICE 13: Soit F : R2 r {0} → R la fonction définie par F(x, y) = x x+y 4 +y4 . Est-il possible
log 1 + x2|xy|
(
x
+y 2 si y 6= 0,
F(x, y) =
0 si x = y = 0.
lim F(x, y) = 0 et lim F(x, y) = 0. Est-il possible d’en déduire que lim F(x, y) = 0 ?
Montrer que x→0 y→0 (x,y)→0
21
2.4 - Continuité
E XERCICE 16: Pour m ∈ Z≥1 et i ∈ m, la projection canonique πi de Rm dans R est définie par,
πi (x) = xi . Montrer que cette fonction est continue.
E XERCICE 17: Soit F(x, y) : R2 → R2 l’application définie par
( 4 4
+y
( xx2 +y x T si x 6= 0;
2 , e sin y) y
F(x, y) =
si xy = 0.
0
0
c. Montrer que F est continue en 0 .
E XERCICE 19: Un sous-ensemble S de Rm est dit fermé, si et seulement si ∀x ∈ / S, ∃r > 0 tel que
m
Br (x) ∩ S = ∅. Montrer que l’ensemble T des fermés de R vérifie les propriétés suivantes :
Fe1. L’ensemble ∅ et Rn sont fermés ;
Fe2. Toute intersection de fermés est fermée ;
Fe3. L’union de deux fermés est fermée.
[Il est aussi possible de parler de la topologie en regardant ses ensembles fermés, e.g. dans la
topologie de Zariski.]
E XERCICE 20: Montrer qu’un intervalle fermé de R est un fermé de R au sens ci-dessus, puis
trouver une union infinie d’intervalles fermés qui n’est pas un ensemble fermé de R (au sens ci-
dessus).
22
Chapitre 3
Dérivées et dérivabilité
Pour les fonctions R → R, la dérivée peut être perçue comme la variation instantanée. En effet, la
variation moyenne d’une fonction entre deux réels a et b se définit raisonnablement par f (b)− f (a)
b−a . La
convention de signe est heureuse dans la mesure où si la fonction est croissante (resp. décroissante),
le chiffre obtenu est positif (resp. négatif) quand a < b tout comme quand a > b. Cette convention
est d’autant plus utile car la droite y = f (a) + f (b)− f (a)
b−a (x − a) est une approximation grossière de
la fonction sur cet intervalle (encore une fois indépendamment du signe de b − a). En fait pour
la plupart des fonctions lisses (l’emploi d’un vocabulaire flou est volontaire), plus l’intervalle est
petit plus l’approximation est correcte. L’expression moderne (sic) de la variation instantanée en x
lim f (x+h)− f (x) .
s’obtient en posant a = x et b = x + h, puis en prenant h de plus en plus petit, i.e. h→0 h
(La convention plus haut fait que le signe h = b − a n’est pas important.) Voici quelques sécantes
(les droites de la forme y = f (a) + f (b)− f (a)
b−a (x − a)) dessinées sur un graphe (à gauche, a est fixé et
b varie) et la tangente (même équation mais le rapport est remplacé par f 0 (a), à droite).
23
3.1 - Dérivées partielles
Comme la dérivée partielle est essentiellement un phénomène en une variable, les deux proprié-
tés suivantes s’obtiennent sans difficultés.
Proposition 3.1.3
Soit U un ouvert et soit F, G : U → Rn deux applications telles que pour un i ∈ m et un y ∈ U,
24
Chapitre 3 - D ÉRIVÉES ET DÉRIVABILITÉ
Le cas des fonctions composées est généralement plus subtil et sera traité dans une section ultérieure.
D’ailleurs, il arrive fréquemment que, plutôt que d’appeler les variables xi , celles-ci soient re-
présentées par d’autres symboles (comme x, y et z). Si, par exemple, G(ρ, θ, φ) est une applica-
tion de U ⊂ R3 dans R3 , les notations changent pour rester cohérentes avec ces nouveaux noms :
∂
D2 G(ρ, θ, φ) = ∂θ G(ρ, θ, φ).
∂ 2F ∂ 2a
D1 f(F, a) = f(F, a) = et D2 f(F, a) = f(F, a) = . ♣
∂F 1 + F 2 + a2 ∂a 1 + F 2 + a2
Remarque 3.1.5. Notons qu’il pourrait y avoir ambiguïté dans la notation ∂x∂ i lorsque des fonc-
tions composées sont prises en considération. En effet, prenons la fonction F : R2 → R définie
par F(x, y) = x2 y. Ses dérivées partielles sont définies en tout point de R2 : (D1 F)(x, y) = 2xy et
(D2 F)(x, y) = x2 . Que veut dire D1 F(x2 , xy) ou ∂x
∂
F(x2 , xy) ? s’agit-il de D1 F évaluée en (x2 , xy) ou
de la fonction G(x, y) = F(x2 , xy) = x5 y dérivée selon sa première variable ? La distinction suivante
sera faite :
Les dérivées partielles comportent une lacune que la dérivée d’une fonction f : R → R ne pos-
sède pas. Effectivement, lorsque la fonction f : R → R a une dérivée en x ∈ R, alors elle est continue
en x. Malheureusement, en dimension supérieure, l’existence de dérivées partielles ne suffit pas pour
avoir la continuité.
E XERCICE 21: Soit F : R2 → R la fonction définie par
0 si x = y = 0,
F(x, y) = xy
2 sinon.
x + y2
Montrer que en (0, 0) les deux dérivées partielles de F existent, mais F n’est pas continue en ce
point (et que la discontinuité n’est pas réparable).
Un autre exemple est la fonction de l’exemple 2.4.4 : la fonction restreinte à n’importe quelle
droite passant par l’origine est dérivable, et pourtant, elle n’est même pas continue !
E XERCICE 22: Trouver les dérivées partielles de
1. F(x, y) = ln(1 + x4 + y4 ) ;
2. G(ρ, θ, φ) = (ρ sin θ, θ − ρ cos θ, arctg φ) ;
25
3.2 - Application linéaire et dérivabilité
x1 −x22
3. H(x1 , x2 , x3 , x4 ) = x32 +x44
si x32 + x42 6= 0 ;
2 y3 z4
4. T (x, y, z) = ex ;
5. Ξ(x, y, z) = ln 2 + cos(xyz)
E XERCICE 23: Soit T : (R r {0}) × R → R la fonction définie par
(
arctg xy si x > 0,
T (x, y) = y
π + arctg x si x < 0,
Calculer D1 T et D2 T . Ces deux fonctions ne sont a priori pas définies si x = 0. Peuvent-elles
s’étendre par continuité aux points y00 ? [Attention : votre réponse doit dépendre de y0 .]
Ainsi, il sera d’autant plus important de maintenir la distinction entre point (qui est “mangé” par
une application quelconque) et vecteur (qui ne peut être “mangé” que par une application linéaire).
Le théorème suivant permet de relier cette définition abstraite à une construction plus familière : les
matrices.
Théorème 3.2.2
Une application L : Rm → Rn est linéaire si et seulement si il existe une matrice A de taille n × m
telle que L(x) = Ax, ou, en coordonnées,
26
Chapitre 3 - D ÉRIVÉES ET DÉRIVABILITÉ
Exemple 3.2.3. Soit L : Rm → R une application linéaire, alors sa matrice est une ligne A =
(a1 , a2 , . . . , am ). En particulier, AT est une colonne et donc s’identifie à un vecteur de Rm , a = AT .
En outre, l’application peut s’exprimer par le biais du produit scalaire L(x) = Ax = a · x. ♣
Dans les trois exercices suivants, il sera discuté des normes sur des matrices, un concept utile
pour justifier la définition de dérivabilité. L’ensemble Mn×m des matrices (à coefficients dans R)
possède la structure d’un espace vectoriel (sur R). En effet, soit A et B des matrices n × m, ai j et
bi j leurs coefficients et λ un réel. Alors la multiplication par un scalaire est définie par le fait que
le coefficient i j de λA est λai j et la somme en disant que le coefficient i j de A + B est ai j + bi j . À
chaque matrice, il est a priori possible de lui associer deux réels :
kAvk 1/2
kAk→ = sup et kAk2 = ∑ |ai j |2 .
v∈R r{0} kvk
m
i∈m, j∈n
E XERCICE 24: Montrer que k · k2 est une norme. [Indice : identifier Mn×m à Rmn .]
E XERCICE 25: Montrer que k·k→ est une norme. Si de plus A et B sont des matrices m×m, montrer
que kABk→ ≤ kAk→ kBk→ (propriété dite de sous-multiplicativité).
E XERCICE 26: Montrer que kAk→ ≤ kAk2 . [Indice : utiliser Cauchy-Schwartz.]
La notion de dérivabilité sera que l’application s’approche bien par une application linéaire.
Plus précisément, L est un candidat pour une approximation linéaire de F en x si F(x + h) est
proche de F(x) + L(h) pour des h petits (c’àd. khk est petit). Plus rigoureusement, soit RF le terme
d’erreur de l’approximation linéaire en x : RF (h) = F(x+h)−F(x)−L(h). À partir de quel moment
l’approximation devient-elle “satisfaisante” ? Si kRF (h)k décroît plus rapidement en norme vers 0
que khk, i.e. si
lim kRF (h)k = 0.
h→0 khk
La raison intuitive qui se cache derrière ce critère est que si A est une matrice, alors kAhk khk ≤
2
∑i∈m, j∈n ai j (cf. exercice 26). Autrement dit, avec une décroissance aussi rapide que khk, n’importe
quelle application linéaire ferait l’affaire, et, en particulier, n’importe quelle matrice B approchera
la matrice A. D’où l’idée de demander un peu plus, comme dans l’équation ci-dessus.
27
3.2 - Application linéaire et dérivabilité
(puis translatée par F(a, b) pour que ce point soit dans l’image). Les deux graphiques à droite sont
des agrandissements successifs du premier ; plus le champ de vision se concentre près du point plus
l’image de F et de son application linéarisé se confondent.
Si cette notion de dérivabilité porte parfois le nom de dérivabilité de Fréchet, c’est qu’il existe
une autre notion, la dérivabilité de Gâteaux, qui est esquissée pour la curiosité du chaland en section
3.A. La notion de dérivée de Fréchet s’adapte bien au cadre infini-dimensionnel (où il faut remplacer
L par une application linéaire bornée) tout comme à l’analyse complexe (où L devient alors une
application linéaire sur C, c’àd. une matrice à coefficients complexes).
Le fin grammairien qu’est le lecteur aura noté que la définition se formule avec “une telle appli-
cation linéaire” plutôt que “l’application linéaire”. Rien n’est gratuit :
Théorème 3.2.5
Soit U ⊂ Rm un ouvert et F : U → Rn une application. Si F est dérivable en x alors sa dérivée
est unique.
En prenant la différence des deux premières équations et en divisant par khk il apparaît que
h R2 (h) − R1 (h)
(A1 − A2 ) = .
khk khk
Puis, en posant y ∈ Rm r {0}, {tk }k∈Z≥0 une suite de réels convergeant vers 0 et h = tk y, ceci devient
y R2 (tk y) − R1 (tk y)
(A1 − A2 ) = .
kyk ktk yk
Par passage à la limite lorsque k tend vers l’infini des deux côtés de cette égalité,
y
∀y ∈ Rm r {0}, (A1 − A2 ) =0 ⇒ ∀y ∈ Rm , (A1 − A2 )y = 0
kyk
28
Chapitre 3 - D ÉRIVÉES ET DÉRIVABILITÉ
Maintenant établie l’unicité de l’application linéaire qu’est la dérivée, il est possible de lui donner
une notation. Pour F une application linéaire dérivable en x, la dérivée de F en x (en tant qu’appli-
cation linéaire) sera notée dFx .
E XERCICE 27: Soit U ⊂ Rm un ouvert, et soit F : U → Rn une application. Montrer que si F est
dérivable en x alors F est continue en x.
Définition 3.3.1. Soit U ⊂ Rm un ouvert et F : U → R une fonction telle que toutes les dérivées
partielles existent en tout point de U. Le gradient de F, noté ∇F ou (gradF), est l’application (pour
être plus pointu, le champ de vecteurs) ∇F : Rm → Rm défini par
D1 F(x)
D2 F(x)
∇F(x) = . . F
..
Dm F(x)
La définition ci-dessus insiste sur l’aspect champ de vecteurs du gradient. Lorsque toutes les
dérivées partielles de F sont définies seulement en un point x, il est aussi commode de dire que le
gradient de F en x est le point de Rm donné par l’équation ci-dessus.
2
−y )2
Voici une représentation du gradient de la fonction F(x, y) = xy(x
x2 +y2
(à gauche, avec un fond
clair pour les grandes valeurs et un fond foncé pour les petites valeurs), ainsi que le graphe de la
fonction (à droite) :
29
3.3 - Gradient et matrice de Jacobi
Définition 3.3.2. Soit U ⊂ Rm un ouvert et F : U → Rn une application telle que toutes les dérivées
partielles existent en y ∈ U. La matrice de Jacobi ou matrice jacobienne de F en y, notée F∗ (y), est
la matrice de taille n × m définie comme suit : pour i ∈ n et j ∈ m, F∗ (y) i j = D j Fi (y), ou
∂ ∂ ∂
∂x1 F1 (x) ∂x2 F1 (x) . . . ∂xm F1 (x)
∂
∂x1 F2 (x) ∂x∂2 F2 (x) . . . ∂x∂m F2 (x)
F∗ (x) =
.. .. .. .. F
. . . .
∂ ∂ ∂
∂x1 Fn (x) ∂x2 Fn (x) . . . ∂xm Fn (x)
Théorème 3.3.3
Soit U ⊂ Rm un ouvert et F : U → Rn une application. Si F est dérivable au point x ∈ U alors
toutes les dérivées partielles de F existent et sa dérivée est représentée matriciellement par la
transposée de la matrice de Jacobi en x i.e.
r sin φ
a pour matrice de Jacobi en (R, r, θ, φ)
cos θ cos φ cos θ −(R + r cos φ) sin θ −r sin φ cos θ
F∗ (R, r, θ, φ) = sin θ cos φ sin θ (R + r cos φ) cos θ −r sin φ sin θ .
0 sin φ 0 r cos φ
30
Chapitre 3 - D ÉRIVÉES ET DÉRIVABILITÉ
♣
Théorème 3.3.6
Soit U ⊂ Rn un ouvert et F : U → Rn telle que ∀i ∈ m, ∀x ∈ U, Di F(x) existent et, de plus, que
les applications Di F sont continues sur U. Alors F est dérivable en tout point de U.
D ÉMONSTRATION : Afin de rendre la preuve plus lisible, elle ne sera ici présentée que dans le
cas m = 2 et n = 1. Ainsi, soit F : U → R la fonction considérée, soit x = xy ∈ U et soit h =
h 2
k ∈ R de petite norme (c’àd. de sorte que x + h ∈ U). Le but de la preuve est de montrer que
F(x + h, y + k) − F(x, y) s’approche d’un terme linéaire x · a où a = D1 F(x), D2 F(x) et de termes
d’erreurs RF (h, k) qui tendent rapidement vers 0. Or
Par le théorème 3.1.6 de la valeur intermédiaire (pour les fonctions d’une variable), ∃s,t ∈ [0, 1] tels
que
F(x + h, y + k) − F(x + h, y) = kD2 F(x + h, y + tk)
F(x + h, y) − F(x, y) = hD1 F(x + sh, y).
Ainsi, RF (h, k) = h D1 F(x +sh, y)−D1 F(x, y) +k D2 F(x +h, y+tk)−D2 F(x, y) . Il ne reste plus
qu’à vérifier que la décroissance est suffisante :
Les deux théorèmes précédents sont optimaux, c’àd. il n’est pas possible d’affaiblir les hypothèses,
comme le montrent les exemples suivants. Si F : R2 → R est dérivable en x, ses dérivées ne sont pas
forcément continues :
Pourtant F est dérivable en 00 , sa dérivée est donnée par la matrice de taille 1 × 2 suivante : (0, 1).
31
3.3 - Gradient et matrice de Jacobi
0
a. Montrer que F est continue en 0 = 0 .
b. Écrire les dérivées partielles de F en 0.
c. Montrer que F est dérivable en 0.
d. Montrer que D1 F n’est pas continue en 0.
d’un autre côté, si les dérivées partielles ne sont pas continues, F n’est pas forcément dérivable :
xy2
(
x
x2 +y2
si y 6= 0
F(x, y) =
0 si x = y = 0.
0
Les dérivées partielles existent en 0
(elles sont toutes deux nulles), mais F
n’est pas dérivable en 00 . [Elle est par
Montrer que F est dérivable en 0 = 00 . [Indice : Il y a plusieurs façons de faire. La méthode directe
a. Montrer qu’elle est continue sur R2 . [Vous pouvez utiliser, sans démonstration, que la fonc-
tion h : R → R définie par h(t) = t sin 1t lorsque t 6= 0 et h(0) = 0 est continue.]
b. Montrer que les dérivées partielles existent en 00 et donner leur valeur.
via la question précédente, puis utiliser que |x| ≤ |x2 + y2 |1/2 et |y| ≤ |x2 + y2 |1/2 .]
32
Chapitre 3 - D ÉRIVÉES ET DÉRIVABILITÉ
G F (p + h) − G(p0 ) − MLh
lim H(p + h) − H(p) − MLh lim
= h→0
h→0 khk khk
0 0
lim G p + Lh + R F (h) − G(p ) − MLh
= h→0
khk
lim MLh + MR F (h) + R G Lh + R F (h) − MLh
= h→0
khk
RF (h) RG Lh + RF (h) kLh + RF (h)k
lim
= h→0 M +
khk kLh + RF (h)k khk
Remarque 3.4.2. Soit G : R2 → R2 une application et soit F : R2 → R une fonction dérivable. Cer-
tains se rappellent de la règle de dérivation en chaîne en écrivant F ◦ G(x, y) = F G1 (x, y), G2 (x, y) ,
33
3.4 - Dérivation composée
puis en posant deux variables accessoires u := G1 (x, y) et v := G2 (x, y). Ceci donne
∂
∂x F(u, v) = ∂F ∂u + ∂F ∂v
∂u ∂x ∂v ∂x
= (D1 F)(u, v)(D1 G1 )(x, y) + (D2 F)(u, v)(D1 G2 )(x, y)
∂ ∂F ∂u ∂F ∂v
∂y F(u, v) = ∂u ∂y + ∂v ∂y
= (D1 F)(u, v)(D2 G1 )(x, y) + (D2 F)(u, v)(D2 G2 )(x, y).
Cette écriture est souvent préférée (car plus facile à retenir) ; l’essentiel étant de ne pas se tromper
en oubliant la dépendance d’une variable accessoire sur une des variables d’origine. ♠
−t
Exemple 3.4.3. Soit γ : R → R2 la courbe paramétrée γ(t) = ee−t cost 2
sint et soit F : R r {0} → R
−t
−e (cost+sint)
3 3 2 2
définie par F(x, y) = x + y . En calculant d’abord F∗ (x, y) = (3x , 3y ) et γ∗ (t) = e−t (cost−sint) , il
apparaît que si h = F ◦ γ
h0 (t) = F∗ (γ(t))γ∗ (t) = −3e−3t (cos3 t + cos2 t sint − cost sin2 t + sin3 t)
Graphiquement, ceci peut se représenter comme suit : on trace d’abord le graphe de F (ici fait
seulement pour (x, y) ∈ B1 (0, 0)) puis dans le plan xy l’image de la courbe γ (ici fait pour t > 0, en
rouge, avec des points en vert pour marquer des intervalles de longueur fixée).
Exemple 3.4.4. Soit F : R2 → R3 définie par F(r, θ) = (ch r cos θ, ch r sin θ, sh r), soit G(x, y, z) =
(x2 + y2 − z2 , x2 + y2 + z2 ) et soit H : R2 → R2 définie par H = G ◦ F. Composante par composante,
la dérivée en chaîne peut s’évaluer en posant x = ch r cos θ, y = ch r sin θ et z = sh r, puis par exemple
∂H1 ∂ ∂ ∂ ∂
(r, θ) = (x2 + y2 − z2 ) = 2x x + 2y y − 2z z = 2 ch r sh r − 2 sh r ch r = 0.
∂r ∂r ∂r ∂r ∂r
34
Chapitre 3 - D ÉRIVÉES ET DÉRIVABILITÉ
Exemple 3.4.5. Là où les formules suivantes ne comportent pas de division par 0, les fonctions F
définies par F(x, y, z) =
Si une fonction homogène est définie sur U, elle s’étend naturellement au cône sur U (l’en-
semble Û := ∪t∈R>0 tU) par homogénéité.
E XERCICE 31: Soit F une fonction homogène de degré k ≥ 1 définie sur un ouvert U ⊂ Rm tel que
U = Û et 0 ∈ U. Si de plus F(0) = 0, montrer alors que ∀u ∈ U la dérivée directionnelle Du F(0, 0)
existe toujours et qu’elle est forcément nulle si k > 1.
E XERCICE 32: Soit F une fonction homogène de degré k = 1 définie sur R2 . Si de plus F(0) = 0,
montrer alors que s’il existe trois points (x1 , y1 ), (x2 , y2 ) et (x3 , y3 ) sur le cercle (i.e. xi2 + y2i = 1) tels
que i 6= j ⇒ |F(xi , yi )| 6= |F(x j , y j )| alors F n’est pas dérivable en (0, 0).
Corollaire 3.4.6 (Théorème d’Euler pour les fonctions homogènes)
Soit U ⊂ Rm un ouvert et F une fonction homogène de degré k, alors, ∀x ∈ U,
m
kF(x) = x · ∇F(x) = ∑ xi Di F(x).
i=1
35
3.5 - Dérivées d’ordres supérieurs
D’autre part, par homogénéité, f (t) = t k F(x) et donc f 0 (t) = kt k−1 F(x). Le résultat est obtenu
en identifiant les deux expressions de f 0 (t) et en posant t = 1.
Remarque 3.4.7. Soit F : Rm r {0} → R une fonction homogène de degré 0. Supposons que
∃r ∈ R>0 tel que F est continue sur ∂Br (0). Alors F est bornée. En effet, ∂Br (0) est compact donc
x
F y admet un maximum disons F(u). Par homogénéité F(x) = F( kxk r) ≤ F(u). ♠
E XERCICE 33: Soit F une fonction homogène de degré k > 0 définie et continue sur Rm . Montrer
lim F(x) = 0. [Indice : utiliser le fait que F est essentiellement déterminée par sa valeur sur
que x→0
un compact.]
E XERCICE 34: Soit F une fonction homogène de degré k ∈ R définie sur {0} ∪ U où U ⊂ Rm est
un ouvert non-vide tel que U = Û.
Montrer que si k ≤ 0, alors soit F est constante (et k = 0) soit F n’est pas continue en 0.
E XERCICE 35: Soit F : R2 → R une fonction homogène de degré 1 (c’àd. ∀t ∈ R>0 , F(tx) = tF(x))
telle que F(0) = 0.
A priori, la question des dérivées d’ordres supérieurs semble anodine. D’une fonction dérivable
se déduisent ses dérivées partielles qui sont de nouveaux des fonctions, dérivables ou peut-être pas.
Il n’y a en tout cas pas d’obstacle majeur à considérer des objets comme D2 D1 F ou D1 D1 F ou
encore D1 D2 D1 F dans la mesure où les limites sont définies. Les dérivées d’ordres supérieurs in-
terviennent naturellement en physique (e.g. équation de la chaleur ou équation des ondes) et l’étude
des fonctions de plusieurs variables (cf. en une variable) compte aussi parmi les motivations pour
les considérer. Il n’est par contre pas aussi évident de savoir quand D1 D2 F = D2 D1 F ; en témoigne
l’exemple suivant.
36
Chapitre 3 - D ÉRIVÉES ET DÉRIVABILITÉ
Le résultat principal de cette section donne une condition sur F pour laquelle l’ordre des dérivées
peut-être inversé.
Définition 3.5.2. Soit U ⊂ Rm un ouvert et soit F : U → Rn une application. F est dite de classe
— C 0 sur U si elle est continue sur U.
— C 1 sur U si toutes ses dérivées sont continues sur U.
— C k , où k ∈ Z≥2 , si ∀` ∈ k et pour tout i1 , i2 , . . . , i` ∈ m, Di1 Di2 · · · Di` F est continue sur U.
— C ∞ si, ∀k ∈ Z≥0 elle est de classe C k
F
Le théorème suivant (donné avec des hypothèses très minimales) est le point de départ qui
permettra d’inverser l’ordre des dérivations.
Théorème 3.5.3
Soit U ⊂ R2 un ouvert, soit F : U → R une fonction continue telle que D1 F, D2 F et D1 D2 F
existent en tout point de U que de plus D1 D2 F est continue en xy ∈ U. Alors D2 D1 F existe en
x
y et est égale à D1 D2 F(x, y).
D ÉMONSTRATION : Soit
F(x + h, y + k) − F(x, y + k) − F(x + h, y) + F(x, y)
G(h, k) =
hk
définie pour h et k suffisamment petits (mais non-nuls). Soit a un réel tel que si V :=]−a, a[×]−a, a[ [
alors ∀(h, k) ∈ V, (x + h, y + k) ∈ U (ceci existe forcément car U est ouvert, voir remarque 2.2.6).
Sur π2 (V ) =] − a, a[, soit définie, pour h ∈ π1 (V ) =] − a, a[ fixé, la fonction f : π2 (V ) → R par
f (k) = F(x + h, y + k) − F(x, y + k) ; elle est dérivable en tout point. Le théorème de la valeur inter-
médiaire 3.1.6 implique qu’il existe t ∈ [0, 1] tel que f (k) − f (0) = k f 0 (tk). Ceci permet d’écrire :
1
f (k) − f (0)) = h1 f 0 (tk) = h1 D2 F(x + h, y + tk) − D2 F(x, y + tk) . Une seconde appli-
G(h, k) = hk
cation du théorème de la valeur intermédiaire 3.1.6 implique qu’il existe s ∈ [0, 1] tel que G(h, k) =
D1 D2 F(x + sh, y + tk). Or D1 D2 F est continue en xy , autrement dit ∀ε > 0, ∃δ, tels que
37
3.5 - Dérivées d’ordres supérieurs
√
lim G(h, k) =
En particulier, ceci reste vrai (pour le ε donné) si si |h| et |k| sont < δ/ 2. Or h→0
1
k D1 F(x, y + k) − D1 F(x, y) . Par conséquent, ∀ε, ∃δ, tel que
√
D F(x, y + k) − D F(x, y)
1 1
|k| < δ/ 2 ⇒
− D1 D2 F(x, y)
< ε.
k
Précisément, ceci veut dire que D2 D1 F existe en xy et vaut D1 D2 F(x, y).
]
Le reste n’est maintenant plus qu’une formalité.
Corollaire 3.5.4
Soit k ∈ Z≥0 , soit F une application de classe C k sur U, soit ` ∈ k, soit i1 , i2 , . . . , i` ∈ m une suite
finie de nombres entiers et soit i01 , i02 , . . . , i0` ∈ m une permutation de cette suite. Alors, ∀x ∈ U,
D ÉMONSTRATION : Tout d’abord si ` = 1 il n’y a rien à montrer ; il sera dorénavant supposé que
` > 1. Les permutations sur ` éléments sont engendrées par les permutations sur deux éléments
consécutifs. Ainsi, il suffit de le montrer pour de telles permutations. De plus, il suffit de le faire
sur i1 et i2 : en effet, si la permutation a lieu sur i j et i j+1 , il est possible de se ramener au cas où
`0 = ` − j + 1, i.e. de ne regarder que la suite Di j Di j+1 · · · Di` .
Or, comme ` ≤ k, la fonction G := Di3 · · · Di` F (lorsque ` = 2 il s’agit de F tout court) est
le classe C k−`+2 où k − ` + 2 ≥ 2. Si i1 = i2 , il n’y a de nouveau rien à montrer. Si ces indices
sont distincts, comme les autres coordonnées n’interviennent pas dans le calcul de Di1 et Di2 il est
possible de considérer que G ne dépend que de deux variables et est de classe C 2 . Par le théorème
3.5.3, l’ordre des deux dérivées n’est pas important.
Exemple 3.5.5. Si F(x, y) est harmonique alors F(x2 − y2 , 2xy) est harmonique. En effet, soit
u = x2 − y2 et v = 2xy,
∂
∂x F(u, v) = 2x(D1 F)(u, v) + 2y(D2 F)(u, v),
∂
∂y F(u, v) = −2y(D1 F)(u, v) + 2x(D2 F)(u, v),
∂2
∂x2
F(u, v) = 2(D1 F)(u, v) + 4x2 (D21 F)(u, v) + 8xy(D2 D1 F)(u, v) + 4y2 (D22 F)(u, v),
∂2
∂y2
F(u, v) = −2(D1 F)(u, v) + 4y2 (D21 F)(u, v) − 8xy(D2 D1 F)(u, v) + 4y2 (D22 F)(u, v).
∂2 ∂2
= 4(x2 + y2 ) (D21 F)(u, v) + (D2 F)(u, v) = 0.
Ainsi, ∂x2
F(u, v) + ∂y2 F(u, v) ♣
E XERCICE 36: Montrer que si F(x, y) est harmonique alors F(x3 −3xy2 , 3x2 y−y3 ) est harmonique.
x −y
E XERCICE 37: Montrer que si F(x, y) est harmonique alors F( x2 +y 2 , x2 +y2 ) est harmonique.
38
Chapitre 3 - D ÉRIVÉES ET DÉRIVABILITÉ
E XERCICE 38: Montrer que la fonction G : R2 r {0} → R de classe C 2 sur son domaine et dé-
x −y
finie par G(x, y) = ln(x2 + y2 ) est harmonique. Montrer G( x2 +y 3
2 , x2 +y2 ) = −G(x, y) et que G(x −
L’objectif de cette section est de présenter quelques interprétations ou applications simples des
dérivées, principalement du gradient.
Lorsque les dérivées partielles sont définies, il y a une grosse dose d’arbitraire de choisir les axes
de coordonnées. En effet, plutôt que de poser f (t) = F(x1 + t, x2 , . . . , xm ) = F(x + te1 ) pour obtenir
une dérivée partielle, il est tout à fait possible de retomber sur le cas d’une variable, en regardant
f (t) = F(x + ty). C’est l’idée de la dérivée directionnelle. Un changement de variable assez simple
permet de voir que la norme de y, ne joue pas réellement de rôle ; ainsi, un vecteur unitaire lui est
préféré, c’àd. u ∈ Rm tel que kuk = 1.
si la limite existe. F
39
3.6 - Interprétation géométrique quand m = 1 ou n = 1
Ceci motive une notation accorte qui sera en particulier utile pour l’expression de la formule de
Taylor-Lagrange (cf. section 5.1) :
Du Du · · · Du F = (Du )k F = (u · ∇)k F.
(3.6.2) Du F = (u · ∇)F et | {z }
k fois
L’existence de dérivées directionnelles en x dans toutes les directions n’est pas une garantie suf-
fisante pour la dérivabilité, cf. la fonction de l’exemple 2.4.4 ; le lecteur curieux est prié d’assouvir
son appétence dans la section 3.A.
La dérivée directionnelle permet de donner une interprétation au gradient. En effet, si ∇F(x) 6=
0, alors ∇F(x) vu comme vecteur basé en x pointe dans la direction du plus grand accroissement en
x (voir les premiers graphiques de la section 3.3). Inversement, −∇F(x) pointe dans la direction où
(depuis x) la fonction décroît le plus. Dans ces deux cas, l’information est uniquement la direction
du vecteur ; sa longueur indique à quel point la croissance ou décroissance est rapide.
Exemple 3.6.3. Soit F : R2 → R la fonction définie par F(x, y) = x2 +y2 = k(x, y)k2 , alors ∇F(x, y) =
(2x, 2y) = 2(x, y). En chaque point (x, y) ∈ R2 , la direction maximale de croissance est donnée par
le vecteur 2(x, y), c’àd. la direction qui s’éloigne de l’origine (0, 0). Par contre, ∇F(0, 0) = (0, 0),
donc (en ne considérant que le gradient) aucune conclusion ne peut-être tirée. ♣
Dans l’exemple précédent, le point où ∇F s’annulait était aussi le point où F prenait sa plus
petite valeur (voir la propriété de positivité de la norme No1 en section 1.3). Ce n’est pas un hasard,
mais cette relation est plus subtile qu’il n’y paraît et sera approfondie au chapitre suivant.
E XERCICE 41: Soit F une fonction homogène de degré k ≥ 1 définie sur un ouvert U ⊂ Rm tel que
U = Û et 0 ∈ U. Si F(0) = 0, montrer alors que ∀u ∈ U la dérivée directionnelle Du F(0, 0) existe
toujours et qu’elle est forcément nulle si k > 1.
E XERCICE 42: Pour chacune des fonctions F : R2 → R de classe C 1 suivantes, calculer son gra-
dient, déterminer quand il est nul, et dessiner le champ de vecteurs donné par la direction du
∇F(x,y)
gradient G(x, y) = k∇F(x,y)k sur la région spécifiée.
a. F(x, y) = xy sur [−1, 1] × [−1, 1] ;
b. F(x, y) = x2 (1 − x2 /2) + y2 (1 − y2 /2) sur [−2, 2] × [−2, 2]. [Indice : regarder le signe du
polynôme z − z3 pour z ∈ R.]
E XERCICE 43: À l’exercice 23, il était démontré que la fonction T : (R r {0}) × R → R définie par
(
arctg xy si x > 0,
T (x, y) = y
π + arctg x si x < 0,
possède des dérivées partielles définies partout sauf en (0, 0) (après extension [de ces dérivées] par
continuité). Soit F le champ de vecteurs donné par l’extension par continuité de ∇T à R2 r {0}.
a. Montrer que kF(x, y)k = (x2 + y2 )−1 .
x
∈ R2 | 1 < x2 + y2 < 4}.
b. Représenter graphiquement le champ de vecteurs F(x, y) sur { y
40
Chapitre 3 - D ÉRIVÉES ET DÉRIVABILITÉ
3.6.ii Potentiel
En l’absence d’effets dispersifs (frottements, ...), il est en physique souvent très utile de regarder
les forces comme découlant d’un potentiel. La force gravitationnelle que crée une masse ou la force
électrique causée par une charge se représentent comme un champ de vecteurs R3 → R3 , c’àd.
qu’en chaque point de l’espace x ∈ R3 , il y a un vecteur v ∈ R3 (basé en x) qui décrit la direction et
l’intensité de cette force au point x.
Soit S ⊂ R3 un ouvert. Un champ de vecteurs F : S → R3 est dit conservatif s’il existe une
fonction V : S → R dérivable telle que F(x, y, z) = −∇V (x, y, z). V est alors nommé un potentiel
pour la force F (l’ajout d’une constante transforme un potentiel en un nouveau potentiel).
Exemple 3.6.4. La force gravitationnelle que crée une masse ponctuelle en l’origine est le champ
x
de vecteurs (défini sur Rm r{0}) donné par F(x) = − kxk 3 . Il est possible de lui associer un potentiel,
1
e.g. V (x) = − kxk . ♣
3.6.iii Vitesse
Une courbe paramétrée est une application R ⊃ I → Rm . La manière la plus commode d’y penser
est comme une application qui à un temps t ∈ I ⊂ R donne la position d’une particule au temps t.
T
Ainsi, une courbe paramétrée γ s’écrit γ(t) = γ1 (t), γ2 (t), . . . , γm (t) où les γi sont les fonctions
coordonnées.
Dans ce cas, il n’y a qu’une seule dérivée partielle de γ, et sa matrice de Jacobi n’est donc qu’une
simple colonne. L’approximation linéaire que forme la dérivée n’est finalement qu’un vecteur ligne,
rien d’autre que D1 γ. Par commodité, ce vecteur est plutôt noté γ0 , i.e.
T
γ0 (t) := D1 γ(t) = γ∗ (t) = γ01 (t), γ02 (t), . . . , γ0m (t) .
Comme prévu, c’est l’approximation par une droite (de vecteur directeur γ0 (t)). Une autre écriture
de γ0 est
γ(t + t 0 ) − γ(t)
γ0 (t) = tlim
0 →0 .
t0
Autrement dit, c’est la vitesse instantanée (plutôt le vecteur vitesse) de la particule au temps t.
41
3.7 - Espace(s) tangent(s)
42
Chapitre 3 - D ÉRIVÉES ET DÉRIVABILITÉ
Il est pour le moins logique de regarder l’ensemble des “zéros” d’une application. Autrement dit, de
regarder un ensemble de niveau d’une application.
Par exemple, ci-dessus sont représentés deux ensembles de niveaux de R3 (en fait pour la clarté,
seuls les points où z > 0 ont été pris en compte) : la sphère (ensemble du niveau 0 de F1 (x, y, z) = x2 +
y2 + z2 − 1) et le cône double (ensemble du niveau 0 de F2 (x, y, z) = x2 + y2 − z2 ). Leur intersection
(x,y,z)
(deux cercles) est la surface de niveau S(0,0) de l’application F(x, y, z) = FF21 (x,y,z) . Ainsi, fidèles à
notre habitude simplificatrice, commençons par le cas où F n’est qu’une fonction F : Rm → R ( et
c = c ∈ R).
Dans ce cas, les directions u qui sont orthogonales à ∇F(x) en un point x ∈ Sc , sont des di-
rections où il n’y a (infinitésimalement) pas de variation. Autrement dit, il s’agit, dans la repré-
sentation de l’ensemble de niveau, de directions (depuis x) où la valeur de F change peu. C’est
là la première idée intuitive pour l’ensemble affin qui approchera l’ensemble Sc : proche de x, F
est approchée par une application affine A donnée par v 7→ A(v) = F(x) + v · ∇F(x), et l’ensemble
affin sera l’ensemble de niveau de A : A−1 (c). Une simple manipulation des égalités donne que
A−1 (c) = {v ∈ Rm | v · ∇F(x) = 0}.
Pour passer à la dimension supérieure, le raisonnement est le même (l’argument de la dérivée
directionnelle en moins) : F : U → Rn est approchée en x par F(x + v) ' F(x) + F∗ (x)v. L’ensemble
qui approchera Sc en x sera donné par les vecteurs tels que A(v) := F(x) + F∗ (x)v = c où, en fait,
c = F(x). Ceci motive la définition suivante :
43
3.7 - Espace(s) tangent(s)
On peut d’ailleurs se rapporter aux dessins qui se situent entre la définition 3.2.4 et le théorème
3.2.5 : de loin, le plan tangent n’a pas nécessairement l’air proche de la surface de niveau, il faut
aller voir de très près pour comprendre qu’il y a tangence.
Il est important de remarquer qu’un ensemble fixé peut-être réalisé comme l’ensemble de niveau
de plusieurs fonction différente. Pour prendre un exemple simple, si S = F −1 (0), et G(x) := F(x)2 ,
alors S = G−1 (0). De plus, ∇G(x) = 2F(x)∇F(x), ce qui implique que l’espace tangent en tant
qu’espace de niveau pourra être différent (aux points où F(x) = 0 mais ∇F(x) 6= 0).
Tout d’abord (pour se placer par rapport à la terminologie de l’introduction de cette section) le
T est un espace vectoriel, tandis que le P est un espace affine.
Ensuite, Tenx Sc peut se décrire de manière plus géométrique. En effet, F∗ (x)v est le vecteur
T
v · ∇F1 (x), v · ∇F2 (x), . . . , v · ∇Fn (x) . Autrement dit, l’espace tangent à Sc en x est l’espace des
vecteurs orthogonaux aux gradients des fonctions coordonnées (évaluées en x). Cependant, l’espace
tangent à Fi−1 (ci ) en x est donné par l’orthogonalité à ∇Fi (x). Ainsi, l’espace tangent à l’intersec-
tion des surface de niveaux ∩i∈n Fi−1 (ci ) est l’intersection des espaces tangents à chaque Fi−1 (ci ).
Autrement dit, notre approximation linéaire semble bien marcher sous intersection.
Par définition, l’espace tangent Ten x Sc est un espace vectoriel. Selon la taille de l’espace linéaire
engendré par les ∇Fi (x) sa dimension est inclue entre m − n (si les ∇Fi (x) sont linéairement indé-
pendants) et m (s’ils sont tous nuls).
Exemple 3.7.2. Soit F : R2 → R la fonction définie par F(x, y) = x2 −y2 . Son gradient est ∇F(x, y) =
2x
est associé l’ensemble de niveau Sc = F −1 (c).
−2y . À c ∈ R
Au point 11 dans l’ensemble de niveau S0 , la droite tangente est faite de vecteurs v = uv (basés
Ten2 Sc = { uv ∈ R2 | 2u = −v}
(−1)
et Pen2 Sc = { 21 + −2tt 2+t
}t∈R = { xy ∈ R2 | 2x + y − 3 = 0} ♣
}t∈R = { −1−2t
(−1)
p
Exemple 3.7.3. Soit F : R3 → R définie par F(x, y, z) = z2 + ( x2 + y2 − 2)2 , son gradient est
∇F(x, y, z) = x 1 − √ 22 2 , y 1 − √ 22 2 , 2z pourvu que x2 + y2 6= 0.
x +y x +y
44
Chapitre 3 - D ÉRIVÉES ET DÉRIVABILITÉ
Dans cet exemple, il est bon de souligner que le gradient n’est pas défini lorsque x = y = 0,
et qu’il ne peut pas y être étendu par continuité. Ceci est dû au fait que les ensembles de niveau
√
(Sc est l’ensemble des ponts à distance c du cercle de rayon 2 contenu dans le plan xOy) se
comportent de manière “pointue” (i.e. qui ne s’approche pas bien linéairement) à cet endroit. Ceci
paraît entre autres dans le dessin des coupes y = 0 ci-après (y sont représentées les coupes de Sc où
c = 1/4, 1, 9/4, 4, 25/4 et 9). Petit exercice : où est l’ensemble de niveau S0 sur ce graphique ? ♣
Exemple 3.7.4. Finalement, voici un exemple d’ensemble de niveau pour une application. Soit F :
z2 +xy2 +x2 T
R3 → R2 l’application définie par F(x, y, z) = z2 +y(y 2
2 −1)−x2 . Alors ∇F1 (x, y, z) = (y + 2x, 2xy, 2z)
E XERCICE 44: Soit F(x, y) = x2 + (|y| − 2)2 une fonction continue sur R2 .
a. Dessiner les ensembles de niveaux Sc = F −1 (c) pour c = 0, 1, 4 et 9. [Indice : séparer les
cas y ≥ 0 et y ≤ 0.]
45
3.7 - Espace(s) tangent(s)
b. Calculer le gradient de F.
c. Identifier les points où le gradient n’est pas défini. Comment se manifeste géométriquement
sur les ensembles de niveaux, l’impossibilité de définir le gradient ?
d. Identifier les points où le gradient est nul. À quel[s] ensemble[s] de niveau[x] correspondent-
ils ?
2 ) en 1 et en
e. Donner
√
l’équation des plans tangents (en tant que sous-ensemble de R 2
2√
−2+ 2
et les représenter graphiquement (soit sur le même dessin, soit sur un autre où
la courbe de niveau est redessinée).
E XERCICE 45: Soit F fonction de classe C 1 sur R2 définie par F(x, y) = x(1 − x2 ) + y2 .
a. Faire une étude du polynôme p(x) = x3 − x. En particulier, quelle est sa valeur maximale et
minimale sur l’intervalle [−1, 1] ?
b. Utiliser cette étude pour esquisser les ensembles de niveaux Sc = F −1 (c) pour c = −1,
− 3√2 3 , 0, 3√2 3 et 1.
c. Calculer le gradient de F. Identifier les points où il est nul. Comment se manifeste géomé-
triquement sur les courbes de niveaux, l’annulation du gradient ?
d. Donner l’équation des plans tangents (en tant que sous-ensemble de R2 ) en 10 et en √25 .
Avant de réinterpréter dans un sens non-linéaire la version EA2 ci-dessus, il est souhaitable de
l’exprimer comme “un ensemble linéaire S est donné par un point de base et les points qu’il est
possible d’atteindre depuis là par certaines droites”. En fait, ceci est un écart (important) par rapport
à la définition donnée en EA2. En effet, dit de cette façon rien n’oblige les droites à se trouver
dans le même plan. Ainsi, cette description est celle (à translation près) d’un espace homogène et
[centralement] symétrique (et non pas d’un espace affin). Comme cette différence est importante, il
vaut la peine de souligner un peu mieux ces concepts.
Un ensemble S ⊂ Rm est dit homogène si ∀λ ∈ R>0 , x ∈ S ⇒ λx ∈ S. Un ensemble est dit
centralement symétrique si x ∈ S ⇒ −x ∈ S.
Autrement dit, si S possède ces deux propriétés alors ∀λ ∈ R, x ∈ S ⇒ λx ∈ S.
Pour non-linéariser “la donnée d’un point et de droites qui passent par ce point”, il suffit de
remplacer “droite” par “courbe [paramétrée]”.
Autrement dit, les ensembles dont une approximation sera ici tentée sont tout bonnement les
ensembles connexes par arc (∀x, y ∈ S, ∃γ : [−1, 1] → S une courbe paramétrée continue telle que
γ(−1) = x et γ(1) = y). Avec une telle ambition (c’àd. une version qui s’applique dans autant de
cas), la définition semblera évidemment souple (c’àd. moins accorte), mais elle est aussi très utile.
Ainsi, soit S un ensemble connexe par arc et x un point de base où un linéarisé de S est à
construire. Dans ce contexte, il y a des courbes paramétrées qui relient x à d’autres points de S
(sauf si S = {x}). En mettant bout à bout de telles courbes, l’existence de courbe paramétrée γ
46
Chapitre 3 - D ÉRIVÉES ET DÉRIVABILITÉ
passant par x (i.e. telle que Im γ 3 x) se démontre sans peine. Lorsqu’elles sont dérivables en x ces
courbes s’approchent par des droites, ce qui permet de tenter une approximation de S en x. Ces
considérations motivent la définition suivante.
Définition 3.7.5. Soit S ⊂ Rm un sous-ensemble connexe par arc. Alors l’espace tangent des vi-
tesses 1 à S en x ∈ S, noté Tvit
x S est
1 0
Tvit m
x S = {v ∈ R | ∃γ : [−1, 1] → S de classe C telle que γ(0) = x et γ (0) = v}.
En plus de mots : c’est l’ensemble des vecteurs v tels qu’il existe une courbe paramétrée γ : [−1, 1] →
S de classe C 1 satisfaisant γ(0) = x et γ0 (0) = D1 γ(0) = v.
Comme plus haut, le plan tangent est Pvit m vit
x S = {y ∈ R | ∃v ∈ Tx S, y = x + v}. F
Le prix de tant de flexibilité (la restriction aux ensembles connexes par arc est sans importance)
est que cet espace N’est, a priori, PAS un espace vectoriel, c’àd. si v, w ∈ Tx S, alors v + w n’ap-
partient pas nécessairement à Tvit x S. Il est, par contre, possible de montrer qu’il est homogène, c’àd.
que si v ∈ Tx S alors ∀a ∈ R, av ∈ Tvit
vit
x .
Côté représentation graphique, voici ci-dessous trois dessins d’un sous-ensemble de R3 . Le
premier dessin (à gauche) représente une vingtaine de vecteurs vitesse en un point. En regardant de
plus près (deuxième dessin, au milieu), il transpire que ces vecteurs se trouvent tous dans un même
plan ; Tvit forme un espace vectoriel en ce point. Par contre (troisième dessin, à droite), au point où
il y a un étranglement, les vecteurs vitesses ne forment définitivement pas un espace vectoriel ; ils
se répartissent en fait dans un cône. Noter qu’ils demeurent une très bonne approximation linéaire
de l’ensemble, même si celle-ci ne sera jamais un espace vectoriel.
Exemple 3.7.6. Soit S ⊂ R2 l’ensemble donné par l’union du cercle de rayon 1 centré en −1
0
et du cercle de rayon centré en 10 . Alors Tvit S est, aux points 20 , 00 et 02 , l’espace vectoriel
47
3.7 - Espace(s) tangent(s)
x
∈ R2 | xy = 0}.
E XERCICE 46: Soit S = { y
Comme il sera vu aux exercices, cette définition est parfois la meilleure approximation linéaire
d’un ensemble. Au chapitre 4, il sera aussi démontré que certains ensembles S qui sont l’image de
courbes paramétrées C ∞ (et non-triviale) ont un Tvit qui se réduit à {0} en certains points.
2
2 1+y2 ln |x|
E XERCICE 47: Soit F : (R r {0}) × R → R la fonction définie par F(x, y) = e 3+y .
a. Trouver la fonction f : R → R telle que F(x, y) = |x| f (y) . Faire une étude de f et la repré-
senter graphiquement, en particulier, marquer les points où f (y) = 1.
b. F(x, y) peut-elle s’étendre en x = 0 ?
c. Esquisser ΓF = {(x, y, z) ∈ R3 | z = F(x, y)} le graphe de F. Il peut-être commode de tracer
le graphe de F(x, 0), F(x, ±1) et F(x, ±2) (des fonctions de R → R).
d. Calculer D1 F et D2 F. Montrer que D2 F est continue sur R2 . Montrer que D1 F est continue
lim |x|α ln |x| = 0.]
sur R2 r {0} × [−1, 1]. [Indice : ∀α > 0, x→0
e. Ainsi, le gradient de F ne peut être défini sur {0} × [−1, 1]. Comment se manifeste cela de
manière géométrique sur le graphe ?
f. Donner le plan tangent au graphe en un point de votre choix.
48
Chapitre 3 - D ÉRIVÉES ET DÉRIVABILITÉ
En effet, il est alors évident que l’espace vectoriel obtenu est de dimension 0 à `. Cet espace tan-
gent dépend du paramétrage, i.e. pour une image S0 fixée deux paramétrages peuvent avoir un plan
tangent très différent.
Pour ceux qui ne serait satisfait de la justification ci-haut voici une interprétation (qui n’est pas
rigoureuse). S’il est admis que G : V → S ⊂ Rm est un bon paramétrage de S, alors une courbe γ :
[a, b] → S devrait pouvoir être exprimée comme G◦φ où φ : [a, b] → V est une courbe. Or par la règle
de dérivation en chaîne, γ0 (t) = G∗ φ(t) φ0 (t) ainsi γ0 (t) ∈ Im G∗ φ(t) . Il est alors assez naturel de
tenter d’approcher l’espace tangent des vecteurs vitesse par cet espace tangent des paramétrages.
Un exemple particulièrement important de ce concept est l’idée de l’espace (ou du plan) tangent
au graphe d’une fonction.
Soit U ⊂ Rm un ouvert, F : U → R une fonction dérivable sur U. Un élément de Rm × R s’écrit
x
(x1 , x2 , . . . , xm , z)T . Soit donc ΓF = { xz ∈ Rm × R | z = F(x)} le graphe de F. Le plan tangent
z =
à xz ∈ ΓF est engendré par les vecteurs (basés en xz ) Di F(x) ei
où i ∈ m. En effet, dans la direction
ei la variation infinitésimale de F est Di F(x).
En particulier pour m = 2, au point (x, y, F(x, y))T du graphe ΓF = {(x, y, z)T ∈ R3 | z = F(x, y)}
le plan tangent est engendré par (1, 0, D1 F(x, y))T et (0, 1, D2 F(x, y))T . Le produit vectoriel permet
aussi de trouver le vecteur normal (unique à un scalaire près) qui définit ce plan (espace vectoriel
de dimension 2 dans R3 ) :
e1 1 0
1 0
−D1 F(x,y)
0 ∧ 1 = e2 0 1 = −D2 F(x,y)
D1 F(x,y) D2 F(x,y) 1
e3 D1 F(x, y) D2 F(x, y)
49
3.7 - Espace(s) tangent(s)
1
Exemple 3.7.8. Soit de nouveau F : R2 → R la fonction définie par F(x, y) = x2 − y2 . Au point
1 1
l’espace tangent au graphe est donné par l’orthogonalité au vecteur (basé en 1 )
1 0 −2 0
0 ∧ 1 = 2 . L’équation du plan est ainsi −2x + 2y + z = 0. ♣
2 −2 1
En général, pour m ≥ 3, il est possible de montrer que le vecteur normal est proportionnel à
1 0 0
0 1 0
.. .. . m −∇F(x)
. . ∧ ∧ . . . ∧ .
. = (−1) .
0 0 1 1
D1 F(x,y) D2 F(x,y) Dm F(x,y)
E XERCICE 48: Soit F : R2 → R la fonction définie par F(x, y) = x2 (1 − x2 ) + (y2 − 1)y. Soit ΓF =
{(x, y, z) ∈ R3 | z = F(x, y)} le graphe de F.
a. Calculer D1 F et D2 F.
b. F donne lieu au paramétrage habituel de son graphe Φ : R2 → R3 défini par Φ(x, y) =
T par
Φ en un point xy arbitraire. Quelle est la
x, y, F(x, y) . Donner le plan tangent P(x,y)
dimension de cet espace ?
c. ΓF a peut aussi être vu comme l’ensemble de niveau S0 := G−1 (0) de la fonction G; R3 → R
définie par G(x, y, z) = z − F(x, y). Calculer le gradient de G.
d. Un calcul du plan tangent Pen S0 devrait donner le même résultat qu’en b. Montrer seulement
que (∇G) Φ(x, y) est orthogonal à D1 Φ(x, y) et D2 Φ(x, y).
Proposition 3.7.9
Soit S ⊂ Rm .
Si G est un paramétrage de classe C 1 de S, et x = G(y) alors Typar G ⊂ Tvit
x S.
1 −1
Si F est une application de classe C telle que Sc = F (c) ⊃ S alors si x ∈ S, Tvit en
x S ⊂ Tx Sc
Avant d’entamer la démonstration, il est bon de se rappeler que, si γ est une courbe paramétrée (de
classe C 1 ) alors γ0 (t) = γ∗ (t).
50
Chapitre 3 - D ÉRIVÉES ET DÉRIVABILITÉ
La seconde assertion est la reprise de l’argument sur l’orthogonalité du gradient aux ensembles
de niveaux. En effet, soit v ∈ Tvit 1 0
x S et soit γ de classe C telle que Im γ ⊂ S, γ(0) = x et γ (0) = v.
Alors F ◦ γ(t) = c car Im γ ⊂ S ⊂ Sc = F−1 (c). En particulier, par la règle de dérivation en chaîne
3.4.1, F∗ γ(0) γ0 (0) = 0 d’où F∗ (x)v = 0. Or la ième ligne (i ∈ n) de F∗ (x) est ∇Fi (x), d’où ∀i ∈
Quelle que soit la manière dont un sous-ensemble de Rm est défini (i.e. comme ensemble de
niveau dans ET1, comme image d’une application dans ET3, ou tout simplement comme sous-
ensemble dans ET2), un point est singulier lorsque les trois définitions de plan tangent ne peuvent
coïncider (ou ne peuvent être définies). Il faudra attendre le théorème des fonctions implicites 6.2.5
pour avoir une (très) bonne caractérisation des points réguliers (c’àd. qui ne sont pas singuliers,
c’àd. où les trois notions d’espaces tangents coïncident).
Tentons de motiver une démonstration en se ramenant à de l’algèbre linéaire. Supposons que A
est une matrice ` × m (i.e. une application linéaire de R` dans Rm ) et que, de plus, A est injective
en tant qu’application linéaire (i.e. Ker A = {0}). Étant donné une base de l’image Im A (et de son
complémentaire), il est aisé de construire une matrice B de taille m × n telle que Ker B = Im A (et
n = m − dim Im A = m − `) et B est surjective en tant qu’application linéaire. Autrement dit, B est
un isomorphisme du complémentaire de Im A avec Rn .
Inversement, étant donné B de taille m × n qui est surjective en tant qu’application linéaire,
trouver une base de Ker B permet très facilement de construire une matrice A de taille ` × m telle
que Im A = Ker B (et ` = dim Ker B = m − n).
Autrement dit, dans les deux cas, si une des applications satisfait certaines propriétés, il est
possible de reconstruire la seconde. Dans les deux cas A décrit l’ensemble Im A = S, tandis que
B décrit le quotient de l’espace par cet ensemble (autrement les différentes tranches de Rm /S). Il
est possible de décomposer Rm en deux sous-espaces complémentaires : S = Im A = Ker B qui est
isomorphe via A à Rl et son complémentaire qui est isomorphe via B à Rn .
En revenant aux applications non-linéaires (dont l’image de l’une est contenue dans l’ensemble
de niveau de l’autre), demander que A est un isomorphisme sur son image (i.e. est injective) revient
à demander que le paramétrage G soit (à peu de chose près) une bonne description de son image
(formellement, G∗ (y) est injectif si les Di G(y) sont linéairement indépendants). Demander que B
soit un isomorphisme à noyau près (i.e. est surjective) revient à demander que l’application F a la
propriété que, en variant c, les ensembles de niveau Sc de F “s’empilent” pour bien recouvrir un
voisinage de l’ensemble de niveau original (formellement, F∗ (x) est surjective si n ≤ m et, pour
i ∈ n, les ∇Fi (x) sont linéairement indépendants). Qui plus est, dans ces deux situations (A injective
et B surjective), la dimension de l’espace tangent est extrémale (T par est de dimension maximale et
Ten de dimension minimale). En regardant de plus près, elles sont même égales.
Quelques part, la proposition 3.7.9 ne permet pas de retrouver tout ce qui se passe dans le cas
linéaire. Mais elle permet quand même d’en retrouver un peu :
Corollaire 3.7.10
Soit U ⊂ Rm ouvert, soit F : U → Rn une application de classe C 1 et soit Sc = F−1 (c). Soit
51
3.7 - Espace(s) tangent(s)
D ÉMONSTRATION : Les deux premières affirmations sont de simples calculs sur les espaces vec-
toriels. Pour la troisième, il suffit de voir que T par et Ten sont deux espaces vectoriels de même
dimension dont le premier est inclus dans le second. Par conséquent, ils doivent être égaux. Mais
comme Tvit est coincé entre T par et Ten , il est lui aussi égal aux deux autres et est donc aussi un
espace vectoriel.
En fait, retrouver la situation idéale des applications linéaire demande beaucoup de travail : c’est
essentiellement le contenu du théorème des applications implicites, et sa démonstration demande
est loin d’être triviale.
E XERCICE 49: Soit S = { xy ∈ R2 | xy = 0}.
c. Déterminer Tvit
0 S. [Utiliser que S est fermé et homogène : x ∈ S ⇒ ∀λ ∈ R, λx ∈ S.]
pour le savoir ?
52
Chapitre 3 - D ÉRIVÉES ET DÉRIVABILITÉ
E XERCICE 52: Il est possible de décrire l’ellipse de plusieurs façons. Soient a, b ∈ R>0 les deux
demi-axes de l’ellipse.
sint
a. La courbe paramétrée γ : R → R2 définie par γ(t) = bacost
a pour image cette ellipse (cen-
trée en 0 et les axes le long des axes de coordonnées). Calculer le vecteur vitesse γ0 (t), la
matrice de Jacobi γ∗ (t) et la dérivée en t. [Il s’agit à peu de chose près des mêmes objets...]
b. En déduire, pour tout s ∈ R l’espace tangent Tspar γ. De quel dimension est-il ?
2 2
c. L’ellipse est aussi la solution de l’équation ax2 + by2 = 1. Autrement dit, c’est un ensemble de
2 2
niveau de la fonction F : R2 → R définie par F(x, y) = ax2 + by2 . Calculer le gradient et la
dérivée de F en (x, y). [Il s’agit à peu de chose près des mêmes objets...]
d. De quel ensemble de niveau s’agit-il ? Décrire l’espace tangent d’un point xy dans cet
53
3.A - Dérivée de Gâteaux
L’exercice suivant est une version générale de l’exerice 48 ; il montre que pour le graphe d’une
fonction C 1 , il y a des notions de plan tangents qui coïncident toutes bien (pour un choix assez
naturel de paramétrage et d’ensemble de niveau).
E XERCICE 54: Soit G : R` → Rm une application de R` dans Rm de classe C 1 .
x
a. L’application F : R` → R`+m définie par F(x) = G(x)
prend valeur dans le graphe de G.
Montrer que F est injective.
b. Montrer que F∗ (x) est toujours injective (en tant qu’application linéaire). En déduire que
dim Txpar F = `.
c. Soit H : R`+m → Rm définie par H(x, y) = G(x) − y où x ∈ R` et y ∈ Rm . Décrire H∗ (x) ; en
conclure que H∗ (x) est surjective, puis que Ker H∗ (x) est de dimension `.
d. Montrer que ΓG = H−1 (0). Dire pourquoi l’espace tangent des vecteur vitesse est un espace
vectoriel de dimension `.
dG F(x; ·) : Rm → Rn .
54
Chapitre 3 - D ÉRIVÉES ET DÉRIVABILITÉ
Cette application n’est par contre pas nécessairement linéaire. Elle n’est a priori que homogène, i.e.
pour tout scalaire t ∈ R et tout y ∈ Rn , dG F(x;ty) = tF(x; y).
F est continue sur R2 et elle est dérivable au sens de Fréchet en tout point sauf 0. De plus, F est
dérivable au sens de Gâteaux en tout point, 0 = 00 compris ; sa dérivée de Gâteaux en 0 est
Ainsi dG F(0; ·) est continue, homogène, mais n’est pas une application linéaire. ♣
Lorsqu’une application F a une dérivée (de Fréchet) dFx en un point x, sa dérivée de Gâteaux en
ce point existe et dG F(x; y) = dFx (y). Par contre, comme l’exemple ci-dessus le montre, l’existence
d’une dérivée de Gâteaux est insuffisante pour être dérivable au sens de Fréchet. De plus, la fonction
F de l’exemple 2.4.4 possède une dérivée de Gâteaux en 0 (encore une fois dG F(0; y) = F(y)), sans
même être continue en 0.
Les dérivées de Gâteaux sont en réalité surtout intéressantes lorsque des applications entre es-
paces de dimension infinie sont prises en compte. Il est alors même possible d’avoir une dérivée de
Gâteaux linéaire sans que la dérivée de Fréchet existe...
55
3.A - Dérivée de Gâteaux
56
Chapitre 4
Courbes
dF2
dt (t0 )
γ0 (t0 ) =
.. = γ∗ (t0 )
.
dFn
dt (t0 )
sera utilisée pour ce vecteur nommé vecteur vitesse de γ en t0 . Comme son nom l’indique, il re-
présente la vitesse (vectorielle, c’àd. avec direction) instantanée d’une particule dont le mouvement
dans Rm serait décrit par γ. La vitesse de γ en t0 est la norme de γ0 (t0 ), notée kγ0 (t0 )k.
Remarque 4.0.1. Les propriétés obtenues précédemment pour les applications, restent valides ici.
En particulier, soit I ⊂ R, γ, σ : I → Rn , toutes deux supposées dérivables, alors
1. (γ(t) + σ(t))0 = γ0 (t) + σ0 (t) ;
2. (γ(t) · σ(t))0 = γ0 (t) · σ(t) + γ(t) · σ0 (t) ;
3. (γ(t) ∧ σ(t))0 = γ0 (t) ∧ σ(t) + γ(t) ∧ σ0 (t) ;
57
4.1 - Paramétrage
Moult exemples de courbes (et plus de détails sur les courbes présentées ici) sont disponibles
(parmi une foule de références possibles) sur le site http://www.mathcurve.com/
4.1 Paramétrage
Il est parfois aussi intéressant de regarder les courbes non pas en tant que mouvement mais
pour la trace qu’elle décrit. En particulier, il peut être souhaitable de pouvoir donner un sens à la
longueur d’une trace dans l’espace. Par exemple, le cercle est décrit par l’équation x2 + y2 = 1,
c’àd. c’est l’ensemble des points de R2 satisfaisant cette relation. Mais il peut être paramétrée par
une très grande famille de courbe, e.g. R 3 t 7→ (sint, cost), ou R 3 t 7→ sin(t 2 ), cos(t 2 ) , ou encore
√ √
[−1, 1] 3 t 7→ (1 − 2t, 1[0,1] 2 t − t 2 − 1[−1,0] 2 t − t 2 ).
Définition 4.1.1. Le terme paramétrage d’une trace fait référence à une des courbes paramétrées
qui peut décrire une même trace, i.e. pour un sous-ensemble S de Rm fixé, un paramétrage est une
application (la même ou une autre) γ : I → Rn telle que Im γ = S (si S est un ensemble tordu, il se
peut qu’une telle application n’existe pas).
Le terme reparamétrage C k (où k ∈ Z≥0 ∪ {∞, ω}) fait référence à une courbe paramétrée σ :
I2 → Rm obtenue d’une courbe paramétrée γ : I1 → Rm par σ = γ ◦ f où f : I2 → I1 est bijective, de
classe C k et son inverse est de classe C k . F
La démonstration que la relation Rk (γ, σ) donnée par le fait que σ est un reparamétrage C k de γ
est une relation d’équivalence est laissée en exercice :
E XERCICE 55: Soit γ(1) : I1 → Rn et γ(2) : I2 → Rn deux courbes paramétrées. Soit k ∈ Z≥0 fixé.
Montrer que la relation définie par γ(1) ' γ(2) s’il existe un difféomorphisme de classe C k , f : I2 → I1
tel que γ(1) ◦ f = γ(2) est une relation d’équivalence, i.e.
RE1. γ(1) ' γ(1) (réflexive)
RE2. γ(1) ' γ(2) ⇒ γ(2) ' γ(1) (symétrique)
RE3. γ(1) ' γ(2) et γ(2) ' γ(3) ⇒ γ(1) ' γ(3) (transitive)
En particulier, deux courbes paramétrées γ(1) : I1 → Rn et γ(2) : I2 → Rn sont souvent dites
équivalentes s’il existe un reparamétrage C 1 , f : I1 → I2 , tel que γ(1) ◦ f = γ(2) . Les exemples 4.1.4
et 4.1.7 montrent qu’il peut y avoir deux paramétrages de la même courbe qui ne sont pas des
reparamétrages.
58
Chapitre 4 - C OURBES
et soit (
εm
1−ε cos θsi ε 6= 0
r(θ) =
r(θ) = m si ε = 0.
cos θ
Enfin, soit γ(ε) : Iε → R2 la courbe paramétrée définie par γ(ε) (θ) = r(θ)
r(θ) sin θ
. En fait, la trace des
courbes γ(ε) donne toute la famille des coniques (selon les valeurs du paramètre ε). En particulier,
2 2
σ : R → R2 définie par σ(t) = (t −mt )/2m est un reparamétrage C 1 (i.e. un paramétrage équivalent)
de la parabole γ(1) . ♣
La forme du paramétrage vue dans l’exemple précédent est relativement fréquent, au point
d’avoir un nom.
Définition 4.1.3. Un paramétrage en coordonnées polaires d’une trace est déterminé par une fonc-
tion r : I → R et défini par γ(θ) = r(θ) cos θ, r(θ) sin θ . Il est commun de demander de plus que
∀θ ∈ I, r(θ) ≥ 0. F
Outre de donner un exemple de paramétrage polaire, le prochain exemple reviendra plus tard
pour montrer que des courbes paramétrées qui ont la même trace peuvent être néanmoins différentes.
p
Exemple 4.1.4. Soit r(t) = | cos(2t)| définie sur [0, 2π], alors la courbe paramétrée en coordon-
nées polaires
p
| cos(2t)| cost
γ(t) = p
| cos(2t)| sint
dessine un échangeur d’autoroute (l’échangeur d’autoroute possède cette forme car la courbe a des
propriétés particulières). Cette courbe est appelée la lemniscate de Bernoulli, c’est aussi les points
(x, y) ∈ R2 solutions de (x2 + y2 )2 = ±(x2 − y2 ). [Le domaine de définition est parfois restreint aux
angles où cos 2t > 0, dans quel cas il s’agit des points solution de (x2 + y2 )2 = (x2 − y2 ).] ♣
Lorsqu’une courbe paramétrée γ : I → Rn est telle que γ0 (t) = 0 pour un t ∈ I, il est possible (un
peu comme dans le cas du gradient) que ce soit le signe d’un comportement étrange de la trace.
3 2
Exemple 4.1.5. Soit γ(t) = tt 2 /3
/2
une courbe paramétrée de classe C ∞ . Alors, γ0 (t) = tt s’annule
en t = 0. En fait, tout paramétrage de classe C 1 de cette trace aura la même propriété...
F IGURE 4.1 – Voici (une partie de) la trace de quelques unes de ces courbes paramétrées de
l’exemple 4.1.2 (pour m = 1 et, de gauche à droite, c = 0, 45 , 1 et 65 ).
59
4.1 - Paramétrage
F IGURE 4.2 – Le paramétrage polaire de la lemniscate (exemple 4.1.4) : à gauche le trait est noir
en t = 0 puis s’éclaircit lorsque t grandit, à droite elle est un peu déformée pour mettre en exergue
qu’il y a des rebroussements.
Pour le voir, il suffit de remarquer qu’un paramétrage C 0 de cette trace passera tôt ou tard de la
partie gauche (où la première coordonnée est négative) à la partie droite (celle où elle est positive),
en passant par le point 00 (la projection sur la première coordonnée est une bijection de la trace
de γ sur R ; il suffit de voir que π1 ◦ γ(t) = t 3 /3 est une bijection). De plus, le premier paramétrage
γ permet quand même de dire que le plan tangent à la courbe en 00 est l’axe x = 0, en prenant la
limite des plans tangents pour t 6= 0, i.e. comme tout vecteur vitesse d’un paramétrage est dans le
plan tangent (cf. théorème 3.7.9), si le paramétrage est de classe C 1 la limite des vecteurs vitesses
appartiendra à la limite des vecteurs tangents.
Soit t0 tel que φ(t0 ) = 0. Soit I 0 un voisinage de t0 tel que φ(I 0 ) = Bε (0) ∩ Im φ, i.e. φ restreinte
à I 0 est bijective sur un voisinage de la trace en l’origine. Lorsque t varie en croissant sur I 0 , φ(t)
va soit de gauche à droite, soit de droite à gauche. Dans les deux cas, la limite du vecteur vitesse
pour t < t0 et pour t > t0 existe (comme le paramétrage est supposé C 1 ), mais ces deux limites sont
forcément de signes opposés (dans un cas la seconde coordonnée croît tandis que dans l’autre elle
décroît). Il faut donc que le vecteur vitesse s’annule en ce point.
t/3
Avant de clore cet exemple, il est bon de mentionner le paramétrage σ(t) = |t|2/3 /2 qui est
de classe C 0 n’est jamais de vitesse nulle, puisque la dérivée n’est pas définie en t = 0 (ce qui
ne contredit rien de ce qui est écrit plus haut puisque la vitesse n’est pas non plus définie en ce
point). ♣
Pour parler de ce phénomène pour une trace, il est non seulement nécessaire de regarder tous
les paramétrages, mais il est parfois nécessaire, pour recouvrir un petit voisinage d’un point x d’une
trace, d’avoir à faire à plusieurs courbes paramétrées (cf. dans l’exemple 4.1.4 prendre un petit
voisinage de l’origine coupe forcément la courbe paramétrée originale).
Définition 4.1.6. Une courbe paramétrée γ : I → Rn est dite régulière si elle est de classe C 1 et
˚ γ0 (t) 6= 0 (où I˚ est l’intérieur de I).
∀t ∈ I,
60
Chapitre 4 - C OURBES
Finalement, le prochain exemple montre qu’il y a une différence non triviale entre reparamétrage
et paramétrage (et que les points singuliers peuvent être plus subtils qu’ils n’en ont l’air).
F IGURE 4.3 – Le paramétrage régulier de la lemniscate (exemple 4.1.7) : à gauche en ton de plus
en plus clairs quand le temps augmente, à droite déformé.
aura aussi pour trace la lemniscate de l’exemple 4.1.4. Avec ce paramétrage la vitesse est parfois ∞,
mais il est possible de trouver un autre paramétrage qui est une courbe paramétrée régulière. Ainsi,
lorsqu’il y a des points d’auto-intersections, deux courbes paramétrées de même trace ne sont pas
forcément un reparamétrage l’une de l’autre. ♣
Définition 4.1.8. Une division d’un intervalle est la donnée d’une suite finie ti ∈ [a, b] telle que
a = t1 < t2 < · · · < tn = b. La largeur d’une division est alors δ({ti }) = max
i∈n
(ti+1 − ti ). F
Définition 4.1.9. Une courbe paramétrée γ : [a, b] → Rn est dite C 1 par morceaux (resp. régulière
par morceaux) si elle est C 0 sur I et qu’il existe une division {ti }i∈n telle que
— γ est C 1 (resp. régulière) sur chaque intervalle ouvert ]ti ,ti+1 [
— et que ∀i ∈ n les deux limites lim± γ0 (t) existent (mais ne sont pas nécessairement égales !).
t→ti
F
Ainsi, une courbe C 1 par morceaux peut-être vue comme plusieurs courbes C 1 mises bout à
bout. Pour avoir vraiment toutes les propriétés des courbes, il est normalement nécessaire de parler
en terme de courbes paramétrées régulières. Cependant les courbes paramétrées C 1 par morceaux
apparaissent naturellement, e.g. le bord d’un pavé de R2 est la trace d’une courbe paramétrée C 1 par
morceaux.
61
4.2 - Longueur ; cas Lipschitz
E XERCICE 56: Étant donné une (demi-)chaînette (i.e. la courbe paramétrée γ : R≥0 → R2 définie
par γ(t) = (t, cht)), le but de cet exercice est de trouver une “développante”. La construction va
comme suit. Soit donné un point γ(t) ∈ Im γ.
E XERCICE 57: Dans un fameux épisode de Sherlock Holmes, notre détective favori tente de décider,
en regardant les traces qu’un vélo laisse sur le sol, dans quelle direction ce vélo allait. Quatre
hypothèses sont faites :
1- les deux roues restent toujours au sol, 2- le vélo doit toujours être en mouvement,
3- la roue avant est la roue directrice, et 4- la roue arrière est la roue tractrice.
Quelle courbes peuvent être tracées par la roue avant mais pas par la roue arrière ? Pourriez-
vous exprimer l’une en fonction de l’autre ? Que se passe-t-il si les hypothèses sont modifiées ?
Une des quantités importantes qu’il est souhaitable d’associer à une courbe est sa longueur 1 . Le
principe de base ici est le théorème de Pythagore (ou plutôt la notion de distance) : soit a, b ∈ R>0 ,
et soit γ : [0, 1] → R2 la courbe paramétrée définie par γ(t) = (at, bt), il faudrait que la longueur de
√
γ soit a2 + b2 .
1. Tout ce qui se trouve après la proposition 4.2.3 est pour la curiosité du lecteur uniquement.
62
Chapitre 4 - C OURBES
Pour parler de la longueur d’une courbe paramétrée γ : [a, b] → Rm , la courbe sera approximée
par des segments (alias une courbe polygonale). Si l’approximation est bonne (pour une certaine
famille), la longueur pourra être définie.
Définition 4.2.1. Soit γ : [a, b] → Rm une courbe paramétrée (C 0 ), sa longueur [d’arc] est
n−1
Long(γ) = sup ∑ kγ(ti ) − γ(ti+1 )k,
a=t1 <···<tn =b i=1
le supremum étant pris sur toutes les divisions de l’intervalle [a, b] (en n − 1 morceaux, n pouvant
être aussi grand que voulu).
La courbe paramétrée γ est dite rectifiable si le supremum ci-dessus (sa longueur) est fini. F
La première remarque à faire à partir de cette définition, est qu’elle invariante sous reparamé-
trage C 0 . À partir de là, il n’est pas très dur (exercice) de montrer que, si la courbe n’a qu’un nombre
fini d’intersection avec elle-même, elle ne dépend pas du paramétrage.
Notons que γ étant continue et définie sur un compact, son image est bornée. Une suite de
divisions {ti,(k) }i∈nk de l’intervalle qui donne une approximation par des segments de longueur totale
de plus en plus en grande est forcément une suite de divisions qui contient des bouts de plus en plus
lim min |ti+1,(k) − ti,(k) | = 0.
petits, i.e. k→∞
i∈k
Pour une suite croissante {ti }i∈n d’éléments de [a, b] (i.e. t1 n’est pas nécessairement a et tn n’est
pas nécessairement b), introduisons la notation
n−1
Σγ ({ti }) = ∑ kγ(ti ) − γ(ti+1 )k.
i=1
Remarque 4.2.2. Grâce à l’inégalité du triangle, il est facile (mais très important) de constater
que si une division {ti0 } est obtenue d’une division précédente {ti } en coupant un peu plus finement
(i.e. en ajoutant un ou plusieurs réels dans la suite {ti }) alors Σγ ({ti }) ≤ Σγ ({ti0 }). Autrement dit,
couper plus finement rapproche toujours du supremum dans la définition 4.2.1 de la longueur. Ceci
ne veut pas pour autant dire que n’importe quelle division avec beaucoup de points est bonne. ♠
Rappelons qu’une application F : S → Rm est Lipschitz si ∃K ∈ R>0 tel que ∀x, y ∈ S, kF(x) −
F(y)k ≤ Kkx − yk. Lorsque la constante K est connue, le terme K-Lipschitz est alors employé.
Proposition 4.2.3
Si γ : [a, b] → Rm est Lipschitz, alors γ est rectifiable.
D ÉMONSTRATION : Si γ est Lipschitz et soit K ∈ R>0 alors, pour toute division de [a, b]
n−1 n−1
Σγ ({ti }) = ∑ kγ(ti ) − γ(ti+1 )k ≤ ∑ K|ti − ti+1 | ≤ K(b − a).
i=0 i=0
Ainsi le supremum est forcément fini, puisque c’est le supremum d’un ensemble contenu dans
[0, K(b − a)].
63
4.2 - Longueur ; cas Lipschitz
Il est relativement facile de construire une fonction qui est Lipschitz mais non dérivable sur un
ensemble dense (e.g. les fractions binaires). À ce titre, il est justifié de se demander si ce critère est
complet, c’àd. une courbe paramétrée rectifiable est-elle Lipschitz. Le théorème suivant est présenté
pour la curiosité du lecteur :
Théorème 4.2.4
Si γ est rectifiable, alors il existe un reparamétrage C 0 de γ qui est un paramétrage Lipschitz
de Im γ, i.e. ∃ f : [0, L0 ] → [a, b] un difféomorphisme C 0 (alias un homéomorphisme, alias une
application bicontinue) tel que γ ◦ f est une courbe Lipschitz (de même trace que γ).
Ainsi, une courbe est rectifiable si et seulement si il existe un reparamétrage C 0 qui est Lipschitz.
D ÉMONSTRATION : Supposons que γ est rectifiable et soit L = Long(γ). Alors ∀c ∈ [a, b], γ[a,c]
est aussi rectifiable. Soit A (c) = Long(γ[a,c] ) la longueur de ce sous-arc de la courbe.
La démonstration de la continuité de A sera d’abord faite. Supposons que ck est une suite telle
que lim ck = c et | lim A (ck ) − A (c)| > ε. Par continuité de γ, soit δ tel que ∀t tel que |t − c| <
k→∞ k→∞
δ, kγ(t) − γ(c)k < ε/60. Puis par définition de la limite, soit k0 tel que ∀k ≥ k0 , |ck − c| < δ. Enfin,
soit cM = max( sup ck , c) et cm = min(k≥k
inf ck , c).
k≥k0 0
Montrons d’abord qu’une bonne division de [a, cM ] donne lieu à une bonne division de tous les
[a, ck ] (k ≥ k0 ) et de [a, c]. Soit {ti }i∈n une division telle que A (cM ) − Σγ ({ti }) < 6ε et que cette
division contienne cm et c. Soit {ti,k 0 }
i∈n0 = {ti }i∈n ∩ [a, ck ] ∪ {ck } (la même construction se fait
pour c). [Par contradiction] Supposons que A (ck ) − Σγ ({ti,k 0 }) > ε , alors il doit exister en particu-
4
lier une division {ti00 } de [a, ck ] telle que Σγ ({ti00 }) − Σγ ({ti,k
0 }) > ε et que cette division contient c.
4
Alors, comme en général ∀s0 ∈ {si } un découpage de [a, cM ], Σγ ({si }) = Σγ ({si } ∩ [a, s0 ]) + Σγ ({si } ∩
[s0 , cM ]), il apparaît que si tM,k est le plus grand des ti tel que ti < ck ,
64
Chapitre 4 - C OURBES
γ(c)k, car il n’y a plus d’éléments de {ti } entre c et ck (le signe dépend du signe de ck − c). Ainsi,
|A (ck ) − A (c)| = |A (ck ) − Σγ ({ti0 }) + Σγ ({ti0 }) − Σγ ({ti } ∩ [a, c]) + Σγ ({ti } ∩ [a, c]) − A (c)|
≤ |A (ck ) − Σγ ({ti0 })| + |Σγ ({ti0 }) − Σγ ({ti } ∩ [a, c])| + |Σγ ({ti } ∩ [a, c]) − A (c)|
≤ 4ε + 60
ε
+ 4ε = 31
60 ε < ε
Alors A 0 : [a, b] → [0, L0 ] est strictement croissante (puisqu’elle vient d’une fonction croissante qui
a été modifiée pour ne plus être constante). Elle est de plus continue, donc sa réciproque f = A −1
est aussi continue (et strictement croissante). Il reste à montrer que γ ◦ f est Lipschitz. Or, l’arc de
γ ◦ f (s) à γ ◦ f (s0 ) (disons que s < s0 ) se caractérise par le fait que toute subdivision est la longueur
inférieure ou égale à s0 − s (strictement inférieure s’il s’agit d’une région où la courbe s’arrête).
En particulier, le segment direct entre les deux points (la division “triviale” qui est faite en ne
regardant que les deux extrémités) le sera. Ainsi, kγ ◦ f (s) − γ ◦ f (s0 )k ≤ ks − s0 k. Autrement dit, ce
paramétrage est 1-Lipschitz.
En fait, comme A est croissante, le seul souci qui pourrait arriver dans son inversion est un
“plateau” dans son graphe, i.e. un endroit où elle ne croît pas. À toute fin pratique, il est possible de
prendre f directement comme une réciproque de A (c’àd. une fonction dont le graphe la réflection
par rapport à la droite x = y du graphe de A , et, aux endroits où un plateau à été transformé en
un segment vertical, f prend comme valeur n’importe quel point de ce segment) alors γ ◦ f est
exactement 1-Lipschitz partout, i.e. ∀t ∈ [0, L], v(t) := lim sup kγ◦ f (t+h)−γ(t)k
h = 1.
h→0
Ceci motive de regarder des courbes qui ne font pas de “pauses” ou qui ne s’arrêtent pas en un
point pendant un certain temps.
Définition 4.2.5. Une courbe γ : [a, b] → Rm est dite monotone si ∀c ∈ [a, b], ∃ε ∈ R>0 tel que
γ]c−ε,c+ε[ est injective. F
En refaisant la démonstration du théorème 4.2.4 pour une courbe monotone, il apparaîtra que la
fonction A est strictement croissante. Le reparamétrage est alors directement donné par l’inverse
de cette fonction (il sera rencontré de nouveau sous des atours plus accorts).
65
4.3 - Longueur ; cas C 1 par morceaux
de relier plus fortement la dérivée à la longueur. Une petite variation de t donne lieu à une variation
γ0 (t) de la courbe. Or la longueur de γ0 (t) est kγ0 (t)k. Pour avoir la longueur totale, l’intuition indique
qu’il suffit de faire la somme de ces petites variations, autrement dit l’intégrale de kγ0 (t)k. Un lemme
préparatoire est nécessaire :
Lemme 4.3.1
Soit I un intervalle et γ : I → Rn une courbe paramétrée alors
Z
Z
γ
≤ kγk,
I I
où l’intégrale de gauche est une intégrale coordonnée par coordonnée ( c’àd. elle a pour résultat
R
le vecteur dont la ième coordonnée est I γi ).
Proposition 4.3.2
Soit γ : [a, b] → Rn une courbe paramétrée C 1 par morceaux, alors
Z b
Long(γ) = kγ0 (t)kdt,
a
D ÉMONSTRATION : Si la courbe n’est que C 1 par morceaux, il suffit de regarder ce qui se passe
sur chaque morceau ; en effet, il est toujours possible de supposer que la division qui est employée
pour s’approcher du supremum, contient les points où la courbe n’est pas C 1 . Par conséquent, il sera
supposé que γ est de classe C 1 .
Il sera démontré que ∀ε > 0, Long(γ) − I kγ0 (t)kdt < ε. Soit fixé un ε.
R
Tout d’abord, comme γ0 est continue sur [a, b] (un compact), elle est uniformément continue.
Ainsi, ∀ε, ∃δ0 tel que |t − s| < δ0 ⇒ kγ0 (s) − γ0 (t)k < 4(b−a)
ε
.
En particulier, kγ0 k sera aussi uniformément continue, avec le même paramètre : |t − s| < δ0 ⇒
0
kγ (s)k − kγ0 (t)k < ε . Par définition de l’intégrale de Riemann (en une variable) et la preuve
4(b−a)
du lemme 4.3.1, si {ti }i∈n est une division de [a, b] telle que δ({ti }) < δ0 , alors
Z b n−1
0 sup 0
kγ (t)kdt − (t − t ) kγ (t)k < ε/4
a
∑ i+1 i t∈[ti ,ti+1 ]
i=1
Ensuite, soit {ti }i∈n une division de [a, b] telle que sa largeur δ({ti }) est < δ0 et que Long(γ) −
Σγ ({ti }) < ε/4 (il suffit de prendre une division qui donne une bonne approximation [qui existe par
66
Chapitre 4 - C OURBES
définition du sup] puis de lui rajouter des points [ce qui ne peut que la rapprocher du sup]). Alors
n−1 n−1
Long(γ) − R b kγ0 (t)k ≤ |Long(γ) − Σγ ({ti })| + ∑ kγ(ti ) − γ(ti+1 )k − ∑ kγ0 (ti )k(ti+1 − ti )
a
i=1 i=1
n−1 n−1
+ ∑ kγ (ti )k(ti+1 − ti ) − ∑ (ti+1 − ti ) sup kγ0 (t)k
0
i=1 i=1 t∈[ti ,ti+1 ]
n−1
+ ∑ (ti+1 − ti ) sup kγ0 (t)k − ab kγ0 (t)kdt
R
i=1 t∈[ti ,ti+1 ]
n−1
ε 0
< 4 + ∑ kγ(ti ) − γ(ti+1 )k − kγ (ti )k(ti+1 − ti )
i=1
n−1
+ ∑ (ti+1 − ti )kγ0 (ti )k − sup kγ0 (t)k + 4ε
i=1 t∈[ti ,ti+1 ]
n−1 n−1
< 2ε kγ(t − − k(t − 0 (t )k + ε
4 + ∑ i ) γ(t i+1 )k i+1 t i )γ i ∑ (ti+1 − ti ) 4(b−a)
i=1 i=1
n−1
< 3ε + kγ(t ) − γ(t )k − k(t − t )γ 0 (t )k
4 ∑ i i+1 i+1 i i
i=1
Pour le dernier terme, il faut faire un peu attention. Tout d’abord γ(ti+1 ) − γ(ti ) = ttii+1 γ0 (s)ds (où
R
l’intégrale est à prendre, comme précédemment, coordonnée par coordonnée). Par conséquent
Z ti+1
γ(ti+1 ) − γ(ti ) = (ti+1 − ti )γ0 (ti ) + (γ0 (s) − γ0 (ti ))ds.
ti
Si bi = ttii+1 (γ0 (s) − γ0 (ti ))ds, alors kbi k < (ti+1 − ti ) 4(b−a)
R ε
(par continuité uniforme). En notant,
ai = k(ti+1 − ti )γ0 (ti )k, il apparaît que kγ(ti ) − γ(ti+1 )k = kai + bi k. Le dernier terme à majorer est
une somme de |kai + bi k − kai k|, dont chacun est ≤ kbi k. D’où
Z b n−1
Long(γ) − kγ0 (t)k <
3ε ε
4 + ∑ (ti+1 − ti ) 4(b−a) = ε.
a i=1
Remarque 4.3.3. La démonstration ci-dessus peut s’étendre au cas où γ n’est que Lipschitz. En
effet, il faut alors définir vγ (t) = lim suph→0 kγ(t+h)−γ(t)k
h . Le résultat obtenu est alors que Long(γ) =
Rb
a v(t)dt. La définition faite ici permet en fait de parler de courbe dans un espace métrique général.
asd ♠
67
4.3 - Longueur ; cas C 1 par morceaux
Ainsi, pas d’analogues du théorème 3.1.6 des valeurs intermédiaires pour les courbes paramé-
trées (et conséquemment pour les applications en général). Ceci n’empêche pas qu’il est possible
d’appliquer ce théorème à chaque fonction coordonnée (mais le s est alors différent pour chacune).
Ceci mène à des complications qui sont essentiellement aussi embêtantes que celles qui se trouvent
dans la démonstration ci-dessus (c’est le célèbre principe de conservation des emmerdements). ♠
Exemple 4.3.5. Une courbe paramétrée très importante est la cycloïde alias la brachistochrone
alias la tautochrone. Il s’agit de γ : [0, π] → R2 définie par
t − sint
γ(t) = .
cost
Sa longueur est
Z π√ √ Z 1
u
Z πq
(1 − cost)2 + sin2 tdt = 2 1 − costdt = 4 √ du = 4
0 0 0 1 − u2
où le changement de variable cost = 1 − 2u2 a été utilisé. Il est bon de vérifier que cette longueur
√
est plus grande que celle de la droite qui relie les deux points ( π2 + 22 ' 3, 72), car dans le plan,
la droite est le chemin le plus court (comme il sera démontré à l’exercice 74). ♣
Si la courbe paramétrée est C 1 par morceaux alors kγ0 (t)k est bornée et continue en dehors d’un
ensemble négligeable (des points). Par conséquent, la longueur est toujours définie. Par contre, en
général, il existe des courbes C 0 sur [0, 1], C 1 sur[[
]0, 1] et qui ne sont pas de longueur bornée.
Alors γ0 (t) est définie partout (sauf en 0) et γ(t) est continue, mais l’intégrale (impropre) de sa
longueur ne converge pas (elle tend vers l’infini). Pour les détails, voir l’exercice 58. ♣
Remarque 4.3.7. Néanmoins, lorsque I n’est pas un intervalle borné ou que γ0 n’est pas bornée,
il est possible de montrer que la proposition 4.3.2 reste vraie, i.e. que si l’intégrale impropre est
divergente la courbe n’est pas rectifiable. ♠
68
Chapitre 4 - C OURBES
Remarque 4.3.8. Une erreur qui fut fatale à plusieurs est de croire que la longueur d’une courbe
est quelque chose qui se comporte bien, c’àd. que si deux courbes sont proches, alors leur longueurs
sont proches. C’est totalement faux.
Un premier exemple est la suite de courbes qui consiste à approcher la diagonale d’un triangle
rectangle par un escalier dont les marches sont de plus en plus fines. En effet, si a est la base, b la
hauteur et c l’hypoténuse du triangle, alors c2 = a2 + b2 par Pythagore. Cependant, un escalier (aussi
proche de l’hypoténuse soit-il) aura longueur a + b (voir dessin ci-dessous à gauche). Remarquez
√
que a + b ≥ a2 + b2 .
Long(γ)= 0 0
R R
I kγ (t)kdt = f (I ) kγ (t)kdt
R1 0 0
R 2 0
f (t) kdt= I2 kγ f (t) f 0 (t)kdt
= I | f (t)|kγ
R2 0
= I2 kσ (t)kdt.
E XERCICE 59: La chaînette (ou caténaire, du latin catena signifiant chaîne) est la trace de la
t
courbe paramétrée γ : R → R2 définie par γ(t) = cht
. Paramétrer cette courbe par la longueur
d’arc.
69
4.3 - Longueur ; cas C 1 par morceaux
t −t t
e −e−t
[Quelques relations utiles sur les fonction hyperboliques : cht = e +e 2 , sht =
2
2 , ch t −
sh2 t = 1, ch0 t = sht et sh0 t = cht. Les fonctions inverses s’appellent (en français) argsht = ln(t +
√ √
t 2 + 1) (définie ∀t ∈ R) et argcht = ln(t + t 2 − 1) (définie sur R≥1 ).]
[Cette trace est la forme qu’aurait une corde (ou chaîne) inélastique et de masse uniforme suspendue
entre deux points, lorsqu’elle se courbe sous son propre poids. En la regardant la tête à l’envers, cela
donne ainsi la forme de l’arc qui sous l’effet de la gravité subit le moins de force possible (seule
la force de sustension). Il a longtemps été supposé que cette forme était celle d’une parabole. Suite
à un défi de Jacques Bernoulli, les mathématiciens Leibniz, Jean Bernoulli et Huygens ont trouvé
indépendamment la réponse en 1691. Beaucoup d’architectes s’en sont servi lorsque les matériaux
plus modernes (e.g. le béton) l’ont rendu possible, e.g. Gaudi. Par ailleurs, un détour par Florence
vous convaincra qu’une section du dôme de la cathédrale est plus proche d’une chaînette que d’une
parabole.]
3
E XERCICE Soit a, b ∈ R. L’hélicoïde est la courbe paramétrée γ : [0, 2π] → R définie par
a cost60:
γ(t) = a sint . En trouver la longueur.
bt
[Ci-dessous un hélicoïde (à gauche) et une spirale logarithmique (à droite).]
E XERCICE 61: La spirale logarithmique est la trace de la courbe paramétrée γ : R≥0 → R2 définie
−t
par γ(t) = ee−t cost
sint .
a. Trouver un autre paramétrage σ, tel que σ : [0, 1] → R2 a pour image γ(R≥0 ) ∪ 0. [Indice :
t
]] inverser l’application t 7→ 1+t qui envoie R≥0 sur [0, 1[.]
b. Montrer que ce paramétrage est C 1 . [Seule une des deux extrémités de [0, 1] peut créer des
soucis.]
c. Pourquoi σ est-elle de longueur finie ?
d. Trouver la longueur de cette trace. [Il est fortement recommandé d’utiliser plutôt le para-
métrage γ, même si l’intégrale est impropre. Comme la courbe paramétrée n’est pas définie
sur un intervalle, il faut regarder les longueurs de γ[0,c] pour c ∈ R>0 puis faire tendre vers
+∞.]
bout du fil. Le but est de montrer que le pendule décrit un cycloïde sous oscillation. Soit t ∈ [−π, π].
70
Chapitre 4 - C OURBES
a. Soit γ(t) le point où le fil quitte la structure métallique. Donner la longueur de la cycloïde
entre γ(t) et 04 .
La courbe décrite par le pendule dans l’exercice précédent est une “développante” du cycloïde.
L’exercice suivant montre l’importance de cette courbe en horlogerie.
E XERCICE 63: Le but de cet exercice est de montrer que tout corps glissant sans frottement sur
une cycloïde prend toujours le même temps pour atteindre le creux γ(π) (dans le paramétrage de
l’exercice 62).
a. Calculer la longueur d’arc entre γ(π) et γ(t). Cette “distance au creux” sera appelée doré-
navant z.
γ0 (t)
b. Au point γ(t), l’accélération donnée par la gravité dans la direction de la courbe est kγ(t)k ·
0 00 1
−1 . En déduire que z = − 2 z.
c. Résoudre cette équation (i.e. écrire z(τ)) en utilisant les conditions initales z(0) = z0 et
z0 (0) = 0.
d. Conclure.
Définition 4.4.1. Une courbe paramétrée est dite paramétrée par la longueur d’arc, si le vecteur
vitesse est unitaire (lorsqu’il est défini), i.e. kγ0 (t)k = 1. F
Il est aussi possible de parler de “paramétrée par la longueur d’arc par morceaux”, dans quel
cas, en un nombre fini de point seul les limites à gauche et à droite de γ0 (t) existent et sont de norme
1.
S’il existe, ce paramétrage n’est pas tout à fait unique, puisque le paramétrage dans le sens
inverse a la même propriété. Par contre, si un paramétrage est équivalent, il faut que le difféomor-
phisme réalisant l’équivalence f satisfasse | f 0 (t)| = ±1 ce qui implique (comme f est C 1 ) que
71
4.4 - Paramétrage par la longueur d’arc
f 0 (t) ≡ 1 ou −1. Ainsi, deux paramétrages par longueur d’arc équivalents sont reliés par un f de
la forme t 7→ a ± t où a ∈ R. Ceci est aussi relié au fait que les courbes dans Rm n’ont que deux
orientations (direction de parcours) possibles. Montrons maintenant que ce paramétrage existe dans
une classe raisonnable de cas.
Une remarque simple, préalable à l’existence de tels paramétrages, est qu’une courbe régulière
doit forcément avoir une longueur strictement positive (l’intégrale d’une quantité > 0 sur un inter-
valle de longueur > 0 est > 0).
Proposition 4.4.2
Soit γ : [a, b] → Rm une courbe paramétrée régulière, soit L = Long(γ) > 0, alors il existe g :
[0, L] → [a, b] un difféomorphisme C 1 tel que γ ◦ g est un paramétrage de Im γ par la longueur
d’arc.
2 arccos(1− 4t ). Le nouveau paramétrage est σ(t) = γ g(t) = γ(2 arccos(1− 4t )). Comme sin arccos B =
√
1 − B2 , il apparaît que
√
t (4 − t) t 2 − 8t (4 − t)2 − 8
γ g(t) = 2 arccos(1 − 4 ) − , ,
8 8
72
Chapitre 4 - C OURBES
Exemple 4.4.5. Soit γ : R≥0 → R2 la courbe paramétrée (une moitié de parabole semi-cubique)
3
définie par γ(t) = tt 2 /3
/2
. Pour trouver un [re]paramétrage par la longueur d’arc, il faut d’abord
2
calculer la fonction de la longueur d’arc : γ0 (t) = tt , d’où
Z sp Z s p
A (s) = t 2 + t 4 dt = t 1 + t 2 dt = 13 (1 + s2 )3/2 − 31 .
0 0
E XERCICE 64: Trouver un paramétrage par la longueur d’arc (par morceaux) de la courbe para-
3 t
métrée γ : [0, π2 ] → R2 définie par γ(t) = cos
sin t (il s’agit d’un morceau d’hypocycloïde [à 4 pointes]).
3
E XERCICE 65: Soit γ : [−π, π] → R2 la courbe paramétrée (nommée cardioïde) définie par γ(t) =
cost(1+cost)
sint(1+cost)
.
a. Donner la longueur d’arc de γ au temps s ∈ [−π, π], c’àd. calculer A (s) = Long(γ[0,s] ).
b. Paramétrer la courbe γ par la longueur d’arc, i.e. trouver f : [0, Longγ] → [a, b] tel que,
pour s ∈ [0, Longγ], Long γ ◦ f[0,s] = s.
E XERCICE 66: Soit γ la courbe paramétrée (épicycloïde) définie de [0, 2π] dans R2 par
γ(t) = R cost − cos(Rt), R sint − sin(Rt) ,
73
4.4 - Paramétrage par la longueur d’arc
-6 -4 -2 2 4 6
-2
-4
-6
74
Chapitre 4 - C OURBES
E XERCICE 68: La développante du cercle est la courbe décrite par la main de quelqu’un qui dé-
roule une bobine circulaire (fixe). Pour un cercle de rayon 1 centré en 0 ∈ R2 , ceci donne la courbe
paramétrée γ : R≥0 → R2 définie par
cost + t sint
γ(t) = .
sint − t cost
Donner la fonction de longueur d’arc A : R≥0 → R≥0 qui à t ∈ R≥0 associe la longueur de la
courbe entre γ(0) et γ(t). Donner σ un reparamétrage C 1 de γ qui est un paramétrage par la lon-
gueur d’arc.
E XERCICE 69: Xorqui a trouvé une courbe paramétrée fantastique qu’il décide de nommer le iou-
teurnoïde rectibaladant. En se penchant sur sa feuille, vous y lisez le paramétrage γ : R → R2 défini
par
ln cht
γ(t) = .
2 arctg th 2t
Donner la fonction de longueur d’arc A : R → R≥0 qui à t ∈ R≥0 associe la longueur de la courbe
entre γ(0) et γ(t). Ce paramétrage a-t-il quelque chose de particulier ?
E XERCICE 70: Xorqui a trouvé une seconde courbe paramétrée fantastique qu’il décide de nommer
la patatoïde parachevée. En se penchant sur sa feuille vous y lisez le paramétrage γ : [0, 2π] → R2
défini par
4 cost − cos(4t)
γ(t) = .
4 sint − sin(4t)
a. Calculer la norme du vecteur vitesse γ0 de ce parametrage. Trouver les points où le paramé-
trage n’est pas régulier (i.e. les points où le vecteur vitesse est nul).
b. Donner la fonction de longueur d’arc A : [0, 2π] → R≥0 qui à s ∈ [0, 2π] associe la longueur
√
de la courbe entre γ(0) et γ(s). [Attention : a2 = |a|.]
c. À partir de la fonction A trouvée, indiquer pourquoi il n’y a pas de reparamétrage C 1
de γ qui est un paramétrage par la longueur d’arc. [Attention : Le problème est lié à la
régularité ; il est possible de trouver un reparamétrage C 0 qui donne, en les points où la
vitesse est définie, un paramétrage par la longueur d’arc.]
4
E XERCICE 71: Soit γ : R → R2 la courbe définie par γ(t) = tt 6 /4
/6
.
a. Est-ce un paramétrage régulier ?
75
4.5 - Intégrale curviligne et travail
σ : [0, 1] → R2
t 4 /4
t 7→ t 6 /6
Comme voulu, Long(γ) = γ 1 et, avec les même arguments que pour montrer l’invariance de la
R
longueur sous paramétrages équivalents, il est possible de vérifier que cette quantité ne dépend pas
de la classe d’équivalence du paramétrage choisi.
E XERCICE 72: Montrer que la définition d’intégral curviligne est invariante sous reparamétrage
C 1.
Le centre de gravité d’une courbe γ : [a, b] → Rm est le centre de masse d’un fil (rigide, e.g. de
T
cuivre) de densité constante. Formellement, si γ(t) = γ1 (t), γ2 (t), . . . , γm (t) , c’est le vecteur x tel
que
Z b Z b
1 1 1
Z
πi (x) = xi = πi = πi (γ(t))kγ0 (t)k = γi (t)kγ0 (t)k.
Long(γ) γ Long(γ) a Long(γ) a
√
Exemple 4.5.2. Soit γ : [−1, 1] → R2 la courbe paramétrée définie par γ(t) = (t, 1 − t 2 ). Sa trace
est un demi-cercle et kγ0 (t)k = √1−t
1
2
. Sa longueur se calcule (ou se vérifie, ou se devine) comme
étant π. Son centre de gravité est ainsi
R1 ! !
t
1 −1 √1−t 2
dt 0
R1 = 2 . ♣
−1 1dt
π π
76
Chapitre 4 - C OURBES
Un autre concept important où intervient l’intégration le long d’une courbe en physique est le
travail. Rappelons que, dans un cas simple, si une force F est exercée dans le même sens qu’un
déplacement s (linéaire), le travail est alors Fs. Lorsque la force est dans le sens contraire du dépla-
cement, la convention est alors que le travail est −Fs. Et quand il n’y a pas colinéarité, il suffit de
regarder la composante de la force qui est dans le sens du mouvement.
Dans un cas plus compliqué, une particule se déplace dans Rm et son mouvement est décrit par
une courbe paramétrée γ : [a, b] → Rm (c’àd. qu’au temps t ∈ [a, b], la particule se trouve en γ(t) ∈
Rm ). Supposons qu’une des forces qui s’opère sur elle ne dépend que de sa position. Autrement dit,
la force est donnée par un champ de vecteurs F : Rm → Rm . Il est alors possible de généraliser la
notion ci-dessus du travail qu’effectue la force F le long de γ :
Définition 4.5.3. Soit U ⊂ Rm un ouvert, soit γ : [a, b] → U une courbe C 1 par morceaux et soit
F : U → Rm un champ de vecteurs. Alors le travail de F le long de γ est, lorsque définie, l’intégrale
Z Z b
F γ(t) · γ0 (t)dt.
F · ds = F
γ a
Le travail n’est pas tout à fait indépendant du paramétrage. En effet, l’expression F γ(t) · γ0 (t)
s’écrit aussi kF γ(t) k kγ0 (t)k cos ∠ F(γ(t)), γ0 (t) . Si le cos ne dépendait pas de γ0 (t), le contexte
serait de nouveau celui de l’intégrale curviligne. Cependant, deux paramétrages équivalents ont en
un point fixé de la trace des vecteurs tangents colinéaires, ainsi le cos ne peut au plus changer que
d’un signe. Comme un difféomorphisme f entre deux intervalles est soit croissant soit décroissant,
le signe de f 0 donnera cette différence. D’où :
Proposition 4.5.4
Soit U un ouvert, soit γ1 : [a, b] → U une courbe paramétrée de classe C 1 par morceaux, soit
f : I → [a, b] un difféomorphisme de classe C 1 , et soit F : U → Rm un champ de vecteurs. Si
0
R R R
γ1 F · ds existe et γ2 = γ1 ◦ f , alors γ2 F · ds = sgn( f ) γ1 F · ds.
champ de forces gravitationnelles ou électriques engendré par une masse ou une charge). Soit z ∈
Rm r {0}, soit a ∈ R et soit γ1 : [0, a] → Rm r {0} la courbe paramétrée définie par γ1 (t) = (1 +t)z.
Alors γ01 (t) = z, et
Z a Z a
cz c 1 c
Z
1
F · ds = 2 3
· zdt = 2
dt = (1 − 1+a ).
γ1 0 (1 + t) kzk kzk 0 (1 + t) kzk
Soit maintenant γ2 : [a, b] → Rm r{0} définie par γ2 (t) = kzk(cost, sint). Alors γ02 (t) = kzk(− sint, cost)
et, ∀t ∈ [a, b], F(γ2 (t)) · γ02 (t) = 0. Ainsi, le travail de F le long de γ2 est nul.
Il est possible de construire, en combinant (plusieurs fois) ces deux chemins, toutes sortes de
chemins C 1 par morceaux allant de x à y tels que le travail de F le long de ces chemins est (indé-
c c
pendamment du chemin) kxk − kyk . Ceci illustre une propriété des champs vectoriels qui découlent
d’un potentiel ; une idée qui sera explorée plus tard. ♣
77
4.6 - Courbure
E XERCICE 74: “Les droites minimisent la longueur.” Soit γ : [a, b] → Rm une courbe paramétrée
telle que γ(a) = p et γ(b) = q. Montrer que pour tout vecteur v de norme kvk = 1
Z b Z b
0
(q − p) · v = γ (t) · v dt ≤ kγ0 (t)k dt.
a a
c’àd. que la courbe la plus courte de p à q est le segment de droite joignant les deux points. Déter-
miner toutes les courbes (de classe C 1 par morceaux) qui réalisent l’égalité.
E XERCICE 75: Soit γ : I → Rm une courbe régulière. Soit x un point qui n’est pas sur la trace, et
soit y = γ(t0 ) le point sur la courbe qui est plus le proche de x (il n’est pas forcément unique), c’àd. :
∀t ∈ I, kx − yk ≤ kx − γ(t)k.
Dire pourquoi il existe un tel point y. Montrer que le vecteur x − y est orthogonal à la courbe au
point y.
4.6 Courbure
Même si pour l’instant seule la vitesse a été définie, il est (d’un point de vue de la physique
newtonienne) normal de parler d’accélération. Le vecteur accélération est simplement défini comme
2
étant γ00 (s) = dsd γ0 (s) = dsd 2 γ(s) = D21 γ(s).
Pour analyser plus finement le comportement des courbes il faut introduire un triplet de vecteurs
unitaires. Le premier d’entre eux est le vecteur unitaire tangent,
γ0 (t)
T̂γ (t) = .
kγ0 (t)k
Lorsqu’une courbe est paramétrée par la longueur d’arc, γ0 (s) = T̂γ (s). Il est possible de voir T̂γ
comme une nouvelle courbe paramétrée, elle aura comme particularité que sa trace (Im T̂γ ) est dans
la sphère de Rm (l’ensemble des points de norme 1). Le lemme suivant donne une propriété utile de
ces courbes.
Lemme 4.6.1
Soit σ : [a, b] → Rm une courbe paramétrée de classe C 1 telle que ∀t ∈ [a, b], kσ(t)k = 1. Alors
σ0 (t) est orthogonal à σ(t), i.e. ∀t ∈ [a, b], σ0 (t) · σ(t) = 0.
En particulier, lorsque la courbe est paramétrée par la longueur d’arc, le vecteur accélération est
orthogonal au vecteur vitesse. En fait, pour un tel paramétrage, la variation du vecteur unitaire
tangent exprime à quelle vitesse la courbe tourne. En effet, voici le cas modèle :
78
Chapitre 4 - C OURBES
Exemple 4.6.2. Soit r ∈ R>0 et soit γ : R → R2 la courbe paramétrée définie par γ(t) = rr cos(t/r)
sin(t/r)
(la trace de cette courbe est le cercle). Ce paramétrage est déjà un paramétrage par la longueur d’arc
et
− sin rt t
0 00 1 cos r
γ (t) = et γ (t) = − r .
cos rt sin rt
En particulier, kγ00 (t)k = r−1 , i.e. l’accélération est plus grande quand le rayon est petit. Ceci est
justifié comme suit, comme toute courbe “parcourt” une distance t en un temps t, plus le rayon est
petit, plus la courbe fait un tour rapidement et donc plus le vecteur tangent unitaire fait (lui aussi)
un tour rapidement. ♣
Définition 4.6.3. La courbure d’une courbe paramétrée γ paramétrée par la longueur d’arc est
définie par κγ (t) = k dtd T̂γ (t)k = kγ00 (t)k. Le vecteur unitaire normal est le vecteur N̂γ (t) tel que
κγ (t)N̂γ (t) = γ00 (t). F
Par le lemme 4.6.1, le vecteur normal unitaire N̂ est orthogonal au vecteur tangent unitaire T̂. Le
plan engendré par le vecteur unitaire tangent et le vecteur unitaire normal est appelé plan osculateur.
Remarque 4.6.4. D’autre part, la physique nous apprend deux choses : a- la force est proportion-
nelle à l’accélération et b- la force nécessaire pour qu’une particule à vitesse constante décrivent un
cercle est inversement proportionnelle au rayon de ce cercle. Ceci n’est qu’une reformulation de ce
qui est écrit plus haut. Par contre, cette remarque est intéressante pour ce qui est du tracé de chemins
de fers (et aussi de routes). En effet, un train suivant son trajet exercera une force latérale sur les
rails dès qu’il y a courbure. Un aspect important lors du tracé est de faire en sorte que la courbure
n’augmente jamais de manière brutale. Les mauvais tracés (faits par exemple en mettant bout à bout
des arcs de cercles et des droites) ont pour effet d’user prématurément les rails (voire de provoquer
des accidents).
De la même manière, pour les tracés de route, de telles combinaisons (droites et cercles) sont à
éviter pour que le conducteur n’ait pas à tourner brusquement le volant [et/ou que les passagers ne
soient pas trop bringueballés]. ♠
Plusieurs courbes (en particulier, la lemniscate et la spirale de Cornu [alias clothoïde]) voient
ainsi leur apparition sur les cartes et les vues du ciel. Par exemple, dans une lemniscate, la courbure
est proportionnelle à la distance à l’origine. En parcourant une spirale de Cornu à vitesse constante,
la courbure croît de façon linéaire (dans une voiture à vitesse constante il faudrait tourner le volant
de manière progressive).
La courbure a une interprétation géométrique simple comme le rayon d’un cercle qui est tangent
à la courbe à ce point (son centre est dans la direction de N̂). Si la courbe est plane en cet endroit,
tout cercle de rayon plus grand (et inscrit dans le plan osculateur) passant par γ(t) devrait couper la
courbe. De ce fait, le rayon de ce cercle en γ(t) est le rayon de courbure de la courbe γ en γ(t) est
défini comme étant Rγ (t) = κγ1(r) (dans le cas de 4.6.2, ceci est bien le rayon du cercle décrit).
79
4.6 - Courbure
Définition 4.6.5. Le centre de courbure au point γ(t) est le centre de ce cercle, autrement dit,
N̂ (t)
σ(t) = γ(t) + κγγ(t) .
La nouvelle courbe paramétrée σ ainsi obtenue est appelée la courbe développée de γ. F
Lorsque la courbe n’est pas paramétrée par la longueur d’arc, il est possible de calculer la
courbure comme suit :
q 2
kγ0 (t)k2 kγ00 (t)k2 − γ0 (t) · γ00 (t)
κγ (t) =
kγ0 (t)k3
kγ0 (t)k2 γ00 (t) − γ0 (t) · γ00 (t) γ0 (t)
et N̂γ (t) = q 2
kγ (t)k kγ0 (t)k2 kγ00 (t)k2 − γ0 (t) · γ00 (t)
0
E XERCICE 76: Une fonction f : [a, b] → R peut-être vue comme une courbe paramétrée γ : [a, b] →
t
R2 en posant γ(t) = f (t)
.
a. Donner (à l’aide d’une intégrale définie, mais qui ne peut être évaluée) un reparamétrage
de γ par la longueur d’arc.
b. Utiliser ce reparamétrage pour déterminer la courbure de γ en fonction de f et ses dérivées
(vérifier votre réponse grâce à la formule ci-dessus).
E XERCICE 77: Xorqui dans son travail doit relier deux bouts de chemin de fer ensemble de manière
à éviter que la transition soit brutale (cf. remarque 4.6.4). Pour simplifier, supposons que le premier
bout est la demi-droite { xy ∈ R2 | y = 0 et x ≤ 0} et le second la demi-droite { xy ∈ R2 | x ≥ 2 et
2y = x}. Trouver une fonction polynomiale de degré le plus petit possible f : [0, 2] → R telle que
t
l’image de γ : [0, 2] → R2 définie par γ(t) = f (t)
relie les deux bouts des demi-droites de manière
à ce que le résultat soit une courbe lisse dont la courbure est nulle aux points de jonctions.
[Indice : il s’agit de conditions sur f et ses dérivées (jusqu’au second ordre) en x = 0 et x = 2.]
L’exercice suivant a pour but de montrer que la courbure ne nécessite pas réellement que la
courbe soit de classe C 2 , c’àd. il y a une façon de définir la courbure pour les courbes de classe C 1
tant que le vecteur tangent unitaire forme une courbe rectifiable.
E XERCICE 78: Soit γ : [a, b] → Rm une courbe régulière et soit φ : [a, b] → Rm la courbe paramétrée
qui est donnée par le vecteur tangent unitaire en t, i.e.
γ0 (t)
φ(t) :=
kγ0 (t)k
Notons Iε l’intervalle [t,t + ε], où ε ∈ R>0 .
(a) Si γ est paramétrée par la longueur d’arc, montrer que
lim Long(φ|Iε )
κγ (t) = ε→0
Long(γ|Iε )
80
Chapitre 4 - C OURBES
4.A Torsion
Lorsque m = 3 il devient naturel de compléter la paire T̂, N̂ pour en faire une base orthonor-
mée, le troisième vecteur qui s’impose est alors le vecteur unitaire binormal, B̂γ (t) = T̂γ (t) ∧ N̂γ (t).
Lorsque B̂ reste constant, la courbe reste toujours dans le même plan (osculateur) où elle ne fait pas
d’autre chose que de “courber” (d’avoir de la courbure). Si ce n’est pas le cas, la courbe est alors
tordue (c’àd. elle a de la torsion), et ceci se manifeste par le fait que B̂0 n’est pas trivial. Or,
B̂0 (t) = T̂0 (t) ∧ N̂(t) + T̂(t) ∧ N̂0 (t) = T̂(t) ∧ N̂0 (t),
car T̂0 est proportionnel à N̂. Mais, par le lemme 4.6.1, N̂0 est orthogonal à N̂. Ainsi B̂0 est pro-
portionnel à N̂. La torsion d’une courbe paramétrée γ est alors définie par le réel τγ (t) tel que
B̂0γ (t) = τγ (t)N̂γ (t).
Étant donné que T̂0 et B̂0 ont donné lieu à des quantités géométriques (la courbure et la torsion)
il serait tentant de penser qu’il en serait de même avec la dérivée du vecteur normal N̂0 . Cependant,
N̂γ (t) = B̂γ (t) ∧ T̂γ (t), d’où
81
4.B - Théorème fondamental de l’algèbre
Ainsi en chaque point de la courbe, les constructions ci-dessus décrivent un repère (appelé repère
de Frenet ou Frenet-Serret). En oubliant les évaluations en un point de l’intervalle et la référence à
γ, les relations s’écrivent
T̂ 0 κ 0 T̂
d
N̂ = −κ 0 −τ N̂
ds
B̂ 0 τ 0 B̂
Essentiellement, une courbe (dans l’espace de dimension 3) est complètement caractérisée par sa
normale et sa torsion, le théorème(qui ne sera pas démontré ici) important sur le sujet va comme
suit :
Théorème 4.A.1 (Théorème fondamental de la théorie locale des courbes)
Étant donné deux fonctions κ(s) > 0 et τ(s) de classe C 1 définies sur un intervalle [0, L], il
existe une courbe paramétrée par la longueur d’arc γ : [0, L] → R3 telle que κγ = κ et τγ = τ. Si
σ est une autre courbe qui satisfait les même conditions, alors ces deux courbes ne diffèrent que
par une translation et une isométrie linéaire de R3 ( i.e. une matrice dans O(3), i.e. une matrice
M telle que M T = M −1 ).
Puisque les courbes qui sont dans le plan n’ont pas de torsion, il s’ensuit que la courbure caractérise
les courbes dans le plan.
Lorsque les courbes ne sont pas paramétrées par la longueur d’arc, il est parfois pratique d’uti-
liser d’autres expressions pour la courbure est la torsion. Nous les citons ici sans démonstration :
Définition 4.B.1. Une courbe paramétrée γ : [a, b] → Rm est dite fermée si γ(a) = γ(b). Si de plus
γ est de classe C 1 , elle est dite fermée seulement s’il est aussi vrai que γ0 (a) = γ0 (b).
Une courbe est dite simple si elle est injective et fermée. F
Ainsi, lorsque γ : [a, b] → Rm est une courbe paramétrée de classe C 1 fermée alors, l’application
unitaire tangente T̂γ définie sur [a, b] prend valeur dans Sm−1 , où Sm−1 = {x ∈ Rm | kxk = 1} est la
sphère de dimension m − 1.
En particulier, lorsque m = 2, l’application tangente prend valeur dans le cercle. Il est possible de
définir l’indice d’une courbe simple de classe C 1 comme étant le nombre de tours que l’application
82
Chapitre 4 - C OURBES
tangente fait en faisant attention à l’ordre, c’àd. deux tours dans le sens anti-horaire et un tour dans
le sens horaire compte comme un tour dans le sens anti-horaire. Soit donc Ind(T̂γ ) comme le nombre
de tours anti-horaires moins le nombre de tours horaires de la courbe décrite par le vecteur unitaire
tangent.
Théorème 4.B.2
Soit γ : [a, b] → R2 une courbe paramétrée fermée de classe C 1 . Si γ est simple alors Ind(T̂γ ) =
±1. Si Ind(T̂γ ) = ±1 alors soit γ est simple, soit si t, s ∈ [a, b] sont tels que γ(t) = γ(s) alors γ0 (t)
est colinéaire à γ0 (s).
En effet, il peut arriver qu’une courbe ne soit pas simple mais d’indice ±1, e.g. en traçant un 8 de
sorte que le point d’intersection est très verticale et que la partie droite est dessinée, puis la partie
gauche.
Démontrons (avec quelques boîtes noires) le théorème fondamental de l’algèbre. Soit k ∈ Z≥1
et P(z) = ∑i∈k ai zi un polynôme de degré k (i.e. ak 6= 0). Supposons que a0 6= 0 sinon z = 0 est une
racine évidente. Alors pour r ∈ R≥0 , soit γr : [0, 2π] → C ' R2 , définie par γr (t) = P(reıt )/kP(reıt )k
est en fait une courbe paramétrée fermée à valeur dans le cercle. Pour r assez grand, le terme de plus
grand degré domine, ainsi il existe r0 tel que Ind(γr0 ) = k (car l’indice de t 7→ eıkt pour t ∈ [0, 2π] est
k).
Autrement dit, la courbe paramétrée fermée σ : [0, 2π] → R2 définie par σ(t) = P(reıt ) fait plus
d’un tour autour de l’origine. Si r0 est suffisamment grand il est aussi possible de supposer que σ
entoure a0 aussi.
Cependant P(0) = a0 6= 0. Ainsi, la surface paramétrée (r,t) 7→ P(reıt ) (pour r ∈ [0, r0 ] et t ∈
[0, 2π]) doit couvrir tous les points entre a0 et la trace de σ, en particulier l’origine. Il y a donc bel
et bien une solution au polynôme.
83
4.B - Théorème fondamental de l’algèbre
84
Chapitre 5
Approximation et étude I
-E. C ANTONA
Ce chapitre a pour but premier d’approximer les fonctions un peu plus précisément que par
l’application linéaire qu’est la dérivée, et d’“étudier” les fonctions, c’àd. de mettre en place (sans
garantie de succès) des techniques pour identifier leur comportement (croissance, décroissance,
inflexions, ...). Ces deux thèmes ne seront abordés que pour des fonctions.
Dans le cas du second, la raison derrière cette restriction provient du fait que la notion d’ordre
dans Rn n’est pas naturelle, et par conséquent prendre une valeur plus élevée ne l’est pas non plus.
Pour le premier, la raison est moins stricte : l’écriture du cas général demande des notations re-
vêches qui ne sont pas d’une lisibilité exemplaire. Par surcroît, le résultat s’obtient de toute façon
en regardant les fonctions coordonnées de l’application.
Des techniques plus sophistiquées (mais qui sont loin d’être infaillibles) pour décider si un point
critique (un point où le gradient s’annule) est un extremum seront discutées ; elles font intervenir
des approximations plus fines que l’approximation linéaire.
85
5.1 - Formule de Taylor
Une fonction F : Rm → R est dite polynomiale ou un polynôme si elle s’écrit F(x) = ∑i∈` Gi (où
` ∈ Z≥1 ). Son degré est alors deg F = max deg Gi .
i∈l
Exemple 5.1.1. 4, x+y+z2 , 3x+8y2 −πxyz sont des polynômes de degré 0, 2 et 3 respectivement.
xy + z2 /x n’est pas un polynôme. ♣
Il ne s’agit plus que de faire une application de la dérivation composée pour obtenir la version en
plusieurs variables.
Théorème 5.1.3
Soit U ⊂ Rm un ouvert et F : U → Rn une application de classe C k+1 sur U. Alors, ∀x ∈ U et
∀h ∈ Rm tel que le segment de x à x + h est contenu dans U,
1 1 1
F(x+h) = F(x)+(h·∇)F(x)+ (h·∇)2 F(x)+. . .+ (h·∇)k F(x)+ (h·∇)k+1 F(x+τh)
2 k! (k + 1)!
où τ ∈ [0, 1].
D ÉMONSTRATION : Soit x(0) ∈ U le point où le développement de Taylor doit être fait, soit h ∈ Rm
un vecteur (basé en x) tel que ∀t ∈ [0, 1], x + th ∈ U et soit L : [0, 1] → Rm l’application définie par
L(t) = x + th. Alors la formule de Taylor-Lagrange (usuelle en une variable) de f (t) := F ◦ L(t)
donne
en posant t = 1. Il ne reste plus qu’à vérifier que f [k] (0) = (h · ∇)k F(x). Ceci sera fait par induction.
Pour k = 1, c’est une conséquence des dérivations composées : f 0 (0) = h · ∇F(x) = (h · ∇)F(x)
car L∗ = D1 L = h et F∗ = ∇F T . Montrons que cela fonctionne aussi pour k ≥ 2 en supposant que
f [`] (x) = (h · ∇)` F(x) pour tout ` ∈ k − 1.
d
f [k−1] (0) = dtd (h · ∇)k−1 F(x + th)t=0
f [k] (0) = dt
= (h · ∇)(h · ∇)k−1 F(x)
= (h · ∇)k F(x)
86
Chapitre 5 - A PPROXIMATION ET ÉTUDE I
Malgré les efforts de notations pour rendre la formule ci-dessus lisible, cela ne peut pas nuire d’ex-
pliciter les quelques premiers termes dans le cas simple où m = 2, F(x) = F(x, y) et h = hk :
F(x + h, y + k) =
F(x, y)
+hD1 F(x, y) + kD2 F(x, y)
(5.1.4)
+ 12 (h2 D21 F(x, y) + 2hkD1 D2 F(x, y) + k2 D22 F(x, y))
+ 16 (h3 D31 F(x, y) + 3h2 kD21 D2 F(x, y) + 3hk2 D1 D22 F(x, y) + k3 D32 F(x, y))
+...
D’une ligne à la suivante, l’approximation s’améliore par l’ajout d’un polynôme homogène dont le
degré est 1 de plus (i.e. dont tous les monômes ont le même degré).
Définition 5.1.5. Soit k ∈ Z≥1 et soit F : U → R une fonction de classe C k sur un ouvert U ⊂ Rm .
Son développement de Taylor à l’ordre ` ∈ k en x est le polynôme
1 1
P`,x F(h) = F(x) + (h · ∇)F(x) + (h · ∇)2 F(x) + . . . + (h · ∇)` F(x). F
2 `!
2 −4y
Exemple 5.1.6. Soit F : R2 → R la fonction (de classe C ∞ ) définie par F(x, y) = ex . Quelques
calculs rapides donnent que
2 2
D1 F(x, y) = 2xex −4y , D2 F(x, y) = −4ex −4y ,
2 2 2 −4y
D21 F(x, y) = (2 + 4x2 )ex −4y , D1 D2 F(x, y) = −8xex −4y et D22 F(x, y) = 16ex .
x 2
Ainsi son développement de Taylor à l’ordre 2 en y = 1 est
Bien que ce phénomène ne soit pas nouveau, il est tout à fait possible qu’une fonction de
classe C ∞ non-triviale ait un développement de Taylor trivial. L’exemple (de R → R) typique est
2
f (x) = e−1/x . En effet f [k] (0) = 0 et f [k] est continue sur R pour tout k ∈ Z≥1 . En particulier, en
0, son développement de Taylor ne contient que le terme de reste. La série formée par la limite des
développements est ainsi triviale (et converge automatiquement), mais n’a pour autant rien à voir
avec la fonction. Comme en une variable, les applications qui peuvent s’exprimer par leur série de
Taylor (sur le domaine où elles convergent) sont dites analytiques ou de classe C ω .
87
5.1 - Formule de Taylor
Comme les dérivées d’ordre k de F sont continues, la différence ci-dessus tend rapidement vers 0
lorsque h est petit. En fait, même après division par khkk elle tend toujours vers 0. Ceci illustre
une propriété importante de l’approximation polynomiale que permet de faire la formule de Taylor-
Lagrange 5.1.3. Elle est même, en un certain sens, optimale :
Théorème 5.1.7
Soit F : U → R une fonction de classe C k sur U ⊂ Rm et soit Q : Rm → R un polynôme de
degré inférieur ou égal à k tel que
La démonstration ne sera pas ici faite (exercice !) ; il s’agit essentiellement d’un analogue pour les
dérivées d’ordres supérieurs de l’unicité de la dérivée (lorsque k = 1 c’est exactement le même
résultat que le théorème 3.2.5) et de l’argument esquissé ci-dessus.
Une conséquence importante, c’est que le développement de Taylor décrit (dans la mesure où il
ne s’annule pas) le comportement de la fonction au voisinage du point où il se situe (cf. section 5.3).
Exemple 5.1.8. Une conséquence intéressante du théorème 5.1.7 est qu’il est possible de sim-
plifier beaucoup le calcul dès qu’une approximation polynomiale est bonne. Par exemple, pour
2
calculer le développement de F(x, y) = ex −4y à l’ordre 2 en 21 : soit t = x2 − 4y, alors t = 0 lorsque
2
x = 2 et y = 1 ; le développement de Taylor en 0 de et à l’ordre 2 est 1 + t + t2 . En remplaçant t par
(2+h)2 −4(1+k) = 4h−4k +h2 , le polynôme 1+(4h−4k)+ 21 (18h2 −16hk +16k2 ) apparaît. ♣
Le théorème 5.1.7 permet aussi de percevoir une application très importante du développe-
ment de Taylor : au voisinage du point x, le premier ordre où des dérivées sont non-triviales dé-
termine le comportement dans une boule suffisamment petite autour de x (e.g. la première ligne
après F(x, y) dans (5.1.4) qui n’est pas identiquement nulle domine). C’est sur ce principe qu’est
construite l’étude de fonction.
E XERCICE 82: Xorqui a gagné, dans sa dernière boîte de lessive, un voyage dans un tout nouvel
avion suborbital. Étant fidèle aux vraies valeurs de la tradition la plus traditionnelle, Xorqui ne
considère vraie que l’heure de l’horloge grand-père de son arrière-grand-mère (un beau spécimen
à pendule... l’horloge pas les ancêtres). q
Cependant, la période d’un pendule étant donnée par F(L, g) = Lg où g est la gravité et L
la longueur du fil, il y aura une distorsion dans le comptage de la seconde car à haute altitude la
88
Chapitre 5 - A PPROXIMATION ET ÉTUDE I
gravité change. Xorqui veut régler son horloge pour rendre le pendule fiable et a remplacé la tige
par une tige à longueur télé-réglo-programmable.
Utiliser le développement de Taylor à l’ordre 2 de F pour trouver quelle perturbation h de L peut
compenser une perturbation de k de g, i.e. pour k, g et L donnés trouver h tel que P2,(L,g) (h, k) = 0
(i.e. que F(L + l, g + k) est presque 0). Afin d’alléger les calculs, prenez g = 8 et L = 2.
E XERCICE 83: Donner le développement de Taylor de la fonction F ci-dessous autour du point
donné et à l’ordre spécifié :
0
a. F(x, y) = arctg(x + xy) de classe C ∞ sur R2 à l’ordre 3 en −1
;
b. F(x, y) = siny x de classe C ∞ sur R × (R r {0}) à l’ordre 3 en 1 ; π/2
1
z
c. F(x, y, z) = x+y de classe C ∞ sur {(x, y, z) ∈ R3 | x 6= −y} à l’ordre 3 en 0 .
0
E XERCICE 84: Montrer que les fonctions suivantes sont de classe C∞ sur R3 puis calculer les
polynômes de Taylor demandé :
x 0
2
a. F(x, y, z) = sin(z + x cos y) en yz = π/2 à l’ordre 3 ;
0
x 0
b. F(x, y, z) = sh(zy) ln(1 + x2 ) en yz = 0 à l’ordre 6 ;
0
2
x 0
c. F(x, y, z) = ch(exy+z − 1) en yz = 0 à l’ordre 3 ;
0
E XERCICE 85: Calculer le polynôme de Taylor de
2
0
a. F(x, y, z) = sin(exy+z − 1 + x3 ) à l’ordre 5 en 0 ;
0
0
b. F(x, y, z) = ln(1 − y2 ) sin(x2 z + π2 ) à l’ordre 10 en 0 .
0
Il est impossible de trop insister sur le fait qu’un maximum ou minimum local n’est pas né-
cessairement un maximum ou minimum absolu. Un exercice de logique simple montrera au lecteur
qu’un point n’est pas un maximum local si
89
5.2 - Points critiques et singuliers
Comme l’ont déjà insinué plusieurs exemples de manière plus ou moins explicite (cf. exemple
3.6.3) et comme c’était aussi le cas pour les fonctions R → R, le gradient semble un indicateur
(malheureusement imparfait) de la présence de minima.
Théorème 5.2.2
Soit U ⊂ Rm un ouvert et soit F : U → R une fonction de classe C 1 . Si x est un extremum de F
alors ∇F(x) = 0.
Comme il est impossible de trop insister sur ce point aussi, rappelons au lecteur éventuellement
étourdi qu’une implication logique A ⇒ B ne veut PAS dire que si B est vraie alors A est vraie. Ici
en particulier, si le gradient s’annule en un point, ce point peut très bien être ni un minimum local
ni un minimum absolu ni un maximum local ni un maximum absolu.
E XERCICE 86: Xorqui part toujours de sa maison tôt le matin et ne rentre jamais avant 17 heures.
Soit les deux assertions suivantes :
A : Xorqui prend son parapluie avant de partir le matin.
B : Il pleut le matin.
Xorqui étant quelqu’un qui aime l’ordre, “B ⇒ A ” (en mots : Xorqui prend toujours son para-
pluie avant de partir quand il pleut le matin). Vous passez la nuit chez Xorqui et vous réveillez vers
midi.
Si le parapluie n’est pas là, pouvez-vous déduire de “B ⇒ A ” qu’il pleuvait ce matin là ? Si le
parapluie n’est pas là, pouvez-vous déduire de “B ⇒ A ” qu’il ne pleuvait pas ce matin là ? Justifiez
et écrivez (en mots) la contraposée de B ⇒ A .
Ici la preuve sera faite en utilisant la contraposée, une autre idée de preuve se trouve aussi dans
la démonstration du théorème 6.4.2.
En particulier, si |t| est suffisamment petit,kvk2 + 1t RF (tv) > 0 car kvk2 > 0 (v est non-nul). De
r
plus, pour toute boule centrée en x de rayon r, si |t| < kvk , alors x + tv ∈ Br (x) (car d(x, x + tv) =
ktvk = |t| kvk < r). Ainsi, dans toute boule centrée en x il y a un point avec une valeur légèrement
supérieure (prendre t positif) et une valeur inférieure (prendre t négatif).
Exemple 5.2.3. La fonction de classe C ∞ , F : R2 → R définie par F(x, y) = (x−y)3 a pour gradient
3(x−y)2
∇F(x, y) = −3(x−y) 2 . En particulier, sur toute la diagonale (les points où les deux coordonnées sont
90
Chapitre 5 - A PPROXIMATION ET ÉTUDE I
La section 5.3 donnera une méthode un peu plus raffinée qui permet parfois de conclure qu’un
point admet un extremum local. Une première méthode rudimentaire est la suivante : soit U ⊂ Rm
un ouvert et F : U → R une fonction. Pour chaque x point critique ou singulier, elle consiste en
définir la fonction test Gx (h) = F(x + h) − F(x). Ensuite, si pour tout h assez petit Gx (h) ≤ 0 (resp.
Gx (h) ≥ 0) alors la fonction admet un maximum local (resp. minimum local) en x.
Cette méthode est évidemment difficile à réaliser : il ne s’agit en fait que d’une réécriture de
la définition d’extremum local et donc, en soi, pas d’une méthode. Pour montrer que Gx est positif
ou négatif près de l’origine, seules les méthodes de manipulations classiques des inégalités sont
jusqu’ici à disposition. En outre, ceci ne dit rien sur les extrema absolus.
Exemple 5.2.6. Soit F : R2 → R la fonction définie par 2x3 − 6xy + 3y2 . Tentons de lui appliquer
2 −6y
la méthode ci-dessus. F est dérivable sur tout R donc D = ∅ et ∇F(x, y) = 6x 6y−6x , donc C =
1
0
{ 1 , 0 }.
La première fonction test G0 (h1 , h2 ) n’est en fait que F(h1 , h2 ). Il faut alors remarquer que
F(h1 , 0) = h31 , ce qui implique que dans tout voisinage de 0 = 00 il y a des points de valeurs plus
grandes (h1 > 0) et plus petite (h1 < 0). Ainsi 00 est un point d’inflexion.
Pour h1 > −3/2 tous les termes sont en fait positifs (un carré étant toujours positif). Par conséquent,
lorsque k hh12 k est assez petit, Gx (h1 , h2 ) ≥ 0 et donc 11 est un minimum local.
Le moment est propice pour remarquer que F(x, 0) = x3 , ainsi, lorsque x → ±∞, F prend des
valeurs arbitrairement grandes ou petites. Elle n’a donc pas d’extremum absolu. ♣
91
5.3 - Matrice de Hesse ou hessienne
la fonction au voisinage d’un point (voir théorème 5.1.7). Quand son expression est simple, il est
possible d’obtenir une conclusion sans trop se perdre dans les détails techniques ; c’est l’objectif de
la section 5.3.
Exemple 5.3.1. xy + πz2 , 2x2 + y2 , x12 + e8 x2 x3 − x1 x4 + x42 et −xy sont des formes quadratiques,
2
mais xy + x2 + xz2 , xy + zxy et x1 x2 + x42 log xx43 ne sont pas des polynômes homogènes de degré 2. ♣
Comme le comportement près d’un point critique est déterminé par les valeurs que peut prendre
une matrice
Le lecteur se convaincra sans souci que si la forme quadratique de F en un point critique x est
QE1. définie positive ⇒ x est un minimum local ;
QE2. définie négative ⇒ x est un maximum local ;
QE3. non-semi-définie ⇒ x est un point d’inflexion ;
QE4. semi-définie positive et non-triviale ⇒ x n’est pas un maximum ;
QE5. semi-définie négative et non-triviale ⇒ x n’est pas un minimum ;
E XERCICE 87: Montrer les affirmations QE1 à 5. [Indice : Faire un développement de Taylor et
utiliser le théorème 5.1.7.]
92
Chapitre 5 - A PPROXIMATION ET ÉTUDE I
Lorsque la forme est semi-définie, il faut recourir à une étude plus poussée (voir la sous-section
5.3.i “Lorsque même la dérivée seconde ne suffit plus...”). Pour l’instant, il ne reste plus qu’à trou-
ver/rappeler des techniques pour identifier les cas QE1-5.
Heureusement, les formes quadratiques possèdent une écriture matricielle très utile. En effet,
soit q(x) une forme quadratique, alors
q(x) = ∑ Qi j xi x j =: xQxT .
i, j∈m
où Qi j ∈ R. En fait, par commutativité (xi x j = x j xi ) il est toujours possible de faire en sorte que Qi j =
Q ji . De fait, sous cette contrainte supplémentaire, l’écriture de la forme quadratique est unique.
Les réels Qi j forment ainsi une matrice Q symétrique de taille m × m (définie ci-dessus) dont le
coefficient de la ième ligne et jème colonne est Qi j .
M1 est à la fois semi-définie négative et positive (la matrice triviale est toujours l’unique telle ma-
trice). M2 est non-semi-définie (e.g. essayer (20, 1, 0)T et (−20, 1, 0)T ). M3 est non semi-définie
(e.g. essayer (1, 0, 0)T et (0, 1, 0)T ). M4 est définie positive. ♣
Dans le cas particulier d’une forme quadratique provenant du polynôme de Taylor d’une fonc-
tion F (de classe C 2 sur un ouvert U ⊂ Rm ) en un point critique x, la matrice s’écrit
D21 F(x) · · · D1 Dm F(x)
D1 D2 F(x)
D2 D1 F(x) D22 F(x)
· · · D2 Dm F(x)
Q= .. .... .. .
. . . .
2
Dm D1 F(x) Dm D2 F(x) · · · Dm F(x)
(MI ) jn = (M)i j in
En particulier, Mk est la mineure principale k × k obtenue en ne gardant que les k premières lignes
et colonnes de M : (Mk ) jn = (M) jn , ∀ j, n ∈ k.
Théorème 5.3.4
Soit q : Rm → R une forme quadratique, et soit Q la matrice symétrique associée. LASSE (“Les
93
5.3 - Matrice de Hesse ou hessienne
Le cas négatif s’obtient essentiellement en demandant que −Q soit défini positif ; voici son “LAS-
SE” :
DN1. q est définie négative.
DN2. Les valeurs propres de la matrice Q sont toutes < 0.
DN3. Pour tout k ∈ m, (−1)k Det Qk > 0.
Pour ce qui est du cas semi-défini, les critères sont moins commodes. Voici deux “LASSE”s :
SDP1. q est semi-définie positive.
SDP2. Les valeurs propres de la matrice Q sont toutes ≥ 0.
SDP3. Pour tout sous-ensemble I ⊂ m, Det QI ≥ 0.
SDP4. Il existe p ∈ Z≥1 et une matrice R de taille m × p telle que Q = RRT .
et
SDN1. q est semi-définie négative.
SDN2. Les valeurs propres de la matrice Q sont toutes ≤ 0.
SDN3. Pour tout sous-ensemble I ⊂ m, (−1)|I| Det QI ≥ 0.
SDN4. Il existe p ∈ Z≥1 et une matrice R de taille m × p telle que Q = −RRT .
La démonstration de ces résultats se fait essentiellement à partir de la remarque suivante. Une ma-
trice symétrique Q possède (toujours) des valeurs propres réelles et ses vecteurs propres peuvent
(toujours) être choisis de sorte à ce qu’ils forment une base orthonormée (c’est le théorème spectral
pour les matrices symétriques). Soit, pour i ∈ m, λi les valeurs propres et vi le vecteur propre asso-
cié. Alors vi · v j = 0 si i 6= j et = 1 si i = j et {vi }i∈m est une base de Rm . Ainsi tout x ∈ Rm s’écrit
x = ∑ ci vi (où ci = x · vi ) et
i∈m
xQxT = ( ∑ λi ci vi ) · x = ∑ λi c2i .
i∈m i∈m
Ceci suffit pout démontrer tous les critères concernant les valeurs propres. Ensuite, pour passer aux
mineures associées à I ⊂ m, il faut combiner ce résultat avec les matrices de projections sur les plans
de coordonnées.
Enfin, il est bon de donner deux critères élémentaires :
Proposition 5.3.5
Soit Q une matrice de taille m × m non-triviale. Si une mineure de taille 2 de Q est non-semi-
définie alors Q est non-semi-définie. Ainsi, si il existe {i, j} ⊂ m tel que
94
Chapitre 5 - A PPROXIMATION ET ÉTUDE I
Exemple 5.3.6. Les quatre fonctions suivantes sont de classe C ∞ sur R2 et possèdent un point
critique en 00 . L’argument qui permet de décider de quel genre de point critique il s’agit se trouve
Exemple 5.3.7. Soit S = B1/2 (0) ⊂ R4 et F : S → R la fonction de classe C ∞ sur S définie par
√
2/ 3 2 2
F(x1 , x2 , x3 , x4 ) = − 2 cos x1 + 2 sin(x2 x3 ) + 2ex2 + x32 + x42 + √ ln(1 + x2 x3 ).
1 − x1 x2 3
Son développement de Taylor à l’ordre 2 en 00 indique que la forme quadratique est donnée par la
matrice
1 √13 √13 0
1
√ 2 1 0
Q= 1 3 .
√3 1 1 0
0 0 0 1
95
5.3 - Matrice de Hesse ou hessienne
Bien que légèrement longuet, il est possible de vérifier que cette matrice est définie positive. Le
point 0 est ainsi un minimum de F (il faut néanmoins vérifier que ∇F(0) = 0). ♣
2 −y2
Exemple 5.3.8. Soit F : R3 → R la fonction de classe C ∞ sur R3 définie par F(x, y, z) = e−x +
2 2
e−x −(z−1) + 2exy . Pour trouver les points où son gradient est nul il faut résoudre
2 −y2 2 2
∂F
∂x = −2x(e−x + e−x −(z−1) ) + 2yexy = 0
2 2
∂F
∂y = −2ye−x −y + 2xexy = 0
2 −(z−1)2
∂F
∂z = −2(z − 1)e−x =0
Il y a un point critique évident en (0, 0, 1)T . Le calcul de son développement de Taylor à l’ordre 2
en x = (0, 0, 1)T donne
P2,x F(h, k, `) = 3 − 2h2 + 2hk − k2 − `2
(Il n’y a pas de termes de degré 1, comme c’est un point critique.) La matrice associée à la forme
quadratique est
−2 1 0
Q = 1 −1 0 .
0 0 −1
−2 1
Elle est définie négative comme −2 < 0, | 1 −1 | = 1 > 0 et Det Q = −1 < 0 ; il s’agit donc d’un
maximum local de F.
L’existence d’autres points critiques est “un peu moins évidente” ; elle est laissée de côté. ♣
E XERCICE 90: Trouver et classifier (maximum/minimum local/absolu, point d’inflexion) les points
critiques des fonctions suivantes :
a. F(x, y) = x sin y définie sur R2 ;
b. F(x1 , x2 , x3 ) = x1 x2 x3 − x12 − x22 − x32 définie sur R3 .
c. F :] π4 , 7π π 7π
4 [×] 4 , 4 [→ R définie par F(x, y) = sin x cos y.
E XERCICE 91: Dire pourquoi les fonctions suivantes sont de classe C ∞ sur R3 puis trouver les
points critiques :
2 +y2 +z2 )/2
a. F(x, y, z) = xyze−(x ;
b. F(x, y, z) = x2 + xy2 + yz2 − 2z ;
xy
c. F(x, y, z) = 2+x4 +y4
;
d. F(x, y, z) = cos(x + z) + sin y.
1
E XERCICE 92: Soit F : (R>0 )2 → R définie par F(x, y) = x + 8y + xy . Pourquoi possède-t-elle au
moins un minimum ? quel[s] est-il [sont-ils] ?
E XERCICE 93: Soit un prisme rectangulaire dont les côtés sont de longueur x, y et z ∈ R>0 . Si le
volume est fixé, quelles sont les valeurs qui minimisent la surface ? Est-ce un minimum absolu ?
[Indice : utiliser la contrainte sur le volume pour réduire le nombre de variable, puis chercher un
minimum à la fonction de la surface.]
96
Chapitre 5 - A PPROXIMATION ET ÉTUDE I
2 2 2
E XERCICE 94: Soit S = {(x, y, z)T ∈ R3 | ax2 + by2 + cz2 ≤ 1} l’ellipsoïde de demi-axes a, b, et c.
Quelle est le prisme rectangulaire de plus grand volume contenu à l’intérieur ? Est-ce un maximum
absolu ? [Indice : utiliser la contrainte sur le volume pour réduire le nombre de variable, puis
cherche un maximum à la fonction de volume.]
Lorsque la matrice est semi-définie, il y a deux situations qui peuvent survenir. La première est
lorsque (miracle !) toutes les dérivées secondes s’annulent (i.e. la forme quadratique est triviale). Il
faut alors chercher les dérivées d’ordre supérieur si la fonction est suffisamment dérivable. Si F est
de classe C k et k ≥ 3 est le premier ordre où les dérivées ne s’annulent pas, le comportement de la
fonction est alors dominé localement par un polynôme de degré k (le développement de Taylor à
l’ordre k).
E XERCICE 95: Soit k > 1 un nombre impair. Montrer que si F est une fonction de classe C k sur un
ouvert U ⊂ Rm telle que ∀` ∈ k − 1, ∀i1 , i2 , . . . , i` ∈ m, Di1 Di2 · · · Di` F(x) = 0 et ∃ j1 , j2 , . . . , jk ∈ m
tel que D j1 D j2 · · · D jk F(x) 6= 0 alors x est un point d’inflexion. [Indice : les polynômes homogènes
de degrés impairs sont impairs.]
Si k > 2 est pair, il n’y a malheureusement pas de technique aussi simple pour déterminer si un
point est un extremum ou un point d’inflexion. Avec un peu de chance, il y a espoir que le polynôme
sera relativement simple.
Dans l’éventualité moins miraculeuse où la forme est semi-définie mais non-triviale, il faut
alors identifier les vecteurs w ∈ Rm tels que q(w) = 0 (par homogénéité il suffit d’en prendre un
par direction) ; soit W l’ensemble de ces vecteurs. Il faut alors calculer des ordres de dérivation
supplémentaires, c’àd. calculer pk le polynôme homogène de degré k formé par les termes de degrés
k dans le développement de Taylor. Ensuite, il faut tenter de voir si pk est (strictement) positif,
(strictement) négatif ou peut prendre des valeurs (str.) positive ET (str.) négative sur W r {0} (par
homogénéité, il est suffisant de regarder les vecteurs de norme 1 dans W ).
En bref, voici une méthode. Soit ε = ±1 le signe de la forme quadratique semi-définie.
1. Choisir un w dans W .
2. Trouver le plus petit k tel que pk (w) 6= 0. [Attention : il se peut que ce k n’existe pas, c’àd.
il existe des fonctions C ∞ qui ne sont pas C ω .]
3. Si kw est impair, w est un point d’inflexion (cf. exercice 95).
4. Si kw est pair et pk (x) a un signe qui n’est pas le même que ε alors w est un point d’inflexion.
5. Sinon passer à la prochaine direction présente dans W . Si ∀w, kw a pu être trouvé et les
clauses 3 et 4 ne s’appliquent pas, c’est que le point est un extremum local (maximum si
ε = −1, minimum si ε = +1).
6. Si ∃w ∈ W tel que kw n’existe pas (le cas des fonctions infiniment plates), alors la conclusion
ne peut être précisée (i.e. c’est soit un point d’inflexion soit un maximum/minimum local
selon que ε = ∓1).
97
5.3 - Matrice de Hesse ou hessienne
Exemple 5.3.9. Pour F1 , la forme quadratique s’annule sur la droite h = 0. Le polynôme homogène
de degré 3 qu’il faut ajouter pour obtenir le développement à l’ordre 3 est 13 k3 . Ainsi, F(0, k) −
F(0, 0) sera positif pour k positif, mais négatif pour k négatif, il s’agit donc d’un point d’inflexion.
Sur le dessin un peu plus bas sont représentés, en rouge l’approximation de F1 par un polynôme
de degré 2 (qui ne montre pas la nature du point critique), en vert celle par un polynôme de degré
3 (qui montre que c’est un point d’inflexion), puis en bleu le graphe de la fonction (qui montre
effectivement que ce n’est pas un point critique, mais bien un point d’inflexion).
d’inflexion.
La représentation graphique est ici plus délicate. Ci-dessus : en bleu le graphe de la fonction F4 ,
en rouge la fonction moins son approximation d’ordre 2, en brun le plan de la valeur 0 (i.e. z = 0).
De fait, même si G = F4 − P2,0 est parfois au dessus de 0, G ne prend que des valeurs négatives le
long de la droite qui n’est pas dominée par la partie quadratique d’ordre 2 (en rouge vif). Ainsi il
s’agit bien d’un maximum. ♣
98
Chapitre 6
Résolution et étude II
Ce chapitre a pour but de faire une démonstration correcte des multiplicateurs de Lagrange
(c’àd. de l’étude de fonction sous avec une ou plusieurs contraintes, typiquement non-linéaires).
Pour y parvenir, il d’abord établir une méthode pour la résolution des équations non-linéaires, i.e. du
type F(x) = 0. Il s’agit essentiellement de la version à plusieurs variables de la méthode de Newton.
De là, le théorème d’inversion locale sera démontrée (avec quelques boîtes noires) et le théorème
des fonctions implicites en sera déduit. Ces deux théorèmes sont le fondement de la géométrie
différentielle et de la théorie des variétés. Pour nos ambitions dans ce cours, ils sont nécessaires pour
la démonstration de la méthode de Lagrange, et, plus tard, pour l’étude des surfaces paramétrées.
La méthode de Newton est une méthode élémentaire (et pourtant efficace) pour former une suite
qui convergera vers une solution d’une équation relativement régulière. La procédure en plusieurs
variables est très similaire à la procédure en une variable qui est ici brièvement rappelée. Soit U ⊂ R
un ouvert et soit f : U → R une fonction de classe C 1 . Le problème est de trouver une solution
à l’équation f (x) = 0. Soit x0 tel que f (x0 ) est petit et f 0 (x0 ) 6= 0. Un dessin où une solution à
l’équation existe proche de x0 convaincra le chaland que si x1 est donné par f (x0 ) = (x0 − x1 ) f 0 (x0 ),
ou autrement écrit x1 = x0 − f 0 (x0 )−1 f (x0 ), alors x1 est plus proche de la solution. L’idée est alors
d’itérer : xn+1 = xn − f 0 (xn )−1 f (xn ) converge raisonnablement vers une solution. Entre parenthèses,
même dans le cas à une variable, la convergence n’est pas automatique pour tout point de départ.
Voici quelques exemples pour une simple fonction polynomiale de degré 3 :
99
6.1 - Méthode de Newton
Les deux dessins du haut représentent l’algorithme pour la méthode de Newton (usuelle) et ceux
d’en bas pour la méthode de Newton modifiée (avec les mêmes points de départ). Le domaine de
convergence pour la méthode de Newton est en général bien meilleur (cf. les deux dessins de droite),
mais pour les bons cas (essentiellement, lorsque le point de départ est près d’une solution et que la
dérivée ne varie pas trop) la différence est faible (cf. les graphiques de gauche ci-dessus).
Parfois, pour sauver du temps de calcul, l’itération utilisée est xn+1 = xn − f 0 (x0 )−1 f (xn ) ; cette
itération, dite méthode de Newton modifiée, est particulièrement courue en grande dimension (d’au-
tant plus lorsqu’elle est infinie). En plusieurs variables, la méthode est essentiellement identique,
mais il faut remplacer f 0 (x) par la matrice de Jacobi. Celle-ci n’étant la plupart du temps pas une
matrice carrée, et son inverse étant parfois longuette à établir, il sera plus commode d’utiliser la
version dite modifiée de la méthode de Newton.
La problématique est la suivante : soit n ≥ m ∈ Z≥1 , soit F : U → Rn une application de classe
C 2 sur U ⊂ Rm , et soit y ∈ Rn , comment trouver une solution x à F(x) = y ?
L’équation n’a évidemment pas une solution pour n’importe quel y, l’hypothèse de base ici est
qu’elle aura au moins une presque solution (puis quelques hypothèses techniques sur son compor-
tement près de la presque solution).
La méthode en plusieurs variables est essentiellement la même qu’en une seule variable. Ce qui
motive une petite parenthèse sur l’inversion de matrice non-carrée : dans notre cas, la dérivée est
représentée par une matrice de taille n × m (la jacobienne est de taille n × m, cf. théorème 3.3.3).
Pour une matrice M de taille n × m, il faut distinguer entre un inverse à gauche (GM M = IdRm ,
qui n’existe pas quand n > m) et l’inverse à droite (MDM = IdRn , qui n’existe pas si m > n). Une
possibilité pour trouver un inverse à gauche est la matrice
GM = (M T M)−1 M T ,
dans la mesure où M T M est inversible. Il est aussi possible, par exemple, de chercher un mineur de
la matrice M de déterminant non-nul, de l’inverser, et de construire un GM à partir de là.
100
Chapitre 6 - R ÉSOLUTION ET ÉTUDE II
L’itération de Newton s’écrit de manière plus commode comme suit : soit x le point de départ
de l’itération et, pour i ∈ Z≥0 , les vecteurs h(i) ∈ Rm (basés en x) avec h(0) = 0. Alors l’itération
s’exprime (en remplaçant xn par x + h(n) )
où GF∗ (x) est l’inverse à gauche de la matrice de Jacobi F∗ (x). Le résultat principal de cette section
est un théorème donnant une condition qui assure la convergence de cette itération. Il est nécessaire
de faire quelques préparatifs. Le premier est un joli lemme très utile et polyvalent : un théorème du
point fixe pour les applications contractantes.
Définition 6.1.1. Soit (X, d) un espace muni d’une distance. Une application f : X → X est dite
contractante si ∃λ ∈[]0, 1[]tel que ∀x, x0 ∈ X, d f (x), f (x0 ) ≤ λd(x, x0 ).
F
Lemme 6.1.2 (Théorème du point fixe de Banach)
Soit (X, d) un espace métrique complet. Toute application f : X → X continue et contractante
possède un unique point fixe, c’àd. ∃x ∈ X tel que f (x) = x. De plus, ce point fixe est unique et,
1
∀x0 ∈ X, d(x0 , x) ≤ 1−λ d(x0 , f (x0 )).
Autrement dit, la limite est en fait un point fixe de f , ce qui mène à la conclusion de l’existence.
Si f avait deux points fixes, disons x̄ et x̃ alors d(x̄, x̃) = d f (x̄), f (x̃) ≤ λd(x̄, x̃) une contradic-
tion comme λ < 1. Ainsi, l’unicité est établie. Notons x∞ ce point limite ; x∞ = n→∞ lim xn .
Finalement, en évaluant la série dont le terme sont les distances successives d(xn+1 , xn ), l’es-
1
timation ci-dessus sur les distances permet de conclure que d(x0 , x∞ ) ≤ 1−λ d(x0 , f (x0 )) et ∀n ∈
1
Z≥1 , d(x0 , xn ) ≤ 1−λ d(x0 , f (x0 )).
101
6.1 - Méthode de Newton
D ÉMONSTRATION : Soit ε ∈ R>0 et soit S = {s ∈ [0, 1] | kF γ(s) − F(x)k ≤ (K + ε)skx − yk}.
Par continuité de F, si t est le supremum de S, alors t ∈ S. Supposons que t < 1, alors il existe une
suite de réels rk tendant vers 0 tels que
(K + ε)(t + rk )kx − yk < kF γ(t + rk ) − F(x)k
≤ kF x + (t + rk )(y − x) − F x + t(y − x) k + kF x + t(y − x) − F(x)k
≤ kF x + (t + rk )(y − x) − F x + t(y − x) k + (K + ε)tkx − yk
D’où (K + ε)rk kx − yk < kF x + (t + rk )(y − x) − F x + t(y − x) k. En divisant par rk des deux
côtés de l’inégalité, et en passant à la limite :
(K + ε)kx − yk ≤ kF∗ γ(t) (x − y)k
≤ Kk(x − y)k.
Il s’agit là d’une contradiction. Par conséquent, t = 1. Puisque ceci est vrai pour tout ε > 0, la
conclusion s’ensuit.
Un lecteur assidu pourra essayer de démontrer ce résultat en remplaçant γ par une courbe arbitraire
de x à y et kx − yk par la longueur de γ.
L’idée est maintenant de montrer que si la dérivée de l’application de Newton est assez petite,
elle sera contractante (lemme 6.1.3) et N aura alors un point fixe (lemme 6.1.2). Si N(h) = h, il est
facile de voir que F(x + h) = 0.
Théorème 6.1.4
Soit S ⊂ Rm , soit F : S → Rn et soit x telle que F∗ (x) est inversible à gauche. Soit G := GF∗ (x)
l’inverse à gauche de F∗ (x), soit K = kGk→ ∈ R>0 , soit ε = kF(x)k ∈ R>0 . Supposons que
∃r, δ ∈ R>0 tels que ∀y ∈ Br (x), kF∗ (y) − F∗ (x)k→ ≤ δ. Si 0 < K −1ε−δ < r, alors la suite définie
par l’itération de Newton h(n+1) = N(h(n) ) converge vers une unique solution dans un voisinage
de x : F(x + h(∞) ) = 0.
D ÉMONSTRATION : Soit N(h(n) ) = h(n+1) = h(n) −GF(x+h(n) ) comme plus haut. Alors la dérivée
de N est
N∗ (h) = Id −GF∗ (x + h) = G(F∗ (x) − F∗ (x + h))
102
Chapitre 6 - R ÉSOLUTION ET ÉTUDE II
Par hypothèse K −1 − δ > 0, d’où δK < 1. Le lemme 6.1.3 donne que, ∀h, h0 ∈ Br (0), kN(h) −
N(h0 )k ≤ δKkh − h0 k. L’hypothèse implique aussi que Kε < r, ainsi h(0) = 0, h(1) = N(0) ∈ Br (0)
(car kN(0)k = kGF(x)k ≤ kGk→ kF(x)k ≤ Kε).
Ceci est important car il faut aussi vérifier que la suite reste à l’intérieur de la boule où l’applica-
tion est contractante. Or la preuve du lemme 6.1.2 donne aussi que les membres suivants de la suite
Kε
resteront à distance 1−Kδ < r de 0.Ainsi, la suite commençant en 0 convergera, et par continuité il
existe un voisinage de 0 autour duquel toute suite convergera vers le même point fixe.
Bien qu’elle puisse sembler anodine, la méthode de Newton est l’ingrédient (ou l’idée) crucial(e)
derrière deux théorèmes équivalents qui servent de fondement à la géométrie différentielle et à la
démonstration des multiplicateurs de Lagrange. C’est le sujet des prochaines sections.
Définition 6.2.1. Soit U ⊂ Rm un ouvert et F : U → Rm une application. Soit k ∈ Z≥0 ∪ {∞}. F est
un difféomorphisme C k si F est une bijection de U dans F(U), F est de classe C k sur U et l’inverse de
F est de classe C k sur F(U). En particulier, lorsque k = 0, F est alors appelée un homéomorphisme
(rappel : C 0 sur U = continue sur U).
Une application F est dite un difféomorphisme C k local en a si c’est un difféomorphisme C k sur
un voisinage de a. F
(l’inverse au sens matriciel). Ainsi, un difféomorphisme C 1 possède toujours une jacobienne in-
versible. Le théorème d’inversion locale exprime que ce critère est, dans la mesure du possible,
déterminant.
Théorème 6.2.2 (Théorème d’inversion locale)
Soit U un ouvert de Rm et F : U → Rm une application de classe C 1 . Si ∃x ∈ U tel que F∗ (x)
est inversible alors F est un difféomorphisme C 1 local en x.
Parenthèse : Ce théorème est essentiellement la version non-linéaire du résultat (bien connu) sur
les matrices (les applications linéaires) disant qu’une matrice est inversible si et seulement si son
déterminant est non-nul.
D ÉMONSTRATION D ÉMONSTRATION PARTIELLE :: Il s’agit essentiellement d’une conséquence
de la convergence de la méthode de Newton. Pour y proche de F(x), il faut montrer qu’il y a une
solution unique à F(z) = y où z est dans un voisinage de x. Ceci est non-trivial car même si F−1 est
toujours définie en tant qu’application image réciproque, l’image réciproque d’un point peut être
103
6.2 - Théorème des applications implicites
plusieurs valeurs. Pour se remettre dans le cadre de la méthode de Newton, il suffit d’introduire la
fonction secondaire G(z) = F(z) − y. Ainsi, lorsque G(z) = 0, z satisfait F(z) = y.
Soit K = kG∗ (x)−1 k→ . Comme G∗ est continue, ∀δ > 0∃r ∈ R>0 tel que ∀z ∈ Br (x), kG∗ (z) −
1 r
G∗ (x)k→ ≤ δ. Prendre δ = 2K fera l’affaire. Maintenant, si ε = 2K et y ∈ Bε F(x) , le théorème 6.1.4
dit que l’itération commençant en x convergera
:il y a donc une solution à G(z) = 0 si y ∈ Bε G(x) ,
c’àd. un inverse à F sur Br (x) ∩ F−1 Bε F(x) .
Exemple 6.2.3. La fonction f : R → R donnée par f (x) = x3 est bijective et de classe C 1 (même
C ∞ ) mais sa réciproque f −1 (y) = y1/3 n’est pas dérivable en y = 0. De fait, f 0 (0) = 0. ♣
xey
Exemple 6.2.4. Soit F : R2 → R2 définie par F(x, y) = y+cos
x , alors
!
ey xey
F∗ (x, y) = ⇒ Det F∗ (x, y) = ey (1 + x sin x).
− sin x 1
E XERCICE 96: Dire si les applications suivantes sont inversibles sur un voisinage du point précisé,
et, si oui, donner la dérivée.
ey cos x
a. F(x, y) = ln(x+y) au voisinage de π/2
0 ;
sin x + xy π/2
b. F(x, y, z) = arctg(xey ) en ;
1
1
3 3
z + y + ln(1 + x ) 2
x2 +2xy
3
c. F(x, y, z) = y3 +xyz en 1 .
2yz+z2 −1
2 2 )
E XERCICE 97: Soit F : R2 → R2 l’applicatoin déterminée par F(x, y) = y +x(1−x xy . Quel est le
2 x 1 x
plus grand ouvert U ⊂ R tel que ∀ y ∈ U, F est un difféomorphisme C local en y . F est-elle
alors un difféomorphisme C 1 de U vers F(U) ?
−y
E XERCICE 98: Soit F : R2 → R2 l’application déterminée par F(x, y) = ee−y cos x
sin x .
a. Calculer la matrice de Jacobi en xy et donner son déterminant.
b. Quel est le plus grand ouvert U ⊂ R2 tel que ∀ xy ∈ U, F est un difféomorphisme C 1 local
en xy ?
c. Montrer que F n’est pas un difféomorphisme C 1 de U vers F(U). [Indice : il suffit de montrer
que F(x, y) n’est pas injective, i.e. qu’il existe deux points différents de U qui ont la même
image.]
104
Chapitre 6 - R ÉSOLUTION ET ÉTUDE II
x
d. Soit V un voisinage de y ∈ U et soit G : F(V ) → V un inverse local de V . Donner la dérivée
de G en F(x, y).
Essentiellement, le théorème d’inversion locale permet de résoudre l’équation x − F(y) = 0. Le
théorème des applications implicites pousse un peu plus loin en voulant résoudre F(x, y) = 0, pour
y en fonction de x. Le nom vient du fait que y dépend (via F) implicitement de x. Dans le cas
le plus simple où F serait une application linéaire il faut autant d’équations que d’inconnues. Par
conséquent, si x ∈ Rm et y ∈ Rn , F sera supposée une application de F : U → Rn où U ⊂ Rm+n est
un ouvert.
La notation suivante sera utile pour la démonstration du théorème. Soit F : Rm+n → Rn une
application, alors F∗,[2] sera la matrice n × n formée par les n dernières colonnes de F∗ (ou autrement
dit la matrice de Jacobi de F mais en prenant les coefficients x comme des constantes), tandis que
F∗,[1] sera la matrice n × m formée par les m premières colonnes de F∗ (ou autrement dit la matrice
de Jacobi de F mais en prenant les coefficients y comme des constantes).
Théorème 6.2.5 (Théorème des applications implicites)
Soit U ⊂ Rm+n un ouvert et F : U → Rn une application de classe C 1 au voisinage de ba tels
Parenthèse : Le petit frère de ce résultat chez les applications linéaires, est qu’étant données n
équations (linéairement indépendantes) et n + m variables, alors il y a m variables “libres” et qui
déterminent les n variables restantes.
x
D ÉMONSTRATION : Soit G : U → Rm+n l’application définie par G(x, y) = F(x,y)
. Alors
!
Idm 0
G∗ (x, y) =
F∗,[1] (x, y) F∗,[2] (x, y)
Ainsi Det G∗ (a, b) = Det F∗,[2] (a, b) 6= 0. En particulier le théorème d’inversion locale 6.2.2 im-
plique qu’il existe un voisinage de ba (dont la forme peut-être supposée V1 ×V2 ) tel que G possède
!
x
= H ◦ G(x, y) = H x, F(x, y) = H(x, 0).
y
Ainsi, en écrivant H = H 1
H2 , il s’obtient que y = H2 (x, 0). D’où il provient l’application T(x) =
H2 (x, 0) désirée.
De l’autre côté (⇐), si xy ∈ V1 ×V2 sont tels que y = T(x) = H2 (x, 0), alors
! ! !
x H1 (x, 0) H1 (x, 0)
= G ◦ H(x, 0) = G H1 (x, 0), H2 (x, 0) = =
0 F H1 (x, 0), H2 (x, 0) F H1 (x, 0), y
105
6.2 - Théorème des applications implicites
En regardant cette égalité coordonnées par coordonnées, il apparaît que x = H1 (x, 0) et 0 = F H1 (x, 0), y .
En remplaçant la première équation dans la seconde, 0 = F(x, y)
Il est facile de montrer que le théorème des fonctions implicites implique le théorème d’inver-
sion locale, il s’agit en réalité de deux énoncés équivalents (le théorème d’inversion locale est le cas
particulier où F(x, y) est de la forme F(x) − y).
en ce point. ♣
Exemple 6.2.7. Soit F1 , F2 : R4 → R deux applications. Supposons qu’il y a des contraintes F1 (x1 , x2 , x3 , x4 ) =
0 et F2 (x1 , x2 , x3 , x4 ) = 0. Comment exprimer la variation de x1 en fonction x3 en un point a =
(a1 , a2 , a3 , a4 )T en considérant x2 comme étant fixé (dans ce cas x4 devra aussi varier pour satisfaire
les contraintes) ?
(x1 ,x2 ,x3 ,x4 )
Soit F(x2 , x3 , x1 , x4 ) = FF21 (x 1 ,x2 ,x3 ,x4 )
et supposons alors que Det F∗,[2] (a) = ∂F1 ∂F2 ∂F1 ∂F1
∂x1 ∂x4 − ∂x4 ∂x2 6= 0.
Le théorème des fonctions implicites 6.2.5 dit que x1 et x4 s’exprime comme des fonctions de x2 et
x3 au voisinage de a.
Pour trouver les dérivées, il n’est pas nécessaire d’inverser la fonction. Il suffit de dériver les
deux équations F1 = 0 et F2 = 0 par rapport à x3 :
que F(a, b) = 0 et Det F∗,[2] (a, b) 6= 0. Soit T : V1 → V2 l’application de classe C 1 qui décrit la
106
Chapitre 6 - R ÉSOLUTION ET ÉTUDE II
∂T −1 ∂F
∀i ∈ m, (x) = −F∗,[2] x, T(x) x, T(x) .
∂xi ∂xi
Dans une écriture moins compacte :
∂F1 ∂F1 ∂F1 ∂F1 ∂F1 ∂F1
∂F1 ∂F1 ∂F1
∂y1 ∂y2 · · · ∂y j−1 ∂xi ∂y j+1
···
∂yn ∂y1 ∂y2
···
∂yn
∂F2 ∂F2 ∂F2 ∂F2 ∂F2 ∂F2 , ∂F2 ∂F2 ∂F2
··· ··· ···
∂T j
(x) = − Det ∂y1 ∂y2 ∂y j−1 ∂xi ∂y j+1 ∂yn Det ∂y1 ∂y2 ∂yn
∂xi .. .. .. .. .. .. .. .. .. .. .. ..
.
. . . . . . . .
. . .
∂F
∂Fn ∂Fn ∂Fn ∂Fn ∂Fn ∂Fn n ∂Fn ∂Fn
··· ··· ···
∂y1 ∂y2 ∂y j−1 ∂xi ∂y j+1 ∂yn ∂y1 ∂y2 ∂yn
∂F ∂T ∂F ∂F ∂T j
x, T(x) + F∗,[2] x, T(x) (x) = x, T(x) + ∑ x, T(x) (x) = 0.
∂xi ∂xi ∂xi j∈n ∂y j ∂xi
La formule matricielle apparaît directement. Pour la formulation explicite (et identique), il suffit de
résoudre les n équations (une pour chaque coordonnée de l’application F) du système linéaire :
démonstration.
107
6.2 - Théorème des applications implicites
z3
E XERCICE 100: Soit F : R3 → R la fonction définie par F(x, y, z) = x2 − y2 + z − .
3
a. Pourquoi F est-elle de classe C 1 ?
b. Pourquoi l’ensemble des points (a, b) ∈ U où le théorème des fonctions implicites peut être
appliqué est un ouvert ? [Votre réponse devrait rester valavle pour n’importe quelle appli-
cation F définie d’un ouvert U ⊂ Rm+n vers Rn qui est de classe C 1 ].
x
c. Au voisinage de quels points yz ∈ F −1 (0) est-il possible d’exprimer z comme fonction de
x et y ? [L’ensemble de niveau F −1 (0) est représenté ci-dessous à gauche.] Soit W l’ouvert
donné par l’ensemble de ces points.
x0
d. Soit yz0 ∈ W et G la fonction définie sur V ⊂ R2 un voisinage de xy00 telle que F x, y, G(x, y) =
0
0 pour tout xy ∈ V . Calculer les dérivées partielles de G en xy00 .
e. Pourquoi est-il ou n’est-il pas possible de définir G sur un ouvert assez grand de sorte que
son image soit tout S ?
f. Pourquoi est-il ou n’est-il pas possible de définir la fonction G sur { xy ∈ R2 | ∃z ∈ R tel
x
que yz ∈ W } ?
2 2 2
E XERCICE 101: Soit F : R3 → R2 l’application définie par F(x, y, z) = z +yz2−x(x−1)
−y2
. Les en-
−1 −1
sembles de niveau F1 (0) et F2 (0) sont représentés ci-dessus à droite ; le second est en effet de
transparence.
x
a. Au voisinage de quels points yz ∈ F−1 (0, 0) est-il possible d’exprimer y et z comme des
fonctions de x ? Soit W l’ensemble de ces points.
b. W est-il ouvert, fermé, fermé et ouvert, ni fermé ni ouvert ?
108
Chapitre 6 - R ÉSOLUTION ET ÉTUDE II
x0
c. Soit y0
z0
∈ W et γ l’application (une courbe paramétrée) définie sur V ⊂ R un voisinage
de x0 telle que F x, γ1 (x), γ2 (x) = 0 pour tout x ∈ V . [Ici, γ1 et γ2 sont les fonctions coor-
données de l’application γ ; ces fonctions sont à valeurs dans R.] Calculer la dérivée de γ
en x0 .
d. Pourquoi est-il ou n’est-il pas possible de définir G sur un ouvert assez grand de sorte que
son image soit tout S ?
Exemple 6.2.9. Dans cet exemple les . . . seront utilisés pour dire qu’il est toujours possible d’aller
chercher des coefficients d’ordre supérieur pour avoir une meilleure information. Soit F : R2 → R la
fonction définie par F(x, y) = sin(x + y) − xy − 2x. En 00 , F(0, 0) = 0 et F∗,[2] (0, 0) = D2 F(0, 0) =
cos 0 − 0 = 1 6= 0. Ainsi dans un voisinage de l’origine, y = f (x). Pour trouver les coefficients ai de
y = f (x) = a1 x + a2 x2 + a3 x3 + . . .
1 + a1 = 2 ⇒ a1 = 1,
a2 = a1 ⇒ a2 = 1,
a3 − 6 (1 + a1 ) = a2 ⇒a3 = 73 .
1 3
109
6.3 - Espace tangent et sous-variétés
Quelle que soit la méthode pour définir un sous-ensemble de Rm (i.e. comme ensemble de niveau
dans ET1, comme image d’une application dans ET3, ou tout simplement comme sous-ensemble
dans ET2), un point est singulier lorsque les trois définitions de plan tangent ne peuvent coïncider.
En réalité, le seul plan tangent qui nous intéresse vraiment, est celui des vecteurs vitesses : c’est
la seule définition “intrinsèque” (i.e. propre à l’ensemble). Comme on a vu, il est difficile à calculer
tandis que ses deux “cousins” T par et Ten sont faciles à calculer. Une des applications majeure du
théorème d’inversion locale et du théorème des fonctions implicites est de donner des critères qui
permettent d’assurer qu’une des notions “calculables” (T par ou Ten ) est égale au plan tangent Tvit .
Le résultat sera même plus fort que celui demandé, au sens où on montrera que les points
singuliers forment un fermé. En particulier, une petite perturbation des conditions fera qu’on se
trouve dans une situation régulière. Voici les définitions clefs de cette section :
110
Chapitre 6 - R ÉSOLUTION ET ÉTUDE II
Des définitions similaires peuvent être faites pour les ensembles de niveaux :
Si la terminologie ci-dessus est redondante, c’est que l’objectif de cette section est précisément
de montrer que les points réguliers d’un paramétrage sont des points réguliers d’un ensemble de
niveau et vice versa.
Dans l’énoncé suivant, lorsque ` = m, Rm−` sera entendu comme étant l’espace vectoriel de
dimension 0 : {0}.
Théorème 6.3.4
Soit ` ≤ m ∈ Z≥1 , soit V ⊂ R` un ouvert, G : V → Rm une application de classe C 1 , et b ∈ V
un point régulier de G. Alors il existe un voisinage U ⊂ V ⊂ R` de b, W un ouvert contenant
G(U) et une application F : W → Rm−` telle que, en posant a := G(b),
— G(U) = F−1 (0) =: S0 ,
— Tbpar G = Ten a S0
— et 0 est une valeur régulière de F.
par
En particulier, si S = G(U), Tvit en
a S est égal aux deux autres plan tangents (Tb G et Ta S0 (par la
proposition 3.7.9).
111
6.3 - Espace tangent et sous-variétés
Par conséquent, F définie sur W = Im H × Rm−` par Fi (x) = Gi+` (x1 , x2 , . . . , x` ) − xi+` , où i ∈ m − `,
est telle que F−1 (0) = Im G.
Il ne reste plus qu’à remarquer que les ∇Fi (a) sont linéairement indépendants (les ` premières
coordonnées de chaque gradient sont un peu étranges, bien que calculables, et les m − ` dernières
coordonnées sont des 0 et un 1). Ainsi dim Ten m
a S0 est l’orthogonale dans R d’un espace de dimen-
sion m − `, soit un espace vectoriel de dimension `. D’autre part, comme les ` colonnes de G∗ (y)
(i.e. les Di G(y)) sont linéairement indépendantes, la dimension de Tbpar G est aussi `. Ainsi ces deux
espaces vectoriels doivent être identiques.
Le précédent théorème dit en fait plus que ce qui avait été annoncé : si le paramétrage est bon, il
est toujours (localement !) possible de réaliser l’image comme un ensemble de niveau et les plans
tangents sont indépendants du point de vue. Le prochain donnera le sens inverse, c’àd. que si un
ensemble de niveau est “régulier” il peut être (localement !) vu comme l’image d’un paramétrage et
les notions de plan tangent coïncident toutes.
Théorème 6.3.5
Soit m ≥ n ∈ Z≥1 , U un ouvert de Rm et soit F : U → Rn une application de classe C 1 , soit
S = S0 = F−1 (0). Soit a ∈ U tel que 1 dim Ten
a S0 = m − n alors il existe un voisinage V de a,
W ⊂R m−n m
un ouvert et G : W → S0 ∩V ⊂ R une application telle que
— G est bijective et C 1 ;
— si b = G−1 (a), Tbpar G = Ten
a S0 ;
— et tout point de W est un point régulier de G.
D ÉMONSTRATION : Si m = n alors F est en fait un difféomorphisme local en x, ainsi F−1 (0) = {x}
et G : {0} → {x} ne peut être définie que d’une façon.
Lorsque m > n, c’est le théorème des fonctions implicites 6.2.5 qui sera utilisé (rappelons qu’il
est équivalent au théorème d’inversion locale 6.2.2). En effet, comme les gradients sont linéairement
indépendants (et supposons que m > n) alors une sous-matrice n × n de F∗ (a) sera de déterminant
non-nul. Quitte à réordonner les coordonnées, il sera supposé qu’il s’agit de celle formée par les
n dernières colonnes. Posons ` = m − n, F va d’un ouvert de R`+n dans un ouvert de Rn . Il est
alors possible d’appliquer le théorème des fonctions implicites 6.2.5 pour montrer qu’il existe un
voisinage V1 ×V2 de a (où V1 ⊂ R` et V2 ⊂ Rn ) et T : V1 → V2 de classe C 1 tel que
112
Chapitre 6 - R ÉSOLUTION ET ÉTUDE II
C’est essentiellement le paramétrage : soit G : V1 → V1 × V2 défini par G(y) = Id`×` (y), T(y) .
Alors par construction, G est une application bijective et C 1 à valeur dans F−1 (0).
Pour montrer l’égalité des espaces tangents il suffit de voir que la dimension est égale. L’espace
tangent Ten
a S0 est donné par orthogonalité à n vecteurs linéairement indépendants ; sa dimension est
m − n = `. Quant à Tbpar G, comme G∗ (b) contient une sous-matrice de la forme identité, les Di G(b)
sont linéairement indépendants ; sa dimension est aussi ` = m − n.
Définition 6.3.6. Soit S un sous-ensemble de Rm . S est une [sous-]variété de Rm , si une des deux
conditions équivalentes 2 suivantes est vérifiée :
— ∀x ∈ S il existe un voisinage U de x (dans Rm ) et un paramétrage local G : V → U ∩ S où
V ⊂ R` est un ouvert.
— ∀x ∈ S il existe un voisinage U de x (dans Rm ) et une application F : U → Rn telle que
S = F−1 (0) et 0 est une valeur régulière de F).
La dimension d’une sous-variété connexe S de Rm est, dans le premier cas, l’entier `, et, dans le
second cas, l’entier m − n. F
Il est bon de notre que les entiers m − n et ` sont tout à fait en analogie avec les dimensions de
noyau et d’image en algèbre linéaire. Un paramétrage local de S est dit paramétrage global s’il est
surjectif sur S (et donc bijectif).
Il serait tentant de croire qu’une des deux perceptions d’un sous-ensemble (via les ensembles
de niveaux ou via les paramétrages locaux) est meilleure que l’autre. Au niveau local, les théorèmes
6.3.4 et 6.3.5 montrent qu’il n’y a aucune différence. Voici une liste d’exemples qui indique que
dans le cas global, il n’y a pas de règle :
Exemple 6.3.7. La sphère ne peut pas être l’image d’un seul paramétrage local, mais elle est
définie par une surface de niveau : x2 + y2 + z2 = 1. Elle peut être donnée par l’image d’une applica-
tion (une surface paramétrée) régulière, mais celle-ci n’est pas injective. Deux paramétrages locaux
possibles sur la sphère sont les deux projections stéréographiques.
L’hyperboloïde à deux nappes est une surface de niveau correspondant à l’équation z2 = 1 +
x2 + y2 . Il est possible de se restreindre à une seule de ses “nappes”, en regardant par exemple
S0 = F −1 (0) où F(x, y, z) = 1 + x2 + y2 − z2 est définie non pas sur R3 mais sur R × R × R≥0 . Alors,
2. Cette équivalence est le contenu des théorèmes 6.3.5 et 6.3.4.
113
6.3 - Espace tangent et sous-variétés
cet ensemble de niveau possède un paramétrage global (ilsuffit de projeter sur le plan xy et de
x
y
prendre l’inverse de cette projection : G(x, y) = √ 2 2 ).
1+x +y
L’hyperboloïde à une nappe est aussi une surface de niveau : x2 + y2 − z2 = 1. Il est possible de
le décrire en utilisant un paramétrage global (il faut chercher un peu). Il est par contre l’image d’une
application (surface paramétrée) régulière (cf. exemple 8.0.2) non-injective (ainsi deux paramétrages
locaux qui recouvrent cette nappe peuvent être formés par deux restrictions de ce paramétrage sur
deux domaines différents).
Le ruban de Möbius (voir l’exemple 8.2.5) ne peut ni être couvert par un paramétrage global ni
être décrit comme une surface de niveau (combiner le fait qu’il n’est pas orientable avec la propo-
sition 8.1.2). Par contre, il est néanmoins possible de le décrire comme l’image d’une application
(surface paramétrée) régulière (non-injective, bien sûr). ♣
E XERCICE 102: Montrer que le (double-)cône S = {(x, y, z)T ∈ R3 | x2 + y2 = z2 } n’est pas une
sous-variété de R3 .
[Attention : il est insuffisant de montrer que le gradient d’une fonction dont S est une surface
de niveau est nul, il faudrait le montrer pour toutes les fonctions qui réalisent S comme surface de
niveau. Par contre, il est plus facile (et très recommandé) de montrer que Tvit
0 S n’est pas un espace
vectoriel.]
Avant de clore cette section sur l’espace tangent, voici un exercice qui devrait permettre de
sceller l’interprétation de cet espace vectoriel. Un court rappel est de bon ton. Soit S ⊂ Rm une
sous-variété. Pour rappel, étant donné une des trois définitions d’espace tangent T par , Tvit ou Ten
(qui coïncident toutes comme S est une sous-variété), il est toujours possible de les réaliser non pas
comme un espace vectoriel mais comme l’ensemble (affin, e.g. en dimension 2 le plan) qui intersecte
S en (au moins) un point. Par exemple, le “plan” tangent (en tant qu’en ensemble) en a ∈ S est défini
par Pvit vit
a = {a + v | v ∈ Ta S}.
E XERCICE 103: Soit S ⊂ Rm une sous-variété de dimension ` ∈ Z≥0 tel que 1 < ` < m. Montrer
que si P est un hyperplan de Rm (i.e. un ensemble où une fonction affine s’annule) tel que P ∩ S est
exactement un point a, alors P contient le plan tangent de Pa S.
[Indices : Ci-dessous le dessin d’un cas où le vecteur normal est linéairement indépendant du
gradient.
1- Remarquer que si A = {a} est un point, alors Tvit
a A = {0}.
2- Réaliser S localement autour de a comme l’ensemble de niveau d’une application F et réaliser P
(globalement) comme l’ensemble de niveau d’une fonction A (affine). En déduire que S ∩ P est aussi
localement l’ensemble de niveau d’une application.
3- Montrer que si le vecteur v normal à P (i.e. tel que P = {a + w | w · v = 0}) est linéairement
indépendant l’espace engendré par les ∇Fj (a) (où j ∈ m − `) alors le plan tangent en a est de
dimension (strictement) supérieure à 0. ]
114
Chapitre 6 - R ÉSOLUTION ET ÉTUDE II
E XERCICE 104: Soit On(R) l’ensemble des matrices orthogonales à coefficients réels, i.e. le sous-
ensemble de Mn×n (R) formé des matrice A telles que AT A = Id. L’objectif est de montrer que
2
ces matrices forment une sous-variété de Mn×n (R). Pour ce faire, il faut voir Mn×n (R) comme Rn
(puisqu’il y a n2 coefficients dans ces matrices et qu’elles forment un espace vectoriel (via l’addition
et la multiplication par un scalaire) et même euclidien (via la norme k · k2 ).
a. Soit S le sous-espace vectoriel formé des matrices symétriques de taille n × n. Dire pourquoi
S est un espace vectoriel de dimension n(n + 1)/2.
b. Soit F : Mn×n → S la fonction définie par F(A) = AT A. Pour B ∈ Mn×n , calculer la dérivée
directionnelle
lim F(A + tB) − F(A)
DB F(A) = t→0
t
c. Montrer que, si B est fixée DB F(A) est une application linéaire, i.e. DB F(A) + DB F(A0 ) =
DB F(A + A0 ). En déduire que F est de classe C 1 (inutile de prendre directement la définition
de limite ; seulement les propriétés sur la somme/composition/produit de fonctions C 1 ).
d. Il faut montrer que Id est une valeur régulière de F. Pourquoi est-il suffisant de montrer que
e. Montrer que Id est une valeur régulière de F, i.e. que O(n) est une sous-variété. Quelle est
la dimension de O(n) ?
f. Montrer que son espace tangent en A = Id est formé par les matrices antisymétriques, i.e.
montrer que DB F(Id) = 0 implique que BT = −B.
E XERCICE 105: Montrer que le graphe d’une fonction est une sous-variété. Pour ce faire, il est
possible de regarer l’exercice 54 (mais avec les théorèmes maintenant à disposition, il n’est pas
nécessaire de refaire tout l’exercice).
115
6.4 - Multiplicateurs de Lagrange
Définition 6.4.1. Soit U ⊂ Rm un ouvert et soit F : U → R une fonction. Soit S := G−1 (0) ⊂ U,
où G : U → Rn est une application, la contrainte. Le point x ∈ S est un maximum (resp. minimum)
local de F sous la contrainte S si ∃r ∈ R>0 ∀y ∈ Br (x) ∩ S, F(y) < F(x) (resp. >). F
Il ne s’agit en quelque sorte que de chercher les extrema de la fonction F restreinte à S, F|S :
U ∩ S → R.
Afin de présenter l’idée de la réponse, G sera temporairement supposée être une fonction ; la
contrainte est temporairement réduite G1 (x) = 0. D’un côté, le gradient de G1 est perpendiculaire
à l’ensemble de niveau G1 (x) = 0. D’un autre, le gradient de F indique la variation la plus impor-
tante de F. En un point x de U ∩ S, si ∇F(x) n’est pas perpendiculaire à l’ensemble de niveau, sa
∇F(x)·∇G1 (x)
composante tangente à l’ensemble de niveau v := ∇F(x)(1 − k∇F(x)k k∇G1 (x)k ) est non nulle. Pour
3. Puisque la variété aura alors essentiellement l’air de l’ensemble de niveau { xy ∈ R2 | x2 = y2 } où 00 est le point
de croisement.
4. Comme dans la parabole semi-cubique, l’ensemble de niveau { xy ∈ R2 | x2 = y3 } ou l’image de la courbe γ(t) =
t3 0
t 2 où, dans les deux cas, 0 est le point de rebroussement.
116
Chapitre 6 - R ÉSOLUTION ET ÉTUDE II
t petit x + tv, donnera une variation stricte (du même signe que t) de la valeur de F ET reste très
proche de la contrainte : G1 (x +tv) est proche de 0 (puisque v est tangent à la surface de niveau). En
déformant un peu, il est raisonnable de croire que des points proprement dans S auront des valeurs
strictement plus grandes et plus petites. La condition est donc que si x est un extrema, ∇F doit être
colinéaire à ∇G1 .
Théorème 6.4.2
Soit U ⊂ Rm un ouvert, soit F : U → R une fonction dérivable et soit G : Rm → Rn une appli-
cation de classe C 1 telle que S := G−1 (0) 6= ∅ et 0 est une valeur régulière 5 de G. Si x est un
extremum local de F|S alors ∃a ∈ Rn tel que
n
∇F(x) = ∑ ai ∇Gi (x).
i=1
117
6.4 - Multiplicateurs de Lagrange
D ÉMONSTRATION : Il ne s’agit en fait que d’une ré-écriture : le gradient est nul si toutes les
dérivées partielles (ici, par rapport aux xi et aux a j ) sont nulles. Les dérivées partielles par rapport
aux xi (où i ∈ m) donnent
∂L ∂F ∂Gk
(x, a) = (x) − ∑ ak (x) = 0,
∂xi ∂xi k∈n ∂xi
ou, comme ceci est vrai ∀i ∈ m, que ∇F(x) − ∑k∈n ak ∇Gk (x) = 0. En d’autres termes, les conditions
obtenues par le théorème 6.4.2. D’autre part, la dérivée partielle par rapport à ak donne que
∂L
(x, a) = Gk (x) = 0,
∂ak
ou que les contraintes soient satisfaites.
En bref, il suffit de faire attention au fait que L : Rm+n → R et ∇L : Rm+n → Rm+n pour voir que les
deux formulations sont équivalentes. Cependant, pour ne pas oublier les hypothèses dudit corollaire,
la meilleure formulation est :
Corollaire 6.4.4
Soit U ⊂ Rm un ouvert, soit F : U → R une fonction dérivable et G : Rm → Rn une application
de classe C 1 telle que S := G−1 (0) 6= ∅. Si x est un extremum local de F|S alors
— soit x n’est pas un point régulier pour G (et G(x) = 0) ;
— soit ∃a ∈ Rn tel que ∇L (x, a) = 0.
118
Chapitre 6 - R ÉSOLUTION ET ÉTUDE II
Exemple 6.4.5. Soit F, G : R2 → R les fonctions définies par F(x, y) = y et G(x, y) = y3 − x2 . Pour
étudier F sous la contrainte (simple) S = G−1 (0), il suffit de trouver une relation de colinéarité entre
les gradients ∇F(x, y) = 01 et ∇G(x, y) = 3y2x 0 2x x
2 . Or, il n’y a aucun a tel que 1 = a 3y2 et y ∈ S.
Pour le voir, ces équations impliquent que 3ay2 = 1 6= 0, d’où a 6= 0. Mais 2ax = 0, ce qui force
x = 0. Cependant, si x = 0 et G(x, y) = 0, ceci implique que y = 0, une contradiction.
Pourtant, F|S a un minimum évident en xy = 00 . Appliquer bêtement la MdMdL ne fonctionne
pas car l’extremum se trouve en un point non-régulier (ou singulier), c’àd. ∇G(0, 0) = 00 . Au-
trement dit, ce point n’est pas un point régulier de l’ensemble de niveau (Tvit 0 S = {0} tandis que
en 2
T0 S = R ) et 0 n’est pas une valeur régulière de G. Cette courbe de niveau est représentée plus bas
sur la gauche. ♣
Le second est probablement plus intéressant, il montre le cas d’une contrainte qui est décrite par
une application G mal choisie (c’àd. de sorte qu’aucun point de la contrainte ne soit régulier).
p
Exemple 6.4.6. Soit G1 = (z − 2)2 + ( x2 + y2 − 3)2 − 4 la fonction (à soustraction par 4 près)
du carré de la distance au cercle de rayon 3 dans le plan z = 2 centré en (0, 0, 2)T et soit G1 =
p
(z + 2)2 + ( x2 + y2 − 3)2 − 4 la fonction (toujours à constante près) du carré de la distance au
cercle de rayon 3 dans le plan z = −2 centré en (0, 0, −2)T . L’ensemble S = G−1 −1
1 (0) ∩ G2 (0) est
l’ensemble des points dont la distance au carré de chaque cercle est 4, soit le cercle x2 + y2 = 9
7. Parfois, les points où F n’est pas dérivable ou G n’est pas de classe C 1 sont eux-aussi inclus dans cette dénomina-
tion.
8. Il arrive aussi que la valeur F(x) ∈ R en un point singulier x soit appelée valeur singulière.
119
6.4 - Multiplicateurs de Lagrange
dans le plan z = 0 (voir dessin ci-dessus à gauche). L’espace tangent de ce cercle est évidemment
de dimension 1. Par contre,
(1 − √ 23 2 )x (1 − √ 23 2 )x
x +y x +y
√ 3 √
∇G1 (x, y, z) = (1 − 2 2 )y et ∇G2 (x, y, z) = (1 − 2 2 )y .
3
x +y x +y
(z − 2) (z + 2)
0 0
En particulier, si z = 0 et x2 + y2 = 9, ces gradients sont égaux à 0 et 0 respectivement.
−2 2
Autrement dit, tout vecteur du plan z = 0 leur est orthogonal, et le plan tangent en tant qu’espace
de niveau est de dimension 2. Il y a alors une différence entre l’espace tangent Tvit en
x S et Tx S ; 0 n’est
pas une valeur régulière de G, et même aucun point n’est régulier pour ce choix de G.
Voici ce que donne une application erronée de la MdMdL à l’étude de F(x,y, z) = x sur S =
0
1
0
−1
G (0). On a ∇F(x, y, z) = 0 n’est jamais une combinaison linéaire de 0 et 0 . Ce qui
0 −2 2
laisserait à penser que la fonction n’a pas d’extrema sur S (ce qui est évidemment faux, puisque S
est compact). Le problème vient du fait que ∇G1 et ∇G2 ne sont (évidemment) pas linéairement
indépendants sur S.
Par contre, il est tout à fait possible de décrire S de façon moins tordue. Par exemple, en regardant
l’intersection du cylindre x2 + y2 = 9 (l’ensemble de niveau de H1 (x, y, z) = x2 + y2 − 9) et du plan
z = 0 (l’ensemble de niveau de H2 (x, y, z) = z). Alors, tous les points sont réguliers, et trouver les
extrema de F(x, y, z) = x se passe sans problème. ♣
Exemple 6.4.7. Soit F, G : R2 → R les fonctions de classe C 1 définies par F(x, y) = xey et G(x, y) =
y − x2 . Tentons de trouver un minimum de F sous la contrainte G(x, y) = 0. Un calcul direct donne
y 2x
que ∇F(x, y) = xee y et ∇G(x, y) = −1
. Tout d’abord, ∇G(x, y) n’est jamais trivial ; ainsi la MdMdL
s’applique.
Reste à trouver a ∈ R tel que ey = 2xa et xey = −a. Comme ey > 0, la première de ces deux
équations exclut que x = 0 ou a = 0. Ainsi ces deux équations se ré-écrivent 2xa = ey = − ax ce qui
donne 2x2 = −1. Il n’y a donc pas de points critiques et la fonction F sous la contrainte G(x, y) = 0,
en particulier, F ne possède pas d’extremum sous cette contrainte. ♣
Pour déterminer si un point critique de L est un extremum local de F|S , il n’y a pour l’instant
pas d’autres méthodes que de procéder par une fonction test. Voici un corollaire important des
théorèmes 6.4.2 et 2.4.9 :
Corollaire 6.4.8
Soit S ⊂ Rm un ensemble compact tel que S = G−1 (0) pour une application dérivable G telle
que les lignes de G∗ sont linéairement indépendantes sur S. Soit F une fonction continue sur S
telle que F possède deux valeurs critiques ou singulières distinctes v1 < v2 . Alors, F −1 (v1 ) sont
des minima absolus de F et F −1 (v2 ) des maxima absolus de F.
120
Chapitre 6 - R ÉSOLUTION ET ÉTUDE II
D ÉMONSTRATION : La démonstration en est simple : comme S est compact et F continu sur S elle
doit avoir des extrema absolus. Ceux-ci ont forcément lieu en des points singuliers ou critiques. Or
il n’y a que deux valeurs possibles en de tels points, ils sont tous des extrema absolus.
Il faut d’abord regarder quand les2 lignes de G∗ sont linéairement indépendantes. En fait,
2x 2x 0 0
∇G1 (x, y, z) = 2y et ∇G2 (x, y, z) = 2y sont linéairement indépendants sauf en 0 , 0
−2z 2(z−1) 0 1
ou si z = 21 . Mais aucun de ces points n’appartient à G−1 (0), i.e. tous les points de S sont réguliers.
Le lagrangien est L (x, y, z, a1 , a2 ) = F(x, y, z) + a1 G1 (x, y, z) + a2 G(x, y, z) et son gradient s’an-
nule lorsque
∂L
∂x = 2x + 2xa1 + 2xa2 = 0 ⇔ 2x(1 + a1 + a2 ) =0 éq.1
∂L
∂y = 4y + 2ya1 + 2ya2 = 0 ⇔ 2y(2 + a1 + a2 ) =0 éq.2
∂L
∂z = 2z − 2za1 + 2(z − 1)a2 = 0 ⇔ 2z(1 − a1 + a2 ) = 2a2 éq.3
∂L
∂a1 = x 2 + y2 − z2 − 4 = 0 ⇔ x 2 + y2 2
= z + 4 éq.4
∂L
∂a2 = x2 + y2 + (z − 1)2 − 9 = 0 ⇔ x2 + y2 + (z − 1)2 = 9 éq.5
Tout d’abord, insérer le terme de droite de l’éq.4 dans l’éq.5 donne z2 + 4 + (z − 1)2 = 9 ou
2z2 − 2z − 4 = 0 ce qui implique que z = 1±3 2 , soit z = 2 ou z = −1.
De plus, l’éq.4 exclut que x et y soient tous les deux simultanément nuls. Mais si x et y sont tous
les deux non-nuls, les éq.1 et éq.2 impliquent que 1 + a1 + a2 = 2 + a1 + a2 ce qui est impossible. Il
y a ainsi deux cas : x = 0 et y = 0.
√
Prenons d’abord y = 0. Alors, par l’éq.4 x = ± z2 + 4. Ensuite a1 + a2 = −1 par l’éq.1. De ce
2z −1
fait, l’éq.3 devient 2z(2+2a2 ) = 2a2 ou a2 = 1−2z ce qui implique a1 = 1−2z . Voici donc les premiers
√ 1 −4 T
√ −1 −2 T
points critiques de L : (± 8, 0, 2; 3 , 3 ) et (± 5, 0, −1; 3 , 3 ) où F prend pour valeur 12 et 6
(resp.).
√
Si x = 0, il apparaît par l’éq.4 que y = ± z2 + 4. Cette fois-ci, satisfaire l’éq.2 demande à ce que
3z 1+z
a1 + a2 = −2. L’éq.3 devient 2z(3 + 2a2 ) = 2a2 , donc a2 = 1−2z et a1 = 2z−1 . Les points critiques
√ T
√ T
de L restants sont établis : (0, ± 8, 2; 1, −2) et (0, ± 5, −1; 0, −1) où F prend pour valeur 18
et 11 (resp.).
121
6.4 - Multiplicateurs de Lagrange
[Attention ! ici il s’agit de maxima et minima absolus sur S ∩ {(x, y, z) | z = 2}, sur tout S ils
ne sont pour l’instant que des minima et maxima locaux.]
[Re-attention ! Si il y avait eu trois valeurs différentes, la plus petite aurait été associée à un
[ou des] minimum[a], la plus grande à un [ou des] maximum[a], mais il aurait fallu plus de travail
pour savoir si la valeur intermédiaire était effectivement un [ou des] extremum[a] ou un [ou des]
points d’inflexions.]
√
En faisant le même raisonnement sur S ∩ {(x, y, z) | z = −1}, il apparaît que (0, ± 5, −1) sont
√
des maxima locaux (la valeur est 11) et que (± 5, 0, −1) sont des minima locaux (la valeur est 6).
Finalement,
en comparant les différentes
valeurs aux points critiques, il apparaît que
0
√ 0
√
± 8 sont des maxima absolus, ± 5 sont des minima locaux,
2
√ √ −1
± 8 ± 5
0 sont des maxima locaux, 0 sont des minima absolus. ♣
2 −1
E XERCICE 107: Soit S un ensemble qui n’est pas nécessairement une sous-variété. Montrer que si
une fonction F : U → R (où U est un ouvert contenant S) a un maximum (resp. minimum) en x alors
pour tout v ∈ Tvit
x S, v · ∇F(x) ≤ 0 (resp. ≥ 0).
Sous l’hypothèse supplémentaire que Tvit vit vit
x S est symétrique (i.e. v ∈ Tx S ⇒ −v ∈ Tx S), montrer
que si F a un extremum en x, alors pour tout v ∈ Tvit
x S, v · ∇F(x) = 0.
E XERCICE 108: Trouver les maxima et minima de la fonction F(x1 , x2 , . . . , xm ) = x1 + x2 + . . . +
xm = ∑i∈m xi sur la sphère, i.e. sous la contrainte x12 + x22 + . . . + xm
2 = 1.
E XERCICE 109: Soit C l’ensemble donné par l’intersection de la surface xyz = 1 et du plan x + y +
z = 3. Afin de trouver les éventuels points où l’ensemble qui en résulte a une coordonnée petite, le but
ici est de chercher les extrema de F(x, y, z) = x (par symétrie, les choses se passeront pareillement
122
Chapitre 6 - R ÉSOLUTION ET ÉTUDE II
pour y et z) restreinte à C.
a. Soit G1 (x, y, z) = xyz − 1 et G2 (x, y, z) = x + y + z − 3. Quels sont les points singuliers ?
[Indice : Il y en a un d’évident. Pour les éventuels autres, utiliser que si deux vecteurs ne
sont pas linéairement indépendants, tous les déterminants des mineurs de la matrice formée
en les prenant pour ligne (ou colonne) sont nuls.]
b. Trouver les points critiques de F sous la contrainte. (Il n’est pas nécessaire de donner le
type)
[Deux dessins, le premier de l’ensemble xyz = 1 (z grand en rouge), dans le second le plan x+y+z =
3 (même couleur mais triangulé) est rajouté.]
123
6.4 - Multiplicateurs de Lagrange
Finalement, il peut arriver que le bord ne soit pas contenu dans le domaine de F. Dans ce cas son
étude est nécessaire seulement pour glaner quelques informations supplémentaires sur la fonction
(i.e. est-elle bornée ?).
Voici un exemple simple :
classe C ∞ définie par F(x, y) = y + y2 (1 − x2 ). Pour passer à l’étude de F sur S, il faut d’abord
chercher à résoudre ∇F(x, y) = − 2xy2 , 1 + 2y(1 − x2 ) = 0. La seule possibilité est x = 0 et y =
− 21 . Or ce point n’appartient pas à S. Maintenant, il faut regarder ce qui se passe au bord, i.e. sur
T1 = {x = 0 et y ≥ 0} et T2 = {y = x2 et y > 0}.
Soit S1 = G−1 1
(1) (0) où G (1) (x, y) = x. Attention : S 1 ⊃ T1 ! Tout d’abord ∇G (1) (x) = 0 ; puis-
qu’il ne s’annule jamais, la MdMdL s’applique. Le lagrangien associé est L(1) (x, y, a) = F(x, y) −
aG(1) (x, y), il faut résoudre
∂L
∂x = −2xy2 − ax = 0
∂L
∂y = 1 + 2y(1 − x2 ) = 0
∂L
∂a = x = 0.
La troisième équation étant assez restrictive, il n’y a que x = 0 et y = − 12 (de nouveau) comme
solution, mais ce point n’appartient pas à T1 . Par contre, T1 a aussi un bord dans S1 : le point 00 .
Par défaut, si une fonction contrainte à un seul point, ce point est un point critique... ici F(0, 0) = 0.
Pour comprendre le comportement de F au voisinage de ce point, il suffit de remarquer que, comme
y ≥ 0 et x ≥ 0 dans S, si 0 ≥ x < 1 alors 1 − x2 > 0 et donc y + y2 (1 − x2 ) ≥ 0 ; ainsi (0, 0) est un
minimum local.
Dans les régions non-bornées, F peut aussi prendre de très grandes valeurs : y→∞ lim F(0, y) = +∞
√
lim F( t,t) = −∞. Ainsi, F ne peut pas avoir de maximum ni de minimum absolu.
et t→∞
En conclusion, F a un minimum local près de 00 mais ni maximum (local ou absolu) ni mini-
mum absolu.
Pour le principe de l’exemple, voici ce qui se passe sur T2 . Soit S2 = G−1 (2) (0) où G(2) (x, y) =
2
y − x (de nouveau, S2 ⊃ T2 ). Le lagrangien associé est L(2) (x, y, a) = F(x, y) − aG(2) (x, y), il faut
résoudre
∂L
∂x = −2xy2 + 2ax = 0
∂L 2
∂y = 1 + 2y(1 − x ) − 2a = 0
∂L
∂a = y − x2 = 0.
Comme le domaine d’intérêt est T2 , supposer que x > 0 et y > 0 est sans incidence.√Ceci permet
√
de simplifier le système ci-dessus en a = y2 , y = x2 , 1 + 2x2 − 4x4 = 0, d’où x = 1+ 2
5
. Pour
montrer qu’il s’agit d’un maximum local sur T2 , il est, entre autres, possible de regarder la fonction
√ √
f (t) := F( t,t), car ∀t > 0, ( t,t) ∈ T2 . À remarquer que comme T2 ∩S = ∅ ce maximum local (sur
T2 ) n’est pas important pour l’analyse en cours ; ceci permet simplement de voir le comportement
de F proche de T2 . ♣
Il va sans dire que de déterminer un maximum absolu est une procédure généralement difficile
(cf. l’exemple 6.4.9).
124
Chapitre 6 - R ÉSOLUTION ET ÉTUDE II
F(x, y) = x2 − y2 . À l’intérieur de S, ∇F(x, y) = (2x, −2y) ne possède que 00 comme point critique.
Mais comme F(0, 0) = 0, F(x, 0) = x2 > 0 pour x 6= 0 et F(0, y) = −y2 < 0 pour y 6= 0, ce point
n’est en fait qu’un point d’inflexion. Comme S est compact, il doit pourtant y avoir des extrema
absolus.
Si G(x, y) = x2 + y2 − 1 alors ∂S = G−1 (0). Comme ∇G(x, y) = 2x
2y ne s’annule pas sur ∂S. La
MdMdL s’applique donc et les solutions des équations
2x = 2xa et 2y = −2ya
donneront les points critiques sur le bord. Ces équations ont pour solution (dans ∂S !) (x, y; a)T =
(±1, 0; 1)T et (x, y; a)T = (0, ±1; −1)T . Comme les valeurs associées sont 1 et −1 et que ∂S est
compact, il est possible de conclure que (±1, 0)T sont des maxima absolus de F sur S et (0, ±1)T
des minima absolus de F sur S. ♣
Dans l’exemple précédent, il est bon de remarquer que si S avait été remplacé par son intérieur,
la fonction n’aurait eu aucun extrema. Ce concept dépend donc beaucoup du domaine de définition
de la fonction.
ce qui est impossible. Donc y = 0, et comme x2 − y2 − 1 = 0 sur ∂S, il faut que x = ±1 (ce qui
donne a = 3e−1 ). Ainsi, ±1
0 sont des points critiques de F contrainte à ∂S. En général, il peut être
difficile de savoir de quel genre de point il s’agit. Dans ce cas-ci il y a une astuce : changer le signe
de y ne change ni F ni G, ainsi une petite variation de la coordonnée y (et la variation associée
de la coordonnée x) aura le même effet qu’elle soit positive ou négative. Autrement dit, sous la
contrainte la situation est identique à celle, en une variable, où la fonction est symétrique : le point
ne peut être un point d’inflexion. Ensuite, ∂S se sépare en deux morceaux : celui de gauche (x < 0)
et celui de droite (x < 0). Chaque composante n’a qu’un seul point critique, et, ainsi, il suffit de
comparer la valeur en ±1
0 avec celle de n’importe quel autre point de la composante respective :
125
6.4 - Multiplicateurs de Lagrange
√
F(±1, 0) = e−1 > 28 e−7 = F(±2, ± 3). Ceci permet de conclure que ±1
0 sont des maxima locaux
de F sur ∂S. Il est même possible de vérifier que lorsque x et y sont grands, les valeurs de F tendent
vers 0.
Ainsi, sur ∂S, F prend au plus la valeur de e−1 , et donc près du bord de S les valeurs de F restent
proches de l’intervalle [0, e−1 ]. Comme aux points ±2 8 −4 > e−1 ,
0 (dans S) F prend la valeur 2 e
ceux-ci sont des maxima absolus de F. ♣
1
q
A(x, y, z) = (x2 + y2 + z2 )2 − 2(x4 + y4 + z4 ).
4
Pour trouver le triangle dont l’aire est maximal à périmètre fixé revient à chercher un maximum
de la fonction A sous la contrainte x + y + z = p (où p ∈ R>0 est le périmètre). [Il y a évidemment
d’autres méthodes pour parvenir à la conclusion de cet exercice.] Utiliser les multiplicateurs de
Lagrange pour trouver quelles valeurs de (x, y, z)T (satisfaisant cette contrainte) donnent une aire
maximale. Pour ce faire, il est préférable d’étudier la fonction F(x, y, z) = 4A(x, y, z)2 et il ne faut
pas oublier que seules les valeurs positives de x, y et z sont d’intérêt.
a. Écrire les 4 équations que doit satisfaire les coordonnées du point critique.
b. Montrer que si (c1 , c2 , c3 )T sont les coordonnées d’un point critique, alors l’équation w3 +
b1 w + b0 où b0 = a/8 (ici a est l’unique [coordonnée du] multiplicateur de Lagrange) et
b1 = −(c21 + c22 + c23 )/2 admet pour solutions w = ci (où i = 1, 2, ou 3).
126
Chapitre 6 - R ÉSOLUTION ET ÉTUDE II
c. En conclure que si les trois racines sont distinctes, alors leur somme est nulle. Étant donné
les contraintes, conclure que au moins deux des ci sont égaux.
d. Supposer (sans perdre de généralité) que c1 = c2 . Trouver alors deux points critques (il y a
en fait trois, mais l’un a alors forcément une coordonée négative).
e. Montrer que (si on se restreint aux coordonnées positives) l’ensemble de la contrainte est
compact. En déduire lequel des deux points critiques est le maximum et lequel le minimum.
La première des deux équations implique soit que a = 0 = F(x) (et donc qu’un des xi est nul)
soit que tous les xi sont égaux, disons à x̄. Dans le deuxième cas, la seconde équation permet de
conclure que x̄ = s (et la valeur du multiplicateur a est 1). La valeur de F en ce point critique
(x1 , x2 , . . . , xm )T = (s, s, . . . , s)T est s. Un point du bord de S vu comme sous-ensemble de G−1 (0)
est un point dont une des coordonnées est nulle, ce qui coïncide avec le premier cas ; F s’annule sur
∂S ⊂ G−1 (0). Comme S est fermé et borné (si m = min αi alors S ⊂ Bs/m (0)), il est compact. Ainsi
(s, s, . . . , s)T est un maximum absolu de F (dont la valeur est s), ce qui implique le résultat.
En guise d’amuse-bouche pour le théorème spectral, la MdMdL permet aussi de trouver les axes
d’une ellipse.
E XERCICE 115: Trouver les axes de l’ellipse 3x2 + 2xy + 3y2 + 4z2 = 16 en utilisant la méthode
des multiplicateurs de Lagrange.
127
6.4 - Multiplicateurs de Lagrange
E XERCICE 116: L’objectif de cet exercice est d’utiliser les multiplicateurs de Lagrange pour dé-
montrer le théorème spectral sur les matrices symétriques (toutes les matrices symétriques n × n
possèdent n vecteurs propres linéairement indépendants). Soit F : Rn → R la fonction définie par
F(v) = vT Qv et soit G0 : Rn → R définie par G0 (v) = vT v.
a. Dire (rapidement) pourquoi F et G sont de classe C ∞ .
b. Il faudra trouver les maxima de F pour la contrainte S0 = G−1 n T
0 (0) = {v ∈ R | v v = 1}. Y
a-t-il des points qui ne sont pas réguliers ? Étant donné x ∈ S, déterminer l’espace tangent
Ten
x S.
c. Montrer que les points critiques du lagrangien sont des vecteurs propres de Q de valeur
propre réelle.
d. Dire pourquoi S est compacte et en déduire l’existence d’au moins un maximum et un mini-
mum (...distincts ?).
e. Dire pourquoi il n’y a plus rien à démontrer si les deux valeurs propres sont les mêmes.
f. Montrer que les vecteurs propres de valeurs propres distinctes sont orthogonaux (cet argu-
ment est un argument classique d’algèbre linéaire).
g. Pour les deux vecteurs propres (de valeur propre distincte) trouvés v1 et v2 , ajouter une
contrainte de la forme Gi (v) = vT
i v = 0. Montrer que l’ensemble des contraintes ne possède
que des points réguliers. Quelle la dimension de S[2] = G−1 −1 −1
0 (0) ∩ G1 (0) ∩ G2 (0) ?
h. Pourquoi les point critiques pour cette nouvelle contrainte sont des vecteurs propres ?
i. Expliquer comment itérer l’argument pour obtenir la conclusion.
Le lagrangien prend réellement son sens lorsqu’on tente d’étudier plus finement les points cri-
tiques, c’àd. de regarder la forme quadratique. Les choses sont plus compliquées que dans le cas
sans contrainte, et le plan tangent prend alors de l’importance (c’àd. il sera non seulement utile de
savoir que Tvit = Ten = T par , mais aussi de trouver une base de cet espace).
Soit (x0 , a0 ) un point critique de L (x, a) = F(x) − a · G(x) et supposons que L soit de classe
C2 dans un voisinage de ce point. En considérant le paramètre a0 comme fixé, soit q la forme
quadratique de L (·, a0 ) en x0 . Soit Tx S ⊂ Rm le plan tangent à S = G−1 (0) en x. Alors c’est le
comportement de la restriction de q aux vecteurs de l’espace tangent, qu’il faut étudier :
n
q(v) = vT QF v − ∑ ai vT QGi v pour v ∈ Ten
x0 S
i=1
9. i.e. une base de l’espace vectoriel formé par les vecteurs orthogonaux à tous les ∇G j (x0 ), où j ∈ k.
128
Chapitre 6 - R ÉSOLUTION ET ÉTUDE II
de
m−n m−n m−n
H(c1 , c2 , . . . , cm−n ) = L x + ∑ c j h( j) , a = F x0 + ∑ c j h( j) − a · G x + ∑ c j h( j)
j=1 j=1 j=1
en tant que fonction de c1 , c2 , . . . , cm−n . Il est bon de noter que H(0) = F(x) et ∇H(0) = 0, ainsi, il
ne doit pas y avoir de terme de degré 1 dans le développement de Taylor (et le terme de degré 0 est
la valeur critique). Aussi, lorsque F et G sont des polynômes, H sera aussi un polynôme et sa forme
quadratique est alors directement données par les termes de degrés deux (en les variables ci ).
Pour résumer :
Théorème 6.4.14
Soit U un ouvert de Rm , F : U → R et G : U → Rn deux applications de classe C 2 . Soit S0 =
G−1 (0) et x ∈ S0 un point régulier de la contrainte. De plus, soit a ∈ Rn tel que (x, a) est un
point critique de L . Soit Q la forme quadratique de H comme ci-dessus.
— Si Q est définie positive (resp. négative), x est un minimum (resp. maximum) local de F
contrainte à S0 .
— Si Q est semi-définie positive (resp. négative) et non-triviale, x n’est pas un maximum
(resp. minimum) local de F contrainte à S0 .
— Si Q est non-semi définie, x est un point d’inflexion F contrainte à S0 .
129
6.4 - Multiplicateurs de Lagrange
Exemple 6.4.15. Pour trouver le point de l’ensemble (fermé mais non compact) z2 + yx2 = 1 le
plus proche de l’origine, il suffit de minimiser la fonction de distance à l’origine au carré F(x, y, z) =
x2 + y2 + z2 sous la contrainte G(x, y, z) = z2 +
yx
2 − 1.
2xy
Il faut d’abord vérifier que ∇G(x, y, z) = x2 ne s’annule pas sur G−1 (0) (et en effet, il fau-
2z
drait que x = z = 0, mais alors G(0, y, 0) = −1, c’àd. ces points ne sont pas dans S). Le lagrangien
est L (x, y, z, a) = x2 + y2 + z2 − a(z2 + yx2 − 1), et les points critiques sont les solutions de
∂L
∂x = 2x + 2axy = 0⇔2x(1 + ay)= 0 éq.1
∂L
∂y = 2y + ax2 = 0⇔ éq.2
∂L
∂z = 2z + 2az = 0⇔ 2z(1 + a)= 0 éq.3
∂L 2 2
∂a =z + yx − 1 = 0⇔ z2 + yx2 = 1 éq.4
Si maintenant ay = −1, l’éq.3 donne deux possibilités supplémentaires : soit z = 0 soit a = −1.
√
Si a = −1 alors y = 1, et l’éq.2 implique que x = ± 2, mais alors l’éq.4 devient z2 + 2 = 1 ce qui
n’a pas de solution. Il faut donc que z = 0.
Le cas actuel est ay = −1 (obtenu de l’éq.1) et z = 0 (obtenu de l’éq.3). L’éq.2 donne que
a2 x 2
= 2, puis l’éq.4 que −2 = a3 . D’où a = −21/3 est le multiplicateur pour les points critiques
(±21/6 , −2−1/3 , 0)T .
Comme la contrainte n’est pas compacte, regarder les valeurs critiques ne peut pas suffire pour
conclure. Commençons par les points (0, 0, ±1)T avec a = −1. Il faut trouver la forme quadratique
de L (h, k, ±1 + `, −1) contrainte aux vecteurs (h, k, `)T orthogonaux à ∇G(0, 0, 1) = (0, 0, ±2)T . Il
va sans dire que ces vecteurs sont les vecteurs de la forme (h, k, 0)T . Autrement dit, il faut regarder
la forme quadratique de L (h, k, ±1 + 0, −1) = h2 + k2 + 1 − (1 + kh2 − 1). Comme ceci est déjà un
polynôme, la forme quadratique (restreinte au plan tangent) est formée des termes de degré 2, soit
h2 + k2 ce qui est défini positif. Ainsi (0, 0, ±1)T est un minimum local.
Maintenant, pour les points critiques (±21/6 , −2−1/3 , 0)T avec a = −21/3 , le plan tangent est
√
donné par l’orthogonalité à ∇G(±21/6 , −2−1/3 , 0) = (∓25/6 , 21/3 , 0)T = 21/3 (∓ 2, 1, 0)T . Autre-
√
ment dit, ce sont des vecteurs de la forme (h, ± 2h, `)T . Il ne reste qu’à trouver la forme quadra-
√
tique de L (±21/6 + h, −2−1/3 ± 2h, `, −21/3 ) =
√ √
(±21/6 + h)2 + (−2−1/3 ± 2h)2 + `2 − 21/3 `2 + (−2−1/3 ± 2h)(±21/6 + h)2
En ne gardant que les termes d’ordre 2, cette forme quadratique est : −(21/3 − 1)`2 qui est semi-
définie négative. Par conséquent, ces points ne sont pas des minima locaux (ce qui suffit pour ré-
pondre à la question initiale).
130
Chapitre 6 - R ÉSOLUTION ET ÉTUDE II
Pour ceux qui veulent en avoir le cœur net à propos du type de point critique, il faut regarder les
termes d’ordres supérieurs dans le développement de L en restreignant aux vecteurs pour lesquels la
√
forme quadratique s’annule (ici, ceux où ` = 0, i.e. de la forme (h, ± 2h, 0)T ). Dans l’équation ci-
dessus, il n’y a qu’un seul terme de degré supérieur à deux, c’est ∓25/6 h3 . Celui-ci peut-être positif
ou négatif selon la valeur de h, et par conséquent les points (±21/6 , −2−1/3 , 0)T sont en réalité des
points d’inflexions.
♣
x1
E XERCICE 118: Le cône double est la surface (dans R3 ) S = {x = x2
x3
∈ S | x12 + x22 = x32 }. L’ob-
jectif est de trouver les extrema de la fonction F(x1 , x2 , x3 ) = x13 + x22 + x32 (définie sur R3 ) restreinte
à S.
e. Expliquer ce qui, dans la démonstration, pourrait faire défaut dans la méthode des multi-
plicateurs de Lagrange aux points singuliers (i.e. les points où les hypothèses ne sont pas
satisfaites). Comment procéderiez-vous pour déterminer si il correspond à un maximum ou
un minimum ?
131
6.4 - Multiplicateurs de Lagrange
E XERCICE 120: Soient données la fonction F(x, y, z) = x2 −y2 +z (définie sur R3 ) et les contraintes
x2 + y2 = z2 et y + z = 1 (représentées ci-dessus à droite dans R3 ). Quels sont les points non-
réguliers de la contrainte et les points critiques de cette fonction restreinte à la contrainte ?
132
Chapitre 6 - R ÉSOLUTION ET ÉTUDE II
Les théorèmes 6.3.4 et 6.3.5 montrent que la formulation en ensemble de niveau est aussi bonne
que celles des paramétrages. Ainsi, il est bon de se demander pourquoi dans l’étude des fonc-
tions, la perspective des ensembles de niveau est toujours prise. La raison tient plus à l’origine
du problème qu’à une obstruction mathématique. La question de l’étude des fonctions est inspirée
d’un problème : trouver le point où la fonction F (qui représente par exemple le volume d’un ob-
jet) est maximale, mais sous la contrainte (la surface de l’objet ? certains angles ou formes ?). Ces
contraintes apparaissent dans la plupart des cas comme des équations ou inéquations.
D’une certaine manière, si la contrainte admet un paramétrage global, le problème est de toute
façon déjà bien résolu. On peut néanmoins formuler une observation :
Proposition 6.4.16
Si S est une variété qui admet un paramétrage global 10 G : U → S (où U ⊂ R` est un ouvert),
alors les extrema de F : S → R sont les images par G des extrema de F ◦ G.
Il est évidemment possible de prendre un recouvrement par des ouverts de S, puis de regarder des
paramétrages locaux sur chaque ouvert (cela ne fait que rendre l’énonciation du résultat moins
claire).
Lorsqu’un tel paramétrage existe, il y a tout les avantages à l’utiliser. La caractérisation des
points critiques par les formes quadratiques est généralement plus simple que de passer par la forme
quadratique du lagrangien. Cependant, trouver le paramétrage est dans la plupart des cas beaucoup
plus difficile que d’appliquer la MdMdL.
6.A Dimension
Lorsqu’il s’agit d’espaces vectoriels, la dimension est un concept relativement facile à établir :
il s’agit du plus petit nombre d’éléments nécessaires pour former une base dudit espace. Mais en
parlant d’un sous-ensemble quelconque de Rn est-ce vraiment clair ? Avec encore plus d’ambition,
que dire d’un sous-ensemble d’un espace topologique ?
Une première et optimiste tentative pourrait être de dire qu’une bijection devrait préserver le
“nombre” d’éléments et ainsi la dimension. Malheureusement, il existe une bijection entre [0, 1]
et [0, 1]2 = [0, 1] × [0, 1] (même avec l’axiome du choix, entre [0, 1] et [0, 1]∞ ). Cette bijection est
relativement simple, la description grossière est la suivante : pour x ∈ [0, 1], il y a une écriture
binaire x = 0, b1 b2 b3 · · · = ∑i∈Z≥0 2−i bi où bi ∈ {0, 1}. (Pour faire les choses proprement il faut
s’entendre sur quelle expression choisir : pour les fractions de la forme 2nm l’expression n’est pas
unique, il y en a une qui se termine qu’avec des 0 et l’autre qu’avec des 1.) La fonction est alors
f (x) = (x pair , ximpair ) où x pair = ∑i∈Z≥0 2−i x2i et ximpair = ∑i∈Z≥0 2−i x2i+1 .
Une deuxième tentative serait de dire que (quand même !) si la fonction est continue, une telle
aberration ne pourrait pas arriver. Notre bien-aimé feu Peano a montré que ça ne suffit pas. Il existe
une courbe, i.e. une application f : [0, 1] → [0, 1]2 , qui est continue et surjective.... elle s’appelle
d’ailleurs la courbe de Peano.
133
6.B - La conjecture du Jacobien
La troisième tentative (qui est la bonne) est en fait de se dire qu’une application qui préserve
la dimension doit être bijective, continue et d’inverse continue. Et enfin, personne n’est arrivé avec
un contre-exemple, mais ça n’a pas aidé pour trouver une définition de la dimension. Par exemple
est-ce que R r Q est de dimension 1 ou 0 ? Il y a en fait une faune de définitions pour la dimension
dont certaines coïncident selon les propriétés de l’espace topologique considéré. Soit X un ensemble
et T une topologie sur X (c’àd. une famille d’ouverts satisfaisant les propriétés d’une topologie).
La dimension par recouvrement est une idée de Lebesgue. Un recouvrement R de X est une
sous-famille de T telle que ∪U∈T U = X. Un recouvrement R est dit plus fin qu’un autre recou-
vrement R 0 si ∀U ∈ R , ∃U 0 ∈ R 0 tel que U ⊂ U 0 ; la notation est alors R < R 0 . Le degré d’un
recouvrement en x est donné par degx R = |{U ∈ R | x ∈ U}|, c’àd. le nombre d’ouverts qui s’in-
tersectent en x. Le degré du recouvrement R tout court est deg R = sup degx R . Lebesgue fait la
x∈X
remarque suivante dans Rn , pour tout recouvrement R 0 , il est possible de trouver un recouvrement
plus fin R tel que deg R = n + 1. D’où l’idée dim X = sup
0
inf deg R − 1, le supremum étant pris
R <R 0
R ⊂T
sur tous les recouvrements possibles. Ce n’est par contre pas nécessairement très intuitif.
Poincaré tente (à peu de choses près) la définition suivante... qui marche relativement bien pour
les sous-ensembles de Rm connexes par arc. La dimension d’un ensemble est un élément de Z≥0 .
Une union dénombrable de points est de dimension 0. Un ensemble A connexe par arc est de di-
mension ≤ n + 1 s’il existe un ensemble B de dimension ≤ n tel que A r B n’est plus connexe par
arc. Ça marche assez bien, mais pour les ensembles non-connexes par arc, ça devient rapidement
difficile à étendre.
La dimension inductive faible (dont l’auteur ignore l’idée de qui il s’agit) est de dire que la
dimension est un élément de Z≥−1 . L’ensemble vide a dimension −1. Un ensemble est A de dimen-
sion ≤ n + 1 s’il existe un ensemble B tel que ∂A B est de dimension ≤ n. Et enfin, il est possible de
parler de dimension pour des sous-ensembles tordus d’espaces topologiques les plus abscons.
Un livre chaudement recommandé sur le sujet est celui de Hurewicz et Wallman, “Dimension
theory”, cote F10 dans la bibliothèque de l’institut de math de l’Unine. Entre autres, il y est détaillé
quand F : Rm → Rn est continue, dans quelle mesure et dans quel sens il est possible de s’attendre
à ce que F−1 (x) soit de dimension m − n.
134
Chapitre 6 - R ÉSOLUTION ET ÉTUDE II
Cette affirmation n’est pas contredite même en ajoutant que la conclusion que G est aussi poly-
nomiale. Deux résultats notoires sont
— cette conjecture est vraie si les polynômes sont de degrés 2 [Wang 1980] ;
— il est suffisant de démontrer l’affirmation pour les polynômes de degré 3 pour que la conjec-
ture soit vraie [Bass, Connell & Wright 1982].
Il va sans dire que ce problème est beaucoup plus compliqué qu’il n’en a l’air.
135
6.B - La conjecture du Jacobien
136
Chapitre 7
Intégrales multiples
7.1 Pavés
Le mot pavé est, curieusement, apparu comme la bonne dénomination pour ce domaine quelque
peu grossier, mais porteur, sur lequel bâtir l’intégration en plusieurs variables quelque temps après
le mois de mai 1968.
Définition 7.1.1. Un rectangle R dans Rm est un produit cartésien de m intervalles bornés, fermés
et non-vides de R, i.e. c’est un sous-ensemble qui s’écrit R = ∏ [ai , bi ], où ai , bi ∈ R et bi − ai ≥ 0.
i∈m
Le volume d’un rectangle R est vol(R) = ∏ (bi − ai ) ∈ R≥0 . Le volume de l’ensemble vide est
i∈m
(par convention) 0.
La largeur d’un rectangle R est δ(R) = max
i∈m
(bi − ai ) ∈ R≥0 .
Un pavé P dans Rm est un rectangle de volume strictement positif. Une feuille P0 dans Rm est
un rectangle de volume nul. F
137
7.1 - Pavés
E XERCICE 123: Montrer que l’intersection de deux rectangles est un rectangle ou l’ensemble vide.
Montrer ensuite que vol(R1 ∪ R2 ) = vol(R1 ) + vol(R2 ) − vol(R1 ∩ R2 ) (si le courage fait défaut, se
restreindre à R2 pour avoir des calculs plus simples).
Il existe des définitions où un pavé peut être de volume nul (en particulier, même un singleton).
Étant donné que les pavés sont fermés et bornés (pour x ∈ P, P ⊂ B√nδ(P) (x)), ils sont compacts.
Définition 7.1.3. Un découpage d’un pavé P est une famille {Pi }i∈k (où k ∈ Z>0 ) de pavés tels
que
Dé1. i, j ∈ k et i 6= j ⇒ vol(Pi ∩ Pj ) = 0
Dé2. P = ∪ Pi
i∈k
La largeur d’un découpage D = {Pi }i∈k est δ(D ) = max δ(Pi ). F
i∈k
3. pour intégrer une fonction F qui n’est pas aussi simple, des découpages D de plus en plus
petits d’un pavé sont considérés de sorte que δ(D ) est de plus en petit. Sur chaque pavé Pi ,
la fonction F est remplacée par une fonction constante prenant pour valeur Ci = F(x(i) ) pour
un x(i) ∈ Pi . L’intégrale de la fonction est une sorte de limite des approximations ∑ Ci vol(Pi ),
à la condition (restricitive !) que cette limite existe.
Pour cette dernière étape, à un découpage D = {Pi }i∈k d’un pavé P et une fonction F : P → R bornée
(i.e. ∃K ∈ R>0 telle que F(P) ⊂ BK (0)) sont associés deux nombres, deux cas “extrêmes” :
inf F(x)
S1 (F, D ) = ∑vol(Pi )x∈P et S2 (F, D ) = ∑vol(Pi )sup F(x),
i x∈Pi
i∈k i∈k
les infima et suprema étant des réels (finis) car la fonction est bornée. En particulier S1 (D , F), S2 (D , F) ∈
[−Kvol(P), Kvol(P)]. De plus, une fonction continue sur un compact possède toujours un maximum
et un minimum absolu, voir théorème 2.4.9, ainsi les suprema et infima sont alors (c’àd. lorsque la
fonction est continue) réalisés par un point du pavé.
Définition 7.1.4. Soit P un pavé, soit F une fonction bornée sur P. F est dite intégrable sur P si
lim inf S (F, D ) lim sup S2 (F, D ).
= ε→0
ε→0 δ(D )<ε 1 δ(D )<ε
Lorsque les limites ci-dessus existent et sont égales, le réel obtenu est appelé l’intégrale (de Rie-
R
mann) de F sur P et est noté P F(x)dvol. d’autres notations habituelles sont de remplacer dvol par
R R
dλ(x) ou dx1 dx2 · · · dxm ou encore de l’enlever tout simplement : P F = P F(x)dvol. F
Le théorème suivant donne un critère, parfois commode, de l’intégrabilité, d’une fonction sur
un pavé.
138
Chapitre 7 - I NTÉGRALES MULTIPLES
Théorème 7.1.5
Soit F une fonction bornée sur un pavé P. Soit I ∈ R. Si ∀ε > 0, ∃δ > 0 tel que ∀D = {Pi }i∈k
découpage de P en pavés et ∀xi ∈ Pi ,
I − ∑ f (xi )vol(Pi ) < ε,
i∈k
Voici quelques propriétés de l’intégrale de Riemann. Il est essentiellement suffisant de voir que ces
propriétés sont vraies pour des fonctions qui sont constantes sur des pavés pour voir qu’elles sont
vraies en général.
Proposition 7.1.6
Soit P un pavé, F, G : P → R deux fonctions bornées intégrables au sens de Riemann, a, b ∈ R.
R R R R
IR1. L’application F 7→ P F est linéaire, i.e. P (aF +bG) = a P F +b P G. Le sous-ensemble
des fonctions bornées qui sont intégrables est donc un espace vectoriel.
inf F(x) ≤ F ≤ vol(P)sup F(x). En particulier, si F ne prend que des valeurs
R
IR2. vol(P)x∈P P x∈P
≥ 0, l’intégrale est ≥ 0.
R R
IR3. Si ∀x ∈ P, F(x) ≤ G(x) alors P F(x) ≤ P G(x).
R R
IR4. P |F| ≥ P F .
Il reste difficile de voir si une fonction est intégrable au sens de Riemann. Une première étape pour
une meilleure compréhension est le concept d’un ensemble négligeable, c’àd. un ensemble où les
valeurs de la fonction ne sont pas importantes.
Définition 7.1.7. Un ensemble N est dit négligeable si pour tout ε ∈ R>0 , ∃k ∈ Z>0 et des pavés
{Pi }i∈k tels que N ⊂ ∪i∈Z≥0 Pi et la somme ∑i∈Z≥0 vol(Pi ) < ε.
Une fonction bornée F : P → R est dite admissible s’il existe un ensemble négligeable N telle
que F est continue sur P r N. F
Exemple 7.1.8.
— Un point est un ensemble négligeable.
— Une feuille est un ensemble négligeable.
— Une union (ou une intersection) finie d’ensembles négligeables est négligeable.
— Le bord d’un pavé est un ensemble négligeable.
— Le sous-ensemble des fonctions bornées qui sont admissibles est un espace vectoriel, i.e.
si F, G : P → R sont admissibles et a, b ∈ R alors aG + bF est admissible.
— Si F, G : P → R sont admissibles alors max(F, G), min(F, G) et |F| sont admissibles.
♣
Corollaire 7.1.9
Une fonction F admissible sur un pavé P est intégrable. De plus, si F et G sont deux fonctions
R R
admissibles qui diffèrent seulement sur un ensemble négligeable alors P F = P G.
139
7.1 - Pavés
Il est facile de montrer une version moins forte (où la fonction est supposée continue sur tout P) de
ce théorème en utilisant le concept de continuité uniforme (voir le lemme 7.3.8).
Comme les pavés sont des compacts, la continuité uniforme s’utilise en conjonction avec le théo-
rème 7.1.5 pour montrer que toute fonction continue est intégrable.
Finalement, il est possible de montrer que la fonction f : [0, 1] → R définie par
(
1 q
p si x = p ∈ Q où pgcd(q, p) = 1,
f (x) =
0 si x ∈ R r Q
Dans l’intégrale de Riemann, il faut découper le pavé en morceaux, puis regarder la hauteur sur
chaque petit pavé, ci-dessous ceci est fait pour 25 et 100 morceaux égaux (des carrés).
140
Chapitre 7 - I NTÉGRALES MULTIPLES
Dans l’intégrale de Lebesgue, la procédure est différente. Le découpage est fait sur les valeurs
que prennent la fonction (ici F([0, 1]2 ) = [−2, 1]) ; disons que (Ii )i∈n est un découpage de [−2, 1]
en n morceaux (les Ii seront ici des intervalles de longueur 3/n). Tout d’abord, le domaine [0, 1]2
est découpé en regardant la préimage des Ii par F : F −1 (Ii ). Ci-dessous ceci est fait pour 6 et 12
morceaux.
Ensuite, à chacun de ces morceaux F −1 (Ii ) est associé le point milieu de Ii pour donner une
approximation du volume.
141
7.2 - Domaines plus généraux
Le problème est qu’il est difficile de donner un poids aux F −1 (Ii ) sans déjà savoir comment
parler de volume (c’est le principe de conservation des emmerdements). Cependant, ceci donne une
version de l’intégrale incroyablement plus générale et plus élégante (cf. le cours de mesure).
E XERCICE 124: Montrer que la fonction F : [0, 1]2 → R définie par
(
1 si xy ∈ Q × Q,
F(x, y) =
0 sinon,
n’est pas intégrable au sens de Riemann sur P = [0, 1]2 . [Indice : Montrer d’abord que Q × Q est
dense dans R2 , i.e. que tout pavé contient un point dans Q × Q. Les fonctions S1 (F, D ) et S2 (F, D )
s’évaluent alors pour n’importe quel découpage D .]
142
Chapitre 7 - I NTÉGRALES MULTIPLES
Définition 7.2.1. Un ensemble A est dit admissible s’il est borné et ∂A est négligeable. F
Exemple 7.2.2.
— Un pavé est admissible.
— Une intersection finie d’ensembles admissibles est admissible.
— Si A et B sont deux ensembles admissibles A ⊂ B, alors B r A est admissible.
— Si A ⊂ Rm et B ⊂ Rn sont admissibles alors A × B est admissible.
♣
Toute boule peut être contenue dans un pavé, plus précisément, ∀x ∈ Rm , ∀r ∈ R>0 alors Br (x) ⊂
∏i∈m [xi − r, xi + r]. Ainsi, pour intégrer F sur A, il suffit de choisir un pavé P tel que A ⊂ P (ce pavé
R
existe comme A est borné) et de regarder P FA⊂P . Il est aisé de montrer que ceci ne dépend pas du
choix de pavé. Lorsque la fonction FA⊂P est intégrable sur P, alors F sera dite intégrable sur A et la
R R
notation utilisée sera A F = P FA⊂P .
Il est aussi maintenant possible d’étendre la notion de volume à n’importe quel ensemble. Soit
1A : Rm → R la fonction (appelée fonction caractéristique de l’ensemble A) définie par 1A (x) = 1
pour tout x ∈ A et 1A (x) = 0 si x ∈
/ A. Alors le volume de A est , pour n’importe quel pavé P ⊃ A,
Z Z
vol(A) = 1A = 1.
P A
Pourvu que F est intégrable sur A, toutes les propriétés de la proposition 7.1.6 valent encore pour P
remplacé par A. De plus,
Proposition 7.2.3
Soit A et B deux ensembles admissibles, F une fonction bornée intégrable sur A et sur B, alors
R R R R
1. F est intégrable sur A ∪ B et A∪B F = AF + BF − A∩B F.
R
2. Si A est négligeable alors AF = 0.
De la même façon que plus tôt, une fonction F sera admissible sur un ensemble admissible A s’il
existe un ensemble négligeable N tel que F est continue sur A r N.
Corollaire 7.2.4
Une fonction bornée admissible sur un ensemble admissible A est intégrable sur A.
7.3 Évaluation
Les deux sections précédentes ont présenté les quelques définitions et théorèmes de bases pour
pouvoir parler d’intégration sur Rm . Cependant, les limites sont difficiles à évaluer. Le but de cette
section est de présenter les techniques qui permettent de se ramener à un cadre plus familier.
143
7.3 - Évaluation
Exemple 7.3.2. Soit P = [1, 2] et Q = [−1, 2]. F(x, y) = x3 ey est continue sur P × Q, en particulier
admissible. De plus, ∀x ∈ [1, 2] (en fait dans R), la fonction y 7→ x3 ey est admissible sur Q. Ainsi
R R R23 y
P×Q F(x, y)dvol(x, y)= P −1 x e dy dx
3 y 2
R
= P x [e ]−1 dx
(e2 − e−1 ) 12 x3 dx
R
=
= (e2 − e−1 )( 83 − 31 ) ♦
Corollaire 7.3.3
Soit P = ∏i∈m [ai , bi ] et F une fonction continue sur P alors
Z Z b1 Z b2 Z bm
F(x)dvol(x) = ··· F(x1 , x2 , . . . , xm )dxm · · · dx2 dx1
P a1 a2 am
Cette deuxième forme s’appelle souvent intégrale itérée ou intégrale double (si m = 2) ou intégrale
triple (si m = 3). Voici un petit résultat sur une forme générique d’ensembles négligeables.
Lemme 7.3.4
Soit P ⊂ Rm un pavé et soit F : P → R une fonction continue, alors le graphe de F est un
ensemble négligeable.
A = {( xy ) ∈ R2 | a ≤ x ≤ b et f1 (x) ≤ y ≤ f2 (x)}.
Alors A est un ensemble admissible et, si F est conforme aux hypothèses du théorème 7.3.1 de
R R b R f2 (x)
Fubini, A F(x, y)dvol(x, y) = a f1 (x) F(x, y)dy dx
√
Exemple 7.3.6. Soit P = [−1, 1], f1 (x) = 0, f2 (x) = 1 − x2 et A définie comme ci-dessus. Soit
144
Chapitre 7 - I NTÉGRALES MULTIPLES
Comme d’habitude en plusieurs variables, ce même exemple peut se traiter d’une autre manière : soit
Q = [0, 1], g1 (y) = − 1 − y2 , g2 (y) = 1 − y2 et A = { xy ∈ R2 | y ∈ [0, 1] et g1 (y) ≤ x ≤ g2 (y)}.
p p
Alors √
R 1 R 1−y2
√ 2 ydx dy
R
A F(x, y)dvolx, y= 0 2x
− √ 1−y2
R1 2 3 1−x2
= 0 3 y[x ]− 1−x2 dx
√
R1 4 2 3/2 dy
= 0 3 y(1 − y )
4 2 5 1
= 15 [−(1 − y ) /2]0
4
= 15 .
Dans ce cas-ci, les deux intégrales sont simples à évaluer, mais il arrive quelquefois qu’une des
intégrales soit beaucoup plus difficile que l’autre (voire impossible). ♣
145
7.3 - Évaluation
E XERCICE 126: Soit R ∈ R>0 , soit [a, b] ⊂ R un intervalle x non-vide. Utiliser les intégrales mupl-
tiples pour évaluer le volume de la strate sphérique D := { yz ∈ R3 | x2 +y2 +z2 ≤ R2 et a ≤ x ≤ b}.
3
E XERCICE 127: Évaluer l’intégrale triple 01 z1 0x ex dydxdz en inversant l’ordre d’évaluation (faire
R R R
1
a. Pour x, y ∈ [0, 1], développer la fonction 1−xy en utilisant la série géométrique.
n
R
b. Évaluer S (xy) dvol(x, y) où n ∈ Z≥0 , a ∈ [0, 1] et S = [0, 1] × [0, a].
1 k+1
dvol(x, y) = a + ∑k∈Z≥1 ak2 . [Il existe des critères pour montrer que
R
c. En intuiter que S 1−xy
l’intégrale des sommes partielles converge bien vers l’intégrale de la série.]
R 1 Ra 1
d. Montrer d’autre part que S 1−xy dvol(x, y) = 0 t ln(1 − t)dt.
Z Z Z
πi F = πi v = vi = πi F = Fi .
A A A
Lemme 7.3.8
Soit P un pavé et F : P → Rn une application continue sur P alors
Z
Z
F
≤ kFk.
P P
D ÉMONSTRATION : Tout d’abord, profitons de cet intermède pour montrer qu’une fonction G
continue sur P est intégrable. Comme P est compact, G est uniformément continue sur P, d’où
∀ε ∈ R>0 ∃δG tel que kx − yk < δ ⇒ kG(x) − G(y)k < vol(P) ε
. Soit D un découpage de P tel que
√ inf G(x) < ε .
δ(D ) < nδ. Alors, pour tout x, y ∈ Q ∈ D , kx−yk < δ. En particulier, sup G(x)− x∈Q vol(P)
x∈Q
D’où
√
∀D tel que δ(D ) < nδ , S1 (G, D ) − S2 (G, D ) < ε.
Ainsi, les fonctions Fi et kFk sont intégrables (rappelons que kF(x)k2 = ∑i∈n |Fi (x)|2 sera continue
si les Fi le sont).
√
Soit D un découpage tel que δ(D ) < n min(δkFk , δF1 , . . . , δFn ). Alors ∀i ∈ n, ∀ j ∈ 2, | P Fi −
R
146
Chapitre 7 - I NTÉGRALES MULTIPLES
où les passages des lignes sont justifiés par : (1ère → 2ème) inégalité du triangle (propriété No3 de
la section 1.3) ; (2ème → 3ème) comme le sup n’est pas forcément réalisé au même point il y a une
erreur possible du plus grand écart de chaque fonction coordonnée entre deux points de Q ; (3ème →
√
ε
4ème) ce plus grand écart est majoré, en chaque coordonnée, par vol(P) comme δ(D ) < nδFj .
T R
√
Comme
S2 (F1 , D ), . . . , S2 (Fn , D ) − F
< nε et |S2 (kFk, D ) − kFk| < ε,
R
P P
Z
Z
√
k F
< kFk + (1 + 2 n)ε.
P P
Cependant, cette inégalité étant vraie pour tout ε > 0 (et que n est fixé), ceci termine la démonstra-
tion.
147
7.4 - Changement de variable
∏i∈m [ai , bi ] un pavé de Rm . Si T P est l’image de P par T , alors vol(T P) = | Det T |vol(P).
D ÉMONSTRATION : La preuve sera faite par réductions successives. Tout d’abord le volume étant
invariant par translation, il est possible de supposer que P = ∏i∈k [0, bi ].
Soit D la matrice diagonale dont le coefficient kk vaut bk ∈ R et tous les autres coefficients
(non-diagonaux) valent 0. Alors, si Q = ∏i∈k [0, 1], QD = P et Det D = vol(P). Ainsi, si vol(T 0 Q) =
| Det T 0 | est supposée démontrée, la démonstration se termine en posant T 0 = T D, car le déterminant
d’un produit de matrices est le produit des déterminants. Il suffit donc de montrer que la formule
marche pour P = ∏i∈m [0, 1].
Mais dans ce cas, PT est le parallélépipède engendré par les vecteurs donnés par les lignes de
T , ce qui est précisément l’interprétation géométrique de | Det T |.
Comme la dérivée est l’approximation d’une application par une application linéaire, la formule du
changement de variable (qui ne sera pas démontrée) est néanmoins intuitive :
Théorème 7.4.2 (Changement de variable)
Soit A un sous-ensemble admissible de Rm et soit T : Rm → Rm une application qui est un
difféomorphisme de classe C 1 sur l’intérieur de A, Å. Soit F une fonction admissible sur T(A),
alors F ◦ T est admissible sur A et
Z Z
F(y)dvol(y) = | Det T∗ (x)|F T(x) dvol(x).
T(A) A
Parmi les ingrédients de la démonstration, il faut montrer que si A est admissible et T un difféomor-
phisme C 1 alors T(A) est admissible.
L’exemple suivant montre comment passer en coordonnées dites radiales, et montre comment
R ∞ −x2
l’utiliser pour évaluer l’intégrale −∞ e dx qu’il n’est pas possible d’évaluer avec les techniques
d’une seule dimension.
r cos θ
Exemple 7.4.3. Soit T : R≥0 × [− π2 , 3π 2
2 [→ R l’application donnée par T(r, θ) = r sin θ . Cette
application est un difféomorphisme de classe C 1 sur l’intérieur ; en effet, l’application inverse est
T−1 : R2 r {x = 0 et y ≤ 0} → R>0 ×] − π2 , 3π
2 [ définie par
p y
2 2
(px + y , arctg x )
si x > 0,
−1 2 2 y
T (x, y) = ( x + y , π + arctg x ) si x < 0,
(y, π2 ) si x = 0 (et y > 0).
Qui plus est, | Det T∗ (r, θ)| = r. Ainsi, si A est un sous-ensemble admissible de R≥0 × [− π2 , 3π
2 [ et F
une fonction admissible sur T(A),
Z Z
F(x, y)dxdy = F(r cos θ, r sin θ)rdrdθ.
T(A) A
148
Chapitre 7 - I NTÉGRALES MULTIPLES
2
Une remarque intelligente (attribuée à Poisson 1 ) est que pour évaluer R e−x dx, il est plus commode
R
R 2
2 R 2
R R
d’évaluer R e−x dx = R e−x dx e −y2 dy = −x2 −y2 dxdy (ces manipulations sont pos-
R R2 e
sibles car les intégrales en question convergent absolument). Pour évaluer cette dernière intégrale,
il suffit de faire le changement de variable ci-dessus :
−x2 −y2 dxdy= 2
e−r rdrdθ
R R
R2 e R≥0 ×[− π2 , 3π
2 []]
R ∞ R 3π/2 −r2
= 0 −π/2 e dθ dr
R ∞ −r2
= 2π 0 re dr
2
= π[−e−r ]∞ 0.
R −x2 dx
√
D’où Re = π. ♣
Exemple 7.4.4. Pour trouver l’aire du domaine borné A délimité par les paraboles y = x2 , y =
2x2 , x = y2 et x = 3y2 , il est aussi plus simple de procéder à un changement de variable. Soit T
2
l’application définie par T(x, y) = y/x
x/y2
, alors
−2y 1
3
x3 x 2
Det T∗ (x, y) = 1 = 2 2.
y2 −2x
y3
x y
En particulier, comme le déterminant ne s’annule pas si xy 6= 0, l’application T est, par le théorème
d’inversion locale 6.2.2 un difféomorphisme C 1 au voisinage de tout point de (R>0 )2 . Autrement
dit, pour vérifier que c’est un difféomorphisme C 1 sur (R>0 )2 , il ne faut que s’assurer que la fonction
est bijective.
Pour se faire, le plus simple est d’inverser T. En posant uv = T(x, y), les valeurs de x et y se
x 2 y2 1
Det T−1
∗ (u, v) = = 2 2.
3 3u v
De plus, T(A) = [1, 2] × [1, 3], ainsi
Z 2Z 3
1
Z Z Z
vol(A) = 1dvol(x, y) = 1dvol(x, y) = | Det T−1
∗ (u, v)|dvol(u, v) = dvdu.
A T −1
T(A) T(A) 1 1 3u2 v2
149
7.4 - Changement de variable
x
∈ R2 | x > 0, y > 0, 12 ≤ x + y ≤ 1}.
E XERCICE 129: Soit S = { y
!
1
a. Montrer que T(u, v) = 2 (u + v) est une application bijective de R2 dans R2 .
1
2 (u − v)
E XERCICE 131: Les coordonnées sphériques sont données par l’application T : R>0 ×[0, 2π[×[0, π[→
r cos θ sin φ
R3 définie par T(r, θ, φ) = r sin θ sin φ .
r cos φ
1. Déterminer les formules de changement de variables pour cette application (vous pouvez
supposer que cette application est bijective).
x
2. Utiliser les intégrales mupltiples pour évaluer le volume de la strate sphérique D := { yz ∈
R3 | x2 + y2 + z2 ≤ R2 et a ≤ z ≤ b}.
E XERCICE 132: Évaluer le volume des régions suivantes (a, b, c ∈ R sont des constantes).
x
a. { y
z
∈ R3 | a ≤ z ≤ b et x2 + y2 + z2 ≤ 1}.
x
b. { yz ∈ R3 | sin z ≤ x2 + y2 ≤ cos z}. [Indice : utiliser les coordonnées cylindriques, un
changement de variable (polaire) sur x et y mais sans changer z.]
x
c. { yz ∈ R3 | x2 + y2 < 4 − z2 et x2 + y2 < 41 + z2 }. [Indice : idem.]
x 2 2 2
d. { yz ∈ R3 | −1 ≤ z/c ≤ 1 et ax2 + by2 − cz2 ≤ 1} (où a, b, c 6= 0). [Indice : utiliser une variante
des coordonnées cylindriques.]
150
Chapitre 7 - I NTÉGRALES MULTIPLES
2 − y2 )−1/2 dvol(x, y) x
∈ R2 |
R
E XERCICE 133: L’objectif est d’évaluer D (x où D est le domaine { y
4 > x2 − y2 > 1, x > 0 et − 21 < xy < 12 }.
r cht
a. Soit la transformation T : R>0 × R → { xy | x > |y|} définie par T(r,t) =
r sht . Montrer
que le déterminant de sa matrice de Jacobi n’est jamais nul.
b. Vous pouvez utiliser sans démontrer que T est bijecitve. Pourquoi est-ce un difféomorphisme
C1 ?
2 − y2 )−1/2 dvol(x, y).
R
c. Utiliser le changement de variable pour évaluer D (x
Exemple 7.A.2. Soit P = [−1, 1] ⊂ R un pavé de R. {0} ⊂ [−1, 1] est un ensemble négligeable.
Pourtant, la fonction continue sur [−1, 1] r {0} définie par f (0) = 0 et, si x 6= 0, f (x) = 1/|x| n’est
pas intégrable sur [−1, 1]. ♣
151
7.B - Théorème de la valeur moyenne
Définition 7.A.3. Soit F une fonction continue sur un ensemble admissible A. Si pour toute suite
lim
R
croissante d’ensembles admissibles Ak ⊂ A tels que F est bornée sur Ak , k→∞ Ak F existe, alors cette
limite définit l’intégrale (impropre) de F sur A. F
R R 1 R x2 dy
A F(x, y)= 0 0 (x+y)2 dx
R 1 h −1 ix2
= 0 x+y dx
R 1 −1 0 1
= 0 x+x2 + x dx
R1 1
= 0 x+1 dx
= [ln(1 + x)]10
= ln 2.
De fait, la vérification se fait essentiellement au fur et à mesure du calcul que l’intégrale impropre
existe. ♣
Il s’agit d’un analogue du théorème en une dimension, à ceci près qu’il faut être plus prudent
sur les domaines considérés.
Définition 7.B.1. Soit A ⊂ R2 un sous-ensemble. A est dit connexe par arc si ∀x, x0 ∈ A, ∃γ :
[0, 1] → A une courbe paramétrée continue telle que γ(0) = x et γ(1) = x0 . F
Corollaire 7.B.2
Soit F : A → R une fonction continue sur un ensemble admissible et fermé A, alors il existe un
R
point x(0) ∈ A tel que F(x(0) )vol(A) = A F(x)dvol(x).
152
Chapitre 7 - I NTÉGRALES MULTIPLES
D ÉMONSTRATION : Comme A est borné et fermé, il est compact. Ainsi F admet (au moins) un
minimum (disons x(1) ) et un maximum (disons x(2) ) sur A. Ainsi
Z
vol(A)F(x(1) ) ≤ F(x)dvol(x) ≤ vol(A)F(x(2) ).
A
Soit F̄ = vol(A)−1 A F(x)dvol(x) ∈ R la valeur moyenne, elle est comprise entre F(x(1) ) et F(x(2) ).
R
Puisque A est connexe par arc, il existe une courbe paramétrée G : [0, 1] → A telle que G(0) = x(1) et
G(1) = x(2) . Alors, du théorème de la valeur moyenne pour les fonctions R → R appliqué à F ◦ G,
il existe t0 ∈ [0, 1] tel que F ◦ G(t0 ) = F̄. Autrement dit x(0) = G(t0 ) est le point (de A) qui prend la
valeur moyenne.
Lorsque des applications à valeur dans Rn (n > 1) sont considérées, le théorème de valeur moyenne
est faux :
Exemple 7.B.3. Soit F : [0, 2π] → R2 l’application (une courbe paramétrée) définie par F(t) =
cost 0
sint . Alors l’intégrale de chaque coordonnée est nulle, mais 0 n’est pas dans l’image de F. ♣
153
7.B - Théorème de la valeur moyenne
154
Chapitre 8
Surfaces
L’objectif de ce chapitre est d’amorcer l’étude des surfaces. En bref, une surface est une sous-
variété de dimension 2. Il y a cependant plusieurs perspectives possibles à prendre sur les surfaces,
et certaines personnes préfèrent qualifier de surface l’image d’une “surface paramétrée”, i.e. l’image
d’une application de U ⊂ R2 dans Rm . Plusieurs images de telles applications ne sont pas des sous-
variétés (e.g. le cône, les surfaces qui s’intersectent elle-mêmes, etc...).
De plus, le fait d’avoir un paramétrage permet souvent de simplifier grandement l’étude de la
surface. Les théorèmes 6.3.5 et 6.3.4 assurent que si une application de classe C 1 est injective et
que sa Jacobinne est injective en tout point, l’image sera une surface. Ils montrent aussi que toute
surface admet des paramétrages locaux dans un voisinage de chaque point. Ainsi, c’est surtout le
point de vue du paramétrage (ou de la surface paramétrée) qui sera pris dans ce chapitre.
Comme au chapitre 4, certaines hypothèses minimales seront faites sur les paramétrages. Ici,
il sera supposé que toute surface paramétrée est une application de classe au moins C 1 et que le
domaine de définition D ⊂ R2 est connexe par arc (i.e. toute paire de points peut être jointe par une
courbe paramétrée) et ouvert 1 .
De la même manière que la vitesse est une caractéristique importante d’une courbe, ce sera ici
la paire D1 Φ et D2 Φ (où Φ est un paramétrage local 2 ) qui sera une caractéristique importante de la
surface. D’ailleurs une relecture des sections 3.7 et 6.3 est recommandée.
Afin de fixer la terminologie de ce chapitre :
— Un paramétrage (ou surface paramétrée) est une application C 1 de D ⊂ R2 (un ouvert
connexe par arc) dans Rm
— Un paramétrage régulier Φ est un paramétrage dont tous les points sont réguliers, i.e. tel que
D1 Φ(s,t) et D2 Φ(s,t) engendrent un espace de dimension 2.
1. Si on veut pousser l’étude du bord des surfaces, il faut admettre des ouverts de R × R≥0 (muni de sa topologie
induite comme sous-ensemble de R2 .
2. Très souvent, les résultat s’appliqueront aussi lorsque Φ n’est pas injective.
155
8.1 - Vecteur normal et orientabilité dans R3
Définition 8.0.1. Soit Φ(1) : D1 → Rn et Φ(2) : D2 → Rn deux surfaces paramétrées. Φ(2) est dit
un reparamétrage C k de Φ(1) s’il existe F : D2 → D1 un difféomorphisme de classe C k tel que
Φ(1) ◦ F = Φ(2) . F
Comme pour les courbes, deux surfaces paramétrées sont dites équivalentes si l’une est un
reparamétrage C 1 de l’autre (et c’est aussi une relation d’équivalence).
156
Chapitre 8 - S URFACES
les points x qui sont relié à p par un vecteur v = x − p tel que N · v = 0. Lorsque le plan passe par
l’origine (c’àd. c’est un sous-espace vectoriel), il est alors déterminé par le vecteur normal N. Ainsi,
un espace tangent de dimension 2 dans R3 est déterminé par un vecteur normal.
Puisque l’espace tangent à une surface est de dimension deux, il y a toujours en un point donné la
possibilité de décrire le plan tangent par un vecteur dit normal. Ceci donne aussi tout naturellement
le concept d’orientabilité : est-il possible de choisir ce vecteur de sorte qu’il pointe toujours du
même côté de la surface.
Définition 8.1.1. Une surface S est dite orientable s’il existe un champ de vecteurs normaux
F : S → R3 tel que
— F est continu ;
— ∀x ∈ S ⊂ Rm , Tvit m
x S = {v ∈ R | v est orthogonal à F(x)}.
La donnée de ce champ de vecteurs est une orientation de la surface. Une autre orientation est dite
positive par rapport à la première si les vecteurs normaux sont positivement colinéaires, et négative
s’ils sont négativement colinéaires. F
En particulier, un champ de vecteur normal F ne s’annule jamais : si c’était le cas, l’espace des
vecteurs orthogonaux serait de dimension 3 et ne serait donc pas l’espace des vecteurs tangents à la
surface.
L’existence d’un tel champ de vecteurs dit qu’il est possible de choisir un côté de la surface.
Comme le champ de vecteurs F ne s’annule pas, il est possible de le remplacer par un champ dont
les vecteurs sont tous unitaires : G(x) = F(x)/kF(x)k est aussi continue car kFk est continue et
non-nulle. Il est alors clair que si la surface est orientable, il ne peut y avoir que deux orientations
possibles (correspondant à un signe). Voici un résultat simple et efficace qui permet de dire qu’une
surface de R3 est orientable.
Proposition 8.1.2
Soit F : R3 → R une fonction de classe C 1 . Soit S = F −1 (a) l’ensemble de niveau correspondant
à la valeur régulière a ( i.e. le gradient de F ne s’annule pas sur S). Alors S est une surface
orientable.
Il est aussi important de remarquer qu’un paramétrage local (dans R3 ) donne toujours un vecteur
normal :
Définition 8.1.4. Soit Φ : D → R3 un paramétrage local (d’une surface), alors son vecteur normal
est l’application NΦ (s,t) = D1 Φ(s,t) ∧ D2 Φ(s,t). F
157
8.1 - Vecteur normal et orientabilité dans R3
Comme il s’agit d’un paramétrage local, les deux vecteurs D1 Φ et D2 Φ sont linéairement indé-
pendants. Ainsi, N est non-nul et normal à la surface en tout point. Par contre, l’image n’en est pas
pour autant orientable. En effet, comme le paramétrage n’est pas global, il est possible que plusieurs
paramétrages locaux soient nécessaires ; rien ne dit qu’ils indiqueront la même direction.
Si les conditions sont relâchées, le problème persiste.
Remarque 8.1.5. Dans un paramétrage régulier 3 le vecteur normal est défini et non-nul en chaque
point.
Mais même si l’image est une variété, comme il n’y a pas nécessairement injectivité, il est
possible qu’à un même point dans l’image, le paramétrage associe plusieurs vecteurs normaux dif-
férents (c’est le cas du ruban de Möbius, exemple 8.2.5).
Que l’image d’un paramétrage régulier ne soit pas une variété n’est pas non plus automatique-
ment une conséquence de la non-injectivité : e.g. le cylindre à l’exemple 8.2.4 est une surface qui
est aussi l’image d’un paramétrage régulier non-injectif.
♠
Un des aspects pratiques du vecteur normal, c’est qu’il permet de rendre de façon plus concise
les informations qui sont utiles pour caractériser un paramétrage régulier.
Par exemple, les propriétés du produit vectoriel permettent entre autres de remarquer qu’un
paramétrage Φ de classe C 1 est régulier en un point si le vecteur normal ne s’annule pas en ce point
(NΦ 6= 0).
Avant de présenter une version équivalente, mais plus générale de l’orientabilité, un court préli-
minaire est requis. En abordant, le travail d’un champ de vecteurs le long d’une courbe paramétrée,
il avait été remarqué que cette quantité n’est pas invariante sous reparamétrage. Ceci tient au fait
que les reparamétrages C 1 se déclinent en deux catégories : un difféomorphisme C 1 d’un intervalle
I1 dans un autre I2 possède un signe selon qu’il est croissant ou décroissant.
Les choses en vont de même en dimension supérieure : si S est un ensemble connexe et F : S →
F(S) est un difféomorphisme de classe C 1 alors Det F∗ : S → R est une fonction continue qui ne
s’annule pas. Ainsi elle est toujours de même signe.
3. Une paramétrage régulier injectif est un paramétrage local... ce qui est important pour cette remarque, est l’absence
d’injectivité.
158
Chapitre 8 - S URFACES
Proposition 8.1.6
Soit Φ : D1 → R3 un paramétrage régulier. Soit Ψ : D2 → R3 un reparamétrage C 1 obtenu par
159
8.2 - L’orientabilité dans Rm
D ÉMONSTRATION : Étant des paramétrages réguliers, les vecteurs normaux sont non-nuls. Il faut
seulement déterminer si les vecteurs normaux sont positivement ou négativement colinéaires. Po-
sons t = F(s), alors par la règle de dérivation en chaîne (théorème 3.4.1) Ψ∗ (s) = Φ∗ (t)F∗ (s). Pour
j ∈ 2, D j Φ(t) = Φ∗ (t)e j et D j Ψ(s) = Ψ∗ (s)e j = Φ∗ (t)F∗ (s)e j . Si ai j sont les coefficients de la
matrice A = F∗ (s)T ,
NΨ (s) = D1 Ψ(s) ∧ D2 Ψ(s) = (a11 D1 Φ(t) + a12 D2 Φ(t)) ∧ (a21 D1 Φ(t) + a22 D2 Φ(t))
= (a11 a22 − a12 a21 )D1 Φ(t) ∧ D2 Φ(t)
= Det F∗ (s) NΦ (t)
D’un point de vue intuitif, le résultat ci-dessus n’est peut-être pas surprenant. En effet, le vecteur
normal n’est déterminé qu’à un scalaire près, et il n’y a pas beaucoup d’autres possibilités que le
déterminant de la matrice de Jacobi pour associer un scalaire à un difféomorphisme C 1 de R2 .
Cette dernière proposition peut sembler anodine ou facile. La difficulté provient de ce que la défini-
tion de l’application de transition passe par un ensemble qui n’est pas un ouvert (la sous-variété qui
est paramétrée). Il faut ainsi passer par un épaississement de cette dernière pour faire une démons-
tration propre.
Avant de passer au résultat principal, il est bon de noter que la démonstration est identique dans
le cadre de “reparamétrages” en dimensions supérieures à 2. Par conséquent, le prochain résultat est
une bonne façon de définir l’orientabilité à la fois pour les surfaces dans Rm (où m > 3) que pour
les sous-variétés de dimension plus grande.
160
Chapitre 8 - S URFACES
Proposition 8.2.3
Soit S une surface et soit donnée une famille d’ouverts {Ui }i∈I (où I ⊂ Z≥0 est fini ou infini)
et de paramétrages locaux Φi : Vi → S ∩ Ui (où Vi ⊂ R2 sont des produits d’intervalles). S est
orientable si et seulement si, quitte à inverser certains paramétrages ( i.e. remplacer Φi par Φi ◦ J
où J(x1 , x2 ) = −x 1
x2 ), les déterminants des matrices de Jacobi des applications T(i j) de transition
sont positifs, Det T(i j)∗ > 0.
(Parenthèse : Cette condition signifie qu’en voyant les paramétrages locaux comme des surfaces
paramétrées (qui coïncident) et en les mettant bout à bout, le vecteur normal reste toujours du
même côté de la surface (c’àd. en un point fixé de la surface tous les vecteurs normaux de tous les
paramétrages pointent du même côté) quitte à inverser le vecteur normal de départ pour certains
paramétrages.)
D ÉMONSTRATION : Supposons qu’il existe une famille de paramétrages locaux avec la propriété
que les applications de transition sont de jacobien positif. Alors ces paramétrages locaux définissent
en tout point de leur image un vecteur normal D1 Φ j ∧ D2 Φ j . Comme ce sont des paramétrages
locaux, ce vecteur n’est jamais nul et varie continûment. Soit
N j : Im Φ j → R3
Φ−1
NΦ j j (x)
x 7→
Φ−1
kNΦ j j (x) k
ce champ de vecteurs renormalisés pour être unitaire. Soit maintenant Φi et Φ j deux paramétrages
locaux dont les images s’intersectent sur Wi j = Im Φi ∩ Im Φ j ⊂ S (supposé non-vide). En restrei-
gnant le domaine à la préimage de Wi j , ces deux applications sont, via T(i j) = Φ−1
j ◦ Φi un re-
1
paramétrage C l’une de l’autre. De plus, comme le déterminant est positif, leur vecteur normal
pointera dans la même direction. Cependant, comme il est unitaire, donc Ni = N j sur Wi j , ou plus
rigoureusement, pour x ∈ Wi j :
161
8.2 - L’orientabilité dans Rm
Maintenant, commençons par une surface orientable S, c’àd. soit N : S → R3 le champ de vec-
teurs normaux sur S (qui sont, sans perte de généralité, supposés unitaires). Il est possible de la
couvrir par une famille d’ouverts qui sont les images de paramétrages locaux Φi : Vi → S (et les Vi
peuvent être choisis comme étant connexe par arc, quitte à démultiplier le paramétrage local en le
restreignant à différents domaines). Il faut vérifier que ces paramétrages locaux peuvent être corrigés
pour que les applications de transition aient des jacobiens positifs.
Comme plus haut, les paramétrages locux définissent, sur leur image, un champ de vecteurs
normaux (unitaires) Ni . De ce champ, une nouvelle “fonction” peut être obtenue sur Im Φi : la
fonction Ei : Im Φi → R qui associe à x la valeur c si Ni (x) = cN(x). Ei est une fonction bien définie
(car les deux vecteurs sont colinéaires en tout x, tous les vecteurs normaux à un plan fixé dans
R3 le sont), continue et non-nulle (car N et Ni sont continus et non-nuls), et même identiquement
égale à 1 ou −1 (car les deux champs de vecteurs normaux sont unitaires et définis sur un ensemble
connexe) ; autrement dit Ei = ±1.
L’idée est alors de changer tous les paramétrages locaux qui ont la mauvaise orientation : si Φi
est un paramétrage local tel que Ei = −1, alors il est remplacé par Ψi = Φi ◦ J où J : R2 → R2 est
définie par (x, y) 7→ (−x, y). Comme la matrice de Jacobi de J (c’àd. −1 0
0 1 ) est de déterminant
négatif, le vecteur normal D1 Ψi ∧ D2 Ψi est, une fois renormalisé pour être unitaire, égal à N (cf.
proposition 8.1.6).
Ainsi, quitte à effectuer ce changement, il est possible de supposer que Ni = N. Soit T(i j) une
application de transition, elle est définie sur Wi j ⊂ Vi . Il faut montrer que le jacobien Det T(i j)∗ est
positif sur les composantes connexes de Wi j (le signe est, par continuité et par non-nullité, constant
sur les composantes connexes). Comme T(i j) est un difféomorphisme C 1 , il donne un reparamétrage
C 1 de Φi restreinte à Wi j en Φ j restreinte à T(i j) (Wi j ). Or, si son jacobien est négatif, les vecteurs
normaux de Φi et Φ j doivent être de signes opposés (par la proposition 8.1.6). Donc, le jacobien est
positif.
Ce qui est important à souligner dans le théorème précédent est que une surface est recouverte
par un nombre fini de paramétrages locaux, alors, en un nombre fini d’étapes, il est possible de
déterminer si elle orientable ou non.
x
Exemple 8.2.4. Le cylindre de rayon r ∈ R>0 , D = { yz ∈ R3 | x2 + y2 = r2 }, peut être paramétré
162
Chapitre 8 - S URFACES
r cos s
par Φ : R2 → R3 définie par Φ(s,t) = r sin s . Le vecteur normal est alors :
t
−r sin s 0
e1 e2 e3
r cos s
r cos s ∧ 0 = −r sin s r cos s 0 = r sin s .
0 1 0
0 0 1
x1
F(x) = x2 est un champ de vecteurs normaux à la surface ; elle est donc orientable. De manière
0
équivalente, deux paramétrages locaux qui permettent de montrer que la surface est orientable sont
Φ1 = Φ|]− 3π , 3π [×R et Φ2 = Φ|] π , 7π [×R . ♣
4 4 4 4
Comme promis, voici un exemple (classique) qui illustre que (dans la proposition 8.2.3) il est
important que les paramétrages locaux soient des applications injectives.
Φ : ] − 1, 1[×R → R3
(2 + s cos 2t ) cost
(s,t) 7→ (2 + s cos 2t ) sint .
s sin 2t
Voir que c’est une surface est relativement aisé : Φ|]−1,1[×]0,3π/2[ et Φ|]−1,1[×]π,5π/2[ sont toutes les
deux des paramétrages locaux et recouvre l’image de Φ. Ainsi, chaque point de Φ possède un
paramétrage local.
0 0
En prenant le vecteur normal 0 basé au point 0 , et en tentant de faire un tour sur cette sur-
1 0
face (suivre la courbe Φ(0,t), un cercle de rayon 2) tout en gardant le vecteur toujours du même côté,
il apparaît que le vecteur est maintenant de l’autre côté... Cette surface est en effet non-orientable
(la démonstration rigoureuse de la non-orientabilité est laissée en exercice, voir ci-après).
Les calculs se passent comme suit : son vecteur normal est donné par D1 Φ(s,t) ∧ D2 Φ(s,t) =
e1 e2 e3
t
cos 2 cost cos 2t sint sin 2t
s
− sin t cost − (2 + s cos t ) sint − s sin t sint + (2 + s cos t ) cost s t
2 cos 2
2 2 2 2 2 2
s
sint − (2 + s cos 2t ) sin 2t cost
2
= − 2s cost − (2 + s cos 2t ) sin 2t sint .
(2 + s cos 2t ) cos 2t
−2 sin 2t cost
D’où NΦ (0,t) = −2 sin 2t sint .
2 cos 2t
0 0
Ainsi, NΦ (0, 0) = 0 et (après un tour) NΦ (0, 2π) = 0 . En fait, voici une représentation du
2 −2
ruban (le “devant” en orange et le “derrière” en bleu) avec son vecteur normal :
163
8.2 - L’orientabilité dans Rm
E XERCICE 135: À partir du paramétrage ci-dessus, il est possible de définir deux paramétrages
locaux Ψ1 = Φ]−1,1[×]0, 3π [ et Ψ2 = Φ]−1,1[×]π, 5π [ .
2 2
Exemple 8.2.6. Les cylindres peuvent (à translation et rotation près) être perçus comme les en-
sembles de niveau (réguliers) associés à la fonction G(x, y, z) = x2 + y2 (toutes les valeurs prises
par cette fonction, à l’exception notable de 0, sont régulières). Par la proposition 8.1.2, ils sont
orientables. r cos s
Soit r ∈ R>0 fixé et soit Φ : R2 → R3 le paramétrage défini par Φ(s,t) = r sin s , alors Im Φ =
r cos s t
−1 2
G (r ). De plus, NΦ (s,t) = r sin s n’est jamais nul (régularité du paramétrage) et Φ est de classe
0
C ∞ . Par contre, Φ n’est pas injective. Afin de parler en terme de paramétrage local, il suffit ici de
prendre des restrictions de Φ à un domaine plus petit pour avoir quelque chose d’injectif. Soit
Il s’agit de deux paramétrages locaux. Il est évident que Φ(1) ≡ Φ(2) sur W =]π, 3π/2[×R. D’autre
part, Φ(1) restreinte à W(1) =]0, π/2[×R a la même image que Φ(2) restreinte à W(2) =]2π, 5π/2[×R
(puisque Φ est 2π-périodique sur la première coordonnée). L’application de transition T(12) est
définie sur W ∪W(1) (et à valeur dans W ∪W(2) ). Sur W , T(12) est l’identité puisque T(12) = Φ−1
(2) ◦Φ(1)
164
Chapitre 8 - S URFACES
et que sur ce domaine les deux applications sont identiques (c’est la même application Φ restreint
au même domaine). L’application de transition envoie aussi W(1) vers W(2) , et (comme l’application
Φ est 2π-périodique) il s’agit que de la translation par 2π sur la première coordonnée : st 7→ s+2π
t .
D’où, (
s
t si s ∈]π, 3π/2[,
T(12) (s,t) = s+2π
t si s ∈]0, π/2[.
En particulier, la matrice jacobienne de cette application est l’identité et, par conséquent, le jacobien
(son déterminant) est positif. (Ceci est une manière compliquée de [re-]démontrer que le cylindre
est orientable.) Pour visualiser un peu mieux l’orientation, il est préférable de regarder les vecteurs
normaux. ♣
Exemple 8.2.7. Une autre (famille de) surface dont l’orientabilité est facilement établie est la
famille des sphères (dans R3 ). Celles-ci sont (à translation près) les surfaces de niveau de la fonction
G(x, y, z) = x2 + y2 + z2 , fonction dont toutes les valeurs (prises) sont régulières, à l’exception de 0.
−1 2 s
r cos s sint
La sphère de rayon r ∈ R>0 est S = G (r ). Le paramétrage le plus commun est t 7→ r sin s sint .
r cost
Cependant, il n’est pas très commode au niveau des possibilités qu’il offre pour donner lieu à des
paramétrages locaux (et aux applications de transition associées).
La démarche passera ainsi par les projections stéréographiques (qui sont à proprement parler
plutôt des cartes, c’àd. l’application inverse d’un paramétrage local). De ce fait, un rappel de leur
construction/définition s’impose. Ce sera fait ici pour la sphère de rayon r centrée en l’origine ;
elle est coupée en deux 0morceaux
égaux par le plan z = 0. La projection
x stéréographique (depuis
0
2
le “nord”) PN : Sr r { 0 } → R est donnée en associant à un point yz ∈ Sr différent de 0
r 0 r
x/(1−z/r)
le point du plan z = 0 qui se situe sur la droite reliant 0 à p. D’où PN (x, y, z) = y/(1−z/r) .
r 0
L’autre projection stéréographique, obtenue depuis le pôle sud, c’àd. le point 0 , est donnée par
−r
x/(1+z/r)
PS (x, y, z) = y/(1+z/r) .
Pour obtenir des paramétrages locaux, il faut inverser ces applications. Par exemple, pour PN il
x y
faut tenter de retrouver, étant donné u = et v = les trois valeurs x, y, et z satisfaisant
1 − z/r 1 − z/r
x2 + y2 + z2 = r2 . Pour ce faire, remarquons que
x 2 + y2 2
2 r −z
2 r+z
u2 + v2 = r2 2
= r 2
= r2
(r − z) (r − z) r−z
u2 + v2 − r 2 z 2r2 u
De là, il apparaît que z = r . Ensuite, comme x = u(1 − r ), x = , et, de la
u2 + v2 + r 2 u2 + v2 + r2
2r2 v
même façon, y = . D’où :
u2 + v2 + r2
2r2 u
u2 + v2 + r 2
2r2 v
ΦN (u, v) =
2 2 2
u +v +r
u2 + v2 − r2
r 2
u + v2 + r2
165
8.3 - Surfaces à bord et orientation induite
2r2 u
u2 + v2 + r2
2r2 v
ΦS (u, v) =
u2 + v2 + r2
r2 − u2 − v2
r 2
u + v2 + r 2
0 0 0
2
est un paramétrage local R → Sr r { 0 }. Puisque ΦN (0, 0) = 0 et ΦS (0, 0) = 0 , l’ap-
−r −r r
plication de transition entre ces deux paramétrages locaux est TNS : R2 r { 00 } → R2 r { 00 }. Étant
E XERCICE 137: Une surface de révolution est paramétrage déterminé par f : U→ R (où U ⊂ R)
f (s) cost
une fonction (continue). Alors Φ : U × R → R3 est défini par Φ(s,t) = f (s) sint . [La surface est
s
obtenue en faisant tourner le graphe de x = f (z) autour de l’axe des z.]
a. Supposons que ∀s ∈ U, f (s) > 0 et I ⊂ R est un intervalle de longueur strictement inférieur
à 2π. Soit Ψ la fonction Φ restreinte à U × I. Montrer que Ψ est injective.
0
b. Montrer que si ∀s ∈ U, f (s)2 6= 0 alors le paramétrage est régulier.
0
c. Déduire de a. et b. que si ∀s ∈ U, f (s)2 6= 0 alors il est possible de trouver deux paramé-
trages dont l’union des images recouvrent Im Φ.
d. Montrer que Im Φ est orientable. [Il est possible d’écrire un champ de vecteurs normaux
directement ou d’utiliser les paramétrages.]
166
Chapitre 8 - S URFACES
Dans R2 , il y a un adage simple pour parler de l’orientation d’un domaine : il faut parcourir
le bord de sorte à garder l’intérieur du domaine sur la gauche. Il est d’autant plus raisonnable de
s’en tenir à ça puisque seule l’orientation du bord des pavés sera importante. Mais les paragraphes
qui suivent en donnent une définition plus rigoureuse (dont l’avantage principal est de mieux com-
prendre ce qui se passe en dimension supérieure).
Le plus simple est alors de commencer par une orientation de R2 (ou Rm ). Une orientation est
un choix de base orthonormée (où l’ordre est important !). Une telle base peut s’écrire comme une
matrice (dite orthogonale). Elles sont soit de déterminant +1 ou −1. Ainsi, les orientation positives
de R2 correspondent aux matrice Rt := −cost sint
sint cost qui ne sont rien d’autre que la rotation de la base
canonique par un angle t. Les orientations négative correspondent aux matrices de la forme Rt 01 10 .
Dans R2 (ou Rm ), l’orientation “canonique” ou “standard” est celle qui correspond aux matrices
positives, c’àd. à la base canonique (e(1) , e(2) ) et ses rotations.
Étant donné D un ouvert (connexe par arc) de sorte que ∂D admette un paramétrage par une
courbe paramétrée régulière par morceaux, il faut déterminer un sens privilégier pour ∂D. Comme
le bord est une courbe (au sens de variété de dimension 1), il est possible de parler de l’espace
tangent à x dans ∂D (l’espace engendré par n’importe quel paramétrage régulier en ce point) ; un
sous-espace de dimension 1 de R2 qui sera noté Tx .
Soit Nx l’orthogonal de Tx , ou autrement dit l’espace normal à x. Nx a deux directions, une qui
pointe vers l’extérieur et l’autre vers l’intérieur. En x ∈ ∂D, il y a une rotation Rθx qui fait en sorte
que Rθx e1 pointe vers l’extérieur. Alors, si γ : [a, b] → ∂D paramètre un bout du bord, son orientation
est compatible avec l’orientation standard de R2 si γ 0 (s) est positivement colinéaire à Rθx e2
e2
e1
Exemple 8.3.1.
1
— Le bord du carré S = [−1, 1] × [−1, 1] est orienté par γ(t) = max(| cost|,| sint|) cost, sint
(voir ci-dessous).
— Le bord de l’anneau S = {(x, y) ∈ R2 | 1 < x2 +y2 < 4} est formé de deux cercles x2 +y2 =
1 et x2 + y2 = 4. L’orientation (i.e. le sens de parcours) de ces deux cercles en tant que bord
167
8.3 - Surfaces à bord et orientation induite
de S est t 7→ (2 cost, 2 sint) pour le cercle de rayon 2 et t 7→ (cost, − sint) pour celui de
rayon 1 (voir ci-dessus).
— Les deux droites x = 1 et x = −1 vues comme le bord de la bande S = {(x, y) ∈ R2 | −1 ≤
x ≤ 1} obtiennent les orientations t 7→ (1,t) et t 7→ (−1, −t) (voir ci-dessous).
Remarque 8.3.2. Si l’ensemble des traces obtenues en regardant le bord d’ensembles comme ci-
dessus est muni d’un signe selon son orientation, les opérations ensemblistes se comportent bien,
c’àd.
— Si D1 ∩ D2 est d’intérieur vide, alors ∂(D1 ∪ D2 ) = ∂D1 + ∂D2 (lorsque qu’un bout de
courbe est parcouru une fois dans un sens et une fois dans le sens contraire, ce bout est
enlevé).
— Si D2 ( D1 alors ∂(D1 r D2 ) = ∂D1 − ∂D2 .
Avec ceci, il est possible de découper la bande en carrés (cf. exemple précédent). Puis, chaque carré
donne une orientation à son bord. Lorsque l’union des carrés est faite (et une fois retirés les segments
parcourus dans un sens et dans l’autre) le bord de la bande obtenue a la même orientation. ♠
Intuitivement, l’orientation du bord de l’image d’un paramétrage régulier est induite par l’orien-
tation de R2 . Cependant, ceci ne donne pas nécessairement un bon résultat (regarder ce qui arrive
pour le ruban de Möbius). En effet, une courbe est toujours orientable (en particulier, le bord du
ruban de Möbius est orientable, même si le ruban ne l’est pas).
En effet, le paramétrage local Φ|]−1,1[×]0,2π[ (où Φ est comme à l’exemple 8.2.5) est défini sur
un produit d’intervalle ouverts. Si le bord est orienté par une courbe régulière par morceaux γ, alors
Φ ◦ γ parcourt bien le bord du ruban de Möbius. Cependant, un segment qui relie Φ(−1, 0) avec
Φ(1, 0) sera parcouru deux fois dans le même sens. Autrement dit, l’image du bord de D par Φ ne
donne pas le bord du ruban de Möbius.
Finalement, il faut souligner que deux paramétrages locaux d’une même surface qui ont des
vecteurs normaux opposés (i.e. négativement colinéaires) vont entraîner des orientations opposées
des bord.
Revenons à l’exemple 8.2.6 du cylindre.
Exemple 8.3.3. À l’exemple 8.2.6, le cylindre était recouvert par deux paramétrages locaux définis
sur des pavés “infinis” (un des intervalles est en fait tout R). Il est possible de restreindre lesdites
applications encore plus de sorte que l’image soit en fait un cylindre fini (qui aura donc un bord
formé de deux cercles) : il suffit de remplacer le Φ décrit par Φ|R×]a,b[ pour obtenir un cylindre de
168
Chapitre 8 - S URFACES
hauteur b − a. Autrement dit, de remplacer les deux paramétrages locaux par Φ(1) = Φ]0,3π/2[×]a,b[
et Φ(2) = Φ]π,5π/2[×]a,b[ .
Dans ce cas, les bords du cylindre (les cercles de rayon r dans les plans z = a et z = b) sont
l’image par Φ des droites R × {a} et R × {b}. Pour déterminer, l’orientation de ces cercles, il suffit
d’orienter les bords des deux pavés ]0, 3π/2[×]a, b[ et ]π, 5π/2[×]a, b[ par l’orientation standard de
R2 , puis de prendre l’image des bouts qui correspondent au bord. Ainsi, il faut regarder la composi-
tion de γ(t) = (t, a) (qui lorsque t ∈ [0, 3π/2] est un paramétrage de ]0, 3π/2[×{a}) avec Φ(1) ainsi
que la composition (toujours de) γ (qui lorsque t ∈]π, 5π/2[ est un paramétrage de ]π, 5π/2[×{a})
avec Φ(2) pour avoir le paramétrage du cercle situé sur le plan z = a. En mettant ces deux bouts
r cost
de paramétrages du cercle ensemble, le paramétrage γ̂(t) = r sint est l’orientation induite sur ce
a r cost
cercle. Pour l’autre cercle, il est laissé en exercice de vérifier que le paramétrage est σ̂(t) = −r sint .
r cos s b
Finalement, comme auparavant, le calcul du vecteur normal NΦ (s,t) = r sin s (en s’écartant
0
de l’axe des z, ou vers l’“extérieur”) rend visuellement bien l’orientation de la surface. ♣
Voici le même exemple traité de manière directe (mais le paramétrage n’est plus fait par un
ouvert dans un pavé) et en prenant r = 1.
Exemple 8.3.4. Soit a < b ∈ R>0 , soit Da,b = { st ∈ R2 | a2 < s2 + t 2 < b2 }, soit Φ : D → R3
donnée par √
s/ s2 + t 2
√
Φ(s,t) = t/ s2 + t 2 .
√
s2 + t 2
Cette surface paramétrée est un paramétrage (régulier, C 1 et injectif !) possible du cylindre (le pro-
duit du cercle de rayon 1 avec l’intervalle [a, b]). Comme il n’y a ici qu’une seule paramétrage local
(et donc global), la nappe S = Im Φ est automatiquement orientable. En tant que champ de vecteurs
normal (puisque l’action se situe dans R3 ), cette orientation est donnée par le vecteur normal de Φ,
soit
e1 e 2 e 3
−s/(s2 + t 2 )
t2 −st s
NΦ (s,t) = D1 Φ(s,t) ∧ D2 Φ(s,t) = (s2 +t 2 )3/2 (s2 +t 2 )3/2 (s2 +t 2 )1/2 = −t/(s2 + t 2 ) .
−st s2 t
0
(s2 +t 2 )3/2 (s2 +t 2 )3/2 (s2 +t 2 )1/2
Ainsi, il s’agit de l’orientation qui pointe vers l’axe des z (ou vers l’“intérieur”, pour autant qu’une
telle chose puisse avoir du sens).
Le bord de la nappe S = Im Φ est faite de deux cercles (de rayon 1), un sur le plan z = 1 et un
sur le plan z = 2. Tous deux sont l’image de ∂D par Φ ; ∂D étant lui-même formé de deux cercles
concentriques de rayon a (le cercle intérieur) et b (le cercle extérieur). L’orientation canonique de
a cost
∂D est horaire sur le cercle intérieur (e.g. par la courbe paramétrée γ(t) = −a sint ) et anti-horaire sur
b cost
le cercle
cost cost
par la courbe paramétrée σ(t) = b sint ). Par conséquent, Φ ◦ γ(t) =
extérieur (e.g.orienté
− sint et Φ ◦ σ(t) = sint sont des orientations induites par l’orientation de S que donne Φ.
a b
Ceci est cohérent avec le résultat de l’exemple précédent : une orientation opposée a induit une
orientation opposée du bord. ♣
169
8.4 - Première forme quadratique : longueur et aire
Afin de commencer en douceur, plutôt que de chercher tout de suite l’aire d’une surface, il vaut
mieux regarder un problème qui est essentiellement déjà résolu c’àd. la longueur d’une courbe. En
effet, si Φ : S → Rm est une paramétrage alors à toute courbe paramétrée γ : [a, b] → S correspond,
par composition, une courbe Φ ◦ γ. Il est alors raisonnable de regarder comment l’application Φ
transforme les longueurs avant de regarder comment elle transforme l’aire (et peut-être se surprendre
à trouver un lien entre les deux).
Ainsi, soit x ∈ S̊, soit v ∈ R2 un vecteur, soit γ :] − a, a[→ S telle que γ(0) = x et γ0 (0) = v. Alors,
par le théorème 3.4.1 sur la dérivation en chaîne, si σ = Φ ◦ γ
Ainsi, kσ0 (0)k2 = kD1 Φ(x)k2 v21 + 2 D1 Φ(x) · D2 Φ(x) v1 v2 + kD2 Φ(x)k2 v22 . La distortion de la dis-
Cette forme quadratique s’appelle parfois l’élément de longueur ou la première forme fondamen-
tale ; la notation traditionnelle pour cette forme quadratique est ds2 . Une notation aussi traditionnelle
mais qui sera ici utilisée est :
Comme ce qui a été fait plus haut est général pour toute courbe ayant un vecteur tangent en un point,
il s’ensuit que la longueur de Φ ◦ γ est
Z Z bq
1= QΦ,γ(t) γ0 (t) dt.
Φ◦γ a
Il n’est pas nécessaire de mettre une valeur absolue sous la racine puisque QΦ,x est toujours semi-
définie positive. Effectivement, par définition QΦ,x (v) est la longueur d’un vecteur.
cos s sint
Exemple 8.4.1. Soit Φ : R2 → R3 le paramétrage défini par Φ(s,t) = sin s sint (et décrivant une
cost
sphère de rayon 1). D’où
− sin s sint cos s cost
D1 Φ(s,t) = cos s sint et D2 Φ(s,t) = sin s cost .
0 − sint
De là,
EΦ (s,t) = sin2 t, FΦ (s,t) = 0, et GΦ (s,t) = 1.
170
Chapitre 8 - S URFACES
Pour mesurer l’aire, l’idée est essentiellement la même que pour la longueur, c’àd. de séparer
l’ensemble S en petits carrés et de regarder l’aire de l’image de chaque petit carré. En effet, au point
x ∈ S le rectangle [x1 , x1 + ε] × [x2 , x2 + δ] (d’aire εδ) sera envoyé vers un parallélogramme dont
trois sommets seront (approximativement) Φ(x), Φ(x) + εD1 Φ(x) et Φ(x) + δD2 Φ(x). Or l’aire de
ce parallélogramme est la norme du vecteur εD1 Φ(x) ∧ δD2 Φ(x) = εδNΦ (x). Autrement dit, l’aire
est (infinitésimalement en x) multipliée par kNΦ (x)k.
R
Il est alors naturel de penser à l’aire comme S kNΦ k.
Cette définition ne semble pas faire intervenir les mêmes ingrédients que la mesure de la lon-
gueur, ce qui est pour le moins surprenant. Il suffit en fait de creuser un peu (cf. proposition 1.4.1)
pour remarquer que
kNΦ (x)k2 = kD1 Φ(x) ∧ D2 Φ(x)k2 = kD1 Φ(x)k2 kD2 Φ(x)k2 − (D1 Φ(x) · D2 Φ(x))2
= EΦ (x)GΦ (x) − FΦ (x)2
= Det QΦ,x .
Ce passage n’est pas qu’une pure consolation mathématique. En fait, l’avantage très supérieur de
QΦ sur NΦ est que la première est définie pour un paramétrage dans Rm pour n’importe quel m ≥ 2
tandis que le second n’est défini que dans R3 .
La définition formelle sera faite pour les intégrales de fonction, en se rappelant que l’aire est
obtenue en prenant la fonction constante de valeur 1.
[La quantité sous la racine est toujours positive ou nulle, sinon il y a erreur de calcul.] Avant de faire
quelques exemples, montrons que la définition 8.4.2 est bien invariante par reparamétrage C 1 . Pour
ce faire, il faut d’abord remontrer un petit résultat sur la transformation que subit la première forme
fondamentale lorsqu’il y a reparamétrage.
Lemme 8.4.3
Soit Φ : D1 → Rm un paramétrage. Soit Ψ : D2 → Rm un reparamétrage C 1 obtenu par compo-
sition de Ψ avec le difféomorphisme C 1 , F : D2 → D1 . Alors
171
8.4 - Première forme quadratique : longueur et aire
D ÉMONSTRATION : Comme pour la proposition 8.1.6, posons t = F(s), alors par la règle de
dérivation en chaîne (théorème 3.4.1) Ψ∗ (s) = Φ∗ (t)F∗ (s). Pour j ∈ 2, D j Φ(t) = e j Φ∗ (t)T et
D j Ψ(s) = e j Ψ∗ (s)T = e j F∗ (s)T Φ∗ (t)T . Si ai j sont les coefficients de la matrice A = F∗ (s)T ,
EΨ (s)=kD1 Ψ(s)k2 =ka11 D1 Φ(t) + a12 D2 Φ(t)k = a211 EΦ (t) + a11 a12 FΦ (t) + a212 GΦ (t)
FΨ (s)=D1 Ψ(s) · D2 Ψ(s)=a11 a21 EΦ (t) + (a11 a22 + a12 a21 )FΦ (t) + a12 a22 GΦ (t)
GΨ (s)=kD2 Ψ(s)k2 =ka21 D1 Φ(t) + a22 D2 Φ(t)k = a221 EΦ (t) + a21 a22 FΦ (t) + a222 GΦ (t)
Ainsi, EΨ (s)GΨ (s) − FΨ (s)2 = (a11 a22 − a12 a21 )2 EΦ (t)GΦ (t) − FΦ (t)2 , comme attendu.
Proposition 8.4.4
Soit D1 un ouvert borné, soit Φ : D1 → Rm un paramétrage régulier et Ψ : D2 → Rm un para-
métrage équivalent à Φ, alors si F est une fonction continue sur Im Φ,
Z Z
F= F.
Φ Ψ
172
Chapitre 8 - S URFACES
p
Ainsi kNΦ (s,t)k = Det QΦ (s,t) = r|R + r cos s|. En supposant que 0 ≤ r ≤ R, il apparaît que
Z Z 2π Z 2π
1=r (R + r cos s)dtds = 4πRr.
Φ 0 0
La physique associe aussi une quantité importante à un champ de vecteurs le long d’une surface.
L’idée est d’alors voir R3 rempli d’un fluide et le champ de vecteurs comme (à un instant donné) la
quantité/vitesse de/du fluide qui se déplace dans la direction donnée. Le flux à travers une surface
représente alors la quantité de fluide qui traverse la surface. Il faut évidemment fixer une orientation
pour pouvoir parler de ce concept, c’àd. comme le travail, la définition dépendra à un signe près de
l’orientation.
E XERCICE 138: Montrer que si Φ est un reparamétrage C 1 de Ψ, alors le flux de F par Φ est à
un signe près le flux de F par Ψ et que ce signe est le signe du jacobien du difféomorphisme de
reparamétrage.
E XERCICE 139: Montrer que le flux à travers un ruban de Möbius n’est pas invariant par paramé-
trage, c’àd. trouver un champ de vecteurs et deux paramétrages (dont le complémentaire de l’image
est négligeable) de sorte que la valeur absolue du flux est différente.
Exemple 8.4.7. Le champ électrique est donné par un champ de vecteurs. Une charge électrique
x
ponctuelle produit un champ F : R3 r {0} → R3 donné par F(x) = k kxk 3 où k ∈ R>0 . Cherchons le
flux de ce champ à travers une sphère de rayon r orientée vers l’intérieur (l’origine).
r cos s cost Pour
ce faire, le
3
paramétrage choisi est Φ : [−π/2, π/2] × [0, 2π] → R défini par Φ(s,t) = r cos s sint . De nouveau,
r sin s
il s’agit d’un découpage en 1 morceau. Tout d’abord le vecteur normal se calcule par
e1 e2 e3
cos s cost
NΦ (s,t) = −r sin s cost −r sin s sint r cos s = −r2 cos s cos s sint
−r cos s sint r cos s cost 0 sin s
cos s cost
k
Comme F Φ(s,t) = r2
cos s sint , le flux est
sin s
Z Z π/2 Z 2π
F · dN = −k cos sdtds = −4πk.
Φ −π/2 0
173
8.4 - Première forme quadratique : longueur et aire
γ2 (s)
Il est possible d’obtenir une surface de révolution (plus générale que celles décrites précédemment)
en faisant la rotation de cette courbe autour du 3ème axe. Soit Φ :]0, L[×R → R3 défini par
γ1 (s) cost
Φ(s,t) = γ1 (s) sint .
γ2 (s)
a. Si γ est injective, l’image de Φ est-elle une surface (au sens de variété de dimension 2) ? Si
oui, est-elle orientable ?
b. Donner la première forme fondamentale de Φ.
c. Montrer que si p(s) est la distance de γ(s) à l’axe de rotation, alors, l’aire de l’image par
Φ de ]0, L[×]0, 2π[ est
Z L
2π p(s)ds
0
d. Utiliser ceci pour calculer l’aire d’un tore.
E XERCICE 142: Soit U ⊂ R2 un ouvert connexe par arc et F : R2 → R une fonction de classe
C 1 . Soit S l’ensemble (dans R3 ) formé parle graphe de D. Le paramétrage le plus simple de cette
x
surface est Φ : U → S défini par Φ(x, y) = y .
F(x,y)
a. Montrer que l’image de Φ est une surface (au sens de variété de dimension 2).
b. La surface est-elle orientable ?
c. Montrer que sa première forme fondamentale est
!
1 + D1 F(x, y)2 D1 F(x, y)D2 F(x, y)
QΦ,(x,y) = .
D1 F(x, y)D2 F(x, y) 1 + D2 F(x, y)2
174
Chapitre 8 - S URFACES
x
où z dépend implicitement de y .
r2 cos s
E XERCICE 144: Soit Φ : [0, 1]2 → R3
la surface déterminée par Φ(r, s) = r2 sin s .
r4 /2
b. En déduire que Φ est régulière sur l’intéreur de son domaine (c’àd. ]0, 1[2 ). Quelle est l’aire
de Φ ?
0
c. Soit F : R3 → R3 le champ de vecteurs défini par F(x, y, z) = 0 . Quel est le flux Φ F · dN
R
z
de F à travers Φ ?
E XERCICE
ch145: La caténoïde peut être paramétrée par l’application Φ : R2 → R3 définie par
s cost
Φ(s,t) = ch s sint .
s
a. Ce paramétrage est-il injectif ? est-il C 1 ?
b. Calculer le vecteur normal NΦ . En déduire les points où le paramétrage est régulier. L’image
de Φ est-elle une surface ?
c. Quelle est l’aire de l’image par Φ du domaine ] − 1, 1[×]0, 2π[ ?
d. Cette surface est-elle orientable ?
E XERCICE
u cos v
146: Une des possibilités pour décrire un cône est le paramétrage suivant : Φ(u, v) =
u sin v défini pour u ∈ R>0 et v ∈]0, 2π[ et à valeur dans R3 .
u
a. Montrer que la matrice de la première forme fondamentale de Φ en uv est QΦ,(u,v) = 20 u02 ,
175
8.5 - Deuxième forme fondamentale : courbure
par exemple (0◦ N, 10◦ E) (pas très loin de Libreville au Gabon), 90◦ N (le pôle nord) et (0◦ N, 80◦ O)
(pas très loin de Bahía de Caráquez en Équateur), un triangle dont tous les angles sont à 90◦ , ce qui
donne une somme de 3π/2... [Il faut savoir que les morceaux d’équateur et de méridiens sont des
chemins les plus courts sur la sphère.]
La manière la plus simple de parler de courbure sur une sphère est de commencer par la courbure
d’une courbe. Une première tentative de définition serait :
“Soit γ : [−1, 1] → S une courbe qui prend valeur sur une surface S et soit x = γ(0) ∈ S. Sup-
posons que γ est paramétrée par la longueur d’arc et que la courbure de γ (représentée par γ00 ) soit
uniquement dû au fait que γ doive rester dans la surface. Alors, la courbure de S dans la direction
γ0 (0) en x est la la courbure de γ.”
Deux remarques importantes :
— il est possible de parler de courbure sans parler de paramétrage par la longueur d’arc, voir
exercice 81 au chapitre 4.
— si une partie de la courbure de γ (en 0, avec γ(0) = x) ne provient pas du fait que γ reste dans
S, alors cette partie de la courbure est la projection du vecteur de courbure dans l’espace
tangent Tx S.
Ainsi, une seconde tentative de définition est :
“Soit γ : [−1, 1] → S une courbe qui prend valeur sur une surface S et soit x = γ(0) ∈ S. La
courbure de S dans la direction γ0 (0) en x est la partie de la courbure de γ qui est orthogonale à Tx S.”
Il n’est cependant pas clair que ceci est bien défini (i.e. que ça ne dépende que de γ0 (0) et non de
γ00 (0) ou d’autres paramètres)... Un petit calcul est alors de propos. Soit Φ : D → S un paramétrage
local (régulier suffirait) et σ : [−1, 1] → D une courbe. Pour alléger les notations, soient
176
Chapitre 8 - S URFACES
Pour simplifier la suite du calcul, supposons que m = 3. Alors, V est l’espace engendré par NΦ et il
suffit de prendre le produit scalaire avec NΦ /kNΦ k pour trouver :
∑2i=1 ∑2j=1 D j Di Φ(s) · NΦ (s) vi v j
;
kNΦ (s)k vT QΦ,s v
La double somme du haut est en fait une forme quadratique du vecteur v. Ceci se voit en posant
II est nommée seconde forme fondamentale. Alors la courbure de Φ en s dans la direction v est
vT II Φ,s v
κΦ,s (v) = .
vT QΦ,s v
Pour trouver les valeurs maximales ou minimales de κ, une petite astuce pourra nous venir en aide :
si v = Q−1/2 w (la matrice Q−1/2 existe car Q est symétrique et définie positive, voir section 8.A),
alors
wT Q−1/2 II Q−1/2 w
κ(v) = .
wT w
Le maximum (resp. minimum) correspond au vecteur propre w de Q−1/2 II Q−1/2 dont la valeur
propre est maximale (resp. minimale). Deux choses sont faciles à dire sur ces valeurs propres (qui
sont parfois nommées courbures principales). Leur produit, appelée courbure de Gauß est
eg − f 2
KΦ (s) = K := λ1 λ2 = Det(Q−1/2 II Q−1/2 ) = (Det Q)−1 Det II =
EG − F 2
Leur moyenne, appelée courbure moyenne, est (en utilisant, Tr(AB) = Tr(BA))
Ge + gE − 2 f F
1 1
Tr(Q−1/2 Q−1/2 II ) = Tr(Q−1 II ) = 12
1
HΦ (s) = H := 2 λ1 + λ2 = 2 2 .
EG − F 2
√
Un petit peu d’algèbre permet de retrouver λ1 et λ2 à partir de H et K : λ = H ± H 2 − K.
La courbure de Gauß, ou plutôt son signe, a un sens très facile à voir géométriquement. En effet,
si elle est positive, ceci veut dire que κ(v) est aussi toujours positif, autrement dit que toutes les
courbes ont une courbure qui va dans le même sens (c’est le cas de la sphère, voir l’exemple 8.5.2
ci-dessous). Par contre, si elle est négative, ceci veut dire que κ(v) prend des valeurs positives et
négatives, autrement dit qu’une courbe a une courbure qui va dans un sens, et une autre dans l’autre
sens (c’est le cas de la “selle de cheval”, le graphe de la fonction F(x, y) = xy, voir l’exemple 8.5.3).
177
8.5 - Deuxième forme fondamentale : courbure
2 3
Exemple 8.5.2.
cos sComme
sint
à l’exemple 8.4.1, soit Φ : R → R le paramétrage de la sphère défini
par Φ(s,t) = sin s sint . Alors
cost
− cos s sin2 t
− sin s sint cos s cost
D1 Φ(s,t) = cos s sint , D2 Φ(s,t) = sin s cost , et NΦ (s,t) = − sin s sin2 t .
0 − sint − sint cost
Ce qui donne
EΦ (s,t) = sin2 t, FΦ (s,t) = 0, et GΦ (s,t) = 1.
Ensuite,
− cos s sint − sin s cost − cos s sint
D1 D1 Φ(s,t) = − sin s sint , D1 D2 Φ(s,t) = cos s cost , et D2 D2 Φ(s,t) = − sin s sint .
0 0 − cost
[C’est une coïncidence rare que les deux formes fondamentales soient égales.] Un calcul rapide
donne que la courbure de Gauß et la courbure moyenne sont toutes deux égales à 1. En fait, la
courbure en un point quelconque et une direction quelconque est
κΦ,s (v) = 1.
Autrement dit, elle est la même partout (ce qui est géométriquement attendu). ♣
Ensuite,
ch s cost − sh s sint − ch s cost
D1 D1 Φ(s,t) = ch s sint , D1 D2 Φ(s,t) = sh s cost , et D2 D2 Φ(s,t) = − ch s sint .
0 0 0
Puisque kNΦ (s,t)k2 = ch2 s(1 + sh2 s) = ch4 s (et ch s ≥ 1 > 0 pour tout t ∈ R),
178
Chapitre 8 - S URFACES
Les surfaces à courbure moyenne nulles sont très particulières (ce sont les surfaces “minimales”,
car elle minimisent l’aire si le bord est fixé). Cette fois-ci la courbure n’est pas uniforme (ce qui est
√
automatique si K < 0). Puisque H = 0, les courbures principales sont λ± = ± −K = ± ch−2 s. La
courbure à l’image du point (s,t) et la direction correspondantes sous Φ à v est
vT II v v21 − v22
κΦ,s (v) = = .
vT Qv ch2 skvk2
Les vecteurs qui donnent le maximum et minimum sont évidemment 10 et 01 (le signe de la
valeur propre est déterminé par le fait que cette courbure pointe ou non dans la direction du vecteur
normal). Autrement dit, les courbes qui correspondent aux courbures les plus extrémales en un point
(s,t) sont celles de la forme Φ ◦ γ(s + u,t) et Φ ◦ γ(s,t + u) où u ∈ R. ♣
L’autre question mentionnée dans l’introduction est de savoir comment trouver l’équivalent
d’une “ligne droite” dans une surface. Cette question est bien sûr reliée. Une personne qui serait
née dans un monde en 2 dimension et qui penserait aller en ligne droite (et à vitesse constante) ne
sentirait aucune accélération. Il y en aurait forcément une : celle qui fait que cette personne reste
dans la surface.
Il serait possible d’utiliser ce qui a été fait au préalable sur le calcul de la courbure, mais il est
plus simple d’énoncer ces conditions directement. Il suffit donc de vérifier une condition :
Définition 8.5.4. Soit Φ : D → Rm un paramétrage régulier. Une courbe γ : [a, b] → D est dite
par
géodésique si (Φ ◦ γ)00 (t) est orthogonal l’espace tangent en γ(t), Tγ(t) Φ. F
Pour voir que cette condition donne automatiquement que la vitesse est constante, il suffit de dériver
k(Φ ◦ γ)0 (t)k2 : 0
0 2
= 2 (Φ ◦ γ)0 (t), (Φ ◦ γ)00 (t) .
k(Φ ◦ γ) (t)k
Mais comme (Φ◦γ)0 (t) est dans le plan tangent en γ(t), c’est une combinaison linéaire de D1 Φ γ(t)
j
Une forme vectorielle qui est plus tentante est, en posant Γk` = Dk D` Φ γ(t) , D j Φ γ(t) ,
j
Les Γk` sont appelés symboles de Christoffel. La somme-produit dans laquelle ils apparaissent ci-
haut est typique du calcul tensoriel (une généralisation du calcul matriciel pour des “matrices” qui
179
8.5 - Deuxième forme fondamentale : courbure
sont des tableaux avec trois dimensions). Pour se ramener à quelques chose de purement matriciel,
il faudrait prendre Γ1 et Γ2 comme des matrices, puis mettre dans un vecteur les deux réels γ 0T Γ j γ 0
(le premier terme étant de manière plus évidente Qγ 00 ).
Dans l’utlime chapitre, il sera démontré que les géodésiques sont des “point critiques” pour la
longueur. Plus précisément, une géodésique est souvent un minimum (local !) pami les courbes qui
relie deux points. Le premier exemple montrera bien que ce ne sont pas toujours des minima.
Exemple 8.5.6. (suite de l’exemple 8.5.2.) L’équateur et le méridien sont des géodésiques sur la
sphère. Les symboles de Christoffel sont :
Une première solution évidente s’obtient en posant γ2 0 ≡ 0. Alors il reste (puisque sin γ2 6= 0 (car
γ2 (r) ∈]0, π[) :
γ1 00 =0
02
γ1 cos γ2 = 0.
En fait, les méridiens et l’équateur représente la même courbe : l’intersection de la sphère avec
un plan qui passe par l’origine. Ces courbes sont appelés des “grand cercles” et forment effectivem-
ment le chemin le plus court sur la sphère (comme le lecteur le remarquera si il prend un avion sur
une longue distance 5 ).
Une manière directe de le voir provient du calcul de la courbure : elle est identiquement égale
à 1. D’autre part le vecteur (unitaire) normal en un point x de la sphère est x lui-même. Autrement
dit, pour qu’une coube soit géodésique il faut que son le vecteur normal soit égal à sa position. Ceci
est réalisé précisément par un “grand cercle”.
Étant donné deux points sur la sphère, il y a un grand cercle qui les relie 6 . Ce grand cercle aura
presque tout le temps une section plus courte que l’autre. La section la plus courte est un minimum
(même le minimum), tandis que la plus longue n’est qu’un point d’inflexion 7 .
Voici un exemple moins conclusif, mais sur une surface plus compliquée.
5. Les vents dominants font que la trajectoire n’est jamais exactement un grand cercle.
6. Il y a en même exactement un, sauf dans la sitation où les deux points sont à l’opposée sur la sphère : il y a une
infinité de méridien entre le pôle nord et le pôle sud.
7. Il est impossible de faire un maximum : il y a toujours une courbe qui oscille encore plus que la précédente et dont
la longueur sera encore plus longue.
180
Chapitre 8 - S URFACES
Exemple 8.5.7. (suite de l’exemple 8.5.3.) Cet exemple a pour but de monrter qu’il y a deux
géodésiques évidentes sur le caténoïde. Les symboles de Christoffel sont :
La plus simple solution est de prendre γ01 ≡ 0, i.e. γ1 (r) = s0 . Puis il reste γ002 ≡ 0, autrement dit :
s0
γ(r) =
K1 r + K2
γ001 ch γ1 + γ02
1 sh γ1 = 0.
Il n’est pas vraiment nécessaire de montrer qu’il y a une solution non-triviale à cette équation (un
théorème nous l’assure). Il d’autre part automatique que, dans l’image cette correspondra
ch r cost à un bout
0
horizontal de la surface, paramétré, mais pas par la longueur d’arc, par ch r sint0 .
r
Pour ceux qui veulent en avoir le coeur net, les astuces usuelles permettre de réduire la solution
de cette équation à celle de v(γ) (avec v = γ0 6= 0, sinon la solution constante serait obtenue) :
v0 sh γ
vv0 ch γ + v2 sh γ = 0 ⇒ =− ⇒ v = K1 (ch γ)−1 .
v ch γ
Puis, Z
K1 r + K2 = ch γdγ = sh γ.
√ 2
√1+r cost0
Soit γ1 (r) = argsh(K1 r +K2 ). Ceci donne une courbe (paramétrée par la longueur d’arc) 1+r2 sint0 .
argsh r
♣
Malheureusement, contrairement à la sphère sur le caténoïde tous les points ne sont pas iden-
tique. L’exemple ci-dessus ne donne que très peu d’information sur une géodésique quelconque.
E XERCICE 147: Le tore (de rayons r et R) est une surface qui peut être vue comme l’image du
(R+r cos s) cost
paramétrage 8 Φ :] − π/2, 3π/2[×] − π, π[7→ R3 défini par Φ(s,t) = (R+r cos s) sint . Montrer que
r sin s
la courbure de Gauß est positive si s ∈] − π/2, π/2[ et négative si s ∈]π/2, 3π/2[.
E XERCICE 148: (voir exercice 142) Soit U ⊂ R2 un ouvert connexe par arc et F : R2 → R une
fonction de classe C 2 . Soit S l’ensemble (dans R3 ) formé par le graphe de D. Le paramétrage le
x
plus simple de cette surface est Φ : U → S défini par Φ(x, y) = y .
F(x,y)
8. Étant donné le domaine, l’image sera un tore privé de deux cercles, mais ce n’est pas bien important.
181
8.5 - Deuxième forme fondamentale : courbure
a. Montrer que
2
D1 D1 F(x, y)D2 D2 F(x, y) − D1 D2 F(x, y)
KΦ (x, y) = .
(1 + D1 F(x, y)2 + D2 F(x, y)2 )2
b. En déduire que si F(x, y) = xy alors la courbure de Gauß du graphe est partour négative.
c. Toujours si F(x, y) = xy, calculer les symboles de Christoffel et montrer que γ(t) = 0t et
u2 − v2
a. Montrer que la matrice de la première forme fondamentale de Φ en uv est
(1+u2 +v2 )2 0
QΦ,(u,v) = (1 + u2 + v2 )2 Id = 0 (1+u2 +v2 )2
,
182
Chapitre 8 - S URFACES
3
cost les géodésiques du cylindres pour le paramétrage Φ : R×] − π, π[→ R
E XERCICE 152: Calculer
donné par Φ(s,t) = sint .
s
eT T T T
( j) Q MQe(i) = (Qe( j) ) M(Qe(i) ) = q( j) Mq(i) = λi q( j) · q(i) .
Or comme les vecteur propres forment une base orthonormée, ce coefficient est 0 si i 6= j et λi si
i = j. De plus, QT Q = Id = QQT , d’où
M = QΛQT .
Lemme 8.A.1
Si une matrice M est symétrique, alors pour tout entier impair k il existe une matrice M 1/k qui
satisfait (M 1/k )k = M.
Si de plus, M est semi-définie positive, alors ∀r, s ∈ R≥0 il existe des matrices M r et M s
telles que M r M s = M r+s , avec M 1 = M et M 0 := Id.
Finalement, si M est définie positive, alors ∀r, s ∈ R≥0 il existe des matrices M r et M s telles
que M r M s = M r+s , avec M 1 = M et M 0 := Id.
Selon que les λi sont quelconques (M symétrique), positifs ou nuls (M semi-définie positive), stric-
tement positifs (M définie positive) les différentes puissances (fraction à dénominateur impair, réel
positif, réel quelconque) sont définies. Puis, si
M r = QΛr QT ,
183
8.A - Le calcul fonctionnel pour les matrices symétriques
Aussi, M 0 = Id et M 1 = M.
De plus, Det(M r ) = (Det M)r , ainsi, lorsque r 6= 0, M r est inversible (i.e. son déterminant est non-
nul) exactement lorsque M l’est.
L’astuce précédente peut-être généralisée :
Lemme 8.A.2
Soit f et g des fonctions qui admettent des séries de Taylor qui convergent pour tout x ∈ [a, b].
Soit M une matrice symétrique dont les valeurs propres sont contenues dans l’intervalle [a, b].
Alors il existe des matrices f (M) et g(M) avec f g(M) = f ◦ g(M). Toutes les relations qui
n’implique que f et un scalaire 9 sera aussi vraie en remplaçant le scalaire par une matrice.
f (M) = ∑ ci M i = ∑ ci QΛi QT = Q
T
∑ ci Λi Q = Q f (Λ)QT .
i≥0 i≥0 i≥0
apparaissent. En particulier Det eM 6= 0, et cette matrice est toujours inversible. Même, puisque
e−x ex = 1, e−M eM = Id. Comme les valeurs propres de eM sont toutes > 0, (eM )r existe pour tout
réel, et (eM )r = erM .
Comme ln(1 + x) a une série de Taylor qui converge pour x ∈] − 1, 1[, si M est une matrice
dont les valeurs propres sont dans cet intervalle, ln(Id +M) est une matrice qui satisfait eln(Id +M) =
Id +M.
√
Il est aussi possible de regarder eıM (où ı = −1 : c’est une matrice (à coefficients complexes)
dont toutes les valeurs propres sont de norme 1.
Par contre, dès que deux matrices interviennent, les relations ne tiennent plus : la base qui
diagonalise M n’est pas forcément la même que celle qui diagonalise M 0 (si c’était le cas, M et M 0
commuterait).
Pour conclure, il est possible de faire du calcul fonctionnel pour des matrices non symétriques.
Par exemple, si M = 00 10 , alors M 2 = 00 00 . Ainsi, toute série de Taylor en M convergera (puisque
N := eM = Id +M = 10 11 e−M = Id −M = 10 −1 −1
alors 1 =N .
En poussant un peu plus loin : ∀r ∈ R, erM = Id +rM = 10 1r = N r . Pour terminer par une remarque
qui va vers les groupes de Lie, pour certains sous-espaces vectoriels de matrices V bien choisis, il
se trouve que l’image par l’exponentielle de V est un sous-groupe (multiplicatif !) des matrices.
184
Chapitre 8 - S URFACES
La manière la plus élémentaire de parler de courbure est de regarder un des types les plus ancien-
nement considérés de surface : les polyèdres. Comme souvent, derrière une apparence anodine se
cache des sujets assez subtils, et histoire de ne pas trop s’étaler, seul les cas où les faces du polyèdre
sont toutes des polygones réguliers identiques sera considéré.
Il n’y a alors que deux données importantes : le nombre de côté au polygone f ∈ Z≥3 et le
nombre de polygone qui se rencontre en un sommet d ∈ Z≥3 . Par exemple, si d = 3, les polyèdres
construit pour f = 3, 4 ou 5 sont le tétraèdre (4 triangles équilatéraux formant une base pyramidale),
le cube, et le dodécaèdre :
Une manière de les dessiner dans le plan est d’utiliser une projection stéréographique. Plus simple-
ment, en commençant par le polygone à f côtés puis en continuant avec cette seule règle combina-
toire (sans tenir compte des angles) une seule solution s’impose. Ceci donne :
u
Z
Z
u
Z
Z
x x Z Z
x u u u
!u
Z Z
@ Z
@x x u
b
PP Z
\u u u!
T bb P \ Z
B Z !
Tx bx
T b
B
B u Bu
B B
"" x x Bu u Pu
B P
"" Z
x B Z
" @
x @x B B
Bu u
u
B
B
S
Su
S
u
B
L’angle solide à chaque sommet devient de plus en plus grand lorsque f augmente. En sorte,
la courbure est de moins en moins grande. D’ailleurs, si d’aventure le même procédé était fait avec
f = 6, ce n’est pas un polyèdre qui serait obtenu mais un pavage (comme le lecteur en a certainement
déjà vus) :
185
8.B - Combinatoire et courbure négative
Ainsi, c’est un plan qui est obtenu, et il est raisonnable de dire que la courbure est nulle. Pour
poursuivre avec f = 7 ou plus, il faut abandonner de réaliser le “polyèdre” avec une matière rigide.
Il est cependant possible de le faire avec du papier et du ruban adhésif. L’objet qui apparaît a alors
la propriété qu’un voisinage de tout point a la forme d’une selle de cheval. Voici des représentations
déformées pour f = 7 et 8 :
Ces types d’objets sont qualifiés d’hyperboliques. Une raison probable est que la courbure posi-
tive, dont les première représentations étaient des ellipsoïdes, fut associée à elliptique. La courbure
nulle a deux adjectifs : planaire ou parabolique. Planaire est pour le cas où la courbure est identi-
quement nulle tandis que parabolique lorsque seule une des deux courbures principales est nulle.
Comme les objets qui sont construits ici sont très réguliers (toutes les directions sont similaires)
le “parabolique” n’apparaît pas. Finalement, les premiers objets à courbure négatives étaient des
hyperboloïdes, d’où le fait que l’adjectif hyperbolique est resté associé à la courbure négative.
Par souci de complétude, voici la série pour d = 4. Elle commence par l’octaèdre ( f = 3, deux
pyramides à base carrés dont les triangles sont équilatéraux qui sont recollées ensemble par leur
base carré), puis le pavage du plan par des carrés (courbure nulle), et les pentagones donnent un
objet hyperbolique :
186
Chapitre 8 - S URFACES
tXX t
T XXX
e t %
Te T %
Te T %
T et Tt%
ou T L puis
TL
TL
TL
t
TL
v ((v
bhhhhhhhv
h
T
S ((((((""
b
TS bb T "
"
bv v v
TS b T "
"
TS T T T
T S T v Tv T
T Sv Tv Tv
T L
TL
ou TL
puis
TLL
TL
TL
v
TL
Pour d = 6, même avec f = 3 c’est un pavage du plan qui est obtenu puis un objet hyperbolique :
187
8.B - Combinatoire et courbure négative
T T J
J
T TT J
J T T
J T
J T T
J T
J T
En fait, une idée tentante serait de voir un polyèdre comme un pavage de la sphère. La question
naturelle est alors : qu’est-ce que pave les cas où la courbure est négative ?
Ceci nous ramène à une vieille question à savoir s’il est possible d’enlever un des postulat
d’Euclide. Celui qui a longtemps fait débat est :
“Étant donné une droite D et deux droites D1 et D2 qui intersectent D en un point, les droites D1 et
D2 se coupent quelque part si et seulement si l’angle de ces deux intersection n’est pas le même 10 .”
Il est assez facile de voir que sur une sphère ce postulat est faux : les droites sont des “grand
cercles” et n’importe quels grands cercles se croisent. Autrement dit en géométrie sphérique ou
elliptique, ⇒ ne tient pas. Cependant, ce qui a longtemps turlupiné les mathématiciens est de savoir
si ⇐ pouvait être déduit des autres postulats d’Euclide.
En construisant avec du papier un des objets hyperboliques ci-dessus (préférablement celui avec
d = 3 et f = 7, voir plus loin), il est possible de voir que tous les postulats d’Euclide, à l’exception
du ⇐, tiennent. Pour voir de quoi a l’air une droite, la méthode “agricole” recommandée est de
prendre un bout de ruban adhésif et de le coller de sorte qu’il n’y ait aucun pli dans le ruban.
“L’objet” pavé dans le cas hyperbolique s’appelle le plan hyperbolique. Un premier avertisse-
ment pour les modèles en papier est que le plan hyperbolique ne peut pas être réalisé comme une
surface dans R3 .
Pour comprendre ce qui fait qu’un objet sphérique, planaire ou hyperbolique est obtenu, le
plus simple est de calculer la somme des angles à un sommet. L’angle α à l’intérieur d’un polygone
régulier à f côtés est donné par f (π − α) = 2π ou α = (1 − 2/ f )π. Si d tels polygones se rencontrent
en un point, un “cercle” autour de ce point aura pour longueur la somme des angles : dα = d(1 −
2/ f )π.
Lorsque d(1 − 2/ f )π = 2π ceci détermine un pavage du plan. Si d(1 − 2/ f )π < 2π c’est un
“pavage” de la sphère (un polyèdre). La courbure est d’autant plus grande que ce nombre est grand.
Finalement, lorsque d(1 − 2/ f )π > 2π c’est un pavage du “plan hyperbolique”.
Cette dernière caractérisation est typique de la courbure, comme le lecteur le découvrira dans
un cours de géométrie différentielle.
188
Chapitre 9
Champs de vecteurs
En physique, les forces qui proviennent d’un potentiel sont particulièrement faciles à traiter
entre autres parce que le calcul du travail ne nécessite pas de faire d’intégrale. D’une certaine façon,
l’information de la force est déjà bien contenue dans le potentiel. Ces champs de vecteurs portent
un nom particulier.
La démonstration du résultat classique sur le travail est une conséquence directe du théorème
fondamental du calcul intégral.
Proposition 9.0.2
Soit G : U → R une fonction de classe C 1 et soit γ : [a, b] → Rm telle que Im γ ⊂ U. Alors
Z
∇G · ds = G γ(b) − G γ(a) .
γ
Les théorèmes de Green, Stokes et de la divergence sont des versions en plus grande dimension
de cette simple observation.
189
9.1 - Divergence, rotationnel et laplacien
faire deux définitions du rotationnel selon la dimension (2 ou 3) de l’espace considéré. Tout d’abord
en dimension 2,
Toujours dans l’exemple du vent ci-dessus, une explosion donnerait une région où le champ de
vecteurs aurait une divergence positive forte tandis qu’une implosion donnerait une région où le
champ de vecteurs aurait une divergence fortement négative.
190
Chapitre 9 - C HAMPS DE VECTEURS
rot F(x, y) = − −y
x · ∇G(x, y)
div F(x, y) = −y
x · ∇G(x, y)
rot F(x, y) = 2G(x, y) + xy · ∇G(x, y)
Un résultat important sur ces opérateurs est que la combinaison de certains d’entre eux est nulle.
Proposition 9.1.6
Soit U ⊂ R3 et F : U → R3 un champ de vecteurs C 2 . Alors ∀x ∈ U, ∇·(∇∧F)(x) = div rot F(x) =
191
9.1 - Divergence, rotationnel et laplacien
0.
Soit m = 2 ou 3, soit U ⊂ Rm un ouvert et F : U → R une fonction C 2 . Alors ∀x ∈ U, ∇ ∧
(∇F)(x) = rot gradF = 0.
D ÉMONSTRATION : Cette démonstration se résume à un calcul direct... Il ne sera fait que pour
m = 3.
e1 e2 e3
∇ ∧ (∇F)(x) = Det ∂ ∂ ∂
∂x1 ∂x2 ∂x3
∂F ∂F ∂F
∂x1 (x) ∂x2 (x) ∂x3 (x)
étant donnée que F est de classe C 2 , l’ordre des dérivées est sans importance, et elles se trouvent
toutes présentes avec un signe une fois + et une fois −.
∂ ∂ ∂
∂x1 ∂x2 ∂x3
∇ · (∇ ∧ F)(x) = Det ∂ ∂ ∂
= 0.
∂x1 ∂x2 ∂x3
F1 (x) F2 (x) F3 (x)
En effet, comme l’ordre des dérivées secondes peut s’inverser, le même phénomène se produit.
L’exercice suivant montre l’importance de l’hypothèse sur la régularité C 2 dans le résultat précédent.
192
Chapitre 9 - C HAMPS DE VECTEURS
un rotationnel nul et une divergence nulle sans pour autant être trivial. Il est un peu moins évident
de trouver d’autres champs de vecteurs ayant cette propriété (bien que les exemples 9.1.4 et 9.1.5
en contiennent tous les deux un). De fait, ceux-ci sont nombreux et importants : un tel champ de
vecteurs est équivalent à une fonction holomorphe. ♠
E XERCICE 155: Soit A une matrice 2 × 2, et soit F(x, y) = A xy le champ de vecteurs (une applica-
tion linéaire) associée. Donner rot F et div F en fonction des coefficients de la matrice A. Montrer
que si ils sont tous deux nuls, A2 = c Id où c ∈ R≥0 et Id est la matrice identité.
E XERCICE 156: Soit ı le symbole dénotant une des racines carrée de −1. Soit C l’ensemble des
nombres complexes, c’àd. z ∈ C s’écrit formellement x + ıy où x, y ∈ R. Toute fonction f : U → C (où
U est un ouvert de C) peut s’interpréter comme un champ de vecteurs. En effet, pour f donné soit
ℜ f (x+ıy)
F(x, y) = −ℑ f (x+ıy)
où, si a et b ∈ R, ℜ(a + ıb) = a et ℑ(a + ıb) = b. Montrer que rot F = div F = 0
si et seulement si f est holomorphe. [Indice : écrire les équations de Cauchy-Riemann.]
D ÉMONSTRATION : Soit aa12 le coin inférieur gauche du pavé et bb12 le coin supérieur droit (où
193
9.2 - Théorème de Green et de la divergence, cas simple
P1,+ = {b1 } × [a2 , b2 ] × [a3 , b3 ] P2,+ = [a1 , b1 ] × {b2 } × [a3 , b3 ] P3,+ = [a1 , b1 ] × [a2 , b2 ] × {b3 }
P1,− = {a1 } × [a2 , b2 ] × [a3 , b3 ] P2,− = [a1 , b1 ] × {a2 } × [a3 , b3 ] P3,− = [a1 , b1 ] × [a2 , b2 ] × {a3 }
Alors, les feuilles sont orientées de sorte que la normale de Pi,± pointe dans la direction de ±ei .
Lemme 9.2.2 (Théorème de la divergence, cas du pavé)
Soit P ⊂ R3 un pavé, soit ∂P son bord avec l’orientation canonique et soit F : P → R3 un champ
de vecteurs de classe C 1 . Alors
Z Z
∇ · Fdvol = F · dN.
P ∂P
Les exercices suivants servent à donner des démonstrations alternatives du théorème de Green, l’une
d’entre elles sous des conditions plus faibles.
E XERCICE 157: Soit f : [0, 1] → R une fonction de classe C 2 telle que ∀x ∈ [0, 1], f (x) > 0. Soit D
la région bornée de R2 délimitée par les équations x = 0, x = 1, y = 0 et y = f (x) (dessin de gauche
ci-dessous). Montrer qu’il existe un difféomorphisme C 2 de [0, 1] × [0, 1] vers D dont le jacobien
(i.e. le déterminant de la matrice de Jacobi) est positif. En particulier le théorème de Green est vrai
pour D.
Sans refaire tout le calcul, comment étendre ce résultat au cas où f (1) = 0 ?
194
Chapitre 9 - C HAMPS DE VECTEURS
E XERCICE 158: Voici une manière d’affaiblir les conditions de régularités pour le théorème de
Green. Soit f : [0, 1] → R une fonction continue, strictement décroissante, dérivable sauf en un
nombre fini de points, et telle que ∀x ∈ [0, 1[, f (x) > 0 et f (1) = 0. Soit D la région bornée de R2 ]]
délimitée par les équations x = 0, y = 0, et y = f (x) (dessin de droite ci-dessus). Pour un champ
de vecteurs F de classe C 1 , montrer par calcul direct (en utilisant le théorème de Fubini sur ce
domaine) que
Z Z
F · ds = rot F dvol.
γ D
E XERCICE 159: Vous pouvez supposer connu que les rotations sont des difféomorphismes C ∞ et le
théorème de Jordan. Ce dernier stipule qu’une courbe γ : [0, L] → R2 injective sur l’intervalle ouvert
et fermée (i.e. γ(0) = γ(L)) sépare le plan en deux composantes (une bornée et une non-bornée).
Soit D la partie bornée. Supposons de plus que l’ensemble {t ∈ [0, L] | γ01 (t) = 0 ou γ02 (t) = 0} est
fini. Comment découper l’ensemble D de façon à montrer le théorème de Green pour D (utiliser le
résultat des deux exercices précédents).
E XERCICE 160: Soit P un pavé et φ : P → R une fonction de classe C 2 et F : P → R3 un champ de
vecteur de classe C 1 . Les notations grad φ = ∇φ et div F = ∇ · F seront utilisées.
a. En utilisant l’identité div φ(x)F(x) = grad φ(x) · F(x) + φ(x) div F(x), montrer que
Z Z Z
grad φ(x) · F(x)dvol(x) = φ(x)F(x) · dN − φ(x) div F(x)dvol(x)
P ∂P P
où le premier terme à droite représente la somme des flux de F à travers les différentes
surfaces formant le bord du pavé.
b. Supposons que div grad φ(x) = 0, montrer, en posant F(x) = grad φ(x), que
Z Z
k grad φ(x)k2 dvol(x) = φ(x) grad φ(x) · dN
P ∂P
c. Si de plus ∀x ∈ ∂P, φ(x) = 0, en conclure que ∀x ∈ P, grad φ(x) = 0, puis que φ est constante
et égale à 0.
195
9.3 - Paramétrage et théorème de Stokes
x1
D ÉMONSTRATION : Dans cette démonstration, les éléments de R3 seront écrits xx2 , et ceux de
3
R2 ss12 . Soit σ : [0, L] → ∂P ⊂ R2 une courbe C 1 par morceaux donnant l’orientation canonique de
∂P et telle que γ = Φ ◦ σ (elle existe car Φ est essentiellement un difféomorphisme et γ est C 1 par
morceaux). Alors
Z L
F γ(t) · γ0 (t)dt
R
γ F · ds= par définition
Z0 L 0 T
F Φ ◦ σ(t) · σ1 (t)D1 Φ σ(t) + σ02 (t)D2 Φ σ(t) dtcar γ0 (t) = σ0 (t)Φ∗ γ(t)
=
0 !
Z L
F Φ ◦ σ(t) · D1 Φ σ(t)
= · σ0 (t)dt réécriture.
0 F Φ ◦ σ(t) · D2 Φ σ(t)
Z L
G σ(t) · σ0 (t)dt
= voir déf. de G ci-dessous.
Z0
= G · ds par définition.
σ
!
F Φ(s1 , s2 ) · D1 Φ(s1 , s2 )
G(s1 , s2 ) = .
F Φ(s1 , s2 ) · D2 Φ(s1 , s2 )
L’idée est maintenant de se ramener au théorème de Green pour le pavé P, i.e. de montrer que le
côté gauche est aussi le rotationnel de G sur le pavé. Il s’agit d’un calcul direct, mais pas tout à fait
196
Chapitre 9 - C HAMPS DE VECTEURS
simple.
∂ ∂
rot G(s1 , s2 )= ∂s1 G2 (s1 , s2) − ∂s2 G1 (s1 , s2 ) par définition
= F Φ(s1 , s2 ) · D1 D2 Φ(s1 , s2 ) dérivation du P.S.
h ∂Φ ∂F
i
+∑ (s1 , s2 ) Φ(s1 , s2 ) · D2 Φ(s1 , s2 ) dérivation en chaîne
i∈3 ∂s 1 ∂xi
∂Φi ∂F i
− (s1 , s2 ) Φ(s1 , s2 ) · D1 Φ(s1 , s2 )
∂s2 ∂xi
−F Φ(s1 , s2 ) · D2 D1 Φ(s1 , s2 )
h ∂Fj
= ∑ ∑ D1 Φi (s1 , s2 )D2 Φ j (s1 , s2 ) Φ(s1 , s2 ) développer le P.S.
i∈3 j∈3 ∂xi
∂Fj i
−D2 Φi (s1 , s2 )D1 Φ j (s1 , s2 ) Φ(s1 , s2 )
h ∂F ∂xii
j ∂Fi
= ∑ Φ(s1 , s2 ) − Φ(s1 , s2 ) D1 Φi (s1 , s2 )D2 Φ j (s1 , s2 )
i6= j ∂xi ∂x j
Maintenant, il faut faire un second calcul (plus court). Avant de s’y lancer, il est bon de jeter un oeil
à l’écriture du produit mixte (a · (b ∧ c)). En effet, (∇ ∧ F Φ(s1 , s2 ) ) · NΦ (s1 , s2 ) est égal à
∂F ∂F2 ∂F1 ∂F3 ∂F2 ∂F1
3
Φ(. . .) − Φ(. . .) Φ(. . .) − Φ(. . .) Φ(. . .) − Φ(. . .)
∂x2 ∂x3 ∂x3 ∂x1 ∂x1 ∂x2
Det .
D Φ (s , s )
1 1 1 2 D Φ (s , s ) 1 2 1 D Φ (s , s )
2 1 3 1 2
D2 Φ1 (s1 , s2 ) D2 Φ2 (s1 , s2 ) D2 Φ3 (s1 , s2 )
Or ce déterminant est la même chose que rot G(s1 , s2 ). Mais comme le théorème de Green a été
démontré pour un pavé, l’affirmation de ce théorème s’ensuit.
Z Z h Z i
(∇ ∧ F) · dN = ∑ F · ds. le terme de droite se note F · ds
S γi ∂S
j∈k
Le théorème ci-dessus ne représente pas les conditions de régularité optimales. Si S n’a pas de bord,
le terme de droite se lit alors 0.
Pour passer au théorème de Green plus général, il suffit de constater que si H : P → R2 est un
difféomorphisme(sur sonimage) alors, il se transforme en un paramétrage local Φ : P → R3 défini
H1 (s1 ,s2 )
par Φ(s1 , s2 ) = H2 (s1 ,s2 ) . Ensuite, comme le rotationnel de R2 est cohérent avec celui de R3 et
0
que la normale de Φ pointe précisément dans la bonne direction, le théorème de Green est étendu à
tout domaine difféomorphe à un pavé. Au passage, notons que tout pavé de Rm est difféomorphe à
[0, 1]m
197
9.3 - Paramétrage et théorème de Stokes
Puis, une version pour des domaines un peu plus arbitraire s’obtient par découpage en morceaux.
u
Exemple 9.3.5. Soit Φ : R2 → R3 la surface paramétrée définie par Φ(u, v) = 2 v 2 (c’est le
u +v
paramétrage “naturel”
−y du graphe de F(u, v) = u2 +v2 ). Soit G : R3 → R3 le champ de vecteurs défini
2y
par G(x, y, z) = 2 2 2 . Un calcul simple donne que ∇ ∧ G(x, y, z) = −2x .
x
x +y +z 2
Pour connaître le flux de ∇ ∧ G(x, y, z) à travers Φ Br (0) (l’image par Φ de la boule de rayon r
1 0 −2u
centrée en l’origine), il est possible soit de faire un calcul direct : NΦ (u, v) = 0 ∧ 1 = −2v ,
2u 2v 1
d’où
R R R 2v −2u
Φ|B (0) rot G · dN= Br (0) rot G Φ(u, v) · N Φ (u, v)dvol= Br (0) −2u · −2v dvol
r 2 1
=2πr2 .
R
=2 Br (0) 1dvol
Ou alors, le théorème de Stokes permet de regarder le travail de G le long du bord. Ici le bord de
B (0) ⊂ R2 est orienté par γ(t) = rr cost
rr cost sint où t ∈ [0, 2π], ce qui induit l’orientation σ(t) = Φ γ(t) =
r sint sur le bord de Φ Br (0) . D’où
r 2
R R 2π 0 R 2π −r sint −r sint
σ G · ds= 0 G σ(t) · σ (t)dt= 0 · r cost dt
r cost
2r2 0
=r2 02π dt =2πr2 .
R
Remarque 9.3.7. Ce qui est le plus important à retenir du théorème de Stokes n’est pas tant que
c’est une méthode de calcul parfois plus simple d’un flux (ou d’un travail). Mais plutôt que le flux
d’un rotationnel ne dépend essentiellement pas de la surface choisie. Plus précisément, toutes les
198
Chapitre 9 - C HAMPS DE VECTEURS
surfaces (orientables) qui ont le même bord (et qui sont suffisamment régulières) auront le même
flux (si elles induisent la même orientation sur le bord). Ceci est particulièrement utile dans la
théorie de l’électromagnétisme. ♠
E XERCICE 161: Un planimètre est un dispositif mécanique qui permet de calculer l’aire d’un do-
maine du plan tout simplement en parcourant son bord. Le principe est de calculer le travail du
champ de vecteurs F : R2 → R2 défini par F(x, y) = −y
0 . Soit D un domaine borné du plan. Poser
des conditions sur D, puis montrer que le travail (du champ de vecteurs F le long d’une courbe qui
parcourt le bord de D) donnera bien l’aire de D.
E XERCICE 162: Soit V un volume dans R3 tel que ∂V = S est une surface régulière admettant
un paramétrage régulier et surjectif hors d’un ensemble négligeable, Φ : D → R3 . Montrer que,
R
∀a, b, c ∈ R tels que a + b + c = 1, vol(V ) = D G(s,t) dvol(s,t) où
aΦ1 (s,t) bΦ2 (s,t) cΦ3 (s,t)
G(s,t) = Det D1 Φ1 (s,t) D1 Φ2 (s,t) D1 Φ3 (s,t)
E XERCICE 163: Soit V un volume dans R3 tel que ∂V = S est une nappe régulière admettant
un paramétrage
xrégulier et surjectif hors d’un ensemble négligeable, Φ : D → R3 . Montrer que,
1R
vol(V ) = 3 S yz · dN.
Étant donné un polyèdre régulier (centré en l’originie), en déduire que, si la distance de l’ori-
nA
gine au centre d’une face ets 1, le volume est où A est l’aire d’une face et n le nombre de
3
2
faces .
Parenthèse : Ici m = 2 ou 3, mais le résultat reste vrai (mutatis mutandis) pour des m > 3.
D ÉMONSTRATION : L’idée est de construire V de la seule manière possible, puis d’utiliser l’annu-
lation du rotationnel et la simple connexité pour montrer que cette définition est conséquente.
2. n = 4, 6, 8, 12 ou 20, pour (respectivement) le tétraèdre (face triangulaires, trois faces se recontrent en un sommet),
le cube (face carré, trois faces se recontrent en un sommet), l’ocaèdre (face triangulaires, quatre faces se recontrent en
un sommet), le dodécaèdre (face pentagonales, trois faces se recontrent en un sommet) et l’icosaèdre (faces triangulaires,
cinq faces se recontrent en un sommet)
199
9.4 - Simple connexité et intégrabilité
Soit x0 fixé. Alors V (x) = γ F · ds où γ : [0, 1] → U est une courbe C 1 allant de x0 à x. Pour voir
R
que ceci est bien défini, il faut vérifier que si η : [0, 1] → U est une autre telle courbe, alors la valeur
de V (x) obtenue est la même. Soit σ : [0, 1] → U définie par
(
γ(2t) si t ∈ [0, 1/2];
σ(t) =
η(2 − 2t) si t ∈ [1/2, 1].
Alors σ est une courbe fermée. Par simple connexité, elle est réalisée par le bord d’un disque (une
surface orientée avec l’orientation induite), ici noté par le paramétrage Φ. Ainsi
Z Z Z Z
F · ds − F · ds = F · ds = rot F · dN = 0.
γ η σ Φ
Reste à vérifier que ∇V = F. Pour ce faire, il suffit de voir que DiV (x) = Fi (x). Soit φ : [0,t] → U la
courbe définie par φ(s) = x + sei , alors φ0 (s) = ei et
Z Z t
V (x + tei ) −V (x) = F · ds = Fi (x + sei )ds =: f (t).
φ 0
Par les exercices 23 et 43, l’assertion si dessus est optimale. En effet, le champ de vecteur donné
par le gradient de T étendu par continuité est un champ de vecteur lisse sur R2 r {0}. Cependant,
T lui-même ne peut pas être étendu par continuité sur { xy ∈ R2 | x = 0 et y ≤ 0}. Il est impossible
de trouver une fonction continue G qui le ferait pour une raison simple : soit γ(t) = cost
sint , alors le
travail le long de γ est toujours positif, et ainsi G(γ(2π)) 6= G(γ(0)). Ceci contredirait γ(0) = γ(2π).
200
Épilogue, alias Chapitre 10
Ce dernier chapitre est une forme d’apologie de la dérivée directionnelle (ou de Fréchet). En
effet, le chapitre 3 a montré que cette manière de procéder amène souvent à calculer la dérivée
d’une fonction qui n’est même pas continue. Cependant, la plupart des problèmes naturels se passe
dans des espaces de dimension infinie. En voici quelques uns qui ont été touché lors de ce cours :
— Étant donné deux points, quelle est la courbe qui a la propriété qu’un objet qui glisse sans
frottement se rend plus rapidement possible d’un point à l’autre ?
— Quelle est la forme d’un pendule dont la période d’oscillation ne dépend pas de l’amplitude ?
— Étant donné deux demi-droites, comment relier leur extrémités de sorte que la variation de
courbure soit minimale ?
— Étant donné un paramétrage Φ : D → R3 et deux points dans D, quelle est la courbe γ :
[a, b] → D qui relie les deux points et telle que la longueur de Φ ◦ γ est minimale ? (i.e. quel
est le chemin le plus court sur une surface ?)
— Étant donné une courbe dans R3 , quelle est la surface qui possède ce bord et dont l’air est
minimale ?
Toutes ces questions sont probablement beaucoup plus naturelles au néophyte que la plupart des
choses qui ont été abordées jusqu’ici. Pourtant les méthodes ne s’appliquent pas : l’espace de toutes
les déformations possibles d’une courbe ou d’une surface est aussi grand que l’espace de toutes les
fonctions (non-dénombrable) 1 . Cependant, une chose reste facile à calculer : la dérivée partielle.
En effet, supposons qu’il nous est donné F une application (e.g. courbe paramétrée), et que la
quantité à minimiser est E . Cette quantité dépendra typiquement de F (définie sur un fermé K) et
de ses dérivées. Dans la plupart des cas il y a des conditions au bord à vérifier : F sur le bord de
K doit prendre certaines valeurs. Alors pour savoir si F est un maximum ou minimum de E , l’idée
naturelle est de regarder G 7→ E (F + G) où G est une autre application telles que G est nulle sur le
bord de K. De la sorte, F + G satisfait les conditions au bord. De plus, avec un peu de chance, la
limite
lim E (F + tG) − E (F)
t→0 t
1. Bien sûr, avec un peu d’analyse fonctionnelle, il deviendra plus facile de parler de la dérivée de Gâteau.
201
10.1 - Géodésiques et longueur minimale
où γ : [a, b] → D est une courbe paramétrée C 2 avec γ(a) = p et γ(b) = q. Pour simplifier les calculs,
c’est plutôt la fonction
Z b
E (γ) = k(Φ ◦ γ)0 (s)k2 ds
a
dont les points critiques seront cherchés. Un argument (qui est ici balayé en fin de section) permet
de montrer que les points critiques de ces deux “applications” sont les mêmes (mais la seconde est
plus régulière, car sans racine carrée).
L’ensemble des déformations C 1 de γ est donné par
En effet, pour t assez petit l’image de γ + tσ sera toujours dans D. Ainsi, si γ est un point critique :
pour tout σ ∈ U,
d b
Z 0
e0 (t) = k Φ ◦ (γ + tσ) (s)k2 ds.
dt a
Pour quand même traiter les choses dans une certaine généralité, il est de bon bon de poser
0
L(γ, γ0 ) = k Φ ◦ γ (s)k2 = γ0 (s)T QΦ,γ(s) γ0 (s).
Puis, en interchangeant l’ordre de la dérivation et de l’intégration (c’est possible car toutes les
fonctions et leurs dérivées sont continues et le domaine d’intégration est compact),
Z b Z b
0 d 0 0 ∂L ∂L
e (0) = L(γ + tσ, γ + tσ )ds = ∑ (γ, γ0 )σi + 0 (γ, γ0 )σ0i
a dt a i ∂γi ∂γi
202
Épilogue, alias Chapitre 10 - L E CALCUL DES VARIATIONS
Ce qui est embêtant à cet étape, c’est que σ et σ0 apparaissent alors qu’elles sont reliées de manière
peu claire. Une petite astuce-clef est l’intégration par partie. Ici cela s’utilise en regardant
Z b
d ∂L
σi 0 (γ, γ0 ) ds
a ds ∂γi
qui vaut 0 car σ(a) = σ(b) = 0. Mais, en utilisant la règle de Leibniz (i.e. de dérivation des produits) :
Z b Z b
d ∂L 0 ∂L 0 0
0= σi 0 (γ, γ ) ds + 0 (γ, γ )σi ds.
a ds ∂γi a ∂γi
Ainsi : Z b
∂L d ∂L
e0 (0) = ∑ σi (γ, γ0 ) − (γ, γ 0
)
a i ∂γi ds ∂γ0i
∂L d ∂L
(γ, γ0 ) − (γ, γ0 ) = 0
∂γi ds ∂γ0i
D ÉMONSTRATION : Il ne reste plus qu’à montrer que si h est une fonction telle que ab h(s) f (s)ds =
R
0 pour tout f de classe C 2 sur [a, b] et nulle au bord, alors h ≡ 0. Si h n’est pas identiquement
nulle, il existe un point x0 ∈ [a, b] avec h(x0 ) > 0 (ou < 0 mais l’argument est identique). Comme
h est continue, il est même vrai que h(s) > 0 sur un petit intervalle contenant x0 , disons [a0 , b0 ].
Soit f (s) = (s − a0 )3 (b0 − s)3 si s ∈ [a0 , b0 ] et f (s) = 0 sinon (i.e. s ∈ [a, b] r [a0 , b0 ]). Un petit
calcul montre que f est de classe C 2 sur [a, b] et positive sur [a0 , b0 ]. Alors ab h(s) f (s)ds > 0, une
R
contradiction.
En revanant à L(γ, γ0 ) = γ0 (s)T QΦ,γ(s) γ0 (s), il faut calculer trois dérivées. La première est
2
0 = ∑ γ0j γ0k ∂γ∂i D j Φ γ(s) · Dk Φ γ(s)
∂L
∂γi (γ, γ )
j,k=1
2
0 0
= ∑ γ j γk Di D j Φ γ(s) · Dk Φ γ(s) + D j Φ γ(s) · Di Dk Φ γ(s)
j,k=1
2
= 2 ∑ γ0j γ0k Di D j Φ γ(s) · Dk Φ γ(s)
j,k=1
La seconde est
2 2
(γ, γ0 ) = ∑ γ0k Di Φ γ(s) · Dk Φ γ(s) + ∑ γ0j D j Φ γ(s) · Di Φ γ(s)
∂L
∂γ0i
k=1 j=1
2
= 2 ∑ γ0k Di Φ γ(s) · Dk Φ γ(s)
k=1
Puis,
2 2 2
d ∂L 0 = 2 ∑ γ00k Di Φ γ(s) · Dk Φ γ(s) + 2 ∑ ∑ γ0k γ0j D j Di Φ γ(s) · Dk Φ γ(s)
ds ∂γ0i (γ, γ )
k=1 k=1 j=1
2 2
+2 ∑ ∑ γ0k γ0j Di Φ γ(s) · D j Dk Φ γ(s) .
k=1 j=1
203
10.2 - Surfaces minimales et aire minimale
Après ces calcul, la condition (8.5.5) est retrouvée. Autrement dit, les géodésiques sont des points
critiques de la longueur. Il est assez facile de se convaincre qu’il ne peut pas y avoir de courbe
qui maximise la longueur (il est toujours possible de déformer une courbe pour qu’elle ne soit plus
rectifiable, et ainsi que sa longueur soit infinie). De fait, comme déjà remarqué, les géodésiques
ne sont pas toujours des minima de la longueur (voir les paragraphes suivant l’exemple 8.5.6). Par
contre, une courbe qui minimise la longueur (et qui est au moins C 2 ) est une géodésique.
√
Un point reste à éclaircir : que L et L donne le même résultat. Un calcul direct n’est pas très
√ R √
convaincant : l’équation de L est définitivement plus compliquée. Par contre, ab L est invariant
par reparamétrage, ainsi il est possible de supposer que la courbe γ est paramétrée par la longueur
√
∂ L 1
√ ∂√L √
d’arc. Ensuite ∂q = 2 L ∂q . Mais si γ est paramétrée par la longueur d’arc L = 1. Pour finir
de se convaincre il faut encore montrer que les solutions de (8.5.5) sont de vitesse constante. Mais
ceci a déjà été à lors de la discussion de cette équation. Ce qui montre que les deux problèmes
variationnels ont les même point critiques.
Il y a une autre astuce qui marche de manière plus générale pour montrer que les solutions
p
de l’équation d’Euler-Lagrange pour L auront L(γ) constant. En effet, comme L est une fonction
homogène de degré m = 2 en γ0 , ∑i ∂γ ∂L 0
0 γi = mL (c’est le théorème d’Euler sur les fonctions homogènes
i
ou corollaire 3.4.6). Fort de ceci, si γ satisfait l’équation d’Euler-Lagrange (et si L ne dépend pas de
s directement, ce qui est aussi le cas) :
∂L 0
d d
m ds L = ds ∑i ∂γ0 γi = ∑i ds ∂γ0 γ0i + ∑i ∂γ
d ∂L ∂L 00
0 γi
i i i
∂L 0 ∂L 00 d
= ∑i ∂γ γ + ∑i ∂γ
i i
0 γi = ds L.
i
Ainsi, si m 6= 1 (pour la longueur m = 2), tout point critique aura L(γ, γ0 ) constante.
204
Biblographie
205
Index
C 0 , 37 surface, 171
C 1 , 37 angle, 4
C k , 37 application, 11
C ω , 85 analytique, 85
C ∞ , 37 continue, 19
∇, voir gradient contractante, 101
∂
∂xi , voir dérivée partielle de transition, 160
dF, voir dérivée, 29 linéaire, 26
Di , voir dérivée partielle
base canonique, 2
Du , voir dérivée directionnelle
bord, 15
n, vii
borné, 16
πi , voir projection canonique
fonction, 138
Pen , voir plan tangent à un ensemble de niveau
boule, 14, 15
P par , voir plan tangent à un paramétrage
Pvit , voir plan tangent des vecteurs vitesse centre de courbure, 78
Rn , 1 champ de vecteurs, 11
Ten , voir espace tangent à un ensemble de niveau conservatif, 189
T par , voir espace tangent à un paramétrage classe
Tvit , voir espace tangent des vecteurs vitesse C 0 , 37
x, 1 C 1 , 37
C k , 37
0, voir origine
C ω , 85
F −1 , voir image réciproque
C ∞ , 37
F [k] , voir dérivée d’ordre k
compact, 18
◦, voir composition
composition, vii
∂, voir bord
connexe par arc, 152
S̊, voir intérieur
connexité
accélération, 76 par arc, 152
adhérence, 15 continuité, 19
admissible uniforme, 140
ensemble, 143 contrainte, 116
fonction, 139, 143 coordonnées, 1
improprement, 152 courbe
aire développée, 78
206
INDEX
équivalente, 56 linéaire, 42
fermée, 80 négligeable, 139
paramétrée, 11 symétrique [centralement], 46
rectifiable, 61 espace
régulière, 58 tangent
simple, 80 au graphe, 48
courbure niveau, 43
d’une courbe, 77 paramétrage, 48
d’une surface, 177 vitesse, 46
vectoriel, 2, 8
découpage extension
pavé, 138 par continuité, 20
définie extremum, 87
négative, 90
positive, 90 fermé, 15, 16
degré, 83 feuille, 137
d’un recouvrement, 134 flux, 173
multi-, 83 fonction, 11
dérivabilité, 27 admissible, 139, 143
dérivée, 27 analytique, 85
composée, 33 bornée, 138
d’ordre k, vii caractéristique, 143
de Fréchet, 27 continue, 19
de Gâteaux, 54 coordonnée, 11
directionnelle, 39 harmonique, 38, 192
partielle, 24 holomorphe, 193
développement de Taylor, 85 homogène, 35
dimension polynomiale, 84
sous-variété, 113 forme fondamentale
discontinuité première, 170
irréparable, 19 seconde, 177
réparable, 19 forme quadratique, 90
distance, 14 du lagrangien, 128
division d’intervalle, 59
géodésique, 179
élément de longueur, 170 gradient, 29
ensemble graphe, 12
admissible, 143
affin, 42 harmonique, 38, 192
de niveaux, 12 hessien[ne], 91
homogène, 46 holomorphe, 193
207
INDEX
image mutli-degré, 83
réciproque, vii multiplicateurs de Lagrange, 118
improprement admissible, 152 multiplication scalaire, 1
Inégalité de Cauchy-Schwarz, 4
négligeable, 139
intégrabilité, 138
non-semi-définie, 90
intégrable, 138
norme, 4
sur un domaine général, 143
intégrale, 138 orientabilité, 157
curviligne, 74 orientation
de surface, 171 courbe, 166
impropre, 152 paramétrage, 166
intérieur, 15 surface, 157
origine, 2
jacobienne, voir matrice de Jacobi
orthogonalité, 3, 4
lagrangien, 118 ouvert, 15, 16
largeur
paramétrage, 12, 56
d’un découpage, 138
application de transition, 160
d’un rectangle, 137
global, 113
limite, 17
local, 111
linéarité, 26
longueur d’arc, 69
Lipschitz, 61
polaire, 57
longueur
pavé, 137
courbe paramétrée, 61, 64
plan
courbe sur une surface, 170
tangent
matrice, 26 au graphe, 48
de Hesse, 91 niveau, 43
de Jacobi, 30 paramétrage, 48
maximum vitesse, 46
absolu, 21 point
local, 87 d’accumulation, 15
MdMdL, voir Multiplicateurs de Lagrange, 119 de bord, 15
mineure, 91 critique, 89, 118
principale, 91 fixe, 101
minimum frontière, 15
absolu, 21 d’inflexion, 89
local, 87 intérieur, 15
Möbius isolé, 15
ruban de, 163 limite, 15
monotone regulier, 111
courbe paramétrée, 63 régulier, 111
208
INDEX
torsion
d’une courbe, 79
trace
209