Calcul Differentiel
Calcul Differentiel
Calcul Differentiel
18 Calcul différentiel
« Les mathématiques sont un jeu que l’on exerce selon des règles simples en manipulant
des symboles ou des concepts qui n’ont en soi, aucune importance particulière. »
David Hilbert (1862 – 1943)
Plan de cours
Dans tout ce chapitre, E et F désignent des espaces vectoriels normés de dimension finie. On cherche à étendre
la notion de dérivabilité (relative aux fonctions d’une variable réelle) aux fonctions plus généralement définies
sur un ouvert U de E et à valeurs dans F . Le choix de travailler sur un ouvert permet de s’assurer que si a ∈ U ,
alors, pour ∥h ∥ suffisamment petit, a + h ∈ U ; on donne ainsi un sens à l’écriture f (a + h ) − f (a ).
Comme nous le verrons tout au long de ce chapitre, le calcul différentiel se construit autour d’un grand principe
qu’il est utile d’avoir dès à présent en tête :
accroissement terme linéaire par rapport terme
= +
de la fonction à l’accroissement de la variable correctif
f : U ⊂ R2 −→ R
(x , y ) 7−→ f (x , y )
Les lignes de niveau, intersections de S et des plans d’équations z = k , permettent de visualiser la surface.
A – Limites et continuité
On munit R2 de la norme euclidienne notée ∥ · ∥. Rappelons que f admet une limite ℓ ∈ R en (x0 , y0 ) ∈ U si :
Pour calculer une telle limite en (x0 , y0 ), il ne suffit pas de faire tendre x vers x0 puis y vers y0 ou vice-versa.
Exemple
2x y
La quantité f (x , y ) = n’admet pas de limite en (0, 0) :
x2 + y 2
y
et pourtant, f (x , x ) = 1 −−−→ 1. Plus généralement,
x →0∗
Attention, l’existence d’une limite commune dans toutes les directions ne garantit pas l’existence d’une limite.
Exercice 1
x2y x2y
Trouver les limites en (0, 0), lorsqu’elles existent, de g (x , y ) = et h (x , y ) = .
x2 + y 2 x4 + y 2
Rappelons de plus que l’application f est dite continue en (x0 , y0 ) ∈ U si lim f (x , y ) = f (x0 , y0 ) :
(x ,y )→(x0 ,y0 )
On dit que f est continue sur U si f est continue en tout point de U . La somme, le produit, la composée et le
quotient dont le dénominateur ne s’annule pas de fonctions continues sont des fonctions continues.
Pour les mêmes raisons que celles évoquées pour les limites, si f est continue alors les applications partielles
f x : y 7→ f (x , y ) et f y : x 7→ f (x , y ) le sont également mais la réciproque est fausse.
y
y = f (x ) Si f : R → R est dérivable sur R, la formule de Taylor-
Young nous permet d’écrire en tout point x0 ∈ R :
On considère à nouveau une fonction f définie sur un ouvert U de R2 , à valeurs dans R et (x0 , y0 ) ∈ U .
∂f ∂f
À l’image de f , et , également notées ∂1 f et ∂2 f , sont des fonctions de deux variables à valeurs réelles.
∂x ∂y
Ces dérivées partielles ne sont que des cas particuliers de ce qu’on appelle les dérivées directionnelles de f .
f (x0 + t a , y0 + t b ) − f (x0 , y0 )
Du (f )(x0 , y0 ) = lim
t →0 t
Les dérivées partielles sont ainsi les dérivées directionnelles de f dans les directions privilégiées (1, 0) et (0, 1).
Exemples
∂f ∂f
∀(x , y ) ∈ R2 , (x , y ) = 6x + 5 sin(y ) et (x , y ) = 5x cos(y )
∂x ∂y
∂f ∂f
f (x0 + h , y0 + k ) = f (x0 , y0 ) + (x0 , y0 ) · h + (x0 , y0 ) · k + o (∥(h , k )∥)
(h ,k )→(0,0) ∂x ∂y
La surface d’équation z = f (x , y ) admet alors un plan tangent 1 en tout point (x0 , y0 , z 0 ) tel que z 0 = f (x0 , y0 ).
Celui-ci a pour équation :
∂f ∂f
z = f (x0 , y0 ) + (x0 , y0 ) · (x − x0 ) + (x0 , y0 ) · (y − y0 )
∂x ∂y
∂f ∂f
Cette équation est de la forme a (x − x0 ) + b (y − y0 ) + c (z − z 0 ) = 0 avec a = (x0 , y0 ), b = (x0 , y0 ) et c = −1.
∂x ∂y
∂f ∂f
Le vecteur (x0 , y0 ), (x0 , y0 ), −1 est normal au plan tangent.
∂x ∂y
1. il sera défini dans un cadre plus général dans la section suivante
Exemple
∂f −x0 ∂f −y0
(x0 , y0 ) = q et (x0 , y0 ) = q
∂x 1 − x02 − y02 ∂y 1 − x02 − y02
1
1
p
z = p + 0 · (x − 0) + (−1) · y − p c’est-à-dire : y +z = 2
2 2
Proposition 18.7
Le gradient au point (x0 , y0 ) est orthogonal à la ligne de niveau passant par (x0 , y0 ).
Le gradient indique en outre la ligne de plus grande pente. Voici une illustration de ces deux propriétés pour
une certaine fonction f : R2 → R de classe C 1 .
3 – Notations différentielles
Démonstration
γ est de classe C 1 sur I , donc x et y sont dérivables et pour tout t ∈ I :
(f ◦ γ)(t + h ) − (f ◦ γ)(t ) = f (x (t + h ), y (t + h )) − f (x (t ), y (t ))
= f (x (t ) + h x ′ (t ) + o(h ), y (t ) + h y ′ (t ) + o(h )) − f (x (t ), y (t ))
h →0 | {z } | {z }
=h ′ =k ′
∂f ∂f p
(x (t ), y (t )) · h ′ +
Or f (x (t ) + h ′ , y (t ) + k ′ ) = f (x (t ), y (t )) + (x (t ), y (t )) · k ′ + o( h ′2 + k ′2 ). D’où,
h →0 ∂x ∂y
∂f ∂f
′ ′
(f ◦ γ)(t + h ) − (f ◦ γ)(t ) = x (t ) (x (t ), y (t )) + y (t ) (x (t ), y (t )) · h + o(h )
h →0 ∂x ∂y ■
Exercice 2
Montrer que t 7→ f (cos(t ), sin(t )) est de classe C 1 sur R et calculer sa dérivée, avec f ∈ C 1 (R2 ; R).
Exemple
Si f : R2 → R est de classe C 1 , il en va de même pour F : (r, θ ) 7→ f (r cos(θ ), r sin(θ )) et,
∂F ∂f ∂f
∀(r, θ ) ∈ R2 , (r, θ ) = cos(θ ) (r cos(θ ), r sin(θ )) + sin(θ ) (r cos(θ ), r sin(θ ))
∂r ∂x ∂y
∂F ∂f ∂f
∀(r, θ ) ∈ R2 , (r, θ ) = −r sin(θ ) (r cos(θ ), r sin(θ )) + r cos(θ ) (r cos(θ ), r sin(θ ))
∂θ ∂x ∂y
∂ 2f ∂ 2f
∀(x0 , y0 ) ∈ U , (x0 , y0 ) = (x0 , y0 )
∂ x∂ y ∂ y∂ x
Cette dernière formule rendra de précieux services dans l’étude des extrema d’une fonction numérique (se
reporter à la dernière section du chapitre).
f (x ) = f (x1 , . . . , xp ) = (f1 (x ), . . . , fn (x ))
Notons que cette identification est toujours possible moyennant le choix d’une base de E et d’une base de F :
p
X n
X
x= xj ej et f (x ) = fi (x )ei′
j =1 i =1
Exemple
Soit f : R2 −→ R3
(u , v ) 7−→ (cos(u + v ), u − v, u 2 ev )
u 7→ (cos(u + v ), u − v, u 2 ev ) et v 7→ (cos(u + v ), u − v, u 2 ev )
(u , v ) 7→ cos(u + v ), (u, v ) 7→ u − v et (u , v ) 7→ u 2 ev
A – Différentielle
f (a + h ) = f (a ) + ϕ(h ) + o(∥h ∥)
h →0
Si l’application ϕ existe, elle est unique et est alors appelée différentielle de f au point a , mais aussi
application linéaire tangente à f en a . On la note dfa ou df (a ).
L’existence d’un développement limité à l’ordre 1 relève ainsi de la définition même de la différentiabilité :
f (a + h ) = f (a ) + d fa (h ) + o(∥h ∥) = f (a ) + d f (a ) (h ) + o(∥h ∥)
h →0 h →0
Au final, une fonction différentiable en un point est une fonction qui vérifie notre grand principe :
accroissement terme linéaire par rapport terme
= +
de la fonction à l’accroissement de la variable correctif
Il arrive parfois que l’on écrive dfa (h ) = df (a ) (h ) = d f (a ) · h . Cette dernière notation fait sens quand on
raisonne en termes matriciels : c’est le produit d’une matrice de taille n × p par un vecteur colonne de taille p .
Rappelons enfin que par définition, o(∥h ∥) = ∥h ∥ϵ(h ) où ϵ : E → F avec ϵ(h ) −−−→ 0F .
h →0E
Démonstration
Justifions, sous réserve d’existence, l’unicité de la différentielle de f en un point a ∈ U . Supposons que :
∥Φ(h )∥
Alors, Φ = ϕ − ψ est linéaire et vérifie Φ(h ) = o(∥h ∥), c’est-à-dire −−→ 0. Ceci signe la nullité de Φ.
h →0 ∥h ∥ h →0
∥Φ(t x )∥
Soit en effet x ∈ E non nul. En introduisant t ∈ K∗ , par linéarité, ∥Φ(x )∥ = ∥x ∥ · −−→ 0. ■
∥t x ∥ t →0
Exemples
Proposition 18.12
Si f : U ⊂ E → F est différentiable en a ∈ U , alors f est continue en a .
Démonstration
Si f est différentiable en a , f (a + h ) − f (a ) = d fa (h ) + o(∥h ∥) −−−→ dfa (0E ) = 0F , par continuité de dfa en
h →0 h →0E
tant qu’application linéaire définie sur un espace normé de dimension finie. ■
Pour justifier quelques règles de calcul sur les différentielles en un point, nous aurons, par exemple, besoin
d’observer que d fa (o(∥h ∥)) = o(∥h ∥) ou bien que o(∥dfa (h )∥) = o(∥h ∥). Montrons plus généralement que
h →0 h →0
pour toute application linéaire ϕ, ϕ(o(∥h ∥)) = o(∥h ∥) et o(∥ϕ(h )∥) = o(∥h ∥). En dimension finie,
h →0 h →0
(i) ϕ est continue en 0 donc ϕ(o(∥h ∥)) = h ϕ(ϵ(h )) = o(∥h ∥) puisque ϕ(ϵ(h )) −−→ ϕ(0) = 0.
h →0 h →0
(ii) ϕ est linéaire donc lipschitzienne. Il existe C > 0 tel que pour tout h ∈ E , ∥ϕ(h )∥ ⩽ C ∥h ∥ d’où la relation
souhaitée : o(∥ϕ(h )∥) = o(∥h ∥).
h →0
Démonstration
Prouvons la deuxième assertion. Par différentiabilité de f en a et de g en f (a ),
(g ◦ f )(a + h ) = g (f (a ) + d fa (h ) + o(∥h ∥)) = g (f (a )) + dg f (a ) (k ) + o(k ) = g (f (a )) + dg f (a ) ◦ d fa (h ) + o(∥h ∥)
h →0 | {z }
=k
Par unicité de la différentielle, g ◦ f est différentiable en a et d(g ◦ f )a = dg f (a ) ◦ d fa . ■
Exercice 3
Soient f , g : U ⊂ E → R différentiables en a .
(i) Montrer que f × g est différentiable en a et déterminer la différentielle en ce point.
1
(ii) On suppose de plus que f (a ) ̸= 0. Montrer que f est différentiable en a .
Nous disposons en fait de la propriété plus générale suivante (que nous n’utiliserons guère).
Proposition 18.14
Si M : F n → R est une application multilinéaire et si f1 , . . . , fn : E → F sont différentiables en a ∈ E ,
n
X
M (f1 , . . . , fn ) est différentiable en a et d(M (f1 , . . . , fn ))a = M (f1 (a ), . . . , fk −1 (a ), d(fk )a , fk +1 (a ), . . . , fn (a )).
k =1
d f : U −→ L (E , F )
a 7−→ d f (a ) = d fa
Exemple
Si f : E → F est linéaire, f est différentiable et sa différentielle est constante : ∀a ∈ E , d f (a ) = f .
Exercice 4
Montrer que l’application (x , y ) 7→ x 2 − y 2 définie sur R2 est différentiable en tout point (a , b ) ∈ R2 et calculer
sa différentielle en (a , b ). Faire alors le lien avec les dérivées partielles de f en (a , b ).
f (a + t u) − f (a )
Du (f )(a ) = lim
t →0 t
Quand une fonction est différentiable, elle est dérivable dans toutes les directions.
Proposition 18.17
Si f est différentiable en a alors f est dérivable en a selon u pour tout vecteur u ∈ E et Du (f )(a ) = d fa (u ).
Si E est muni d’une base (e1 , . . . , ep ), on peut définir les dérivées partielles de f qui sont des dérivées selon des
directions privilégiées.
∂f f (a + t e j ) − f (a ) f (a 1 , . . . , a j −1 , a j + t , a j +1 , . . . , a p ) − f (a )
(a ) = lim = lim
∂ xj t →0 t t →0 t
∂f
∀ j ∈ ⟦1, p ⟧, (a ) = dfa (e j )
∂ xj
!
p p p
X X X ∂f
Remarquons alors que par linéarité de dfa , dfa (h ) = dfa hj ej = h j d fa (e j ) = hj (a ).
j =1 j =1 j =1
∂ xj
En notant (abusivement) dx j les applications h 7→ h j ,
p
∂f ∂f X ∂f
d fa = (a )dx1 + · · · + (a )dxp = (a )dx j
∂ x1 ∂ xp j =1
∂ xj
Ce résultat est essentiel : il permet de justifier facilement la différentiabilité d’une fonction, à la seule condition
d’existence et de continuité des dérivées partielles (on obtient même en prime la continuité de la différentielle).
∂f ∂f
(x ) − (a ) = df x (e j ) − dfa (e j ) ⩽ df x − dfa · ∥e j ∥ −−→ 0
∂ xj ∂ xj F
F op x →a
⇐= Supposons maintenant l’existence et la continuité des dérivées partielles. Il s’agit de prouver que f
est différentiable en tout point a ∈ U et de justifier la continuité de la différentielle.
X p
Soient a ∈ U et h = h j e j tel que a + h ∈ U . Par dérivabilité de f suivant ep ,
j =1
! ! !
p p −1 p −1
X X ∂f X
f (a + h ) = f a+ hj ej = f a+ hj ej + hp a+ h j e j + o(∥h ∥)
j =1 j =1
∂ xp j =1
!
p −1
∂f X ∂f
Par continuité de en a , on obtient f (a + h ) = f a+ h j e j + hp (a ) + o(∥h ∥).
∂ ep j =1
∂ xp
p
∂f X
De proche en proche, f (a + h ) = f (a ) + hj (a ) + o(∥h ∥). f est bien différentiable en a et
h →0
j =1
∂ xj
p
X ∂f
d fa (h ) = hj (a ). Justifions désormais la continuité de la différentielle. Soit x ∈ U .
j =1
∂ xj
p
X ∂f ∂f ∂f ∂f
∀h ∈ E , ∥d f x (h ) − dfa (h )∥F ⩽ |h j | · (x ) − (a ) ⩽ ∥h ∥ · max (x ) − (a )
j =1
∂ xj ∂ xj F
1⩽ j ⩽p ∂ xj ∂ xj F
∂f ∂f ∂f
Ainsi, ∥df x − dfa ∥op ⩽ max (x ) − (a ) −−→ 0 par continuité des . ■
1⩽ j ⩽p ∂ xj ∂ xj F
x →a ∂ xj
Exercice 5
Montrer que l’application (x , y ) 7→ x 2 − y 2 définie sur R2 est de classe C 1 et déterminer sa différentielle.
∂f
Attention, les notations sont trompeuses ! ne désigne pas la dérivée d’une expression (ou d’une « grandeur »)
∂y
par rapport à y mais la dérivée d’une fonction par rapport à sa seconde variable. C’est une simple convention ;
on note parfois cette dérivée partielle ∂2 f pour alléger les calculs et lever toute ambiguïté.
Concluons ce paragraphe en mentionnant l’exemple d’une fonction qui admet des dérivées directionnelles
dans toutes les directions sans pour autant être différentiable (et encore moins C 1 !).
Exemple
Considérons la fonction :
2
x y si (x , y ) ̸= (0, 0)
f : (x , y ) 7→ x 2 + y 2
0 si (x , y ) = (0, 0)
f (0 + t a , 0 + t b ) − f (0, 0) a 2b a 2b
∀(a , b ) ̸= (0, 0), ∀t ∈ R∗ , = −−→
t a 2 + b 2 t →0∗ a 2 + b 2
∂f ∂f
En particulier, (0, 0) = (0, 0) = 0. La dérivée directionnelle suivant la direction (1, 1) vaut 21 .
∂x ∂y
∂f ∂f
• Si f était différentiable en (0, 0), on aurait d f(0,0) (h1 , h2 ) = h1 (0, 0)+h2 (0, 0) = 0. Et pourtant, la dérivée
∂x ∂x
directionnelle suivant la direction (1, 1) n’est pas nulle.
f (x ) = f (x1 , . . . , xp ) = (f1 (x ), . . . , fn (x ))
∂ fi
On suppose f de classe C 1 . Les fonctions sont alors définies et continues pour tout (i , j ) ∈ ⟦1, n ⟧ × ⟦1, p ⟧.
∂ xj
Ce sont des fonctions définies sur Rp et à valeurs dans R.
∂ f1 ∂ f1
(x ) . . . (x )
∂ x1 ∂ xp
.. ..
J f (x ) =
. .
∂ f ∂ fn
n
(x ) . . . (x )
∂ x1 ∂ xp
Exemple
Soit f : (x , y , z ) 7→ (2x + y z , cos(y ) + x 2 ). L’application
est de classe
C 1 sur R3 donc d f existe en tout point
2 2 0
de R3 . La jacobienne au point (1, 0, 2) est J f (1, 0, 2) = .
2 0 0
Ainsi, df(1,0,2) : R3 −→ R2
(x , y , z ) 7−→ (2x + 2y , 2x )
∀x ∈ E , Jg ◦ f (x ) = Jg (f (x )) × J f (x ) puisque d(g ◦ f ) x = dg f (x ) ◦ d f x
Ce produit matriciel nous permet de retrouver la fameuse règle de la chaîne (essayez !).
∂f ∂f
p
d fa ∈ L (R ; R) et J f (a ) = MatB (d fa ) = (a ) · · · (a )
∂ x1 ∂ xp
On peut définir le gradient de f au point a au moyen de ses coordonnées dans la base B en posant :
∂f
(a )
∂ x1
.
∇ f (a ) =
..
∂f
(a )
∂ xp
f (a + h ) = f (a ) + 〈∇f (a ), h 〉 + o(∥h ∥)
h →0
Il est également possible de définir le gradient de manière intrinsèque, sans l’usage des coordonnées et donc
d’une base de E , à l’aide du théorème de représentation de Riesz.
Définition 18.21
Soit f : U ⊂ E → R différentiable en a . L’application d fa étant une forme linéaire, il existe un vecteur
appelé gradient de f en a – et noté ∇ f (a ) – tel que pour tout h ∈ E ,
dfa (h ) = 〈∇f (a ), h 〉
| f (a + h ) − f (a )| ≈ 〈∇f (a ), h 〉 ⩽ ∥∇ f (a )∥ × ∥h ∥
L’écart absolu f (a +h )− f (a ) est maximal dans le cas d’égalité 〈∇f (a ), h 〉 = ∥∇ f (a )∥×∥h ∥, c’est-à-dire lorsque
la direction h est colinéaire au gradient. Comme annoncé lors de l’étude des fonctions de deux variables, le
gradient indique bien la ligne de plus grande pente, la direction où les variations sont les plus importantes.
On appelle arc paramétré de classe C k toute fonction vectorielle de classe C k , définie sur un intervalle I de R
et à valeurs dans E . Soit désormais un arc paramétré γ : I ⊂ R → E supposé de classe C 1 .
Soit t 0 ∈ I . On suppose que γ′ (t 0 ) ̸= 0. Alors, la courbe représentative de γ admet une tangente au point γ(t 0 ),
dirigée par le vecteur γ′ (t 0 ).
Pour prouver ce résultat, considérons la droite ∆t issue de M (t 0 ),
−−−−−−−→
γ′ (t 0 ) M (t 0 ) = γ(t 0 ) dirigée par le vecteur M (t 0 )M (t ), c’est-à-dire γ(t ) − γ(t 0 ), et faisons
tendre t vers t 0 : intuitivement, la droite limite sera tangente à la
M (t ) = γ(t ) courbe au point M (t 0 ). Plus formellement, on définit la tangente à
la courbe en M (t 0 ) comme la droite passant par M (t 0 ) et dirigée
−−−−−−−→
M (t 0 )M (t )
par lim −−−−−−−→ lorsque cette dernière existe.
∆t t →t 0
∥M (t 0 )M (t )∥
Sous les conditions précédentes, c’est le cas, car pour tout t ̸= t 0 ,
Démonstration
C’est le résultat d’une simple différentiation de composée d’applications différentiables :
La tangente à la courbe f ◦ γ en t 0 est dirigée par (f ◦ γ)′ (t 0 ) = d fγ(t 0 ) (γ′ (t 0 )) si celui-ci est non nul. Ce dernier
vecteur n’est rien d’autre que l’image du vecteur qui dirige la tangente à γ en t 0 par l’application linéaire d fγ(t 0 ) .
• Si γ(t ) = x + t u avec x , u ∈ E , alors γ est un paramétrage de la droite affine passant par x et dirigée par u .
γ′ (t ) = u est comme attendu constante et alors, (f ◦ γ)′ (t ) = d fγ(t ) (u ).
• Enfin, si f est une application numérique, (f ◦ γ)′ (t ) = dfγ(t ) (γ′ (t )) = 〈∇f (γ(t )), γ′ (t )〉.
Ajoutons que si l’on suppose toute ligne de niveau décrite par un paramétrage γ de classe C 1 , f ◦ γ est
constante. En dérivant, l’on obtient 〈∇f (γ(t )), γ′ (t )〉 = 0, ce qui assure l’orthogonalité du gradient aux
vecteurs qui dirigent les tangentes aux lignes de niveau (cf. l’illustration page 4).
Démonstration
La preuve est immédiate puisque l’on peut intégrer la fonction continue (f ◦ γ)′ sur [0, 1] :
Z1 Z1
dfγ(t ) (γ′ (t )) dt = (f ◦ γ)′ (t ) dt = f (γ(1)) − f (γ(0)) = f (b ) − f (a )
0 0
■
Démonstration
L’implication est simple. La réciproque est obtenue grâce à la forme intégrale prouvée ci-dessus. Attention,
cette dernière n’est valable que pour des chemins de classe C 1 . Conformément au programme, on restreindra
la démonstration au cas où l’ouvert U est supposé convexe.
Soient a , b ∈ U . On considère la fonction γ définie sur [0, 1] par γ(t ) = (1 − t )a + t b . γ est bien un chemin
de U de classe C 1 . Par nullité de la différentielle,
Z1 Z1
f (b ) − f (a ) = d fγ(t ) (γ′ (t )) dt = 0 dt = 0
0 0
On généralise ainsi un résultat bien connu : une fonction f ∈ C 1 (I , R) est constante sur l’intervalle I si et
seulement si f ′ est nulle sur l’intervalle I . Rappelons que les parties de R connexes par arcs sont les intervalles.
Un tel ensemble Tx X n’est pas, en général, un espace vectoriel bien que les exemples suivants puissent suggérer
le contraire. Pour déterminer les vecteurs tangents à une partie, on procède souvent par double inclusion.
Exemple
Si E est un sous-espace affine de dimension finie et de direction E , alors, en tout point x ∈ E , Tx E = E .
Exercice 6
Soit E un espace euclidien. Montrer que :
(i) pour tout point x ∈ B(0, 1), Tx B(0, 1) = E .
(ii) pour tout point x ∈ S (0, 1), Tx S (0, 1) = Vect(x )⊥ .
Concluons cette série d’exemples par l’étude du plan tangent (affine) à une surface de R3 d’équation z = f (x , y )
en un point donné. Soient S la surface d’équation z = f (x , y ) où f : R2 → R est supposée de classe C 1 et
M 0 (x0 , y0 , z 0 ) un point de S . Le plan tangent en M 0 peut être défini comme la réunion des tangentes aux
courbes tracées le long de S passant par le point M 0 , c’est-à-dire comme le plan affine passant par M 0 et de
direction le plan vectoriel TM 0 S . Il reste à vérifier que TM 0 S est, comme attendu, un plan vectoriel !
∂f ∂f
γ′ (0) = (x ′ (0), y ′ (0), x ′ (0) (x0 , y0 ) + y ′ (0) (x0 , y0 ))
∂x ∂y Représentation de deux courbes tracées le long
d’une surface et des vecteurs tangents associés
Ce vecteur tangent à la courbe en M 0 est, quel que soit l’arc γ considéré, orthogonal au vecteur :
∂f ∂f
n= (x0 , y0 ), (x0 , y0 ), −1
∂x ∂y
pour constater que v ∈ TM 0 S . En effet, γ est de classe C 1 et à valeurs dans S , γ(0) = M 0 et γ′ (0) = v .
Nous venons ainsi de prouver que TM 0 S = Vect(n )⊥ .
Le plan tangent à S en M 0 peut alors être défini comme l’unique plan passant par M 0 et de vecteur normal n.
On retrouve l’équation déjà donnée par troncature à l’ordre 1 du développement limité de f en (x0 , y0 ) :
∂f ∂f
z = f (x0 , y0 ) + (x0 , y0 ) · (x − x0 ) + (x0 , y0 ) · (y − y0 )
∂x ∂y
La description d’une surface de R3 par une équation de la forme z = f (x , y ) n’englobe cependant qu’un
nombre restreint de surfaces de l’espace. On définit plus généralement une surface de R3 par la donnée d’une
équation implicite g (x , y , z ) = 0, comme par exemple (x − x0 )2 + (y − y0 )2 + (z − z 0 )2 = R 2 . Il n’est pas toujours
possible d’exprimer z en fonction de x et y pour se ramener au cas particulier précédent. Le théorème suivant
permet de contourner cette objection pour déterminer le plan tangent à une telle surface. Sa démonstration
(hors programme) fait appel au théorème des fonctions implicites, ce dernier précisant les conditions pour
exprimer localement z comme une fonction de x et de y .
Démonstration
Soient g : U ⊂ Rp → R de classe C 1 , X l’hypersurface d’équation g (x1 , . . . , xp ) = 0 et x ∈ X tel que dg x =
̸ 0.
Montrons que Tx X = Ker(dg x ) = ∇g (x ) .
⊥
Remarquons pour commencer que dg x ̸= 0L (Rp ,R) , Ker(dg x ) est un hyperplan de Rp . De plus,
h ∈ Ker(dg x ) ⇐⇒ dg x (h ) = 0 ⇐⇒ 〈∇g (x ), h 〉 = 0 ⇐⇒ h ∈ ∇g (x )⊥
Le plan tangent à une surface S d’équation g (x , y , z ) = 0 en M 0 (x0 , y0 , z 0 ) est donc le plan affine passant par
M 0 et de direction le plan vectoriel TM 0 S = ∇g (x0 , y0 , z 0 )⊥ . Il a donc pour équation :
∂g ∂g ∂g
(x0 , y0 , z 0 ) · (x − x0 ) + (x0 , y0 , z 0 ) · (y − y0 ) + (x0 , y0 , z 0 ) · (z − z 0 ) = 0 où g (x0 , y0 , z 0 ) = 0
∂x ∂y ∂z
Exercice 7
Déterminer une équation du plan tangent à la sphère unité de R3 , muni de sa structure euclidienne, en un
point M 0 (x0 , y0 , z 0 ).
∂kf ∂ ∂ k −1 f
=
∂ x jk · · · ∂ x j1 ∂ x jk ∂ x jk −1 · · · ∂ x j1
Les sommes et composées de fonctions de classe C k sont encore de classe C k , les fonctions polynomiales
sont de classe C ∞ ...
∂ 2f ∂ 2f
∀i , j ∈ ⟦1, p ⟧, ∀x ∈ U , (x ) = (x )
∂ xi ∂ x j ∂ x j ∂ xi
Ce théorème, que l’on admet, s’étend aux dérivées d’ordres supérieurs. Il montre que l’ordre de dérivation
importe peu, du moment que la fonction est suffisamment régulière.
Exercice 8
(i) Justifier l’existence et calculer les dérivées partielles secondes sur R2 de f : (x , y ) 7→ x sin(y ) + x 2 .
2 2
x y · x − y si (x , y ) ̸= (0, 0)
∂ g
2
∂ g
2
(ii) Comparer (0, 0) et (0, 0) puis conclure, lorsque g (x , y ) = x2 + y 2
∂ x∂ y ∂ y∂ x
0 si (x , y ) = (0, 0)
Z 1
′
La formule de Taylor avec reste intégral à l’ordre 2 pour ϕ, i.e. ϕ(1) = ϕ(0) + ϕ (0) + (1 − t )ϕ ′′ (t ) dt , nous
0
donne celle relative à f :
n 1 n X
n
∂f ∂ f
2
Z
X X
f (a + h ) = f (a ) + hj (a ) + (1 − t ) hi h j (a + t h ) dt
j =1
∂ xj 0 i =1 j =1
∂ xi ∂ x j
∂ 2f ∂ 2f
∀i , j ∈ ⟦1, n ⟧, (a + t h ) = (a ) + ϵi , j (t h ) où ϵi , j (u ) −−−→ 0
∂ xi ∂ x j ∂ xi ∂ x j u→0E
X
Z 1
Il reste à prouver que R (h ) = hi h j (1 − t )ϵi , j (t h ) dt = o(∥h ∥2 ).
h →0
1⩽i , j ⩽n 0
Pour cela, fixons ϵ > 0. Il existe δ > 0 tel que pour tous i , j ∈ ⟦1, p ⟧, si ∥u ∥ ⩽ δ alors |ϵi , j (u)| < ϵ.
Soit h ∈ E tel que ∥h ∥ ⩽ δ. Alors, pour tout t ∈ [0, 1], ∥t h ∥ ⩽ δ et donc :
1 1
ϵ
Z Z
∀i , j ∈ ⟦1, p ⟧, (1 − t )ϵi , j (t h ) ⩽ ϵ (1 − t ) dt =
0 0
2
Ainsi, chaque terme de la somme est un o(hi h j ). De plus, |hi h j | ⩽ ∥h ∥2∞ donc R (h ) = o(∥h ∥2 ). ■
h →0
1
f (a + h ) = f (a ) + d fa (h ) + d2 fa (h , h ) + o(∥h ∥2 )
h →0 2
X ∂ 2f
où l’application bilinéaire d2 fa : (h , k ) 7→ hi k j (a ) est appelée différentielle seconde 4 de f en a .
1⩽i , j ⩽n
∂ xi ∂ x j
Il importe de savoir réécrire la formule pour une fonction de deux variables (usage le plus fréquent) :
∂f ∂f
f (x0 + h1 , y0 + h2 ) = f (x0 , y0 ) + (x0 , y0 ) · h1 + (x0 , y0 ) · h2
(h1 ,h2 )→(0,0) ∂x ∂y
1 ∂ f ∂ 2f ∂ 2f
2
2
+ (x0 , y0 ) · h1 + 2 (x0 , y0 ) · h1 h2 + (x0 , y0 ) · h2 + o(h12 + h22 )
2
2 ∂ x2 ∂ x∂ y ∂ y2
L’application f étant à valeurs dans R, nous disposons d’une écriture matricielle de la formule de Taylor-Young
à l’ordre 2 assez commode. Elle s’appuie sur les relations suivantes :
n
X ∂f X ∂ 2f
dfa (h ) = hj (a ) = 〈∇f (a ), h 〉 et d2 fa (h ) = hi h j (a ) = 〈H f (a )h , h 〉
j =1
∂ xj 1⩽i , j ⩽n
∂ xi ∂ x j
∂ 2f
où l’on a noté h = (h j )1⩽ j ⩽n et H f (a ) = (a )
∂ xi ∂ x j 1⩽i , j ⩽n
Notons que la hessienne est bien symétrique, dès lors que f est de classe C 2 , en vertu du théorème de Schwarz.
On retiendra la version matricielle suivante de la formule de Taylor-Young à l’ordre 2 pour une fonction de
classe C 2 sur un ouvert U de E . Pour tout a ∈ U ,
1 1
f (a + h ) = f (a ) + 〈∇f (a ), h 〉 + 〈H f (a )h , h 〉 + o(∥h ∥2 ) = f (a ) + ∇f (a )⊤ h + h ⊤ H f (a )h + o(∥h ∥2 )
h →0 2 h →0 2
Rappelons que si A est une partie compacte de E , f admet nécessairement un minimum et un maximum. De
plus, pour une fonction de la variable réelle f de classe C 1 sur un intervalle I :
• si f atteint un extremum local en a ∈ I , f ′ (a ) = 0 ;
• f ′ peut s’annuler sans que f atteigne un extremum (cf. x 7→ x 3 sur ] − 1, 1[) ;
• si I n’est pas ouvert, f peut atteindre un extremum sans que sa dérivée s’annule (cf. x 7→ x sur [0, 1]).
Ajoutons que lorsque f est de classe C 2 :
• si f atteint un minimum local en a ∈ I , f ′′ (a ) ⩾ 0 ;
• si f ′ (a ) = 0 et f ′′ (a ) > 0 pour a ∈
I , f atteint un minimum local.
La recherche des extrema ne diffère guère de celle que les lecteurs connaissent pour les fonctions de la variable
réelle. On prendra garde au fait que la plupart des résultats énoncés ci-dessous sont valables uniquement sur
des parties ouvertes. Il sera donc parfois nécessaire de dissocier la recherche des extrema de f à l’intérieur
de A et le long de sa frontière.
∂f
Cela revient à dire que pour tout j ∈ ⟦1, n ⟧, (a ) = 0.
∂ xj
Démonstration
Soit j ∈ ⟦1, n⟧. Supposons que f atteigne un extremum en a ∈ U . Alors, l’application de la variable réelle
∂f
ϕ : t 7→ f (a + t e j ) est de classe C 1 au voisinage de 0 et admet un extremum en 0. Ainsi, ϕ ′ (0) = (a ) = 0. ■
∂ xj
Les extremums locaux sont donc à rechercher parmi les points critiques. Cependant, comme en dimension 1,
la réciproque est fausse ! Tout point critique ne correspond pas nécessairement à un extremum local.
Exemple
On considère la fonction f : R2 → R définie par :
f (x , y ) = x 2 + x y + y 2 + 2x + 3y
∀(x , y ) ∈ R2 , ∇f (x , y ) = (2x + y + 2, 2y + x + 3)
3 1
f (−1/3 + h , −4/3 + k ) − f (−1/3, −4/3) = h 2 + h k + k 2 = (h + k )2 + (h − k )2 ⩾ 0
4 4
Ainsi, f atteint en M 0 un minimum (global) que l’on visualise bien sur le paraboloïde ci-dessus.
Exercice 9
Soient (E , 〈·, ·〉) un espace préhilbertien, F un sous-espace vectoriel de dimension finie de E et a ∈ E .
(i) Montrer que l’application f : u 7→ ∥u − a ∥ admet un minimum sur F en calculant lim f (u ).
∥u ∥→+∞
(ii) Justifier que ce minimum est atteint en un seul x ∈ F . Que dire de x ?
L’étude globale du signe de f (x , y ) − f (x0 , y0 ) menée dans l’exemple précédent pour justifier la présence d’un
minimum n’est pas satisfaisante car difficilement reproductible pour une fonction quelconque. Pour pallier
cette difficulté, il suffit de pousser l’étude locale au voisinage d’un point critique au moyen de la formule de
Taylor-Young. En effet, si f est de classe C 2 sur l’ouvert U et a un point critique de f , alors :
1
f (a + h ) = f (a ) + h ⊤ H f (a )h + o(∥h ∥2 )
h →0 2
Le signe de f (a + h ) − f (a ) est localement celui de 〈H f (a )h , h 〉 = h ⊤ H f (a )h , ce qui conduit au résultat suivant.
Bien entendu, appliqué à − f , le théorème précédent affirme que lorsque a est un point critique de f et si
H f (a ) ∈ S−n − (R), alors f atteint en a un maximum local.
Démonstration
Soient f : U ⊂ E → R de classe C 2 sur l’ouvert U et a ∈ U .
• Supposons que f (a ) est un minimum local de f . Alors a est un point critique de f . De plus, si h ∈ E , pour
tout t ∈ R suffisamment petit, a + t h ∈ U et f (a + t h ) − f (a ) ⩾ 0.
t2 2
〈H f (a )h , h 〉 + o(t 2 ) c’est-à-dire, 〈H f (a )h , h 〉 =
Or, f (a + t h ) − f (a ) = f (a + t h ) − f (a ) + o(1).
t →0 2 t →0∗ t 2
Un passage à la limite permet de conclure : 〈H f (a )h , h 〉 ⩾ 0 pour tout h ∈ E .
• Supposons maintenant que a est un point critique de f et que H f (a ) ∈ S++ n (R). Alors, en notant λmin la
plus petite des valeurs propres (nécessairement réelle) de H f (a ), d’après le théorème spectral,
f (a + h ) − f (a ) = 12 h ⊤ H f (a )h + ∥h ∥2 ϵ(h ) avec ϵ(u ) −−→ 0. Il existe donc r > 0 tel que pour tout h ∈ B(0, r ),
u→0
2 ∥h ∥2
∥h ∥ ϵ(h ) ⩽ λmin . Ainsi, pour tout h ∈ B(0, r ),
4
1 ∥h ∥2 ∥h ∥2 ∥h ∥2
f (a + h ) − f (a ) = h ⊤ H f (a )h + ∥h ∥2 ϵ(h ) ⩾ λmin − λmin = λmin ⩾0
2 2 4 4
f (a ) est bien un minimum local de f . ■
Corollaire 18.35
Soient f : U ⊂ E → R de classe C 2 sur l’ouvert U et a ∈ U un point critique de f .
• Si Sp(H f (a )) ⊂ R∗+ , f atteint en a un minimum.
• Si Sp(H f (a )) ⊂ R∗− , f atteint en a un maximum.
• Si H f (a ) possède deux valeurs propres de signes distincts, a est un point selle.
Lorsque les valeurs propres H f (a ) sont seulement supposées positives (ou négatives), on ne peut pas conclure.
On notera que pour n = 2, on dispose d’une caractérisation simple au moyen du déterminant et de la trace. En
effet, en notant λ et µ les deux valeurs propres de H f (a ), det(H f (a )) = λµ et Tr(H f (a )) = λ + µ.
Corollaire 18.36
Soient f : U ⊂ R2 → R de classe C 2 sur l’ouvert U et a ∈ U un point critique de f .
• Si det(H f (a )) > 0, f admet un extremum en a .
Il s’agit d’un minimum lorsque Tr(H f (a )) > 0, d’un maximum sinon.
• Si det(H f (a )) < 0, f admet un point selle.
• Si det(H f (a )) = 0, on ne peut pas conclure.
Pour le dernier cas, on pourra penser aux fonctions x 7→ x 3 et x 7→ x 4 de dérivée et dérivée seconde nulles en 0.
Exemple
On considère la fonction f : R2 → R définie par :
f (x , y ) = x 4 + y 4 − (x − y )2
4x 3 − 2(x − y ) = 0 x 3 = −y 3 x = −y
¨ ¨ ¨
−→
∇f (x , y ) = 0 ⇐⇒ ⇐⇒ ⇐⇒
4y 3 + 2(x − y ) = 0 4x 3 − 2(x − y ) = 0 x3 − x = 0
Nous avons donc trois points criques : A(1, −1), B (−1, 1) et C (0, 0).
Exercice 10
Déterminer de deux manières min x y .
x 2 +y 2 =1
Néanmoins, même si des résultats spécifiques justifient, sous la condition dg x ̸= 0, la possibilité d’exprimer
une des variables en fonction des autres, l’approche proposée s’avère en pratique rapidement inopérante : on
ne dispose pas en général d’une expression explicite et cette dernière n’est souvent valable que localement.
Démonstration
• Si dfa est nulle, alors dfa = λdg a avec λ = 0. Supposons désormais dfa non nulle.
• Rappelons que deux formes linéaires non nulles ϕ et ψ ont même noyau si et seulement s’il existe λ ∈ R∗
tel que ϕ = λψ (cf. « Compléments d’algèbre linéaire »). Prouvons donc que Ker(dg a ) = Ker(d fa ).
L’application dg a étant non nulle, Ker(dg a ) = Ta X . Soit x ∈ Ker(dg a ). On sait qu’il existe γ :] − ϵ, ϵ[→ X de
classe C 1 tel que γ(0) = a et γ′ (0) = x . De plus, f|X admet un extremum local en a donc f ◦ γ admet un
extremum local en 0, point intérieur de ] − ϵ, ϵ[. Ainsi,
Précisons que cette condition n’est que nécessaire et qu’il sera en général indispensable d’accompagner cette
recherche de points critiques (toujours sur un ouvert !) d’une étude locale pour distinguer les extrema des
points selles ou d’un argument de compacité.
Exemple
Déterminons à nouveau min x y en posant cette fois-ci f (x , y ) = x y et g (x , y ) = x 2 + y 2 − 1.
x 2 +y 2 =1
• Les deux fonctions numériques f et g sont polynomiales donc de classe C ∞ sur l’ouvert R2 .
• Le cercle unité X = {(x , y ) ∈ R2 | g (x , y ) = 0} étant compact, f|X admet un minimum en (x0 , y0 ) ∈ X .
y x
• ∇f (x , y ) = et ∇g (x , y ) = 2 ̸= 0 pour tout (x , y ) ∈ X . D’après ce qui précède, il existe λ ∈ R∗ tel que :
x y
y0 = 2λx0
x0 = 2λy0
2
x0 + y02 = 1
1 1 1 1 1 1 1
On trouve (x0 , y0 , λ) = ± p , ± p , ou bien (x0 , y0 , λ) = ± p , ∓ p , − . D’où min x y = − .
2 2 2 2 2 2 x +y =1
2 2 2
Exercice 11 (CCP 2023)
Soit f l’application définie sur R2 par f (x , y ) = 4x 2 + 12x y − y 2 . On note C = {(x , y ) ∈ R2 | x 2 + y 2 = 13}.
(i) Montrer que f admet un minimum et un maximum sur C .
(ii) Les déterminer.
X = {x ∈ U | g 1 (x ) = · · · = g p (x ) = 0}