Calcul Differentiel

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 23

MATHÉMATIQUES 2023 – 2024 1

18 Calcul différentiel
« Les mathématiques sont un jeu que l’on exerce selon des règles simples en manipulant
des symboles ou des concepts qui n’ont en soi, aucune importance particulière. »
David Hilbert (1862 – 1943)

Plan de cours

I Premiers pas informels avec les fonctions numériques de deux variables . . . . 1


1
II Applications différentiables, applications de classe C . . . . . . . . . . . . . . . . . . 7
k
III Applications de classe C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
IV Optimisation avec et sans contrainte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

Dans tout ce chapitre, E et F désignent des espaces vectoriels normés de dimension finie. On cherche à étendre
la notion de dérivabilité (relative aux fonctions d’une variable réelle) aux fonctions plus généralement définies
sur un ouvert U de E et à valeurs dans F . Le choix de travailler sur un ouvert permet de s’assurer que si a ∈ U ,
alors, pour ∥h ∥ suffisamment petit, a + h ∈ U ; on donne ainsi un sens à l’écriture f (a + h ) − f (a ).
Comme nous le verrons tout au long de ce chapitre, le calcul différentiel se construit autour d’un grand principe
qu’il est utile d’avoir dès à présent en tête :
     
accroissement terme linéaire par rapport terme
= +
de la fonction à l’accroissement de la variable correctif

Pour une « simple » fonction f : R → R dérivable, celui-ci se traduit par : f (a + h ) − f (a ) = f ′ (a )h + o(h ).


h →0

I | Premiers pas informels avec les fonctions numériques de deux variables


Débutons notre étude en la restreignant aux fonctions définies sur un ouvert U de R2 et à valeurs dans R.
Cette limitation provisoire offre un cadre commode pour représenter graphiquement les fonctions étudiées et
permet de se familiariser avec le calcul différentiel dans un contexte simplifié. Soit donc la fonction :

f : U ⊂ R2 −→ R
(x , y ) 7−→ f (x , y )

La surface S d’équation z = f (x , y ) est l’ensemble des points de coordonnées (x , y , f (x , y )) pour (x , y ) ∈ U .

Définition 18.1 : Ligne de niveau


On appelle ligne de niveau de hauteur k (ou d’altitude k ) la courbe d’équation f (x , y ) = k .

Les lignes de niveau, intersections de S et des plans d’équations z = k , permettent de visualiser la surface.

Exemple de surface Lignes de niveau 3D Lignes de niveau


2 Chap. 18 Calcul différentiel

A – Limites et continuité
On munit R2 de la norme euclidienne notée ∥ · ∥. Rappelons que f admet une limite ℓ ∈ R en (x0 , y0 ) ∈ U si :

∀ϵ > 0, ∃δ > 0, ∀(x , y ) ∈ U , ∥(x , y ) − (x0 , y0 )∥ < δ =⇒ f (x , y ) − ℓ < ϵ

Pour calculer une telle limite en (x0 , y0 ), il ne suffit pas de faire tendre x vers x0 puis y vers y0 ou vice-versa.

Exemple
2x y
La quantité f (x , y ) = n’admet pas de limite en (0, 0) :
x2 + y 2

lim lim f (x , y ) = lim f (0, y ) = 0 et lim lim f (x , y ) = lim f (x , 0) = 0


y →0∗ x →0∗ y →0∗ x →0∗ y →0∗ y →0∗

y
et pourtant, f (x , x ) = 1 −−−→ 1. Plus généralement,
x →0∗

f (r cos(θ ), r sin(θ )) = 2 cos(θ ) sin(θ ) −−→ 2 cos(θ ) sin(θ )


r →0∗
x
L’existence de limites différentes selon la direction définie par
l’angle θ choisi justifie la non-existence d’une limite en (0, 0).

Attention, l’existence d’une limite commune dans toutes les directions ne garantit pas l’existence d’une limite.

Exercice 1
x2y x2y
Trouver les limites en (0, 0), lorsqu’elles existent, de g (x , y ) = et h (x , y ) = .
x2 + y 2 x4 + y 2

Rappelons de plus que l’application f est dite continue en (x0 , y0 ) ∈ U si lim f (x , y ) = f (x0 , y0 ) :
(x ,y )→(x0 ,y0 )

∀ϵ > 0, ∃δ > 0, ∀(x , y ) ∈ U , ∥(x , y ) − (x0 , y0 )∥ < δ =⇒ f (x , y ) − f (x0 , y0 ) < ϵ

On dit que f est continue sur U si f est continue en tout point de U . La somme, le produit, la composée et le
quotient dont le dénominateur ne s’annule pas de fonctions continues sont des fonctions continues.
Pour les mêmes raisons que celles évoquées pour les limites, si f est continue alors les applications partielles
f x : y 7→ f (x , y ) et f y : x 7→ f (x , y ) le sont également mais la réciproque est fausse.

B – Dérivées partielles premières


1 – Retour sur les fonctions de la variable réelle

y
y = f (x ) Si f : R → R est dérivable sur R, la formule de Taylor-
Young nous permet d’écrire en tout point x0 ∈ R :

f (x ) = f (x0 ) + f ′ (x0 )(x − x0 ) + o(x − x0 ) (⋆)


f (x0 )
y = f (x0 ) + f ′ (x0 )(x − x0 ) L’équation de la tangente à la courbe au point d’abscisse
x0 est alors :

x y = f (x0 ) + f ′ (x0 )(x − x0 )


x0

L’égalité (⋆) peut s’écrire :


f (x0 + h ) = f (x0 ) + f ′ (x0 ) · h +o(h )
h →0 | {z }
partie linéaire
| {z }
partie affine

L’application h 7→ f ′ (x0 ) · h est linéaire. On l’appelle différentielle de f en x0 et on la note df x0 . df x0 ∈ L (R).

© Mickaël PROST Année 2023/2024


Partie I – Premiers pas informels avec les fonctions numériques de deux variables 3

2 – Fonctions de deux variables : dérivées partielles, différentielle et plan tangent

On considère à nouveau une fonction f définie sur un ouvert U de R2 , à valeurs dans R et (x0 , y0 ) ∈ U .

Définition 18.2 : Dérivées partielles


Lorsque les limites suivantes existent et sont finies, on les appelle dérivées partielles premières de f au
point (x0 , y0 ) ∈ U :

∂f f (x0 + h , y0 ) − f (x0 , y0 ) ∂f f (x0 , y0 + k ) − f (x0 , y0 )


(x0 , y0 ) = lim et (x0 , y0 ) = lim
∂x h →0 h ∂y k →0 k

∂f ∂f
À l’image de f , et , également notées ∂1 f et ∂2 f , sont des fonctions de deux variables à valeurs réelles.
∂x ∂y
Ces dérivées partielles ne sont que des cas particuliers de ce qu’on appelle les dérivées directionnelles de f .

Définition 18.3 : Dérivées directionnelles


Soit u (a , b ) ∈ R2 . Si la fonction de la variable réelle t 7→ f (x0 + t a , y0 + t b ) est dérivable en 0, on dit alors
que f est dérivable en (x0 , y0 ) selon le vecteur u et on pose :

f (x0 + t a , y0 + t b ) − f (x0 , y0 )
Du (f )(x0 , y0 ) = lim
t →0 t

Les dérivées partielles sont ainsi les dérivées directionnelles de f dans les directions privilégiées (1, 0) et (0, 1).

Définition 18.4 : Fonction de classe C 1


On dit que f est de classe C 1 sur un ouvert U de R2 si les dérivées partielles existent et sont continues en
tout point de U .

Exemples

• L’application (x , y ) 7→ 3x 2 + 5x sin(y ) est de classe C 1 sur R2 et :

∂f ∂f
∀(x , y ) ∈ R2 , (x , y ) = 6x + 5 sin(y ) et (x , y ) = 5x cos(y )
∂x ∂y

• L’application ∥ · ∥ est de classe C 1 sur R2 \ {(0, 0)}.

On admet provisoirement le résultat suivant.

Théorème 18.5 : Formule de Taylor-Young à l’ordre 1


Si f est de classe C 1 sur un ouvert U de R2 alors, pour tout (x0 , y0 ) ∈ U ,

∂f ∂f
f (x0 + h , y0 + k ) = f (x0 , y0 ) + (x0 , y0 ) · h + (x0 , y0 ) · k + o (∥(h , k )∥)
(h ,k )→(0,0) ∂x ∂y

La surface d’équation z = f (x , y ) admet alors un plan tangent 1 en tout point (x0 , y0 , z 0 ) tel que z 0 = f (x0 , y0 ).
Celui-ci a pour équation :
∂f ∂f
z = f (x0 , y0 ) + (x0 , y0 ) · (x − x0 ) + (x0 , y0 ) · (y − y0 )
∂x ∂y
∂f ∂f
Cette équation est de la forme a (x − x0 ) + b (y − y0 ) + c (z − z 0 ) = 0 avec a = (x0 , y0 ), b = (x0 , y0 ) et c = −1.
∂x ∂y
∂f ∂f
 ‹
Le vecteur (x0 , y0 ), (x0 , y0 ), −1 est normal au plan tangent.
∂x ∂y
1. il sera défini dans un cadre plus général dans la section suivante

Année 2023/2024 Lycée Louis-le-Grand – MP


4 Chap. 18 Calcul différentiel

Exemple

Considérons la sphère de centre O et de rayon 1 qui


M0
a pour équation x 2 + y 2 + z 2 = 1. Posons :
Æ
f : (x , y ) 7→ 1− x2 − y 2
O
La surface représentative de f est une demi-sphère.
Déterminons une équation du plan tangent au point
p p
M 0 de coordonnées (x0 , y0 , z 0 ) = (0, 1/ 2, 1/ 2).
La sphère unité et son plan tangent en (x0 , y0 , z 0 )
f est tout d’abord de classe C 1 sur l’ouvert U = {(x , y ) ∈ R2 | x 2 + y 2 < 1} et pour tout (x0 , y0 ) ∈ U ,

∂f −x0 ∂f −y0
(x0 , y0 ) = q et (x0 , y0 ) = q
∂x 1 − x02 − y02 ∂y 1 − x02 − y02

Ici, x0 = 0 et y0 = z 0 = p1 d’où l’équation recherchée du plan tangent en M 0 :


2

1

1
‹ p
z = p + 0 · (x − 0) + (−1) · y − p c’est-à-dire : y +z = 2
2 2

Si f de classe C 1 sur un ouvert U de R2 et (x0 , y0 ) ∈ U , l’application


∂f ∂f
(h , k ) 7→ (x0 , y0 ) · h + (x0 , y0 ) · k
∂x ∂y
est linéaire ; on l’appelle différentielle de f en (x0 , y0 ) et on la note d f(x0 ,y0 ) . Ici, d f(x0 ,y0 ) ∈ L (R2 , R).

Définition 18.6 : Gradient

‹ U de R et (x0 , y0 ) ∈ U . On appelle gradient de f au point (x0 , y0 ) le


1 2
 classe C sur un ouvert
Soit f de
∂f ∂f −−→
vecteur (x0 , y0 ), (x0 , y0 ) . On le notera grad f (x0 , y0 ) ou ∇f (x0 , y0 ).
∂x ∂y

Le gradient de f en (x0 , y0 ) est donc l’unique vecteur vérifiant, pour tout u = (h , k ),


∂f ∂f
df(x0 ,y0 ) (u) = (x0 , y0 ) · h + (x0 , y0 ) · k = 〈∇f (x0 , y0 ), u 〉
∂x ∂y
Quand ils manipulent des gradients, nos amis physiciens omettent parfois de préciser « (x0 , y0 ) » mais il faut
garder à l’esprit que l’on parle du gradient en un point donné.

Proposition 18.7
Le gradient au point (x0 , y0 ) est orthogonal à la ligne de niveau passant par (x0 , y0 ).

Le gradient indique en outre la ligne de plus grande pente. Voici une illustration de ces deux propriétés pour
une certaine fonction f : R2 → R de classe C 1 .

Représentation de la surface d’équation z = f (x , y ) Gradient et lignes de niveau associés

© Mickaël PROST Année 2023/2024


Partie I – Premiers pas informels avec les fonctions numériques de deux variables 5

3 – Notations différentielles

Nous venons d’introduire la différentielle de f au point (x0 , y0 ) ∈ U :


∂f ∂f
d f(x0 ,y0 ) : (h , k ) 7→ (x0 , y0 ) · h + (x0 , y0 ) · k
∂x ∂y
Considérons maintenant les deux formes linéaires dx(x0 ,y0 ) : (h , k ) 7→ h et dy(x0 ,y0 ) : (h , k ) 7→ k . Alors,
∂f ∂f
df(x0 ,y0 ) = (x0 , y0 ) dx(x0 ,y0 ) + (x0 , y0 ) dy(x0 ,y0 ) (comb. lin. de deux applications linéaires)
∂x ∂y
Et enfin, en notant df l’application (x , y ) 7→ d f(x ,y ) définie sur U et à valeurs dans L (R2 , R) :
∂f ∂f
df = dx + dy (d f n’est en général pas linéaire !)
∂x ∂y

4 – Dérivées partielles et composées : règle de la chaîne

▷ Pour U un ouvert de R2 et I un intervalle de R, on considère les deux applications de classe C 1 :


γ : I −→ U et f : U −→ R
t 7−→ (x (t ), y (t )) (x , y ) 7−→ f (x , y )
f ◦ γ : I → R est alors de classe C 1 sur I et :
∂f ∂f
∀t ∈ I , (f ◦ γ)′ (t ) = x ′ (t ) (x (t ), y (t )) + y ′ (t ) (x (t ), y (t )) = 〈∇f (γ(t )), γ′ (t )〉
∂x ∂y

Démonstration
γ est de classe C 1 sur I , donc x et y sont dérivables et pour tout t ∈ I :

(f ◦ γ)(t + h ) − (f ◦ γ)(t ) = f (x (t + h ), y (t + h )) − f (x (t ), y (t ))

= f (x (t ) + h x ′ (t ) + o(h ), y (t ) + h y ′ (t ) + o(h )) − f (x (t ), y (t ))
h →0 | {z } | {z }
=h ′ =k ′
∂f ∂f p
(x (t ), y (t )) · h ′ +
Or f (x (t ) + h ′ , y (t ) + k ′ ) = f (x (t ), y (t )) + (x (t ), y (t )) · k ′ + o( h ′2 + k ′2 ). D’où,
h →0 ∂x ∂y
∂f ∂f
• ˜
′ ′
(f ◦ γ)(t + h ) − (f ◦ γ)(t ) = x (t ) (x (t ), y (t )) + y (t ) (x (t ), y (t )) · h + o(h )
h →0 ∂x ∂y ■

Exercice 2
Montrer que t 7→ f (cos(t ), sin(t )) est de classe C 1 sur R et calculer sa dérivée, avec f ∈ C 1 (R2 ; R).

▷ Considérons désormais les applications f : R2 → R, ϕ : R2 → R et ψ : R2 → R de classe C 1 sur R2 et :


F : R2 −→ R
(x , y ) 7−→ f (ϕ(x , y ), ψ(x , y ))
Alors F est de classe C 1 sur R2 et pour tout (x , y ) ∈ R2 ,
∂F ∂ϕ ∂f ∂ψ ∂f
(x , y ) = (x , y ) · (ϕ(x , y ), ψ(x , y )) + (x , y ) · (ϕ(x , y ), ψ(x , y ))
∂x ∂x ∂x ∂x ∂y
∂F ∂ϕ ∂f ∂ψ ∂f
(x , y ) = (x , y ) · (ϕ(x , y ), ψ(x , y )) + (x , y ) · (ϕ(x , y ), ψ(x , y ))
∂y ∂y ∂x ∂y ∂y

Exemple
Si f : R2 → R est de classe C 1 , il en va de même pour F : (r, θ ) 7→ f (r cos(θ ), r sin(θ )) et,

∂F ∂f ∂f
∀(r, θ ) ∈ R2 , (r, θ ) = cos(θ ) (r cos(θ ), r sin(θ )) + sin(θ ) (r cos(θ ), r sin(θ ))
∂r ∂x ∂y
∂F ∂f ∂f
∀(r, θ ) ∈ R2 , (r, θ ) = −r sin(θ ) (r cos(θ ), r sin(θ )) + r cos(θ ) (r cos(θ ), r sin(θ ))
∂θ ∂x ∂y

Année 2023/2024 Lycée Louis-le-Grand – MP


6 Chap. 18 Calcul différentiel

C – Dérivées partielles secondes


∂ 2f ∂ 2f ∂ 2f ∂ 2f
Elles sont au nombre de 4 et définies à partir des dérivées partielles premières : , , et .
∂x 2 ∂ x∂ y ∂ y ∂ x ∂ y2
Définition 18.8
On dit que f est de classe C 2 sur un ouvert U de R2 si les dérivées partielles secondes existent et sont
continues en tout point de U .

Théorème 18.9 : Théorème de Schwarz


Soit f : U → R2 une application de classe C 2 sur un ouvert U de R2 . Alors,

∂ 2f ∂ 2f
∀(x0 , y0 ) ∈ U , (x0 , y0 ) = (x0 , y0 )
∂ x∂ y ∂ y∂ x

Théorème 18.10 : Formule de Taylor-Young à l’ordre 2


Si f est de classe C 2 sur un ouvert U de R2 alors, pour tout (x0 , y0 ) ∈ U :
∂f ∂f 1 ∂ 2f ∂ 2f ∂ 2f
 
f (x0 + h , y0 + k ) = f (x0 , y0 ) + (x0 , y0 ) · h + (x0 , y0 ) · k + (x 0 , y0 ) · h 2
+ 2 (x 0 , y0 ) · h k + (x 0 , y0 ) · k 2
+ o(h 2 + k 2 )
∂x ∂y 2 ∂ x2 ∂ x∂ y ∂ y2

Cette dernière formule rendra de précieux services dans l’étude des extrema d’une fonction numérique (se
reporter à la dernière section du chapitre).

D – Exemples de résolution d’équations aux dérivées partielles


Nous n’aborderons la résolution d’équations aux dérivées partielles (EDP) qu’à travers des exemples relative-
ment simples et, à ce titre, très restreints. U désignera ici l’ouvert I × J où I et J sont deux intervalles ouverts
et f une solution des équations aux dérivées partielles proposées. Nous justifierons dans la section suivante le
choix d’un tel domaine.
∂f
• ∀(x , y ) ∈ U , (x , y ) = 0 : ∀(x , y ) ∈ U , f (x , y ) = ϕ(y ) avec ϕ : J → R
∂x
∂f
Z
• ∀(x , y ) ∈ U , (x , y ) = g (x , y ) : ∀(x , y ) ∈ U , f (x , y ) = g (x , y ) dx + ϕ(y ) avec ϕ : J → R
∂x
∂ 2f
• ∀(x , y ) ∈ U , (x , y ) = 0 : ∀(x , y ) ∈ U , f (x , y ) = ϕ(y )x + ψ(y ) avec ϕ, ψ : J → R
∂ x2
• Équation des ondes, dite des cordes vibrantes ou encore de d’Alembert :
∂ 2f 1 ∂ 2f
∀(x , t ) ∈ R2 , 2
(x , t ) − (x , t ) = 0 (⋆) (c ̸= 0)
∂x c2 ∂ t2
u = x −ct

On passe par le changement de variables de classe C et bijectif (car c ̸= 0) : 2
v = x +ct
Partant de f (x , t ) = g (u , v ), on cherche une équation aux dérivées partielles vérifiée par g .
∂f ∂u ∂g ∂v ∂g ∂g ∂g
= · + · = +
∂x ∂x ∂u ∂x ∂v ∂u ∂v
∂ 2f ∂ u ∂ 2g ∂ v ∂ 2g ∂ u ∂ 2g ∂ v ∂ 2g ∂ 2g ∂ 2g ∂ 2g
   
= · + · + · + · = + 2 +
∂ x2 ∂ x ∂ u2 ∂ x ∂ v ∂ u ∂ x ∂ u∂ v ∂ x ∂ v 2 ∂ u2 ∂ u∂ v ∂ v 2
∂ 2f 2 ∂ g ∂ 2g ∂ 2g
 2 
De même, on trouve =c −2 +
∂ t2 ∂ u2 ∂ u∂ v ∂ v 2
∂ 2g
L’équation (⋆) devient : ∀(u , v ) ∈ R2 , (u , v ) = 0
∂ u∂ v
On trouve alors g (u , v ) = ϕ(u ) + ψ(v ) avec ϕ, ψ : R → R, ce qui conduit à :
f (x , t ) = ϕ(x − c t ) + ψ(x + c t )

© Mickaël PROST Année 2023/2024


Partie II – Applications différentiables, applications de classe C 1 7

II | Applications différentiables, applications de classe C 1


On considère désormais une application f : U ⊂ E → F où E et F désignent deux espaces vectoriels normés
sur R de dimensions respectives p et n et U un ouvert de E . Toutes les normes étant équivalentes en dimension
finie, le choix d’une norme spécifique pour E ou F importera peu.
On parle de champ de vecteurs lorsque f : E → E et de champ scalaire lorsque f : E → R.
Nous travaillerons bien souvent – à quelques exceptions matricielles près – dans les espaces E = Rp et F = Rn
munis de leur structure euclidienne canonique. L’on pourra ainsi noter :

f (x ) = f (x1 , . . . , xp ) = (f1 (x ), . . . , fn (x ))

Notons que cette identification est toujours possible moyennant le choix d’une base de E et d’une base de F :
p
X n
X
x= xj ej et f (x ) = fi (x )ei′
j =1 i =1

• On appelle applications partielles de f les applications : x j 7→ f (x ) pour j ∈ ⟦1, p ⟧.


• On appelle applications composantes de f les applications fi : x 7→ fi (x ) pour i ∈ ⟦1, n ⟧.

Exemple
Soit f : R2 −→ R3
(u , v ) 7−→ (cos(u + v ), u − v, u 2 ev )

• f possède deux applications partielles définies sur R et à valeurs dans R3 :

u 7→ (cos(u + v ), u − v, u 2 ev ) et v 7→ (cos(u + v ), u − v, u 2 ev )

• f possède trois composantes définies sur R2 et à valeurs dans R :

(u , v ) 7→ cos(u + v ), (u, v ) 7→ u − v et (u , v ) 7→ u 2 ev

A – Différentielle

Théorème / Définition 18.11 : Différentielle en un point


Une application f : U ⊂ E → F est dite différentiable en a ∈ U s’il existe ϕ ∈ L (E , F ) tel que :

f (a + h ) = f (a ) + ϕ(h ) + o(∥h ∥)
h →0

Si l’application ϕ existe, elle est unique et est alors appelée différentielle de f au point a , mais aussi
application linéaire tangente à f en a . On la note dfa ou df (a ).

L’existence d’un développement limité à l’ordre 1 relève ainsi de la définition même de la différentiabilité :
 
f (a + h ) = f (a ) + d fa (h ) + o(∥h ∥) = f (a ) + d f (a ) (h ) + o(∥h ∥)
h →0 h →0

Au final, une fonction différentiable en un point est une fonction qui vérifie notre grand principe :
     
accroissement terme linéaire par rapport terme
= +
de la fonction à l’accroissement de la variable correctif
 
Il arrive parfois que l’on écrive dfa (h ) = df (a ) (h ) = d f (a ) · h . Cette dernière notation fait sens quand on
raisonne en termes matriciels : c’est le produit d’une matrice de taille n × p par un vecteur colonne de taille p .

Rappelons enfin que par définition, o(∥h ∥) = ∥h ∥ϵ(h ) où ϵ : E → F avec ϵ(h ) −−−→ 0F .
h →0E

Année 2023/2024 Lycée Louis-le-Grand – MP


8 Chap. 18 Calcul différentiel

Démonstration
Justifions, sous réserve d’existence, l’unicité de la différentielle de f en un point a ∈ U . Supposons que :

f (a + h ) = f (a ) + ϕ(h ) + o(∥h ∥) = f (a ) + ψ(h ) + o(∥h ∥) où ϕ, ψ ∈ L (E , F )


h →0 h →0

∥Φ(h )∥
Alors, Φ = ϕ − ψ est linéaire et vérifie Φ(h ) = o(∥h ∥), c’est-à-dire −−→ 0. Ceci signe la nullité de Φ.
h →0 ∥h ∥ h →0
∥Φ(t x )∥
Soit en effet x ∈ E non nul. En introduisant t ∈ K∗ , par linéarité, ∥Φ(x )∥ = ∥x ∥ · −−→ 0. ■
∥t x ∥ t →0

Exemples

• Si f : R → R est dérivable en a alors f est différentiable en a et d fa : h 7→ f ′ (a )h .


• Si f : U ⊂ E → F est constante sur U alors, pour tout a ∈ U , d fa = 0L (E ,F ) .
• Si f : U ⊂ E → F est linéaire alors, pour tout a ∈ U , dfa = f .

Proposition 18.12
Si f : U ⊂ E → F est différentiable en a ∈ U , alors f est continue en a .

Démonstration
Si f est différentiable en a , f (a + h ) − f (a ) = d fa (h ) + o(∥h ∥) −−−→ dfa (0E ) = 0F , par continuité de dfa en
h →0 h →0E
tant qu’application linéaire définie sur un espace normé de dimension finie. ■

Pour justifier quelques règles de calcul sur les différentielles en un point, nous aurons, par exemple, besoin
d’observer que d fa (o(∥h ∥)) = o(∥h ∥) ou bien que o(∥dfa (h )∥) = o(∥h ∥). Montrons plus généralement que
h →0 h →0
pour toute application linéaire ϕ, ϕ(o(∥h ∥)) = o(∥h ∥) et o(∥ϕ(h )∥) = o(∥h ∥). En dimension finie,
h →0 h →0
(i) ϕ est continue en 0 donc ϕ(o(∥h ∥)) = h ϕ(ϵ(h )) = o(∥h ∥) puisque ϕ(ϵ(h )) −−→ ϕ(0) = 0.
h →0 h →0
(ii) ϕ est linéaire donc lipschitzienne. Il existe C > 0 tel que pour tout h ∈ E , ∥ϕ(h )∥ ⩽ C ∥h ∥ d’où la relation
souhaitée : o(∥ϕ(h )∥) = o(∥h ∥).
h →0

Proposition 18.13 : Opérations algébriques


• Si f , g : U ⊂ E → F sont différentiables en a , alors pour tous λ, µ ∈ R, λf + µg est différentiable en a et :

d(λf + µg )a = λdfa + µdg a

• Si f : U ⊂ E → F et g : V ⊂ F → G avec U et V deux ouverts vérifiant f (U ) ⊂ V et E , F et G trois


espaces normés de dimension finie. Si f est différentiable en a et g différentiable en f (a ), alors g ◦ f
est différentiable en a et :
d(g ◦ f )a = dg f (a ) ◦ dfa

Démonstration
Prouvons la deuxième assertion. Par différentiabilité de f en a et de g en f (a ),
 
(g ◦ f )(a + h ) = g (f (a ) + d fa (h ) + o(∥h ∥)) = g (f (a )) + dg f (a ) (k ) + o(k ) = g (f (a )) + dg f (a ) ◦ d fa (h ) + o(∥h ∥)
h →0 | {z }
=k
Par unicité de la différentielle, g ◦ f est différentiable en a et d(g ◦ f )a = dg f (a ) ◦ d fa . ■

Exercice 3
Soient f , g : U ⊂ E → R différentiables en a .
(i) Montrer que f × g est différentiable en a et déterminer la différentielle en ce point.
1
(ii) On suppose de plus que f (a ) ̸= 0. Montrer que f est différentiable en a .

© Mickaël PROST Année 2023/2024


Partie II – Applications différentiables, applications de classe C 1 9

Nous disposons en fait de la propriété plus générale suivante (que nous n’utiliserons guère).

Proposition 18.14
Si M : F n → R est une application multilinéaire et si f1 , . . . , fn : E → F sont différentiables en a ∈ E ,
n
X
M (f1 , . . . , fn ) est différentiable en a et d(M (f1 , . . . , fn ))a = M (f1 (a ), . . . , fk −1 (a ), d(fk )a , fk +1 (a ), . . . , fn (a )).
k =1

Définissons maintenant la différentielle d’une application.

Définition 18.15 : Différentielle et application de classe C 1


• L’application f : U ⊂ E → F est dite différentiable sur U si f est différentiable en tout point de U .
On appelle alors différentielle de f l’application :

d f : U −→ L (E , F )
a 7−→ d f (a ) = d fa

• L’application f : U ⊂ E → F est dite de classe C 1 sur U , ou continûment différentiable sur U , si f est


différentiable sur U et si sa différentielle df est continue sur U .

Exemple
Si f : E → F est linéaire, f est différentiable et sa différentielle est constante : ∀a ∈ E , d f (a ) = f .

Exercice 4
Montrer que l’application (x , y ) 7→ x 2 − y 2 définie sur R2 est différentiable en tout point (a , b ) ∈ R2 et calculer
sa différentielle en (a , b ). Faire alors le lien avec les dérivées partielles de f en (a , b ).

B – Dérivées selon un vecteur et dérivées partielles

Définition 18.16 : Dérivée selon un vecteur


Soient f : U ⊂ E → F et a ∈ E . Si la fonction de la variable réelle t 7→ f (a + t u ) avec u ∈ E est dérivable
en 0, on dit alors que f est dérivable en a selon le vecteur u et on pose :

f (a + t u) − f (a )
Du (f )(a ) = lim
t →0 t

Quand une fonction est différentiable, elle est dérivable dans toutes les directions.

Proposition 18.17
Si f est différentiable en a alors f est dérivable en a selon u pour tout vecteur u ∈ E et Du (f )(a ) = d fa (u ).

Si E est muni d’une base (e1 , . . . , ep ), on peut définir les dérivées partielles de f qui sont des dérivées selon des
directions privilégiées.

Définition 18.18 : Dérivées partielles


Soit f : U ⊂ E → F . On suppose E muni d’une base (e1 , . . . , ep ). Pour j ∈ ⟦1, p ⟧, on appelle, sous réserve
d’existence, dérivée partielle en a d’indice j la dérivée de f en a suivant e j , c’est-à-dire :

∂f f (a + t e j ) − f (a ) f (a 1 , . . . , a j −1 , a j + t , a j +1 , . . . , a p ) − f (a )
(a ) = lim = lim
∂ xj t →0 t t →0 t

Si f est différentiable en a , alors les dérivées partielles existent et :

∂f
∀ j ∈ ⟦1, p ⟧, (a ) = dfa (e j )
∂ xj

Année 2023/2024 Lycée Louis-le-Grand – MP


10 Chap. 18 Calcul différentiel

!
p p p
X X X ∂f
Remarquons alors que par linéarité de dfa , dfa (h ) = dfa hj ej = h j d fa (e j ) = hj (a ).
j =1 j =1 j =1
∂ xj
En notant (abusivement) dx j les applications h 7→ h j ,
p
∂f ∂f X ∂f
d fa = (a )dx1 + · · · + (a )dxp = (a )dx j
∂ x1 ∂ xp j =1
∂ xj

Ainsi, lorsque f est différentiable sur U et si a ∈ U ,


p
X ∂f
f (a + h ) = f (a ) + d fa (h ) + o(∥h ∥) = f (a ) + hj (a ) + o(∥h ∥)
h →0 h →0
j =1
∂ xj

Théorème 18.19 : Caractérisation des applications de classe C 1


Soient f : U ⊂ E → F et (e1 , . . . , ep ) une base de E . f est de classe C 1 sur U si et seulement si les dérivées
partielles de f existent et sont continues en tout point de U .

Ce résultat est essentiel : il permet de justifier facilement la différentiabilité d’une fonction, à la seule condition
d’existence et de continuité des dérivées partielles (on obtient même en prime la continuité de la différentielle).

Démonstration (à passer en première lecture)


On note ∥ · ∥F une norme sur F . Soit (e1 , . . . , ep ) une base de E . L’équivalence des normes en dimension finie
Xp p
X
nous permet de choisir une norme particulière sur E , celle définie par ∥h ∥ = |h j | pour h = hj ej .
j =1 j =1
On munit L (E , F ) de la norme subordonnée ∥ · ∥op relative à ∥ · ∥ et ∥ · ∥F .
=⇒ Supposons la différentielle de f continue en tout point de l’ouvert U . L’existence des dérivées partielles
ayant été établie, il reste à justifier leur continuité. Soit a ∈ U . Pour tous x ∈ U et j ∈ ⟦1, p ⟧,

∂f ∂f
(x ) − (a ) = df x (e j ) − dfa (e j ) ⩽ df x − dfa · ∥e j ∥ −−→ 0
∂ xj ∂ xj F
F op x →a

⇐= Supposons maintenant l’existence et la continuité des dérivées partielles. Il s’agit de prouver que f
est différentiable en tout point a ∈ U et de justifier la continuité de la différentielle.
X p
Soient a ∈ U et h = h j e j tel que a + h ∈ U . Par dérivabilité de f suivant ep ,
j =1
! ! !
p p −1 p −1
X X ∂f X
f (a + h ) = f a+ hj ej = f a+ hj ej + hp a+ h j e j + o(∥h ∥)
j =1 j =1
∂ xp j =1

!
p −1
∂f X ∂f
Par continuité de en a , on obtient f (a + h ) = f a+ h j e j + hp (a ) + o(∥h ∥).
∂ ep j =1
∂ xp
p
∂f X
De proche en proche, f (a + h ) = f (a ) + hj (a ) + o(∥h ∥). f est bien différentiable en a et
h →0
j =1
∂ xj
p
X ∂f
d fa (h ) = hj (a ). Justifions désormais la continuité de la différentielle. Soit x ∈ U .
j =1
∂ xj
p
X ∂f ∂f ∂f ∂f
∀h ∈ E , ∥d f x (h ) − dfa (h )∥F ⩽ |h j | · (x ) − (a ) ⩽ ∥h ∥ · max (x ) − (a )
j =1
∂ xj ∂ xj F
1⩽ j ⩽p ∂ xj ∂ xj F

∂f ∂f ∂f
Ainsi, ∥df x − dfa ∥op ⩽ max (x ) − (a ) −−→ 0 par continuité des . ■
1⩽ j ⩽p ∂ xj ∂ xj F
x →a ∂ xj
Exercice 5
Montrer que l’application (x , y ) 7→ x 2 − y 2 définie sur R2 est de classe C 1 et déterminer sa différentielle.

© Mickaël PROST Année 2023/2024


Partie II – Applications différentiables, applications de classe C 1 11

∂f
Attention, les notations sont trompeuses ! ne désigne pas la dérivée d’une expression (ou d’une « grandeur »)
∂y
par rapport à y mais la dérivée d’une fonction par rapport à sa seconde variable. C’est une simple convention ;
on note parfois cette dérivée partielle ∂2 f pour alléger les calculs et lever toute ambiguïté.
Concluons ce paragraphe en mentionnant l’exemple d’une fonction qui admet des dérivées directionnelles
dans toutes les directions sans pour autant être différentiable (et encore moins C 1 !).

Exemple

Considérons la fonction :
 2
 x y si (x , y ) ̸= (0, 0)
f : (x , y ) 7→ x 2 + y 2
0 si (x , y ) = (0, 0)

L’application f est clairement de classe C 1 sur R2 \ {(0, 0)}.


Montrons qu’elle est continue sur R2 et qu’elle admet des
dérivées suivant toutes les directions sans pour autant être
différentiable 2 en (0, 0).

• L’application f est continue en (0, 0) puisque pour tout (x , y ) ̸= (0, 0),

| f (x , y )| = | f (r cos θ , r sin θ )| = |r cos2 θ sin θ | ⩽ |r | −−−−−−→ 0 = f (0, 0)


(x ,y )→(0,0)

• L’application f admet des dérivées suivant toute direction (a , b ) :

f (0 + t a , 0 + t b ) − f (0, 0) a 2b a 2b
∀(a , b ) ̸= (0, 0), ∀t ∈ R∗ , = −−→
t a 2 + b 2 t →0∗ a 2 + b 2
∂f ∂f
En particulier, (0, 0) = (0, 0) = 0. La dérivée directionnelle suivant la direction (1, 1) vaut 21 .
∂x ∂y

∂f ∂f
• Si f était différentiable en (0, 0), on aurait d f(0,0) (h1 , h2 ) = h1 (0, 0)+h2 (0, 0) = 0. Et pourtant, la dérivée
∂x ∂x
directionnelle suivant la direction (1, 1) n’est pas nulle.

C – Représentation matricielle de la différentielle en un point


On munit à nouveau nos espaces E et F des bases (e j )1⩽ j ⩽p et (ei′ )1⩽i ⩽n . Pour toute fonction f : E → F , on
peut alors écrire, moyennant une certaine identification,

f (x ) = f (x1 , . . . , xp ) = (f1 (x ), . . . , fn (x ))

∂ fi
On suppose f de classe C 1 . Les fonctions sont alors définies et continues pour tout (i , j ) ∈ ⟦1, n ⟧ × ⟦1, p ⟧.
∂ xj
Ce sont des fonctions définies sur Rp et à valeurs dans R.

Théorème / Définition 18.20 : Jacobienne


∂ fi
 

La matrice représentative de df x dans les bases (e j )1⩽ j ⩽p et (ei′ )1⩽i ⩽n est (x ) = ∂ j fi (x ) 1⩽i ⩽n .
∂ xj 1⩽i ⩽n 1⩽ j ⩽p
1⩽ j ⩽p
Elle est appelée matrice jacobienne 3 de f au point x = (x1 , . . . , xp ). On la note généralement J f (x ).

2. On observe sur la figure un « pincement » en (0, 0).


3. Charles Gustave Jacob Jacobi (1804-1851), mathématicien allemand dont les travaux ont notamment porté sur les équations aux
dérivées partielles et la théorie des nombres.

Année 2023/2024 Lycée Louis-le-Grand – MP


12 Chap. 18 Calcul différentiel

Ainsi, pour f : U → F de classe C 1 sur un ouvert U ⊂ E et x ∈ U , la jacobienne de f au point x est :

∂ f1 ∂ f1
 
(x ) . . . (x )
 ∂ x1 ∂ xp 
 .. .. 
J f (x ) = 
 . .


∂ f ∂ fn 
n
(x ) . . . (x )
∂ x1 ∂ xp

Exemple
Soit f : (x , y , z ) 7→ (2x + y z , cos(y ) + x 2 ). L’application
 est de classe
 C 1 sur R3 donc d f existe en tout point
2 2 0
de R3 . La jacobienne au point (1, 0, 2) est J f (1, 0, 2) = .
2 0 0
Ainsi, df(1,0,2) : R3 −→ R2
(x , y , z ) 7−→ (2x + 2y , 2x )

Soient f : E → F et g : F → G , de classe C 1 respectivement sur E et F . g ◦ f : E → F est de classe C 1 sur E et :

∀x ∈ E , Jg ◦ f (x ) = Jg (f (x )) × J f (x ) puisque d(g ◦ f ) x = dg f (x ) ◦ d f x

Ce produit matriciel nous permet de retrouver la fameuse règle de la chaîne (essayez !).

D – Gradient d’une fonction numérique


On considère dans ce paragraphe uniquement des fonctions à valeurs dans R et on suppose E , espace vectoriel
de dimension p , muni d’une structure euclidienne. Soit donc f : U ⊂ E → R avec bien souvent E = Rp . On
suppose f de classe C 1 sur l’ouvert U . D’après ce qui précède, en tout point a ∈ U , dfa est une forme linéaire
et, dans la base canonique B de Rp ,

∂f ∂f
 
p
d fa ∈ L (R ; R) et J f (a ) = MatB (d fa ) = (a ) · · · (a )
∂ x1 ∂ xp

On peut définir le gradient de f au point a au moyen de ses coordonnées dans la base B en posant :

∂f
 
(a )
 ∂ x1 
 . 
∇ f (a ) = 

.. 

∂f 
(a )
∂ xp

En notant 〈·, ·〉 le produit scalaire usuel de Rp , pour tout h ∈ Rp ,


p p
X ∂f X
〈∇f (a ), h 〉 = hj (a ) = h j d fa (e j ) = d fa (h )
j =1
∂ xj j =1

La différentiabilité de f au point a se traduit alors par l’égalité :

f (a + h ) = f (a ) + 〈∇f (a ), h 〉 + o(∥h ∥)
h →0

Il est également possible de définir le gradient de manière intrinsèque, sans l’usage des coordonnées et donc
d’une base de E , à l’aide du théorème de représentation de Riesz.

Définition 18.21
Soit f : U ⊂ E → R différentiable en a . L’application d fa étant une forme linéaire, il existe un vecteur
appelé gradient de f en a – et noté ∇ f (a ) – tel que pour tout h ∈ E ,

dfa (h ) = 〈∇f (a ), h 〉

© Mickaël PROST Année 2023/2024


Partie II – Applications différentiables, applications de classe C 1 13

Si f : U ⊂ E → R est différentiable en a , pour h proche de 0, l’inégalité de Cauchy-Schwarz donne :

| f (a + h ) − f (a )| ≈ 〈∇f (a ), h 〉 ⩽ ∥∇ f (a )∥ × ∥h ∥

L’écart absolu f (a +h )− f (a ) est maximal dans le cas d’égalité 〈∇f (a ), h 〉 = ∥∇ f (a )∥×∥h ∥, c’est-à-dire lorsque
la direction h est colinéaire au gradient. Comme annoncé lors de l’étude des fonctions de deux variables, le
gradient indique bien la ligne de plus grande pente, la direction où les variations sont les plus importantes.

E – Arcs paramétrés et dérivées le long d’un arc

On appelle arc paramétré de classe C k toute fonction vectorielle de classe C k , définie sur un intervalle I de R
et à valeurs dans E . Soit désormais un arc paramétré γ : I ⊂ R → E supposé de classe C 1 .

Soit t 0 ∈ I . On suppose que γ′ (t 0 ) ̸= 0. Alors, la courbe représentative de γ admet une tangente au point γ(t 0 ),
dirigée par le vecteur γ′ (t 0 ).
Pour prouver ce résultat, considérons la droite ∆t issue de M (t 0 ),
−−−−−−−→
γ′ (t 0 ) M (t 0 ) = γ(t 0 ) dirigée par le vecteur M (t 0 )M (t ), c’est-à-dire γ(t ) − γ(t 0 ), et faisons
tendre t vers t 0 : intuitivement, la droite limite sera tangente à la
M (t ) = γ(t ) courbe au point M (t 0 ). Plus formellement, on définit la tangente à
la courbe en M (t 0 ) comme la droite passant par M (t 0 ) et dirigée
−−−−−−−→
M (t 0 )M (t )
par lim −−−−−−−→ lorsque cette dernière existe.
∆t t →t 0
∥M (t 0 )M (t )∥
Sous les conditions précédentes, c’est le cas, car pour tout t ̸= t 0 ,

γ(t ) − γ(t 0 ) γ(t ) − γ(t 0 ) t − t0 ±γ′ (t 0 )


= · −−→
∥γ(t ) − γ(t 0 )∥ t − t0 ∥γ(t ) − γ(t 0 )∥ t →t 0 ∥γ′ (t 0 )∥
−−→
dO M
On retrouve un résultat couramment utilisé en mécanique du point : le vecteur vitesse (t 0 ), s’il est non
dt
nul, dirige la tangente à la courbe en M (t 0 ).

Soient désormais f : U ⊂ E → F et γ : I ⊂ R → E deux applications supposées de classe C 1 respectivement


sur l’espace normé E et l’intervalle I . L’application composée f ◦ γ est elle-même définie sur I et à valeurs
dans F . Géométriquement, c’est l’image de l’arc γ par la transformation f . Si M (t 0 ) est régulier, c’est-à-dire si
γ′ (t 0 ) ̸= 0E , γ′ (t 0 ) dirige la tangente à la courbe γ en M (t 0 ). Qu’en est-il pour la courbe f ◦ γ ?

Proposition 18.22 : Dérivation le long d’un arc


Si f : U ⊂ E → F et γ : I ⊂ R → U sont de classe C 1 , alors f ◦ γ est de classe C 1 sur I et :

∀t ∈ I , (f ◦ γ)′ (t ) = dfγ(t ) (γ′ (t ))

Démonstration
C’est le résultat d’une simple différentiation de composée d’applications différentiables :

∀t ∈ I , (f ◦ γ)′ (t ) = d(f ◦ γ)t (1) = (d fγ(t ) ◦ dγt )(1) = dfγ(t ) (γ′ (t ))

puisque que pour toute fonction g : I ⊂ R → F dérivable, g ′ (t ) = dg t (1). ■

La tangente à la courbe f ◦ γ en t 0 est dirigée par (f ◦ γ)′ (t 0 ) = d fγ(t 0 ) (γ′ (t 0 )) si celui-ci est non nul. Ce dernier
vecteur n’est rien d’autre que l’image du vecteur qui dirige la tangente à γ en t 0 par l’application linéaire d fγ(t 0 ) .

Ce résultat appelle plusieurs remarques :

• Si γ(t ) = x + t u avec x , u ∈ E , alors γ est un paramétrage de la droite affine passant par x et dirigée par u .
γ′ (t ) = u est comme attendu constante et alors, (f ◦ γ)′ (t ) = d fγ(t ) (u ).

Année 2023/2024 Lycée Louis-le-Grand – MP


14 Chap. 18 Calcul différentiel

• Si γ(t ) = (x1 (t ), . . . , xp (t )) est de classe C 1 , on généralise la règle de la chaîne :


p
X ∂f
(f ◦ γ)′ (t ) = d fγ(t ) (γ′ (t )) = x j′ (t ) (x1 (t ), . . . , xp (t ))
j =1
∂ xj

• Enfin, si f est une application numérique, (f ◦ γ)′ (t ) = dfγ(t ) (γ′ (t )) = 〈∇f (γ(t )), γ′ (t )〉.
Ajoutons que si l’on suppose toute ligne de niveau décrite par un paramétrage γ de classe C 1 , f ◦ γ est
constante. En dérivant, l’on obtient 〈∇f (γ(t )), γ′ (t )〉 = 0, ce qui assure l’orthogonalité du gradient aux
vecteurs qui dirigent les tangentes aux lignes de niveau (cf. l’illustration page 4).

Proposition 18.23 : Intégration le long d’un arc


Si f : U ⊂ E → F et γ : [0, 1] ⊂ R → U sont de classe C 1 et si γ(0) = a et γ(1) = b , alors :
Z1
f (b ) − f (a ) = dfγ(t ) (γ′ (t )) dt
0

Démonstration
La preuve est immédiate puisque l’on peut intégrer la fonction continue (f ◦ γ)′ sur [0, 1] :
Z1 Z1
dfγ(t ) (γ′ (t )) dt = (f ◦ γ)′ (t ) dt = f (γ(1)) − f (γ(0)) = f (b ) − f (a )
0 0

On notera que le résultat ne dépend pas du chemin choisi.

Corollaire 18.24 : Caractérisation des fonctions constantes


Soient U un ouvert connexe par arcs et f : U ⊂ E → F . Alors,

f est constante sur U si et seulement si pour tout a ∈ U , d fa = 0L (E ,F )

Démonstration
L’implication est simple. La réciproque est obtenue grâce à la forme intégrale prouvée ci-dessus. Attention,
cette dernière n’est valable que pour des chemins de classe C 1 . Conformément au programme, on restreindra
la démonstration au cas où l’ouvert U est supposé convexe.
Soient a , b ∈ U . On considère la fonction γ définie sur [0, 1] par γ(t ) = (1 − t )a + t b . γ est bien un chemin
de U de classe C 1 . Par nullité de la différentielle,
Z1 Z1
f (b ) − f (a ) = d fγ(t ) (γ′ (t )) dt = 0 dt = 0
0 0

Donc f (a ) = f (b ). f est bien constante. ■

On généralise ainsi un résultat bien connu : une fonction f ∈ C 1 (I , R) est constante sur l’intervalle I si et
seulement si f ′ est nulle sur l’intervalle I . Rappelons que les parties de R connexes par arcs sont les intervalles.

F – Vecteurs tangents à une partie


On étend maintenant la notion de vecteur tangent aux parties d’un espace vectoriel de dimension finie.

Définition 18.25 : Vecteur tangent


Si X est une partie de E et x un point de X , un vecteur v de E est tangent à X en x s’il existe ϵ > 0 et un
arc paramétré γ défini sur ] − ϵ, ϵ[, dérivable en 0 et à valeurs dans X , tels que γ(0) = x , γ′ (0) = v .
On note Tx X l’ensemble des vecteurs tangents à X en x .

Un tel ensemble Tx X n’est pas, en général, un espace vectoriel bien que les exemples suivants puissent suggérer
le contraire. Pour déterminer les vecteurs tangents à une partie, on procède souvent par double inclusion.

© Mickaël PROST Année 2023/2024


Partie II – Applications différentiables, applications de classe C 1 15

Exemple
Si E est un sous-espace affine de dimension finie et de direction E , alors, en tout point x ∈ E , Tx E = E .

• Soit v ∈ E . Il suffit de considérer la droite de E paramétrée par


γ(t ) = x + t v pour vérifier que v ∈ Tx E .
x γ(t ) • Réciproquement, soient v ∈ Tx E et γ un arc de classe C 1 défini
sur ] − ϵ, ϵ[, à valeurs dans E et tel que γ(0) = x et γ′ (0) = v .
E
γ(t ) − γ(0)
∀t ∈] − ϵ, ϵ[\{0}, ∈E
v t
E
Par passage à la limite, E étant fermé en tant qu’espace vectoriel
de dimension finie, γ′ (0) = v ∈ E .

Exercice 6
Soit E un espace euclidien. Montrer que :
(i) pour tout point x ∈ B(0, 1), Tx B(0, 1) = E .
(ii) pour tout point x ∈ S (0, 1), Tx S (0, 1) = Vect(x )⊥ .

Concluons cette série d’exemples par l’étude du plan tangent (affine) à une surface de R3 d’équation z = f (x , y )
en un point donné. Soient S la surface d’équation z = f (x , y ) où f : R2 → R est supposée de classe C 1 et
M 0 (x0 , y0 , z 0 ) un point de S . Le plan tangent en M 0 peut être défini comme la réunion des tangentes aux
courbes tracées le long de S passant par le point M 0 , c’est-à-dire comme le plan affine passant par M 0 et de
direction le plan vectoriel TM 0 S . Il reste à vérifier que TM 0 S est, comme attendu, un plan vectoriel !

• On construit un arc sur S en considérant deux fonctions


x , y :]−ϵ, ϵ[→ R de classe C 1 vérifiant x (0) = x0 et y (0) = y0
n
et γ définie par :

∀t ∈] − ϵ, ϵ[, γ(t ) = (x (t ), y (t ), f (x (t ), y (t )))


v1

Cette application γ est de classe C 1 sur ] − ϵ, ϵ[, à valeurs v2


dans S et vérifie γ(0) = M 0 . En dérivant γ et en évaluant
en 0, on obtient :

∂f ∂f
γ′ (0) = (x ′ (0), y ′ (0), x ′ (0) (x0 , y0 ) + y ′ (0) (x0 , y0 ))
∂x ∂y Représentation de deux courbes tracées le long
d’une surface et des vecteurs tangents associés

Ce vecteur tangent à la courbe en M 0 est, quel que soit l’arc γ considéré, orthogonal au vecteur :

∂f ∂f
 ‹
n= (x0 , y0 ), (x0 , y0 ), −1
∂x ∂y

• Réciproquement, soit v = (v1 , v2 , v3 ) orthogonal à n . Il suffit de considérer l’arc γ défini par :

∀t ∈] − ϵ, ϵ[, γ(t ) = (x0 + t v1 , y0 + t v2 , f (x0 + t v1 , y0 + t v2 ))

pour constater que v ∈ TM 0 S . En effet, γ est de classe C 1 et à valeurs dans S , γ(0) = M 0 et γ′ (0) = v .
Nous venons ainsi de prouver que TM 0 S = Vect(n )⊥ .
Le plan tangent à S en M 0 peut alors être défini comme l’unique plan passant par M 0 et de vecteur normal n.
On retrouve l’équation déjà donnée par troncature à l’ordre 1 du développement limité de f en (x0 , y0 ) :

∂f ∂f
z = f (x0 , y0 ) + (x0 , y0 ) · (x − x0 ) + (x0 , y0 ) · (y − y0 )
∂x ∂y

Année 2023/2024 Lycée Louis-le-Grand – MP


16 Chap. 18 Calcul différentiel

La description d’une surface de R3 par une équation de la forme z = f (x , y ) n’englobe cependant qu’un
nombre restreint de surfaces de l’espace. On définit plus généralement une surface de R3 par la donnée d’une
équation implicite g (x , y , z ) = 0, comme par exemple (x − x0 )2 + (y − y0 )2 + (z − z 0 )2 = R 2 . Il n’est pas toujours
possible d’exprimer z en fonction de x et y pour se ramener au cas particulier précédent. Le théorème suivant
permet de contourner cette objection pour déterminer le plan tangent à une telle surface. Sa démonstration
(hors programme) fait appel au théorème des fonctions implicites, ce dernier précisant les conditions pour
exprimer localement z comme une fonction de x et de y .

Théorème 18.26 : Hyperplan tangent


Soient g une fonction numérique de classe C 1 sur l’ouvert U , X l’ensemble des zéros de g et x ∈ X . Si
dg x est non nulle, Tx X = Ker(dg x ) = ∇g (x )⊥ .

Démonstration
Soient g : U ⊂ Rp → R de classe C 1 , X l’hypersurface d’équation g (x1 , . . . , xp ) = 0 et x ∈ X tel que dg x =
̸ 0.
Montrons que Tx X = Ker(dg x ) = ∇g (x ) .

Remarquons pour commencer que dg x ̸= 0L (Rp ,R) , Ker(dg x ) est un hyperplan de Rp . De plus,

h ∈ Ker(dg x ) ⇐⇒ dg x (h ) = 0 ⇐⇒ 〈∇g (x ), h 〉 = 0 ⇐⇒ h ∈ ∇g (x )⊥

⊂ Soit v ∈ Tx X . Il existe donc γ :] − ϵ, ϵ[→ X de classe C 1 tel que γ(0) = x et γ′ (0) = v .

∀t ∈] − ϵ, ϵ[, g (γ(t )) = 0 donc dg γ(t ) (γ′ (t )) = 0

En évaluant en 0, il vient dg x (v ) = 0. Ainsi, Tx X ⊂ Ker(dg x ).


⊃ Admis. ■

Le plan tangent à une surface S d’équation g (x , y , z ) = 0 en M 0 (x0 , y0 , z 0 ) est donc le plan affine passant par
M 0 et de direction le plan vectoriel TM 0 S = ∇g (x0 , y0 , z 0 )⊥ . Il a donc pour équation :

∂g ∂g ∂g
(x0 , y0 , z 0 ) · (x − x0 ) + (x0 , y0 , z 0 ) · (y − y0 ) + (x0 , y0 , z 0 ) · (z − z 0 ) = 0 où g (x0 , y0 , z 0 ) = 0
∂x ∂y ∂z

Exercice 7
Déterminer une équation du plan tangent à la sphère unité de R3 , muni de sa structure euclidienne, en un
point M 0 (x0 , y0 , z 0 ).

III | Applications de classe C k


Pour définir les dérivées partielles d’ordres supérieurs, il suffit tout bonnement de... dériver les dérivées !
∂ 2f ∂f
On notera, sous réserve d’existence, ou ∂i , j f la dérivée partielle d’indice i de la dérivée partielle .
∂ xi ∂ x j ∂ xj
On définit plus généralement par récurrence les dérivées partielles d’ordre k pour tout k ∈ N∗ :

∂kf ∂ ∂ k −1 f
 
=
∂ x jk · · · ∂ x j1 ∂ x jk ∂ x jk −1 · · · ∂ x j1

Définition 18.27 : Application de classe C k


Une application est dite de classe C k sur un ouvert U si toutes ses dérivées partielles d’ordre k existent
et sont continues.

Les sommes et composées de fonctions de classe C k sont encore de classe C k , les fonctions polynomiales
sont de classe C ∞ ...

© Mickaël PROST Année 2023/2024


Partie IV – Optimisation avec et sans contrainte 17

Théorème 18.28 : Théorème de Schwarz


Soit f : U ⊂ E → F une application de classe C 2 sur un ouvert U ⊂ E . Alors,

∂ 2f ∂ 2f
∀i , j ∈ ⟦1, p ⟧, ∀x ∈ U , (x ) = (x )
∂ xi ∂ x j ∂ x j ∂ xi

Ce théorème, que l’on admet, s’étend aux dérivées d’ordres supérieurs. Il montre que l’ordre de dérivation
importe peu, du moment que la fonction est suffisamment régulière.

Exercice 8

(i) Justifier l’existence et calculer les dérivées partielles secondes sur R2 de f : (x , y ) 7→ x sin(y ) + x 2 .
 2 2
 x y · x − y si (x , y ) ̸= (0, 0)
∂ g
2
∂ g
2
(ii) Comparer (0, 0) et (0, 0) puis conclure, lorsque g (x , y ) = x2 + y 2
∂ x∂ y ∂ y∂ x
0 si (x , y ) = (0, 0)

IV | Optimisation avec et sans contrainte


Dans cette section, f : U ⊂ E → R désignera une application de classe C 2 définie sur un ouvert U d’un espace
vectoriel de dimension n , souvent Rn , et à valeurs dans R.

A – Formule de Taylor-Young à l’ordre 2 pour une fonction numérique


Pour les besoins de notre étude, commençons par énoncer la formule de Taylor-Young à l’ordre 2. Cette dernière
nous permet d’améliorer notre grand principe introductif de la façon suivante :
       
accroissement terme linéaire par rapport terme quadratique par rapport terme
= + +
de la fonction à l’accroissement de la variable à l’accroissement de la variable correctif

Théorème 18.29 : Formule de Taylor-Young à l’ordre 2


Si f : U ⊂ E → R est de classe C 2 sur un ouvert U de E alors, pour tout a ∈ U :
n
X ∂f 1 X ∂ 2f
f (a + h ) = f (a ) + hj (a ) + hi h j (a ) + o(∥h ∥2 )
h →0
j =1
∂ xj 2 1⩽i , j ⩽n ∂ xi ∂ x j

Démonstration (à passer en première lecture)


Soit a ∈ U . U étant ouvert, il existe r > 0 tel que pour tous h ∈ B(a , r ) et t ∈ [0, 1], a + t h ∈ U .
• On introduit la fonction de la variable réelle ϕ définie sur [0, 1] par ϕ(t ) = f (a + t h ). ϕ est de classe C 2
comme composée de fonctions de classe C 2 et :
n n X n

X ∂f ′′
X ∂ 2f
∀t ∈ [0, 1], ϕ (t ) = hj (a + t h ) et ϕ (t ) = hi h j (a + t h )
j =1
∂ xj i =1 j =1
∂ xi ∂ x j

Z 1

La formule de Taylor avec reste intégral à l’ordre 2 pour ϕ, i.e. ϕ(1) = ϕ(0) + ϕ (0) + (1 − t )ϕ ′′ (t ) dt , nous
0
donne celle relative à f :
 
n 1 n X
n
∂f ∂ f
2
Z
X X
f (a + h ) = f (a ) + hj (a ) + (1 − t )  hi h j (a + t h ) dt
j =1
∂ xj 0 i =1 j =1
∂ xi ∂ x j

Année 2023/2024 Lycée Louis-le-Grand – MP


18 Chap. 18 Calcul différentiel

• Exploitons maintenant la continuité des dérivées partielles secondes :

∂ 2f ∂ 2f
∀i , j ∈ ⟦1, n ⟧, (a + t h ) = (a ) + ϵi , j (t h ) où ϵi , j (u ) −−−→ 0
∂ xi ∂ x j ∂ xi ∂ x j u→0E

La formule de Taylor avec reste intégral devient :


n 1
∂f ∂ 2f
Z
X 1 X X
f (a + h ) = f (a ) + hj (a ) + hi h j (a ) + hi h j (1 − t )ϵi , j (t h ) dt
j =1
∂ xj 2 1⩽i , j ⩽n ∂ xi ∂ x j 1⩽i , j ⩽n 0

X
Z 1
Il reste à prouver que R (h ) = hi h j (1 − t )ϵi , j (t h ) dt = o(∥h ∥2 ).
h →0
1⩽i , j ⩽n 0

Pour cela, fixons ϵ > 0. Il existe δ > 0 tel que pour tous i , j ∈ ⟦1, p ⟧, si ∥u ∥ ⩽ δ alors |ϵi , j (u)| < ϵ.
Soit h ∈ E tel que ∥h ∥ ⩽ δ. Alors, pour tout t ∈ [0, 1], ∥t h ∥ ⩽ δ et donc :
1 1
ϵ
Z Z
∀i , j ∈ ⟦1, p ⟧, (1 − t )ϵi , j (t h ) ⩽ ϵ (1 − t ) dt =
0 0
2

Ainsi, chaque terme de la somme est un o(hi h j ). De plus, |hi h j | ⩽ ∥h ∥2∞ donc R (h ) = o(∥h ∥2 ). ■
h →0

La formule de Taylor-Young à l’ordre 2 se réécrit sous la forme plus concise suivante :

1
f (a + h ) = f (a ) + d fa (h ) + d2 fa (h , h ) + o(∥h ∥2 )
h →0 2
X ∂ 2f
où l’application bilinéaire d2 fa : (h , k ) 7→ hi k j (a ) est appelée différentielle seconde 4 de f en a .
1⩽i , j ⩽n
∂ xi ∂ x j

Il importe de savoir réécrire la formule pour une fonction de deux variables (usage le plus fréquent) :

∂f ∂f
f (x0 + h1 , y0 + h2 ) = f (x0 , y0 ) + (x0 , y0 ) · h1 + (x0 , y0 ) · h2
(h1 ,h2 )→(0,0) ∂x ∂y
1 ∂ f ∂ 2f ∂ 2f
 2 
2
+ (x0 , y0 ) · h1 + 2 (x0 , y0 ) · h1 h2 + (x0 , y0 ) · h2 + o(h12 + h22 )
2
2 ∂ x2 ∂ x∂ y ∂ y2

L’application f étant à valeurs dans R, nous disposons d’une écriture matricielle de la formule de Taylor-Young
à l’ordre 2 assez commode. Elle s’appuie sur les relations suivantes :
n
X ∂f X ∂ 2f
dfa (h ) = hj (a ) = 〈∇f (a ), h 〉 et d2 fa (h ) = hi h j (a ) = 〈H f (a )h , h 〉
j =1
∂ xj 1⩽i , j ⩽n
∂ xi ∂ x j

∂ 2f
 
où l’on a noté h = (h j )1⩽ j ⩽n et H f (a ) = (a )
∂ xi ∂ x j 1⩽i , j ⩽n

Définition 18.30 : Hessienne


La hessienne au point a ∈ U de la fonction numérique f : U ⊂ Rn → R de classe C 2 est la matrice :
 ∂ 2f ∂ 2f

(a ) ... (a )
  ∂ x1 2 ∂ x1 ∂ xn
∂ 2f
 
.. .. ..
H f (a ) = (a ) =   ∈ Sn (R)
 
. . .
∂ xi ∂ x j 2
∂ f ∂ 2f
 
(a ) ... (a )
∂ x1 ∂ xn ∂ xn 2

4. l’étude de la différentielle seconde ne figure pas au programme

© Mickaël PROST Année 2023/2024


Partie IV – Optimisation avec et sans contrainte 19

Notons que la hessienne est bien symétrique, dès lors que f est de classe C 2 , en vertu du théorème de Schwarz.
On retiendra la version matricielle suivante de la formule de Taylor-Young à l’ordre 2 pour une fonction de
classe C 2 sur un ouvert U de E . Pour tout a ∈ U ,

1 1
f (a + h ) = f (a ) + 〈∇f (a ), h 〉 + 〈H f (a )h , h 〉 + o(∥h ∥2 ) = f (a ) + ∇f (a )⊤ h + h ⊤ H f (a )h + o(∥h ∥2 )
h →0 2 h →0 2

B – Étude des extrema libres


Par la suite, f désignera une application définie sur une partie A de E , espace vectoriel de dimension n, et à
valeurs dans R.

Définition 18.31 : Extremum


On dit que f admet un minimum local (resp. un maximum local) en a ∈ A s’il existe un voisinage U de a
tel que :
∀x ∈ U , f (x ) ⩾ f (a ) (respectivement f (x ) ⩽ f (a ))
Le minimum (resp. le maximum) est qualifié de global lorsque l’inégalité est valable sur A.

Rappelons que si A est une partie compacte de E , f admet nécessairement un minimum et un maximum. De
plus, pour une fonction de la variable réelle f de classe C 1 sur un intervalle I :
• si f atteint un extremum local en a ∈ I , f ′ (a ) = 0 ;
• f ′ peut s’annuler sans que f atteigne un extremum (cf. x 7→ x 3 sur ] − 1, 1[) ;
• si I n’est pas ouvert, f peut atteindre un extremum sans que sa dérivée s’annule (cf. x 7→ x sur [0, 1]).
Ajoutons que lorsque f est de classe C 2 :
• si f atteint un minimum local en a ∈  I , f ′′ (a ) ⩾ 0 ;
• si f ′ (a ) = 0 et f ′′ (a ) > 0 pour a ∈ 
I , f atteint un minimum local.
La recherche des extrema ne diffère guère de celle que les lecteurs connaissent pour les fonctions de la variable
réelle. On prendra garde au fait que la plupart des résultats énoncés ci-dessous sont valables uniquement sur
des parties ouvertes. Il sera donc parfois nécessaire de dissocier la recherche des extrema de f à l’intérieur
de A et le long de sa frontière.

1 – Condition du premier ordre

Définition 18.32 : Point critique


Soit f une fonction de classe C 1 sur un ouvert U de E . On dit que a ∈ U est un point critique de f si :
−→
dfa = 0L (E ,R) soit ∇f (a ) = 0

∂f
Cela revient à dire que pour tout j ∈ ⟦1, n ⟧, (a ) = 0.
∂ xj

Théorème 18.33 : Condition nécessaire d’existence d’un extremum


Si f : U ⊂ E → R de classe C 1 sur un ouvert U admet un extremum en a , alors a est un point critique.

Démonstration
Soit j ∈ ⟦1, n⟧. Supposons que f atteigne un extremum en a ∈ U . Alors, l’application de la variable réelle
∂f
ϕ : t 7→ f (a + t e j ) est de classe C 1 au voisinage de 0 et admet un extremum en 0. Ainsi, ϕ ′ (0) = (a ) = 0. ■
∂ xj

Les extremums locaux sont donc à rechercher parmi les points critiques. Cependant, comme en dimension 1,
la réciproque est fausse ! Tout point critique ne correspond pas nécessairement à un extremum local.

Année 2023/2024 Lycée Louis-le-Grand – MP


20 Chap. 18 Calcul différentiel

Exemple (Point selle)


Soit la fonction f : (x , y ) 7→ x 2 − y 2 ; f ∈ C 1 (R2 , R) et :

∀(x , y ) ∈ R2 , ∇ f (x , y ) = (2x , −2y )

f admet (0, 0) comme seul point critique mais ce point ne


correspond ni à un maximum, ni à un minimum. En effet,
f (0, 0) = 0 et pour tous x , y non nuls,

f (x , 0) = x 2 > f (0, 0) et f (0, y ) = −y 2 < f (0, 0)


Point selle (ou point col)
Il sera donc nécessaire lors de l’étude d’une fonction de distinguer les points cols des points correspondant à
des extrema. Pour justifier que l’on dispose d’un extrema, on peut revenir à la définition d’un extremum.

Exemple
On considère la fonction f : R2 → R définie par :

f (x , y ) = x 2 + x y + y 2 + 2x + 3y

• Recherche des points critiques


f est de classe C 1 sur R2 car polynomiale.

∀(x , y ) ∈ R2 , ∇f (x , y ) = (2x + y + 2, 2y + x + 3)

Il y a un seul point critique : M 0 (−1/3, −4/3). Présence d’un minimum


• Détermination des extrema
Étudions la fonction au voisinage de M 0 . f (−1/3, −4/3) = −7/3 et :

3 1
f (−1/3 + h , −4/3 + k ) − f (−1/3, −4/3) = h 2 + h k + k 2 = (h + k )2 + (h − k )2 ⩾ 0
4 4
Ainsi, f atteint en M 0 un minimum (global) que l’on visualise bien sur le paraboloïde ci-dessus.

Exercice 9
Soient (E , 〈·, ·〉) un espace préhilbertien, F un sous-espace vectoriel de dimension finie de E et a ∈ E .
(i) Montrer que l’application f : u 7→ ∥u − a ∥ admet un minimum sur F en calculant lim f (u ).
∥u ∥→+∞
(ii) Justifier que ce minimum est atteint en un seul x ∈ F . Que dire de x ?

2 – Condition du second ordre

L’étude globale du signe de f (x , y ) − f (x0 , y0 ) menée dans l’exemple précédent pour justifier la présence d’un
minimum n’est pas satisfaisante car difficilement reproductible pour une fonction quelconque. Pour pallier
cette difficulté, il suffit de pousser l’étude locale au voisinage d’un point critique au moyen de la formule de
Taylor-Young. En effet, si f est de classe C 2 sur l’ouvert U et a un point critique de f , alors :
1
f (a + h ) = f (a ) + h ⊤ H f (a )h + o(∥h ∥2 )
h →0 2
Le signe de f (a + h ) − f (a ) est localement celui de 〈H f (a )h , h 〉 = h ⊤ H f (a )h , ce qui conduit au résultat suivant.

Théorème 18.34 : Condition suffisante d’existence d’un extremum


Soient f : U ⊂ E → R de classe C 2 sur l’ouvert U et a ∈ U .
• si f atteint en a un minimum local, H f (a ) ∈ S+n (R).
• si a est un point critique de f et si H f (a ) ∈ S++
n (R), alors f atteint en a un minimum local.

Bien entendu, appliqué à − f , le théorème précédent affirme que lorsque a est un point critique de f et si
H f (a ) ∈ S−n − (R), alors f atteint en a un maximum local.

© Mickaël PROST Année 2023/2024


Partie IV – Optimisation avec et sans contrainte 21

Démonstration
Soient f : U ⊂ E → R de classe C 2 sur l’ouvert U et a ∈ U .
• Supposons que f (a ) est un minimum local de f . Alors a est un point critique de f . De plus, si h ∈ E , pour
tout t ∈ R suffisamment petit, a + t h ∈ U et f (a + t h ) − f (a ) ⩾ 0.
t2 2
〈H f (a )h , h 〉 + o(t 2 ) c’est-à-dire, 〈H f (a )h , h 〉 =

Or, f (a + t h ) − f (a ) = f (a + t h ) − f (a ) + o(1).
t →0 2 t →0∗ t 2
Un passage à la limite permet de conclure : 〈H f (a )h , h 〉 ⩾ 0 pour tout h ∈ E .
• Supposons maintenant que a est un point critique de f et que H f (a ) ∈ S++ n (R). Alors, en notant λmin la
plus petite des valeurs propres (nécessairement réelle) de H f (a ), d’après le théorème spectral,

∀h ∈ E \ {0E }, 〈H f (a )h , h 〉 ⩾ λmin ∥h ∥2 > 0

f (a + h ) − f (a ) = 12 h ⊤ H f (a )h + ∥h ∥2 ϵ(h ) avec ϵ(u ) −−→ 0. Il existe donc r > 0 tel que pour tout h ∈ B(0, r ),
u→0
2 ∥h ∥2
∥h ∥ ϵ(h ) ⩽ λmin . Ainsi, pour tout h ∈ B(0, r ),
4
1 ∥h ∥2 ∥h ∥2 ∥h ∥2
f (a + h ) − f (a ) = h ⊤ H f (a )h + ∥h ∥2 ϵ(h ) ⩾ λmin − λmin = λmin ⩾0
2 2 4 4
f (a ) est bien un minimum local de f . ■

Corollaire 18.35
Soient f : U ⊂ E → R de classe C 2 sur l’ouvert U et a ∈ U un point critique de f .
• Si Sp(H f (a )) ⊂ R∗+ , f atteint en a un minimum.
• Si Sp(H f (a )) ⊂ R∗− , f atteint en a un maximum.
• Si H f (a ) possède deux valeurs propres de signes distincts, a est un point selle.

Lorsque les valeurs propres H f (a ) sont seulement supposées positives (ou négatives), on ne peut pas conclure.
On notera que pour n = 2, on dispose d’une caractérisation simple au moyen du déterminant et de la trace. En
effet, en notant λ et µ les deux valeurs propres de H f (a ), det(H f (a )) = λµ et Tr(H f (a )) = λ + µ.

Corollaire 18.36
Soient f : U ⊂ R2 → R de classe C 2 sur l’ouvert U et a ∈ U un point critique de f .
• Si det(H f (a )) > 0, f admet un extremum en a .
Il s’agit d’un minimum lorsque Tr(H f (a )) > 0, d’un maximum sinon.
• Si det(H f (a )) < 0, f admet un point selle.
• Si det(H f (a )) = 0, on ne peut pas conclure.

Pour le dernier cas, on pourra penser aux fonctions x 7→ x 3 et x 7→ x 4 de dérivée et dérivée seconde nulles en 0.

Exemple
On considère la fonction f : R2 → R définie par :

f (x , y ) = x 4 + y 4 − (x − y )2

• La fonction f est de classe C 2 sur R2 en tant que fonction polynomiale.


• Recherche des points critiques

4x 3 − 2(x − y ) = 0 x 3 = −y 3 x = −y
¨ ¨ ¨
−→
∇f (x , y ) = 0 ⇐⇒ ⇐⇒ ⇐⇒
4y 3 + 2(x − y ) = 0 4x 3 − 2(x − y ) = 0 x3 − x = 0

Nous avons donc trois points criques : A(1, −1), B (−1, 1) et C (0, 0).

Année 2023/2024 Lycée Louis-le-Grand – MP


22 Chap. 18 Calcul différentiel

• Détermination des extrema  


12x 2 − 2 2
La hessienne en un point critique (x , y ) est H f (x , y ) = .
2 12y 2 − 2
⋆ Extremum au point A(1, −1) ?
det(H f (A)) = 96 > 0 et Tr(H f (A)) = 20 > 0 donc f présente
un minimum local en (1, −1) qui vaut f (1, −1) = −2.
⋆ Extremum au point B (−1, 1) ?
5
Par symétrie, f présente un minimum local en (−1, 1).
⋆ Extremum au point C (0, 0) ?
0
det(H f (C )) = 0, on ne peut pas conclure directement.
1 On remarquera cependant que f (0, 0) = 0 et que :
0
−1
0
1 −1 f (x , x ) = 2x 4 > 0 pour x ̸= 0

Représentation de la surface d’équation et f (x , 0) = x 2 (x 2 − 1) < 0 pour x ∈] − 1, 1[


z = f (x , y )
On trouve ici un point selle.

C – Étude des extrema liés


On cherche dans cette dernière partie à déterminer les extrema d’une fonction f : U ⊂ E → R de classe C 1
sous la contrainte g (x ) = 0, où g est elle-même une fonction numérique de classe C 1 sur U .
Pour déterminer min f (x ), une approche naïve consiste à tirer de la contrainte g (x1 , . . . , xn ) = 0 une relation de
g (x )=0
la forme xn = ϕ(x1 , . . . , xn−1 ). On se ramène de la sorte aux techniques d’optimisation du paragraphe précédent :

min f (x ) = min f (x1 , . . . , xn−1 , ϕ(x1 , . . . , xn −1 ))


g (x )=0 (x1 ,...,xn −1 )∈U ′

où U ′ serait une partie de E à préciser.

Exercice 10
Déterminer de deux manières min x y .
x 2 +y 2 =1

Néanmoins, même si des résultats spécifiques justifient, sous la condition dg x ̸= 0, la possibilité d’exprimer
une des variables en fonction des autres, l’approche proposée s’avère en pratique rapidement inopérante : on
ne dispose pas en général d’une expression explicite et cette dernière n’est souvent valable que localement.

La mathématicien Joseph-Louis Lagrange a proposé une y


autre démarche, fondée sur le point de vue géométrique sui-
vant. Considérons la fonction f définie sur R2 par f (x , y ) =
x 2 + y 2 et une contrainte de la forme g (x , y ) = 0 où g : R2 → R f (x , y ) = cste
est supposée de classe C 1 . f atteint un minimum (global) en g (x , y ) = 0
(0, 0) mais celui-ci diffère de min f (x , y ) si g (0, 0) ̸= 0.
g (x ,y )=0 M0
Comme l’illustre le graphe ci-contre, lorsque f admet
en M 0 = (x0 , y0 ) un minimum sous la contrainte g (x0 , y0 ) = 0, x
la ligne de niveau relative à f en M 0 est tangente à la courbe
d’équation g (x , y ) = 0. En d’autres termes, les deux gradients
∇f (M 0 ) et ∇g (M 0 ) sont colinéaires : ∇f (M 0 ) = λ∇g (M 0 ).
Le rapport λ est appelé multiplicateur de Lagrange.

Théorème 18.37 : Multiplicateur de Lagrange


Soient f et g deux fonctions numériques de classe C 1 sur l’ouvert U de E et X = {x ∈ U | g (x ) = 0}.
Si la restriction de f à X admet un extremum local en a ∈ X et dg a ̸= 0, alors dfa est colinéaire à dg a .

© Mickaël PROST Année 2023/2024


Partie IV – Optimisation avec et sans contrainte 23

Démonstration
• Si dfa est nulle, alors dfa = λdg a avec λ = 0. Supposons désormais dfa non nulle.
• Rappelons que deux formes linéaires non nulles ϕ et ψ ont même noyau si et seulement s’il existe λ ∈ R∗
tel que ϕ = λψ (cf. « Compléments d’algèbre linéaire »). Prouvons donc que Ker(dg a ) = Ker(d fa ).
L’application dg a étant non nulle, Ker(dg a ) = Ta X . Soit x ∈ Ker(dg a ). On sait qu’il existe γ :] − ϵ, ϵ[→ X de
classe C 1 tel que γ(0) = a et γ′ (0) = x . De plus, f|X admet un extremum local en a donc f ◦ γ admet un
extremum local en 0, point intérieur de ] − ϵ, ϵ[. Ainsi,

(f ◦ γ)′ (0) = d fγ(0) (γ′ (0)) = d fa (x ) = 0

Donc x ∈ Ker(d fa ). Par égalité des dimensions, Ker(d fa ) = Ker(dg a ).


D’où l’existence de λ ∈ R∗ tel que d fa = λdg a . ■

Précisons que cette condition n’est que nécessaire et qu’il sera en général indispensable d’accompagner cette
recherche de points critiques (toujours sur un ouvert !) d’une étude locale pour distinguer les extrema des
points selles ou d’un argument de compacité.

Exemple
Déterminons à nouveau min x y en posant cette fois-ci f (x , y ) = x y et g (x , y ) = x 2 + y 2 − 1.
x 2 +y 2 =1

• Les deux fonctions numériques f et g sont polynomiales donc de classe C ∞ sur l’ouvert R2 .
• Le cercle unité X = {(x , y ) ∈ R2 | g (x , y ) = 0} étant compact, f|X admet un minimum en (x0 , y0 ) ∈ X .
   
y x
• ∇f (x , y ) = et ∇g (x , y ) = 2 ̸= 0 pour tout (x , y ) ∈ X . D’après ce qui précède, il existe λ ∈ R∗ tel que :
x y

 y0 = 2λx0

x0 = 2λy0
 2
x0 + y02 = 1

1 1 1 1 1 1 1
 ‹  ‹
On trouve (x0 , y0 , λ) = ± p , ± p , ou bien (x0 , y0 , λ) = ± p , ∓ p , − . D’où min x y = − .
2 2 2 2 2 2 x +y =1
2 2 2
Exercice 11 (CCP 2023)
Soit f l’application définie sur R2 par f (x , y ) = 4x 2 + 12x y − y 2 . On note C = {(x , y ) ∈ R2 | x 2 + y 2 = 13}.
(i) Montrer que f admet un minimum et un maximum sur C .
(ii) Les déterminer.

Exercice 12 (inégalité arithmético-géométrique)


En considérant l’application f : (x1 , . . . , xn ) ∈ Rn 7→ x1 × · · · × xn et la contrainte C s = {(x1 , . . . , xn ) ∈ Rn+ | x1 +
· · · + xn = s }, retrouver l’inégalité arithmético-géométrique.

Rajoutons pour finir le résultat plus général suivant, hors programme.

Théorème 18.38 : Multiplicateurs de Lagrange (HP, pour votre culture)


Soient f et g 1 , . . . , g p des fonctions numériques de classe C 1 sur l’ouvert U de E et :

X = {x ∈ U | g 1 (x ) = · · · = g p (x ) = 0}

Si la restriction de f à X admet un extremum local en a ∈ X et si les formes linéaires dg 1,a , . . . , dg p ,a sont


indépendantes, alors il existe λ1 , . . . , λp ∈ R tels que d fa = λ1 dg 1,a + . . . + λp dg p ,a .
Les réels λ1 , . . . , λp sont appelés multiplicateurs de Lagrange.

Année 2023/2024 Lycée Louis-le-Grand – MP

Vous aimerez peut-être aussi