17 Fonctions Convexes Chapitre

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 14

Chapitre 17.

Fonctions convexes

Plan du chapitre
1 Parties convexes du plan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . page 2
1.1 Barycentres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . page 2
1.2 Convexes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . page 3
1.2.1 Segments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . page 3
1.2.2 Parties convexes du plan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . page 4
2 Fonctions convexes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . page 4
2.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . page 4
2.2 Caractérisation par la « fonction pente » . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . page 8
2.3 Caractérisation des fonctions convexes dérivables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . page 9
2.4 Tangentes au graphe d’une fonction convexe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . page 11
2.5 Inégalités de convexité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . page 12

c Jean-Louis Rouget, 2021. Tous droits réservés. 1 http ://www.maths-france.fr


1 Parties convexes du plan

1.1 Barycentres

Si on place dans chacun des deux plateaux d’une balance des masses respectives de 1 kg et 2 kg, le point d’équilibre « est
aux deux tiers ». On partage le segment [A, B] en trois segments égaux. On laisse un segment du côté de B qui est deux
fois plus lourd et deux segments du côté de A et on place le fléau de la balance au point G dessiné ci-dessous.

A G B
b b b

−→ 2 −→ −→ −→ − →
Le point G vérifie l’égalité AG = AB ou aussi GA + 2GB = 0 . L’affixe g du point G vérifie (en notant a et b les affixes
3
respectives des points A et B)
−→ −→ − → a + 2b
GA + 2GB = 0 ⇔ (g − a) + 2(g − b) = 0 ⇔ g = .
1+2
1 2
Cette dernière égalité s’écrit aussi g = a + b. On généralise cette situation :
3 3
Définition 1. Soient n ∈ N∗ puis A1 , . . . , An n n points du plan. Soit (λ1 , . . . , λn ) ∈ Rn tel que λ1 + . . . + λn 6= 0.
Le barycentre du système de points pondérés (A1 (λ1 ) , . . . , An (λn )) est le point G d’affixe g telle que
λ1 a 1 + . . . + λ n a n
g= .
λ1 + . . . + λ n
Notation. Le barycentre du système (A1 (λ1 ) , . . . , An (λn )) se note bar (A1 (λ1 ) , . . . , An (λn )).
Ensuite,

λ1 a 1 + . . . + λ n a n
g= ⇔ (λ1 + . . . + λn ) g = λ1 a1 + . . . + λn an
λ1 + . . . + λ n
−−→ −−−→ −→
⇔ λ1 (g − a1 ) + . . . + λn (g − an ) = 0 ⇔ λ1 GA1 + . . . + λn GAn = 0 .

et donc
−−→ −−−→ −→
Théorème 1. G est l’unique point de E vérifiant λ1 GA1 + . . . + λn GAn = 0 .
Exemple. Soit ABC un triangle du plan. Construisons G = bar(A(2), B(1), C(1)). Notons I le milieu de [BC].
−→ −→ −→ − → −→ − → − → − → − → − → −→ −
→ − → −→ − → − →
2GA + GB + GC = 0 ⇒ 2GA + GI + IB + GI + GI = 0 ⇒ 2GA + 2GI = 0 ⇒ GA + GI = 0 .
Le point G est donc le milieu du segment [AI].

c Jean-Louis Rouget, 2021. Tous droits réservés. 2 http ://www.maths-france.fr


A

B I C

Théorème 2. Soient n ∈ N∗ puis A1 , . . . , An n points du plan. Soit (λ1 , . . . , λn ) ∈ Rn tel que λ1 + . . . + λn 6= 0. Soit
k ∈ R \ {0}. Alors

bar (A1 (kλ1 ) , . . . , An (kλn )) = bar (A1 (λ1 ) , . . . , An (λn )) .


Démonstration . kλ1 + . . . + kλn 6= 0 et de plus, en notant a1 , ... , an , les affixes respectives des points A1 , ... , An et g et g ′
les affixes respectives des points G = bar (A1 (λ1 ) , . . . , an (λn )) et G ′ = bar (A1 (kλ1 ) , . . . , An (kλn )),

kλ1 a1 + . . . + kλn an λ1 a1 + . . . + λn an
g′ = = = g.
kλ1 + . . . + kλn λ1 + . . . + λn

    
1 1
Par exemple, le milieu du segment [AB] est bar (A(1), B(1)) et est aussi bar A ,B . De manière plus générale,
2 2
si λ1 + . . . + λn 6= 0,

bar (A1 (λ1 ) , . . . , An (λn )) = bar (A1 (λ1′ ) , . . . , An (λn′ )) ,


λi
où ∀i ∈ J1, nK, λi′ = . Les coefficients λi′ vérifient
λ1 + . . . + λ n
Xn n
X
1
λi′ = λi = 1.
λ1 + . . . + λ n
i=1 i=1

On peut donc toujours se ramener au cas où la somme des coefficients est égale à 1.

1.2 Convexes

1.2.1 Segments

Soient A et B deux points d’un K-espace vectoriel E. Le segment [A, B] est l’ensemble des points M de E tel qu’il existe
−−→ −→
un réel λ ∈ [0, 1] tel que AM = λAB.
B
b

M
b

A
b

−−→ −→
En notant m, a et b les affixes respectives des points M, A et B, l’égalité AM = λAB s’écrit encore m − a = λ(b − a) ou
enfin m = (1 − λ)a + λb. Donc
Définition 2. Soient A et B deux points du plan d’affixes respectives a et b.
Le segment [A, B] est l’ensemble des points du plan d’affixes (1 − λ)a + λb où λ ∈ [0, 1]} ou encore l’ensemble des
barycentres à coefficients positifs des points A et B.
Commentaire. La présentation d’un segment comme ensemble des points d’affixes (1 − λ)a + λb, λ ∈ [0, 1], est meilleure
que la présentation de ce segment comme ensemble des points d’affixe λa + (1 − λ)b. Quand λ croît de 0 à 1, le point

c Jean-Louis Rouget, 2021. Tous droits réservés. 3 http ://www.maths-france.fr


d’affixe (1 − λ)a + λb parcourt le segment [A, B] de A à B alors que le point d’affixe λa + (1 − λ)b parcourt le segment
[A, B] de B à A. Notons que, lorsque a 6= b, l’application λ 7→ (1 − λ)a + λb « est » une bijection du segment [0, 1] de R
sur le segment [A, B] du plan.

bb

(1 − λ)a + λb
b
ab

b b b

0 λ 1

1.2.2 Parties convexes du plan

Définition 3. Soit C une partie non vide du plan. C est convexe si et seulement si pour tout (A, B) ∈ C2 , [A, B] ⊂ C.
Commentaire. Il revient au même de dire :

C est convexe ⇔ ∀(A, B) ∈ C2 , ∀λ ∈ [0, 1], bar((A, 1 − λ), (B, λ)) ∈ C.


Convention. ∅ est convexe.

C C

B
b

A A
b b

B
b

C est convexe car C n’est pas convexe car


∀(A, B) ∈ C2 , [A, B] ⊂ C ∃(A, B) ∈ C2 / [A, B] 6⊂ C

2 Fonctions convexes

2.1 Définition
Définition 4. Soit f une fonction définie sur un intervalle I de R à valeurs dans R. L’épigraphe de f est
{(x, y) ∈ I × R/ y > f(x)}.
L’épigraphe de f est donc la partie du plan située au-dessus du graphe de f, bord compris.

c Jean-Louis Rouget, 2021. Tous droits réservés. 4 http ://www.maths-france.fr


4

−1 1 2 3 4
−1

Définition 5. Soit f une fonction définie sur un intervalle I de R à valeurs dans R.


On dit que f est convexe sur I si et seulement si l’épigraphe de f est une partie convexe de R2 .
On dit que f est concave sur I si et seulement si −f est convexe sur I.

Théorème 3. Soit f une fonction définie sur un intervalle I de R à valeurs dans R.


f est convexe sur I si et seulement si ∀(x, y) ∈ I2 , ∀λ ∈ [0, 1], f((1 − λ)x + λy) 6 (1 − λ)f(x) + λf(y).
f est concave sur I si et seulement si ∀(x, y) ∈ I2 , ∀λ ∈ [0, 1], f((1 − λ)x + λy) > (1 − λ)f(x) + λf(y).
Voici un exemple de graphe de fonction convexe :

f(y) b

(1 − λ)f(x) + λf(y) b

f(x) b

b
f((1 − λ)x + λy)

x (1 − λ)x + λy y

Démonstration .
• Supposons que f est convexe sur I et donc que l’épigraphe E de f est un convexe de R2 .
Soient (x1 , x2 ) ∈ I2 et λ ∈ [0, 1]. Les points A1 = (x1 , f (x1 )) et A2 = (x2 , f (x2 )) sont des points de E. Donc, le segment [A1 , A2 ] est
contenu dans E. En particulier, le point d’affixe (1 − λ)a1 + λa2 (où a1 et a2 sont les affixes respectives des points A1 et A2 ) est
un point de E. L’ordonnée de ce point, à savoir (1 − λ)f (x1 ) + λf (x2 ), est supérieure ou égale à l’image de son abscisse, à savoir
f ((1 − λ)x1 + λx2 ).
On a montré que ∀ (x1 , x2 ) ∈ I2 , ∀λ ∈ [0, 1] f ((1 − λ)x1 + λx2 ) 6 (1 − λ)f (x1 ) + λf (x2 ). Donc, f est convexe sur I.
• Supposons que ∀ (x1 , x2 ) ∈ I2 , ∀λ ∈ [0, 1], f ((1 − λ)x1 + λx2 ) 6 (1 − λ)f (x1 ) + λf (x2 ). Montrons que E est un convexe de R2 .
Soient A1 = (x1 , y1 ) et A2 = (x2 , y2 ) deux points de E et λ ∈ [0, 1]. On note a1 et a2 les affixes respectives des points A1 et A2 . Soit
M le point d’affixe (1 − λ)a1 + λa2 . Posons M = (x, y). Alors

y = (1 − λ)y1 + λy2 > (1 − λ)f (x1 ) + λf (x2 ) > f ((1 − λ)x1 + λx2 ) = f(x),
et donc M est un point de E. Ainsi, pour tout (A1 , A2 ) ∈ E2 et tout point M de [A1 , A2 ], M est un point de E. On a montré que E
est un convexe de R2 .
Enfin, f concave sur I ⇔ −f convexe sur I ⇔ ∀(x, y) ∈ I2 , ∀λ ∈ [0, 1], −f((1 − λ)x + λy) 6 (1 − λ)(−f(x)) + λ(−f(y)) ⇔ ∀(x, y) ∈ I2 ,
∀λ ∈ [0, 1], f((1 − λ)x + λy) > (1 − λ)f(x) + λf(y).

Dorénavant, les équivalences du théorème 3 devient les définitions d’une fonction convexe ou concave sur un intervalle :

c Jean-Louis Rouget, 2021. Tous droits réservés. 5 http ://www.maths-france.fr


f est convexe sur I ⇔ ∀(x, y) ∈ I2 , ∀λ ∈ [0, 1], f((1 − λ)x + λy) 6 (1 − λ)f(x) + λf(y).
f est concave sur I ⇔ ∀(x, y) ∈ I2 , ∀λ ∈ [0, 1], f((1 − λ)x + λy) > (1 − λ)f(x) + λf(y).

Il existe des fonctions qui sont à la fois convexes et concaves : les fonctions affines. On peut montrer que ce sont les seules
fonctions à être à la fois convexes et concaves :
Exercice 1. Soit f une fonction de R dans R telle que :

∀(x, y) ∈ R2 , ∀λ ∈ [0, 1], f((1 − λ)x + λy) = (1 − λ)f(x) + λf(y).


Montrer que f est une fonction affine. Etablir la réciproque.
f(1) − f(0)
Solution 1. Montrons que pour tout réel x, f(x) = ax + b où on a posé a = = f(1) − f(0) et b = f(0). Soit x
1−0
un réel.
1er cas. Si 0 6 x 6 1, alors x ∈ [0, 1]. Posons λ = x ou encore x = (1 − λ) × 0 + λ × 1 avec λ ∈ [0, 1]. Par hypothèse

f(x) = f((1 − λ) × 0 + λ × 1) = (1 − λ)f(0) + λf(1) = λ(f(1) − f(0)) + f(0) = ax + b.


1
2ème cas. Si x > 1, alors 1 ∈ [0, x]. Dans ce cas, il existe λ ∈ [0, 1] tel que 1 = (1 − λ) × 0 + λx (à savoir λ = et donc
x
x−1
aussi 1 − λ = ). Par hypothèse,
x
x−1 f(x)
f(1) = f((1 − λ) × 0 + λx) = (1 − λ)f(0) + λf(x) = f(0) +
x x
puis f(x) = xf(1) − (x − 1)f(0) = (f(1) − f(0))x + f(0) = ax + b.
x
3ème cas. Si x < 0, alors 0 ∈ [x, 1]. Dans ce cas, il existe λ ∈ [0, 1] tel que 0 = (1 − λ) × x + λ × 1 (à savoir λ = et
x−1
1
donc aussi 1 − λ = ). Par hypothèse,
1−x
1 x
f(0) = f((1 − λ)x + λ × 1) = (1 − λ)f(x) + λf(1) = f(x) − f(1)
1−x 1−x
puis f(x) = (1 − x)f(0) + xf(1) = (f(1) − f(0))x + f(0) = ax + b.
On a monté qu’il existe deux réels a et b tels que, pour tout réel x, f(x) = ax + b. Donc, f est une fonction affine.
Inversement, soit f une fonction affine. Il existe deux réels a et b tels que, pour tout réel x, f(x) = ax + b. Soient alors
(x, y) ∈ R2 et λ ∈ [0, 1],

(1 − λ)f(x) + λf(y) = (1 − λ)(ax + b) + λ(ay + b) = a[(1 − λ)x + λy] + b = f((1 − λ)x + λy).
Les fonctions affines sont les fonctions à la fois convexes et concaves.

Théorème 4. (Inégalité de Jensen)


Soit f une fonction définie sur un intervalle I de R à valeurs dans R.
f est convexe sur I si et seulement si
n n
! n
!
X X X
n n
∀n > 2, ∀ (xi )16i6n ∈ I , ∀ (λi )16i6n ∈ [0, 1] , λi = 1 ⇒ f λi x i 6 λi f (xi ) .
i=1 i=1 i=1

n n
! n
!
X X X
Démonstration . ⇐ / Supposons que ∀n > 2, ∀ (xi )16i6n ∈ In , ∀ (λi )16i6n ∈ [0, 1]n , λi = 1 ⇒ f λi xi 6 λi f (xi ) .
i=1 i=1 i=1
Quand n = 2, on obtient la définition d’une fonction convexe (en remplaçant x1 et x2 par x et y et en remplaçant λ1 et λ2 par λ et
1 − λ car λ1 + λ2 = 1).
⇒ / Supposons f convexe sur I. Montrons par récurrence que
n n
! n
!
n n
X X X
∀n > 2, ∀ (xi )16i6n ∈ I , ∀ (λi )16i6n ∈ [0, 1] , λi = 1 ⇒ f λi xi 6 λi f (xi ) (Pn ) .
i=1 i=1 i=1

• (P2 ) est vraie par définition d’une fonction convexe.

c Jean-Louis Rouget, 2021. Tous droits réservés. 6 http ://www.maths-france.fr


• Soit n > 2. Supposons (Pn ).
n+1
X
Soient (x1 , . . . , xn , xn+1 ) ∈ In+1 et (λ1 , . . . , λn , λn+1 ) ∈ [0, 1]n+1 tel que λi = 1.
i=1
n
X
1er cas. Si λn+1 = 1, alors λi = 0 puis, ∀i ∈ J1, nK, λi = 0 (réels positifs de somme nulle). Dans ce cas, l’inégalité
i=1
est immédiate (c’est une égalité).

n
X
2ème cas. Sinon λn+1 ∈ [0, 1[ et en particulier, λi = 1 − λn+1 > 0. On commence par constater que
i=1
n
!
X λi
f (λ1 x1 + . . . + λn xn + λn+1 xn+1 ) = f (1 − λn+1 ) xi + λn+1 xn+1 .
i=1
1 − λn+1
λi λi λ1 + . . . + λn
Pour i ∈ J1, nK, posons λi′ = . Tout d’abord, pour i ∈ J1, nK, 0 6 λi′ = 6 = 1.
1 − λn+1 1 − λn+1 1 − λn+1
n
X
n
λi
X i=1
De plus, λi′ = = 1.
i=1
1 − λn+1

Ensuite, en supposant avoir numéroté les réels x1 , . . . , xn de telle sorte que par exemple x1 6 x2 6 . . . 6 xn , on a

n
X n
X
x1 = x1 λi′ = λi′ x1
i=1 i=1
n
X
6 λi′ xi
i=1
Xn n
X
6 λi′ xn = xn λi′ = xn .
i=1 i=1

n
X n
X
Donc, x1 6 λi′ xi 6 xn ou encore le réel x = λi′ xi est dans [x1 , xn ]. Puisque x1 et xn sont dans I et que I est
i=1 i=1
n
X
un intervalle, on en déduit que [x1 , xn ] ⊂ I. Donc, le réel x = λi′ xi est un réel de I. Mais alors,
i=1

n
!
X λi
f (1 − λn+1 ) xi + λn+1 xn+1 = f ((1 − λn+1 ) x + λn+1 xn+1 )
i=1
1 − λn+1
6 (1 − λn+1 ) f(x) + λn+1 f (xn+1 )
(puisque f est convexe sur I et que x et xn+1 sont dans I)
n
!
X ′
= (1 − λn+1 ) f λi xi + λn+1 f (xn+1 )
i=1
n
X
6 (1 − λn+1 ) λi′ f (xi ) + λn+1 f (xn+1 )
i=1
n
X
(par hypothèse de récurrence en tenant compte entre autre de λi′ = 1)
i=1
n
X n+1
X
= λi f (xi ) + λn+1 f (xn+1 ) = λi f (xi )
i=1 i=1

Le résultat est démontré par récurrence.


On mettra en œuvre plus loin l’inégalité de Jensen dans l’exercice sur la comparaison entre la moyenne arithmétique et
la moyenne géométrique de n réels positifs.
On peut affiner la définition d’une fonction convexe :

c Jean-Louis Rouget, 2021. Tous droits réservés. 7 http ://www.maths-france.fr


Définition 6. Soit f une fonction définie sur un intervalle I de R à valeurs dans R.
On dit que f est strictement convexe sur I si et seulement si si et seulement si ∀(x, y) ∈ I2 tel que x 6= y, ∀λ ∈]0, 1[,
f((1 − λ)x + λy) < (1 − λ)f(x) + λf(y).
On dit que f est strictement convave sur I si et seulement si si et seulement si ∀(x, y) ∈ I2 tel que x 6= y, ∀λ ∈]0, 1[,
f((1 − λ)x + λy) > (1 − λ)f(x) + λf(y).

2.2 Caractérisation par la « fonction pente »

Théorème 5. Soit f une fonction définie sur un intervalle I de R à valeurs dans R.


f est convexe sur I si et seulement si

∀x0 ∈ I, « la fonction pente en x0 » ϕx0 : I \ {x0 } → R est croissante sur I \ {x0 } .


f(x) − f (x0 )
x 7→
x − x0
f est strictement convexe sur I si et seulement si la fonction pente en tout x0 de I est strictement croissante sur I.
On a un théorème analogue pour les fonctions concaves en remplaçant le mot « croissante » par « décroissante ».

Démonstration .
• Supposons que pour tout x0 de I, la fonction ϕx0 est croissante sur I \ {x0 }.
Soit (x1 , x2 ) ∈ I2 tel que x1 < x2 et λ ∈]0, 1[. On a donc x1 < (1 − λ)x1 + λx2 < x2 . La fonction ϕx1 est croissante sur I \ {x1 }. Donc,
ϕx1 ((1 − λ)x1 + λx2 ) 6 ϕx1 (x2 ). Cette inégalité s’écrit explicitement

f ((1 − λ)x1 + λx2 ) − f (x1 ) f (x2 ) − f (x1 )


6
((1 − λ)x1 + λx2 ) − x1 x2 − x1
f ((1 − λ)x1 + λx2 ) − f (x1 ) f (x2 ) − f (x1 )
ou encore 6 puis f ((1 − λ)x1 + λx2 ) − f (x1 ) 6 λ (f (x2 ) − f (x1 ))
λ (x2 − x1 ) x2 − x1
(car x2 − x1 > 0) et finalement

f ((1 − λ)x1 + λx2 ) 6 (1 − λ)f (x1 ) + λf (x2 ) .


Cette inégalité reste claire quand λ = 0 ou λ = 1 ou x1 = x2 et on a donc montré que f est convexe. Enfin, si pour tout x0 de I, la
fonction ϕx0 est strictement croissante sur I \ {x0 }, on remplace ci-dessus les inégalités larges par des inégalités strictes et on obtient
le fait que f est strictement convexe sur I.
• Supposons f convexe sur I. Soit x0 ∈ I. On supposera dans ce qui suit que x0 n’est pas une borne de I, la démonstration s’adaptant
facilement dans le cas contraire. Soit (x1 , x2 ) ∈ I2 tel que x1 < x2 . Trois cas de figure se présentent :
1er cas. Supposons x0 < x1 < x2 .
x1 − x0
Soit λ = . λ est un réel de ]0, 1[ tel que x1 = (1 − λ)x0 + λx2 . Puisque f est convexe sur I,
x2 − x0
x2 − x1 x1 − x0
f (x1 ) = f ((1 − λ)x0 + λx2 ) 6 (1 − λ)f (x0 ) + λf (x2 ) = f (x0 ) + f (x2 )
x2 − x0 x2 − x0
puis

− (x1 − x0 ) x1 − x0 x1 − x0
f (x1 ) − f (x0 ) 6 f (x0 ) + f (x2 ) = (f (x2 ) − f (x0 ))
x2 − x0 x2 − x0 x2 − x0
f (x1 ) − f (x0 ) f (x2 ) − f (x0 )
et donc ϕx0 (x1 ) 6 = ϕx0 (x2 ) après division des deux membres de l’inégalité par x1 − x0 > 0.
x1 − x0 x2 − x0
2ème cas. Supposons x1 < x2 < x0 .
x2 − x1
Soit λ = . λ est un réel de ]0, 1[ tel que x2 = (1 − λ)x1 + λx0 . Puisque f est convexe sur I,
x0 − x1
x0 − x2 x2 − x1
f (x2 ) 6 (1 − λ)f (x1 ) + λf (x0 ) = f (x1 ) + f (x0 )
x0 − x1 x0 − x1
puis
x0 − x2 x2 − x0 x2 − x0
f (x2 ) − f (x0 ) 6 f (x1 ) + f (x0 ) = (f (x1 ) − f (x0 ))
x0 − x1 x0 − x1 x1 − x0
et donc encore ϕx0 (x1 ) 6 ϕx0 (x2 ) après division des deux membres de l’inégalité par x2 − x0 < 0.
3ème cas. Supposons x1 < x0 < x2 . D’après les deux premiers cas,

f (x1 ) − f (x0 ) f (x2 ) − f (x0 )


= ϕx0 (x1 ) = ϕx1 (x0 ) 6 ϕx1 (x2 ) = ϕx2 (x1 ) 6 ϕx2 (x0 ) = .
x1 − x0 x2 − x0

c Jean-Louis Rouget, 2021. Tous droits réservés. 8 http ://www.maths-france.fr


Ceci montre que la fonction pente en x0 est croissante sur I \ {x0 }. D’autre part, si f est strictement convexe sur I, on remplace toutes
les inégalités larges précédentes par des inégalités strictes et on obtient le fait que la fonction pente en x0 est strictement croissante
sur I \ {x0 }.

Notons au passage cette configuration usuelle concernant les fonctions convexes : si x < z < y,

f(z) − f(x) f(y) − f(x) f(y) − f(z)


6 6 .
z−x y−x y−z

f(y) b

f(x) b

b
f(z)

x z y

2.3 Caractérisation des fonctions convexes dérivables


Théorème 6. Soit f une fonction définie sur un intervalle I de R à valeurs dans R. On suppose de plus que f est
dérivable sur I.
f est convexe sur I si et seulement si f ′ est une fonction croissante sur I.
f est concave sur I si et seulement si f ′ est une fonction décroissante sur I.

Démonstration .
• Supposons f ′ croissante sur I. Soit (x, y) ∈ I2 tel que x < y.
Pour λ ∈ [0, 1], posons g(λ) = (1 − λ)f(x) + λf(y) − f((1 − λ)x + λy). La fonction λ 7→ (1 − λ)x + λy est dérivable sur [0, 1] à valeurs
dans [x, y] ⊂ I et la fonction f est dérivable sur I. Donc la fonction λ 7→ f((1 − λ)x + λy) est dérivable sur [0, 1] et il en est de même
de la fonction g. De plus, pour λ ∈ [0, 1],

g ′ (λ) = f(y) − f(x) − (y − x)f ′ ((1 − λ)x + λy).


D’après le théorème des accroissements finis (puisque f est continue sur [x, y] ⊂ I et dérivable sur ]x, y[⊂ I), il existe un réel c ∈]x, y[ tel
c−x
que f(y)−f(x) = (y−x)f ′ (c) ou encore, il existe un réel λ0 ∈]0, 1[, à savoir λ0 = , tel que f(y)−f(x) = (y−x)f ′ ((1 − λ0 ) x + λ0 y).
y−x
Donc,
 
∀λ ∈ [0, 1], g ′ (λ) = (y − x) f ′ ((1 − λ0 ) x + λ0 y) − f ′ ((1 − λ) x + λy) .
La fonction affine λ 7→ (1 − λ) x + λy = λ(y − x) − x est croissante sur [0, 1] (car x < y) et donc la fonction λ 7→ f ′ ((1 − λ) x + λy)
est croissante sur [0, 1] puis la fonction g ′ est décroissante sur [0, 1]. Puisque g ′ (λ0 ) = 0, on en déduit que g ′ est positive sur [0, λ0 ]
et négative sur [λ0 , 1].
Ainsi, la fonction g est croissante sur [0, λ0 ] et décroissante sur [λ0 , 1]. Puisque g(0) = g(1) = 0, la fonction g est positive sur [0, 1]
ou encore

∀λ ∈ [0, 1], f((1 − λ)x + λy) 6 (1 − λ)f(x) + λf(y).


Donc, la fonction f est convexe sur I.
f(t) − f(x)
• Supposons f convexe sur I. Soit (x, y) ∈ I2 tel que x < y. Puisque la fonction ϕx : t 7→ est croissante sur I \ {x} (d’après
t−x
f(y) − f(x)
lim ϕx (u) = f ′ (x) et en particulier,
le théorème 5), pour tout t ∈ I∩]x, +∞[, ϕx (t) > u→x > f ′ (x).
u>x
y−x
f(t) − f(y)
De même, la fonction ϕy : t 7→ est croissante sur I \ {y} et donc ϕy (x) 6 u→y lim ϕy (u) = f ′ (y) et en particulier,
t−y u<y
f(y) − f(x) ′
6 f (y).
y−x

c Jean-Louis Rouget, 2021. Tous droits réservés. 9 http ://www.maths-france.fr


f(y) − f(x)
On a donc f ′ (x) 6 6 f ′ (y) et en particulier f ′ (x) 6 f ′ (y). On a montré que f ′ est croissante sur I.
y−x

On démontre de manière analogue le théorème suivant :


Théorème 7. Soit f une fonction définie sur un intervalle I de R à valeurs dans R. On suppose de plus que f est
dérivable sur I.
f est strictement convexe sur I si et seulement si f ′ est une fonction strictement croissante sur I.
f est strictement concave sur I si et seulement si f ′ est une fonction strictement décroissante sur I.
et on en déduit :
Théorème 8. Soit f une fonction définie sur un intervalle I de R à valeurs dans R. On suppose de plus que f est deux
fois dérivable sur I.
f est convexe sur I si et seulement si f ′′ > 0.
f est concave sur I si et seulement si f ′′ 6 0.
Si f ′′ > 0 sur I sauf peut-être en un nombre fini de points, alors f est strictement convexe sur I.
Si f ′′ < 0 sur I sauf peut-être en un nombre fini de points, alors f est strictement concave sur I.
Démonstration. On sait que f ′ est croissante sur I si et seulement si (f ′ ) ′ = f ′′ est positive sur I.

Définition 7. Soit f une fonction définie sur un intervalle I de R à valeurs dans R, deux fois dérivable sur I.
Si x0 est un réel de I en lequel f ′′ s’annule en changeant de signe, on dit que le point (x0 , f (x0 )) est un point
d’inflexion de la courbe représentative de f.
Un point d’inflexion est un point de la courbe en lequel la concavité change de sens. On verra aussi qu’en un point
d’inflexion, la courbe « traverse sa tangente ».

f ′′ < 0

f ′′ > 0
f ′′ (x0 ) = 0
b

x0

Dans les théorèmes de ce paragraphe, nous avons rajouté des hypothèses du genre « on suppose f dérivable ou deux fois
dérivables sur I ». Le fait que la fonction f soit convexe ou concave n’entraine absolument pas que la fonction f soit
dérivable sur I. Par exemple, la fonction x 7→ |x| est convexe sur R mais n’est pas dérivable sur R.

Néanmoins,

c Jean-Louis Rouget, 2021. Tous droits réservés. 10 http ://www.maths-france.fr


Exercice 2. Soit f une fonction convexe sur un intervalle ouvert I de R.
1) Montrer que f est dérivable à droite et à gauche en tout réel de I.
2) Montrer que f est continue sur I.
Solution 2.
1) Soit x0 un réel de I. Puisque I est un intervalle ouvert, I ∩ ]−∞, x0 [ et I ∩ ]x0 , +∞[ sont des intervalles ouverts non
f(x) − f (x0 )
vides. Puisque f est convexe sur I, la fonction pente en x0 (à savoir ϕx0 : x 7→ ) est croissante sur I \ {x0 }.
x − x0
On en déduit que cette fonction admet des limites réelles à droite et à gauche en x0 . f est donc dérivable à droite et à
gauche en x0 .
2) Soit x0 un réel de I. D’après 1), f est dérivable à droite et à gauche en x0 et en particulier, f est continue à droite et à
gauche en x0 . Mais alors f est continue en x0 . Ainsi, f est continue en chaque réel x0 de I et donc f est continue sur I.

2.4 Tangentes au graphe d’une fonction convexe

Soit f une fonction dérivable et convexe sur un intervalle I de R à valeurs dans R. Soit a un réel. On va montrer que
la courbe représentative Cf de f est au-dessus de sa tangente (Ta ) en son point d’abscisse a sur I. Une équation de la
tangente à Cf en le point (a, f(a)) est

y = f ′ (a)(x − a) + f(a).
Pour x ∈ I, posons g(x) = f(x) − (f ′ (a)(x − a) + f(a)). g est dérivable sur I et pour tout x de I, g ′ (x) = f ′ (x) − f ′ (a).
Puisque f est convexe sur I, f ′ est croissante sur I. Puisque g ′ (a) = 0, on en déduit que g ′ est négative sur I∩] − ∞, a] et
positive sur I ∩ [a, +∞[. La fonction g admet donc un minimum en a égal à g(a) = 0. Ceci montre que la fonction g est
positive sur I et donc que

∀x ∈ I, f(x) > f ′ (a)(x − a) + f(a).


On a montré que Cf est au-dessus de (Ta ) sur I.
Commentaire 1. Si de plus, f est de classe C1 sur I, on peut aussi constater que pour x ∈ I,
Zx
f(x) − (f ′ (a)(x − a) + f(a)) = (f(x) − f(a)) − f ′ (a)(x − a) = (f ′ (t) − f ′ (a)) dt
a
et vérifier que cette intégrale est positive en discutant suivant le fait que x > a ou x 6 a.
Commentaire 2. Dans le cas où f est strictement convexe, en adaptant la démonstration ci-dessus, on montre que Cf
est strictement au-dessus de (Ta ) sur I \ {a}.
Commentaire 3. Enfin, si f est concave sur I (resp. strictement concave sur I), Cf est au-dessous de (Ta ) sur I (resp.
strictement au-dessous de (Ta ) sur I \ {a}).

c Jean-Louis Rouget, 2021. Tous droits réservés. 11 http ://www.maths-france.fr


2.5 Inégalités de convexité

De ce qui précède, on a l’habitude de déduire que « le graphe d’une fonction convexe est au-dessus de ses tangentes et
au-dessous de ses cordes » (étant entendu que le graphe est au-dessus de sa tangente sur I tout entier et au-dessous de la
corde joignant les points (a, f(a)) et (b, f(b)) sur le segment [a, b] uniquement).

b b

Cette constatation explicitement utilisée fournit des inégalités appelées « inégalités de convexité ». On donne ci-dessous
un certain nombre d’inégalités de convexité classique à connaître.
• La fonction exponentielle est strictement convexe sur R car sa dérivée seconde, à savoir x 7→ ex , est strictement positive
sur R. Son graphe est donc au-dessus de sa tangente en (0, e0 ) = (0, 1) sur R et strictement au-dessus sur R∗ . Ceci fournit

∀x ∈ R, ex > 1 + x et ∀x ∈ R∗ , ex > 1 + x.

−5 −4 −3 −2 −1 1 2 3 4 5
−1

En constatant que le graphe de la fonction exponentielle est au-dessus de sa tangente au point (1, e), on obtient aussi :
∀x ∈ R, ex > ex.
1
• La fonction x 7→ ln(1 + x) est strictement concave sur ] − 1, +∞[ car sa dérivée seconde, à savoir x 7→ − , est
(1 + x)2
strictement négative sur ] − 1, +∞[. Son graphe est donc au-dessous de sa tangente en (0, ln 1) = (0, 0) sur ] − 1, +∞[ et
strictement au-dessous sur ] − 1, 0[∪]0, +∞[. Ceci fournit

∀x ∈] − 1, +∞[, ln(1 + x) 6 x et ∀x ∈] − 1, 0[∪]0, +∞[, ln(1 + x) < x.

c Jean-Louis Rouget, 2021. Tous droits réservés. 12 http ://www.maths-france.fr


1

−1 1 2 3 4
−1

−2

h πi
• La fonction x 7→ sin x est strictement concave sur 0, car sa dérivée seconde à savoir x 7→ − sin x, est strictement
i πi 2 h πi
négative sur 0, . Son graphe est donc au-dessous de sa tangente en (0, sin 0) = (0, 0) sur 0, et strictement au-dessous
i πi 2 π  h 2π i
sur 0, et son graphe est au-dessus de sa corde joignant les points (0, 0) et , 1 sur 0, . Ceci fournit entre autre
2 2 2
h πi 2
∀x ∈ 0, , x 6 sin x 6 x.
2 π

π
1 2

Exercice 3. (comparaison entre la moyenne géométrique et la moyenne arithmétique de n réels positifs)


Soient n > 2 puis (x1 , . . . , xn ) ∈ [0, +∞[n . Montrer que
√ x1 + . . . + xn
∀n > 2, ∀ (x1 , . . . , xn ) ∈ [0, +∞[n , n
x1 . . . xn 6 .
n
Solution 3. Soit (x1 , . . . , xn ) ∈ [0, +∞[n .

Si il existe i ∈ J1, nK tel que xi = 0, l’inégalité est immédiate car dans ce cas, n
x1 . . . xn = 0.
1
Supposons donc : ∀i ∈ J1, nK, xi > 0. La fonction ln est concave sur ]0, +∞[ car sa dérivée seconde, à savoir x 7→ − 2 , est
x
1 1 1
négative sur ]0, +∞[. Les n nombres λ1 = , λ2 = , . . . , λn = , sont n réels positifs de somme 1. D’après l’inégalité
n n n
de Jensen
 
1 1 1 1
ln (x1 ) + . . . + ln (xn ) 6 ln x1 + . . . + xn
n n n n
ce qui s’écrit encore
 
√ x1 + . . . + xn
ln ( n
x1 . . . xn ) 6 ln
n
et finalement
√ x1 + . . . + xn
n
x1 . . . xn 6 .
n
√ x1 + . . . + xn
∀n > 2, ∀ (x1 , . . . , xn ) ∈ [0, +∞[n , n
x1 . . . xn 6 .
n

c Jean-Louis Rouget, 2021. Tous droits réservés. 13 http ://www.maths-france.fr


La moyenne géométrique de n nombres est toujours inférieure ou égale à la moyenne arithmétique de ces n nombres.

√ a+b
En particulier, quand n = 2, on obtient : ∀(a, b) ∈ [0, +∞[2 , ab 6 . On rappelle que cette inégalité peut s’obtenir
2
directement par un calcul algébrique sans passer par l’analyse (dérivées, fonction logarithme, ...) :

a+b √ 1 √ √  1 √ √ 2
− ab = a−2 a b+b = a − b > 0.
2 2 2

c Jean-Louis Rouget, 2021. Tous droits réservés. 14 http ://www.maths-france.fr

Vous aimerez peut-être aussi