17 Fonctions Convexes Chapitre
17 Fonctions Convexes Chapitre
17 Fonctions Convexes Chapitre
Fonctions convexes
Plan du chapitre
1 Parties convexes du plan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . page 2
1.1 Barycentres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . page 2
1.2 Convexes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . page 3
1.2.1 Segments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . page 3
1.2.2 Parties convexes du plan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . page 4
2 Fonctions convexes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . page 4
2.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . page 4
2.2 Caractérisation par la « fonction pente » . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . page 8
2.3 Caractérisation des fonctions convexes dérivables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . page 9
2.4 Tangentes au graphe d’une fonction convexe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . page 11
2.5 Inégalités de convexité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . page 12
1.1 Barycentres
Si on place dans chacun des deux plateaux d’une balance des masses respectives de 1 kg et 2 kg, le point d’équilibre « est
aux deux tiers ». On partage le segment [A, B] en trois segments égaux. On laisse un segment du côté de B qui est deux
fois plus lourd et deux segments du côté de A et on place le fléau de la balance au point G dessiné ci-dessous.
A G B
b b b
−→ 2 −→ −→ −→ − →
Le point G vérifie l’égalité AG = AB ou aussi GA + 2GB = 0 . L’affixe g du point G vérifie (en notant a et b les affixes
3
respectives des points A et B)
−→ −→ − → a + 2b
GA + 2GB = 0 ⇔ (g − a) + 2(g − b) = 0 ⇔ g = .
1+2
1 2
Cette dernière égalité s’écrit aussi g = a + b. On généralise cette situation :
3 3
Définition 1. Soient n ∈ N∗ puis A1 , . . . , An n n points du plan. Soit (λ1 , . . . , λn ) ∈ Rn tel que λ1 + . . . + λn 6= 0.
Le barycentre du système de points pondérés (A1 (λ1 ) , . . . , An (λn )) est le point G d’affixe g telle que
λ1 a 1 + . . . + λ n a n
g= .
λ1 + . . . + λ n
Notation. Le barycentre du système (A1 (λ1 ) , . . . , An (λn )) se note bar (A1 (λ1 ) , . . . , An (λn )).
Ensuite,
λ1 a 1 + . . . + λ n a n
g= ⇔ (λ1 + . . . + λn ) g = λ1 a1 + . . . + λn an
λ1 + . . . + λ n
−−→ −−−→ −→
⇔ λ1 (g − a1 ) + . . . + λn (g − an ) = 0 ⇔ λ1 GA1 + . . . + λn GAn = 0 .
et donc
−−→ −−−→ −→
Théorème 1. G est l’unique point de E vérifiant λ1 GA1 + . . . + λn GAn = 0 .
Exemple. Soit ABC un triangle du plan. Construisons G = bar(A(2), B(1), C(1)). Notons I le milieu de [BC].
−→ −→ −→ − → −→ − → − → − → − → − → −→ −
→ − → −→ − → − →
2GA + GB + GC = 0 ⇒ 2GA + GI + IB + GI + GI = 0 ⇒ 2GA + 2GI = 0 ⇒ GA + GI = 0 .
Le point G est donc le milieu du segment [AI].
B I C
Théorème 2. Soient n ∈ N∗ puis A1 , . . . , An n points du plan. Soit (λ1 , . . . , λn ) ∈ Rn tel que λ1 + . . . + λn 6= 0. Soit
k ∈ R \ {0}. Alors
kλ1 a1 + . . . + kλn an λ1 a1 + . . . + λn an
g′ = = = g.
kλ1 + . . . + kλn λ1 + . . . + λn
❏
1 1
Par exemple, le milieu du segment [AB] est bar (A(1), B(1)) et est aussi bar A ,B . De manière plus générale,
2 2
si λ1 + . . . + λn 6= 0,
On peut donc toujours se ramener au cas où la somme des coefficients est égale à 1.
1.2 Convexes
1.2.1 Segments
Soient A et B deux points d’un K-espace vectoriel E. Le segment [A, B] est l’ensemble des points M de E tel qu’il existe
−−→ −→
un réel λ ∈ [0, 1] tel que AM = λAB.
B
b
M
b
A
b
−−→ −→
En notant m, a et b les affixes respectives des points M, A et B, l’égalité AM = λAB s’écrit encore m − a = λ(b − a) ou
enfin m = (1 − λ)a + λb. Donc
Définition 2. Soient A et B deux points du plan d’affixes respectives a et b.
Le segment [A, B] est l’ensemble des points du plan d’affixes (1 − λ)a + λb où λ ∈ [0, 1]} ou encore l’ensemble des
barycentres à coefficients positifs des points A et B.
Commentaire. La présentation d’un segment comme ensemble des points d’affixes (1 − λ)a + λb, λ ∈ [0, 1], est meilleure
que la présentation de ce segment comme ensemble des points d’affixe λa + (1 − λ)b. Quand λ croît de 0 à 1, le point
bb
(1 − λ)a + λb
b
ab
b b b
0 λ 1
Définition 3. Soit C une partie non vide du plan. C est convexe si et seulement si pour tout (A, B) ∈ C2 , [A, B] ⊂ C.
Commentaire. Il revient au même de dire :
C C
B
b
A A
b b
B
b
2 Fonctions convexes
2.1 Définition
Définition 4. Soit f une fonction définie sur un intervalle I de R à valeurs dans R. L’épigraphe de f est
{(x, y) ∈ I × R/ y > f(x)}.
L’épigraphe de f est donc la partie du plan située au-dessus du graphe de f, bord compris.
−1 1 2 3 4
−1
f(y) b
(1 − λ)f(x) + λf(y) b
f(x) b
b
f((1 − λ)x + λy)
x (1 − λ)x + λy y
Démonstration .
• Supposons que f est convexe sur I et donc que l’épigraphe E de f est un convexe de R2 .
Soient (x1 , x2 ) ∈ I2 et λ ∈ [0, 1]. Les points A1 = (x1 , f (x1 )) et A2 = (x2 , f (x2 )) sont des points de E. Donc, le segment [A1 , A2 ] est
contenu dans E. En particulier, le point d’affixe (1 − λ)a1 + λa2 (où a1 et a2 sont les affixes respectives des points A1 et A2 ) est
un point de E. L’ordonnée de ce point, à savoir (1 − λ)f (x1 ) + λf (x2 ), est supérieure ou égale à l’image de son abscisse, à savoir
f ((1 − λ)x1 + λx2 ).
On a montré que ∀ (x1 , x2 ) ∈ I2 , ∀λ ∈ [0, 1] f ((1 − λ)x1 + λx2 ) 6 (1 − λ)f (x1 ) + λf (x2 ). Donc, f est convexe sur I.
• Supposons que ∀ (x1 , x2 ) ∈ I2 , ∀λ ∈ [0, 1], f ((1 − λ)x1 + λx2 ) 6 (1 − λ)f (x1 ) + λf (x2 ). Montrons que E est un convexe de R2 .
Soient A1 = (x1 , y1 ) et A2 = (x2 , y2 ) deux points de E et λ ∈ [0, 1]. On note a1 et a2 les affixes respectives des points A1 et A2 . Soit
M le point d’affixe (1 − λ)a1 + λa2 . Posons M = (x, y). Alors
y = (1 − λ)y1 + λy2 > (1 − λ)f (x1 ) + λf (x2 ) > f ((1 − λ)x1 + λx2 ) = f(x),
et donc M est un point de E. Ainsi, pour tout (A1 , A2 ) ∈ E2 et tout point M de [A1 , A2 ], M est un point de E. On a montré que E
est un convexe de R2 .
Enfin, f concave sur I ⇔ −f convexe sur I ⇔ ∀(x, y) ∈ I2 , ∀λ ∈ [0, 1], −f((1 − λ)x + λy) 6 (1 − λ)(−f(x)) + λ(−f(y)) ⇔ ∀(x, y) ∈ I2 ,
∀λ ∈ [0, 1], f((1 − λ)x + λy) > (1 − λ)f(x) + λf(y).
❏
Dorénavant, les équivalences du théorème 3 devient les définitions d’une fonction convexe ou concave sur un intervalle :
Il existe des fonctions qui sont à la fois convexes et concaves : les fonctions affines. On peut montrer que ce sont les seules
fonctions à être à la fois convexes et concaves :
Exercice 1. Soit f une fonction de R dans R telle que :
(1 − λ)f(x) + λf(y) = (1 − λ)(ax + b) + λ(ay + b) = a[(1 − λ)x + λy] + b = f((1 − λ)x + λy).
Les fonctions affines sont les fonctions à la fois convexes et concaves.
n n
! n
!
X X X
Démonstration . ⇐ / Supposons que ∀n > 2, ∀ (xi )16i6n ∈ In , ∀ (λi )16i6n ∈ [0, 1]n , λi = 1 ⇒ f λi xi 6 λi f (xi ) .
i=1 i=1 i=1
Quand n = 2, on obtient la définition d’une fonction convexe (en remplaçant x1 et x2 par x et y et en remplaçant λ1 et λ2 par λ et
1 − λ car λ1 + λ2 = 1).
⇒ / Supposons f convexe sur I. Montrons par récurrence que
n n
! n
!
n n
X X X
∀n > 2, ∀ (xi )16i6n ∈ I , ∀ (λi )16i6n ∈ [0, 1] , λi = 1 ⇒ f λi xi 6 λi f (xi ) (Pn ) .
i=1 i=1 i=1
n
X
2ème cas. Sinon λn+1 ∈ [0, 1[ et en particulier, λi = 1 − λn+1 > 0. On commence par constater que
i=1
n
!
X λi
f (λ1 x1 + . . . + λn xn + λn+1 xn+1 ) = f (1 − λn+1 ) xi + λn+1 xn+1 .
i=1
1 − λn+1
λi λi λ1 + . . . + λn
Pour i ∈ J1, nK, posons λi′ = . Tout d’abord, pour i ∈ J1, nK, 0 6 λi′ = 6 = 1.
1 − λn+1 1 − λn+1 1 − λn+1
n
X
n
λi
X i=1
De plus, λi′ = = 1.
i=1
1 − λn+1
Ensuite, en supposant avoir numéroté les réels x1 , . . . , xn de telle sorte que par exemple x1 6 x2 6 . . . 6 xn , on a
n
X n
X
x1 = x1 λi′ = λi′ x1
i=1 i=1
n
X
6 λi′ xi
i=1
Xn n
X
6 λi′ xn = xn λi′ = xn .
i=1 i=1
n
X n
X
Donc, x1 6 λi′ xi 6 xn ou encore le réel x = λi′ xi est dans [x1 , xn ]. Puisque x1 et xn sont dans I et que I est
i=1 i=1
n
X
un intervalle, on en déduit que [x1 , xn ] ⊂ I. Donc, le réel x = λi′ xi est un réel de I. Mais alors,
i=1
n
!
X λi
f (1 − λn+1 ) xi + λn+1 xn+1 = f ((1 − λn+1 ) x + λn+1 xn+1 )
i=1
1 − λn+1
6 (1 − λn+1 ) f(x) + λn+1 f (xn+1 )
(puisque f est convexe sur I et que x et xn+1 sont dans I)
n
!
X ′
= (1 − λn+1 ) f λi xi + λn+1 f (xn+1 )
i=1
n
X
6 (1 − λn+1 ) λi′ f (xi ) + λn+1 f (xn+1 )
i=1
n
X
(par hypothèse de récurrence en tenant compte entre autre de λi′ = 1)
i=1
n
X n+1
X
= λi f (xi ) + λn+1 f (xn+1 ) = λi f (xi )
i=1 i=1
On mettra en œuvre plus loin l’inégalité de Jensen dans l’exercice sur la comparaison entre la moyenne arithmétique et
la moyenne géométrique de n réels positifs.
On peut affiner la définition d’une fonction convexe :
Démonstration .
• Supposons que pour tout x0 de I, la fonction ϕx0 est croissante sur I \ {x0 }.
Soit (x1 , x2 ) ∈ I2 tel que x1 < x2 et λ ∈]0, 1[. On a donc x1 < (1 − λ)x1 + λx2 < x2 . La fonction ϕx1 est croissante sur I \ {x1 }. Donc,
ϕx1 ((1 − λ)x1 + λx2 ) 6 ϕx1 (x2 ). Cette inégalité s’écrit explicitement
− (x1 − x0 ) x1 − x0 x1 − x0
f (x1 ) − f (x0 ) 6 f (x0 ) + f (x2 ) = (f (x2 ) − f (x0 ))
x2 − x0 x2 − x0 x2 − x0
f (x1 ) − f (x0 ) f (x2 ) − f (x0 )
et donc ϕx0 (x1 ) 6 = ϕx0 (x2 ) après division des deux membres de l’inégalité par x1 − x0 > 0.
x1 − x0 x2 − x0
2ème cas. Supposons x1 < x2 < x0 .
x2 − x1
Soit λ = . λ est un réel de ]0, 1[ tel que x2 = (1 − λ)x1 + λx0 . Puisque f est convexe sur I,
x0 − x1
x0 − x2 x2 − x1
f (x2 ) 6 (1 − λ)f (x1 ) + λf (x0 ) = f (x1 ) + f (x0 )
x0 − x1 x0 − x1
puis
x0 − x2 x2 − x0 x2 − x0
f (x2 ) − f (x0 ) 6 f (x1 ) + f (x0 ) = (f (x1 ) − f (x0 ))
x0 − x1 x0 − x1 x1 − x0
et donc encore ϕx0 (x1 ) 6 ϕx0 (x2 ) après division des deux membres de l’inégalité par x2 − x0 < 0.
3ème cas. Supposons x1 < x0 < x2 . D’après les deux premiers cas,
Notons au passage cette configuration usuelle concernant les fonctions convexes : si x < z < y,
f(y) b
f(x) b
b
f(z)
x z y
Démonstration .
• Supposons f ′ croissante sur I. Soit (x, y) ∈ I2 tel que x < y.
Pour λ ∈ [0, 1], posons g(λ) = (1 − λ)f(x) + λf(y) − f((1 − λ)x + λy). La fonction λ 7→ (1 − λ)x + λy est dérivable sur [0, 1] à valeurs
dans [x, y] ⊂ I et la fonction f est dérivable sur I. Donc la fonction λ 7→ f((1 − λ)x + λy) est dérivable sur [0, 1] et il en est de même
de la fonction g. De plus, pour λ ∈ [0, 1],
Définition 7. Soit f une fonction définie sur un intervalle I de R à valeurs dans R, deux fois dérivable sur I.
Si x0 est un réel de I en lequel f ′′ s’annule en changeant de signe, on dit que le point (x0 , f (x0 )) est un point
d’inflexion de la courbe représentative de f.
Un point d’inflexion est un point de la courbe en lequel la concavité change de sens. On verra aussi qu’en un point
d’inflexion, la courbe « traverse sa tangente ».
f ′′ < 0
f ′′ > 0
f ′′ (x0 ) = 0
b
x0
Dans les théorèmes de ce paragraphe, nous avons rajouté des hypothèses du genre « on suppose f dérivable ou deux fois
dérivables sur I ». Le fait que la fonction f soit convexe ou concave n’entraine absolument pas que la fonction f soit
dérivable sur I. Par exemple, la fonction x 7→ |x| est convexe sur R mais n’est pas dérivable sur R.
Néanmoins,
Soit f une fonction dérivable et convexe sur un intervalle I de R à valeurs dans R. Soit a un réel. On va montrer que
la courbe représentative Cf de f est au-dessus de sa tangente (Ta ) en son point d’abscisse a sur I. Une équation de la
tangente à Cf en le point (a, f(a)) est
y = f ′ (a)(x − a) + f(a).
Pour x ∈ I, posons g(x) = f(x) − (f ′ (a)(x − a) + f(a)). g est dérivable sur I et pour tout x de I, g ′ (x) = f ′ (x) − f ′ (a).
Puisque f est convexe sur I, f ′ est croissante sur I. Puisque g ′ (a) = 0, on en déduit que g ′ est négative sur I∩] − ∞, a] et
positive sur I ∩ [a, +∞[. La fonction g admet donc un minimum en a égal à g(a) = 0. Ceci montre que la fonction g est
positive sur I et donc que
De ce qui précède, on a l’habitude de déduire que « le graphe d’une fonction convexe est au-dessus de ses tangentes et
au-dessous de ses cordes » (étant entendu que le graphe est au-dessus de sa tangente sur I tout entier et au-dessous de la
corde joignant les points (a, f(a)) et (b, f(b)) sur le segment [a, b] uniquement).
b b
Cette constatation explicitement utilisée fournit des inégalités appelées « inégalités de convexité ». On donne ci-dessous
un certain nombre d’inégalités de convexité classique à connaître.
• La fonction exponentielle est strictement convexe sur R car sa dérivée seconde, à savoir x 7→ ex , est strictement positive
sur R. Son graphe est donc au-dessus de sa tangente en (0, e0 ) = (0, 1) sur R et strictement au-dessus sur R∗ . Ceci fournit
∀x ∈ R, ex > 1 + x et ∀x ∈ R∗ , ex > 1 + x.
−5 −4 −3 −2 −1 1 2 3 4 5
−1
En constatant que le graphe de la fonction exponentielle est au-dessus de sa tangente au point (1, e), on obtient aussi :
∀x ∈ R, ex > ex.
1
• La fonction x 7→ ln(1 + x) est strictement concave sur ] − 1, +∞[ car sa dérivée seconde, à savoir x 7→ − , est
(1 + x)2
strictement négative sur ] − 1, +∞[. Son graphe est donc au-dessous de sa tangente en (0, ln 1) = (0, 0) sur ] − 1, +∞[ et
strictement au-dessous sur ] − 1, 0[∪]0, +∞[. Ceci fournit
−1 1 2 3 4
−1
−2
h πi
• La fonction x 7→ sin x est strictement concave sur 0, car sa dérivée seconde à savoir x 7→ − sin x, est strictement
i πi 2 h πi
négative sur 0, . Son graphe est donc au-dessous de sa tangente en (0, sin 0) = (0, 0) sur 0, et strictement au-dessous
i πi 2 π h 2π i
sur 0, et son graphe est au-dessus de sa corde joignant les points (0, 0) et , 1 sur 0, . Ceci fournit entre autre
2 2 2
h πi 2
∀x ∈ 0, , x 6 sin x 6 x.
2 π
π
1 2
√ a+b
En particulier, quand n = 2, on obtient : ∀(a, b) ∈ [0, +∞[2 , ab 6 . On rappelle que cette inégalité peut s’obtenir
2
directement par un calcul algébrique sans passer par l’analyse (dérivées, fonction logarithme, ...) :
a+b √ 1 √ √ 1 √ √ 2
− ab = a−2 a b+b = a − b > 0.
2 2 2