Teorema de Función Implicta
Teorema de Función Implicta
Teorema de Función Implicta
Facultad de Ciencias
Grado en Matemáticas
Prólogo 5
Introducción 11
Summary 15
3
3. Generalizaciones del T.F.I. y aplicaciones 49
Los babilonios fueron los primeros en emplearlas, tenían tablas de números natu-
rales expresando sus cuadrados o sus cubos, aunque el hecho de que las usaran, no
significa que supieran lo que eran de manera rigurosa. De este modo, no podemos,
ni debemos, afirmar que los babilonios sean los creadores del concepto de función.
Por estas mismas razones, por muy presentes que las funciones estuviesen durante
todos estos años, no era algo formalmente definido. No fue hasta el siglo XIV, en las
Universidades de Oxford y París, cuando se empezó a materializar una definición,
refiriéndose a las leyes de la naturaleza como la dependencia de algunas cantidades
de otras.
Más tarde, con Galileo, el concepto empezó a ver algo más de luz. Sus estudios
sobre el movimiento contenían un claro entendimiento sobre las relaciones entre va-
riables. Casi al mismo tiempo, la misma idea se formaba en la cabeza de Descartes,
el cuál, en su libro La Géometrie(1637) comentaba cómo una curva podía dibujarse
dándole infinitos valores a las variables, que al fin y al cabo, es lo que generalmente
hacemos hoy en día para la construcción de una curva, dada una función.
5
6 ÍNDICE GENERAL
El uso por primera vez de la expresión "función", no se dio hasta 1673, con el ma-
temático Leibniz. Sin embargo la palabra no fue usada en un lenguaje matemático,
como pasa como con la mayoría del lenguaje usado en las ciencias. Tras otros cien
años de espera, en 1748, la definición de función apareció de la mano de Léonard
Euler, y era la siguiente,
No obstante, nos damos cuenta al momento de que el definir una función como
una fórmula no nos trae más que problemas. Sea por ejemplo, el conjunto de puntos
de y 5 + 16y − 32x2 + 32x = 0, la figura 1 mostrada en R2 nos hace suponer que se
trata del gráfico de y en función de x, pero no tenemos una fórmula existente que
nos lo diga.
La definición de Euler, por tanto al no ser una definición hecha con su respectiva
expresión analítica, no nos aporta mucho, con ella solo podemos asumir que una
función se trata de un conjunto de operaciones como sumar, multiplicar, raíces, etc.
Si bien más tarde, en 1755, volvió a dar una nueva definición de función, esta última
siendo algo más precisa.
ÍNDICE GENERAL 7
Durante las siguientes décadas diversos matemáticos fueron aportando sus propias
definiciones de función, como Lacroix, Cauchy, Fourier o Poincaré, entre otros.
Para ser más exactos muchos matemáticos de prestigio acabaron dando su propia
versión. Cabe mencionar, que en la de Cauchy, se generaliza por primera vez una
definición de función en la que se incluyen tanto las funciones explícitas como las
implícitas, conceptos que definiré con precisión más adelante. Sin embargo, como
pasaba con Euler, lo hace hablando de fórmulas, y como vimos previamente eso
no nos da más que complicaciones. Fue en 1923, gracias a Goursat, con el que
obtuvimos una definición similar a la moderna que tenemos actualmente, la cual
doy a continuación.
X × Y = {(x, y) : x ∈ X, y ∈ Y }
con las siguientes propiedades, (i) para cada x ∈ X hay un elemento (x, y) ∈ f , y
(ii) si (x, y) ∈ f y (x, z) ∈ f , entonces y = z.
Usando esta definición es fácil ver que, en efecto, el ejemplo que se puso ante-
riormente es una función. Podemos llegar a la conclusión de que para cada x ∈ R,
existe un único y ∈ R tal que (x, y) satisface la ecuación escrita más arriba. Además,
tenemos que el conjunto de puntos que dibujamos antes, es el gráfico y = f (x), luego
ya tenemos la función f definida en el sentido moderno.
8 ÍNDICE GENERAL
Por tanto, no hace falta añadir, que también existen las funciones explícitas,
las cuales no son más que las que vienen expresadas directamente como y = f (x),
como por ejemplo, f (x) = x4 + log(x) − 7.
Ahora que tenemos más que definida una función, y hemos explicado las diferen-
cias entre explícitas e implícitas, no nos queda otra que hablar sobre la razón por la
que estamos aquí, el Teorema de la Función Implícita.
Uno espera que teniendo una ecuación de una variable, F (x) = c, siendo c una
constante, debe ser suficiente para determinar el valor de x dado c. En el caso
de tener dos variables, podríamos pensar de la misma manera, y suponer que dos
ecuaciones serán sufucientes para encontrar los valores de esas dos variables, y así
sucesivamente. De manera más general, lo que tenemos es que con un sistema de m
ecuaciones con m variables,
F1 (x1 , x2 , . . . , xm ) = c1 ,
F2 (x1 , x2 , . . . , xm ) = c2 ,
.. (1)
.
Fm (x1 , x2 , . . . , xm ) = cm ,
con c1 , c2 , . . . , cm constantes, uno esperaría que es el número ideal para poder obtener
los valores de las variables x1 , x2 , . . . , xm . Podemos incluso llegar a razonar que
con un sistema de ecuaciones como el descrito anteriormente, pero ahora con más
incógnitas (n) que ecuaciones (m), tratar las n−m extra variables como parámetros,
de forma que hay m variables que son funciones implícitas de n − m parámetros.
F1 (x1 , x2 , . . . , xn ) = c1 ,
F2 (x1 , x2 , . . . , xn ) = c2 ,
.. (2)
.
Fm (x1 , x2 , . . . , xn ) = cm ,
Para la realización de este prólogo se han utilizado las referencias [1] y [2].
10 ÍNDICE GENERAL
Introducción
Estos objetivos se han alcanzado mediante la realización de los siguientes tres capí-
tulos:
Este capítulo trata sobre el del primer objetivo que hemos mencionado. Nos hemos
11
12 ÍNDICE GENERAL
El segundo capítulo, trata sobre el segundo objetivo como bien indica su título. A
lo largo de éste, se van a enunciar tres versiones del teorema de la función implícita y
sus respectivas demostraciones, además de los preliminares que hayan sido necesarios
para su realización.
Finalmente, como se puede ver, mediante la realización de cada capítulo los obje-
tivos iniciales se han cumplido satisfactoriamente, además del uso de la bibliografía
que aparece al final y de la ayuda de mi tutor, Antonio Cañada.
14 ÍNDICE GENERAL
Summary
The present end degree work entitled The Implicit Function Theorem, is divided
into three chapters and a brief preface. In the preface, we give diverse definitions of
the mathematical term function throughout the history of mathematics, beginning
with Euler:
As we all know, nowadays we use one slightly different definition, which was given
by Goursat in 1923, and which can be found in details in the preface, as well as the
meaning of the appreciated implicit function.
The first chapter of this work is dedicated to the founders of the theorem, in other
words, the prestigious mathematicians who were key in development of the implicit
function theorem. We will describe how the British physicist Isaac Newton without
realising it, was the pioneer, thanks to his Newton’s Polygon. Later, Lagrange, gave
us the first proof of what we would call now, an inverse function theorem, but it
15
16 ÍNDICE GENERAL
was the French mathematician Cauchy who is considered to be the first ever to
enunciate and prove our main theorem. Nevertheless, the implicit function theorem
we learn now was described by the Italian Ulisse Dini, as he is the one who gave the
general version, which applies for systems of equations of multiple variables. Next,
we enunciate this version,
Implicit function theorem for one dependent variable: Let be the open set
O ⊆ Rn , and f : O → R a continuously differentiable function and p = (p1 , p2 ) ∈
Rn−1 × R, where p ∈ O is a point for which:
∂f
f (p) = 0 and (p) 6= 0.
∂xn
Then there exists an open set U ⊂ Rn−1 with p1 ∈ U and a unique continuously
differentiable function F : U → R such that
The middle chapter consists in giving three different versions of the implicit function
theorem and their respective demonstrations. We start by proving the Ulisse Dini’s
version, as described in [1]. We do this by the induction method on the number
of dependent variables. That is, we first enunciate and prove the version for one
dependent variable, one equation and any number of independent variables, which
is quite simple, and then by induction, we finally give and demonstrate the general
version, which is the next one:
In the proof, we use the classical approach. This one is relatively easier in com-
parison, that is the reason this is the preferred method to explain this theorem to
students. On this section, we enunciate both the inverse and implicit theorem, and
prove that they are equivalent to each other. In this way, we obtain our implicit
ÍNDICE GENERAL 17
function theorem demonstration by just proving the inverse function one. As stated
earlier on the introduction of this work, the main source used for this two proofs
has been the Krantz’s book named The Implicit Function Theorem. History, theory
and applications [1].
Finally in this chapter, we shall use the contraction mapping fixed point principle
to obtain our last variant of the implicit function theorem. This section, unlike the
previous ones, is based on functional analysis, therefore it is more abstract. However,
for this particular reason, this version of the theorem can be applied in different and
more general settings. For this one, we have relied on a previous end degree work
from another university, also entitled Teorema de la Función Implícita [7].
On the final chapter of this work, we explain some applications and generalisations
of the implicit function theorem, as stated on the introduction.
It is known about the direct correlation between this theorem and ordinary dif-
ferential equations. The mathematician Goursat studied this connection and gave
an iterative proof of the implicit function theorem. He was inspired by the Picard’s
iterative proof used on the existence theorem for ordinary differential equations. In
this section, we will enunciate Picard’s theorem and then explain how it can be used
to obtain an implicit function theorem demonstration.
Secondly, we have been requiring through this work, the condition of a non dege-
nerate jacobian matrix throughout this work. However, in this section, we will give
some examples of cases where it does degenerate, and see whether we can still apply
the implicit function theorem or not. After describing some necessary preliminary
remarks, we will study and differentiate various cases where the jacobian has range
one, and later on we will illustrate an example where its range is zero.
Last but not least, we will consider the implicit function theorem in both cases:
the real analytic and the complex analytic frameworks. We also now that they are
closely related as the problem in the real analytic category can be turned into a
holomorhic theorem and viceversa. Consequently, an implicit function problem with
18 ÍNDICE GENERAL
complex analytic data will have a C ∞ solution by the classical C ∞ implicit function
theorem, and hence, it also has a real analytic solution by the real analytic implicit
function theorem. The key of the matter is to see that it has a holomorphic solution,
as we describe bellow, from [1],
is absolutely convergent for |x| ≤ R1 , |y| ≤ R2 , if a0,0 = 0 and a0,1 6= 0, then there
exits r0 > 0 and a power series
X
f (x) = cα x α , (3)
|α|>0
F (x, f (x)) = 0.
Capítulo 1
Por otro lado, tenemos a Joseph Louis Lagrange (1736-1813),el cual llegó a
encontrar un teorema que es prácticamente el teorema de la función inversa. Fue
Augustin-Louis Cauchy (1789-1857) el que con más detalle se centró en el teorema
de la función implícita. Debido a ello, es el matemático al que se le suele dar el título
de creador del teorema. Esto es gracias al matemático Willian Fogg Osgood, el cual
fue el que mencionó la Memoria de Turin, como la fuente del teorema, definiendo
así a Cauchy como el creador de éste.
19
20 Origen histórico del Teorema de la función Implícita
Apareció entonces una versión del teorema para variables reales. Éste tomó la
versión más simple, es decir, la de dos variables reales, siendo la hipótesis principal
que al menos una derivada parcial fuese no nula, hipótesis correspondiente a que
la matriz jacobiana sea no singular. Ésta vino de la mano del matemático italiano
Ulisse Dini (1845-1918) que generalizó la versión del teorema con variables reales
para cualquier número de ecuaciones. Una vez que los matemáticos fueron estudiando
el teorema más a fondo y, paralelamente, comprendiéndolo mejor, empezaron a salir
nuevas demostraciones, que usaban técnicas algo más modernas, gracias a las cuáles
se fueron desarrollando nuevas versiones del teorema.
Antes del siglo XVIII parece ser que ningún matemático llegó a tener un mínimo
de interés en probar la existencia de funciones implícitas. Para ser más precisos, y
citando las propias palabras de Léonard Euler [1],
Entre los muchos manuscritos que Newton escribió a lo largo de su vida, en uno
precisamente escrito en latín, De Analysi per AEquationes Infinitas (1669), Newton
se plantea el problema de cómo expresar la siguiente ecuación,
respecto de la variable x, de forma que ésta sea válida en un entorno del punto
x = 0 y tal que nos de una solución de la ecuación para a 6= 0 cuando x = 0. Este
ejemplo en cuestión se encuentra dentro de un apartado del libro llamado Exempla
per Resolutionem AEquationum Affectarum.
Este apartado empieza con lo que hoy en dia llamamos el Método de Newton,
usado principalmente en la matemática aplicada como un método numérico para
encontrar raíces. No obstante, se trata de la primera referencia en la historia de las
matemáticas que tenemos de algo similar al teorema de la función implícita.
Con la ayuda del ejemplo que el mismo Isaac Newton usó en su momento, es decir
la ecuación (1.1), me dispongo a realizar la construcción de su polígono de Newton.
Además, de esta función implícita podremos obtener una solución y = y(x), de
forma que su gráfica pase por el origen y tal que esté definida al menos para valores
suficientemente pequeños de x. En particular, tendremos que se verifica y(0) = 0.
Empezamos realizando una pequeña traslación sobre la variable y, de forma que
se cumpla la condición que dijimos antes y de paso, para quitarnos de en medio a
la variable Y , hacemos el cambio y = Y − a, y sustituyendo en la ecuación (1.1)
obtenemos,
y 3 + 3ay 2 + 4a2 y + axy + a2 x − x3 = 0. (1.3)
El conjunto formado por todos los segmentos lineales creados al conectar los pares
de puntos del conjunto
{(i, j) : ai,j 6= 0} (1.4)
Cuya solución en un entorno de (0, 0) satisface ỹ ≈ −1/4, por lo que concluimos que
y ≈ −1/4x y finalmente, deshaciendo la traslación que se hizo al principio,
Y ≈ a − 1/4x.
En 1770, Lagrange probó lo que puede ser el primer teorema de la función implí-
cita, aunque se asemejaba más al teorema de la función inversa. Al resultado como
tal se le conoce como el Teorema de Inversión de Lagrange, y fue uno de los
resultados más trascendentales que hizo a lo largo de su vida. El teorema se podría
considerar como un caso especial del teorema de la función inversa para series de
potencias, que nos permite obtener la expansión en serie de Taylor de la función
inversa de una función analítica.
Las series de Lagrange aparecieron por primera vez durante sus investigaciones so-
bre métodos para encontrar soluciones numéricas de ecuaciones algebraicas. Usando
este mismo método, fue como obtuvo la solución del problema de Johannes Kepler
(1571-1630) de la teoría planetaria, convirtiéndose así en la aplicación más conocida
de las series de Lagrange. [6]
E = M + e · sen(E). (1.6)
1.2. JOSEPH LOUIS LAGRANGE 25
δ = a + g(z) (1.8)
tiene exactamente una raíz en D(a, r) y, si esa raíz δ = δ() es considerada como
una función de , tenemos que
∞
tn dn−1 0
X
n
f (δ) = f (a) + n−1
(f (z)g(z) ) . (1.9)
n=1
n! dz
z=a
26 Origen histórico del Teorema de la función Implícita
Cauchy definía una función de manera muy general como una variable que puede
ser expresada mediante una u otras variables, a las que llamaba variables in-
dependientes. Si la función era multivaluada, Cauchy la denotaba como f ((x)).
Además, llegó a diferenciar varios tipos de funciones: explícitas, implícitas, simples,
algebraicas y trigonométricas. Como ya dije al principio del capítulo, es considerado
el primer matemático que enunció y probó un teorema de la función implícita, o al
menos eso aseguraba Osgood.
Por razones políticas, tras la revolución de 1830, en 1831 Cauchy se auto exilió de
Francia, yéndose a Italia, donde el rey de Cerdeña le ofreció la cátedra de profesor
de física teórica en la Universidad de Turin, la cual fue creada expresamente para
él. En 1831 publicó sus conocidas Memorias de Turin a la Real Academia de
las Ciencias de Turin. Me voy a centrar en la primera, publicada el 11 de octubre,
Sur la mecanique celeste et sur un nouveau calcul qui s’applique a un grand nombre
de questions diverses, escrita en francés, ya que es la que contiene el teorema de la
función implícita.
Consta de tres partes, de las cuáles solo nos interesa la Parte I, que fue publicada
bajo algunas modificaciones en Ejercicios de análisis y física matemática de Cauchy.
Como dato adicional, las partes de las memorias se encuentran entre los trabajos
de Cauchy, es decir en diferentes libros o artículos, pero no fueron publicadas todas
juntas como un solo tomo.
gencia de las series infinitas más importantes de la mecánica celeste. Describió sus
resultados sobre la convergencia de series de Taylor de una función y de las expan-
siones de series de potencias de funciones implícitas. También describe en términos
generales las aplicaciones de dichos resultados en la mecánica celeste.
F (x, f (x)) = 0
Cauchy demostró esta versión del teorema mediante técnicas de análisis complejo,
luego no me voy a parar a demostrarlo. Sin embargo, también llegó a enunciar y
demostrar el teorema de la función implícita mediante el método de mayorantes,
que mencioné anteriormente. Lo enuncio a continuación, [1].
F (x, f (x)) = 0.
Para esta sección se han usado los siguientes libros [1], [5] y [6].
Hasta ahora, los teoremas de la función implícita que he descrito han sido para
funciones de una única variable. Sin embargo, en 1878, el matemático italiano Ulisse
Dini (1845-1918) describió de forma rigurosa por primera vez la versión que podemos
encontrar en los libros de texto en la actualidad.
Ulisse Dini fue un matemático nacido en Pisa. Durante sus años de estudiante tu-
vo la oportunidad de tener a mentores como Ottavio Mossotti y Enrico Betti. El
primero era físico matemático, muy influenciado por el trabajo de Lagrange, y ense-
ñaba geodésica en la Universidad de Pisa. El segundo, profesor de física matemática,
fue el tutor de la tesis de Dini.
En 1865, gracias a una beca, se fue a vivir a París, donde estudió bajo Charles
Hermite y Joseph Bertrand, además de publicar diversos artículos. Volvió a Pisa
un año más tarde, empezando allí su carrera como profesor en la Universidad Real
de Pisa, como profesor de geodésica y análisis avanzado. Además de su carrera
matemática, debido en parte a la problemática situación en la que se encontraba
Italia durante aquella época, Dini se inició en la política en 1871, llegando incluso
en 1890 a formar parte del parlamento italiano como senador. [3]
1. A × I ⊂ Ω,
∂f
2. para cualquier punto (x, y) ∈ A × I se tiene que ∂y
(x, y) 6= 0,
4. y0 = ϕ(x0 ),
Tras el trabajo realizado por Dini, otros autores han propuesto algunas mejoras
de sus resultados. En primer lugar, mencionar a Elcia Sadun, que aún siendo poco
conocido, fue el primero en destacar la importancia del trabajo que Dini había
hecho sobre las funciones implícitas, además de realizar algunas mejoras y añadir
generalizaciones, algunas de éstas con aplicaciones geométricas. Más tarde en 1899,
E. Lindelöf hizo su propia contribución considerando de nuevo funciones analíticas
de varias variables en el campo escalar complejo, probando el teorema mediante la
expansión de series de potencias, que fue una restricción que el mismo Dini eliminó.
Otras muchas contribuciones se han hecho desde entonces, algunas por W.F.
Osgood en 1901, É. Goursat en 1903 y E.H. Young en 1909, la versión del cual
requería de unas hipótesis más débiles que las dadas por Dini, ya que se pedía un
orden más bajo de diferenciabilidad [3].
Capítulo 2
Podemos decir que, a grandes rasgos, existen dos puntos de vista para demostrar el
teorema de la función implícita clásico. El primero se basa en conceptos y resultados
del cálculo de varias variables, mientras que el segundo usa nociones del análisis
funcional consiguiendo llegar así a una demostración mucho más rápida y sencilla,
en general.
En este capítulo voy a dar dos demostraciones basadas en el cálculo, ambas ob-
tenidas del libro de Krantz [1], la primera de ellas es la que el propio Dini usó en
su momento. También usaré el análisis funcional para dar una tercera demostración
que, aún siendo algo más abstracta que las anteriores, nos va a permitir tener una
versión del teorema más general, para esta he usado [7].
La demostración de en este capítulo, como bien dice el título es la dada por Ulisse
Dini en 1870. Ésta se realiza mediante un procedimiento inductivo en el número de
31
32 Estudio comparativo de diferentes demostraciones del T.F.I
Después mediante inducción, iremos tomando de nuevo una única ecuación con
una variable dependiente a la que se le aplica la versión del teorema anterior. Así
obtenemos una función definida de forma implícita que podemos sustituir en el resto
de ecuaciones, de esta forma se acaba reduciendo el número de variables dependientes
y ecuaciones a solo una.
∂f
f (p) = 0 y (p) 6= 0.
∂xn
Entonces tenemos que existe un conjunto abierto U ⊂ Rn−1 con p1 ∈ U y una función
continuamente diferenciable F : U → R tal que
Demostración:
∂f
Podemos suponer sin problema alguno que ∂xn
(p) > 0. Por la continuidad de
∂f /∂xn , y utilizando un entorno más pequeño O de p en caso de necesidad, asumimos
que:
∂f
(q) > 0, ∀q ∈ O. (2.1)
∂xn
Por esta razón tenemos que f (p1 , .) es una función creciente en un cierto intervalo
que contiene a r. Luego podemos encontrar r1 < r < r2 tal que,
Por el Teorema del Valor Intermedio, más concretamente el caso particular del
Teorema de Bolzano, tenemos que para cada x ∈ U existe un único número y tal
que r1 < y < r2 con f (x, y) = 0. Definimos F como F (x) = y y debido a la unicidad
de dicho y tenemos la continuidad de F . Además, se cumple,
∂F ∂f ∂f
=− / , j = 1, 2 . . . n − 1. (2.4)
∂xj ∂xj ∂xn
∂F ∂F √
f (x + sej , y + t) − f (x, y) = s (x, y) + t (x, y) + s2 + t2 (2.5)
∂xi ∂xn
luego llegamos a:
∂F ∂F
|t| (x, y) ≤ |s| (x, y) + |||s| + |||t| (2.6)
∂xn ∂xj
1 ∂F ∂F
|| ≤ | (x, y)| y || ≤ 2| (x, y)|
2 ∂xn ∂xj
tal que
∂F
∂xj
(x, y)
|t| ≤ 6|s| ∂F
(2.7)
∂xn
(x, y)
34 Estudio comparativo de diferentes demostraciones del T.F.I
∂F ∂F √ !
F (x + sej) − F (x) ∂xj
(x, y) t ∂xj
(x, y) s2 + t2
+ ∂F
= + ∂F
≤ || 1 + 6 ∂F (2.8)
s ∂xn
(x, y) s ∂xn
(x, y) ∂xn
(x, y)
∂F
Tomando el límite cuando s → 0 en la expresión anterior, tenemos que ∂xj
existe
en x y es el dado en la fórmula (2.4), luego ya tenemos que F es continuamente
diferenciable como queríamos demostrar.
Para poder demostrar la versión general del teorema, vamos a enunciar el siguiente
lema, además de algunos conceptos y notación nuevos.
Lema: Sea M una matriz real m × m. Entonces tenemos que existe una matriz
invertible real A tal que AM es triangular superior.
fi (x1 , . . . , xj ; y1 , . . . , yn ) = 0, i = 1, . . . n, (2.9)
∂ f˜i
y 7→ F̃ (y) = (f˜1 (p; y), . . . , f˜n (p; y)), de forma que, ∂yj
= 0, cuando i > j.
n
Y ∂fi
6= 0 (2.14)
i=1
∂yi
Demostración:
Introducimos ahora las nuevas variables y‘ = (y1 , y2 , . . . , yn−1 ) y a q 0 = (q1 , . . . , qn−1 ).Por
el TFI1 aplicado a la ecuación,
fn (x, y 0 ; yn ) = 0 (2.17)
∂fn ∂fn ∂F
+ = 0. (2.19)
∂yj ∂yn ∂yj
∂F
(p; q 0 ) = 0 (2.20)
∂yj
Tenemos que las parciales de la primera matriz están evaluadas en (p; q 0 ) mientras
que las de la segunda, en (p; q). Por inducción, tenemos que existe un entorno V ⊂ Rm
2.2. DEMOSTRACIÓN CLÁSICA 37
Tomando ahora Φ(x) = (x.φ1 (x), . . . , φn−1 (x)) y O = V ∩ Φ−1 (V) y definimos
φn : O → R como φn (x) = F [x; φ1 , . . . , φn−1 (x)]. Y por la definición que hicimos de
hi tenemos que
∂f1 ∂f1 ∂f1
(p) (p) ··· (p)
∂x1 ∂x2 ∂xN
∂f2 ∂f2 ∂f2
···
∂x1 (p) ∂x2
(p) ∂xN
(p)
JacF (p) ≡
.. .. ... ..
(2.24)
. . .
∂fN ∂fN ∂fN
∂x1
(p) ∂x2
(p) ··· ∂xN
(p)
teorema de la función inversa también nos va a hacer falta el jacobiano, siendo éste
el determinante de la matriz jacobiana,
∂f1 ∂f1 ∂f1
(p) (p) ··· (p)
∂x1 ∂x2 ∂xN
∂f2 ∂f2 ∂f2
···
∂x1 (p) ∂x2
(p) ∂xN
(p)
det(JacF (p)) = det
.. .. .. ..
(2.25)
.
. . .
∂fN ∂fN ∂fN
∂x1
(p) ∂x2
(p) ··· ∂xN
(p)
Veremos que la condición de que dicho determinante |JacF (p)| = det(JacF (p))
sea no nulo será la condición suficiente para que exista inversa de F en un entorno
de p. Una notación que vamos usar respecto a las componentes de una función es la
siguiente:
Suponemos que,
∂(f1 , . . . , fm ) 0
(x ) 6= 0 (2.28)
∂(xq+1 , . . . , xn )
Entonces existe un entorno V de x0 , un conjunto abierto W ⊆ Rq que contiene a x0a
y funciones g1 , . . . , gm ∈ C k en W tales que:
Demostración:
siguiente:
1 0 ··· 0 0 ··· 0
0 1 ··· 0 0 ··· 0
··· ···
0 0 1 0 0
JacG =
∂f1
∂f1 ∂f1 ∂f1 ∂f1
∂x ∂x2
··· ∂xq ∂xq+1
··· ∂xn
1
.. .. .. .. .. .. ..
. . . . . . .
∂fm ∂fm ∂fm ∂fm ∂fm
∂x1 ∂x2
··· ∂xq ∂xq+1
··· ∂xn
Ahora, usando el teorema de la función inversa que hemos enunciado más arriba,
concluimos que existe un entorno V de x0 de forma que G(V) es un conjunto abierto
y tal que la restricción G|V tiene una función inversa G−1 ∈ C k .
Para x ∈ V, G(x) = 0 si y solo si, xa ∈ R y G(x) = (xa , 0), ya que G_V y G−1 son
inversas, G(x) = (xa , 0) , si y solo si x = G−1 (xa , 0).
1
c= (2.29)
kh(x0 )k
2.2. DEMOSTRACIÓN CLÁSICA 41
|G̃(s) − G̃(t)|
→ 0, cuando s, t → 0.
|s − t|
Luego para un > 0, tenemos que cuando el s esté cerca de t,
˙ − t|
|G(s) − G(t)| ≥ |L(s) − L(t)| − |s
Sin embargo,
˙ − t|.
|L(s) − L(t)| ≥ c|s (2.30)
˙
por tanto tenemos que, |G(s)−G(t)| ≥ (c−)|s−t|, donde tomando = c
obtenemos:
2
c˙
|G(s) − G(t)| ≥ |s − t|.
2
Con estos cálculos llegamos a la conclusión de que G(s) = G(t) implica necesa-
riamente que s = t, con lo que hemos demostrado que G es localmente inyectiva en
el conjunto U.
F (t∗ ) = |x − x∗ |2 < [σ ∗ ]2 , y
F (t) > [σ ∗ ]2 ∀t ∈ S.
Tenemos que (G|V )−1 ⊂ C 1 existe, por la inyectividad local que se probó en el
Paso 1. Sea x∗ ∈ W , t∗ = (G|−1 ∗ ∗ ∗
V (x )) y L = JacG (t ). Vamos a ver que G−1 es
2.2. DEMOSTRACIÓN CLÁSICA 43
· c̃ · c
|G(t) − G(t∗ ) − L∗ (t − t∗ )| ≤ |t − t∗ |, ∀t ∈ B̃. (2.31)
2
˙ − t|.
|L(s) − L(t)| ≥ c|s
c
· |t − t∗ | ≤ |x − x∗ |. (2.32)
2
∗
|G−1 (x) − Gx − (L∗ )−1 (x − x∗ )| ≤ |x − x∗ |
Jac−1 ∗ −1
G (x ) = JacG (G (x)), ∀x ∈ W, (2.33)
∂gi
de donde deducimos que G−1 es continua.Y como además, cada ∂xj
es continua,
∂gi
la composición ∂xj
◦ G, también lo es. Luego por (2.33) y por la regla de Cramer,
tenemos que todas las derivadas parciales,
∂(G−1 )i
son continuas.
∂xj
44 Estudio comparativo de diferentes demostraciones del T.F.I
∂gi
Siendo ahora G de clase C m , entonces cada ∂xj
es de clase C m−1 , y por tanto
∂gi ∂gi
la composición ∂xj
◦ G−1 ∈ C m−1 . Por tanto, ∂xj
◦ G es de clase C m−1 y a la vez
G−1 ∈ C m . Así, de forma inductiva tenemos que si G ∈ C k , entonces también lo será
G−1 , con lo que se termina la demostración de este último paso, y por consiguiente,
la del teorema de la función inversa.
x1 = p, x2 = F (x1 ), . . . , xi = F (xi−1 ).
≤ ci−1 · δ(x1 , x0 )
De aquí obtenemos,
Luego hemos probado que efectivamente, x0 es un punto fijo de F , ahora nos falta
probar la unicidad de este. Para ello, vamos a suponer que existe otro punto fijo,
para llegar a la conclusión de que tienen que ser el mismo. Sea x̃0 el otro punto fijo,
entonces como F es una contracción tenemos que existe una métrica tal que,
Y ya que tenemos la condición de 0 < c < 1, las únicas posibilidades son δ(x̃, ỹ) = 0
o que x̃ = ỹ, con lo probamos la unicidad, y por consiguiente el teorema.
46 Estudio comparativo de diferentes demostraciones del T.F.I
F (x, u(x)) = 0, ∀x ∈ U.
H: C 0 (U0 , Rm ) −→ C 0 (U0 , Rm )
v 7−→ f (x, v(x))
1
kd2 f (x, y)k ≤ , ∀(x, y) ∈ U0 × V0 ,
2
Para finalizar, nos queda ver que como F (x, u(x)) = 0, tenemos que,
∂F ∂F ∂u1
∂x1 + ∂xn+1
· ∂x1
+ . . . ∂x∂F
n+m
· ∂um
∂x1
=0
∂F ∂u1
+ ∂x∂F · + . . . ∂x∂F · ∂um
∂x2 n+1 ∂x2 n+m ∂x2
=0
...
∂F + ∂F ∂u1
· + . . . ∂x∂F · ∂um
∂xn ∂xn+1 ∂xn n+m ∂xn
=0
∂u ∂u
con lo que podemos concluir por la regla de Cramer, que las parciales, ∂x1
, . . . , ∂xn
,
pueden ser expresadas como funciones continuas, y efectivamente u ∈ C 1 . Solo nos
queda por demostrar que esas parciales existen, para ello vamos a emplear el lema
enunciado antes.
∂F
Como teníamos que F (x, u(x)) = 0, ∂y
(x, y) se trata de un difeomorfismo de Rm
en un entorno de (a, b). Por tanto, G(x, u(x)) = (x, F (x, u(x))) es una aplicación
inyectiva y su diferencial es un isomorfismo en un entorno de (a,b).
Sabemos que existe una relación directa entre el teorema de la función implícita y
la teoría de ecuaciones diferenciales. Picard, al demostrar el teorema de existencia de
ecuaciones diferenciales ordinarias, dio lugar a que Goursat demostrase de la misma
manera, mediante una prueba iterativa, el teorema de la función implícita.
Más tarde, en el siglo XX, John Nash fue de los primeros en emplear el teorema
de la función implícita para el estudio de ecuaciones en derivadas parciales. Sin em-
bargo, para esta sección me voy a centrar, por simplicidad, solo en las ecuaciones
diferenciales ordinarias. Se va a demostrar cómo el teorema de existencia de solu-
ciones de ecuaciones diferenciales ordinarias puede ser usado para probar nuestro
teorema de la función implícita.
49
50 GENERALIZACIONES
Para obtener la unicidad nos bastará con añadir la condición de que F sea lips-
chitziana respecto a x, pasando a convertirse el teorema anterior en el Teorema de
Existencia y Unicidad de Picard.
Ahora podemos dar una demostración del teorema de la función implícita como
un corolario del teorema de Picard.
Demostración:
dx
= F (t, x), x(t0 ) = x0 ,
dt
dx
g 0 (t) = (t) = F (t, x(t)),
dt
∂G ∂G
= − (t, g(t))/ (t, g(t)).
∂t ∂x
d ∂G ∂G
G(t, g(t)) = (t, g(t)) + g 0 (t) (t, g(t)) = 0.
dt ∂t ∂x
Para el caso de n > 1, basta elegir a, r > 0 tal que (t0 − a, t0 + a) × B(x0 , r) ⊆ U
de forma que la matriz (n × n),
∂Gi
Dx G = (t0 , x0 )
∂xj i,j=1,2,...,n
tenga determinante distinto de 0 en (t0 −a, t0 +a)×B(x0 , r). Y por último sustituimos
en (3.1), para obtener,
−1 ∂G
F (t, x) = − [Dx G(t + t0 , x + x0 )] (t + t0 , x + x0 ) ,
∂t
En esta sección se van a tratar algunos casos en los que esto no ocurre, es decir,
en el que la matriz jacobiana es degenerada, y ver cuando se va a poder aplicar
dichos teoremas igualmente. Pero antes es necesario exponer algunos preliminares.
Preliminares:
Sean F (x, y, z) y G(x, y, x) funciones C 1 en un entorno del origen y tal que cum-
plan F (0, 0, 0) = G(0, 0, 0) = 0. Tenemos que las siguientes ecuaciones,
son de tres variables, luego el teorema de la función implícita usual nos dice que dos
de dichas variables, pongamos por ejemplo la x y la y, van a poder ser expresadas
como funciones de la tercera variable z. Como ya sabemos, la hipótesis para poder
aplicar el teorema es que la matriz jacobiana sea no degenerada en el origen,
Fx Fy
J = det (3.3)
Gx Gy
teniendo en cuenta que las funciones F y G son una aplicación tal que,
∂G
G0y = (0, 0, 0).
∂y
3.2. ALGUNOS CASOS SINGULARES DEL T.F.I. 53
Para el caso en que la matriz (3.4) tenga un rango mayor que la de (3.5), entonces
tendremos que la solución diferenciable que estamos buscando no existe.
Para esta sección vamos a asumir que el rango de (3.4) y de (3.5) es 1. Luego al
menos una de las componentes de (3.5) es distinta de 0. Por simplicidad, vamos a
suponer que,
∂F
(0, 0, 0) = Fx0 6= 0.
∂x
Como (3.4) tiene rango 1 y por haber asumido que Fx0 6= 0, tenemos que,
G0x 0 0 G0x 0
G0y = 0 Fy , Gz = 0 Fz . (3.6)
Fx Fx
F (x, y, z) = 0
(3.8)
H(x, y, z) = 0
Si la ecuación anterior se resolviese para y como una función de z, tal que y = y(z),
con dy/dz finita en z = 0, entonces esta función y(z) junto con x(z) = f (y(z), z),
nos daría la solución que buscamos para el sistema F (x, y, z) = 0, H(x, y, z) = 0.
Es más, la derivada dx/dz podría expresarse como,
dx Fy · (dy/dz) + Fz
=− . (3.11)
dz Fx
Solo nos queda ver cómo obtener nuestra función y respecto de la variable z.
Si asumimos que todas las derivadas de F y de H que necesitamos existen y son
3.2. ALGUNOS CASOS SINGULARES DEL T.F.I. 55
−Hx Fy + Hy Fx
Jy = ,
Fx
−Hx Fz + Hz Fx
Jz = .
Fx
Con lo que tenemos que por la última igualdad de la expresión anterior, Jyy = 0
en (0, 0) por ser Hx0 = 0, sin embargo, no tenemos razón para pensar que la igualdad
de la primera línea sea 0 en el origen.
Teniendo en cuenta que las primeras derivadas parciales de J(y, z) son nulas en
(0, 0), podemos escribir lo siguiente,
1 0 2 0 1 0 2 1 0 3 1 0 2
J(y, z) = Jyy y + Jyz yz + Jzz z + Jyyy y − Jyyz y z
2 2 6 2 (3.12)
1 0 1
+ Jyzz yz 2 + Jzzz
0
z 3 + otros términos de orden superior.
2 6
Ahora podemos resolver la ecuación (3.14) para µ como función de z. Por tanto,
la solución de J(y, z) = 0 para la variable y vendrá dada como y(z) = zµ(z). Si
cogemos la primera expresión de la ecuación,
1 0 2 0 1 0
Jyy µ + Jyz µ + Jzz = 0, (3.15)
2 2
Caso I
0 2 0 0
(Jyz ) − Jyy Jzz < 0
0 0 0
o Jyy = Jyz = 0 y Jzz 6= 0
En este caso, la ecuación (3.15) no tiene raíces reales. Luego no puede existir un
valor real para µ(0), y por tanto tampoco va a existir una solución del tipo que
estamos buscando.
Caso II
0 2 0 0
(Jyz ) − Jyy Jzz > 0
Para este caso, (3.15) tiene una o dos raíces reales simples, dependiendo de si
0
Jyy se anula o no. Igualmente, para ambos casos se puede aplicar el teorema de la
función implícita, el cuál nos asegura la existencia de una solución µ = µ(z) de la
3.2. ALGUNOS CASOS SINGULARES DEL T.F.I. 57
ecuación (3.14) para cada raíz real simple de (3.15). Luego, cuando µ0 sea una raíz
real, tendremos que,
µ(z) = µ0 + o(1),
dx F y µ0 + F z
=− . (3.16)
dz Fx
Caso III
0 2 0 0 0
(Jyz ) − Jyy Jzz = 0 y Jyy 6= 0
En esta ocasión, se puede resolver la µ(z) tanto para z positivo como en negativo.
Sin embargo, hará falta utilizar potencias fraccionarias de z. Sea µ0 una raíz doble
de (3.15). Tenemos que entonces la ecuación (3.14) pasa a convertirse en,
1 0 2 1 0 3 2
J (µ − µ0 ) + z J (µ − µ0 ) + J1 (µ − µ0 ) + J2 (µ − µ0 ) + J3
2 yy 6 yyy
+ otros términos de orden superior = 0.
Siendo
1 0 1 0
J1 = Jyyy µ0 + Jyyz ,
2 2
1 0 2 0 1 0
J2 = Jyyy µ0 + Jyyz µ0 + Jyzz ,
2 2
1 0 3 1 0 2 1 0 1 0
J3 = Jyyy µ0 + Jyyz µ0 + Jyzz µ0 + Jzzz .
6 2 2 6
Este subcaso no puede resolverse sin usar derivadas de un orden todavía más
superior, luego no lo vamos a ver en detalle.
58 GENERALIZACIONES
q
µ − µ0 = ± (2J3 /Jyy 0 )u + otros términos de orden superior,
0
1. Si J3 y Jyy tienen signos opuestos, entonces existen dos soluciones de µ(z) para
z positiva y ninguna para z negativa.
0
2. Si J3 y Jyy tienen el mismo signo, entonces existen dos soluciones de µ(z) para
z negativa y ninguna para z positiva.
Para ambos casos, tenemos que y = µ0 (z) + O(|z|3/2 ), luego para z = 0, dy/dz =
µ0 y dx/dz viene dado por (3.16).
Caso IV
0 0 0
Jyy = Jyz = Jzz =0
1 0 3 1 0 2 1 0 1 0
Jyyy µ + Jyyz µ + Jyzz µ + Jzzz + otros términos de orden superior = 0. (3.17)
6 2 2 6
1 0 3 1 0 2 1 0 1 0
Jyyy µ + Jyyz µ + Jyzz µ + Jzzz = 0, (3.18)
6 2 2 6
una solución, µ = µ(z) con µ(z) = µ0 +o(1). Luego, como antes, y(z) = µ0 (z)+o(z),
y en z = 0, tendremos que,
dy dx F y µ0 + F z
= µ0 , =− .
dz dz Fx
Explicar este caso es algo más complicado que los mencionados anteriormente. Sin
embargo, a continuación voy a hacer un ejemplo para poder tener una idea general.
xz + yz + xy − z 3 + z 2 x = 0,
(3.19)
xz + 2yz − xy − 3z 3 − z 2 y = 0.
Como no hay ningún término lineal el rango del jacobiano del sistema es cero en
el origen. Sin embargo, nuestra intención es resolverlo para las variables x e y en
función de z. Esto se podría hacer de manera algebraica eliminando variables, pero
vamos a emplear el teorema de la función implícita para poder mostrar su utilidad
en un caso más general.
u + v − z + zu + uv = 0,
(3.20)
u + 2v − 3z − zv − uv = 0.
F (u, v, z) = u + v − z + zu,
G(u, v, z) = u + 2v − 3z − zv,
x(z) = −z 2 + o(z 2 ),
y(z) = 2z 2 + o(z 2 ).
Por último, de forma adicional, también podemos ver que todos los puntos del
conjunto,
{(x, 0, 0) : x ∈ R} ∪ {(0, y, 0) : y ∈ R}
también resuelven el sistema (3.19), dándonos por tanto otras dos soluciones adicio-
nales que nos resuelven el sistema en el origen.
También se van a usar series de potencias para una función δ(x, y), siendo x ∈ RN
e y ∈ R. Luego tendremos potencias de xα , siendo α un multiíndice y también, y k ,
con k un entero no negativo. La escribiremos como,
X
δ(x, y) = aα,k xα y k .
α,k
donde α se moverá dentro del rango de sus índices y k irá de 0 hasta ∞. Cuando se
escriba a0,0 se supondrá que α es la N-tupla de solo ceros y K = 0.
Lema: Sea
X
F (x) = aα x α y k
α,k
Demostración:
Tenemos que sin pérdida de generalidad podemos suponer que a0,1 = 1, luego
(3.22) se expresa como,
X ∞
XX
α
F (x, y) = y + (aα,0 + aα,1 y)x + aα,k xα y k . (3.26)
|α|>0 |α|≥0 k=2
∞
k (3.29)
XX X
+ bα,k xα cβ x β .
|α|≥0 k=2 |β|>0
Si todas las series que aparecen en (3.29) fueran al final absolutamente conver-
gentes, entonces el orden de los sumatorios podría ser reordenado sin problemas.
Asumiendo por tanto que lo son, podemos igualar las potencias de x de la par-
te izquierda y derecha de la ecuación, obteniendo así las siguientes relaciones de
recurrencia. En primer lugar, tenemos
que nos permite resolverla para cada cej . A continuación indicamos como para cada
coeficiente cα con un índice de orden mayor puede ser expresado en términos de
bγ,j y otros cβ de índice menor. De hecho, vamos a asumir de forma inductiva que
hemos resuelto para cα para todos los multiíndices α con |α| ≤ p. Fijando entonces
un multiíndice |α| = p e identificando las potencias de x, tenemos que,
X
cα+ej = bα+ej ,0 + bγ,1 cβ
|β|>0,|γ|>0,
β+γ=α+ej
X (3.31)
+ M (β 1 , . . . , β k ) · bγ,k · cβ 1 · cβ 2 · · · cβ k .
|γ|>0,k≥0,
|β i |>0,β 1 +···+β k +γ=α+ej
para todo j1 , j2 , . . . , jρ .
y si
X
h(x) = hα xα (3.35)
|α|
resuelve
h(x) = G[x, h(x)], (3.36)
entonces h(x) será un mayorante de f(x). Como consecuencia, si la serie (3.34) para
h(x) es convergente, entonces la serie de (3.24) es convergente y su radio de conver-
gencia es al menos tan grande como el radio de convergencia de (3.34). Tenemos
Kr
G(x, y) = ,
r − (x1 + · · · + xN ) − y
donde K = sup{|B(x, y)| : x ∈ D̄(o, R1 ), y ∈ D̄(0, r2 )} y r son lo suficientemente
pequeños (dependiendo de R1 y R2 ). Por el lema enunciando previamente, tenemos
que G es un mayorante de B. Con esta elección de mayorante (3.35) es cuadrática
y puede ser resuelta explícitamente. La solución además es holomorfa en x = 0. De
hecho, y = h(x) es la solución de dicha ecuación cuadrática
es continuamente diferenciable, basta aplicar ∂/∂ z̄j a ambos lados y aplicar la regla
de la cadena para determinar que ψ es holomorfa.
Bibliografía
[1] Steven G. Krantz and Harold R. Parks, The Implicit Function Theorem. History,
theory and applications, Springer Science and Business Media, 2012.
[2] J.J. O’Connor and E.F. Robertson, The Function Concept, MacTutor His-
tory of Mathematics Archive, 2005. https://mathshistory.st-andrews.ac.
uk/HistTopics/Functions/.
[3] Iurato, Giuseppe (2012) On the role played by the work of Ulisse Dini on implicit
function theory in the modern differential geometry foundations: the case of the
structure of a differentiable manifold, 1. http://philsci-archive.pitt.edu/
9485/
[4] Mingari Scarpello, Giovanni and Ritelli, Daniele. (2002). A Historical Outline of
the Theorem of Implicit Functions. Divulgaciones Matemáticas. 10.
[6] Frank Smithies, Cauchy and the Creation of Complex Function Theory, Univer-
sity of Cambridge, 1997.
[7] José Carlos Castaño Muñoz, Trabajo de Fin de Grado, El teorema de la función
implícita, Universidad de Sevilla, curso académico 2017-2018. https://idus.
us.es/handle/11441/77506
65