Teorema de Función Implicta

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 65

Trabajo Fin de Grado

Facultad de Ciencias

Grado en Matemáticas

Teorema de la función Implícita

María del Carmen Andrades Moya

Departamento de Análisis Matemático


Tutor: Antonio Cañada Villar
Curso Académico 2020/2021
Trabajo fin de Grado. Curso Académico 2020/2021.
Responsable de tutorización:
Antonio Cañada Villar.
Departamento de Análisis Matemático.
Índice general

Prólogo 5

Introducción 11

Summary 15

1. Origen histórico del Teorema de la función Implícita 19

1.1. Isaac Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

1.2. Joseph Louis Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . 24

1.3. Augustin-Louis Cauchy . . . . . . . . . . . . . . . . . . . . . . . . . . 26

1.4. Ulisse Dini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

2. Estudio comparativo de diferentes demostraciones del T.F.I. 31

2.1. Demostración inductiva. Ulisse Dini . . . . . . . . . . . . . . . . . . . 31

2.2. Demostración clásica . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

2.3. Demostración con el método de aproximaciones sucesivas . . . . . . . 44

3
3. Generalizaciones del T.F.I. y aplicaciones 49

3.1. Ecuaciones diferenciales ordinarias . . . . . . . . . . . . . . . . . . . . 49

3.2. Algunos casos singulares del T.F.I. . . . . . . . . . . . . . . . . . . . 52

3.2.1. Matriz Jacobiana de rango 1 . . . . . . . . . . . . . . . . . . . 53

3.2.2. Matriz Jacobiana de rango 0 . . . . . . . . . . . . . . . . . . . 59

3.3. El T.F.I para funciones analíticas . . . . . . . . . . . . . . . . . . . . 60


Prólogo

Antes de empezar a usar términos matemáticos más complejos, deberíamos pre-


viamente definir lo más simple, y la base, al fin y al cabo, de este trabajo, el concepto
de función. Puede parecer una tarea sencilla, no obstante, la definición de ésta ha
ido formándose poco a poco a lo largo de la historia de las matemáticas, y como
tal, ha sufrido cambios, o mejor dicho, ha ido mejorando en rigor y precisión con el
curso de los años.

Los babilonios fueron los primeros en emplearlas, tenían tablas de números natu-
rales expresando sus cuadrados o sus cubos, aunque el hecho de que las usaran, no
significa que supieran lo que eran de manera rigurosa. De este modo, no podemos,
ni debemos, afirmar que los babilonios sean los creadores del concepto de función.
Por estas mismas razones, por muy presentes que las funciones estuviesen durante
todos estos años, no era algo formalmente definido. No fue hasta el siglo XIV, en las
Universidades de Oxford y París, cuando se empezó a materializar una definición,
refiriéndose a las leyes de la naturaleza como la dependencia de algunas cantidades
de otras.

Más tarde, con Galileo, el concepto empezó a ver algo más de luz. Sus estudios
sobre el movimiento contenían un claro entendimiento sobre las relaciones entre va-
riables. Casi al mismo tiempo, la misma idea se formaba en la cabeza de Descartes,
el cuál, en su libro La Géometrie(1637) comentaba cómo una curva podía dibujarse
dándole infinitos valores a las variables, que al fin y al cabo, es lo que generalmente
hacemos hoy en día para la construcción de una curva, dada una función.

5
6 ÍNDICE GENERAL

El uso por primera vez de la expresión "función", no se dio hasta 1673, con el ma-
temático Leibniz. Sin embargo la palabra no fue usada en un lenguaje matemático,
como pasa como con la mayoría del lenguaje usado en las ciencias. Tras otros cien
años de espera, en 1748, la definición de función apareció de la mano de Léonard
Euler, y era la siguiente,

Una función de una variable es una expresión analítica compuesta de alguna


manera de la variable en cuestión y una cantidad numerable de números o
constantes. [2]

No obstante, nos damos cuenta al momento de que el definir una función como
una fórmula no nos trae más que problemas. Sea por ejemplo, el conjunto de puntos
de y 5 + 16y − 32x2 + 32x = 0, la figura 1 mostrada en R2 nos hace suponer que se
trata del gráfico de y en función de x, pero no tenemos una fórmula existente que
nos lo diga.

Figura 1: Gráfica de y 5 + 16y − 32x2 + 32x = 0. [1]

La definición de Euler, por tanto al no ser una definición hecha con su respectiva
expresión analítica, no nos aporta mucho, con ella solo podemos asumir que una
función se trata de un conjunto de operaciones como sumar, multiplicar, raíces, etc.
Si bien más tarde, en 1755, volvió a dar una nueva definición de función, esta última
siendo algo más precisa.
ÍNDICE GENERAL 7

Si algunas cantidades dependen de otras cantidades de forma que las últimas


cambien cuando lo hagan las primeras, entonces podríamos decir que las últimas
son funciones de las primeras. [1]

Durante las siguientes décadas diversos matemáticos fueron aportando sus propias
definiciones de función, como Lacroix, Cauchy, Fourier o Poincaré, entre otros.
Para ser más exactos muchos matemáticos de prestigio acabaron dando su propia
versión. Cabe mencionar, que en la de Cauchy, se generaliza por primera vez una
definición de función en la que se incluyen tanto las funciones explícitas como las
implícitas, conceptos que definiré con precisión más adelante. Sin embargo, como
pasaba con Euler, lo hace hablando de fórmulas, y como vimos previamente eso
no nos da más que complicaciones. Fue en 1923, gracias a Goursat, con el que
obtuvimos una definición similar a la moderna que tenemos actualmente, la cual
doy a continuación.

Una función dada con dominio X y codominio o rango Y es un subconjunto,


llamémosle f , del producto cartesiano

X × Y = {(x, y) : x ∈ X, y ∈ Y }

con las siguientes propiedades, (i) para cada x ∈ X hay un elemento (x, y) ∈ f , y
(ii) si (x, y) ∈ f y (x, z) ∈ f , entonces y = z.

Siempre que se cumplan estas dos condiciones, tenemos que dado un x ∈ f


cualquiera, tenemos un único y ∈ Y tal que (x, y) ∈ f . Dado que la propia definición
nos da la unicidad de dicha función, podemos escribir simplemente y = f (x), para
decir que (x, y) ∈ f .

Usando esta definición es fácil ver que, en efecto, el ejemplo que se puso ante-
riormente es una función. Podemos llegar a la conclusión de que para cada x ∈ R,
existe un único y ∈ R tal que (x, y) satisface la ecuación escrita más arriba. Además,
tenemos que el conjunto de puntos que dibujamos antes, es el gráfico y = f (x), luego
ya tenemos la función f definida en el sentido moderno.
8 ÍNDICE GENERAL

Nos bastaba con estudiar el comportamiento de F (y) = y 5 + 16y − 32x2 + 32x = 0


para un x fijo, es decir, si para cada x, sabemos que existe un único y que verifica
dicha ecuación, pero no somos capaces de calcularlo explícitamente, tenemos que la
ecuación está definida de forma implícita.

Por tanto, no hace falta añadir, que también existen las funciones explícitas,
las cuales no son más que las que vienen expresadas directamente como y = f (x),
como por ejemplo, f (x) = x4 + log(x) − 7.

Ahora que tenemos más que definida una función, y hemos explicado las diferen-
cias entre explícitas e implícitas, no nos queda otra que hablar sobre la razón por la
que estamos aquí, el Teorema de la Función Implícita.

Uno espera que teniendo una ecuación de una variable, F (x) = c, siendo c una
constante, debe ser suficiente para determinar el valor de x dado c. En el caso
de tener dos variables, podríamos pensar de la misma manera, y suponer que dos
ecuaciones serán sufucientes para encontrar los valores de esas dos variables, y así
sucesivamente. De manera más general, lo que tenemos es que con un sistema de m
ecuaciones con m variables,

F1 (x1 , x2 , . . . , xm ) = c1 ,
F2 (x1 , x2 , . . . , xm ) = c2 ,
.. (1)
.
Fm (x1 , x2 , . . . , xm ) = cm ,

con c1 , c2 , . . . , cm constantes, uno esperaría que es el número ideal para poder obtener
los valores de las variables x1 , x2 , . . . , xm . Podemos incluso llegar a razonar que
con un sistema de ecuaciones como el descrito anteriormente, pero ahora con más
incógnitas (n) que ecuaciones (m), tratar las n−m extra variables como parámetros,
de forma que hay m variables que son funciones implícitas de n − m parámetros.

Tenemos por tanto, que bajo unas condiciones especiales y variando c1 , c2 , . . . , cm ,


podremos definir estas m variables como funciones implícitas respecto de las otras.
De forma que la finalidad del Teorema de la Función Implícita es de proporcionar-
ÍNDICE GENERAL 9

nos un método lo suficientemente potente, o un conjunto de métodos, para poder


asegurar que efectivamente estamos bajo esas condiciones especiales con las cuáles
podremos dar el argumento anterior como válido.

El teorema de la función implícita se puede describir de diversas formas, a lo largo


de este trabajo se expresarán varias, algunas más modernas, otras más complejas,
pero al fin y al cabo todas siguen la misma base. A continuación, voy a enunciarlo
de manera informal como se hace en [1],

Teorema de la Función Implícita (Informal): Sean las ecuaciones siguientes,


dadas por funciones continuamente diferenciables,

F1 (x1 , x2 , . . . , xn ) = c1 ,
F2 (x1 , x2 , . . . , xn ) = c2 ,
.. (2)
.
Fm (x1 , x2 , . . . , xn ) = cm ,

si (2) se cumple para un punto a = (a1 , a2 , . . . , an ) y si, cuando las funciones en


(2) sean remplazadas por sus aproximaciones lineales, un conjunto en concreto de m
variables puede ser expresado como funciones de las otras n − m variables, entonces,
para (2), las mismas m variables pueden definirse como funciones implícitas de las
otras n − m variables en un entorno de a. Además, las funciones implícitas resul-
tantes son también continuamente diferenciables y sus derivadas pueden obtenerse
mediante derivación implícita.

El teorema, actualmente, es lo que un alemán llamaría un ansatz, cuya traducción


no es más que un enfoque, es decir, una manera de mirar a los problemas. Tenemos
diversas versiones de él, como de otros muchos teoremas, y podemos generalizar cada
uno de ellas a espacios euclídeos, de Banach o incluso conjuntos más complicados.
En definitiva, el teorema lo que nos da es un método para resolver ecuaciones.

Para la realización de este prólogo se han utilizado las referencias [1] y [2].
10 ÍNDICE GENERAL
Introducción

El presente Trabajo de fin de grado con título Teorema de la función Implícita,


se ha realizado teniendo en mente afrontar los siguientes objetivos:

Revisión histórica de sus orígenes (incluyendo las aportaciones de diversos


matemáticos durante distintos momentos de la historia).

Estudio comparativo de diferentes demostraciones que se han llevado a cabo


sobre dicho teorema.

Descripción de diferentes aplicaciones clásicas y modernas del teorema.

Estos objetivos se han alcanzado mediante la realización de los siguientes tres capí-
tulos:

1. Origen histórico del teorema de la función implícita.

2. Estudio comparativo de diferentes demostraciones del T.F.I.

3. Generalizaciones del T.F.I y aplicaciones.

A continuación, se explica brevemente el contenido de cada uno de los capítulos.

Capítulo 1: Origen histórico del teorema de la función implícita.

Este capítulo trata sobre el del primer objetivo que hemos mencionado. Nos hemos

11
12 ÍNDICE GENERAL

centrado en cuatro matemáticos que tuvieron una gran importancia en el desarrollo


del teorema de la función implícita.

El primero de ellos, Isaac Newton, lo hizo indirectamente mediante su Polígono


de Newton. El segundo, Joseph Louis Lagrange, realizó lo que puede ser la primera
demostración del teorema, aunque se asemejaba más a la demostración de un teo-
rema de la función inversa, al cuál se le conoce como el Teorema de Inversión de
Lagrange. A continuación tenemos a Augustin-Louis Cauchy, que es considerado el
primer matemático que enunció y probó un teorema de la función implícita. Por
último, Ulisse Dini. Los matemáticos anteriores a Dini habían estudiado versiones
del teorema para funciones de una única variable, sin embargo, fue Dini, como se
explica en el capítulo, el que describió de forma rigurosa por primera vez la ver-
sión que podemos encontrar en los libros de texto en la actualidad, que usa n ≥ 1
variables.

Capítulo 2: Estudio comparativo de diferentes demostraciones del T.F.I.

El segundo capítulo, trata sobre el segundo objetivo como bien indica su título. A
lo largo de éste, se van a enunciar tres versiones del teorema de la función implícita y
sus respectivas demostraciones, además de los preliminares que hayan sido necesarios
para su realización.

La primera demostración, es la realizada por Ulisse Dini. Se trata de una demos-


tración inductiva. Primero se enuncia y demuestra la versión para para una sola
variable dependiente y ecuación y un número arbitrario de variables independientes.
Después mediante inducción, llegamos a la versión general que sirve para n ≥ 1 va-
riables. La segunda demostración es la demostración clásica, se trata de demostrar
el teorema de la función implícita mediante el teorema de la función inversa. Ya
que ambos son equivalentes, como veremos en este capítulo, bastará demostrar el
segundo para obtener la prueba del primero. Para estas dos demostraciones se ha
usado el libro de Krantz como referencia [1], no obstante, para la tercera y última
demostración, que emplea el método de aproximaciones sucesivas he empleado un
ÍNDICE GENERAL 13

Trabajo de Fin de Grado de 2017, de la Universidad de Sevilla [7]; la razón de esto


ha sido mera preferencia respecto a la que se incluía el libro de Krantz.

Capítulo 3: Generalizaciones del T.F.I y aplicaciones.

En este último capítulo, se afronta el tercer objetivo de este trabajo. Se ha dividido


en tres secciones, donde cada una de ellas engloba una aplicación distinta del teorema
de la función implícita.

La primera de ellas se centra en las ecuaciones diferenciales ordinarias, ya que


sabemos que existe una relación directa entre el teorema de la función implícita y el
problema de Cauchy en teoría de ecuaciones diferenciales. Por esta razón, veremos
que se puede demostrar, usando el teorema de existencia de ecuaciones diferenciales
ordinarias (Picard), el teorema de la función implícita de forma iterativa. A conti-
nuación, se van a tratar algunos casos de sistemas de ecuaciones en los que la matriz
jacobiana es degenerada, y veremos cuando se va a poder aplicar igualmente el teo-
rema de la función implícita. Por último, se va a considerar el teorema de la función
implícita en el ámbito del análisis complejo.

Previamente a estos capítulos, se ha realizado una pequeño prólogo para este


trabajo, en el cuál se ha definido el concepto de función, en concreto el de función
implícita, además de explicar brevemente su origen. En él, también se ha enunciado
de manera informal una versión del teorema de la función implícita.

Finalmente, como se puede ver, mediante la realización de cada capítulo los obje-
tivos iniciales se han cumplido satisfactoriamente, además del uso de la bibliografía
que aparece al final y de la ayuda de mi tutor, Antonio Cañada.
14 ÍNDICE GENERAL
Summary

The implicit function theorem is a classical theorem of mathematical analysis and


it is used for equation systems with multiple variables. By using this theorem, we
are able to obtain numerous related results, such as the well-known inverse function
theorem. Its applications are countless (ordinary and partial differential equations,
differential geometry, functional analysis, etc).

The present end degree work entitled The Implicit Function Theorem, is divided
into three chapters and a brief preface. In the preface, we give diverse definitions of
the mathematical term function throughout the history of mathematics, beginning
with Euler:

A function of a variable quantity is an analytic expression composed in any way


whatsoever of the variable quantity and numbers or constant quantities. [2]

As we all know, nowadays we use one slightly different definition, which was given
by Goursat in 1923, and which can be found in details in the preface, as well as the
meaning of the appreciated implicit function.

The first chapter of this work is dedicated to the founders of the theorem, in other
words, the prestigious mathematicians who were key in development of the implicit
function theorem. We will describe how the British physicist Isaac Newton without
realising it, was the pioneer, thanks to his Newton’s Polygon. Later, Lagrange, gave
us the first proof of what we would call now, an inverse function theorem, but it

15
16 ÍNDICE GENERAL

was the French mathematician Cauchy who is considered to be the first ever to
enunciate and prove our main theorem. Nevertheless, the implicit function theorem
we learn now was described by the Italian Ulisse Dini, as he is the one who gave the
general version, which applies for systems of equations of multiple variables. Next,
we enunciate this version,

Implicit function theorem for one dependent variable: Let be the open set
O ⊆ Rn , and f : O → R a continuously differentiable function and p = (p1 , p2 ) ∈
Rn−1 × R, where p ∈ O is a point for which:

∂f
f (p) = 0 and (p) 6= 0.
∂xn

Then there exists an open set U ⊂ Rn−1 with p1 ∈ U and a unique continuously
differentiable function F : U → R such that

p2 = F (p1 ) and f [x, F (x)] = 0, ∀x ∈ U.

The middle chapter consists in giving three different versions of the implicit function
theorem and their respective demonstrations. We start by proving the Ulisse Dini’s
version, as described in [1]. We do this by the induction method on the number
of dependent variables. That is, we first enunciate and prove the version for one
dependent variable, one equation and any number of independent variables, which
is quite simple, and then by induction, we finally give and demonstrate the general
version, which is the next one:

Implicit function theorem: There exists a neighborhood O ⊂ Rm of p and a


set of continuously differentiable functions δj : O → R, j = 1, 2, . . . , n, such that
δj (p) = qj , j = 1, 2, . . . , n and

fi [x; δ1 (x), δ2 (x), . . . , δn (x)] = 0, i = 1, 2, . . . , n, ∀x ∈ O.

In the proof, we use the classical approach. This one is relatively easier in com-
parison, that is the reason this is the preferred method to explain this theorem to
students. On this section, we enunciate both the inverse and implicit theorem, and
prove that they are equivalent to each other. In this way, we obtain our implicit
ÍNDICE GENERAL 17

function theorem demonstration by just proving the inverse function one. As stated
earlier on the introduction of this work, the main source used for this two proofs
has been the Krantz’s book named The Implicit Function Theorem. History, theory
and applications [1].

Finally in this chapter, we shall use the contraction mapping fixed point principle
to obtain our last variant of the implicit function theorem. This section, unlike the
previous ones, is based on functional analysis, therefore it is more abstract. However,
for this particular reason, this version of the theorem can be applied in different and
more general settings. For this one, we have relied on a previous end degree work
from another university, also entitled Teorema de la Función Implícita [7].

On the final chapter of this work, we explain some applications and generalisations
of the implicit function theorem, as stated on the introduction.

It is known about the direct correlation between this theorem and ordinary dif-
ferential equations. The mathematician Goursat studied this connection and gave
an iterative proof of the implicit function theorem. He was inspired by the Picard’s
iterative proof used on the existence theorem for ordinary differential equations. In
this section, we will enunciate Picard’s theorem and then explain how it can be used
to obtain an implicit function theorem demonstration.

Secondly, we have been requiring through this work, the condition of a non dege-
nerate jacobian matrix throughout this work. However, in this section, we will give
some examples of cases where it does degenerate, and see whether we can still apply
the implicit function theorem or not. After describing some necessary preliminary
remarks, we will study and differentiate various cases where the jacobian has range
one, and later on we will illustrate an example where its range is zero.

Last but not least, we will consider the implicit function theorem in both cases:
the real analytic and the complex analytic frameworks. We also now that they are
closely related as the problem in the real analytic category can be turned into a
holomorhic theorem and viceversa. Consequently, an implicit function problem with
18 ÍNDICE GENERAL

complex analytic data will have a C ∞ solution by the classical C ∞ implicit function
theorem, and hence, it also has a real analytic solution by the real analytic implicit
function theorem. The key of the matter is to see that it has a holomorphic solution,
as we describe bellow, from [1],

Implicit function theorem: Suppose that the power series,


X
F (x, y) = aα,k xα y k ,
α,k

is absolutely convergent for |x| ≤ R1 , |y| ≤ R2 , if a0,0 = 0 and a0,1 6= 0, then there
exits r0 > 0 and a power series
X
f (x) = cα x α , (3)
|α|>0

such that (3) is absolutely convergent for |x| ≤ r0 and

F (x, f (x)) = 0.
Capítulo 1

Origen histórico del Teorema de la


función Implícita

El teorema de la función implícita, junto con el teorema de la función inversa, es


uno de los más importantes y antiguos paradigmas que se han dado en las matemá-
ticas. Se podría decir que la semilla del teorema apareció por primera vez entre los
escritos del físico matemático Isaac Newton (1642-1727), y en los de Gottfried
Leibniz (1646-1716), el cuál llego incluso a comentar la derivabilidad implícita.

Por otro lado, tenemos a Joseph Louis Lagrange (1736-1813),el cual llegó a
encontrar un teorema que es prácticamente el teorema de la función inversa. Fue
Augustin-Louis Cauchy (1789-1857) el que con más detalle se centró en el teorema
de la función implícita. Debido a ello, es el matemático al que se le suele dar el título
de creador del teorema. Esto es gracias al matemático Willian Fogg Osgood, el cual
fue el que mencionó la Memoria de Turin, como la fuente del teorema, definiendo
así a Cauchy como el creador de éste.

El teorema, como todo en la vida, fue evolucionando, hasta llegar a convertirse en


el que se enseña en las aulas de matemáticas por todo el mundo. Fue formalmente
definido por primera vez en el ambiente del análisis complejo y de las series de

19
20 Origen histórico del Teorema de la función Implícita

potencias complejas. El trabajo de Cauchy mencionado anteriormente estaba basado


principalmente en resultados del análisis complejo, ya que no fue hasta el siglo XIX,
cuando se pudo apreciar por primera vez diferencias importantes entre el análisis
complejo y el real.

Apareció entonces una versión del teorema para variables reales. Éste tomó la
versión más simple, es decir, la de dos variables reales, siendo la hipótesis principal
que al menos una derivada parcial fuese no nula, hipótesis correspondiente a que
la matriz jacobiana sea no singular. Ésta vino de la mano del matemático italiano
Ulisse Dini (1845-1918) que generalizó la versión del teorema con variables reales
para cualquier número de ecuaciones. Una vez que los matemáticos fueron estudiando
el teorema más a fondo y, paralelamente, comprendiéndolo mejor, empezaron a salir
nuevas demostraciones, que usaban técnicas algo más modernas, gracias a las cuáles
se fueron desarrollando nuevas versiones del teorema.

Durante este capítulo, se va ir haciendo un recorrido por las distintas contribucio-


nes que aportaron algunos de los matemáticos que contribuyeron al descubrimiento
del teorema, enunciando detalladamente pero sin un rigor total, cada una de ellas.

1.1. Isaac Newton

Antes del siglo XVIII parece ser que ningún matemático llegó a tener un mínimo
de interés en probar la existencia de funciones implícitas. Para ser más precisos, y
citando las propias palabras de Léonard Euler [1],

"Tenemos que, efectivamante, un gran número de funciones algebraicas no es


posible expresarlas de manera explícita. Sea por ejemplo, la función Z de z que
vienen definida por la ecuación, Z 5 = az 2 Z 3 − bz 4 Z 2 + cz 3 Z − 1. Aunque tengamos
la certeza de que esta ecuación es irresoluble, no podemos negar el hecho de que sí
podemos expresar Z como una expresión que dependa exclusivamente de la
variable z y constantes, luego; podemos afirmar que Z es una función de z."
1.1. ISAAC NEWTON 21

A los matemáticos de entonces les importaba más estudiar el comportamiento de


tales funciones, que probar su propia existencia. El trabajo de Newton que comentaré
más abajo, se puede considerar uno de los primeros en analizar el comportamiento
de funciones definidas implícitamente.

Isaac Newton (1643-1727), fue un físico matemático nacido en Inglaterra. Es


conocido fundamentalmente por sus estudios sobre las leyes de la mecánica clásica, a
través de las leyes del movimiento y su ley de la gravitación universal. No obstante,
también hizo descubrimientos fundamentales en el área de las matemáticas. Se le
atribuye la creación del cálculo integral y diferencial, junto con Gottfried Leibniz.
Pero esta no es la razón por la que estamos aquí.

Entre los muchos manuscritos que Newton escribió a lo largo de su vida, en uno
precisamente escrito en latín, De Analysi per AEquationes Infinitas (1669), Newton
se plantea el problema de cómo expresar la siguiente ecuación,

Y 3 + a2 Y − 2a3 + axY − x3 = 0 (1.1)

respecto de la variable x, de forma que ésta sea válida en un entorno del punto
x = 0 y tal que nos de una solución de la ecuación para a 6= 0 cuando x = 0. Este
ejemplo en cuestión se encuentra dentro de un apartado del libro llamado Exempla
per Resolutionem AEquationum Affectarum.

Este apartado empieza con lo que hoy en dia llamamos el Método de Newton,
usado principalmente en la matemática aplicada como un método numérico para
encontrar raíces. No obstante, se trata de la primera referencia en la historia de las
matemáticas que tenemos de algo similar al teorema de la función implícita.

Newton tuvo la oportunidad de desarrollar más a fondo este procedimiento en


otro manuscrito, De Methodis Serierum et Fluxionum (1670), en el cuál el método
mejorado que construye es al que llamamos Polígono de Newton o Diagrama
de Newton.

A continuación voy a explicar brevemente en qué consiste este método.


22 Origen histórico del Teorema de la función Implícita

Construcción del polígono de Newton: El polígono de Newton se usa para


determinar el comportamiento de un conjunto de puntos que siguen una función
polinómica del tipo,
N X
X
P (x, y) = ai,j xi y j (1.2)
n=0 i+j=n

en un entorno de uno de dichos puntos. Por comodidad, mediante el uso de traslacio-


nes podemos hacer cambios en la función para que ese punto sea el (0, 0). También
podemos suponer que no hay ningún factor común de x o y en el polinomio.

Con la ayuda del ejemplo que el mismo Isaac Newton usó en su momento, es decir
la ecuación (1.1), me dispongo a realizar la construcción de su polígono de Newton.
Además, de esta función implícita podremos obtener una solución y = y(x), de
forma que su gráfica pase por el origen y tal que esté definida al menos para valores
suficientemente pequeños de x. En particular, tendremos que se verifica y(0) = 0.
Empezamos realizando una pequeña traslación sobre la variable y, de forma que
se cumpla la condición que dijimos antes y de paso, para quitarnos de en medio a
la variable Y , hacemos el cambio y = Y − a, y sustituyendo en la ecuación (1.1)
obtenemos,
y 3 + 3ay 2 + 4a2 y + axy + a2 x − x3 = 0. (1.3)

Empleando ahora la notación de (1.2), tenemos que,

a1,0 = a2 , a0,1 = 4a2 , a1,1 = a, a0,2 = 3a, a3,0 = −1, a0,3 = 1,

con el resto de coeficientes igual a 0.

El conjunto formado por todos los segmentos lineales creados al conectar los pares
de puntos del conjunto
{(i, j) : ai,j 6= 0} (1.4)

contiene a un conjunto convexo especial, al que vamos a llamar C. De hecho, C es la


envolvente conexa del conjunto dado en (1.4). La frontera, ∂C, es un polígono cerrado
contenido en el primer cuadrante del eje de coordenadas, que además interseca a
ambos ejes.
1.1. ISAAC NEWTON 23

Figura 1.1: Polígono de Newton. [1]

Ya tenemos construido por tanto el polígono de Newton, y es el de arriba.

Tenemos que para cada segmento lineal formado se le corresponde un α, Siendo


entonces −1/α la pendiente de dicho segmento de línea. Una de las ideas de Newton
detrás del polinomio, es asumir que se puede escribir y(x) = xα ỹ(x), siendo ỹ(x)
una función continua que no se anula en x = 0. Primero se obtenían los α que
cumplían esta condición y después para saber con cuál quedarse se empleaba un
método geométrico algo más elaborado.

Para la ecuación (1.3) en concreto, solo tenemos un segmento en el polígono de


Newton, y este tiene pendiente -1, luego sustituyendo y = xỹ y, eliminando los
factores comunes de x, obtenemos la siguiente expresión,

x2 ỹ 3 + 3axỹ 2 + axỹ − x2 + 4a2 ỹ + a2 = 0. (1.5)

Cuya solución en un entorno de (0, 0) satisface ỹ ≈ −1/4, por lo que concluimos que
y ≈ −1/4x y finalmente, deshaciendo la traslación que se hizo al principio,

Y ≈ a − 1/4x.

Luego utilizando el método de Newton, mediante la construcción de su polígono,


hemos llegado a la misma aproximación lineal que se hubiese obtenido con el teorema
de la función implícita.
24 Origen histórico del Teorema de la función Implícita

1.2. Joseph Louis Lagrange

En 1770, Lagrange probó lo que puede ser el primer teorema de la función implí-
cita, aunque se asemejaba más al teorema de la función inversa. Al resultado como
tal se le conoce como el Teorema de Inversión de Lagrange, y fue uno de los
resultados más trascendentales que hizo a lo largo de su vida. El teorema se podría
considerar como un caso especial del teorema de la función inversa para series de
potencias, que nos permite obtener la expansión en serie de Taylor de la función
inversa de una función analítica.

En efecto, la mayor parte de la fama de Lagrange como matemático se debe a sus


estudios en mecánica celeste, ya que sus mayores contribuciones estaban relacionadas
con ella. Recibió numerosos premios por su trabajo, empezando en 1764, otorgado
por la Academia de las Ciencias de París, gracias a su escrito sobre la libración de
la luna. [1]

Las series de Lagrange aparecieron por primera vez durante sus investigaciones so-
bre métodos para encontrar soluciones numéricas de ecuaciones algebraicas. Usando
este mismo método, fue como obtuvo la solución del problema de Johannes Kepler
(1571-1630) de la teoría planetaria, convirtiéndose así en la aplicación más conocida
de las series de Lagrange. [6]

Figura 1.2: Kepler. [1]

La ecuación de Kepler es una de las fundamentales de la mecánica celeste,

E = M + e · sen(E). (1.6)
1.2. JOSEPH LOUIS LAGRANGE 25

En astronomía, una anomalía se define como la cantidad angular usada para


describir la posición de la órbita de un cuerpo celeste. En (1.6) M es la anomalía
media, o ángulo que recorrería un planeta que se moviese uniformemente a lo largo
de la circunferencia principal. E es la anomalía excéntrica y e es la excentricidad de
la órbita. Tenemos que M y e son cantidades medibles, donde e es preferiblemente
de un valor pequeño.

Gracias al teorema mencionado anteriormente, el Teorema de Inversión de La-


grange, se obtuvo una fórmula para la corrección que se debe hacer cuando para
alguna función ψ(.), ψ(M ) es remplazado por ψ(E). La corrección toma la forma
de una serie de potencias en e. Por tanto, se puede ajustar la diferencia entre la
anomalía media y la excéntrica.

No voy a entrar demasiado en detalle en el problema de Kepler, pero si que me


parece importante mencionar que antes de la intervención de Lagrange, las diversas
soluciones que había eran erróneas, incluso la dada por el propio Kepler. Para deter-
minados valores de la excentricidad, las soluciones fallaban, en concreto para valores
demasiado altos. A continuación enuncio el teorema de Lagrange, con el lenguaje y
rigor de la época. [1]

Teorema de Inversión de Lagrange: Sea f (z) y g(z) funciones analíticas en


el disco abierto D(a, r) ⊂ C y continuas en el cierre de dicho disco. Para un  de
módulo lo suficientemente pequeño tal que la desigualdad

|g(z)| < |z − a| (1.7)

sea cierta para z ∈ ∂D(a, r), entonces

δ = a + g(z) (1.8)

tiene exactamente una raíz en D(a, r) y, si esa raíz δ = δ() es considerada como
una función de , tenemos que

tn dn−1 0
X  
n
f (δ) = f (a) + n−1
(f (z)g(z) ) . (1.9)
n=1
n! dz
z=a
26 Origen histórico del Teorema de la función Implícita

1.3. Augustin-Louis Cauchy

Cauchy definía una función de manera muy general como una variable que puede
ser expresada mediante una u otras variables, a las que llamaba variables in-
dependientes. Si la función era multivaluada, Cauchy la denotaba como f ((x)).
Además, llegó a diferenciar varios tipos de funciones: explícitas, implícitas, simples,
algebraicas y trigonométricas. Como ya dije al principio del capítulo, es considerado
el primer matemático que enunció y probó un teorema de la función implícita, o al
menos eso aseguraba Osgood.

Por razones políticas, tras la revolución de 1830, en 1831 Cauchy se auto exilió de
Francia, yéndose a Italia, donde el rey de Cerdeña le ofreció la cátedra de profesor
de física teórica en la Universidad de Turin, la cual fue creada expresamente para
él. En 1831 publicó sus conocidas Memorias de Turin a la Real Academia de
las Ciencias de Turin. Me voy a centrar en la primera, publicada el 11 de octubre,
Sur la mecanique celeste et sur un nouveau calcul qui s’applique a un grand nombre
de questions diverses, escrita en francés, ya que es la que contiene el teorema de la
función implícita.

Consta de tres partes, de las cuáles solo nos interesa la Parte I, que fue publicada
bajo algunas modificaciones en Ejercicios de análisis y física matemática de Cauchy.
Como dato adicional, las partes de las memorias se encuentran entre los trabajos
de Cauchy, es decir en diferentes libros o artículos, pero no fueron publicadas todas
juntas como un solo tomo.

El tema fundamental en la que basa esta parte es la determinación de condiciones


para la expansión de funciones explícitas e implícitas en series de potencias. A lo
largo del trabajo, Cauchy desarrolló diversos métodos para la estimación de restos
en esas expansiones tras un número finito de términos. A esta técnica Cauchy la
nombró calcul des limites, que hoy se conoce como el método de mayorantes.

En los preliminares del libro, Cauchy insistió en la necesidad de probar la conver-


1.3. AUGUSTIN-LOUIS CAUCHY 27

gencia de las series infinitas más importantes de la mecánica celeste. Describió sus
resultados sobre la convergencia de series de Taylor de una función y de las expan-
siones de series de potencias de funciones implícitas. También describe en términos
generales las aplicaciones de dichos resultados en la mecánica celeste.

El siguiente teorema que voy a formular, bajo el contexto de funciones holomorfas,


nos da la existencia de una función definida implícitamente bajo unas hipótesis
generales, y también nos ofrece una representación integral de la función. [1]

Teorema de la Función Implícita (Versión Cauchy): Sea una función


F (x, y) holomorfa en el bidisco D(x0 , R1 ) × D(y0 , R2 ) ⊆ C2 con
∂F
D2 F =
∂y
Tenemos que si F (x0 , y0 ) = 0 y D2 F (x0 , y0 ) 6= 0, entonces existe un disco D(x0 , r)
y una única función holomorfa f (x) definida en dicho disco con f (x0 ) = y0 tal que

F (x, f (x)) = 0

se cumple para x ∈ D(x0 , r). Además, la función f (x) es representada como


I
1 D2 F (x, y)
f (x) = dy
2πi C F (x, y)
donde C = ∂D(y0 , r1 ) es un círculo elegido adecuadamente.

Cauchy demostró esta versión del teorema mediante técnicas de análisis complejo,
luego no me voy a parar a demostrarlo. Sin embargo, también llegó a enunciar y
demostrar el teorema de la función implícita mediante el método de mayorantes,
que mencioné anteriormente. Lo enuncio a continuación, [1].

Teorema: Sea la siguiente serie de potencias,



X
F (x, y) = akj xj y k
j,k=0

que suponemos absolutamente convergente para |x| ≤ R1 , |y| ≤ R2 . Si a00 = 0 y


a01 6= 0, entonces existe r0 > 0 y una serie de potencias,

X
f (x) = cj x j
j=1
28 Origen histórico del Teorema de la función Implícita

tal que f (x) es absolutamente convergente para |x| ≤ r0 y

F (x, f (x)) = 0.

Para esta sección se han usado los siguientes libros [1], [5] y [6].

1.4. Ulisse Dini

Hasta ahora, los teoremas de la función implícita que he descrito han sido para
funciones de una única variable. Sin embargo, en 1878, el matemático italiano Ulisse
Dini (1845-1918) describió de forma rigurosa por primera vez la versión que podemos
encontrar en los libros de texto en la actualidad.

Ulisse Dini fue un matemático nacido en Pisa. Durante sus años de estudiante tu-
vo la oportunidad de tener a mentores como Ottavio Mossotti y Enrico Betti. El
primero era físico matemático, muy influenciado por el trabajo de Lagrange, y ense-
ñaba geodésica en la Universidad de Pisa. El segundo, profesor de física matemática,
fue el tutor de la tesis de Dini.

En 1865, gracias a una beca, se fue a vivir a París, donde estudió bajo Charles
Hermite y Joseph Bertrand, además de publicar diversos artículos. Volvió a Pisa
un año más tarde, empezando allí su carrera como profesor en la Universidad Real
de Pisa, como profesor de geodésica y análisis avanzado. Además de su carrera
matemática, debido en parte a la problemática situación en la que se encontraba
Italia durante aquella época, Dini se inició en la política en 1871, llegando incluso
en 1890 a formar parte del parlamento italiano como senador. [3]

En 1877, Dini publicó el libro Lezioni di Analisi Infinitesimale, el cuál contie-


ne las lecciones dadas por él mismo durante el año académico anterior (1876-1877),
en la Universidad de Pisa. Existen dos versiones de este libro, ya que fue publicado
por dos editoriales distintas, pero en ambas se trata de un único volumen dividido
en dos partes. La primera parte está basada en el cálculo diferencial y la segunda en
1.4. ULISSE DINI 29

el cálculo integral. La teoría de funciones implícitas se encuentra en el capítulo XIII


de la parte 1a , con título Derivate e differenziali dei vari ordini di funzioni implicite
di una o più variabili indipendenti.

En este capítulo, Dini introduce la notación de funciones implícitas de dos o


más variables, discutiendo sus propiedades de unicidad, existencia y regularidad C 1 ,
primero para una única función implícita con derivadas de orden igual o mayor que
la primera y después, extendiendo sus resultados a sistemas de funciones implícitas.

El teorema de Dini nos asegura la existencia, regularidad y unicidad de funciones


de n ≥ 1 variables y con regularidad de clase C r con r ≥ 1, pero solo en campos
escalares reales. Sin embargo posteriormente, Dini mencionó en uno de sus trabajos
que el caso de campos complejos se podía deducir fácilmente, bastaba considerar la
descomposición de una función compleja de la forma f (x, y) = g(x, y) + ih(x, y),
siendo g y h funciones reales. La versión de Dini [4], para el caso de una variable, se
enuncia a continuación.

Teorema de la función implícita: Sea Ω un conjunto abierto en R2 y sea


f : Ω −→ R una una función C 1 . Supongamos que existe un punto (x0 , y0 ) ∈ Ω tal
que:
∂f
f (x0 , y0 ) = 0,
(x0 , y0 ) > 0,
∂y
entonces debe existir un intervarlo real A con centro x0 , otro I con centro y0 y una
función ϕ : A −→ R de forma que:

1. A × I ⊂ Ω,

∂f
2. para cualquier punto (x, y) ∈ A × I se tiene que ∂y
(x, y) 6= 0,

3. si (x, y) ∈ A × I entonces f (x, y) = 0, sí y solo sí y = ϕ(x),

4. y0 = ϕ(x0 ),

5. ϕ ∈ C 1 (A) y para cualquier x ∈ A:


∂f
(x, ϕ(x))
ϕ0 (x) = − ∂f
∂x
.
∂y
(x, ϕ(x))
30 Origen histórico del Teorema de la función Implícita

Tras el trabajo realizado por Dini, otros autores han propuesto algunas mejoras
de sus resultados. En primer lugar, mencionar a Elcia Sadun, que aún siendo poco
conocido, fue el primero en destacar la importancia del trabajo que Dini había
hecho sobre las funciones implícitas, además de realizar algunas mejoras y añadir
generalizaciones, algunas de éstas con aplicaciones geométricas. Más tarde en 1899,
E. Lindelöf hizo su propia contribución considerando de nuevo funciones analíticas
de varias variables en el campo escalar complejo, probando el teorema mediante la
expansión de series de potencias, que fue una restricción que el mismo Dini eliminó.

Otras muchas contribuciones se han hecho desde entonces, algunas por W.F.
Osgood en 1901, É. Goursat en 1903 y E.H. Young en 1909, la versión del cual
requería de unas hipótesis más débiles que las dadas por Dini, ya que se pedía un
orden más bajo de diferenciabilidad [3].
Capítulo 2

Estudio comparativo de diferentes


demostraciones del T.F.I.

Podemos decir que, a grandes rasgos, existen dos puntos de vista para demostrar el
teorema de la función implícita clásico. El primero se basa en conceptos y resultados
del cálculo de varias variables, mientras que el segundo usa nociones del análisis
funcional consiguiendo llegar así a una demostración mucho más rápida y sencilla,
en general.

En este capítulo voy a dar dos demostraciones basadas en el cálculo, ambas ob-
tenidas del libro de Krantz [1], la primera de ellas es la que el propio Dini usó en
su momento. También usaré el análisis funcional para dar una tercera demostración
que, aún siendo algo más abstracta que las anteriores, nos va a permitir tener una
versión del teorema más general, para esta he usado [7].

2.1. Demostración inductiva. Ulisse Dini

La demostración de en este capítulo, como bien dice el título es la dada por Ulisse
Dini en 1870. Ésta se realiza mediante un procedimiento inductivo en el número de

31
32 Estudio comparativo de diferentes demostraciones del T.F.I

variables dependientes. Primero se demuestra el teorema de la función implícita para


una sola variable dependiente, una ecuación y un número arbitrario de variables
independientes.

Después mediante inducción, iremos tomando de nuevo una única ecuación con
una variable dependiente a la que se le aplica la versión del teorema anterior. Así
obtenemos una función definida de forma implícita que podemos sustituir en el resto
de ecuaciones, de esta forma se acaba reduciendo el número de variables dependientes
y ecuaciones a solo una.

A continuación se enuncia y demuestra el teorema de la función implícita para


una variable dependiente:

Teorema de la función implícita con una variable dependiente :Sea el


abierto O ⊆ Rn , f : O → R función continuamente diferenciable y sea p = (p1 , p2 ) ∈
Rn−1 × R, donde p ∈ O es un punto tal que:

∂f
f (p) = 0 y (p) 6= 0.
∂xn

Entonces tenemos que existe un conjunto abierto U ⊂ Rn−1 con p1 ∈ U y una función
continuamente diferenciable F : U → R tal que

p2 = F (p1 ) y f [x, F (x)] = 0, ∀x ∈ U.

Demostración:

∂f
Podemos suponer sin problema alguno que ∂xn
(p) > 0. Por la continuidad de
∂f /∂xn , y utilizando un entorno más pequeño O de p en caso de necesidad, asumimos
que:
∂f
(q) > 0, ∀q ∈ O. (2.1)
∂xn

Por esta razón tenemos que f (p1 , .) es una función creciente en un cierto intervalo
que contiene a r. Luego podemos encontrar r1 < r < r2 tal que,

f (p1 , r1 ) < 0 < f (p1 , r2 ) (2.2)


2.1. DEMOSTRACIÓN INDUCTIVA. ULISSE DINI 33

se cumple. Usando ahora la continuidad de f , podemos encontrar un nuevo entorno


U de p1 tal que U × [r1 , r2 ] ⊆ O y con

f (x, r1 ) < 0 < f (x, r2 ), ∀x ∈ U. (2.3)

Por el Teorema del Valor Intermedio, más concretamente el caso particular del
Teorema de Bolzano, tenemos que para cada x ∈ U existe un único número y tal
que r1 < y < r2 con f (x, y) = 0. Definimos F como F (x) = y y debido a la unicidad
de dicho y tenemos la continuidad de F . Además, se cumple,

∂F ∂f ∂f
=− / , j = 1, 2 . . . n − 1. (2.4)
∂xj ∂xj ∂xn

Fijando el punto x ∈ U y F (x) = y, por la diferenciabilidad de la función f tenemos


que:

∂F ∂F √
f (x + sej , y + t) − f (x, y) = s (x, y) + t (x, y) +  s2 + t2 (2.5)
∂xi ∂xn

donde ej es el vector j-ésimo de la base canónica y  = (s, t) → 0 cuando


(s, t) → 0. Tomando por tanto t = F (x + sej ) − F (x) y recordando que y = F (x)
sustituyendo en (2.5) tenemos

f (x + sej , F (x) + F (x + sej ) − F (x)) − f (x, F (x)) = 0


∂F ∂F √
s (x, y) + t (x, y) +  s2 + t2 = 0
∂xi ∂xn

luego llegamos a:

∂F ∂F
|t| (x, y) ≤ |s| (x, y) + |||s| + |||t| (2.6)
∂xn ∂xj

donde tomando un valor de s suficientemente pequeño obtenemos que

1 ∂F ∂F
|| ≤ | (x, y)| y || ≤ 2| (x, y)|
2 ∂xn ∂xj

tal que
∂F
∂xj
(x, y)
|t| ≤ 6|s| ∂F
(2.7)
∂xn
(x, y)
34 Estudio comparativo de diferentes demostraciones del T.F.I

se cumple, y por tanto tenemos que,

∂F ∂F √ !
F (x + sej) − F (x) ∂xj
(x, y) t ∂xj
(x, y) s2 + t2
+ ∂F
= + ∂F
≤ || 1 + 6 ∂F (2.8)
s ∂xn
(x, y) s ∂xn
(x, y) ∂xn
(x, y)

∂F
Tomando el límite cuando s → 0 en la expresión anterior, tenemos que ∂xj
existe
en x y es el dado en la fórmula (2.4), luego ya tenemos que F es continuamente
diferenciable como queríamos demostrar. 

Para poder demostrar la versión general del teorema, vamos a enunciar el siguiente
lema, además de algunos conceptos y notación nuevos.

Lema: Sea M una matriz real m × m. Entonces tenemos que existe una matriz
invertible real A tal que AM es triangular superior.

Notación: Supongamos que tenemos un conjunto dado de ecuaciones:

fi (x1 , . . . , xj ; y1 , . . . , yn ) = 0, i = 1, . . . n, (2.9)

siendo las funciones fi todas continuamente diferenciables en R. Vamos a asumir


que (p; q) = (p1 , . . . , pj ; q1 , . . . qn ) es un punto el que (2.9) se cumple y además
tenemos que  
∂f1 ∂f1
···
 ∂y1 ∂yn 
 . ... .. 
det  .. . =6 0. (2.10)
 
∂fn ∂fn
∂y1
··· ∂yn

Tomamos dichas funciones fi (p; ·) como una aplicación F : Rn → Rn definida


como sigue:
y 7→ F (y) = (f1 (p; y), . . . , fn (p; y)). (2.11)

Luego aplicando el lema enunciado más arriba a la matriz de derivadas parciales


de F podemos obtener mediante transformaciones lineales de F una nueva función:
2.1. DEMOSTRACIÓN INDUCTIVA. ULISSE DINI 35

∂ f˜i
y 7→ F̃ (y) = (f˜1 (p; y), . . . , f˜n (p; y)), de forma que, ∂yj
= 0, cuando i > j.

No es restrictivo suponer que,


∂fi
= 0, i > j (2.12)
∂yj
De esta forma la matriz de derivadas parciales se nos ha quedado de la siguiente
forma,    
∂f1 ∂f1 ∂f1 ∂f1 ∂f1 ∂f1
··· ···
 ∂y1 ∂y2 ∂yn   ∂y1 ∂y2 ∂yn 
 ∂f2 ∂f2 ∂f2  ∂f2 ∂f2 
··· ···

 ∂y1 ∂y2 ∂yn 
  0 ∂y2 ∂yn 

 .. .. ..  =  .. .. ..  (2.13)
 
.. ..
 . . . .   . . . . 
   
∂fn ∂fn ∂fn ∂fn
∂y1 ∂y2
··· ∂yn
0 0 ··· ∂yn

con esta transformación tenemos que el determinante de dicha matriz es sim-


plemente la multiplicación de la diagonal, luego la ecuación (2.10) se escribe como

n
Y ∂fi
6= 0 (2.14)
i=1
∂yi

Podemos enunciar ya, la citada versión general.

Teorema de la función implícita: Existe un entorno O ⊂ Rm del punto p y un


conjunto de funciones δj : O → R, j = 1, 2, . . . , n, tal que δj (p) = qj , j = 1, 2, . . . , n
y con
fi [x; δ1 (x), δ2 (x), . . . , δn (x)] = 0, i = 1, 2, . . . , n, ∀x ∈ O. (2.15)

Demostración:

La vamos a hacer mediante inducción como se comentó al principio de este apar-


tado.

El caso n = 1, es el teorema de la función implícita para una sola variable de-


pendiente (TFI1 a partir de ahora), que ya tenemos probado. Supongamos que es
cierto para el caso n − 1 y vamos a probarlo para n. Usando la nueva notación que
definimos antes, por la expresión (2.14), tenemos que,
∂fn
(p; q) 6= 0 (2.16)
∂yn
36 Estudio comparativo de diferentes demostraciones del T.F.I

Introducimos ahora las nuevas variables y‘ = (y1 , y2 , . . . , yn−1 ) y a q 0 = (q1 , . . . , qn−1 ).Por
el TFI1 aplicado a la ecuación,

fn (x, y 0 ; yn ) = 0 (2.17)

para el punto (p; q 0 ; qn ), existe un entorno U ⊂ Rm+n−1 de (p, q 0 ) y una función


continuamente diferenciable F : U → R tal que F (p; q 0 ) = qn y

fn (x; y 0 ; F (x; y 0 )] = 0, ∀(x; y 0 ) ∈ U. (2.18)

Derivando fn respecto de la variable yj , 1 ≤ j ≤ n − 1 obtenemos

∂fn ∂fn ∂F
+ = 0. (2.19)
∂yj ∂yn ∂yj

Evaluando ahora en el punto x = p, y 0 = q 0 , y usando (2.12) y (2.16), vemos que

∂F
(p; q 0 ) = 0 (2.20)
∂yj

se cumple para j = 1, . . . , n − 1. Ahora para cada i = 1, 2, . . . , n − 1 definimos la


función hi como sigue,

hi (x1 , . . . , xm , y1 , . . . , yn − 1) = fi (x; y 0 , F (x; y 0 )). (2.21)

Considerando el sistema de ecuaciones, hi (x1 , . . . , xm , y1 , . . . , yn−1 ) = 0, para i =


1, . . . , n − 1, y para cada j = 1, . . . , n − 1, por (2.20), tenemos que,

∂hi ∂fi ∂fi ∂F ∂fi


(p; q 0 ) = (p; q 0 ; qn ) + (p; q 0 ; qn ) (p; q 0 ) = (p; q 0 ) (2.22)
∂yj ∂yj ∂yn ∂yj ∂yj

y por la expresión (2.14),


   
∂h1 ∂h1 ∂h1 ∂f1 ∂f1 ∂f1
· · · ∂yn−1 ···
 ∂y1 ∂y2   ∂y1 ∂y2 ∂yn−1 
 ∂h2 ∂h2  ∂f2 ∂f2 ∂f2 
· · · ∂y∂hn−1 ···
2

 ∂y1 ∂y  = det  ∂y1 ∂y2 ∂yn−1 
  
..  6= 0.
2
det 
 .. .. ... ..   .. .. ... (2.23)
 . . .   . . . 
   
∂hn−1 ∂hn−1 ∂hn−1 ∂fn−1 ∂fn−1 ∂fn−1
∂y1 ∂y2
· · · ∂yn−1 ∂y1 ∂y2
··· ∂yn−1

Tenemos que las parciales de la primera matriz están evaluadas en (p; q 0 ) mientras
que las de la segunda, en (p; q). Por inducción, tenemos que existe un entorno V ⊂ Rm
2.2. DEMOSTRACIÓN CLÁSICA 37

de p y una aplicación continuamente diferenciable φj : V → R tal que φj (p) = qj y


con
hi [x; φ1 (x), . . . , φn−1 (x)] = 0, i = 1, 2, . . . , n − 1, ∀x ∈ V

Tomando ahora Φ(x) = (x.φ1 (x), . . . , φn−1 (x)) y O = V ∩ Φ−1 (V) y definimos
φn : O → R como φn (x) = F [x; φ1 , . . . , φn−1 (x)]. Y por la definición que hicimos de
hi tenemos que

hi (x1 , . . . , xm , y1 , . . . , yn−1 ) = fi (x; y 0 , F (x; y 0 ))

luego vemos que se cumple fi (x; φ1 (x), . . . , φn (x)) = 0, i = 1, . . . , n, ∀x ∈ O. 

2.2. Demostración clásica

En este apartado se va a demostrar el teorema de la función implícita mediante


el teorema de la función inversa. Ya que ambos son equivalentes, como veremos a
continuación, bastará demostrar el segundo para tener la prueba del primero. Antes
sin embargo, nos va a hacer falta describir algunas definiciones previas.

Empezaremos por la matriz jacobiana y su determinante, además de comentar el


papel que desempeñan en el cálculo. Sean dos entornos abiertos U, V ⊂ RN y sea
la función F : U → V ∈ C 1 , que la describimos como F (x) = (f1 (x), . . . , fN (x)).
Tenemos por tanto, que para un punto p ∈ U, la matriz jacobiana de F en p es,
simplemente F 0 (p),

 
∂f1 ∂f1 ∂f1
(p) (p) ··· (p)
 ∂x1 ∂x2 ∂xN 
 ∂f2 ∂f2 ∂f2
···

 ∂x1 (p) ∂x2
(p) ∂xN
(p)
JacF (p) ≡ 
 .. .. ... ..

 (2.24)
 . . . 
 
∂fN ∂fN ∂fN
∂x1
(p) ∂x2
(p) ··· ∂xN
(p)

La matriz jacobiana juega a veces el mismo papel en el cálculo de varias variables


que la primera derivada (una matriz 1x1) en el cálculo de una variable. Para el
38 Estudio comparativo de diferentes demostraciones del T.F.I

teorema de la función inversa también nos va a hacer falta el jacobiano, siendo éste
el determinante de la matriz jacobiana,
 
∂f1 ∂f1 ∂f1
(p) (p) ··· (p)
 ∂x1 ∂x2 ∂xN 
 ∂f2 ∂f2 ∂f2
···

 ∂x1 (p) ∂x2
(p) ∂xN
(p)
det(JacF (p)) = det 
 .. .. .. ..
 (2.25)
.

 . . . 
 
∂fN ∂fN ∂fN
∂x1
(p) ∂x2
(p) ··· ∂xN
(p)

Veremos que la condición de que dicho determinante |JacF (p)| = det(JacF (p))
sea no nulo será la condición suficiente para que exista inversa de F en un entorno
de p. Una notación que vamos usar respecto a las componentes de una función es la
siguiente:

F (x) = F (x1 , . . . xN ) ≡ (f1 (x1 , . . . , xN ), . . . , fM (x1 , . . . , xN )), (2.26)

usando la elección de M ≤ N argumentos posibles, que expresamos como xi1 , . . . , xiM ,


y siendo el jacobiano,
 
∂f1 ∂f1 ∂f1
···
 ∂xi1 ∂xi2 ∂xiM
 ∂f2 ∂f2 ∂f2
···

∂(f1 , . . . , fM )  ∂xi ∂xi2 ∂xiM

det(JacF (p)) = = det 
 ..
1
.. .. .. 
 (2.27)
∂(xi1 , . . . , xiM )  . . . . 
 
∂fM ∂fM ∂fM
∂xi1 ∂xi2
··· ∂xiM

Teorema de la función inversa: Sea U ⊆ Rn un abierto y sea G : U → Rn ∈ C k ,


con k ≥ 1. Sea x0 un punto fijo de U, suponemos que |JacG(x0 )| =
6 0. Entonces existe
un entorno abierto V ⊆ U de x0 tal que:

La restricción G|V es inyectiva.

El conjunto G(V) = W es abierto.

La inversa G−1 de G|U es de clase C k .

A continuación procedo a enunciar y demostrar el teorema de la función implícita


mediante el teorema de la función inversa. Tras esta demostración, haré la prueba del
teorema de la función inversa dando así por finalizada la demostración del primero.
2.2. DEMOSTRACIÓN CLÁSICA 39

Teorema de la función implícita: Sea

F (x) = F (x1 , . . . , xn ) ≡ (f1 (x1 , . . . , xn ), . . . , fm (x1 , . . . , xn ))

una función de clase C k , con k ≥ 1, definida en un conjunto abierto U ⊆ Rn , y


tal que tome valores en Rm , suponiendo que 1 ≤ m < n, y definimos q = n − m.
Sea x0 = (x01 , . . . , x0n ) un punto fijo de U y sea x = (x1 , . . . , xn ) un punto cualquiera
también de U. Tomamos por tanto:

xa = (x1 , . . . , xq ) las primeras q coordenadas de x,


x0a = (x01 , . . . , x0q ) las primeras q coordenadas de x0 .

Suponemos que,
∂(f1 , . . . , fm ) 0
(x ) 6= 0 (2.28)
∂(xq+1 , . . . , xn )
Entonces existe un entorno V de x0 , un conjunto abierto W ⊆ Rq que contiene a x0a
y funciones g1 , . . . , gm ∈ C k en W tales que:

F (x1 , . . . , xq ; g1 (xa ), . . . , gm (xa )) = 0, ∀xa ∈ W.

Además, g1 , . . . , gm son las únicas funciones que cumplen,

{x ∈ V : F (x) = 0} = {x ∈ V : xa ∈ W, xq+i = gi (xa ), i = 1, . . . , m}.

Demostración:

Tenemos que la función que hemos definido F es al menos, C 1 , luego podemos


definir su jacobiano, el cuál es continuo y en él existe un entorno U de x0 , en el que
éste no se anula.

Sea la transformación G : U → Rn dada por:

G(x) = (x1 , . . . , xn , f1 (x), . . . , fm (x)),

con lo que tenemos que G ∈ C k , al igual que G. Su matriz jacobiana de F es la


40 Estudio comparativo de diferentes demostraciones del T.F.I

siguiente:  
1 0 ··· 0 0 ··· 0
 
 0 1 ··· 0 0 ··· 0 
 
 
··· ···
 
 0 0 1 0 0 
JacG = 
 ∂f1

∂f1 ∂f1 ∂f1 ∂f1 
 ∂x ∂x2
··· ∂xq ∂xq+1
··· ∂xn 

 1
 .. .. .. .. .. .. .. 
 . . . . . . . 
 
∂fm ∂fm ∂fm ∂fm ∂fm
∂x1 ∂x2
··· ∂xq ∂xq+1
··· ∂xn

Tenemos por tanto que el determinante de dicha matriz, debido a su peculiar


forma, es simplemente del bloque inferior derecho m × m, que se trata del jacobiano
(2.28), por tanto det(JacG (x)) 6= 0, ∀x ∈ U.

Ahora, usando el teorema de la función inversa que hemos enunciado más arriba,
concluimos que existe un entorno V de x0 de forma que G(V) es un conjunto abierto
y tal que la restricción G|V tiene una función inversa G−1 ∈ C k .

Por último, si definimos (xa , 0) = (x1 , . . . , xq , 0, . . . , 0) y el conjunto,

R = {xa : (xa , 0) ∈ G(V)}.

Como el conjunto G(V) es un abierto de Rn , tenemos que R es también un abierto.


Ahora, para cada xa ∈ R, sea

gi (xa ) = fq+1 (xa , 0), ∀i = 1, . . . , m.

Para x ∈ V, G(x) = 0 si y solo si, xa ∈ R y G(x) = (xa , 0), ya que G_V y G−1 son
inversas, G(x) = (xa , 0) , si y solo si x = G−1 (xa , 0). 

Demostración (Teorema función Inversa):

PASO 1: La función F es localmente inyectiva:

Sea x0 ∈ U un punto fijo pero arbitrario y sea h la matriz inversa de JacG , y


notamos por khk la norma de h, la cual es un operador lineal. Se define

1
c= (2.29)
kh(x0 )k
2.2. DEMOSTRACIÓN CLÁSICA 41

Sea L la matriz jacobiana de G en el punto x0 , y tomamos G̃(t) = G(t) − L.


Luego para s, t ∈ U:

G(s) − G(t) = L(s) − L(t) + [G̃(s) − G̃(t)], pero

|G̃(s) − G̃(t)|
→ 0, cuando s, t → 0.
|s − t|
Luego para un  > 0, tenemos que cuando el s esté cerca de t,

˙ − t|
|G(s) − G(t)| ≥ |L(s) − L(t)| − |s

Sin embargo,
˙ − t|.
|L(s) − L(t)| ≥ c|s (2.30)
˙
por tanto tenemos que, |G(s)−G(t)| ≥ (c−)|s−t|, donde tomando  = c
obtenemos:
2


|G(s) − G(t)| ≥ |s − t|.
2

Con estos cálculos llegamos a la conclusión de que G(s) = G(t) implica necesa-
riamente que s = t, con lo que hemos demostrado que G es localmente inyectiva en
el conjunto U.

PASO 2: El conjunto G(U) es abierto:

Sea W = G(U). Sea x∗ un punto cualquiera de W , vamos a ver que x∗ tiene


un entorno en W . Por lo visto en el Paso 1, podemos tomar t∗ ∈ V, de forma que
G(t∗ ) = x∗ , siendo V un entorno de t∗ en el que G es inyectiva. Sea ahora B una
bola abierta con centro t∗ , y tal que su clausura esté dentro de V y con ∂B = S, su
frontera.

La inyectividad implica que x∗ ∈


/ G(S). Además por ser G continua y S un
conjunto compacto, tenemos que G(S) es también compacto. Definimos
1
σ ∗ = dist(x∗, G(S)).
2
Sea ahora W ∗ = B(x∗ , σ ∗ ). Fijando el punto arbitrario x ∈ W ∗ , y con t ∈ S,

2σ ∗ ≤ |x∗ − G(t)| ≤ |x∗ − x| + |x − G(t)|.


42 Estudio comparativo de diferentes demostraciones del T.F.I

y como tenemos que |x∗ − x| < σ ∗ , σ ∗ < |x − G(t)|, ∀t ∈ S. Sea ahora un t ∈ U,


definimos,
Q
X
2
F (t) = |x − G(t)| = [xj − gj (t)]2 ,
j=1

donde gj son las componentes de G. Por tanto, F ⊂ C k y debe existir un mínimo en


la bola compacta B̄, pero

F (t∗ ) = |x − x∗ |2 < [σ ∗ ]2 , y

F (t) > [σ ∗ ]2 ∀t ∈ S.

Por tanto, el valor mínimo de F en B̄ es menor que [σ ∗ ]2 , luego debe alcanzarse


en algún punto interior t̃ ∈ W ∗ , y en ese caso la derivada parcial de F en t̃ debe ser
0,
Q
∂F (t) X ∂fj (t)
= −2 (xj − gj (t)) (t),
∂tk j=1
∂tk
˜ obtenemos,
donde tomando cj = xj − gj (t),
Q
X ∂fj (t̃)
cj , para cada k.
j=1
∂tk

Como además det(JacG (t̃)) 6= 0, tenemos que los vectores columna


∂g1 ∂gQ
(t̃), . . . , (t̃), j = 1, . . . , Q,
∂tj ∂tj
son linealmente independientes. Con esto concluimos que cj = 0, j = 1, . . . Q, y por
tanto, x = G(t̃).

Hemos demostrado así que si x ∈ B, entonces x = G(t̃) para algún t̃ ∈ B, o


x ∈ G(B). Luego W ∗ ⊆ G(B) ⊆ W , luego W = G(V) es un conjunto abierto.

Notación: Durante el resto de demostración, se va a dejar fijo el entorno V de


x0 , donde G es inyectiva y por tanto det(JacG ) 6= 0.

PASO 3: La función (G|V )−1 ∈ C 1 :

Tenemos que (G|V )−1 ⊂ C 1 existe, por la inyectividad local que se probó en el
Paso 1. Sea x∗ ∈ W , t∗ = (G|−1 ∗ ∗ ∗
V (x )) y L = JacG (t ). Vamos a ver que G−1 es
2.2. DEMOSTRACIÓN CLÁSICA 43

diferenciable en x∗ y que Jac−1 ∗ ∗ −1


G (x ) = (L ) . Sea c̃ =
1
k(L∗ )−1 k
. Para algún  > 0,
existe una bola B̃ = B(t∗ , r∗ ) ⊆ V tal que:

 · c̃ · c
|G(t) − G(t∗ ) − L∗ (t − t∗ )| ≤ |t − t∗ |, ∀t ∈ B̃. (2.31)
2

La constante c es la misma que la definida en el Paso 1, donde,

˙ − t|.
|L(s) − L(t)| ≥ c|s

Por lo demostrado en el Paso 2, tenemos que existe un entorno B ∗ = B(x∗ , s) tal


que B ∗ ⊆ G(B̃). Sea x ∈ B ∗ , entonces x = G(t) para algún t ∈ B̃. Como además,
x∗ = G(t∗ ), por el Paso 1 tenemos que,

c
· |t − t∗ | ≤ |x − x∗ |. (2.32)
2

Es más, como t = G−1 (x∗ ), vemos que,

L∗ [G−1 (x) − G−1 (x∗ ) − (L∗ )−1 (x − x∗ )] ≤ |G(t) − G(t∗ ) − L∗ (x − x∗ )|.

Como tenemos que c̃|ω| ≤ L∗ (ω) para todo ω ∈ RQ , tenemos que,

c̃|G−1 (x) − G−1 (x∗ ) − (L∗ )−1 (x − x∗ )| ≤ |G(t) − G(t∗ ) − L∗ (x − x∗ )|.

Usando ahora (2.31) y (2.32), para cada x ∈ B̃,


|G−1 (x) − Gx − (L∗ )−1 (x − x∗ )| ≤ |x − x∗ |

Por tanto, hemos visto que G−1 es diferenciable en x∗ y Jac−1 ∗ −1


G (x ) = L . Resu-

miendo, tenemos que G−1 es una función diferenciable y,

Jac−1 ∗ −1
G (x ) = JacG (G (x)), ∀x ∈ W, (2.33)

∂gi
de donde deducimos que G−1 es continua.Y como además, cada ∂xj
es continua,
∂gi
la composición ∂xj
◦ G, también lo es. Luego por (2.33) y por la regla de Cramer,
tenemos que todas las derivadas parciales,

∂(G−1 )i
son continuas.
∂xj
44 Estudio comparativo de diferentes demostraciones del T.F.I

∂gi
Siendo ahora G de clase C m , entonces cada ∂xj
es de clase C m−1 , y por tanto
∂gi ∂gi
la composición ∂xj
◦ G−1 ∈ C m−1 . Por tanto, ∂xj
◦ G es de clase C m−1 y a la vez
G−1 ∈ C m . Así, de forma inductiva tenemos que si G ∈ C k , entonces también lo será
G−1 , con lo que se termina la demostración de este último paso, y por consiguiente,
la del teorema de la función inversa. 

2.3. Demostración con el método de aproximaciones


sucesivas

La tercera y última demostración que se va a dar es algo más abstracta en compa-


ración con las anteriores, ya que emplea el análisis funcional, pero nos va a permitir
tener una versión del teorema más general. Como bien dice el nombre de esta sección,
se va a usar el método de aproximaciones sucesivas, es decir, mediante iteraciones
vamos a ir mejorando el resultado partiendo de un punto inicial. Con esto se conse-
guirá una sucesión de funciones cuyo límite va a acabar siendo la función implícita
que necesitábamos.

Antes de demostrar nada, nos es necesario enunciar algunas definiciones que se


van a emplear durante esta sección.

Sea X un espacio métrico completo y sea δ su métrica. Tenemos que la función


F : X → X se define como una contracción si existe una constante 0 < c < 1 tal
que
δ(F (x), F (y)) ≤ c · δ(x, y), ∀x, y ∈ X.

El hecho de que c < 1 nos asegura que la imagen de un conjunto bajo F es


contraída, así los puntos en F (x) van a estar más pegados entre ellos que los puntos
originales en X.

El siguiente teorema que voy a enunciar se considera el teorema básico de funcio-


nes contractivas.
2.3. DEMOSTRACIÓN CON EL MÉTODO DE APROXIMACIONES SUCESIVAS45

Teorema (Punto fijo de Banach): Sea F : X → X una contracción con X un


espacio métrico completo. Entonces F va a tener un único punto fijo, x0 ∈ X que
cumple F (x0 ) = x0 .

Demostración: Para un punto p ∈ X cualquiera, vamos a definir una sucesión


de forma inductiva de la siguiente forma,

x1 = p, x2 = F (x1 ), . . . , xi = F (xi−1 ).

A continuación se prueba que dicha sucesión {xi } es de Cauchy en X. Sea i ≥ 1:

δ(xi , xi+1 ) = δ(F (xi−1 ), F (ii−2 )) ≤ c · δ(xi−1 , xi−2 ) =

= c · δ(F (xi−2 ), F (xi−3 )) ≤ c2 · δ(xi−2 , xi−3 ) ≤ · · · ≤

≤ ci−1 · δ(x1 , x0 )

De aquí obtenemos,

δ(xi+k , xi ) ≤ δ(xi+k , xi+k−1 ) + δ(xi+k−1 , xi+k−2 ) + δ(xi+1 , xi ) ≤


1
≤ [ci+k−1 + ci+k−2 + . . . cj ] · δ(x1 , x0 ) ≤ ci · · δ(x1 , x − 0).
1−c

Luego para un  > 0 y para un i lo suficientemente grande, tenemos que cualquier


sea el valor de k ≥ 1, δ(xi+k , xi ) < c, luego la sucesión {xi } es de Cauchy. Ahora,
como el espacio X es completo, tenemos que la sucesión tiene límite, al que vamos
a denotar x0 , y además,

F (x0 ) = F ( lı́m (xi ) = lı́m (F (xi )) = lı́m (xi+1 ) = x0 .


i→∞ i→∞ i→∞

Luego hemos probado que efectivamente, x0 es un punto fijo de F , ahora nos falta
probar la unicidad de este. Para ello, vamos a suponer que existe otro punto fijo,
para llegar a la conclusión de que tienen que ser el mismo. Sea x̃0 el otro punto fijo,
entonces como F es una contracción tenemos que existe una métrica tal que,

δ(x0 , x̃0 ) = δ(F (x0 ), F (x̃0 )) ≤ c · δ(x0 , x̃0 ).

Y ya que tenemos la condición de 0 < c < 1, las únicas posibilidades son δ(x̃, ỹ) = 0
o que x̃ = ỹ, con lo probamos la unicidad, y por consiguiente el teorema. 
46 Estudio comparativo de diferentes demostraciones del T.F.I

Para la demostración de la siguiente versión del teorema de la función implícita


he usado el trabajo de Castaño Muñoz [7]. Enuncio antes el siguiente lema que va a
ser usado en la demostración.

Lema: Sea f un homeomorfismo y diferenciable en a. Entonces tenemos que la


función g = f −1 es diferenciable en b = f (a) si y solo si f 0 (a) es un isomorfismo.

Teorema de la función implícita: Sean U ⊆ Rn y V ⊆ Rm , dos conjuntos


abiertos, y sea la función F : U × V → Rm diferenciable de forma que existan a ∈ U
y b ∈ V, tal que F (a, b) = 0. Sea M la matriz jacobiana de F (a, ·) en b invertible.
Entonces existen entornos abiertos de a y b respectivamente, U0 ⊂ U y V0 ⊂ V, tales
que para todo x ∈ U0 existe un único y ∈ V0 que cumple F (x, y) = 0, y además,
existe una aplicación diferenciable u : U0 → V0 tal que:

u(a) = b, (x, u(x)) ∈ U × V,

F (x, u(x)) = 0, ∀x ∈ U.

Demostración: Sea la sucesión de funciones definida como sigue:



 u0 (x) = y0 ,
 u (x) = f (x, u (x)) ∈ C(U , Rm ).
n n−1 0

Donde f (x, y) = y − M −1 (F (x, y)), que verifica la condición f (x, y) = y si y solo si


F (x, y) = 0. Consideremos ahora la aplicación, con x fijo:

H: C 0 (U0 , Rm ) −→ C 0 (U0 , Rm )
v 7−→ f (x, v(x))

Para un punto fijo de esta aplicación se va a tener que:

H(v) = v ⇔ f (x, v(x)) = v(x) ⇔ F (x, v(x)) = 0.

Veamos ahora que para un U0 lo suficientemente pequeño la aplicación H es con-


tractiva, es decir,

kH(v1 ) − H(v2 )k∞,U0 ≤ c · kv1 − v2 k∞,U0 , para 0 < c < 1, luego,


2.3. DEMOSTRACIÓN CON EL MÉTODO DE APROXIMACIONES SUCESIVAS47

kH(v1 ) − H(v2 )k∞,U0 = sup |H(v1 )(x) − H(v2 )(x)|Rm =


x∈U0
= sup |f (x, v1 (x)) − f (x, v2 (x))| ≤ (∗)
x∈U0
1
≤ sup · |v1 (x) − v2 (x)|Rm =
x∈U0 2
1
= · kv1 − v2 k∞,U0 .
2

En (∗) hemos usado la igualdad, d2 f (a, b) = IdRm − M −1 (d2 F (a, b)) = 0, y


empleando el teorema de los incrementos finitos, de forma que,

1
kd2 f (x, y)k ≤ , ∀(x, y) ∈ U0 × V0 ,
2

concluimos que existe un punto fijo en nuestra aplicación.

Para finalizar, nos queda ver que como F (x, u(x)) = 0, tenemos que,

∂F ∂F ∂u1
 ∂x1 + ∂xn+1

 · ∂x1
+ . . . ∂x∂F
n+m
· ∂um
∂x1
=0


∂F ∂u1
+ ∂x∂F · + . . . ∂x∂F · ∂um


∂x2 n+1 ∂x2 n+m ∂x2
=0


 ...


 ∂F + ∂F ∂u1
· + . . . ∂x∂F · ∂um

∂xn ∂xn+1 ∂xn n+m ∂xn
=0

∂u ∂u
con lo que podemos concluir por la regla de Cramer, que las parciales, ∂x1
, . . . , ∂xn
,
pueden ser expresadas como funciones continuas, y efectivamente u ∈ C 1 . Solo nos
queda por demostrar que esas parciales existen, para ello vamos a emplear el lema
enunciado antes.

∂F
Como teníamos que F (x, u(x)) = 0, ∂y
(x, y) se trata de un difeomorfismo de Rm
en un entorno de (a, b). Por tanto, G(x, u(x)) = (x, F (x, u(x))) es una aplicación
inyectiva y su diferencial es un isomorfismo en un entorno de (a,b).

Luego, G y G−1 son difeomorfismos de C 1 , por lo que el lema nos asegura la


existencia de las parciales de u, con lo que queda por terminada la demostración. 
48 Estudio comparativo de diferentes demostraciones del T.F.I
Capítulo 3

Generalizaciones del T.F.I. y


aplicaciones

Las siguientes generalizaciones y aplicaciones del teorema de la función implícita


han sido obtenidas del libro de Krantz [1].

3.1. Ecuaciones diferenciales ordinarias

Sabemos que existe una relación directa entre el teorema de la función implícita y
la teoría de ecuaciones diferenciales. Picard, al demostrar el teorema de existencia de
ecuaciones diferenciales ordinarias, dio lugar a que Goursat demostrase de la misma
manera, mediante una prueba iterativa, el teorema de la función implícita.

Más tarde, en el siglo XX, John Nash fue de los primeros en emplear el teorema
de la función implícita para el estudio de ecuaciones en derivadas parciales. Sin em-
bargo, para esta sección me voy a centrar, por simplicidad, solo en las ecuaciones
diferenciales ordinarias. Se va a demostrar cómo el teorema de existencia de solu-
ciones de ecuaciones diferenciales ordinarias puede ser usado para probar nuestro
teorema de la función implícita.

49
50 GENERALIZACIONES

Teorema (Cauchy-Peano): Si F (t, x), (t, x) ∈ R×Rn , es una función continua


en la región (t0 − a, t0 + a) × B(x0 , r), con a, r > 0, entonces existe una solución x(t)
de
dx
= F (t, x), x(t0 ) = x0 ,
dt
en un cierto intervalo (t0 − h, t0 + h).

Observación: Recalcar que el teorema anterior no nos asegura la unicidad de


la solución, y es que para funciones F solo continuas no tiene por qué ser la única
solución del problema. Sea por ejemplo el problema x0 = x2/3 , x(0) = 0. Tenemos
que existen dos soluciones x(t) verificando el problema, x ≡ 0 y x ≡ (t/3)3 .

Para obtener la unicidad nos bastará con añadir la condición de que F sea lips-
chitziana respecto a x, pasando a convertirse el teorema anterior en el Teorema de
Existencia y Unicidad de Picard.

Ahora podemos dar una demostración del teorema de la función implícita como
un corolario del teorema de Picard.

Teorema: Supongamos que U ⊂ Rn+1 , y sea G : U → Rn una función C 1 . Si


G(t0 , x0 ) = 0, (t0 , x0 ) ∈ R×Rn , y tal que la matriz (n×n), siendo Gi la componente
i-ésima de G,  
∂Gi
(t0 , x0 )
∂xj i,j=1,2,...,n
sea no singular, entonces existe un intervalo abierto (t0 − h, t0 + h) y una función
continuamente diferenciable g : (t0 −h, t0 +h) → Rn tal que g(t0 ) = x0 y G(t, g(t)) =
0, ∀t ∈ R.

Demostración:

Consideremos en primer lugar el caso para n = 1. Elegimos un a, r > 0 de forma


que (t0 −a, t0 +a)×(x0 −r, x0 +r) ⊆ U y tal que (∂G/∂x)(t, x) sea distinto de cero en
(t0 −a, t0 +a)×(x0 −r, x0 +r). Definimos ahora F : (t0 −a, t0 +a)×(x0 −r, x0 +r) → R
como,
∂G ∂G
F (t, x) = − (t, x)/ (t, x). (3.1)
∂t ∂x
3.1. ECUACIONES DIFERENCIALES ORDINARIAS 51

Como F es continua, podemos aplicar el teorema de existencia de ecuaciones


diferenciales para concluir que existe una solución del problema

dx
= F (t, x), x(t0 ) = x0 ,
dt

definida en un intervalo (t0 − h, t0 + h). Sea por tanto g : (t0 − h, t0 + h) → Rn tal


que g(t) = x(t). Nótese además que g(t0 ) = x0 y que,

dx
g 0 (t) = (t) = F (t, x(t)),
dt
∂G ∂G
= − (t, g(t))/ (t, g(t)).
∂t ∂x

Como g(t0 ) = x0 , tenemos que G(t0 , g(t0 )) = G(t0 , x0 ), y por lo anterior,

d ∂G ∂G
G(t, g(t)) = (t, g(t)) + g 0 (t) (t, g(t)) = 0.
dt ∂t ∂x

Luego tenemos que G(t, g(t)) = 0 en el intervalo (t0 − h, t0 + h).

Para el caso de n > 1, basta elegir a, r > 0 tal que (t0 − a, t0 + a) × B(x0 , r) ⊆ U
de forma que la matriz (n × n),
 
∂Gi
Dx G = (t0 , x0 )
∂xj i,j=1,2,...,n

tenga determinante distinto de 0 en (t0 −a, t0 +a)×B(x0 , r). Y por último sustituimos
en (3.1), para obtener,
 
−1 ∂G
F (t, x) = − [Dx G(t + t0 , x + x0 )] (t + t0 , x + x0 ) ,
∂t

con lo que la demostración es similar al caso n = 1. 

Observación: La demostración del teorema de la función implícita que acabo


de dar solo es válida para el caso de una variable independiente. Luego para el
caso de tener una sola variable dependiente y varias independientes se tendría que
cambiar la función F (t, x) que es usada en la prueba, por un sistema de ecuaciones
en derivadas parciales de primer orden. Para el caso general, es decir varias variables
dependientes e independientes, se podrá usar el mismo método que usa Ulisse Dini
en su demostración (dada en la sección 2.1 de este trabajo).
52 GENERALIZACIONES

3.2. Algunos casos singulares del T.F.I.

Tanto el teorema de la función implícita como el de la inversa requieren que la


función con la que se trabaje sea continuamente diferenciable, además de la condición
de que una cierta matriz jacobiana tenga un determinante distinto de cero.

En esta sección se van a tratar algunos casos en los que esto no ocurre, es decir,
en el que la matriz jacobiana es degenerada, y ver cuando se va a poder aplicar
dichos teoremas igualmente. Pero antes es necesario exponer algunos preliminares.

Preliminares:

Sean F (x, y, z) y G(x, y, x) funciones C 1 en un entorno del origen y tal que cum-
plan F (0, 0, 0) = G(0, 0, 0) = 0. Tenemos que las siguientes ecuaciones,

F (x, y, z) = 0, G(x, y, z) = 0 (3.2)

son de tres variables, luego el teorema de la función implícita usual nos dice que dos
de dichas variables, pongamos por ejemplo la x y la y, van a poder ser expresadas
como funciones de la tercera variable z. Como ya sabemos, la hipótesis para poder
aplicar el teorema es que la matriz jacobiana sea no degenerada en el origen,
 
Fx Fy
J = det   (3.3)
Gx Gy

teniendo en cuenta que las funciones F y G son una aplicación tal que,

(x, y) 7−→ (F (x, y, z), G(x, y, z)).

Se puede ver que hemos tomado a la variable z como un parámetro. Además,


como se ha hecho en el (3.3), a lo largo de este apartado los subíndices se van a
emplear para referirse a las derivadas parciales de las funciones, y el superíndice del
0 para cuando estas estén evaluadas en el origen, es decir,

∂G
G0y = (0, 0, 0).
∂y
3.2. ALGUNOS CASOS SINGULARES DEL T.F.I. 53

En esta sección, incluso sin tener la hipótesis de J =


6 0, se van a obtener las
expresiones de x e y respecto de z en un entorno el origen (0, 0, 0). Por tanto, de la
misma forma que en el teorema de la función implícita, si las funciones x(z) e y(z)
existen y son diferenciables, entonces podremos encontrar (mediante la regla de la
cadena) sus respectivas derivadas dx/dz y dy/dz, que para z = 0 satisfacen,
dx dy
Fx + Fy + Fz = 0,
dz dz
dx dy
Gx + Gy + Gz = 0.
dz dz
Luego es completamente necesario (para tener su existencia) que la matriz,
 
0 0 0
F Fy Fz
 x  (3.4)
G0x G0y G0z
tenga el mismo rango que la matriz jacobiana en el origen,
 
0 0
Fx Fy
J0 =  . (3.5)
G0x G0y

Para el caso en que la matriz (3.4) tenga un rango mayor que la de (3.5), entonces
tendremos que la solución diferenciable que estamos buscando no existe.

3.2.1. Matriz Jacobiana de rango 1

Para esta sección vamos a asumir que el rango de (3.4) y de (3.5) es 1. Luego al
menos una de las componentes de (3.5) es distinta de 0. Por simplicidad, vamos a
suponer que,
∂F
(0, 0, 0) = Fx0 6= 0.
∂x
Como (3.4) tiene rango 1 y por haber asumido que Fx0 6= 0, tenemos que,
G0x 0 0 G0x 0
G0y = 0 Fy , Gz = 0 Fz . (3.6)
Fx Fx

Vamos a cambiar el sistema de ecuaciones de antes F (x, y, z) = 0, G(x, y, z) = 0,


por uno equivalente pero más simple.
G0x
H(x, y, z) = G(z, y, z) − F (x, y, z).
Fx0
54 GENERALIZACIONES

Es obvio que Hx0 = 0, y además podemos aplicar (3.6), y tenemos que,

Hx0 = Hy0 = Hz0 = 0. (3.7)

Por tanto, el siguiente sistema,

F (x, y, z) = 0
(3.8)
H(x, y, z) = 0

es equivalente al original (3.2).

Como hemos supuesto que Fx0 6= 0, podemos aplicar el teorema de la función


implícita para resolver la primera ecuación F (x, y, z) = 0 de (3.8), siendo x una
función respecto de y y z cerca de y = z = 0. Por tanto, si expresamos x = f (y, z),
entonces f (0, 0) = 0 y las derivadas parciales de f (y, z) pueden ser expresadas
respecto las de F (x, y, z). Luego para un entorno de (0, 0), tenemos que,

Fy (f (y, z), y, z) Fz (f (y, z), y, z)


fy = − , fz = − . (3.9)
Fx (f (y, z), y, z) Fx (f (y, z), y, z)

Sustituyendo además x = f (y, z) dentro de la ecuación H(x, y, z) en (3.8), ya


hemos eliminado la variable x de nuestro sistema. Consideremos ahora la ecuación
resultante de sustituir la x,

J(x, y) ≡ H(f (y, z), y, z) = 0. (3.10)

Si la ecuación anterior se resolviese para y como una función de z, tal que y = y(z),
con dy/dz finita en z = 0, entonces esta función y(z) junto con x(z) = f (y(z), z),
nos daría la solución que buscamos para el sistema F (x, y, z) = 0, H(x, y, z) = 0.
Es más, la derivada dx/dz podría expresarse como,

dx Fy · (dy/dz) + Fz
=− . (3.11)
dz Fx

Solo nos queda ver cómo obtener nuestra función y respecto de la variable z.
Si asumimos que todas las derivadas de F y de H que necesitamos existen y son
3.2. ALGUNOS CASOS SINGULARES DEL T.F.I. 55

continuas, entonces las derivadas de J(y, z) pueden ser expresadas en términos de


F y H usando (3.10). En concreto, tendríamos que,

−Hx Fy + Hy Fx
Jy = ,
Fx
−Hx Fz + Hz Fx
Jz = .
Fx

Entonces por (3.7), tenemos también que Jy0 = Jz0 = 0.

La segunda y tercera derivada de J son expresiones más complicadas. Por ejemplo,


tenemos,

Hxx Fy2 − 2Hxy Fy Fx + Hyy Fx2


Jyy =
Fx2
Fy2 Fxx − 2Fx Fy Fxy + Fx2 Fyy
= −Hx · .
Fx3

Con lo que tenemos que por la última igualdad de la expresión anterior, Jyy = 0
en (0, 0) por ser Hx0 = 0, sin embargo, no tenemos razón para pensar que la igualdad
de la primera línea sea 0 en el origen.

Teniendo en cuenta que las primeras derivadas parciales de J(y, z) son nulas en
(0, 0), podemos escribir lo siguiente,

1 0 2 0 1 0 2 1 0 3 1 0 2
J(y, z) = Jyy y + Jyz yz + Jzz z + Jyyy y − Jyyz y z
2 2 6 2 (3.12)
1 0 1
+ Jyzz yz 2 + Jzzz
0
z 3 + otros términos de orden superior.
2 6

Como queremos encontrar una solución a la ecuación J(y, z) = 0 con y = 0


y z = 0 y para la que z tome valores no nulos. Podemos sustituir y = µz en la
expresión (3.12), siendo µ una función real evaluada en z. Con lo que tenemos que,
 
2 1 0 2 0 1 0
J(y, z) = z J µ + Jyz µ + Jzz
2 yy 2
 
3 1 0 3 1 0 2 1 0 1 0 (3.13)
+z J µ + Jyyz µ + Jyzz µ + Jzzz
6 yyy 2 2 6
+ otros términos de orden superior,
56 GENERALIZACIONES

luego para z 6= 0, podemos simplificar y tenemos que J(y, z) = 0 es equivalente a


escribir,
 
1 0 2 0 1 0
J(µ, z) = J µ + Jyz µ + Jzz
2 yy 2
 
1 0 3 1 0 2 1 0 1 0 (3.14)
+z J µ + Jyyz µ + Jyzz µ + Jzzz
6 yyy 2 2 6
+ otros términos de orden superior = 0.

Ahora podemos resolver la ecuación (3.14) para µ como función de z. Por tanto,
la solución de J(y, z) = 0 para la variable y vendrá dada como y(z) = zµ(z). Si
cogemos la primera expresión de la ecuación,

1 0 2 0 1 0
Jyy µ + Jyz µ + Jzz = 0, (3.15)
2 2

vemos que es el límite de (3.14) cuando z → 0. Si µ = µ(z) es solución de (3.14),


entonces µ(0) debe cumplir (3.15). Tenemos por tanto cuatro casos dependiendo del
0 2 0 0
signo del discriminante (Jyz ) −Jyy Jzz y del signo de las derivadas parciales segundas
0 0 0
Jyz , Jyy y Jzz . Lo habitual es que el se pueda aplicar el Caso I o el Caso II que se
van a describir a continuación.

Caso I
0 2 0 0
(Jyz ) − Jyy Jzz < 0
0 0 0
o Jyy = Jyz = 0 y Jzz 6= 0

En este caso, la ecuación (3.15) no tiene raíces reales. Luego no puede existir un
valor real para µ(0), y por tanto tampoco va a existir una solución del tipo que
estamos buscando.

Caso II
0 2 0 0
(Jyz ) − Jyy Jzz > 0

Para este caso, (3.15) tiene una o dos raíces reales simples, dependiendo de si
0
Jyy se anula o no. Igualmente, para ambos casos se puede aplicar el teorema de la
función implícita, el cuál nos asegura la existencia de una solución µ = µ(z) de la
3.2. ALGUNOS CASOS SINGULARES DEL T.F.I. 57

ecuación (3.14) para cada raíz real simple de (3.15). Luego, cuando µ0 sea una raíz
real, tendremos que,

µ(z) = µ0 + o(1),

y(z) = zµ(z) = µ0 (z) + o(z)


dy
= µ0 para z = 0.
dz
A partir de ahora, cuando se use la notación o(z), nos referiremos a que dicho
infinitésimo está acotado. De (3.11) obtenemos además que para z = 0 tenemos,

dx F y µ0 + F z
=− . (3.16)
dz Fx

Caso III
0 2 0 0 0
(Jyz ) − Jyy Jzz = 0 y Jyy 6= 0

En esta ocasión, se puede resolver la µ(z) tanto para z positivo como en negativo.
Sin embargo, hará falta utilizar potencias fraccionarias de z. Sea µ0 una raíz doble
de (3.15). Tenemos que entonces la ecuación (3.14) pasa a convertirse en,
 
1 0 2 1 0 3 2
J (µ − µ0 ) + z J (µ − µ0 ) + J1 (µ − µ0 ) + J2 (µ − µ0 ) + J3
2 yy 6 yyy
+ otros términos de orden superior = 0.

Siendo
1 0 1 0
J1 = Jyyy µ0 + Jyyz ,
2 2
1 0 2 0 1 0
J2 = Jyyy µ0 + Jyyz µ0 + Jyzz ,
2 2
1 0 3 1 0 2 1 0 1 0
J3 = Jyyy µ0 + Jyyz µ0 + Jyzz µ0 + Jzzz .
6 2 2 6

Caso III (a)


J3 = 0

Este subcaso no puede resolverse sin usar derivadas de un orden todavía más
superior, luego no lo vamos a ver en detalle.
58 GENERALIZACIONES

Caso III (b)


J3 6= 0

Reemplazamos la z por u2 si J3 y Jyy


0
tienen signos opuestos, y por −u2 si son
del mismo signo. Entonces, haciendo la raíz cuadrada, obtenemos que,
q
µ − µ0 = ± (−2J3 /Jyy 0 )u + otros términos de orden superior,

q
µ − µ0 = ± (2J3 /Jyy 0 )u + otros términos de orden superior,

Como resultado, tenemos que estas soluciones:

0
1. Si J3 y Jyy tienen signos opuestos, entonces existen dos soluciones de µ(z) para
z positiva y ninguna para z negativa.

0
2. Si J3 y Jyy tienen el mismo signo, entonces existen dos soluciones de µ(z) para
z negativa y ninguna para z positiva.

Para ambos casos, tenemos que y = µ0 (z) + O(|z|3/2 ), luego para z = 0, dy/dz =
µ0 y dx/dz viene dado por (3.16).

Caso IV
0 0 0
Jyy = Jyz = Jzz =0

Para este apartado, podemos remplazar (3.13) por,

1 0 3 1 0 2 1 0 1 0
Jyyy µ + Jyyz µ + Jyzz µ + Jzzz + otros términos de orden superior = 0. (3.17)
6 2 2 6

Y tomando ahora la ecuación,

1 0 3 1 0 2 1 0 1 0
Jyyy µ + Jyyz µ + Jyzz µ + Jzzz = 0, (3.18)
6 2 2 6

que es el límite de (3.17) cuando z → 0. Si (3.18) no tuviese raíces reales, entonces


no existirían soluciones del tipo que buscamos. Si µ0 fuese una raíz real múltiple de
(3.18), nos harían falta derivadas de un orden superior para poder encontrar una
solución, y no nos vamos a meter en eso. Por último, en el caso de que µ0 fuese una
raíz real simple, entonces el teorema de la función implícita nos dice que (3.18) tiene
3.2. ALGUNOS CASOS SINGULARES DEL T.F.I. 59

una solución, µ = µ(z) con µ(z) = µ0 +o(1). Luego, como antes, y(z) = µ0 (z)+o(z),
y en z = 0, tendremos que,
dy dx F y µ0 + F z
= µ0 , =− .
dz dz Fx

3.2.2. Matriz Jacobiana de rango 0

Explicar este caso es algo más complicado que los mencionados anteriormente. Sin
embargo, a continuación voy a hacer un ejemplo para poder tener una idea general.

Sea el siguiente sistema de ecuaciones,

xz + yz + xy − z 3 + z 2 x = 0,
(3.19)
xz + 2yz − xy − 3z 3 − z 2 y = 0.

Como no hay ningún término lineal el rango del jacobiano del sistema es cero en
el origen. Sin embargo, nuestra intención es resolverlo para las variables x e y en
función de z. Esto se podría hacer de manera algebraica eliminando variables, pero
vamos a emplear el teorema de la función implícita para poder mostrar su utilidad
en un caso más general.

Teniendo en cuenta que no hay ningún término z 2 en (3.19), si sustituimos por


las variables x = uz y = vz, tendremos el siguiente sistema una vez que eliminamos
los factores comunes de z 2 ,

u + v − z + zu + uv = 0,
(3.20)
u + 2v − 3z − zv − uv = 0.

y tomando las siguientes ecuaciones,

F (u, v, z) = u + v − z + zu,

G(u, v, z) = u + 2v − 3z − zv,

tenemos que cumplen,    


Fu0 Fv0 1 1
 . =  . (3.21)
G0u G0v 1 2
60 GENERALIZACIONES

Además, tenemos que (u, v, z) = (0, 0, 0) es un punto que cumple el sistema


(3.20). Luego como la matriz anterior tiene rango 2, por el teorema de la función
implícita tenemos garantizada la existencia de las soluciones u(z) y v(z) para (3.20)
con u(0) = v(0) = 0. Además, el teorema también nos permite obtener las derivadas
de u(z) y v(z) de forma implícita. Tenemos por tanto que, du/dz(0) = −1 y que
dv/dz(0) = 2. Y por tanto que,

x(z) = −z 2 + o(z 2 ),

y(z) = 2z 2 + o(z 2 ).

Por último, de forma adicional, también podemos ver que todos los puntos del
conjunto,
{(x, 0, 0) : x ∈ R} ∪ {(0, y, 0) : y ∈ R}

también resuelven el sistema (3.19), dándonos por tanto otras dos soluciones adicio-
nales que nos resuelven el sistema en el origen.

3.3. El T.F.I para funciones analíticas

En esta sección vamos a considerar el teorema de la función implícita tanto en


el análisis real como en el complejo. Estas categorías están relacionadas ya que
podemos pasar el problema de la función implícita del análisis real al complejo, y al
revés también.

En otras palabras, un problema de funciones implícitas con datos analíticos reales


tiene una solución en C ∞ gracias al teorema de la función implícita clásico en C ∞ , la
cuestión es ver que tiene una solución analítica real. De la misma forma, el mismo
problema pero con funciones holomorfas (análisis complejo) también va a tener una
solución en C ∞ , y además, también tendrá automáticamente una solución analítica
real. Pero el caso ahora es ver que tiene una solución analítica compleja.

Notación: Durante este apartado vamos a usar la notación de multiíndice. En


3.3. EL T.F.I PARA FUNCIONES ANALÍTICAS 61

RN , un multiíndice es una N-tupla α = (α1 , . . . , αN ), donde cada índice αj es un


entero no negativo. Para un x ∈ RN , definimos,

xα ≡ xα1 1 · xα2 2 · · · xαNN .

Además, tendremos que |α| = α1 + · · · + αN , y que α! = α1 ! · α2 ! · · · αN !. Por


último, si tenemos otro multiíndice β = (β1 , . . . , βN ), entonces la suma será, α + β =
(α1 + β1 , . . . , αN + βN ). Se va a emplear también la notación ej para referirse al
multiíndice (0, 0, . . . , 0, 1, . . . , 0), todo ceros menos el índice de la posición j que es
un 1.

También se van a usar series de potencias para una función δ(x, y), siendo x ∈ RN
e y ∈ R. Luego tendremos potencias de xα , siendo α un multiíndice y también, y k ,
con k un entero no negativo. La escribiremos como,
X
δ(x, y) = aα,k xα y k .
α,k

donde α se moverá dentro del rango de sus índices y k irá de 0 hasta ∞. Cuando se
escriba a0,0 se supondrá que α es la N-tupla de solo ceros y K = 0.

Enunciamos a continuación el siguiente lema que usa las estimaciones de Hada-


mard para el tamaño de los coeficientes de una serie de potencias convergente.

Lema: Sea
X
F (x) = aα x α y k
α,k

una función definida por una serie de potencias en x = (x1 , . . . , xN ) e y ∈ R que


es convergente para |x| < R1 , |y| < R2 . Asumiendo que F está acotada por K,
entonces,
−|α|
|aα,k | ≤ K · R1 · R2−k .

Teorema: Supongamos que la serie de potencias,


X
F (x, y) = aα,k xα y k . (3.22)
α,k

es absolutamente convergente para |x| ≤ R1 , |y| ≤ R2 , si

a0,0 = 0 y a0,1 6= 0, (3.23)


62 GENERALIZACIONES

entonces existe un r0 > 0 y una serie de potencias,


X
f (x) = cα x α (3.24)
|α|>0

tal que (3.24) es absolutamente convergente para |x| ≤ r0 y

F (x, f (x)) = 0. (3.25)

Demostración:

Tenemos que sin pérdida de generalidad podemos suponer que a0,1 = 1, luego
(3.22) se expresa como,
X ∞
XX
α
F (x, y) = y + (aα,0 + aα,1 y)x + aα,k xα y k . (3.26)
|α|>0 |α|≥0 k=2

Usando ahora la notación bα,k = −aα,k , podemos reescribir la ecuación F (x, y) = 0


como,
X ∞
XX
y= (bα,0 + bα,1 y)xα + bα,k xα y k , (3.27)
|α|>0 |α|≥0 k=2

y tomando también y = B(x, y), entonces,


X ∞
XX
α
B(x, y) = (bα,0 + bα,1 y)x + bα,k xα y k . (3.28)
|α|>0 |α|≥0 k=2

Sustituyendo ahora y = f (x) en (3.27) con la f (x) dada en (3.24), obtenemos,


X X X X
cα x α = bα,0 xα + bα,1 cβ xα+β
|α|>0 |α|>0 |α|>0 |β|>0


 k (3.29)
XX X
+ bα,k xα  cβ x β  .
|α|≥0 k=2 |β|>0

Si todas las series que aparecen en (3.29) fueran al final absolutamente conver-
gentes, entonces el orden de los sumatorios podría ser reordenado sin problemas.
Asumiendo por tanto que lo son, podemos igualar las potencias de x de la par-
te izquierda y derecha de la ecuación, obteniendo así las siguientes relaciones de
recurrencia. En primer lugar, tenemos

cej = bej ,0 , (3.30)


3.3. EL T.F.I PARA FUNCIONES ANALÍTICAS 63

que nos permite resolverla para cada cej . A continuación indicamos como para cada
coeficiente cα con un índice de orden mayor puede ser expresado en términos de
bγ,j y otros cβ de índice menor. De hecho, vamos a asumir de forma inductiva que
hemos resuelto para cα para todos los multiíndices α con |α| ≤ p. Fijando entonces
un multiíndice |α| = p e identificando las potencias de x, tenemos que,
X
cα+ej = bα+ej ,0 + bγ,1 cβ
|β|>0,|γ|>0,
β+γ=α+ej
X (3.31)
+ M (β 1 , . . . , β k ) · bγ,k · cβ 1 · cβ 2 · · · cβ k .
|γ|>0,k≥0,
|β i |>0,β 1 +···+β k +γ=α+ej

Tenemos que M (β 1 , . . . , β k ) es un posible coeficiente multinomial ( y los superíndices


son etiquetas no potencias), y cada M es positivo. Se puede comprobar que todos
los multiíndices del lado derecho son menores o iguales que p, justo como queríamos.

Las relaciones de recurrencia obtenidas por ahora, (3.30) y (3.31) únicamente


determinan los coeficientes cβ en la serie de potencias para la función implícita,
pero aún nos hace falta ver que (3.24) es convergente. La manera más sencilla para
obtener las estimaciones necesarias es usando el método de mayorantes, que describo
a continuación.

Sean dos series de potencias con el mismo número de variables,



X 1 2 ρ
φ(x1 , x2 , . . . , xρ ) = φj1 ,j2 ,...,jρ xj1 xj2 . . . xjρ , (3.32)
j1 ,j2 ,...,jρ =0

X 1 2 ρ
ψ(x1 , x2 , . . . , xρ ) = ψj1 ,j2 ,...,jρ xj1 xj2 . . . xjρ (3.33)
j1 ,j2 ,...,jρ =0

Diremos que ψ(x1 , x2 , . . . , xρ ) es un mayorante de φ(x1 , x2 , . . . , xρ ) si,

|φj1 ,j2 ,...,jρ | ≤ ψj1 ,j2 ,...,jρ (3.34)

para todo j1 , j2 , . . . , jρ .

Como todos los coeficientes de M (β 1 , . . . , β k ) en (3.31) son positivos, tenemos


que si
X
G(x, y) = gα,k xα y k ,
|α|≥0,k≥0
64 GENERALIZACIONES

(con g0,0 = g0,1 = 0) es un mayorante de


X X
B(x, y) = (bα,0 + bα,1 y)xα + bα,k xα y k
|α|>0 |α|≥0,k≥2

y si
X
h(x) = hα xα (3.35)
|α|

resuelve
h(x) = G[x, h(x)], (3.36)

entonces h(x) será un mayorante de f(x). Como consecuencia, si la serie (3.34) para
h(x) es convergente, entonces la serie de (3.24) es convergente y su radio de conver-
gencia es al menos tan grande como el radio de convergencia de (3.34). Tenemos

Kr
G(x, y) = ,
r − (x1 + · · · + xN ) − y
donde K = sup{|B(x, y)| : x ∈ D̄(o, R1 ), y ∈ D̄(0, r2 )} y r son lo suficientemente
pequeños (dependiendo de R1 y R2 ). Por el lema enunciando previamente, tenemos
que G es un mayorante de B. Con esta elección de mayorante (3.35) es cuadrática
y puede ser resuelta explícitamente. La solución además es holomorfa en x = 0. De
hecho, y = h(x) es la solución de dicha ecuación cuadrática

y 2 + (x1 + · · · + xN − r)y + Kr = 0. (3.37)

El teorema que acabamos de demostrar solo considera el caso de una variable


dependiente y un número arbitrario de independientes, mediante el método inductivo
de Dini se podría obtener una versión general.

Tenemos además, que el teorema de la función implícita para el análisis complejo


se saca de la versión de C 1 . Una vez que sabemos que la solución y = ψ(x) para un
sistema holomorfo,
F (x, y) = 0

es continuamente diferenciable, basta aplicar ∂/∂ z̄j a ambos lados y aplicar la regla
de la cadena para determinar que ψ es holomorfa.
Bibliografía

[1] Steven G. Krantz and Harold R. Parks, The Implicit Function Theorem. History,
theory and applications, Springer Science and Business Media, 2012.

[2] J.J. O’Connor and E.F. Robertson, The Function Concept, MacTutor His-
tory of Mathematics Archive, 2005. https://mathshistory.st-andrews.ac.
uk/HistTopics/Functions/.

[3] Iurato, Giuseppe (2012) On the role played by the work of Ulisse Dini on implicit
function theory in the modern differential geometry foundations: the case of the
structure of a differentiable manifold, 1. http://philsci-archive.pitt.edu/
9485/

[4] Mingari Scarpello, Giovanni and Ritelli, Daniele. (2002). A Historical Outline of
the Theorem of Implicit Functions. Divulgaciones Matemáticas. 10.

[5] Bruno Belhoste, Augustin-Louis Cauchy: A Biography, Springer-Verlag New


York, 1991.

[6] Frank Smithies, Cauchy and the Creation of Complex Function Theory, Univer-
sity of Cambridge, 1997.

[7] José Carlos Castaño Muñoz, Trabajo de Fin de Grado, El teorema de la función
implícita, Universidad de Sevilla, curso académico 2017-2018. https://idus.
us.es/handle/11441/77506

65

También podría gustarte