TEG Edwin Pin Baque

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 87

UNIVERSIDAD CENTRAL DE VENEZUELA

FACULTAD DE CIENCIAS
ESCUELA DE MATEMÁTICA

Fórmula de Inversión de Lagrange

Trabajo Especial de Grado presentado


ante la ilustre Universidad Central de
Venezuela por el Br. Edwin Pin Baque
para optar al tı́tulo de Licenciado en
Matemática.

Tutor: Manuel Maia.

Caracas, Venezuela
Diciembre 2011
ii

Nosotros, los abajo firmantes, designados por la Universidad Central de Venezuela como
integrantes del Jurado Examinador del Trabajo Especial de Grado titulado “Fórmula de
Inversión de Lagrange”, presentado por el Br. Edwin Pin Baque, titular de la Cédula
de Identidad 18.813.365, certificamos que este trabajo cumple con los requisitos exigidos
por nuestra Magna Casa de Estudios para optar al tı́tulo de Licenciado en Matemática.

Manuel Maia
Tutor

Cristina Balderrama
Jurado

Miguel Méndez
Jurado
iii

Dedicatoria

A Marı́a Baque y Homero Pin, mis padres,


por su apoyo en este largo proceso.

Y Alejandra Aguilera.
La mejor compañera que se pueda desear.
iv

Agradecimiento

Agradezco muy especialmente al profesor Manuel Maia.


Sin su ayuda y guı́a no podrı́a haber sido
posible este trabajo.
CONTENIDO

Introducción 1

Capı́tulo 1. Desarrollo original y antecedentes históricos. 3


1. El problema de Kepler. 3
2. Lagrange y su Teorema de Inversión. 7
3. Sobre el problema de Kepler. 11

Capı́tulo 2. Enfoque analı́tico. 13

Capı́tulo 3. Enfoque algebraico. 19


1. Demostración de FIG usando residuos. 25
2. Demostración de FIG usando operadores adjuntos. 27

Capı́tulo 4. Enfoque combinatorio. 32


1. Teorı́a de especies combinatorias. 32
2. Árboles R-enriquecidos. 49

Capı́tulo 5. Otras demostraciones y resultados. 57


1. Otra demostración analı́tica. 57
2. Algoritmo para FIL. 61
3. Arreglos de Riordan. 64

Capı́tulo 6. Aplicaciones 70

Bibliografı́a 82

v
Introducción

El estudio de funciones expresadas implı́citamente ha sido de mucho interés en la his-


toria de la matemática desde que Descartes formalizó su idea en 1637. Joseph Lagrange
demostró lo que probablemente sea el primer teorema de función implı́cita, aunque serı́a más
acertado decir teorema de función inversa. La Fórmula de Inversión de Lagrange apareció
por primera vez en Nouvelle méthode pour résoudre les équations littérales par le moyen des
séries publicado en 1770, con el propósito especı́fico de resolver el problema de Kepler.
Este trabajo se ha realizado con la finalidad de mostrar el largo alcance de la Fórmula de
Inversión de Lagrange. Haremos un recorrido en un principio histórico para luego adentrarnos
en varias de las distintas ramas de la matemática y examinar con moderado detalle cómo se
demuestra y se aplica dicho resultado.
Dependiendo del área de matemática en el que trabajemos variarán las hipótesis del
Teorema de Inversión de Lagrange, pero a modo genérico, podemos introducir la Fórmula
de Inversión como la solución de la ecuación

α − x + ϕ(x) = 0 (P1)

siendo x el valor a determinar y ϕ una función de x. Al caso particular α = 0 lo llamare-


mos (P2). Este tipo de ecuaciones aparecen de manera natural tanto en problemas fı́sicos
como en problemas matemáticos, de ahı́ el propósito de esta monografı́a. Si bien existen
varias generalizaciones de la fórmula de inversión, aquı́ sólo nos centraremos en la forma
básica estudiada por Lagrange, la cual resultará suficiente para abarcar una gran cantidad
de problemas.
En el Capı́tulo 1, hablaremos sobre Johannes Kepler y sus famosas leyes de movimiento
planetario, del interés de Lagrange por resolver el problema de Kepler y el primer resultado
obtenido a partir de su fórmula de inversión.

1
INTRODUCCIÓN 2

En el Capı́tulo 2, recordando varios tópicos de Funciones Analı́ticas, dotaremos a la


función ϕ de condiciones necesarias para resolver la ecuación (P1), y ası́ formalizar el estudio
realizado por Lagrange.
En el Capı́tulo 3 nos alejaremos de los aspectos históricos de este trabajo y estudiaremos
la ecuación (P2) mediante teorı́a de series formales, y finalmente daremos dos demostraciones
algebraicas de la fórmula de inversión.
En el Capı́tulo 4 usaremos nuevamente las series formales, pero aplicadas esta vez desde
un punto de vista combinatorio. Siguiendo el trabajo realizado por Joyal, usando teorı́a
de especies daremos la demostración de la fórmula de inversión para series generatrices
exponenciales que Labelle publicó en [10].
Demostraciones y otros aspectos de menor envergadura, pero no menos interesantes, los
dejaremos para el Capı́tulo 5 y, finalmente, mostraremos las aplicaciones en el Capı́tulo 6.
CAPÍTULO 1

Desarrollo original y antecedentes históricos.

El impacto de Lagrange en las ciencias, especialmente en fı́sica matemática, aún sigue


vigente. Uno de los resultados más trascendentales fue su Teorema de Inversión, creado
particularmente para resolver la ecuación de Kepler, y que más tarde se usarı́a en distintas
ramas de la matemática. Como veremos más adelante en este capı́tulo, la expresión de la
Fórmula de Inversión viene dada como una serie de potencia, lo cual resultó sumamente
satisfactorio debido al inmenso interés que existı́a en el siglo XVIII por la teorı́a de series,
y hasta en tiempos actuales, resulta mucho más cómodo y conveniente trabajar con estas
expresiones debido a su funcionalidad.
En este capı́tulo hablaremos de la teorı́a de Kepler sobre el movimiento de los planetas, la
ecuación de Kepler, soluciones aproximadas de la ecuación de Kepler y el interés de Lagrange
en la mecánica celeste. Luego mostraremos los resultados concernientes que Lagrange publicó
en [11] y finalmente la solución de la ecuación de Kepler.

1. El problema de Kepler.

Después de muchos años de trabajo Johannes Kepler anunció sus famosas leyes de
movimiento planetario a comienzos del siglo XVII. Estas leyes establecen:
(1) Los planetas viajan sobre una órbita elı́ptica con el sol sobre uno de sus focos.
(2) Se mueven con una velocidad tal que las lı́neas que unen los planetas con el sol
barren igual área en igual unidades de tiempo.
(3) El cuadrado del perı́odo de la órbita de cada planeta es proporcional al cubo del
ancho de la elipse que recorre.
Kepler dio a conocer las primeras dos leyes en Astronomia Nova publicado en 1609, y la
tercera ley en Harmonice Mundi publicado en 1619. Estas leyes se basaron en observaciones
detalladas de la órbita de Marte y para los seis planetas que se conocı́an en ese entonces los
resultados fueron bastante exactos. A continuación, mostraremos la deducción para obtener
el Problema de Kepler.

3
1. EL PROBLEMA DE KEPLER. 4

Supongamos que un planeta P se mueve contrarreloj en una órbita elı́ptica alrededor


del sol con excentricidad , 0 <  < 1, semieje mayor a, y perı́odo T . Teniendo en cuenta
la Figura 1.1, la idea es hallar la posición del planeta P bajo las coordenadas polares (r,v)
relativas al sol S en un tiempo t.

Q
P
r
E v
A
C S R

Figura 1.1. Problema de Kepler.

En astronomı́a, una anomalı́a es una cantidad angular usada para describir la posición en
la órbita de un cuerpo celeste. El problema de Kepler cuenta con tres anomalı́as a considerar.
Si queremos calcular las coordenadas (r,v) en el tiempo t, esas tres anomalı́as son: la cantidad
v = ∠P SA llamada anomalı́a real, la cantidad E = ∠QCA llamada anomalı́a excéntrica, y
por último, la anomalı́a media M que viene dada por la ecuación
2πt
M= ,
T
la cual representa el ángulo que recorre un planeta ficticio que se mueve uniformemente en
la órbita circular.
Una relación entre r y v en el tiempo t viene dada por
a(1 − 2 )
r= . (1.1)
1 +  cos v

Con b = a 1 − 2 , se sabe que
b PR Area P RA
= = , (1.2)
a QR Area QRA
ası́ que
r sen v = b sen E, (1.3)
1. EL PROBLEMA DE KEPLER. 5

r cos v = CR − CS = a cos E − a (1.4)

y
r = a(1 −  cos E). (1.5)

Ahora,
v sen v r sen v
tan = =
2 1 + cos v r + r cos v
b sen E
=
a(1 −  cos E) + a cos E − a
b sen E
=
a(1 − )(1 + cos E)

1 − 2 sen E
= .
(1 − )(1 + cos E)
y ası́ r
v 1+ E
tan = tan . (1.6)
2 1− 2
Es decir, las coordenadas (r,v) pueden ser determinadas por E. Luego, la segunda ley
de Kepler implica que
 
t
Area P SA = (Área encerrada por la órbita)
T

tπa2 1 − 2
=
T
1 √
= M a2 1 − 2 .
2
También

Area P SA = Area P SR + Area P RA


1 b
= a(cos E − )(r sen v) + Area QRA
2 a
 
1 b 1 2 1 2
= ab(cos E − ) sen E + a E − a sen E cos E
2 a 2 2
1 √
= a2 1 − 2 (E −  sen E),
2
de donde obtenemos la Ecuación de Kepler

M = E −  sen E. (EK)
1. EL PROBLEMA DE KEPLER. 6

Resumiendo, si conocemos t y M y podemos hallar una solución E de (EK), entonces las


ecuaciones (1.5) y (1.6) determinarán la posición (r,v) del planeta P en el tiempo t. Note
además que esta ecuación es comparable con (P1), siendo E la variable a determinar y la
función ϕ(x) =  sen(x).
Desde el momento de su publicación, el interés general por resolver el problema (EK) fue
tan desmesurado que podemos encontrar una gran bibliografı́a dedicada solamente a buscar
su solución. Para ilustrar la importancia de la Fórmula de Inversión de Lagrange, daremos
tres ejemplos (cronológicamente previos al resultado de Lagrange) de aproximaciones al
problema (EK).

Ejemplo 1.1 (Solución de Kepler). La solución planteada por el propio Kepler fue de
esta manera: dado  y M , aproximamos una solución E0 de E y calculamos

M0 = E0 +  sen E0 .

Sea E1 = E0 + (M − M0 ) y calculamos

M1 = E1 +  sen E1 .

Luego, calculamos E2 = E1 + (M − M1 ), la cual Kepler determinó que es una mejor apro-


ximación de E. Para los planetas que se conocı́an estas cuentas producı́an valores aceptables
de E en dos pasos, aunque podı́a ser problemático para Mercurio, cuya excentricidad es
mayor que 0.2.

Ejemplo 1.2 (Aproximación por series de Taylor). Fijando M , una manera bastante
sencilla de obtener una aproximación de E es considerando la serie de arcseno y E − M =
arcsen(sen(E − M )) para escribir
1 3
 sen E = E − M = sen(E − M ) + sen3 (E − M ) + sen5 (E − M ) + . . .
6 40
Luego,

 sen E ≈ sen(E − M );

es decir, una aproximación al problema (EK) es hallar un valor de E tal que


sen(E − M )
≈ .
sen E
2. LAGRANGE Y SU TEOREMA DE INVERSIÓN. 7

Ejemplo 1.3 (Solución de Horrocks). En 1638 Jeremiah Horrocks usó un método dife-
rente para resolver (EK). La proveniencia de la solución es más interesante debido a los
argumentos geométricos que se utilizan.

M EH
B C S A

Figura 1.2. Dibujo de Horrocks

Alrededor del foco vacı́o B se describe un cı́rculo de radio AC. Sobre este cı́rculo se
marca un punto Q, tal que la anomalı́a media satisfaga M = ∠QBS. La aproximación de
Horrocks, EH , de E es el ángulo ∠QCS. Horrocks dedujo que
   
M 1+ M
tan EH − = tan (1.7)
2 1− 2
y demostró a partir de esta ecuación que
1
EH − E ≈ 3 sen3 M.
6
La deducción de todos los resultados de Horrocks puede hallarlos en [5].


Estos tres ejemplos no son más que una pequeña muestra de lo realizado antes de la
intervención de Lagrange, sin embargo, una caracterı́stica común de la mayorı́a de los resul-
tados de (EK) publicados entre los siglos XVII y XVIII es que tendı́an a fallar para distintos
valores de la excentricidad . Particularmente, los ejemplos mostrados fallan en presición
para valores altos de . Por esta razón, la solución planteada por Lagrange a partir de su
Fórmula de Inversión representa el primer resultado destacable de (EK).

2. Lagrange y su Teorema de Inversión.

A pesar de ser considerado uno de los más grandes matemáticos de la historia, Lagrange
alcanzó la fama con sus tratados en mecánica celeste y es bien sabido que sus investigaciones
2. LAGRANGE Y SU TEOREMA DE INVERSIÓN. 8

matemáticas siempre tenı́an un trasfondo fı́sico. A corta edad se sintió tentado a seguir la
carrera de matemática después de haber leı́do un artı́culo de Edmund Halley sobre el uso
del álgebra en óptica. Con tan solo 19 años, recibió ovaciones de Euler por los resultados
obtenidos en su investigación de curvas tautócronas. Ayudó a fundar la Real Academia
de Ciencias de Turı́n, cuyo objetivo principal era crear la revista Mélanges de Turin, donde
fueron publicados en los tres primeros volúmenes las investigaciones de Lagrange, que incluı́a
temas relacionados con cálculo de variaciones, probabilidades, energı́a cinética y propagación
de sonido. Probablemente las más grandes contribuciones de Lagrange son las relacionadas
con mecánica del universo, siendo Mécanique Analytique de 1788 su trabajo más famoso
y controversial por contener ecuaciones generales que solucionaban todos los problemas de
mecánica y además por no contar con ningún tipo de diagrama geométrico, que eran de su
completo desagrado. Como ya hemos dicho, fue en 1770 cuando Lagrange dio finalmente la
solución exacta de (EK), el cual habı́a llamado su atención por ser éste un problema clásico
de mecánica celeste. Como matemático, Lagrange estudió en un principio la ecuación (P1),
que generaliza en todos los aspectos a (EK). A continuación, plantearemos lo que será la
“primera versión” del Teorema de Inversión de Lagrange de este trabajo y mostraremos el
cálculo realizado por Lagrange, cuya deducción se encuentra desplegada entre las secciones
8 y 10 de [11].

Teorema 1.4 (Inversión de Lagrange). Consideremos la ecuación

α − x + ϕ(x) = 0, (P1)

donde ϕ es una función cualquiera de x. Si p es una raı́z de esta ecuación, entonces



1 dn−1
X  
n
p=x+ ϕ(x) , (FIL)
n=1
n! dxn−1
cambiando x por α después de diferenciar.

En adelante, nos referiremos a la Fórmula de Inversión de Lagrange simplemente como


(FIL). Ahora mostraremos el desarrollo realizado por Lagrange que a pesar de no ser una
prueba propiamente dicha y de resultar poco rigurosa en muchos de sus planteamientos
y en su conclusión, igualmente la delimitaremos en un esquema de demostración. En el
siguiente desarrollo, veremos que en la deducción de Lagrange no se trabaja con una función
ϕ cualquiera, sino con polinomios de la forma p(x) = a0 − a1 x + a2 x2 − . . . + (−1)n xn . La
2. LAGRANGE Y SU TEOREMA DE INVERSIÓN. 9

idea es demostrar que una raı́z p1 del polinomio p(x) es de la forma (FIL). En los capı́tulos
siguientes, sustituiremos la palabra “cualquiera” del Teorema 1.4 por hipótesis más fuertes.

Demostración. Consideremos la ecuación,

a0 − a1 x + a2 x2 − . . . + (−1)n xn = 0,

donde a0 , a1 , . . . , an−1 son coeficientes cualesquiera. Si p1 , p2 , . . . , pn son las raı́ces, entonces


   
2 n n x x
a0 − a1 x + a2 x − . . . + (−1) x = a0 1 − ··· 1 − .
p1 pn
Dividiendo entre −a1 x a ambos lados de la expresión obtendremos
    
a0 a0 x x x
1− −ξ =− 1− 1− ··· 1 −
a1 x a1 x p1 p2 pn
   
a0  p1  x x
= 1− 1− ··· 1 − ,
a1 p 1 x p2 pn
a2 x − . . . + (−1)n xn−1
siendo ξ = . Aplicando logaritmo natural,
a1
    n  
a0 a0  p1  X x
log 1 − − ξ = log + log 1 − + log 1 − .
a1 x a1 p 1 x k=2
pk

Teniendo en cuenta que


  !
a0 a0 ξ
1− −ξ = 1− 1− ,
a1 x a1 x 1 − aa10x

en términos de serie de Taylor, la expresión anterior nos queda


∞  k X ∞
!k   X ∞ n ∞  r !
X 1 a0 1 ξ a1 p 1 1  p1  k X X 1 x
+ a0 = log + + .
k=1
k a 1x
k=1
k 1 − a1 x
a 0
k=1
k x k=2 r=1
r p k

Note que el coeficiente de x−1 de la parte derecha es p1 . Por lo que nos limitaremos a
calcular el coeficiente de x−1 de la parte izquierda. Cada potencia ξ k vamos a identificarla
de manera general por los polinomios

X
k
ξ = $k,i xi
i=0

y recordemos que
!k ∞   j
1 X j+k−1 a0
= .
1 − aa10x j=0
j a1 x
De esta manera,
2. LAGRANGE Y SU TEOREMA DE INVERSIÓN. 10

!k !k
1 ξ 1 1
= ξk
k 1 − aa10x k 1 − aa10x

!
∞   j !
1 X X j + k − 1 a 0
= $k,i xi
k i=0 j=0
j a 1x

∞ ∞    j
1 XX j + k − 1 a0
= $k,i xi−j . (1.8)
k i=0 j=0 j a1

Ası́, cuando j = i + 1 obtendremos todos los términos correspondientes de x−1 . Es decir,


de la ecuación que obtuvimos al expandir por series de Taylor se tiene:
∞ ∞    i+1
a0 X 1 X i + k a0
p1 = + $k,i
a1 k=1 k i=0 i + 1 a1
∞  i+1 X ∞ ∞    i+1
a0 X a0 1 X i+k a0
= + $1,i + $k,i
a1 i=0 a1 k=2
k i=0 i + 1 a1
∞  i+1 X ∞ ∞  i+1
a0 X a0 1 X (i + k)! a0
= + $1,i + $k,i .
a1 i=0 a1 k=2
k! i=0 (i + 1)! a1

Notemos que para k ≥ 2,

dk−1 k dk−1 k k
(xξ) = k−1 x ξ
dxk−1 dx

dk−1 X
= k−1 $k,i xi+k
dx i=0

X (i + k)!
= $k,i xi+1 .
i=0
(i + 1)!

Llamando ϕ(x) = xξ obtendremos que



X 1 dk−1
p1 = x + ϕ(x) + k−1
(ϕ(x))k ,
k=2
k! dx
a0
cuando sustituimos a1
por x.

Luego de este análisis, Lagrange compara la ecuación (P1) con


a0
− x + xξ = 0,
a1
3. SOBRE EL PROBLEMA DE KEPLER. 11

a0
llamando α = a1
y ϕ(x) = xξ. Si realizamos el cambio ϕ(x) = tφ(x) obtendremos que la
raı́z p de (P1) es una serie de potencias de t, cuando x = α:

tn dn−1
X  
n
p=x+ n−1
φ(x) .
n=1
n! dx

Notemos además que en el Teorema 1.4 no se establecen criterios de convergencia, sin


embargo, la expansión de p sugiere que el teorema funciona bajo ciertas condiciones que La-
grange anexó en trabajos posteriores. En el Capı́tulo 2 hablaremos de los aspectos analı́ticos
de (FIL).
Lagrange dio además una expresión para las potencias de la raı́z p. Para ello sólo debió
considerar en la ecuación (1.8) los valores j = i + n, con n ≥ 1, y ası́ obtuvo que

n n
X n dk−1 n−1
p =x + k−1
(x ϕ(x))k , (1.9)
k=1
k! dx

al sustituir x = α después de diferenciar. A partir de esto, Lagrange propuso un teorema


más general:

Teorema 1.5 (Inversión de Lagrange Generalizado). Si p es una raı́z de

α − x + tφ(x) = 0 (P1)

y ψ es una función definida en p entonces



X tn dn−1 0
ψ(p) = ψ(x) + n−1
(ψ (x)φ(x)n ), (FIG)
n=1
n! dx

cambiando x por α después de diferenciar.

Lagrange consideró la prueba de este teorema bastante sencilla debido a la ecuación (1.9).
En el Capı́tulo 2 haremos una demostración formal del Teorema 1.5.

3. Sobre el problema de Kepler.

Lagrange publicó la solución de (EK) en [12], trabajo dedicado exclusivamente al pro-


blema de Kepler. Comparando (EK) con (P1), obtenemos el caso particular en el que α = M
y ϕ(x) =  sen(x). Aplicando (FIL),

X
E=M+ an (M )n , (1.10)
n=1
3. SOBRE EL PROBLEMA DE KEPLER. 12

donde,
1 dn−1
 
n
an (M ) = sen (x) .
n! dxn−1 x=M
En lo que sigue, la notación de la derecha de esta última igualdad se usará para resumir
que sustituimos x = M después de diferenciar. La solución (1.10) pronto lograrı́a establecer
una modalidad estándar para hallar la solución de (EK) como serie. Muchos se interesaron
en hallar fórmulas explı́citas para los coeficientes an (M ), el mismo Lagrange trabajarı́a pos-
teriormente para intentar escribir su solución como una serie de Fourier de senos. Por otro
lado, Laplace en su Mécanique céleste de 1799 hizo cálculos para hallar el radio de conver-
gencia de la serie (1.10). Los estudios realizados por Laplace dieron pie al aparecimiento
de la teorı́a de cálculo infinitesimal como lo planteó Cauchy, de la cual extraeremos ciertas
definiciones y resultados para formalizar la demostración del Teorema 1.5.
CAPÍTULO 2

Enfoque analı́tico.

Teniendo en cuenta que en el capı́tulo anterior nada se dijo sobre la convergencia de


(FIL), cualquiera podrı́a preguntarse si la solución del problema de Kepler converge para
valores M y  determinados. Fue Laplace quien en un principio se interesó en esta cuestión,
y estableció ciertas relaciones para garantizar que la solución (1.10) en efecto converge. Sus
argumentos fueron publicados en Mécanique céleste, y dedujo que la solución (1.10) converge,
siempre que
p
2 w(1 − w)
<k= ,
1 − 2w
donde w es la solución de la ecuación:
 
1−w 2
= exp .
w 1 − 2w
Laplace determinó que w ≈ 0.08307 y k ≈ 0.66195. Poco conforme con estos resultados,
Cauchy determinó que el valor de k debı́a ser aproximadamente 0.6627434 . . .. Podrá leer un
análisis completo de este hecho en [5]. Otra observación que el lector puede haber notado, es
que Lagrange afirma que la solución de la ecuación (P1) viene dada por (FIL) si esta existe,
¿pero será posible dar condiciones para que esta solución exista? Más aún, ¿será posible que
esa solución sea única? Cauchy escribirı́a en [3]:

“Atraı́do por un resultado tan digno de mención, me pregunté si no


serı́a posible describir en términos generales las condiciones de con-
vergencia de la expansión de Lagrange... Mis estudios me llevaron
a reconocer que las condiciones siempre pueden ser deducidas para
la solución de una ecuación trascendental”.

Siguiendo el estudio realizado por Cauchy, en adelante trabajaremos con funciones sobre
el cuerpo C, lo cual para (EK) esto no significará ningún problema, puesto que en ciertos casos
será posible pasar los resultados obtenidos a R. Nos limitaremos simplemente a demostrar
el Teorema 1.5, puesto que nada nuevo surge de examinar cada teorema por separado.

13
2. ENFOQUE ANALÍTICO. 14

También será necesario recordar definiciones y resultados de Variable Compleja antes de


poder establecer las hipótesis deseadas.
La definición fundamental de análisis complejo corresponde a la analiticidad de una
función de C en C. Asumiendo que el lector ya está familiarizado con todos los aspectos
topológicos con los que se puede dotar a un espacio con producto interno como C, tenemos
que una función compleja es analı́tica (u holomorfa) en un punto z0 si es diferenciable en
todo punto de un entorno de z0 . Decimos que una función f es analı́tica sobre un conjunto
abierto U ⊆ C si es analı́tica en cada punto de U . En análisis complejo, es suficiente pedir
la analiticidad de una función para poder obtener su serie de Taylor, lo cual constituye una
ventaja por encima del análisis real donde se requiere una mayor cantidad de condiciones. De
esta manera, observando cómo se presenta el Teorema 1.5, parece natural exigir simplemente
la analiticidad de las funciones φ y ψ, viendo a ambas como funciones complejas.
Una propiedad importante de funciones holomorfas, y que se presentará de manera
implı́cita en la demostración del Teorema 1.5, es:

Teorema 2.1 (Cauchy-Goursat). Si f es una función holomorfa dentro y sobre un con-


torno cerrado simple C, entonces
I
f (z)dz = 0.
C

La demostración planteada por Cauchy depende fuertemente de uno de sus resultados


más importantes de análisis complejo:

Teorema 2.2 (Formula Integral de Cauchy). Supongamos que una función f es holo-
morfa sobre un conjunto abierto U ⊆ C. Sean α ∈ U y r > 0 tales que D(α, r) ⊆ U .
Entonces,
I
1 f (ξ)
f (z) = dξ (2.1)
2πi ∂D(α,r) ξ−z
para cada z ∈ D(α, r).

La demostración de este teorema no nos resulta indispensable, sino más bien lo que el
teorema en sı́ implica, aunque si desea leer una demostración puede hallarla en [6]. A partir
de la fórmula integral se puede demostrar que una función holomorfa posee derivada de
cualquier orden y además, si tenemos una función f bajo las hipótesis del Teorema 2.2, para
2. ENFOQUE ANALÍTICO. 15

n≥1
dn−1 (n − 1)!
I
[n−1] f (ξ)
f (z) = n−1 f (z) = dξ.
dz 2πi ∂D(α,r) (ξ − z)n
Para solucionar las inquietudes que surgieron al comienzo de este capı́tulo sobre la exis-
tencia y unicidad de la solución de (P1), recordaremos uno de los resultados más importantes
dados en un curso básico de Variable Compleja:

Teorema 2.3 (Rouché). Sean f, g : U → C funciones holomorfas sobre un conjunto


abierto U ⊆ C. Si D(α, r) ⊆ U y para cada z ∈ ∂D(α, r) se satisface,

|f (z) − g(z)| < |f (z)| + |g(z)|, (2.2)

entonces el número de ceros de f en D(α, r) es igual al número de ceros de g en D(α, r),


contando multiplicidad.

Ahora sı́ estamos en condiciones de enunciar y demostrar formalmente el Teorema 1.5.


Seguiremos el desarrollo planteado por Whittaker en [18]:

Teorema 2.4 (Versión analı́tica de FIG). Sean φ y ψ funciones holomorfas sobre el


disco D(α, r) ⊂ C y continuas sobre D(α, r). Si la magnitud de t es tal que

|tφ(z)| < |z − α| (2.3)

para todo z ∈ ∂D(α, r), entonces

z − α − tφ(z) = 0 (P1)

tiene exactamente una raı́z p ∈ D(α, r) y si consideramos a esa raı́z p como dependiente de
t entonces

tn dn−1 0
X  
n
ψ(p) = ψ(α) + (ψ (z)φ(z) ) . (FIG)
n=1
n! dz n−1 z=α

Demostración. Llamemos f (z) = z − α y g(z) = z − α − tφ(z), entonces la condición


(2.3) y el resultado de Rouché nos dicen que el Teorema 2.4 está bien planteado, es decir,
la ecuación (P1) tiene solución y además es única, puesto que f (z) sólo posee una raı́z en
D(α, r). Ahora, si φ(p) = 0 para algún p ∈ D(α, r) obtenemos la solución trivial p = α. Por
lo que trabajaremos con el caso φ(z) 6= 0 en D(α, r).
2. ENFOQUE ANALÍTICO. 16

Fijemos t para el cual el problema (P1) tenga solución, es decir, que satisfaga la condición
(2.3), y asumamos la solución p = p(t). Definamos
z−α
θ(z) = . (2.4)
φ(z)
Tenemos que θ(p) = t.
Notemos que θ(z) es holomorfa en D(α, r) y que θ(z) − θ(p) tiene exactamente un cero
en z = p. Podemos escribir
θ(z) = θ(p) + (z − p)R(z), (2.5)

donde R(z) es una función que no se anula en D(α, r). Usando el Teorema 2.2 y el hecho de
que R(p) = θ0 (p), calculamos
ψ(z)θ0 (z) ψ(z)θ0 (z)
I I
1 1
dz = dz
2πi ∂D(α,r) θ(z) − θ(p) 2πi ∂D(α,r) (z − p)R(z)
ψ(p)θ0 (p)
=
R(p)
= ψ(p).

La condición (2.3) es equivalente a |θ(p)| < |θ(z)|, y ası́



θ0 (z) X θ0 (z)θn (p)
= . (2.6)
θ(z) − θ(p) n=0 θn+1 (z)

De esta manera obtenemos,


ψ(z)θ0 (z)
I
1
ψ(p) = dz
2πi ∂D(α,r) θ(z) − θ(p)

ψ(z)θ0 (z)θn (p)
I
X 1
= n+1 (z)
dz
n=0
2πi ∂D(α,r) θ

ψ(z)θ0 (z)
I
X
n 1
= θ (p) dz
n=0
2πi ∂D(α,r) θn+1 (z)

ψ(z)θ0 (z)
I
n 1
X
= t dz
n=0
2πi ∂D(α,r) θn+1 (z)

ψ(z)θ0 (z)
I
n 1
X
= ψ(α) + t dz.
n=1
2πi ∂D(α,r) θn+1 (z)

La integración por partes nos da para n ≥ 1


ψ(z)θ0 (z) ψ 0 (z)
I I
1
n+1 (z)
dz = dz
∂D(α,r) θ n ∂D(α,r) θn (z)
2. ENFOQUE ANALÍTICO. 17

y ası́,

ψ 0 (z)
I
X 1 n
ψ(p) = ψ(α) + t dz.
n=1
2nπi ∂D(α,r) θn (z)
Sustituyendo (2.4) en la ecuación anterior

ψ 0 (z)φn (z)
I
X1 n
ψ(p) = ψ(α) + t dz
n=1
2nπi ∂D(α,r) (z − α)n

tn dn−1 0
X  
n
= ψ(α) + (ψ (z)φ (z)) .
n=1
n! dz n−1 z=α

Al comienzo de este capı́tulo dijimos que el Teorema 2.4 sirve para resolver problemas de
variable real de la forma (P1). Supongamos que tenemos una función real f (x) que admite
serie de Taylor centrada en un valor α ∈ R y con radio de convergencia 0 < r < ∞, es decir,

X
f (x) = an (x − α)n ,
n=0

donde an son los coeficientes que obtenemos por el Teorema de Taylor y x ∈ (α − r, α + r).
Recordando las propiedades de las series de Taylor, tenemos que

X
|an ||x − α|n < ∞,
n=0

para todo x ∈ (α − r, α + r), puesto que las series de Taylor satisfacen la convergencia
absoluta en sus intervalos de convergencia.
Supongamos además que para los valores fronteras x = α − r y x = α + r se cumple

X ∞
X
n
t |an ||x − α| = t |an |rn < |x − α| = r, (2.7)
n=0 n=0

para alguna magnitud t ∈ R+ . Esta última desigualdad implica que la serie de Taylor de
f (x) converge para los valores frontera, por lo que el entorno de convergencia en realidad es
el intervalo cerrado [α − r, α + r]. Estamos en condiciones de resolver el problema (P1) para
la función f (x).
Definamos sobre el entorno complejo D(α, r) la siguiente función:

X
φ(z) = an (z − α)n .
n=0
2. ENFOQUE ANALÍTICO. 18

Esta función está bien definida, ya que para todo z ∈ D(α, r) existe x ∈ [α − r, α + r] tal
que |z − α| = |x − α| y aprovechando el hecho de que f (x) converge absolutamente, entonces
φ(z) converge para todo valor de z en su dominio. Por la manera como está definida φ(z)
tenemos que es analı́tica en D(α, r), continua en D(α, r) y la desigualdad (2.7) garantizará
que se satisface la condición (2.3) del Teorema 2.4. De esta manera, obtenemos que el
problema
z − α − tφ(z) = 0,

tiene exactamente una solución p ∈ D(α, r) de la forma



tn dn−1
X  
n
p=α+ n−1
(φ(z) ) .
n=1
n! dz z=α

Dado que todos los términos de esta serie son números reales, entonces esta solución p
debe estar contenida en el intervalo abierto (α − r, α + r), quedando resuelto ası́ el problema
en variable real.
CAPÍTULO 3

Enfoque algebraico.

En este capı́tulo, debido al interés de querer establecer una estructura de grupo sobre el
conjunto de series de potencias invertibles con coeficientes en C (aunque podrı́amos trabajar
con cualquier cuerpo de caracterı́stica 0), estudiaremos exclusivamente el problema (P2) a
través de distintos operadores.
Daremos dos demostraciones de (FIG), una corta que surge como consecuencia directa
de varios resultados, y otra larga, pero no menos atractiva. Comenzaremos con ciertas
definiciones necesarias para ambas pruebas.
Trabajaremos sobre dos espacios; el de series de potencias formales y el de series de
Laurent formales. Este último contendrá al de series formales, y será indispensable para
poder hallar los coeficientes de la serie (FIG) en ambas demostraciones. Respectivamente,
denotaremos cada espacio por C[z] y C(z) (independientemente de la notación usual usada
para anillos de polinomios), siendo z el término “indefinido”. Los elementos de C[z] son de
la forma

X
f (z) = ai z i ,
i=0

donde ai ∈ C ∀i ∈ N = {0, 1, 2, 3, . . .}. Evidentemente, este conjunto es un C-espacio vecto-


rial con la suma término a término y la multiplicación por un escalar usual. Denotaremos la
operación suma de dos series f (z) y g(z) como (f + g)(z), y la multiplicación por un escalar
α ∈ C por αf (z). Más aún, podemos definir C[z] como un álgebra, siendo el producto de
vectores el llamado producto de Cauchy: si

X ∞
X
i
f (z) = ai z y g(z) = bj z j
i=0 j=0

son elementos de C[z], entonces su producto es



!
X X
(f · g)(z) = f (z)g(z) = ai b j zk . (3.1)
k=0 i+j=k

19
3. ENFOQUE ALGEBRAICO. 20

Para cada n ∈ N, denotaremos como f n (z) al producto de una serie f (z) consigo mismo n
veces. Otra caracterı́stica de C[z] es que posee unidad, siendo ésta h(z) = 1. Cuando existe
unidad multiplicativa es normal preguntarse qué elementos poseen inversa multiplicativa (ó
recı́proco). Sea f (z) como antes, queremos hallar g(z) tal que (f · g)(z) = 1. Del producto
(3.1) obtenemos que a0 b0 = 1, es decir, tanto f (z) como g(z) deben poseer término inde-
pendiente distinto de 0. Además, para k > 0 obtenemos la siguiente fórmula de recurrencia
para los términos bk :
1 X
bk = − ai bk−i ,
a0 0<i≤k

por lo que podemos concluir que g(z) es único, ya que sus coeficientes vienen determinados
de manera única por la ecuación anterior. Denotaremos al recı́proco de una serie f (z) por
f −1 (z).
Debido a lo molesto que es trabajar con la notación de serie, será usual a partir de
este punto verificar la fórmula (FIG) coeficiente a coeficiente. Esta manera de trabajar se
formaliza a partir de la siguiente familia de funcionales definidos en C[z]:

Definición 3.1. Para cualquier f ∈ C[z] y n ∈ N, definimos

[z n ]f (z) = an (coeficiente n-ésimo de f )

y llamamos a [z n ] funcional de coeficiente.

Es fácil verificar la linealidad de estos funcionales, más nos interesa lo simple que resulta
trabajar con esta notación. Note que el coeficiente n-ésimo de la serie (FIG) en términos de
los funcionales de coeficiente viene dado por
1 n−1 0
[z ]ψ (z)φn (z),
n
cuando α = 0, lo que hace mucho más atractiva la solución de Lagrange. Para las series de
C[z], será sumamente relavante la siguiente definición:

Definición 3.2. Para una serie de potencia f ∈ C[z] definimos

ord f = min{m ∈ N : [z m ]f (z) 6= 0}

como el orden de f . Por convención, ord 0 = ∞.


3. ENFOQUE ALGEBRAICO. 21

El orden satisface la propiedad ord f · g = ord f + ord g. Además, es el orden de una serie
de potencia f lo que determina si tiene o no recı́proco.

Proposición 3.3 (Condición de recı́proco). Una serie de potencia f ∈ C[z] tiene


recı́proco si y sólo si ord f = 0; en este caso el recı́proco es único.

La demostración de esta proposición ya se realizó.


Ya sabemos qué elementos de C[z] tienen recı́proco, pero para futuros propósitos nos
gustarı́a extender esto a cada elemento de ese espacio. Sea f (z) ∈ C[z] con ord f = m. Note
que podemos escribir f (z) = z m e(z), con e(z) ∈ C[z] y ord e = 0. Para estos elementos
definamos f −1 (z) = z −m e−1 (z). Si m > 0, f −1 (z) no se encuentra en C[z] por poseer
potencias negativas, pero esta serie es completamente compatible con el producto de Cauchy
(3.1) considerando a k ∈ Z, por lo que procederemos a expandir el espacio a este tipo de
series. Note también que las nuevas series son compatibles con la definición de orden, de la
cual podemos obtener que ord f −1 = − ord f . Este nuevo C-espacio vectorial lo llamaremos
espacio de Laurent, y lo denotamos por C(z). Además, la multiplicación de una serie de
Laurent f (z) con el recı́proco de otra serie g(z) lo llamaremos cociente, y lo denotaremos
por (f /g)(z).

Definición 3.4. En C(z) definimos el residuo como el funcional de coeficiente

Res = [z −1 ].

an z n ∈ C(z), definimos el operador D : C(z) → C(z)


P
Definición 3.5. Sea f (z) = n∈Z

como
d X
Df (z) = f (z) = nan z n−1 ,
dz n∈Z
y lo llamamos operador diferencial.

También usaremos la notación f 0 (z) para referirnos a Df (z). De ambas definiciones


podemos extraer la siguiente proposición:

Proposición 3.6. Para cualquier f (z) ∈ C(z), Res Df (z) = Res f 0 (z) = 0.

La demostración es imediata de la definición del operador D.


Ahora presentaremos la composición de series y, al igual que en la definición de recı́proco,
daremos una condición de orden para los elementos de C[z] invertibles. Sean f (z), g(z) ∈
3. ENFOQUE ALGEBRAICO. 22

C[z], para definir (f ◦ g)(z) = f (g(z)), daremos la condición adicional de ord g ≥ 1, para no
caer en ambigüedades topológicas. De esta manera, si


X ∞
X
f (z) = an z n y g(z) = bm z m ,
n=0 m=1

entonces,
!n  

X ∞
X ∞
X k
X X
f (g(z)) = an bm z m = a0 +  ap bn1 . . . bnp  z k .
n=0 m=1 k=1 p=1 n1 +...+np =k

En términos de funcionales, la composición de las series f (z) y g(z) es aquella con los
siguientes coeficientes:

[z 0 ](f ◦ g)(z) = a0 (3.2)


n
X X
n
[z ](f ◦ g)(z) = ap bn1 . . . bnp , ∀n > 0. (3.3)
p=1 n1 +...+np =n

La propiedad de orden respecto a la composición es ord(f ◦ g) = ord f · ord g. Tenemos


además que C[z] con esta operación posee elemento neutro, el cual es h(z) = z. Introducida
ya la composición como una operación entre series daremos las propiedades interesantes del
operador diferencial:

Proposición 3.7 (Propiedades de la derivada). Para f (z), g(z) ∈ C(z), se satisface:

1. (αf + βg)0 (z) = (αf 0 + βg 0 )(z), ∀α, β ∈ C.


2. (f · g)0 (z) = (f 0 · g + f · g 0 )(z).
3. (f −1 )0 (z) = −(f 0 /f 2 )(z).
4. (f /g)0 (z) = ((f 0 · g − f · g 0 )/g 2 )(z).
5. (g k )0 (z) = k(g k−1 · g 0 )(z), ∀k ∈ N.
6. (f ◦ g)0 (z) = ((f 0 ◦ g) · g 0 )(z), ∀ ord g ≥ 1.

Todas estas propiedades son conocidas de cálculo, sin embargo, la demostración de esta
proposición es un poco más interesante porque cada ı́tem resulta ser consecuencia de las
definiciones dadas, independiente en todo sentido de la noción de convergencia usada en las
materias de cálculo. Haremos solamente la demostración de las ecuaciones 1 y 2 para ilustrar
este hecho, las propiedades restantes puede hallarlas en [13].
3. ENFOQUE ALGEBRAICO. 23

Demostración.

1. Verifiquemos la linealidad del operador D. Sean f (z) y g(z) series de Laurent, y


α, β ∈ C. Si ord f = n0 y ord g = k0 , entonces [z n ]f (z) = 0 y [z k ]g(z) = 0, para todo
n < n0 y k < k0 . Llamando am y bm a los coeficientes de f (z) y g(z) respectivamente,
para todo m ≥ min{n0 , k0 }, tenemos que

[z m−1 ](αf + βg)0 (z) = m(αam + βbm )

= α(mam ) + β(mbm )

= [z m−1 ]αf 0 (z) + [z m−1 ]βg 0 (z),

lo que concluye la demostración.


2. Sean f (z) y g(z) series de Laurent tales que ord f = n0 y ord g = k0 . Entonces, para
todo m ≥ n0 + k0 , obtenemos a partir de las definiciones del producto de Cauchy y
la derivada que:
X
[z m−1 ](f · g)0 (z) = man bk
n+k=m
X
= (n + k)an bk
n+k=m
X X
= (nan )bk + an (kbk )
n+k=m n+k=m

= [z m−1 ](f 0 · g)(z) + [z m−1 ](f · g 0 )(z).




Definición 3.8. Sean f (z) y g(z) series de potencia, con ord f, ord g ≥ 1. Entonces g(z)
es llamada la inversa de f (z) si y sólo si f (g(z)) = g(f (z)) = z. En tal caso, decimos que
f (z) y g(z) son invertibles, y denotamos g(z) = f (z).

Proposición 3.9 (Condición de Inversa). Sea f (z) ∈ C[z]. f (z) tiene inversa única
f (z) si, y sólo si, ord f = 1.

Demostración. Sea f (z) una serie de potencias invertible, con inversa f (z). Usando
la propiedad de orden sobre la composición de f y f tenemos:

1 = ord(f ◦ f ) = ord f · ord f .


3. ENFOQUE ALGEBRAICO. 24

Como el orden de una serie es un número natural entonces ord f = ord f = 1. Ahora,
suponiendo que ord f = 1, veamos que f (z) existe y es única. De la ecuación (f ◦ f )(z) = z
obtenemos que

1, si n = 1

[z n ](f ◦ f )(z) = δ1n =
0, otro caso.

De la ecuación (3.3) y de la hipótesis ord f = 1, obtenemos la siguiente recurrencia:

1
b1 =
a1
n−1
1 X X
bn = − bp an1 . . . anp ,
a1 n p=1 n
1 +...+np =n−1

donde los ai y bi son los coeficientes de f (z) y f (z), respectivamente. Por lo tanto, f (z) existe
pues todos los términos bn se pueden hallar a partir de la fórmula de recurrencia obtenida y
además, f (z) es única pues sus coeficientes vienen dados de manera única por la recurrencia.
Obtenemos exactamente lo mismo si trabajamos con (f ◦ f )(z) = z.


Ahora, sean f (z) y g(z) series de potencia invertibles, por la proposición anterior, ord f =
ord g = 1. Usando la propiedad del orden de la composición, ord(f ◦ g) = ord f · ord g = 1, es
decir, la composición de series invertibles es invertible. Este resultado da pie a la siguiente
proposición:

Proposición 3.10. El conjunto {f (z) ∈ C[z] : ord f = 1} es un grupo con respecto a la


composición de series.

Lo único que resta demostrar es que la composición de series es asociativa, lo cual se deja
al lector. En la demostración de la Proposición 3.9 vimos cómo obtener los coeficientes de la
inversa de una serie dada, a partir de una fórmula de recurrencia. La pregunta es: ¿hay un
método más eficiente? Analicemos lo siguiente: sea f (z) una serie invertible, entonces pode-
mos reescribirla como f (z) = ze(z), donde ord e = 0. Sustituyendo f (z) por z nos queda,
z = f (z)e(f (z)). Llamando M (z) = e−1 (z), obtenemos finalmente la ecuación implı́cita:

f (z) = zM (f (z)). (3.4)


1. DEMOSTRACIÓN DE FIG USANDO RESIDUOS. 25

Note que esta ecuación es completamente análoga a

x − tφ(x) = 0, (P2)

cuando φ(x) posee serie de Taylor alrededor de 0, lo que sugiere que la solución de (3.4)
viene dada por (FIL). Ya estamos en condiciones de presentar el Teorema de Inversión de
Lagrange de este capı́tulo:

Teorema 3.11 (Versión algebraica de FIG). Sea G(z) ∈ C[z] de orden 1, tal que satisface
la ecuación G(z) = zM (G(z)), donde M (z) es una serie de potencia de orden 0. Entonces,
los coeficientes cn = [z n ]F (G(z)) vienen dados por

c0 = [z 0 ]F (z)
1 n−1 0 (FIG)
cn = [z ]F (z)M n (z),
n
para cualquier F (z) ∈ C[z].

1. Demostración de FIG usando residuos.

Esta primera demostración depende fundamentalmente de la siguiente propiedad de


residuo:

Proposición 3.12. Sea g(z) ∈ C[z] con ord g = 1. Entonces el residuo de la serie de
Laurent g 0 (z)g −n (z) es
Res(g 0 · g −n )(z) = δ1n ,

para cualquier n ∈ Z.

Demostración. Para n 6= 1, tenemos g 0 (z)g −n (z) = 1


1−n
(g 1−n (z))0 , cuyo residuo es
igual a 0 por la Proposición 3.6.
Para n = 1, escribimos g(z) = ze(z), donde ord e = 0. Entonces
 0 
1 e0 (z)
   0 
g (z) e (z)
Res = Res + = 1 + Res .
g(z) z e(z) e(z)
El término que depende de la serie e(z) tiene residuo 0, por ser multiplicación de series
de potencia, por lo que queda demostrada la proposición.


Como resultado directo de esta proposición tenemos,


1. DEMOSTRACIÓN DE FIG USANDO RESIDUOS. 26

Corolario 3.13. Sea h(z) ∈ C(z) y g(z) ∈ C[z], tal que ord g = 1. Entonces,

Res[(h ◦ g) · g 0 ](z) = Res h(z).

Demostración con residuos del Teorema 3.11. Sean, F (z) y G(z) series de po-
tencia, con ord G = 1. Denotemos a los coeficientes de (F ◦G)(z) por cn , con n ∈ N. Sabemos
que por definición de composición de series

c0 = [z 0 ](F ◦ G)(z) = [z 0 ]F (z),

por lo que sólo nos interesaremos en los funcionales [z n ] con n ≥ 1. Denotemos por

X
0
(F ◦ G) (z) = ncn z n−1 = H(z).
n=1

Sea g(z) = G(z), hallaremos dos expresiones para el valor residuo


(F ◦ G)0 (z)
 
Res .
(g ◦ G)n (z)
Para el primer cálculo, consideraremos la serie H(z),
(F ◦ G)0 (z)
   
H(z)
Res = Res = ncn
(g ◦ G)n (z) zn
Para el otro cálculo, usaremos el Corolario 3.13 sobre G(z) y la propiedad de los fun-
cionales lineales [z l ]h(z) = [z k+l ]z k h(z) para cualesquiera h(z) ∈ C[z] y k, l ∈ N. Recordemos
que G(z) = zM (G(z)), por lo que
Gn (z) Gn (z)
M n (G(z)) = = ,
zn (g ◦ G)n (z)
y ası́,
(F ◦ G)0 (z) (F ◦ G)0 (z)M n (G(z))
   
Res = Res
(g ◦ G)n (z) Gn (z)
 0
F (G(z))M n (G(z))G0 (z)

= Res
Gn (z)
 0
F (z)M n (z)

= Res
zn
= [z n−1 ]F 0 (z)M n (z).

De donde,
1 n−1 0
cn = [z ]F (z)M n (z),
n
2. DEMOSTRACIÓN DE FIG USANDO OPERADORES ADJUNTOS. 27

quedando demostradas las ecuaciones (FIG) del Teorema 3.11.




2. Demostración de FIG usando operadores adjuntos.

La demostración presentada en esta sección resultará bastante interesante por la riqueza


de resultados algebraicos que obtendremos. Daremos una caracterización de los coeficientes
de la serie (F ◦G)(z) mediante los autovectores de cierto operador, más especı́ficamente, será
a través de un operador adjunto. Para esto, primero debemos definir una aplicación bilineal
sobre C(z).

Definición 3.14. En C(z) definimos la forma bilineal

hf |gi = [z 0 ](f · g)(z), (3.5)

para cualesquiera f (z), g(z) ∈ C(z).

Al par (C(z), h·|·i) no podemos llamarlo espacio con producto interno porque, de hecho, la
forma bilineal h·|·i no es un producto interno, por no ser sesquilineal. Sin embargo, teniendo
una forma bilineal podemos introducir la definición de adjunto de la manera usual.

Definición 3.15. Sea S un operador sobre C(z). Entonces su adjunto S ∗ es otro ope-
rador sobre C(z) que satisface
hSf |gi = hf |S ∗ gi,

para cualesquiera f (z), g(z) ∈ C(z).

A continuación, daremos dos ejemplos para ilustrar esta definición, pero ambos serán de
mucha utilidad en las próximas demostraciones:

Ejemplo 3.16. Para cualquier m(z) ∈ C[z], podemos definir un operador M = Mm


sobre C(z) llamado operador multiplicación definido por

M a(z) = m(z)a(z),

para toda serie de Laurent a(z). Dado que el producto en C(z) es conmutativo y asociativo,
tenemos que

hM a|bi = [z 0 ]((m · a) · b)(z) = [z 0 ](a · (m · b))(z) = ha|M bi


2. DEMOSTRACIÓN DE FIG USANDO OPERADORES ADJUNTOS. 28

para cualesquiera a(z) y b(z), es decir, M ∗ = M .




Ejemplo 3.17. Definimos al operador D• como la aplicación

D• a(z) = zDa(z) = za0 (z),

al cual llamaremos operador apuntamiento (la razón de este nombre lo explicaremos en el


capı́tulo siguiente por su interpretación combinatoria). En algunos casos, será conveniente
la notación D• a(z) = a• (z). El apuntamiento satisface la propiedad

(a · b)• (z) = (a• · b + a · b• )(z)

Sabemos ya que el residuo de la derivada de cualquier serie de Laurent es cero, ası́ que

0 = [z 0 ](a · b)• (z) = [z 0 ](a• · b)(z) + [z 0 ](a · b• )(z) = ha• |bi + ha|b• i

de donde,
ha• |bi = ha| − b• i

y por lo tanto, (D• )∗ = −D• .




Tenemos de igual manera la conocida propiedad

(ST )∗ = T ∗ S ∗ ,

para operadores S y T cualesquiera de C(z).


Antes de introducir el teorema en el cual se basará la demostración de las ecuaciones
(FIG), daremos un resultado con respecto a la base del espacio C[z]. Este espacio posee
la base canónica {1, z, z 2 , . . .}. Si tenemos g(z) ∈ C[z] de orden 1, entonces {gn (z)}n∈N ,
donde gn (z) = g n (z), es también una base de C[z]. La demostración de este hecho es sencilla
considerando que
ord g n (z) = n = ord z n , ∀n ∈ N.

Luego, cualquier F (z) ∈ C[z], puede escribirse como combinación lineal de la base
{gn (z)}n∈N . Es decir, existen escalares cn ∈ C, tales que

X
F (z) = cn gn (z). (3.6)
n=0
2. DEMOSTRACIÓN DE FIG USANDO OPERADORES ADJUNTOS. 29

Por la Proposición 3.7, la derivada de F (z) satisface,



X
0
F (z) = ncn gn−1 (z)g 0 (z). (3.7)
n=1

Daremos ahora el teorema indispensable de esta sección.

Teorema 3.18. Sean F (z), g(z) ∈ C[z], con ord g = 1. Entonces existe una serie formal
h(z), tal que (h ◦ g)(z) = F (z), y sus coeficientes cn pueden hallarse con

c0 = [z 0 ]F (z)
1 (3.8)
cn = Res(F 0 · g −n )(z).
n

Demostración. Como ord g = 1, entonces podemos obtener una expresión de F (z) de


la forma (3.6). Si definimos

X
h(z) = cn z n
n=0

entonces, F (z) = (h ◦ g)(z). Quedando probada ası́ la existencia de h(z). Consideremos el


operador U sobre C(z), definido por
g(z) 0
U a(z) = a (z).
g 0 (z)
Para cada elemento base gn (z) tenemos

U gn (z) = ngn (z),

es decir, ∀n ∈ N, λn = n es autovalor de U , con el correspondiente autovector gn (z).


Consideremos el operador multiplicación M = Mm sobre C(z), donde
g(z)
m(z) = ,
zg 0 (z)
tenemos que U = M D• . De esta manera, usando los ejemplos dados

U ∗ = (M D• )∗ = (D• )∗ M ∗ = −D• M.

Veamos que el problema −D• M g˙n (z) = ng˙n (z) tiene solución distinta de la trivial. Esto
es, λn = n, es autovalor de U ∗ . Llamando g¨n (z) = M g˙n (z), tenemos que

−D• M g˙n (z) = −D• g¨n (z) = −z(g¨n )0 (z).


2. DEMOSTRACIÓN DE FIG USANDO OPERADORES ADJUNTOS. 30

Por otro lado,

m(z) 1 1
ng˙n (z) = n g˙n (z) = n M g˙n (z) = n g¨n (z),
m(z) m(z) m(z)

de donde obtenemos la siguiente ecuación diferencial

g 0 (z)
(g¨n )0 (z) = −ng¨n (z) ,
g(z)

la cual tiene como solución g¨n (z) = g −n (z), y ası́, g˙n (z) = zg −n−1 (z)g 0 (z). Obtenido este
resultado, debido a la Proposición 3.12, hgm |g˙n i = δmn . En efecto,

hgm |g˙n i = [z 0 ](gm · gn )(z)

= [z 0 ]zg m (z)g −n−1 (z)g 0 (z)

= [z 0 ]zg m−n−1 (z)g 0 (z)

= Res(g 0 · g m−n−1 )(z)

= δmn .

De esta manera, considerando la ecuación (3.7), tenemos que para n ≥ 1

ncn = hF 0 /g 0 |ġn−1 i

= [z 0 ]z(F 0 · g −n )(z)

= Res(F 0 · g −n )(z),

y para n = 0, es inmediato que c0 = [z 0 ]F (z), quedando demostradas las ecuaciones (3.8).




Demostración del Teorema 3.11. Nos pondremos bajo las hipótesis del Teorema
3.18. Note que si G(z), es tal que satisface G(z) = zM (G(z)), entonces su inversa g(z) se
puede representar como

g(z) = zM −1 (z).

Ahora, como (G ◦ g)(z) = z, componiendo con F (z) a ambos lados nos queda,

((F ◦ G) ◦ g)(z) = F (z).


2. DEMOSTRACIÓN DE FIG USANDO OPERADORES ADJUNTOS. 31

Si llamamos h(z) = (F ◦ G)(z), entonces h(z), es la serie de potencia para la cual se


satisface el Teorema 3.18. Por lo tanto, los coeficientes cn de h(z) vienen dados por las
ecuaciones (3.8). Para n = 0 es directo. Si n ≥ 1
1 1 1
cn = Res(F 0 · g −n )(z) = Res[z −n F 0 (z)M n (z)] = [z n−1 ]F 0 (z)M n (z),
n n n
que es lo que querı́amos demostrar.


Considerando la demostración por residuos, podemos demostrar que los Teoremas 3.11
y 3.18 son equivalentes, por lo que trabajar con las ecuaciones (FIG) será básicamente lo
mismo que trabajar con las ecuaciones (3.8), cosa que sucederá en temas posteriores.
CAPÍTULO 4

Enfoque combinatorio.

En el capı́tulo anterior dimos una interpretación bastante elegante a la ecuación (P2) al


verla como una expresión genérica para hallar la inversa compositiva de una serie de po-
tencias con ciertas caracterı́sticas. Seguiremos trabajando con series de potencias formales,
pero esta vez analizándolas mediante teorı́a combinatoria. Las series resultan en este capı́tulo
indispensables para solucionar de manera eficiente problemas combinatorios. Se caracteri-
zarán por poseer coeficientes enteros no negativos, sin embargo, al final de este capı́tulo
veremos que trabajar con estas series es suficiente para generalizar el resultado a series con
coeficientes en C.
Con respecto a la fórmula de inversión, a diferencia de los capı́tulos anteriores en los
que sólo demostramos la fórmula (FIG) por generalizar el resultado planteado por Lagrange,
aquı́ sı́ estudiaremos por separado la ecuación (FIL) y la ecuación (FIG) del Capı́tulo 1.
Asimismo daremos una interpretación combinatoria de la ecuación (P2).

1. Teorı́a de especies combinatorias.

En 1981, André Joyal en [8] mostró su estudio de series formales a través de teorı́a com-
binatoria, o para ser más especı́fico, mediante lo que él llamó especies combinatorias. Lo que
resulta más interesante del trabajo de Joyal es que da una definición formal de “estructura”
sobre conjuntos finitos, definiéndola simplemente como una aplicación funtorial. De esta
manera, grafos, árboles, órdenes lineales, funciones, ciclos, y muchos otros conceptos estruc-
turales que manejamos y que son de mucha ayuda en distintos campos de la matemática,
vienen enmarcados en la categorı́a utilizada por Joyal. Más aún, dentro de este marco pode-
mos establecer equivalencias y operaciones entre especies que nos permiten generar nuevas
estructuras, o incluso obtener otras interpretaciones combinatorias de las estructuras que
conocemos.
Antes de poder enfocarnos en la fórmula de inversión, hace falta dar los conceptos nece-
sarios para poder obtener la ecuación (P2).

32
1. TEORÍA DE ESPECIES COMBINATORIAS. 33

Definición 4.1. Una categorı́a es una clase C de objetos (a, b, c, ...) junto con:

(1) una clase de conjuntos disjuntos, denotado hom(a, b), para cada par de elementos
a, b de C; a cada elemento f ∈ hom(a, b) lo llamaremos morfismo de a a b y
denotamos f : a → b;
(2) para cada tripleta (a, b, c) de objetos de C, una función

hom(b, c) × hom(a, b) → hom(a, c)

(para morfismos f : a → b, g : b → c, esta función se escribe (g, f ) 7→ g ◦ f y


g ◦ f : a → c es llamado la composición de f y g); sujeta a las siguientes condiciones:
• Asociatividad. Si f : a → b, g : b → c, h : c → d son morfismos de C, entonces
h ◦ (g ◦ f ) = (h ◦ g) ◦ f .
• Identidad. Para cada objeto b de C existe un morfismo 1b : b → b tal que para
cualesquiera f : a → b y g : b → c,

1b ◦ f = f y g ◦ 1b = g.

Para ejemplos de categorı́as puede revisar [7]. En este trabajo sólo estamos interesados
en la categorı́a Cbiy de conjuntos finitos cuyo morfismos son funciones biyectivas, la cual
evidentemente satisface la Definición 4.1.

Definición 4.2. Una especie de estructuras es una regla F : Cbiy → Cbiy que genera para
cada conjunto finito U un conjunto finito F [U ] y para cada biyección (morfismo de Cbiy )
σ : U −→ V , una biyección F [σ] : F [U ] −→ F [V ], tal que,

(1) para todas las biyecciones σ : U −→ V y τ : V −→ W ,

F [τ ◦ σ] = F [τ ] ◦ F [σ], (4.1)

(2) para la función identidad IdU : U −→ U ,

F [IdU ] = IdF [U ] . (4.2)

Un elemento s ∈ F [U ] se denomina F -estructura sobre U (o estructura de especie F sobre


U), y la función F [σ] transporte de las F-estructuras a través de σ. En terminos de categorı́as
F es una especie de estructura si es un funtor (covariante) de Cbiy en sı́ mismo.
1. TEORÍA DE ESPECIES COMBINATORIAS. 34

Será usual en esta sección dar interpretaciones gráficas, como la Figura 4.1, de las distintas
especies con las que trabajaremos.

Figura 4.1. Representación de Especies.

A lo largo de este tema estaremos interesados en el problema (combinatorio) de calcular el


cardinal de los conjuntos F [U ], siendo F una especie y U un conjunto finito. Por comodidad,
en algunos casos trabajaremos con los conjuntos [n] = {1, 2, ..., n} (y establecemos [0] = ∅),
debido a que si card(U ) = n entonces card(F [U ]) = card(F [[n]]), lo cual es consecuencia
de que F [σ] es biyectiva. Para más comodidad, denotaremos F [n] en vez de F [[n]], y a su
cardinal por Fn . Ahora daremos algunos ejemplos de especies.

Ejemplo 4.3. Para todo k ∈ N = {0, 1, 2, . . .}, definimos la especie E(k) como

{U },

si card U = k
E(k) [U ] =
∅,

otro caso.

A la especie E(k) se le llama caracterı́stica de conjuntos de cardinal k. Los casos parti-


culares k = 0 y k = 1 los denotaremos E(0) = 1 y E(1) = X.

Ejemplo 4.4. La especie uniforme E, definida simplemente por E[U ] = {U }. Entonces,


para cada conjunto finito U existe una única E-estructura. Esta especie será bastante rele-
vante en próximos desarrollos.

Ejemplo 4.5. La especie G, de grafos simples. En términos de conjuntos, un grafo simple


sobre un conjunto finito U (o una G-estructura) es un conjunto γ ⊆ ℘[2] [U ], donde

℘[2] [U ] = {u ⊆ U : card(u) = 2}.


1. TEORÍA DE ESPECIES COMBINATORIAS. 35

Llamaremos vértices a los elementos de U y aristas a los elementos de γ. Usaremos


la interpretación gráfica usual de grafos. Por ejemplo, para el conjunto [6] la Figura 4.2
representa una estructura de grafo simple.

2
1 6

3 5
4

Figura 4.2. Ejemplo de un grafo sobre [6]

En este caso, el conjunto γ posee como elementos a las aristas:

{1, 3}, {2, 3}, {3, 4}, {4, 5}, {4, 6}, {5, 6}.

En adelante, sólo haremos uso de la interpretación gráfica por ser más clara y completa.
De la definición de grafos podemos extraer ejemplos particulares, como los que siguen.

Ejemplo 4.6. La especie a, de árboles (grafos simples conexos sin ciclos).

2
1 6

3 5
4

Figura 4.3. Ejemplo de un árbol sobre [6]

Ejemplo 4.7. La especie A, de árboles con raı́z (árboles con un elemento distinguido).

2
1 6

3 5
4

Figura 4.4. Ejemplo de un árbol con raı́z sobre [6]

En la Figura 4.4, el elemento distinguido es 4, según la manera estándar de representarlo.


1. TEORÍA DE ESPECIES COMBINATORIAS. 36

Ejemplo 4.8. La especie L de ordenes lineales. Los ordenes lineales sobre un conjunto
U de cardinal n los podemos identificar con funciones biyectivas L : U → [n], donde el orden
a través de L viene dado por

u <L v ⇔ L(u) < L(v), ∀u, v ∈ U.

Para este tipo de estructuras daremos la siguiente interpretación gráfica:

L
a •c
1
•b
b 2
=⇒
c •a
3
•d
d 4

Figura 4.5. Orden lineal sobre [4].

La Figura 4.5 nos dice que sobre el conjunto U = {a, b, c, d}, aquella función L define el
siguiente orden lineal:
d <L a <L b <L c.

Ejemplo 4.9. La especie End de endofunciones. El conjunto de End-estructuras sobre


el conjunto U es End[U ] = {φ | φ : U → U }. Las endofunciones poseen interpretaciones
gráficas como la siguiente:

2

6
• • • •
• 5
4 3
10 • •
8 • • •
11
1 7 9
• • •
13 12 14

Figura 4.6. Representación gráfica de una endofunción sobre [14].

En este ejemplo, las flechas indican el modo como se comporta la función cuando los
nodos están etiquetados.
1. TEORÍA DE ESPECIES COMBINATORIAS. 37

Ejemplo 4.10. La especie S de permutaciones. Las S-estructuras sobre un conjunto


finito U vienen dadas por S[U ] = {φ ∈ End[U ] : φ es biyectiva}. La Figura 4.6 no repre-
senta una permutación, pero la podemos modificar para dar el ejemplo apropiado de una
S-estructura.

2
• 6

• • •
• 5
4 3
10 • • •
8 7 9

1

Figura 4.7. Representación gráfica de una permutación sobre [10].

La Figura 4.7 representa una permutación de cinco ciclos.

Ejemplo 4.11. La especie C de permutaciones cı́clicas, la cual se compone de todas las


permutaciones de un ciclo.

2

• •
4 3


1

Figura 4.8. Permutación cı́clica sobre [4].

Todos estos ejemplos (en particular los gráficos) nos serán de mucha utilidad para de-
mostrar la fórmula de inversión de Lagrange. Veremos que todas estas estructuras poseen
relaciones muy interesantes entre sı́.

Resolver el problema de los cardinales Fn para algunos de los ejemplos dados resulta bas-
tante sencillo. Por ejemplo, para cualquier n ≥ 2, el conjunto ℘[2] [n] posee n2 elementos, por


la definición del combinatorio. Ahora, como cualquier G-estructura de [n] es un subconjunto


de ℘[2] [n], entonces
n
Gn = 2( 2 ) .
1. TEORÍA DE ESPECIES COMBINATORIAS. 38

Por otro lado, para otras estructuras no es tan sencillo resolver este problema, como
sucede con las especies a y A. Cayley demostró en 1889 que para todo n ≥ 1

an = nn−2 y An = nn−1 ,

como sucesivo resultado de otros argumentos combinatorios. En nuestro caso, el problema


de los cardinales An aparecerá como consecuencia de un problema más general. Para llegar
a esto, debemos empezar por la siguiente definición.

Definición 4.12. A cada especie de estructura F le asociamos la serie formal



X zn
F (z) = Fn , (4.3)
n=0
n!

la cual llamaremos serie generatriz exponencial de la especie F .

De esta definición obtenemos que,


∞ ∞
zk zn n z
n
2( 2 )
X X
(1) E(k) (z) = (2) E(z) = = ez (3) G(z) = z +
k! n=0
n! n=0
n!

zn
 
X 1 1 1
(4) a(z) = nn−2 (5) L(z) = (6) S(z) = (7) C(z) = log .
n=1
n! 1−z 1−z 1−z

La Definición 4.12 nos permite establecer una relación entre especies.

Definición 4.13. Sean F y G dos especies de estructura. Una equipotencia de F a G es


una familia de biyecciones α = {αU }, donde para cada conjunto finito U ,


αU : F [U ] −→ G[U ].

Diremos que las especies F y G son equipotentes, y escribimos F ≡ G. En otras palabras,


F ≡ G si y sólo si ambas especies poseen la misma serie generatriz.

El concepto de equipotencia es útil cuando sólo interesa contar la cantidad de estructuras


a partir de una especie que, en esencia, es más sencilla. En otros casos que no es de nuestro
total interés, resulta poco adecuado. Por ejemplo, las especies L y S son equipotentes, pero
en los ejemplos podemos ver que en realidad no se trata de estructuras con caracterı́sticas
similares. Sin embargo, podemos establecer condiciones sobre la familia α de biyecciones
para obtener un tipo de igualdad más preciso.
1. TEORÍA DE ESPECIES COMBINATORIAS. 39

Definición 4.14. Sean F y G dos especies de estructuras. Una familia de biyecciones α


es un isomorfismo de F a G si para todo conjunto finito U las biyecciones αU : F [U ] −→ G[U ]
satisfacen la condición de naturalidad: Para cualquier biyección σ : U −→ V el siguiente
diagrama conmuta:
αU
F [U ] - G[U ]

F [σ] G[σ]

? ?
F [V ] αV
- G[V ]
En tal caso, diremos que las especies F y G son isomorfas y denotamos F ' G.

La condición de isomorfismo sobre la familia α garantiza la equipotencia de las especies F


y G. Si bien esta definición es beneficiosa para resolver otro tipo de problemas combinatorios
como podrá leer en [1], nosotros la usaremos solamente para generar nuevas estructuras a
partir de las operaciones que definiremos a continuación.
Como motivación para la primera operación, comparemos las series generatrices de las
especies E y E(k) . Es evidente la siguiente igualdad

X
E(z) = E(k) (z).
n=0

Quisiéramos que esta relación se mantuviera para una operación entre las especies E(k) .
El hecho de que para cada [n] la familia {E(k) [n]}k∈N se componga casi en su totalidad por
conjuntos vacı́os ayuda para establecer la siguiente definición:

Definición 4.15. Una familia {Fi }i∈N de especies de estructuras se dice sumable si para
cualquier conjunto finito U , Fi [U ] = ∅, excepto para una cantidad finita de ı́ndices i. La
P
suma de una familia sumable {Fi }i∈N es la especie i∈N Fi definida por la igualdad
!
X X [
Fi [U ] = Fi [U ] = Fi [U ] × {i}, (4.4)
i∈N i∈N i∈N

y cuyos transportes vienen dados por


!
X
Fi [σ](s, j) = (Fj [σ](s), j), (4.5)
i∈N

donde σ : U → V es una biyección y s ∈ Fj [U ].


1. TEORÍA DE ESPECIES COMBINATORIAS. 40

La suma de los E(k) es compatible con esta definición, y usando la ecuación (4.5) podemos
concluir que
X
E' E(k) .
k∈N
Para la suma de un par de especies F y G, será usual la interpretación gráfica

F +G F G

= o

Figura 4.9. Suma de Especies.

La suma de especies satisface, vı́a isomorfismo, igualdades usuales tales como conmuta-
tividad y asociatividad. Si declaramos la especie 0[U ] = ∅, para cualquier conjunto finito
U , tenemos entonces un elemento neutro con respecto a la suma. Además, la suma de una
especie F consigo mismo n veces la denotamos por nF . Un resultado que nos será relevante
en su debido momento es que si tenemos una especie F cualquiera, y {Fk }k∈N la familia de
cardinales de la especie F , entonces
X
F ≡ Fk E(k) . (4.6)
k∈N

Para el producto, tomemos otro ejemplo como motivación. En la Figura 4.7 note que
podemos separar los puntos fijos de los ciclos de la siguiente manera:

2
• 6

• • •
• 5
4 3
10 • • •
8 7 9

1

Dicho de otro modo, hemos realizado una partición que separa los puntos fijos de los
puntos no fijos. Al tipo de permutaciones que no dejan puntos fijos llamémoslos desarreglos.
1. TEORÍA DE ESPECIES COMBINATORIAS. 41

Podemos definir incluso la especie Des de desarreglos. El propósito ahora es definir una
operación (·) tal que
S ' E · Des,

para cualquier partición que consideremos. De esta manera surge la siguiente definición:

Definición 4.16. Sean F y G dos especies de estructuras. La especie F · G, llamada


producto de F y G, se define como sigue: Una (F · G)-estructura sobre un conjunto U es un
par ordenado s = (f, g), donde

(1) f es una F -estructura sobre un subconjunto U1 ⊆ U ;


(2) g es una G-estructura sobre un subconjunto U2 ⊆ U ;
(3) (U1 , U2 ) es una partición de U , es decir, U1 ∪ U2 = U y U1 ∩ U2 = ∅.

En otras palabras, para cualquier conjunto U , tenemos


X
(F · G)[U ] = F [U1 ] × G[U2 ], (4.7)
(U1 ,U2 )

con la suma disjunta definida sobre todas las particiones (U1 , U2 ) de U . El transporte a
través de una biyección σ : U → V está definida por

(F · G)[σ](s) = (F [σ1 ](f ), G[σ2 ](g)), (4.8)

donde s = (f, g), y σi es la restricción de la biyección σ sobre el subconjunto Ui , con i = 1, 2.

Esta definición se puede generalizar para el producto de k especies, pero en este caso
debemos considerar una k-partición de U , (U1 , . . . , Uk ). El producto de especies tiene la
interpretación gráfica:

F ·G F G

Figura 4.10. Producto de Especies.


1. TEORÍA DE ESPECIES COMBINATORIAS. 42

Esta definición nos permite formalizar el hecho de que la igualdad (vı́a isomorfismo)
S ' E · Des, en efecto se da. Teniendo esto en cuenta, podrı́amos preguntarnos qué sucede
con la serie generatriz exponencial de un producto, por lo que plantearemos la siguiente
proposición.

Proposición 4.17. Se tiene que

(F · G)(z) = F (z)G(z) (producto de Cauchy)

con F y G especies de estructuras cualesquiera.

Demostración. Sea el conjunto U de cardinal n, y denotemos por (U1 , U2 ) a las parti-


ciones de U . Por definición de producto
X
(F · G)n = card(F [U1 ]) card(G[U2 ])
(U1 ,U2 )

Llamando, i = card(U1 ) y j = card(U2 ), y usando la propiedad de los cardinales que


vimos al comienzo de esta sección, podemos reescribir la suma anterior como
X n
(F · G)n = Fi Gj
i+j=n
i

siendo este justamente el término que obtenemos al realizar el producto de Cauchy (3.1) con
las series F (z) y G(z).


Como consecuencia de este resultado obtenemos que


e−z
Des(z) = ,
1−z
lo que nos muestra lo práctico que puede resultar trabajar problemas combinatorios a partir
de teorı́a de series formales.
Siguiendo un orden similar al del capı́tulo anterior, corresponde ahora hablar de la susti-
tución de especies. Una vez más, a modo de motivación, definamos la especie V de los ver-
tebrados. Un vertebrado es un árbol γ donde se ha distinguido un par ordenado de vértices,
digamos (x, y). Llamaremos columna vertebral al único camino a través de γ que va de la
“cabeza” x a la “cola” y, y a los vértices que están en la columna vertebral los llamaremos
vértebras. Definamos sobre las vértebras la función posición α, que nos dará la información
de la posición con respecto a la cabeza, por ejemplo, α(x) = 1 y α(y) = #{vértebras}. Note
1. TEORÍA DE ESPECIES COMBINATORIAS. 43

que la función posición establece un orden sobre las vértebras. Para visualizar este tipo de
estructura observe la Figura 4.11.

x y

Figura 4.11. Representación gráfica de un vertebrado.

Debido a que la función posición α establece un orden sobre las vértebras, en la Figura
4.11 podemos prescindir de las aristas que van de x a y (la columna vertebral en otras
palabras) y considerar como equivalente a

1 2 3 4 5

Esto es posible para cualquier vertebrado que consideremos. Nos gustarı́a ahora estable-
cer una operación (◦) entre las especies L+ (órdenes lineales no vacı́os) y A tal que

V ' L+ ◦ A.

Por el ejemplo dado, esta operación parece depender de una partición del conjunto base
que tomemos. Note que el hecho de que A0 = 0 es de mucha ayuda pues para cualquier
conjunto U que consideremos basta con tomar los subconjuntos distintos de vacı́o para definir
la partición, y ası́ no caer en posibles problemas en el conteo de los cardinales deseados, lo que
sugiere que al momento de definir la operación F ◦ G, para dos especies F y G cualesquiera,
se debe pedir la condición extra de que G0 = 0. Recordemos que al introducir la operación
composición en el capı́tulo anterior se exigı́a una condición análoga a esta.
1. TEORÍA DE ESPECIES COMBINATORIAS. 44

Definición 4.18. Sean F y G dos especies de estructuras, tal que G[0] = ∅. La especie
F ◦ G (también denotada F (G)), llamada la composición de F y G, se define como sigue:
Una F ◦ G-estructura sobre U es una terna s = (π, ϕ, γ), donde

(1) π es una partición sin conjuntos vacı́os de U , y denotamos π ` U ;


(2) ϕ es una F -estructura sobre el conjunto de clases π;
(3) γ = (γp )p∈π , donde para cada clase p de π, γp es una G-estructura sobre p.

En otras palabras,

(F ◦ G)[0] = F [0]
X Y (4.9)
(F ◦ G)[U ] = F [π] × G[p], ∀n ≥ 1.
π`U p∈π

El transporte a través de una biyección σ : U → V está definido, para cada (F ◦ G)-


estructura s = (π, ϕ, (γp )p∈π ), como

(F ◦ G)[σ](s) = (π, ϕ, (γp )p∈π ), (4.10)

donde

(1) π es la partición de V obtenida a través de la biyección σ;


(2) para cada p = σ(p) ∈ π, la estructura γp se obtiene de la estructura γp al G-
transportar a través de la biyección σ|p ;
(3) la estructura ϕ se obtiene de la estructura ϕ al F -transportar a través de la biyección
σ inducida en π por σ.

La composición tiene la interpretación gráfica:

F ◦G F G

= G

Figura 4.12. Composición de Especies.


1. TEORÍA DE ESPECIES COMBINATORIAS. 45

La propiedad de la serie generatriz exponencial de la composición se comporta de la


manera esperada.

Proposición 4.19. Se tiene

(F ◦ G)(z) = F (G(z))

para especies F y G cualesquiera, con G0 = 0.

Demostración. Sea un conjunto U con cardinal n ≥ 1, entonces


X Y
(F ◦ G)n = card(F [π]) × card(G[p]).
π`U p∈π

Si π1 y π2 son dos particiones de U tales que card π1 = card π2 , sabemos que se satisface
card(F [π1 ]) = card(F [π2 ]). Podemos reescribir la igualdad anterior dependiendo de los
cardinales de las particiones π ` U , que varı́an de 1 hasta n. Además, para cada partición π
con k clases, digamos p1 , . . . , pk , se tiene que:
k
X
card pi = n.
i=1

Denotando ni = card pi , podemos reescribir la ecuación inicial como sigue


n  
X 1 X n
(F ◦ G)n = Fk Gn1 · · · Gnk ,
k=1
k! n +···+n =n
n 1 · · · nk
1 k

que es justamente el término n-ésimo de la composición F (G(z)) definida en (3.3). Para el


conjunto [0] es directo.


De esta proposición obtenemos que


A(z)
V(z) = L+ (A(z)) = .
1 − A(z)
Ahora definiremos la derivada de una especie. A diferencia de las operaciones anteriores,
lo haremos de manera constructiva. Es decir, estamos interesados en hallar una especie tal
que su serie generatriz exponencial satisfaga G(z) = F 0 (z). La pregunta es, ¿de qué manera
debemos alterar a la especie F para obtener otra tal que su serie generatriz sea F 0 (z)? La
respuesta, de hecho, la obtenemos de la ecuación de G(z), pues a partir de ahı́ podemos ver
que los cardinales de la especie G satisfacen

Gn = Fn+1 , ∀n ∈ N.
1. TEORÍA DE ESPECIES COMBINATORIAS. 46

Por lo tanto, el número de G-estructuras sobre un conjunto U es igual al número de


F -estructuras sobre el conjunto U al cual le ha sido agregado un “nuevo” elemento.

Definición 4.20. Sea F una especie de estructuras. La especie F 0 , llamada la derivada


de F , se define como sigue: una F 0 -estructura sobre U es una F -estructura sobre U ] {∗}.
El transporte a través de una biyección σ : U → V es simplemente asignar para cada F 0 -
estructura s sobre U , F 0 [σ](s) = F [σ + ](s), donde σ + : U ] {∗} → V ] {∗} es la extensión
canónica de σ: 
σ(x), si x ∈ U

σ + (x) =
∗,

si x = ∗.

La interpretación gráfica de la derivada es:

F0 F

=

Figura 4.13. Derivada de Especies.

Para ilustrar aún más esta definición considere la Figura 4.14.

C0 ∗ L
4• •2 4• •2

=
• • • •
3 5 3 5
• •
1 1

Figura 4.14. Derivada de las permutaciones cı́clicas sobre [5].

Entonces,
1
C 0 (z) = L(z) = ,
1−z
como era de esperar.
1. TEORÍA DE ESPECIES COMBINATORIAS. 47

Veremos ahora que las propiedades comunes de la derivada se satisfacen a partir de las
interpretaciones gráficas.

Proposición 4.21. Para especies F y G cualesquiera se tiene


1. (F + G)0 = F 0 + G0
2. (F · G)0 = F 0 · G + F · G0
3. (F ◦ G)0 = (F 0 ◦ G) · G0 , si G0 = 0.
Demostración.

1. (F + G)0 F+G

=

F G
∗ ∗
= o

F0 G0
= o

2. (F · G)0 ∗
F ·G
=

F ∗ G F ∗ G
= o

F0 · G F · G0
= o
1. TEORÍA DE ESPECIES COMBINATORIAS. 48

3. ∗
(F ◦ G)0 F ◦G
=

F G∗

= G

F ∗ G ∗
= G •
G •

Para finalizar esta parte de conceptos, hablaremos de otro tipo de operación (o aplicación)
que nos será indispensable, la cual ya apareció en el capı́tulo anterior y que hemos llamado
apuntamiento. Recordemos que el apuntamiento es una aplicación que asigna a cada serie de
potencia F (z) la serie F • (z) = zF 0 (z), entonces si F (z) es una serie generatriz exponencial,
la especie F • es aquella con coeficientes Fn• = nFn .

Definición 4.22. Sea F una especie de estructuras. La especie F • , llamada apun-


tamiento de F , se define como sigue: Una F • -estructura sobre U es un par s = (u, r),
donde
(1) u ∈ U (elemento distinguido),
(2) r es una F -estructura sobre U .
El par (u, r) es llamado F -estructura apuntada de U . En otras palabras, para cualquier
conjunto U , F • [U ] = U × F [U ]. El tranporte a través de una biyección σ : U → V es
simplemente asignar F • [σ](s) = (σ(k), F [σ](r)), para cualquier F • -estructura s = (k, r)
sobre U .

La identidad
F• ' X · F0

viene justificada por la Figura 4.15.


2. ÁRBOLES R-ENRIQUECIDOS. 49

F• F F

= =

Figura 4.15. Representación gráfica del apuntamiento.

El ejemplo más claro del apuntamiento lo puede observar comparando las Figuras 4.3 y
4.4, donde obtenemos que a• ' A. De manera similar, tenemos que A• ' V.

Proposición 4.23. Para especies F y G cualesquiera se tiene

1. (F · G)• = F • · G + F · G• .
2. (F ◦ G)• = (F 0 ◦ G) · G• .

Demostración. Similar al de la Proposición 4.21.




2. Árboles R-enriquecidos.

El propósito de esta sección es la deducción (combinatoria) de la ecuación (P2) y la


demostración de (FIL) y (FIG) para series generatrices exponenciales. Serán de sumo interés
las siguientes especies:

Definición 4.24. Para un conjunto finito V 6= ∅, y una especie de estructuras R, defini-


mos RV como la especie cuyas estructuras son funciones con codominio V , donde cada fibra
está dotada de una R-estructura. En otras palabras, una RV -estructura sobre un conjunto
U , es un par de la forma (f, {γm }m∈V ), donde

(1) f : U → V ;
(2) γm ∈ R[f −1 (m)], para cada m ∈ V .

Si card V = k, entonces una función f : U → V define una k-partición sobre U de la


forma (U1 , . . . , Uk ), por lo que la siguiente igualdad (vı́a isomorfismo), en efecto es válida:

RV ' Rk . (4.11)
2. ÁRBOLES R-ENRIQUECIDOS. 50

Definición 4.25. Una estructura de especie EndR (es decir, una endofunción R-enriquecida)
sobre un conjunto U está compuesto de los siguientes datos:
(1) una endofunción cualquiera f : U → U ;
(2) una R-estructura sobre cada fibra de la endofunción f .


• • • •

• •
• • •
• • •

Figura 4.16. Endofunción R-enriquecida.

Definición 4.26. Un árbol con raı́z R−enriquecido sobre un conjunto U está compuesto
de los siguientes datos:
(1) una estructura de árbol con raı́z arbitrario sobre U , denotado por α;
(2) una R-estructura sobre la fibra de cada vértice u ∈ U en α.
Aquı́ la fibra de un vértice u se refiere al conjunto (posiblemente vacı́o) α−1 (u) de pre-
decesores inmediatos de u, cuando todas las aristas están orientadas hacia la raı́z.

En la Figura 4.17 tenemos que

α−1 (4) = {3, 5, 6},

α−1 (3) = {1, 2},

α−1 (1) = ∅.

R 2

R 6 R
1
R 3 R
5
R
4

Figura 4.17. Árbol con raı́z R-enriquecido.


2. ÁRBOLES R-ENRIQUECIDOS. 51

Denotamos a la especie de árboles con raı́z R-enriquecidos como AR . A los vértices con
fibra vacı́o los llamaremos hojas. En la Figura 4.17 las hojas son los vértices 1, 2, 5 y 6.
Note que en las fibras de estos vértices también establecemos una R-estructura. Por lo que
haremos la suposición R0 6= 0, ya que de lo contrario obtendremos la solución trivial AR = 0.
Teniendo en cuenta todas las operaciones vistas en la sección anterior, note que la estructura
de la Figura 4.17 es igual a

AR

AR
AR
R

De donde obtenemos la ecuación implı́cita

AR ' X · R(AR ). (4.12)

Para el caso particular, R = E, se tiene, AE ' A y

A ' X · E(A), (4.13)

siendo esta última ecuación la que estudiaremos para resolver el famoso problema de Cayley.
Aplicando las propiedades de series generatrices exponenciales a la ecuación (4.12) obtenemos
una ecuación con caracterı́sticas similares a (3.4).

AR (z) = z · R(AR (z)). (4.14)

Ya hemos visto que resolver el problema de los cardinales Fn , para una especie F
cualquiera, se reduce a hallar su serie generatriz. Lo propio haremos con la especie AR ,
y el método a utilizar para resolver la ecuación (4.14) será, como puede imaginar, mediante
la fórmula de inversión de Lagrange.

Teorema 4.27 (FIL para series generatrices exponenciales). Sea R una especie tal que
R0 6= 0, y AR la especie de árboles con raı́z R-enriquecidos. Llamando A(z) = AR (z),
tenemos que
n
An = Rn−1 , (4.15)

para todo n ≥ 1.
2. ÁRBOLES R-ENRIQUECIDOS. 52

La demostración de este teorema depende de ciertos isomorfismos y equipotencias que


mostraremos a continuación.

Lema 4.28. Para una especie R tal que R0 6= 0, se tiene la identidad

EndR ' S ◦ Q, (4.16)

donde Q = X · (R0 ◦ AR ).

Demostración. La especie Q tiene la interpretación gráfica

R AR R AR

AR o AR

AR AR

Teniendo esto en cuenta, note que la Figura 4.16 es equivalente a

Q
Q
Q Q
Q
Q Q
Q Q
Q

lo que demuestra la ecuación (4.16). 

Recordando que S ≡ L se tiene que EndR ≡ L ◦ Q. En la sección anterior vimos una


relación entre la especie V de vertebrados y la especie A de árboles con raı́z. El siguiente
lema da un resultado más general.

Lema 4.29. Para una especie R tal que R0 6= 0, se tiene la identidad

A• R ' (L ◦ Q) · AR , (4.17)

donde Q es como en el Lema 4.28.


2. ÁRBOLES R-ENRIQUECIDOS. 53

Demostración. Se tiene a partir del siguiente gráfico y de la Definición 4.26 que

A•R L◦Q AR

Demostración del Teorema 4.27. Por los Lemas 4.28 y 4.29 se tiene:

A•R ' (L ◦ Q) · AR ≡ EndR ·AR .

Definamos la especie auxiliar Ψ = ΨR de la siguiente manera: una Ψ-estructura sobre un


conjunto U de cardinal n se compone de

(1) un elemento u ∈ U ;
(2) una función R-enriquecida cualquiera ψ : U \ {u} → U .

Como hay n maneras de escoger el elemento u, y la función ψ es cualquier estructura de


RU [U \ {u}], entonces
n
ψn = nRn−1 (4.18)

por la identidad (4.11). La interpretación gráfica de una Ψ-estructura es

• • • •

• • • •

• •
• • •
• • • •
x

de donde Ψ ' EndR ·AR . De esta manera obtenemos la equipotencia

A•R ≡ Ψ. (4.19)
2. ÁRBOLES R-ENRIQUECIDOS. 54

Llamemos An a los cardinales de AR ; de la sección anterior tenemos que A•n = nAn , y


ası́, por la igualdad (4.18):
n
nAn = nRn−1 ,

de donde obtenemos el resultado, ya que n ≥ 1 por la definición de árbol R-enriquecido.




Hemos considerado al Teorema 4.27 como la versión combinatoria de (FIL) ya que a


partir de este resultado es fácil ver que
1 n−1 n
[z n ]A(z) = [z ]R (z).
n
Este teorema funciona para resolver cualquier problema de la forma

f (z) = zR(f (z)), (3.4)

siendo R una serie generatriz exponencial con coeficiente independiente no nulo. La de-
ducción realizada para obtener la identidad (4.6) garantiza este hecho, pues siempre po-
dremos encontrar una especie R cuya serie generatriz sea R(z). Es decir, podemos variar los
coeficientes de R(z) sobre el conjunto N y siempre hallar una solución de (3.4).
Note además que la ecuación (4.15) nos dice que los cardinales An se escriben como
producto y suma de los n primeros cardinales de la especie R. En otras palabras, podemos
observar a los coeficientes An como polinomios que dependen de las variables R0 , R1 , . . . , Rn .

Teorema 4.30 (Principio de extensión de identidades algebraicas). Sea D un dominio


integral. Dado un polinomio P (x1 , . . . , xm ) ∈ D[x1 , . . . , xm ], denotamos por gradi P el grado
de P con respecto a la variable xi , i = 1, . . . , m. Sean P (x1 , . . . , xm ) y Q(x1 , . . . , xm ) dos
polinomios tales que toman los mismos valores en cada punto (s1 , . . . , sm ) de un conjunto
S ⊆ Dm que satisface la siguientes propiedades: Para cada i = 1, . . . , m, existe Si ⊆ D tal
que:
Qm
1. i=1 Si ⊆ S.
2. card Si > max(gradi P, gradi Q), ∀i = 1, . . . , m.
Entonces, los polinomios P y Q son idénticos.

Debido a este teorema, tomando D = C y S = N, y considerando los “polinomios”


An (R0 , . . . , Rn ), obtenemos que las ecuaciones (FIL) demostradas en este capı́tulo, en efecto
2. ÁRBOLES R-ENRIQUECIDOS. 55

se satisfacen para cualquier serie con coeficientes en C. Para la deducción de la ecuación


general (FIG) usaremos las especies del Ejemplo 4.3 y luego extenderemos por linealidad.
El propósito ahora es determinar que para cualquier especie F = E(k) y una arborescencia
R-enriquecida como antes, se tiene que

0
(E(k) ◦ A)n = (E(k) · Rn )n−1 . (4.20)

Primero analicemos la especie E(k) ◦A. Recordemos que la especie E(k) sólo genera estruc-
turas sobre conjuntos de cardinal k, por lo que en la composición anterior sólo tomaremos
en cuenta a las k-particiones sobre cada conjunto U . En otras palabras, la ecuación (4.20)
se reduce a demostrar el siguiente teorema

Teorema 4.31 (FIG para series generatrices exponenciales). Sea R una especie tal que
R0 6= 0, y AR la especie de árboles con raı́z R-enriquecidos. Llamando A(z) = AR (z)
tenemos que si k ∈ N
0
Akn = (E(k) · Rn )n−1 , (4.21)

para todo n ≥ 1.

Demostración. La demostración de este teorema se basa, de hecho, en un razonamiento


similar al de la demotración del Teorema 4.27. Trabajaremos solamente con el caso k ≥ 1,
ya que para k = 0 es directo. Definamos la especie auxiliar Ψk = ΨkR de la siguiente manera:
una Ψk -estructura sobre un conjunto U se compone de

(1) un subconjunto cualquiera Λ ⊆ U de cardinal k;


(2) un elemento x ∈ Λ;
(3) una función R-enriquecida cualquiera ψ : U \ Λ → U .

Note que esta especie generaliza a la especie Ψ de la demostración del Teorema 4.27 en
el sentido que Ψ1 ' Ψ. De manera análoga, podemos demostrar que (AkR )• ≡ Ψk , de donde,
si card U = n ≥ k, entonces
(Akn )• = nAkn = Ψkn .

Por otro lado, por la definición de Ψk , se tiene que para dicho conjunto U hay la siguiente
cantidad de estructuras,
 
n n
Ψkn =k Rn−k .
k
2. ÁRBOLES R-ENRIQUECIDOS. 56

Entonces, de esta igualdad y de la equipotencia obtenemos que


 
k n−1 n 0
An = Rn−k = (E(k−1) · Rn )n−1 = (E(k) · Rn )n−1 ,
k−1
quedando demostrado el teorema.


Aprovechando la equipotencia (4.6) y el hecho de que los operadores [z n ] y el operador


diferencial D son lineales, obtenemos que el Teorema 4.31 se satisface para cualquier especie
F , es decir, en efecto es válida la ecuación

(F ◦ A)n = (F 0 · Rn )n−1 .

Para finalizar, por el teorema de extensión de indentidades algebraicas, podemos asegurar


que la ecuación (FIG) se satisface para cualquier serie de potencia F (z) en el espacio C[z].
CAPÍTULO 5

Otras demostraciones y resultados.

Ya hemos dado las demostraciones de la fórmula de inversión de Lagrange que requerı́an


de un desarrollo teórico más amplio. El propósito de este capı́tulo es mostrar otras particu-
laridades de FIL, ası́ como otros ámbitos y problemas interesantes donde aparece la fórmula
(P2). Debido a lo práctico y sencillo que resultó trabajar con los funcionales de coeficientes,
usaremos exclusivamente la notación propuesta en el Capı́tulo 3 en cada una de las próximas
secciones.

1. Otra demostración analı́tica.

En el Capı́tulo 2 dimos una demostración analı́tica de la fórmula (FIG), la cual dependı́a


totalmente de la fórmula integral de Cauchy (Teorema 2.2). Asimismo, en el Capı́tulo 3,
dimos otra demostración que resultó ser consecuencia de la definición de residuo y sus im-
plicaciones, pero establecimos una condición de orden para poder resolver el problema (P2).
En esta sección daremos una demostración completamente similar a la del residuo pero cam-
biaremos la condición de inversión, que tendrá que ver más con caracterı́sticas geométricas
que posee una función holomorfa.
Para seguir con el mismo orden de los Capı́tulos 2 y 3, trabajaremos con funciones de
variable compleja que admiten series de Laurent centradas en el polo z = 0. Las condiciones
bajo las cuales una función posee una representación de esta forma se ven en cualquier curso
básico de Variable Compleja, y viene establecido por el siguiente teorema:

Teorema 5.1 (Teorema de Laurent). Sean C1 y C2 dos cı́rculos centrados en z = 0, con


respectivos radios r1 y r2 , donde r2 < r1 (Figura 5.1). Si f es una función holomorfa sobre
C1 , C2 y el dominio encerrado entre ambas curvas, entonces para cada punto z en dicho
dominio, f (z) está representada por la expansión:
∞ ∞
X
n
X bn
f (z) = an z + , (5.1)
n=0 n=1
zn

57
1. OTRA DEMOSTRACIÓN ANALÍTICA. 58

donde,
Z
1 f (s)
an = ds (n = 0, 1, 2, . . .),
2πi C1 sn+1
Z
1 f (s)
bn = ds (n = 1, 2, . . .),
2πi C2 s−n+1
y cada integral de lı́nea se considera contrareloj.

•z

x

C2 s

s
C1

Figura 5.1. Dibujo para el Teorema de Laurent.

La demostración se ve por igual en Variable Compleja, pero para mayor referencia puede
revisar [4]. Como consecuencia directa de este teorema, es fácil ver que si f (z) es una función
holomorfa dentro y sobre el contorno C1 entonces bn = 0 para todo n ≥ 1, y ası́ obtenemos
la serie de Taylor (o de Maclaurin en nuestro caso particular) de f (z). Más allá de esto, las
ecuaciones de los coeficientes an y bn no nos son completamente indispensables, sin embargo,
ambas expresiones nos dicen que la demostración de Cauchy del Capı́tulo 2 y la de residuos
del Capı́tulo 3 son esencialmente las mismas, salvo los argumentos usados para garantizar la
existencia de la solución del problema (P2). De igual manera, en esta sección estableceremos
la condición con la cual el problema (P2) tendrá solución, y ésta depende fuertemente de la
siguiente caracterización geométrica:

Definición 5.2. Una función compleja que preserva la magnitud y sentido del ángulo
entre los vectores tangentes de dos curvas suaves cualesquiera en un punto común se dice
conforme en ese punto.

Para visualizar mejor esta definición vea la Figura 5.2.


1. OTRA DEMOSTRACIÓN ANALÍTICA. 59

y y

C1 f (C1 )

C2
α
α f (C2 )


x x

Figura 5.2. Ejemplo de una función conforme.

Las funciones conformes poseen una gran cantidad de propiedades útiles e interesantes,
entre las que destacaremos (por ser las más concernientes para nuestros propósitos) las
siguientes:

Teorema 5.3. En cada punto z donde una función f es analı́tica y f 0 (z) 6= 0 la función
y = f (z) es conforme.

Teorema 5.4. Si una función y = f (z) es conforme en un punto z0 , la función f posee


una inversa local analı́tica en y0 = f (z0 ).

Recordando el operador residuo, de manera similar al Capı́tulo 3, tenemos la siguiente


propiedad:

Lema 5.5. Sea H(z) una función de variable compleja que admite serie de Laurent. Para
cualquier función analı́tica h(z) tal que h(0) = 0 y h0 (0) 6= 0, se tiene

Res[H(h(z))h0 (z)] = Res[H(z)].

La demostración es análoga a la del Teorema 3.12.

Teorema 5.6 (2a versión analı́tica de FIG). Sea y = g(z) una función de variable
compleja, tal que es analı́tica en un entorno de z = 0, g(0) = 0 y g 0 (0) 6= 0. Entonces g(z)
posee una inversa G(y) analı́tica en un entorno de y = 0. Además, para cualquier función
F (z) analı́tica en z = 0 se tiene que la función F (G(y)) posee serie de Taylor:

X
F (G(y)) = F (0) + cn y n ,
n=1
1. OTRA DEMOSTRACIÓN ANALÍTICA. 60

donde los coeficientes cn se obtienen a partir de la ecuación:

1 n−1 0
cn = [z ]F (z)M n (z). (FIG)
n

Demostración. Dado que la función y = g(z) es analı́tica alrededor de z = 0, y


g 0 (0) 6= 0, por el Teorema 5.3, tenemos que la función g(z) es conforme, y por el Teorema
5.4, g(z) posee inversa G(y) = g(y), en un entorno de y = 0. Escribiendo, g(z) = ze(z),
donde e(z) es una serie de Taylor de orden 0, sabemos ya que hallar G(y) es lo mismo que
resolver

G(y) = yM (G(y)),

donde M (z) = e−1 (z). Tenemos que G(0) = 0 ya que g(0) = 0. De esta manera, para
cualquier F (z) analı́tica en z = 0 tenemos que (F ◦ G)(y), también es analı́tica en y = 0 y
por lo tanto, F (z) admite una serie de Taylor en la variable y cuando z = G(y).
Supongamos que F (z) posee la siguiente representación en potencias de y:

X
F (z) = F (0) + cn y n ,
n=1

entonces

0
X dy
F (z) = ncn y n−1 .
n=1
dz
P∞
Sea N (y) = n=1 ncn y n−1 . Por el Lema 5.5, para r = 1, 2, 3, . . .
 0  0 
F (z)M r (z)
    
F (z) N (y) dy N (z)
Res = Res = Res = Res = rcr .
zr yr y r dz zr

Pero por las propiedades de los funcionales de coeficientes:


 0
F (z)M r (z)

Res = [z r−1 ](F 0 · M r )(z)
zr

y ası́

rcr = [z r−1 ](F 0 · M r )(z).

Finalmente,
1
cr = [z r−1 ](F 0 · M r )(z),
r
que es lo que deseábamos obtener.

2. ALGORITMO PARA FIL. 61

En esta demostración, todas las igualdades que involucran a la serie G(y) se cumplen
sobre el entorno de y = 0 que el Teorema 5.4 garantiza que existe. La pregunta natural
serı́a cómo conocer dicho entorno. Una vez obtenida la serie G(y) podemos hacer uso de los
criterios aprendidos en las materias básicas de cálculo para hallar su radio de convergencia.
En el Capı́tulo 6 daremos algunos ejemplos relacionados con este aspecto.

2. Algoritmo para FIL.

En esta sección daremos un método iterativo para hallar los coeficientes de la serie (FIL),
usando como herramienta fundamental el teorema del punto fijo de Banach. Para ello nece-
sitamos recordar una definición de Análisis Funcional.

Definición 5.7. Sea (X, d) un espacio métrico. Una aplicación T : X → X (no nece-
sariamente lineal) es llamada contracción si existe un escalar λ > 0 tal que

d(T (y1 ), T (y2 )) ≤ λd(y1 , y2 ), ∀y1 , y2 ∈ X.

Será usual llamar a T , λ-contracción, para especificar que λ es la constante de contracción.

Teorema 5.8 (Punto fijo de Banach). Sea (X, d) un espacio métrico completo y T :
X → X una λ-contracción, con 0 ≤ λ < 1. Entonces, T tiene un único punto fijo. Más
aún, para cualquier x0 ∈ X, la sucesión {xn }n∈N , definida recursivamente por xn+1 = T (xn ),
converge al punto fijo de T .

Puede hallar una demostración de este teorema en [9]. El espacio vectorial sobre el
que trabajaremos será X = C[z], definido en el Capı́tulo 3. Debemos establecer ahora una
métrica apropiada sobre este espacio para aplicar el Teorema 5.8.

Teorema 5.9. La aplicación d : C[z] × C[z] → R, definida por


1
d(f (z), g(z)) = ,
2ord(f −g)
1
es una métrica sobre el espacio C[z], entendiéndose que 2∞
= 0.

Demostración. Sólo probaremos la desigualdad triangular, ya que las demás propiedades


se satisfacen directamente de la definición de la aplicación d y de la definición de orden. Sean
f (z), g(z) y h(z) series de potencias cualesquiera. Veamos que

d(f (z), h(z)) ≤ d(f (z), g(z)) + d(g(z), h(z)).


2. ALGORITMO PARA FIL. 62

Tenemos que ord(F + G) ≥ min{ord F, ord G}, para cualesquiera series de potencia F (z)
y G(z), entonces
ord(f − h) ≥ min{ord f − g, ord g − h} = m.

Llamando M = max{ord f − g, ord g − h}, obtenemos que


1 1 1 1
≤ ≤ m + M,
2ord(f −h) 2m 2 2
lo que demuestra lo deseado.


Con esta métrica, (C[z], d) es un espacio completo. Este resultado es básicamente conse-
cuencia de la siguiente proposición:

Proposición 5.10. Denotemos Tk (F ) como el polinomio de Taylor de orden k de una


serie F (z). Tenemos que,
1
d(f (z), g(z)) ≤ ⇔ Tk (f ) = Tk (g)
2k+1
para dos series de potencia f (z) y g(z) cualesquiera.

Consideremos el espacio zC[z] de todas las series con término independiente nulo, y la
aplicación T : zC[z] → zC[z] definida por:

T (y) = zM (y),

siendo M (z) una serie de potencias tal que ord M = 0.


Esta aplicación es 21 -contractiva ya que
1 1 1
d(T (y1 ), T (y2 )) = = ≤ d(y1 , y2 ).
2ord z(M (y1 )−M (y2 )) 2ord(M (y1 )−M (y2 ))+1 2
El dominio zC[z] es la bola cerrada en (C[z], d), cuyo centro es f = 0 y el radio es 21 .
Consecuentemente, nuestro dominio es también un espacio métrico completo con respecto
a la métrica relativa. Además, si definimos la serie g(z) = ze(z), donde e(z) = M −1 (z),
entonces el único punto fijo de la aplicación T es la serie G(z) = g(z). Note que estamos
bajo las condiciones del Teorema 5.8. Supongamos que los coeficientes de la serie M (z) son
Mn , con n ∈ N. Comencemos el proceso de iteración en f0 (z) = 0. Entonces, f1 (z) = M0 z.
Como T tiene coeficiente de contracción 21 , entonces
1 1
d(G(z), f1 (z)) = d(T (G(z)), T (0)) ≤ d(G(z), 0) = 2 .
2 2
2. ALGORITMO PARA FIL. 63

Por la Proposición 5.10, obtenemos que

T1 (G) = M0 z.

Repetimos el proceso; f2 (z) = T (f1 (z)) = zM (M0 z) = M0 z + M0 M1 z 2 + · · · . Como


1 1
d(G(z), f2 (z)) ≤ d(G(z), f1 (z)) ≤ 3 ,
2 2
obtenemos que

T2 (G) = M0 z + M0 M1 z 2 .

De manera similar, para n = 3:

T3 (G) = T3 (f3 ) = M0 z + M0 M1 z 2 + (M0 M12 + M02 M2 )z 3 .

En general, si queremos obtener los coeficientes de G(z) hasta el grado m, basta conocer
su polinomio de Taylor de orden m que obtenemos a partir del algoritmo:

Tm (G) = Tm (T (T (· · · (T (0)) · · · ))).


| {z }
m veces

Ya que conocemos un algoritmo para hallar estos polinomios, si 1 ≤ n ≤ m, entonces


1 n−1 n
[z n ]G(z) = [z ]M (z) = [z n ]Tm (G(z)). (5.2)
n
Por último, daremos un ejemplo sencillo para ilustrar el proceso iterativo: sea M (z) =
z + 1 y la aplicación T (y) = zM (y). Entonces el polinomio de Taylor de orden 5 del punto
fijo de T lo obtenemos de la siguiente manera:

T (0) = z,

T (T (0)) = z(z + 1) = z 2 + z,

T (T (T (0))) = z(z 2 + z + 1) = z 3 + z 2 + z,

T (T (T (T (0)))) = z(z 3 + z 2 + z + 1) = z 4 + z 3 + z 2 + z,

T (T (T (T (T (0))))) = z(z 4 + z 3 + z 2 + z + 1) = z 5 + z 4 + z 3 + z 2 + z.

El polinomio de Taylor de orden 5 del punto fijo G(z) es:

T5 (G) = z 5 + z 4 + z 3 + z 2 + z.
3. ARREGLOS DE RIORDAN. 64

De hecho, G(z) es la serie geométrica sin término independiente:


z
G(z) = ,
1−z
lo cual podemos verificar por inducción.

3. Arreglos de Riordan.

Shapiro introdujo el concepto de arreglos de Riordan en 1991, con el propósito de definir


una clase de arreglos (o matrices) triangulares inferiores de orden infinito que tuviesen
propiedades similares a las del triángulo de Pascal. Por los momentos, sólo nos centraremos
en definir estos objetos y no tardaremos en encontrar la estrecha relación que existe con la
Fórmula de Inversión de Lagrange. A lo largo del trabajo hemos usado la variable z como
el argumento de las funciones holomorfas, o como el indefinido de las series formales, sin
embargo, para adecuarnos con el formato usual de la literatura de los arreglos de Riordan
usaremos en esta sección el término t (y en algunos casos y ó w), y trabajaremos con series
formales sobre C[t].

Definición 5.11. Sean d(t) y h(t) dos series formales en C[t]. Un arreglo de Riordan es
una matriz (dn,k )n,k∈N , cuyas entradas están definidas por:

dn,k = [tn ]d(t)(th(t))k . (5.3)

Denotaremos este arreglo por (d(t), h(t)). Si ord d 6= 0 y ord h 6= 0, llamaremos a


(d(t), h(t)) un arreglo de Riordan propio.

Frecuentemente usaremos la notación (d(t), h(t)), pero cada arreglo matricial (dn,k )n,k∈N
también podemos identificarlos con la función generatriz bivariada
d(t)
d(t, w) = , (5.4)
1 − wth(t)

puesto que para cada n, k ∈ N, dn,k = [tn ][wk ]d(t, w).


Es fácil verificar que los arreglos de Riordan cumplen con las caracterı́sticas que nom-
bramos al comienzo de esta sección; en efecto se trata de matrices triangulares inferiores. La
propiedad algebraica más importante de los arreglos de Riordan yace en el hecho de que es
cerrado con respecto al producto usual de matrices:
3. ARREGLOS DE RIORDAN. 65

Proposición 5.12. El producto usual fila por columna de dos arreglos de Riordan es un
arreglo de Riordan.

Demostración. Sean (d(t), h(t)) = (dn,k )n,k∈N y (f (t), b(t)) = (fn,k )n,k∈N dos arreglos
de Riordan. La entrada n, k del producto de ambos arreglos es:

X
dn,j fj,k .
j=0

Note que estas entradas están bien definidas pues se tratan de sumas finitas. De la
Definición 5.11 obtenemos que:

X ∞
X
dn,j fj,k = [tn ]d(t)(th(t))j [y j ]f (y)(yb(y))k
j=0 j=0

X
n
= [t ]d(t) ([y j ]f (y)(yb(y))k )(th(t))j
j=0

= [tn ]d(t)f (th(t))(th(t)b(th(t)))k .

Es decir, la matriz producto tiene representación (d(t)f (th(t)), h(t)b(th(t))), lo que con-
cluye la demostración.


Con respecto a este producto, el arreglo I = (1, 1) representa la matriz identidad. En


álgebra lineal es bien conocida la propiedad de la inversa de matrices triangulares; sólo
poseen inversa aquellas cuyas entradas de la diagonal sean todas distintas de 0. En nuestro
caso sucederá algo similar, por lo que sólo consideraremos los arreglos de Riordan propios,
por ser quienes satisfacen la condición de la diagonal. Si definimos formalmente el producto
de arreglos de Riordan como:

(d(t), h(t)) ∗ (f (t), b(t)) = (d(t)f (th(t)), h(t)b(th(t))) (5.5)

entonces, para hallar la inversa de un arreglo de Riordan propio (d(t), h(t)) debemos resolver:

(d(t), h(t)) ∗ (f (t), b(t)) = (d(t)f (th(t)), h(t)b(th(t))) = (1, 1). (5.6)

De donde obtenemos que

f (y) = d−1 (t) y b(y) = h−1 (t),


3. ARREGLOS DE RIORDAN. 66

cuando t = yh−1 (t). Note que hallar a t en función de y es lo mismo que resolver el pro-
blema (P2), por lo que hemos obtenido la primera relación fundamental entre los arreglos de
Riordan y la Fórmula de Inversión de Lagrange. Además, recordando la teorı́a del Capı́tulo
3, aseguramos la unicidad de esta inversa. Usaremos la notación estándar:

f (y) = d−1 (t)|t = yh−1 (t) b(y) = h−1 (t)|t = yh−1 (t) .
   
y

Denotaremos a la inversa de un arreglo de Riordan propio (d(t), h(t)) = (dn,k )n,k∈N por
(d(t), h(t)) = (dn,k )n,k∈N . Para ser más precisos en cuanto al uso de la fórmula de inversión
en este tema, demostraremos el siguiente teorema:

Teorema 5.13. Sea (d(t), h(t)) cualquier arreglo de Riordan propio. Entonces las en-
tradas dn,k de la inversa (d(t), h(t)) vienen dadas por la fórmula:

yd0 (y)
 
1 n−k 1
dn,k = [y ] k − . (5.7)
n d(y) d(y)hn (y)

Demostración. Por la identidad (5.4) tenemos que:


 
n k d(t) n k d(t)
dn,k = [t ][w ] = [t ][w ] y = th(t) .
1 − wth(t) 1 − wy

Como h(y)h(yh(y)) = 1 y h(t)h(th(t)) = 1, obtenemos que y = th(t) si y sólo si t = yh(y).


Luego,
   
k n d(t) k n 1 −1
dn,k = [w ][t ] t = yh(y) = [w ][t ] y = th (y) .
1 − wy d(y)(1 − wy)

Estamos en condiciones de aplicar (FIG) a ésta última expresión, y ası́ obtenemos que:
 
k 1 n−1 ∂ 1
dn,k = [w ] [y ] h−n (y)
n ∂y d(y)(1 − wy)
∞ ∞
!
0
1 X d (y) X 1
= [wk ] [y n−1 ] wr+1 y r (r + 1) − wr y r n
n r=0
d(y) r=0 h (y)
yd0 (y)
 
1 n−k 1
= [y ] k − .
n d(y) d(y)hn (y)


3. ARREGLOS DE RIORDAN. 67

Ahora veremos que los arreglos de Riordan poseen toda la información del problema
(3.4), incluida aquella que obtenemos a partir de la ecuación (1.9) del Capı́tulo 1. Sea g(t)
una serie formal invertible; como ord g = 1 entonces (1, g(t)/t) es un arreglo de Riordan
propio. Por definición, las entradas de este arreglo son de la forma

dn,k = [tn ]g k (t).

Es decir, la columna k-ésima de este arreglo viene dada por los coeficientes de la potencia
g k (t). Si G(t) es la inversa de g(t), considerando el producto (5.5), es fácil verificar que la
inversa del arreglo (1, g(t)/t) es (1, G(t)/t). Por el Teorema 5.13, se tiene que las entradas
de este último arreglo son:
 n
k y
dn,k = [y ]G (y) = [y n−k ]
n k
.
n g(y)

Por las propiedades de los funcionales de coeficientes usadas a lo largo del Capı́tulo
3, podemos verificar que la ecuación anterior es equivalente a (FIG) cuando F (y) = y k y
M (y) = y/g(y).
En particular, los arreglos de Riordan con series generatrices d(t) y h(t) de coeficientes
enteros, se usan para resolver una gran cantidad de problemas combinatorios. Como se dijo
al comienzo de esta sección, los arreglos de Riordan generalizan en cierto modo al triángulo
de Pascal. De hecho, por las propiedades del combinatorio generalizado:
   k
n n 1 t
= [t ] ,
k 1−t 1−t

y por lo tanto, el triángulo de Pascal tiene representación


 
1 1
, .
1−t 1−t

Una propiedad sumamente relevante de los arreglos de Riordan que suele usarse para
trabajar en el ámbito combinatorio es el siguiente:

Proposición 5.14. Si (d(t), h(t)) es un arreglo de Riordan y f (t) es una serie formal
con coeficientes (fk )k∈N , entonces
n
X
dn,k fk = [tn ]d(t)f (th(t)). (5.8)
k=0
3. ARREGLOS DE RIORDAN. 68

Demostración. La prueba consiste en un cálculo sencillo mediante los funcionales de


coeficientes:
n
X ∞
X ∞
X
n k n
dn,k fk = [t ]d(t)(th(t)) fk = [t ]d(t) fk (th(t))k = [tn ]d(t)f (th(t)).
k=0 k=0 k=0

En términos de matrices, los coeficientes (gn )n∈N de la serie generatriz d(t)f (th(t)) vienen
dados por el producto:
    
d0,0 0 0 0 ··· f0 g0
    
 d
 1,0 d1,1 0 0 ···  
 f1  
  g1 
    
···  =
 d2,0 d2,1 d2,2 0  f2   g2 
  
    
 d3,0 d3,1 d3,2 d3,3
 ···  
 f3  
  g3 
.. .. .. .. .. .. ..
. . . . . . .

Cuando el arreglo de Riordan (d(t), h(t)) es propio, podemos invertir la relación anterior,
es decir, podemos encontrar una expresión similar para los coeficientes fn dependiendo de
los coeficientes gn :
n
X
fn = dn,k gk .
k=0

Lo interesante de estas relaciones es que aparecen prácticamente en cualquier aplicación


dentro del campo de la combinatoria, y es por ello que un extenso estudio se ha dedicado
a estas ecuaciones. Puede revisar [14] y [16] para varios ejemplos. En materia de cálculo,
los arreglos de Riordan propios son relativamente prácticos, pero en general, el cálculo de la
inversa puede resultar sumamente complicado. Para finalizar esta parte, veremos que (FIG)
puede generar de manera eficiente arreglos de Riordan propios ası́ como de sus inversas.
Usaremos especı́ficamente el Teorema 3.18, el cual ya sabemos es equivalente al Teorema
3.11. Usando las Proposiciones 3.6 y 3.7 podemos reescribir la ecuación (3.8) como:

1
Res F 0 (t)g −n (t) = Res F (t)g 0 (t)g −n−1 (t). (5.9)
n

De esta manera podemos demostrar el siguiente teorema:


3. ARREGLOS DE RIORDAN. 69

Teorema 5.15 (Construcción de pares de inversas). Sea f (t) una serie de potencia de
orden 0, y a(t), b(t) dos series de orden 1. Entonces,

αn,k = Res f (t)b0 (t)b−n−1 (t)ak (t)

βn,k = Res f −1 (t)a0 (t)a−n−1 (t)bk (t)

forman un par de arreglos mutuamente invertibles.

Demostración. Usando las propiedades de orden podemos verificar que en efecto los
arreglos (αn,k )n,k∈N y (βn,k )n,k∈N son invertibles. Verifiquemos que (αn,k )n,k∈N = (βn,k )n,k∈N .
Dado que ord g = 1 y ord h = 1 podemos aplicar el Teorema 3.18 y por lo tanto, la fórmula
(5.9) nos dice que:

X
f (t)ak (t) = αn,k bn (t),
n=0
k
cuando tomamos F (t) = f (t)a (t) y g(t) = b(t), y

X
f −1 (t)bk (t) = βn,k an (t),
n=0

cuando tomamos F (t) = f −1 (t)bk (t) y g(t) = a(t). En la primera de estas ecuaciones
multipliquemos por βk,m y sumando sobre k ∈ N obtenemos:

X
f (t) βk,m ak (t) = f (t)f −1 (t)bm (t) = bm (t).
k=0

Por otro lado,


∞ ∞ ∞ ∞
!
X X X X
f (t) βk,m ak (t) = βk,m f (t)ak (t) = αn,k βk,m bn (t).
k=0 k=0 n=0 k=0

Como podemos escribir:



X
bm (t) = δnm bn (t),
n=0
obtenemos que en efecto el arreglo (βn,k )n,k∈N es la inversa (a derecha) de (αn,k )n,k∈N . Para
obtener el cálculo a izquierda sólo debemos realizar el mismo análisis para la expresión en
serie de f −1 (t)bk (t).


En el Capı́tulo 6 mostraremos una aplicación de este teorema.


CAPÍTULO 6

Aplicaciones

Ha llegado el momento de dar varios ejemplos para mostrar la efectividad de la Fórmula


de Inversión de Lagrange. En su mayoria serán ejemplos combinatorios donde obtendremos
distintas interpretaciones para la ecuación (P2), pero veremos que varios de estos problemas
tendrán por igual una interpretación analı́tica o algebraica.
Ya en el Capı́tulo 1 mostramos cómo Lagrange utilizó (FIL) para dar la solución del
problema de Kepler (ecuación (1.10)). Podrá recordar que en el contexto histórico con el
que nos referimos a dicha solución resultó para la época sumamente interesante por establecer
un método distinto para trabajar con la teorı́a de Kepler, pero en realidad, la ecuación (1.10)
resultó poco eficiente debido a la dificultad de calcular los coeficientes requeridos. De por
sı́, las funciones trigonométricas parecen ser bastante resistentes cuando se trata de aplicar
(FIG) en una ecuación donde estén involucradas. Sin embargo, en las aplicaciones que
mostraremos a continuación veremos que la función exponencial y las funciones binomiales
se ajustan bastante bien para resolver una gran cantidad de problemas involucrados con la
ecuación (P2) y son especialmente llevaderas con la Fórmula de Inversión de Lagrange.

Aplicación 6.1 (Una inversa simple). Consideremos la función compleja g(z) = ze−az ,
con a ∈ C. Es fácil verificar que esta función satisface las hipótesis del desarrollo analı́tico
del Capı́tulo 5, por lo que podemos hallar su inversa G(y) en un entorno de 0. Además,
G(y) = yM (G(y)), donde M (z) = eaz . Por la ecuación (FIG), tomando F (z) = z, obtenemos
que para n > 0,
1 n−1 n 1 (an)n−1
[z n ]G(z) = [z ]M (z) = [z n−1 ]eanz = .
n n n!
Es decir,

X (an)n−1
G(y) = yn,
n=1
n!
y usando las herramientas vistas en las materias de cálculo, tenemos que el entorno de 0
para el cual esto se satisface es el abierto |y| < 1/|a|e, si a 6= 0.

70
6. APLICACIONES 71

Aplicación 6.2 (Raı́z de un polinomio). Una de las tareas más difı́ciles y usuales a las
que se enfrenta un estudiante de matemática es hallar las raı́ces de un polinomio, y a veces,
hallar tan sólo una raı́z resulta imposible con los pocos métodos que se conocen. En reducidos
casos podemos utilizar procedimientos o algoritmos sencillos para resolver este problema,
como el método de Ruffini o las soluciones algebraicas que se conocen para polinomios de
grado 2,3 y 4. Pero casi siempre estos métodos se tornan engorrosos e ineficientes. Sólo para
polinomios de grado 2 conocemos una fórmula que en todo momento es accesible, y esta
es conocida como la resolvente: si tenemos una ecuación cuadrática ax2 + bx + c = 0 con
coeficientes reales, sus raı́ces vienen dadas por

−b ± b2 − 4ac
x= .
2a
Para polinomios de grado 3 se utiliza la Fórmula de Cardano: si tenemos una ecuación
cúbica x3 + px2 + qx + r = 0 con coeficientes reales, realicemos el cambio x = y − p3 , para
obtener la forma normal
y 3 + ay + b = 0,

donde
1
a = (3q − p2 ),
3
1
b = (2p3 − 9pq + 27r).
27
Gerolamo Cardano publicó una de las tres soluciones de la forma normal en 1545:
s r s r
3 b b 2 a 3 3 b b 2 a3
y0 = − + + + − − + .
2 4 27 2 4 27
Dado que en aquella época, la teorı́a de números complejos aún no se desarrollaba,
Cardano solamente consideró el caso
b 2 a3
+ ≥ 0.
4 27
Sin embargo, no importa qué peculiaridad se considere sobre los coeficientes de alguna
ecuación cúbica, la fórmula de Cardano no deja de ser complicada. Las ecuaciones de grado 4
se pueden resolver con un método similar al propuesto por Cardano pero la solución no será
más atractiva como podrá ver en [15]. Para polinomios de mayor grado, Niels Abel publicó
en 1824 una demostración donde se asegura que no se puede hallar una solución de las raı́ces
6. APLICACIONES 72

de ningún polinomio de grado mayor o igual que 5 mediante una expresión cerrada. Para
este tipo de problemas se utilizan otros recursos, en su mayorı́a procesos iterativos, como el
Método de Newton. Nosotros usaremos la ecuación (FIG) para hallar una solución de ciertos
polinomios: consideremos la ecuación

xm+1 + ax − c = 0,

o lo que es igual
c = x(xm + a),

con m un entero par positivo, a y c reales y a 6= 0. Llamemos y = g(x) = x(xm + a) y


consideremos su inversa G(y), entonces

G(y) = yM (G(y)),

donde M (x) = (xm + a)−1 . Como g(x) satisface las hipótesis de la demostración analı́tica
del Capı́tulo 5, tenemos que [y 0 ]G(y) = 0 y para n ≥ 0:
1 n−1 n 1 1
[y n ]G(y) = [y ]M (y) = [y n−1 ] m .
n n (y + a)n
Para poder escribir M n (y) como una expansión binomial debemos dar la condición extra
|y|m < |a|. De esta manera obtenemos que
∞    m r
n 1 n−1 X r + n − 1 −y
[y ]G(y) = n [y ] .
a n r=0
r a

Si n 6= mk + 1, con k ≥ 0, entonces [y n ]G(y) = 0. Si n = mk + 1, con k ≥ 0, entonces


(−1)k
 
mk+1 k + mk 1
[y ]G(y) = k+mk+1
.
k (mk + 1) a
Ahora, cualquier ecuación xm+1 + ax − c = 0, con |c|m ≤ |a|, tiene raı́z:
∞ 
(−1)k cmk+1

X k + mk
x= k+mk+1
.
k=0
k (mk + 1) a

Si tomamos m = 2, obtenemos la forma normal estudiada por Cardano. Nuestra solución


en este caso viene dada por:
∞ 
3k (−1)k c2k+1
X 
x= 3k+1
. (6.1)
k=0
k 2k + 1 a

No es nuestro propósito establecer criterios de convergencia más allá del que se propuso
para el término c, pero para valores c < 1 y a > 1 se deben obtener muy buenos resultados.
6. APLICACIONES 73

Por ejemplo, para el caso (a, c, m) = (2, 21 , 2), y considerando solamente los primeros 10
términos de la serie (6.1) nos queda x ≈ 0.2428397323, la cual podrá ver que resulta ser una
muy buena aproximación si gusta verificarlo. El hecho de tomar m como un número par en
nada afecta los cálculos realizados, podemos obtener lo mismo si lo consideramos impar. La
razón de tomarlo de esa manera es simplemente para garantizar que el valor c que escojamos
siempre será imagen de la función g(x).

Aplicación 6.3 (Identidad de Abel). Siguiendo el desarrollo algebraico del Capı́tulo 3,


consideremos en el Teorema 3.11 los casos particulares F (z) = exz y M (z) = eaz . Si G(z) es
la serie tal que G(z) = zM (G(z)), entonces los coeficientes de (F ◦ G)(z) son: para m > 0
1 m−1 0
cm = [z ]F (z)M m (z)
m
1
= [z m−1 ]xexz eamz
m
x
= [z m−1 ]e(x+am)z
m

x m−1 X (x + am)r r
= [z ] z
m r=0
r!
x(x + am)m−1
= .
m!
Para el caso m = 0 note que:
x(x + a0)0−1
c0 = [z 0 ]F (z) = 1 = .
0!
Si llamamos g(z) = ze−az , por el Teorema 3.18 tenemos que

xz
X x(x + am)m−1 −amz m
e = e z .
m=0
m!

Multipliquemos a ambos lados de la ecuación anterior por eyz , y ası́, por el producto de
Cauchy definido en el Capı́tulo 3 obtenemos que:
∞ ∞ n
!
X x(x + am)m−1 y−amz m X X x(x + ak)k−1 (y − ak)n−k
e(x+y)z = e z = zn.
m=0
m! n=0 k=0
k! (n − k)!

Expandiendo f (z) = e(x+y)z como serie de Taylor obtenemos finalmente que:


n  
(x + y)n X n
= (x + ak)k−1 (y − ak)n−k ,
x k=0
k
6. APLICACIONES 74

la cual es la bien conocida identidad de Abel, y que fue demostrada originalmente en 1826 por
Niels Hendrik Abel. En [17] podrá encontrar una gran variedad de problemas combinatorios
relacionados con esta ecuación.

Aplicación 6.4 (Serie formal del Logaritmo). En el Capı́tulo 4 dimos la serie generatriz
exponencial de la especie de permutaciones cı́clicas C:
 
1
C(z) = log .
1−z

Esta relación la obtenemos al recordar la serie de Taylor de la función logaritmo que


usamos en las materias de cálculo. Sin embargo, al hablar de la serie formal del logaritmo
debemos tener en cuenta ciertas consideraciones. Niven en [13] define el logaritmo formal
sobre el conjunto P1 ⊂ C[z], que se compone de series f (z) tales que [z 0 ]f (z) = 1. De esta
manera, definimos el logaritmo de la serie f (z) como:


X (−1)n+1
1 2 1 3 1 4
log f (z) = log(1 + h(z)) = h(z) − h (z) + h (z) − h (z) + · · · = hn (z),
2 3 4 n=1
n

donde h(z) es una serie formal tal que [z 0 ]h(z) = 0 y f (z) = 1 + h(z). Las propiedades
básicas del logaritmo se satisfacen, incluyendo la conocida relación con la derivada:

D log f (z) = f −1 (z)Df (z).

El logaritmo se comporta muy bien cuando componemos de cierta manera con la solución
del problema (P2). Supongamos que g(z) es una serie invertible tal que [z 1 ]g(z) = 1. En-
tonces, por la definición de logaritmo podemos definir la serie
 
z
F (z) = log .
g(z)

Sea G(z) = g(z), veremos que los coeficientes de la serie F (G(z)) los podemos hallar
fácilmente mediante la fórmula de inversión. Note que esta composición está bien definida
ya que por la Proposición 3.9 tenemos que [z 1 ]G(z) = 1. Sea la serie M (z) de orden 0 tal
que G(z) = zM (G(z)), por las ecuaciones (FIG) los coeficientes de la serie F (G(z)) son:

c0 = [z 0 ]F (z) = 0,
6. APLICACIONES 75

y para n ≥ 1
 
n G(z)
ncn = n[z ] log
z
 
n−1 n z
= [z ]M (z)D log
g(z)
1 g 0 (z)
 
n−1 n
= [z ]M (z) − .
z g(z)

Como se satisface la igualdad M (z) = zg −1 (z), entonces


n 
1 g 0 (z)
 
n−1 z
ncn = [z ] −
g(z) z g(z)
 n
z 1
= [z n ] + Res Dg −n (z)
g(z) n
 n
z
= [z n ]
g(z)
= [z n ]M n (z).

Haremos una rápida verificación de este resultado. En la sección 2 del Capı́tulo 5, ob-
tuvimos a partir de un método iterativo que la solución del problema G(z) = zM (G(z))
cuando M (z) = 1 + z es la serie G(z) = z(1 − z)−1 . Entonces, para n ≥ 1, tenemos que
 
n 1 1 1 (n − 1)!
[z ] log = [z n ](1 + z)n = = ,
1−z n n n!

siendo justamente (n − 1)! los cardinales de la especie C, por lo que su serie generatriz
exponencial en efecto es la mostrada.
Veremos nuevamente a la serie formal del logaritmo en las próximas aplicaciones. No
serán completamente necesarias las ecuaciones obtenidas de los términos cn por lo simple
que resultará trabajar con las series escogidas, pero los ejemplos siguientes podrı́an verificarse
nuevamente con esta aplicación.

Aplicación 6.5 (Expansión Binomial). Aprovecharemos la fórmula de inversión para


hallar una expresión más sencilla de los números sn , definidos como la suma de los n primeros
términos de la expansión binomial
 −n X ∞  
1 1 r+n−1
1− = .
2 r=0
2r r
6. APLICACIONES 76

Para ello consideremos las series de


 −1
1
M (z) = 1 − z y F 0 (z) = (1 − z)−1 .
2

Por el producto de Cauchy obtenemos que


∞ m  !
X X 1 r+n−1
(F 0 · M n )(z) = r
zm,
m=0 r=0
2 r

de donde sn = [z n−1 ](F 0 ·M n )(z). Como ord M = 0, entonces podemos definir una serie G(z)
tal que G(z) = zM (G(z)). Podemos verificar fácilmente que en este caso G(z) satisface

1
(G(z) − 1)2 − 1 ,

z=−
2

la cual tiene como solución G(z) = 1 − 1 − 2z. Además, F (z) = − log(1 − z). Por las
ecuaciones (FIG) del Teorema 3.11 tenemos que:

sn = n[z n ](F ◦ G)(z)



= n[z n ](− log( 1 − 2z))
n
= − [z n ] log(1 − 2z)
2
= 2n−1 ,

la cual es una expresión mucho más atractiva.

Aplicación 6.6 (Otra expresión sencilla). Para este ejemplo consideremos las series
formales de F (z) = log(1 + z) y M (z) = (1 + z)2 (2 + z)−1 . Dado que ord M = 0 podemos
hallar una serie G(z) tal que G(z) = zM (G(z)), y podemos verificar fácilmente que

G(z) = (1 − z)−1/2 − 1.

Tenemos que para n ≥ 1:

n 1
n[z n ]F (G(z)) = − [z n ] log(1 − z) = ,
2 2

ya que el coeficiente n-ésimo de log(1 − z) es −n−1 . Además, por el Teorema 3.11,

n[z n ]F (G(z)) = [z n−1 ]F 0 (z)M n (z) = [z n−1 ](1 + z)2n−1 (2 + z)−n .


6. APLICACIONES 77

Considerando las expanciones binomiales de ambas series y el producto de Cauchy, lle-


gamos a que
n−1
1 X (−1)n−1−i 2n − 1 2(n − 1) − i
  
1
= n .
2 2 i=0 2n−1−i i n−1
Reescribiendo la ecuación anterior y realizando la sustitución n + 1 por n obtenemos que:
n   
n
X
n−i i 2n + 1 2n − i
4 = (−1) 2 , (6.2)
i=0
i n

cuando n ≥ 0. Podemos dotar a la ecuación (6.2) de una interpretación combinatoria usando


los Principios de Adición, Multiplicación, y de Inclusión-Exclusión, por lo que lo dirigimos
al libro [2].

Aplicación 6.7 (Conteo de árboles - Resultado de Cayley). En el Capı́tulo 4 ya hablamos


del problema del conteo de árboles que Cayley resolvió. Daremos una demostración de dicho
problema mediante especies combinatorias. Recordemos que para una especie R, con R0 6= 0,
la especie AR de árboles con raı́z R-enriquecidos, satisface el isomorfismo

AR ' X · R(AR ).

Para la especie uniforme R = U , obtenemos una relación para los árboles con raı́z,
correspondiente al Ejemplo 4.7. Para n ≥ 1, los cardinales An se calculan de la siguiente
manera:
n
An = Un−1 = (n − 1)![z n−1 ]U n (z).

Sabemos además que U (z) = ez , de donde la solución es exactamente la misma que en


la Aplicación 6.1:
An = nn−1 .

Este resultado nos permite obtener los cardinales an . La aplicación apuntamiento nos
dice que a• ' A. De esta relación, para n ≥ 1 se cumple

a•n = nan = An = nn−1 ,

de donde obtenemos el famoso resultado an = nn−2 , debido a Cayley.

Aplicación 6.8 (Números de Catalán). Para hallar los números de Catalán podemos
escoger de entre una gran variedad de problemas combinatorios, aparentemente distintos,
donde esta sucesión de números aparece. Nosotros escogemos el problema de contar caminos
6. APLICACIONES 78

crecientes por debajo de la diagonal principal. Aquı́, dado n ∈ N, un camino de (0, 0) (punto
de partida) a (n, n) (punto de llegada) se compone de “pasos” de tamaño 1 hacia la derecha
y hacia arriba. Por ejemplo, sobre [5], el siguiente gráfico representa un camino creciente:

Llamaremos diagonal principal al segmento que una a (0, 0) y (n, n), y denotamos por
cn la cantidad de caminos crecientes que no pasan la diagonal. Por convención, c0 = 1. Es
fácil ver que c1 = 1 y c2 = 2. Para n = 3, tenemos que todos los caminos crecientes de (0, 0)
a (3, 3) que no pasan la diagonal principal son:

a b c d e
Es decir, c3 = 5. Es bien sabido que los pocos términos que siguen son: 14, 42, 132,
429,... Hallaremos una relación de recurrencia para estos números. Consideremos los caminos
obtenidos para n = 3. Note que podemos hallar todos los caminos necesarios mediante alguno
de los siguientes casos:

(1) (2) (3)

Es decir, hallar un camino para n = 3 es lo mismo que hallar un camino que no pase la
diagonal para los cuadrados más pequeños de la figura anterior y completar con lo de afuera
de la única manera posible, o en otras palabras, podemos obtener los caminos a y b con la
figura (1), los caminos c y d con la figura (2) y, por último, obtener el camino e con la figura
(3). Note además que estos tres casos son disjuntos y generan todos los caminos deseados
para n = 3 y por el Principio de Multiplicación (vea [2]) tenemos que cada uno de estos
casos vienen identificados por los términos c0 c2 , c2 c0 y c1 c1 , respectivamente. Ahora, por el
Principio de Adición:
c3 = c2 c0 + c1 c1 + c0 c2 .
6. APLICACIONES 79

De manera muy similar, podemos ver que para n = 4 los casos a estudiar vienen dados
por:

Es decir, c4 = c3 c0 + c2 c1 + c1 c2 + c0 c3 . Para cualquier n ≥ 1 se realiza un análisis similar,


y ası́ obtenemos la recurrencia
n−1
X
cn = ck cn−1−k . (6.3)
k=0

Consideremos la serie C(z) cuyos coeficientes vienen dados por la sucesión de términos
cn . Por la recurrencia (6.3) y recordando la definición de producto de series, tenemos que
para n ≥ 1:
n−1
X
[z n ]C(z) = cn = ck cn−1−k = [z n−1 ](C · C)(z) = [z n ]zC 2 (z).
k=0

Es decir, esta serie satisface la ecuación implı́cita

C(z) = 1 + zC 2 (z). (6.4)

Si resolvemos la ecuación cuadrática anterior, nos queda:



1 − 1 − 4z
C(z) = .
2z
Para trabajar con lo desarrollado en los Capı́tulos 3 y 4, realicemos el cambio C(z) =
G(z) + 1, donde ord G = 1. Entonces, la ecuación (6.4) se reduce a resolver:

G(z) = zM (G(z)),

donde M (z) = (z + 1)2 . Por el Teorema 3.11, considerando la serie F (z) = z, tenemos que
 
n 1 n−1 n 1 n−1 2n 1 2n
[z ]G(z) = [z ]M (z) = [z ](z + 1) = .
n n n n−1
Es decir, la solución del problema de los caminos por debajo de la diagonal es:
∞ ∞  
X
n
X 1 2n
C(z) = 1 + cn z = 1 + zn.
n=1 n=1
n n − 1
6. APLICACIONES 80

Estos cardinales cn , son mejor conocidos como los números de Catalán. Esta aplicación
resulta interesante porque el resultado obtenido a partir de la fórmula de inversión genera
una mayor cantidad de información que la solución mediante la ecuación cuadrática.

Aplicación 6.9 (Árboles con orden). Los números de Catalán aparecen nuevamente en
el conteo de árboles con orden. Recordando la Definición 4.26 introducimos estas estructuras
como los árboles con raı́z donde cada fibra posee una estructura de orden lineal, y usamos la
notación establecida para estas especies: AL . La Figura 6.1 ilustra este tipo de estructuras.

4 11
1

5
7 10 6

8
3 2

Figura 6.1. Estructura de árbol con orden sobre [11].

Estamos interesados en el conteo de estas estructuras para cada conjunto [n], con n ≥ 1.
Llamando A(z) la serie generatriz de la especie AL , tenemos nuevamente que para resolver
este problema combinatorio basta examinar la ecuación implı́cita:

z
A(z) = zL(A(z)) = .
1 − A(z)

Luego, por el Teorema 4.27, para todo n ≥ 1:

An = Lnn−1 = (n − 1)![z n−1 ]Ln (z).

Aparece nuevamente la expansión binomial de (1 − z)−n . De esta manera obtenemos que:

(2(n − 1))!
An = = n!cn−1 ,
(n − 1)!

siendo cn los números de Catalán definidos en la aplicación anterior.


6. APLICACIONES 81

Aplicación 6.10 (Inversión binomial). A continuación, mostraremos una aplicación


clásica del Teorema 5.15 y obtendremos una propiedad conocida del combinatorio. Nos
gustarı́a encontrar la inversa de un arreglo con entradas αn,k = n+p

k+p
, donde p ∈ N es un
parametro adicional. Por un simple cálculo podemos ver que las siguientes igualdades en
efecto son válidas:
   
n+p n+p
αn,k = = = Res(1 + z)n+p z −n+k−1 .
k+p n−k
Tomando las funciones, a(z) = z, b(z) = (1 + z)−1 z y f (z) = (1 + z)p+1 , por la igualdad
anterior tenemos que los coeficientes αn,k tienen la forma:

αn,k = Res f (t)b0 (t)b−n−1 (t)ak (t),

y por lo tanto, el Teorema 5.15 nos dice que podemos construir la inversa de este arreglo y
sus entradas βn,k son de la forma:

βn,k = Res f −1 (t)a0 (t)a−n−1 (t)bk (t).

De esta manera,
z −n+k−1
βn,k = Res
(1 + z)p+k+1
∞  
r r+p+k
X
= Res (−1) z r−n+k−1
r=0
r
 
n−k n + p
= (−1)
n−k
 
n−k n + p
= (−1) .
k+p
Cuando tomamos el caso particular p = 0 obtenemos la conocida propiedad:
n   
m−k n m
X
(−1) = δnm ,
m=0
m k
que es probablemente una de las relaciones de inversa más famosas.
Bibliografı́a

[1] F. Bergeron, G. Labelle, P. Leroux, Théorie de espèces et combinatoire des structures arbores-
centes: LACIM, 19 (1994). 39
[2] R. Brualdi, Introductory Combinatorics: Pearson Education, Inc. (1999). 77, 78
[3] A. Cauchy, Mémoire sur divers points d’analyse: Académie Royale des Sciences, 8 (1829), 97-129. 13
[4] R. Churchill, J. Brown, R. Verhey, Complex variables and applications: McGraw-Hill Book
Company (1976). 58
[5] P. Colwell, Solving Kepler’s problem over three centuries: Willman-Bell (1993). 7, 13
[6] R.E. Greene, Function theory of one complex variable: American Mathematical Society, 40 (2000).
14
[7] T.W. Hungerford, Algebra: Editorial Board (1974). 33
[8] A. Joyal, Une théorie combinatoire des séries formelles: Advances in Mathematics, 42 (1981), 1-82. 32
[9] R. Kress, Numerical Analysis: Springer, First Edition (1998). 61
[10] G. Labelle, Une nouvelle démonstration combinatoire des formules d’inversion de Lagrange: Advances
in Mathematics, 42 (1981), 217-247. 2
[11] J.L. Lagrange, Nouvelle méthode pour résoudre les équations littérales par le moyen des séries:
Histoire de l’Académie Royale des Sciences et des Belles-Lettres de Berlin (1770). 3, 8
[12] J.L. Lagrange, Sur le problème de Kepler: Histoire de l’Académie Royale des Sciences et des Belles-
Lettres de Berlin (1771). 11
[13] I. Niven, Formal power series: American Mathematical Monthly, 76 (1969), 871-889. 22, 74
[14] J. Riordan, Combinatorial identities: Krieger Publishing Company (1979). 68
[15] M.R. Spiegel, S. Lipschutz, J. Liu, Mathematical handbook of formulas and tables: McGraw-Hill,
Schaum’s Outline Series, Third Edition (2008). 71
[16] R. Sprugnoli, Riordan arrays and combinatorial sums: Discrete Math., 132 (1994), 267-290. 68
[17] V. Strehl, Identities of Rothe-Abel- Schläfli-Hurwitz-type: Discrete Math., 99 (1992), 321-340. 74
[18] E.T. Whittaker, G.N. Watson, A course of modern analysis: Cambridge University Press, Fourth
Edition (1927). 15

82

También podría gustarte