CÁLCULO DIFERENCIAL E INTEGRAL - Javier Pérez González
CÁLCULO DIFERENCIAL E INTEGRAL - Javier Pérez González
CÁLCULO DIFERENCIAL E INTEGRAL - Javier Pérez González
Universidad de Granada
Asignatura: Cálculo
Curso: Primero
Titulación: Ingeniero de Telecomunicación
septiembre 2006
Índice general
1.2. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.3. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.2. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
I
Índice general II
3.4. Ejerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
4. Continuidad 38
4.3. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
5. Sucesiones 45
5.3. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
6.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
7. Derivadas 69
7.4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
9. Series 149
Introducción
3. Escribe con palabras lo que afirma la igualdad (−x)y = −xy. ¿Sabes probarla?
Supongo que hace ya tanto tiempo que conoces estas propiedades de los números que has
olvidado cuándo las aprendiste. ¡Y ahora te piden que las demuestres! Puedo imaginar tu reac-
ción ¿que demuestre que 0 x = 0?, ¡pero si eso es evidente! ¡siempre me han dicho que es así!
¿cómo se puede demostrar tal cosa?.
Pienso que muchas veces la dificultad de un ejercicio está en que no sabes qué es exacta-
mente lo que se te pide que hagas; no te dan un marco claro de referencia. En estas situaciones
lo más frecuente es “quedarse colgado” con la mente en blanco sin saber qué hacer. Para evitar
ese peligro, en este curso vamos a dar un marco de referencia muy claro que va a consistir en
unas propiedades de los números (axiomas, si quieres llamarlas así) que vamos a aceptar como
punto de partida para nuestro estudio. Esas propiedades, junto con las reglas de inferencia lógi-
ca usuales y con definiciones apropiadas nos permitirán demostrar resultados (teoremas) que
podremos usar para seguir avanzando. Simplificando un poco, puede decirse que en matemá-
ticas no hay nada más que axiomas y teoremas (bueno, también hay conjeturas, proposiciones
1
Números reales. Propiedades algebraicas y de orden 2
Es conveniente recordar las propiedades de los números reales porque son ellas las que
nos permiten trabajar con desigualdades. Es muy fácil equivocarse al trabajar con desigualda-
des. Yo creo que en el bachillerato no se le da a este tema la importancia que merece. Fíjate
que algunos de los conceptos más importantes del Cálculo se definen mediante desigualdades
(por ejemplo, la definición de sucesión convergente o de límite de una función en un punto).
Por ello, tan importante como saber realizar cálculos más o menos complicados, es aprender
a manejar correctamente desigualdades, y la única manera de hacerlo es con la práctica me-
diante numerosos ejemplos concretos. Por supuesto, siempre deben respetarse cuidadosamente
las reglas generales que gobiernan las desigualdades entre números y asegurarse de que se usan
correctamente. Aparte de tales reglas no hay otros métodos generales que nos digan cómo te-
nemos que proceder en cada caso particular.
Los números racionales que son cocientes de la forma p/q donde p ∈ Z, q ∈ N, cuyo conjunto
representamos por Q.
√
También conocéis otros números como 2, π, o el número e que no son números racionales
y que se llaman, con una expresión no demasiado afortunada, "números irracionales". Pues
bien, el conjunto formado por todos los números racionales e irracionales se llama conjunto
de los números reales y se representa por R.
Es claro que N ⊂ Z ⊂ Q ⊂ R.
Aunque los números que no son racionales pueden parecer un poco raros, no merece la pena, al
menos por ahora, preocuparse por cómo son estos números; sino que lo realmente interesante
√
es aprender a trabajar con ellos. Lo interesante del número 2 es que su cuadrado es igual a 2.
Pues bien, una de las cosas más llamativas de los números es que a partir de un pequeño grupo
de propiedades pueden deducirse casi todas las demás. Vamos a destacar estas propiedades
básicas que, naturalmente, hacen referencia a las dos operaciones fundamentales que se pue-
den hacer con los números: la suma y el producto. La suma de dos números reales x, y se escribe
x + y, representándose el producto por xy. Las propiedades básicas a que nos referimos son las
siguientes.
P4 [Elementos opuesto e inverso] Para cada número real x hay un número real llamado opues-
to de x, que representamos por −x, tal que x + (−x) = 0.
Para cada número real x distinto de 0, x , 0, hay un número real llamado inverso de x, que
representamos por x−1 , tal que xx−1 = 1.
Las propiedades anteriores son de tipo algebraico y, aunque son muy sencillas, a partir de ellas
pueden probarse cosas tan familiares como que 0x = 0, o que (−x)y = −(xy).
Pero los números tienen, además de las propiedades algebraicas, otras propiedades que
suelen llamarse propiedades de orden. Como todos sabemos, los números suelen representarse
como puntos de una recta en la que se fija un origen, el 0, de forma arbitraria. Los números que
hay a la derecha de 0, se llaman positivos y el conjunto de todos ellos se representa por R+ . Las
propiedades básicas del orden son las siguientes.
P6 [Ley de tricotomía] Para cada número real x se verifica que o bien es x = 0, o bien x es posi-
tivo, o bien su opuesto −x es positivo.
Para x, y ∈ R escribimos x < y (léase x es menor que y) o y > x (léase y es mayor que x) para indicar
que y − x ∈ R+ , y escribimos x 6 y o y > x para indicar que y − x ∈ R+ ∪ {0}. En adelante usaremos
las notaciones: R+o = R+ ∪ {0}, R−o = R− ∪ {0} y R∗ = R\ {0}. Nótese que si x∈R entonces −x∈R+ .
1.1 Teorema (Reglas para trabajar con desigualdades). Sean x, y, z números reales.
1. x 6 y e y 6 z implican que x 6 z.
2. x 6 y e y 6 x implican que x = y.
7. xy > 0 si, y sólo si, x e y son los dos positivos o los dos negativos. En consecuencia si x , 0 es
x 2 > 0 y, en particular, 1 > 0.
1
8. z > 0 implica que > 0.
z
9. Supuesto que x e y son los dos positivos o los dos negativos, se verifica que x < y implica que
1 1
< .
y x
Valor absoluto
Dados a, b ∈ R+o para probar que a = b es suficiente probar que a 2 = b 2 y para probar que
a < b es suficiente probar que a 2 < b 2 .
1. |x y| = |x||y|;
2. |x| 6 y es equivalente a −y 6 x 6 y;
1.2. Ejercicios
1. Sabiendo que a + b > c + d, a > b, c > d; ¿se verifica necesariamente alguna de las des-
igualdades: a > c, a > d, b > c o b > d ? Dar una prueba o un contraejemplo en cada caso.
s u x s s+u+x x
5. Dado que < < donde t, v, y ∈ R+ , prueba que < < . Generaliza este resul-
t v y t t +v+y y
tado.
6. Prueba cada una de las siguientes desigualdades y estudia, en cada caso, cuándo se da la
igualdad.
i) 2x y 6 x 2 + y 2 .
ii) 4x y 6 (x + y)2 .
iii) x 2 + x y + y 2 > 0.
El Principio de inducción matemática es un método que se usa para probar que ciertas pro-
piedades matemáticas se verifican para todo número natural. Considera, por ejemplo, la si-
guiente igualdad en la que n ∈ N:
1
12 + 22 + 32 + · · · + n2 = n(n + 1)(2n + 1)
6
Si le damos a n un valor, por ejemplo n = 2, podemos comprobar fácilmente que la igualdad
correspondiente es cierta. Si le damos a n el valor 1000 ya no es tan fácil comprobar esa igual-
dad y se le damos a n el valor 101000 la cosa ya se pone realmente difícil. Pero nosotros queremos
aún más, no nos conformamos con probar que esa igualdad es cierta para unos cuantos miles
o millones de valores de n; no, queremos probar que es válida para todo número natural n. En
estos casos es el Principio de inducción matemática el que viene en nuestra ayuda para salvar-
nos del apuro. Para nosotros el principio de inducción matemática es algo que aceptamos, es
decir, puedes considerarlo como un axioma de la teoría que estamos desarrollando (aunque su
formulación lo hace “casi evidente”).
i) 1 ∈ A
Entonces A = N.
El Principio de Inducción Matemática es la herramienta básica para probar que una cierta pro-
piedad P(n) es verificada por todos los números naturales. Para ello se procede de la siguiente
forma:
A) Comprobamos que el número 1 satisface la propiedad, esto es, que P(1) es cierta.
Nótese que en B) no se dice que se tenga que probar que P(n) es cierta, sino que hay que de-
mostrar la implicación lógica P(n) =⇒ P(n + 1).
1.3 Ejemplo. Para cada número natural n, sea P(n) la proposición si el producto de n números
positivos es igual a 1, entonces su suma es mayor o igual que n.
Demostraremos por inducción que P(n) es verdadera para todo n ∈ N. Trivialmente P(1) es
verdadera. Supongamos que P(n) es verdadera. Consideremos n+1 números positivos no todos
iguales a 1 cuyo producto sea igual a 1. En tal caso alguno de dichos números, llamémosle x1 ,
tiene que ser menor que 1 y otro, al que llamaremos x2 , tiene que ser mayor que 1. Notando
x3 , · · · , xn+1 los restantes números se tiene que:
es decir, x1 x2 , x3 , · · · , xn+1 son n números positivos con producto igual a 1 por lo que:
x1 + x2 > 1 + x1 x2 (2)
1.4 Teorema (Desigualdad de las medias). Cualesquiera sean los números positivos a1 , a2 , · · · , an
se verifica que: q
n a1 + a2 + · · · + an
a1 a2 · · · an 6
n
y la igualdad se da si, y sólo si, a1 = a2 = · · · = an .
q
n ai
Demostración. Basta poner G = a1 a2 · · · an y xi = , 1 6 i 6 n, con lo cual x1 x2 · · · xn = 1 por lo
G
n
X n
X
que xi > n es decir ai > nG y se da la igualdad solamente cuando xi = 1, para i = 1, 2, . . . , n;
i=1 i=1
es decir, cuando a1 = a2 = · · · = an .
Probaremos a continuación una útil igualdad algebraica conocida como fórmula del binomio
de Newton.
Para establecer esta igualdad necesitamos definir los llamados coeficientes binómicos. Dados
dos números enteros n > k > 0 se define:
n
Y
n n!
= donde n! = p
k k!(n − k)!
p=1
Es decir, n! es el producto de todos los números naturales menores o iguales que n. Se define
también 0! = 1. La igualdad
n n n+1
+ = (1 6 k 6 n) (1.1)
k−1 k k
1.5 Teorema (Fórmula del binomio de Newton). Cualesquiera sean los números reales a, b y el
número natural n se verifica que:
n
X
n n n−k k
(a + b) = a b .
k
k=0
Lo que prueba la validez de la igualdad para n + 1. En virtud del principio de inducción, con-
cluimos que la igualdad del enunciado es cierta para todo n ∈ N.
Con eso te indico que hay que ser precavido: no basta comprobar la veracidad de una ex-
presión para unos cuantos valores de n para concluir que dicha expresión es cierta para todo n.
La historia de las matemáticas está llena de este tipo de errores.
1.4. Ejercicios
2. Demuestra que cualquier conjunto de número naturales, con un número finito de ele-
mentos, contiene un número natural máximo.
2 + 4 + 6 + · · ·+ 2n = n2 + n + 2
cumple con el segundo paso del principio de inducción matemática. Esto es, si la fórmula
es verdadera para n, también lo es para n + 1. Sin embargo, esta fórmula no es válida para
n = 1. ¿Qué deduces de esto?
4. Teorema del mapa de dos colores: si se traza en una hoja de papel líneas rectas que em-
piezan y terminan en un borde de la hoja, este mapa puede ser coloreado con sólo dos
colores sin que ninguna región adyacente tenga el mismo color.
nq
9. Sea q ∈ N y a > 0. Prueba que el número es muy pequeño si n es muy grande.
(1 + a) n
10. Prueba que entre todos los rectángulos de perímetro dado el de mayor área es el cuadrado.
Introducción
En esta lección vamos a estudiar con algún detalle un concepto teórico importante que es el
de continuidad. En este curso se supone que ya tienes un conocimiento intuitivo de las funcio-
nes elementales (exponencial, logaritmo natural, trigonométricas), no obstante, si yo doy por
sabido algo que tú desconoces harás muy bien en preguntar y yo haré lo posible por despejar
tus dudas.
Las funciones son las herramientas principales para la descripción matemática de una situa-
ción real. Todas las fórmulas de la Física no son más que funciones: expresan cómo ciertas
magnitudes (por ejemplo el volumen de un gas) dependen de otras (la temperatura y la pre-
sión). El concepto de función es tan importante que muchas ramas de la matemática moderna
se caracterizan por el tipo de funciones que estudian. No es de extrañar, por ello, que el con-
cepto de función sea de una gran generalidad. Además, se trata de uno de esos conceptos cuyo
contenido esencial es fácil de comprender pero difícil de formalizar.
La idea básica de función es la siguiente. Supongamos que tenemos dos conjuntos A y B; una
función de A en B es una regla que a cada elemento de A asocia un único elemento de B.
10
Funciones reales 11
Las funciones se representan por letras. En la práctica las letras más usadas son f , g y h, pero
cualquiera otra es también buena. Si f es una función y x es un número que está en su dominio,
se representa por f (x) (léase “ f de x”) el número que f asigna a x, que se llama imagen de x por
f . Es muy importante en este curso distinguir entre f (una función) y f (x) (un número real).
Es importante advertir que las propiedades de una función depende de la regla que la define
y también de su dominio, por ello dos funciones que tienen distintos dominios se consideran
distintas funciones aunque la regla que las defina sea la misma.
Dos funciones f y g son iguales cuando tienen igual dominio y f (x) = g(x) para todo x en el
dominio común.
Notemos también que aunque estamos acostumbrados a representar a las funciones mediante
fórmulas, no siempre es posible hacerlo.
El símbolo f : A → R se utiliza para indicar que f es una función cuyo dominio es A (se supone,
como hemos dicho antes, que A es un subconjunto de R)
x 3 + 5x + 6
d) Sea f (x) =
x2 − 1
Según lo antes dicho, las funciones en a) y b) son distintas. Nótese que la función definida en
b) es creciente y la definida en a) no lo es.
La función definida en c) es llamada función de Dirichlet. Nótese que no es fácil calcular los
valores de dicha función porque no siempre se sabe si un número real dado es racional o irra-
cional. ¿Es e +π racional? Pese a ello la función está correctamente definida.
En d) no nos dan explícitamente el dominio de f por lo que se entiende que f está definida
siempre que f (x) tenga sentido, es decir, siempre que, x2 − 1 , 0, esto es, para x ± 1.
Cuando una función se define mediante una fórmula f (x) = fórmula y el dominio no es explí-
cito, se entiende que el dominio es el mayor conjunto de valores de x para los cuales la expre-
sión f (x) tiene sentido como número real. Éste es el llamado dominio natural de la función. Si
queremos restringir el dominio natural de alguna manera, entonces debemos decirlo de forma
explícita.
Usaremos la notación dom( f ) para representar el dominio de una función f (dicho dominio
puede ser el natural o un subconjunto del mismo). El conjunto de todos los valores que toma
una función, { f (x) : x∈dom( f )}, suele llamarse rango o recorrido de f , o simplemente, la imagen
de f y lo representaremos por imagen( f ).
Ocurre que el dominio natural de muchas funciones es un intervalo o la unión de varios inter-
valos. Recordemos el concepto de intervalo y cuántos tipos diferentes hay.
2.1 Definición. Un conjunto I ⊆ R se llama un intervalo si siempre que dos números están en
I todos los números comprendidos entre ellos dos también están en I. El conjunto vacío, Ø, se
considera también como un intervalo.
Intervalos que tienen dos puntos extremos a y b (donde a 6 b son números reales):
Intervalos que tienen un único punto extremo c ∈ R llamado origen del intervalo:
Como es la primera vez que aparecen, hay que decir que los símbolos +∞ (léase: “más infinito”)
y −∞ (léase: “menos infinito"); son eso: símbolos. No son números. Cada vez que aparece uno
de ellos en una situación determinada hay que recordar cómo se ha definido su significado
para dicha situación. A veces, se escribe R =] − ∞, +∞[.
La mayoría de las funciones que vamos a usar en este curso pertenecen a la clase de las
funciones elementales. Se llaman así porque pueden obtenerse a partir de ciertos tipos de fun-
ciones bien conocidas realizando las operaciones de suma, producto, cociente y composición
de funciones.
Dadas dos funciones f y g se define su función suma (resp. producto) como la función que a
cada número x∈dom( f )∩dom(g) asigna el número real f (x)+ g(x) (resp. f (x)g(x)). Dicha función
se representa con el símbolo f + g (resp. f g). Se define la función cociente de f por g como la
f (x)
función que a cada número x ∈ dom( f ) ∩ dom(g) con g(x) , 0 asigna el número real . Dicha
g(x)
f
función se representa con el símbolo . También podemos multiplicar una función f por un
g
1 Este resultado, en apariencia evidente, no podríamos demostrarlo con las herramientas de que disponemos hasta
ahora.
número α para obtener la función α f que asigna a cada x ∈ dom( f ) el número α f (x). De todas
formas, el producto de un número por una función puede considerarse como un caso parti-
cular del producto de funciones, pues se identifica el número α con la función constante que
toma como único valor α.
Las propiedades de la suma y el producto de funciones son las que cabe esperar y su demostra-
ción es inmediata pues se reducen a las correspondientes propiedades de los números.
Propiedades conmutativas. f + g = g + f ; fg = gf
Composición de funciones
Supongamos que f y g son funciones verificando que imagen( f ) ⊂ dom(g). En tal caso, la función
h dada por h(x) = g( f (x)) para todo x ∈ dom( f ) se llama composición de g con f y se representa
por g ◦ f . La composición de funciones es asociativa, esto es
(g ◦ f ) ◦ h = g ◦ ( f ◦ h)
Funciones inyectivas
Si f es una función inyectiva, puede definirse una nueva función f −1 : imagen( f ) → R que
llamaremos función inversa de f , que a cada número y ∈ imagen( f ) asigna el único número
x ∈ dom( f ) tal que f (x) = y. Equivalentemente f −1 ( f (x)) = x para todo x ∈ dom( f ), y también
f ( f −1 (y)) = y para todo y ∈ dom( f −1 ) = imagen( f ).
Funciones monótonas
La gráfica de una función f es el conjunto de pares de números {(x, f (x)) : x ∈ dom( f )}.
La gráfica de una función pone de manifiesto, a simple vista, muchas de sus propiedades. Para
dibujar gráficas de funciones se precisan herramientas de cálculo que estudiaremos más ade-
lante.
P(x) = c0 + c1 x + c2x 2 + · · · + cn x n
Es inmediato que sumas, productos y cocientes de funciones racionales son también funciones
racionales; y la composición de dos funciones racionales es también una función racional.
Raíces de un número
Dados un número real x > 0 y un número natural k > 2, hay un único número real positivo,
z > 0, que verifica que zk = x . Dicho número real z se llama la raiz k-ésima o de orden k de x y
√
se representa por k x o por x 1/k .
está en http://www.ugr.es/local/fjperez/funciones_elementales.nb.
√ p
Si x < 0 y k es impar se define k
x = − k |x|
Potencias racionales
√
q √ √
Dados x > 0, p ∈ Z y q ∈ N, definimos x p/q = x p . Notemos que ( q x ) p = q x p pues
√ q √ √ p
( q x ) p = ( q x ) p q = ( q x )q = x p
Logaritmos
Vamos a hacer un estudio descriptivo de estas funciones. Nos limitaremos a recordar sus
definiciones y propiedades básicas, dejando para más adelante un estudio riguroso de las mis-
mas.
Exponenciales
La función inversa de la función loga es la función exponencial de base a, que se representa por
expa . Por tanto, para cada x∈R, expa (x) es, por definición, el único número positivo cuyo logarit-
mo en base a es igual a x: loga (expa (x)) = x. Es fácil comprobar que si r ∈Q entonces expa (r) = a r ,
por lo que se usa la notación expa (x) = a x .
x y = e y log x (x > 0, y ∈ R)
La letra e se eligió en honor del gran matemático Leonhard Euler (1707-1783). A primera vista
puede parecer que no hay razones particulares para llamar natural al número e. Las razones
matemáticas de esta elección se verán al estudiar la derivación. Sin embargo, hay muchos pro-
cesos de crecimiento que hacen del número e una base exponencial extremadamente útil e
interesante. Veamos unos ejemplos.
Interés compuesto. Supongamos que invertimos un capital inicial, P, a una tasa de interés
anual r (expresado en tanto por uno), ¿cuánto dinero tendremos cuando hayan pasado k años?
Respuesta: depende de cómo se paguen los intereses. En el interés simple se paga el total de los
intereses al terminar la inversión, por lo que el interés total producido es igual a Prk, y el capital
final será igual a P(1 + rk).
Sin embargo, lo usual es que se paguen intereses en períodos más cortos de tiempo. Estos
intereses se acumulan al capital inicial y producen, a su vez, nuevos intereses. Esto se cono-
ce como interés compuesto. Por ejemplo, si el interés se paga n veces al año (trimestralmente
(n = 4), mensualmente (n = 12), etcétera) al final del primer período tendremos P(1 + r/n), al
final del segundo P(1 + r/n) 2; al final del primer año P(1 + r/n) n, al final del k-ésimo año tendre-
mos P(1 + r/n) nk .
Se llama así la función cuyo dominio es R+ que a cada x > 0 asigna el número x a . Puesto que
xa= exp(a log x), las propiedades de esta función se deducen con facilidad de las propiedades
de las funciones exponencial y logaritmo natural.
Funciones trigonométricas
Vamos a hacer un estudio descriptivo de estas funciones. Nos limitaremos a recordar sus
definiciones y propiedades básicas, dejando para más adelante un estudio más riguroso de las
mismas.
La palabra tri-gono-metría significa “medida de las figuras con tres esquinas”, es decir, de
los triángulos. La trigonometría (plana) es el estudio de las relaciones entre las longitudes de
los lados de un triángulo (plano) y las medidas de sus ángulos. Por ello, las funciones trigono-
métricas se definieron originalmente mediante triángulos rectángulos. No obstante, interesa
definir dichas funciones usando la circunferencia unidad, es decir, la circunferencia centrada
en 0 y de radio 1.
Hay una expresión que estamos acostumbrados a usar y cuyo significado conviene precisar.
Me refiero a la expresión: “una circunferencia de radio r”. Cuando empleamos dicha expresión
se sobreentiende que el radio r de la circunferencia es un número expresado en alguna unidad
Supongamos que tenemos una circunferencia de radio r. Para medir ángulos en grados
sobre dicha circunferencia lo que hacemos es tomar como unidad de medida un arco cuya
longitud sea igual a la longitud total de esa circunferencia (2πr) dividida por 360. Un ángulo de
un grado es el que intercepta en una circunferencia de radio r un arco cuya longitud es igual a
2πr
.
360
Supongamos que tenemos una circunferencia de radio r. Para medir ángulos en radianes
sobre dicha circunferencia lo que hacemos es tomar como unidad de medida un arco cuya lon-
gitud sea igual a la del radio. Un ángulo de un radián es el que intercepta en una circunferencia
de radio r un arco cuya longitud es igual a r.
Las palabras “grado” y “radián” se usan tanto para referirse a los respectivos ángulos como
a las medidas de sus arcos. Es así como debes interpretar la expresión “la longitud total de
la circunferencia es 360 grados y también es igual a 2π radianes”. Sería más exacto decir: “la
longitud total de la circunferencia es 360 veces la longitud de un arco de un grado y también es
igual a 2π veces la longitud de un arco de un radián”. Evidentemente, la longitud de un arco de
un radián es igual al radio de la circunferencia.
No hay que olvidar que grados y radianes no son otra cosa que unidades de medida de longitu-
des, al igual que lo son el metro y el centímetro. En la navegación y en la astronomía los ángulos
se miden en grados, pero en Cálculo es preferible medirlos en radianes porque se simplifican
las cuentas. Por ejemplo, la longitud de un arco de circunferencia se obtiene multiplicando la
longitud del radio de dicha circunferencia por la medida en radianes del ángulo que correspon-
de a dicho arco.
Observa que la ventaja de medir arcos en radianes es que, en tal caso, la misma unidad con
la que medimos el radio nos sirve para medir arcos. Por ejemplo, si el radio es 1 centímetro el
radián también mide 1 centímetro; mientras que la medida de un grado en centímetros sería
2π/360 ≃ 0, 0174533.
Hay dos funciones que suelen confundirse: el seno de un ángulo y el seno de un número.
√
En geometría se habla del seno de un ángulo y en Cálculo usamos la expresión sen( 2) para
√
referirnos al seno del número 2. ¿Qué relación hay entre uno y otro? Antes que nada hay que
decir que tanto el seno de un ángulo como el seno de un número son números, pero mientras
que el seno de un ángulo tiene una sencilla definición geométrica, no es evidente, a priori,
cómo se puede definir el seno de un número.
La idea consiste en asociar a cada número un (único) ángulo y definir el seno del número
como el seno del ángulo que le corresponde. Es evidente que a cada número x > 0 le pode-
mos asignar de manera única un ángulo “enrollando” el segmento [0, x] sobre la circunferencia
unidad, en sentido contrario a las agujas del reloj, de forma que el origen de dicho segmento
coincida con el punto U = (1, 0) de la circunferencia. Obtenemos así un punto Px de la circun-
ferencia unidad. Pues bien, si las coordenadas de Px son (a, b), se define:
y
Px
[x ) = b
sen x = seno del ángulo(OUP
longitud x [x ) = a
cos x = coseno del ángulo(OUP
b
Al ser igual a 2π la longitud de la circunferencia uni-
x dad, es claro que Px+2π = Px , por lo que sen(x) =
O a U
sen(x + 2π) y cos(x) = cos(x + 2π). Observa también
que si 0 6 x < 2π, entonces la medida en radianes del
[x es igual a x, es decir:
ángulo OUP
Si x < 0 podemos proceder con el segmento [x, 0] de forma análoga a la anterior, con la di-
ferencia de que ahora enrollamos dicho segmento sobre la circunferencia unidad en el sentido
de las agujas del reloj, de forma que su extremo 0 coincida con el punto U = (1, 0) de la circun-
ferencia. Obtenemos así un punto Px = (c, d) de la circunferencia unidad y se define, igual que
antes sen(x) = d, cos(x) = c. Es fácil ver que si Px = (c, d), entonces P−x = (c, −d). Resulta así que
sen(x) = − sen(−x) y cos(x) = cos(−x).
1 y = sen x
−2π −π 0 π 2π
-1
Observación
Podemos definir la función seno en grados sin más que interpretar que x es la medida en
grados del ángulo que le corresponde. El hecho de que se use la misma notación para ambas
funciones es la causa de muchos errores. Si notamos seno (x) el valor del seno del ángulo cuya
media es x grados, y notamos senr (x) el valor del seno del ángulo cuya media es x radianes (es
decir, la función que hemos definido antes); la relación entre ambas funciones viene dada por:
2πx πx
seno (x) = senr = senr
360 180
Es frecuente que seno (x) se escriba como sen x o . Por ejemplo sen(45o ). A esta mala notación se
deben las dudas que a veces surgen sobre el significado de sen x y que llevan a preguntar: “¿está x
en grados o en radianes?”, cuando lo que realmente debería preguntarse es “¿se trata de seno (x)
o de senr (x)?”; porque, en ambos casos, x es tan sólo un número al que no hay por qué ponerle
ninguna etiqueta.
Insistimos, una última vez: en este curso de Cálculo el número sen x significará siempre senr x.
Por tanto sen(π/4) , sen(45) (pero sen(π/4) = seno (45)).
Las funciones seno y coseno son funciones reales cuyo dominio es todo R. Las identidades
básicas que dichas funciones verifican son:
sen 2 x + cos 2 x = 1 (x ∈ R)
Como se ha dicho antes, las funciones seno y coseno son periódicas de período 2π:
Todas las propiedades anteriores se deducen fácilmente de las definiciones dadas. Las siguien-
tes igualdades, conocidas como fórmulas de adición, se probarán más adelante:
La función seno se anula en los múltiplos enteros de π, es decir, en los puntos de la forma kπ
donde k es un entero cualquiera. La función coseno se anula en los puntos de la forma kπ + π/2
donde k es un entero cualquiera.
Las funciones tangente y secante, que se representan por tg y sec son las funciones definidas
en el conjunto R \ {kπ + π/2 : k ∈ Z} = {x ∈ R : cos x , 0}, por:
sen x 1
tg x = , sec x =
cosx cos x
Las funciones cotangente y cosecante, que se representan por cotg y csc son las funciones defi-
nidas en el conjunto R \ {kπ : k ∈ Z} = {x ∈ R : sen x , 0}, por:
cos x 1
cotg x = , csc x =
sen x sen x
Las propiedades de estas funciones se deducen con facilidad de las propiedades del seno y del
coseno. Por ejemplo, tg(x) = tg(x + π); es decir, la función tangente es periódica de período π.
Lo primero que hay que decir es que ninguna de las funciones “seno”, “coseno”, “tangente”,
es inyectiva pues todas ellas son periódicas y, por tanto, toman cada uno de sus valores en
infinitos puntos; en consecuencia, ninguna de ellas tiene inversa. Por tanto, no debe decirse
que las funciones arcoseno, arcocoseno, arcotangente sean las funciones inversas del seno, del
coseno o de la tangente: eso no es cierto. Hecha esta observación imprescindible, pasemos a
definir dichas funciones.
π
2 π
y = arc sen x
-1 1
π/2
y = arc cos x
−π
2 -1 1
Figura 2.3: Función arc sen x Figura 2.4: Función arc cos x
π
2
y = arctg x
−π
2
Hay algunas combinaciones de las funciones exp(x) y exp(−x) que aparecen con tanta frecuen-
cia que se les da nombre propio. Ellas son las funciones seno hiperbólico, representada por senh,
y coseno hiperbólico, representada por cosh, y están definidas para todo x ∈ R por:
e x + e−x e x − e−x
cosh x = , senh x =
2 2
3.5
3
3
2
2.5 y = cosh x
1
y = senh x 2
-2 -1 1 2 1.5
-1
-2 -1 1 2
-2
-3
Las funciones seno hiperbólico y coseno hiperbólico son funciones reales cuyo dominio es todo
R. La identidad básica que dichas funciones verifican es:
cosh 2 x − senh 2 x = 1 (x ∈ R)
La función tangente hiperbólica que se representa por tgh es la función definida para todo x∈R
por:
senh x e x − e−x
tgh x = =
cosh x e x + e−x
y = tgh x
-4 -2 2 4
-1
La función seno hiperbólico es una biyección de R sobre R cuya inversa, representada por,
argsenh, (léase argumento seno hiperbólico) viene dada por:
p
argsenhx = log(x + x 2 + 1) (x ∈ R)
2 2
y = argsenhx 1
-4 -2 2 4 y = argcoshx
-1
1 2 3 4
-2
y = argtghx
1
-1 1
-1
-2
La razón de por qué estas funciones se llaman hiperbólicas es que, al igual que los puntos de
la circunferencia unidad pueden representarse en la forma (cost, sent), los puntos en la rama
derecha de la hipérbola unitaria x 2 − y 2 = 1 pueden representarse como (cosht, senht).
Las funciones hiperbólicas, por su parte, también sirven para describir el movimiento de
ondas en sólidos elásticos, o la forma que adoptan los cables eléctricos colgantes. Hay una her-
mosa curva llamada catenaria cuya ecuación es de la forma y = a cosh(x/a) (donde se entiende
que a es una constante). La catenaria es la forma que adopta una cadena perfectamente flexible
suspendida de sus extremos y bajo la acción de la gravedad.
2.3. Ejercicios
7. Resuelve el sistema: 7(logy x + logx y) = 50, x y = 256. Se supondrá que x > y > 1.
1 x
cos(arc tg x) = p sen(arc tg x) = p
1+x 2 1 + x2
x π
tan(arc sen x) = p ∀x ∈] − 1, 1[, arc cosx + arc senx = ∀x ∈ [−1, 1]
1−x 2 2
b
12. Sean a, b∈R tales que a2 +b2 = 1, a , −1. Definamos ϑ = 2 arc tg . Prueba que cos ϑ = a,
a+1
sen ϑ = b.
x nx n+1
sen (sen x + sen 2x + · · · + sen nx) = sen sen x
2 2 2
tg x + tg y
14. Prueba que tg(x + y) = . ¿Qué excepciones hay que hacer?.
1 − tgx tg y
x+y
15. Indica para qué valores de x e y se verifica la igualdad arc tg x + arc tgy = arc tg .
1 − xy
Introducción
Los números complejos son una herramienta básica de cálculo. Son especialmente útiles
para trabajar con funciones sinusoidales, y por eso se hace uso constante de ellos siempre que
representamos una señal por medio de dichas funciones, y no hay que olvidar que ése es el
propósito básico de los “métodos de Fourier”. La Transformada de Fourier Discreta, una herra-
mienta fundamental en el tratamiento digital de señales, toma valores complejos. Las transfor-
madas de Fourier y de Laplace son funciones complejas. La transformada z, al igual que otras
transformadas de uso frecuente, se define como una serie de números complejos. La función
exponencial compleja desempeña un papel fundamental en el estudio de los sistemas LTI (sis-
temas lineales invariantes en el tiempo) y también en la teoría de las ecuaciones diferenciales
lineales.
26
Operaciones básicas con números complejos 27
Comentarios a la definición
A los elementos de R2 se les llama unas veces pares ordenados de números reales, otras vec-
tores o puntos y también números complejos. La razón de esto es que en R2 conviven varias
estructuras cada una con su terminología propia. Por eso a los elementos de R2 se les llama
vectores si se está considerando la estructura de espacio vectorial, puntos si fijamos la atención
en la estructura topológica o afín, pares ordenados cuando estamos pensando en R2 como con-
junto sin ninguna estructura particular y números complejos cuando se considera la estructura
de cuerpo antes definida. Ocurre que estos términos se usan a veces en un mismo párrafo lo
que puede resultar confuso. La regla que debes tener siempre presente es que todo concep-
to matemático tiene sentido propio dentro de una determinada estructura matemática. Por
ello, a un elemento de R2 se le llama número complejo cuando se va a usar el producto antes
definido que es lo que en realidad distingue a los números complejos de los vectores de R2 .
El símbolo usual (a, b) para representar pares ordenados no es conveniente para represen-
tar el número complejo (a, b). Para convencerte calcula (1, −1)4 . Representaremos los números
complejos con un simbolismo más apropiado. Para ello hacemos la identificación (a, 0) = a y el
número complejo (0, 1) lo representaremos por i. Con ello tenemos que
√
Comentarios a la definición usual i = −1
Acabamos de ver que i2 = −1 pero eso no nos permite escribir así, sin más ni más, que
√ √
i = −1. Fíjate lo que ocurre si ponemos i = −1 y manejamos ese símbolo con las reglas a las
que estamos acostumbrados:
√ √ p √
i2 = −1 = i i = −1 −1 = (−1)(−1) = 1 = 1
Luego 1 = −1. Por tanto, las matemáticas son contradictorias y aquí hemos acabado.
Naturalmente, el error, procede de que estamos haciendo disparates. Fíjate que en la expre-
√
sión −1 no puedes interpretar que −1 es el número real −1 (porque, como sabes, los números
reales negativos no tienen raíz cuadrada real), sino que tienes que interpretar −1 como el núme-
ro complejo −1 (espero que ya tengas clara la diferencia). Resulta así que estamos usando raíces
de números complejos sin haberlas definido y dando por supuesto que dichas raíces verifican las
mismas propiedades que las de los números reales positivos.
√ √
Antes de escribir −1 hay que definir qué significa z para z ∈ C. Cuando lo hagamos ve-
√ √ √
remos ¡sorpresa! que la igualdad z w = z w, válida cuando z, w ∈ R+ , no es cierta en general
cuando z, w ∈ C.
√
Todavía más disparatado es definir i = −1 sin ni siquiera haber definido antes los números
complejos. Sin embargo, y aunque parezca mentira, en muchos textos se define (porque sí, sin
√
más explicaciones) i = −1 y a continuación se dice que los números de la forma a + ib son los
números complejos. No es de extrañar que luego resulte que 1 = −1.
Al ampliar R a C ganamos mucho pero también perdemos algo. Te recuerdo que R tiene dos
estructuras: la algebraica y la de orden. Ambas estructuras están armoniosamente relacionadas.
Pues bien, en C no hay nada parecido. Podemos definir relaciones de orden en C, pero no hay
ninguna de ellas que sea compatible con la estructura algebraica. Es decir, es imposible definir
un concepto de número complejo positivo de forma que la suma y el producto de complejos
positivos sea positivo. Por ello no se define en C ningún orden. Así que ya sabes: ¡nunca escribas
desigualdades entre números complejos! Naturalmente, puedes escribir desigualdades entre
las partes reales o imaginarias de números complejos, porque tanto la parte real como la parte
imaginaria de un número complejo son números reales.
Es usual interpretar el número complejo x + iy como el vector del plano (x, y) y, en ese sen-
tido, se habla del plano complejo. El eje horizontal recibe el nombre de eje real, y el eje vertical
recibe el nombre de eje imaginario. Si z = x + iy es un número complejo (con x e y reales), en-
b z = a + ib
|z|
z̄ = a − i b
z = x − iy
z+w
c a a+c
El uso de coordenadas polares en el plano facilita mucho los cálculos con productos de
números complejos. Para cualquier número complejo z = x + iy , 0 podemos escribir
x y
z = |z | ( +i )
|z | |z |
x y
Como ( , ) es un punto de la circunferencia unidad, puede escribirse en la forma
|z | |z |
x y
( , ) = (cos ϑ, sen ϑ)
|z | |z |
z = |z | (cos ϑ + i sen ϑ)
Esta forma de expresar un número complejo recibe el nombre de forma polar, cuya interpre-
tación gráfica vemos en la figura siguiente.
|z|
Dado z∈C, z , 0, hay infinitos números t ∈R que verifican la igualdad z = |z | (cost, sent) cual-
quiera de ellos recibe el nombre de argumento de z. El conjunto de todos los argumentos de
un número complejo no nulo se representa por Arg(z).
Observa que
( )
cos(t) = cos(s)
s, t ∈ Arg(z) ⇐⇒ ⇐⇒ s = t + 2kπ para algún k ∈ Z
sin(t) = sin(s)
Por tanto, conocido un argumento to ∈ Arg(z) cualquier otro es de la forma to + 2kπ para algún
k ∈ Z, es decir, Arg(z) = to + 2πZ.
De entre todos los argumentos de un número complejo z , 0 hay uno único que se encuentra
en el intervalo ] − π, π], se representa por arg(z) y se le llama argumento principal de z. No es
difícil comprobar que el argumento principal de z = x + iy , 0 viene dado por:
arc tg(y/x) − π si y 6 0, x < 0
−π/2 si y 6 0, x = 0
arg(z) = arc tg(y/x) si x > 0
π/2 si y > 0, x = 0
arc tg(y/x) + π si y > 0, x < 0
Fíjate que si tomas un número complejo que esté situado en el tercer cuadrante z = x + iy
con x < 0, y < 0 y supones que y es próximo a 0, su argumento principal está próximo a −π, y si
tomas un número complejo que esté situado en el segundo cuadrante, w = x + iv con x < 0, v > 0,
y supones que v es próximo a 0, su argumento principal está próximo a π. Además, la distancia
|w − z| = |v − y| = v − y es tan pequeña como quieras. Esto nos dice que el argumento principal
tiene una discontinuidad en el eje real negativo: salta de −π a π cuando atravesamos dicho eje
desde el tercer al segundo cuadrante.
Peor todavía dirás. Hasta cierto punto. Primero, la discontinuidad es inevitable. Si queremos
elegir argumentos en un intervalo de longitud 2π, digamos [α, α + 2π[, entonces dichos argu-
mentos saltan de α a α + 2π cuando atravesamos la semirrecta (x, y) = ρ(cosα, sen α), (ρ > 0). En
particular, si tomamos argumentos en el intervalo [0, 2π[ (cosa que, a primera vista, parece lo
razonable) nos encontramos con que entonces se produce una discontinuidad de dichos argu-
mentos en el eje real positivo. Bien, sucede que la extensión a C de algunas funciones definidas
en R+ (el logaritmo, las raíces) hace intervenir el argumento principal. Naturalmente, queremos
que dichas extensiones sigan siendo continuas en R+ y ello justifica que tengamos que tomar
argumentos principales de la forma en que lo hemos hecho: porque preferimos introducir una
discontinuidad en R− a perder la continuidad en R+ .
Fórmula de De Moivre
Veamos cómo la forma polar permite hacer fácilmente productos de números complejos.
Consideremos dos números complejos no nulos escritos en forma polar.
z = |z | (cos ϑ + i sen ϑ)
w = |w| (cos ϕ + i sen ϕ)
Entonces
Es decir: para multiplicar dos números complejos se multiplican sus módulos y se suman sus
argumentos.
Así pues, el producto de dos números complejos es geométricamente un giro (pues se su-
man los argumentos de los números que estamos multiplicando) seguido de una homotecia (el
producto de los módulos de ambos números).
Acabamos de ver que si z, w∈C∗ , ϑ∈Arg(z) y ϕ∈Arg(w), entonces ϑ + ϕ ∈ Arg(z + w). Es ahora
fácil demostrar mediante inducción la siguiente fórmula, muy útil, conocida como fórmula de
De Moivre.
tal que (wk )n = z. Como una ecuación polinómica de grado n no puede tener más de n solucio-
nes, se sigue que distintos valores de k deben dar lugar al mismo número wk . Veamos:
wk = wq ⇔ ϕk − ϕq = 2mπ ⇔ k − q = nm
Es decir, si k y q dan el mismo resto al dividirlos por n entonces wk = wq . Deducimos que para
k = 0, 1, 2, . . . , n − 1 obtenemos wk distintos y cualquier otro wq es igual a uno de ellos. Por tanto
hay n raíces n–ésimas distintas de z.
Observa que definiendo u = cos(2π/n) + i sen(2π/n), los números u0 = 1, u, u2 , . . . , un−1 son las raí-
ces n–ésimas de la unidad. Podemos escribir las raíces n–ésimas de z en la forma z k = z 0 uk .
Como multiplicar por u es un giro de amplitud 2π/n, deducimos que las n raíces de z se ob-
tienen girando la raíz n–ésima principal, z 0 , con giros sucesivos de amplitud 2π/n. Es decir, si
representamos todas las raíces n–ésimas de z obtenemos n puntos sobre una circunferencia de
p
centro (0, 0) y radio n |z | que forman un polígono regular de n lados.
√
De entre todas las raíces n–ésimas de z vamos a designar con el símbolo n
z a la raíz n-ésima
principal, que está definida por
√ arg z arg z
n
z = |z |1/n cos + i sen
n n
Observa que en el caso particular de que z sea un número real positivo, entonces la raíz prin-
cipal de z (considerado como número complejo) coincide con la raíz de z (considerado como
número real positivo).
En general no es cierto que dados dos números complejos z y w entonces el producto de las
raíces n-ésimas principales de z y de w sea igual a la raíz n-ésima principal de z w. Lo que sí es
cierto es que el producto de dos raíces n-ésimas cualesquiera de z y de w es una raíz n-ésima de
√ √
z w. Por tanto, n z n w, es una raíz n-ésima de z w pero no tiene por qué ser la principal.
En este caso √
√ √ p
−1 −1 = i i = −1 , (−1)(−1) = 1 = 1
√ √
es decir −1 −1 = −1 es una raíz cuadrada de 1 (porque 1 = (−1)(−1)) pero no es la raíz
cuadrada principal de 1.
3.2. Ejercicios
1+z
4. Calcula los números complejos z tales que es:
1−z
a) Un número real; b) Un número imaginario puro.
13. Sea x un número real que no es múltiplo entero de 2π. Prueba las igualdades
n+1
n sen 2
x
a) 1 + cosx + cos2x + · · · + cosnx = cos x x
2 sen
2
n+1
n sen 2
x
b) sen x + sen2x + · · · + sen nx = sen x x
2 sen
2
Sugerencia: Si llamamos A a la primera suma y B a la segunda, calcula A + iB haciendo uso
de la fórmula de De Moivre.
Las funciones complejas no son más que las funciones definidas en subconjuntos de R2 con
valores en R2 cuando en R2 consideramos su estructura compleja. Dado un conjunto A ⊂ C, a
toda función compleja f : A → C se le asocian dos funciones reales: la función u = Re f “parte
real de f ” y la función v = Im f “parte imaginaria de f ” definidas para todo (x, y) = x + iy ∈ A por:
Observa que
| ez | = eRe z , Im z ∈ Arg(ez )
que establece una relación entre la exponencial compleja y las funciones trigonométricas. De
la fórmula de Euler se deducen fácilmente las llamadas ecuaciones de Euler:
Se prueba fácilmente que ez+w = ez ew para todos z, w ∈ C. Se deduce que para todo z ∈ C y
todo k ∈ Z es
ez = ez+2kπi
Lo que nos dice que la exponencial compleja es una función periódica con período 2πi. Natu-
ralmente, esto supone una gran diferencia con la exponencial real que es una función inyectiva.
Observa que la exponencial no se anula nunca pues | ez | = eRe z > 0.
1 Más adelante veremos la justificación de esta definición.
Dado un número complejo z , 0, hay infinitos números complejos w que satisfacen la ecua-
ción ew = z. Cualquiera de ellos se llama un logaritmo de z. El conjunto de todos ellos lo repre-
sentaremos por Log z y es el conjunto:
De entre todos ellos elegimos uno, llamado logaritmo principal, definido por
Observa que cualquier otro logaritmo de z es de la forma log(z) + i2kπ para algún entero k. Es
importante que observes que la igualdad
que es válida para los logaritmos de los números reales positivos, no es siempre cierta para
números complejos. Por ejemplo:
2π 3π 7π
log ei 2π/3 = i , log ei 3π/4 = i , log ei 2π/3 ei 3π/4 = log ei 17π/12 = log e−i7π/12 = −i
3 4 12
Lo que está claro es que el número log z + log w ∈ Log(z w), es decir, log z + logw es un logaritmo
de z w pero no tiene por qué ser el logaritmo principal de z w.
Recuerda que dados dos números reales a > 0 y b ∈ R, la potencia de base a y exponente b se
define como ab = eb log a . Ahora, dados a, b ∈ C, con a , 0, sabemos que hay infinitos logaritmos
de a, todos ellos son de la forma log a + i 2kπ, con k ∈ Z. Por ello, cualquier número complejo de
la forma eb(log a+i 2kπ) donde k ∈ Z, es una potencia de base a y exponente b. Representamos por
[ab ] el conjunto de todas ellas. n o
[ab ] = eb(log a+i 2kπ) : k ∈ Z
Se destaca una:
ab = eb log a
que se llama valor principal de la potencia de base a y exponente b. Observa que si b = 1/n
donde n ∈ N, el número
1 log a arga arg a arg a
a1/n = exp log a = exp +i = |z |1/n cos + i sen
n n n n n
√
es el valor principal de la raíz n-ésima de a que antes hemos notado por n a.
3.4. Ejerccios
√
1. Expresa los 8 números ±1 ± i, ± 3 ± i en la forma r eiϕ .
√ log(z)
a) log(exp(z)) = z ; b) exp(log(z)) = z ; c) log( n z) = ; d) log(zn ) = n log(z).
n
Continuidad
Introducción
Para motivar la definición que vamos a dar de continuidad, consideremos una ley física de la
forma P = f (V ), que relaciona los valores de una “variable independiente V ” (podemos pensar
que es el volumen de un gas) con otra “variable dependiente P” (podemos pensar que es la
presión). Si queremos usar dicha ley, hemos de medir un valor Vo de la variable V , y es inevitable
que al hacerlo cometamos algún error el cual, naturalmente, influye en el correspondiente valor
de P, que ya no será exactamente igual a Po = f (Vo ). Surge así la pregunta natural: ¿de qué forma
el error en la medida de V afecta al valor resultante de P? Es claro que si para valores de V “muy
próximos” a Vo obtengo valores de P muy diferentes entre sí, la ley “ f ” que relaciona V con P no
tendrá ninguna utilidad práctica.
Puesto que los errores de medida son inevitables, no es razonable tratar de obtener “el ver-
dadero valor Po ”. Lo que sí puede hacerse es fijar una cota de error admisible para P (la cual
dependerá de cada situación concreta); llamemos “ε” a dicha cota, (ε > 0), y tratar de obtener
otra cota de error “δ”, (δ > 0), de tal forma que siempre que midamos Vo con un error menor
que δ tengamos la seguridad de que el valor resultante para P se diferencia de Po en menos que
ε. Esto es, | f (V ) − f (Vo )| < ε siempre que |V −Vo | < δ. Cuando esto efectivamente pueda hacerse
para cualquier cota de error ε > 0 decimos que la ley “ f ” es continua en Vo . Observa que cabe
esperar que la cota de error δ dependa del ε > 0 fijado en cada caso, y también de Vo .
38
Propiedades básicas de las funciones continuas 39
La definición anterior suele escribirse, con abuso del formalismo lógico, de la siguiente forma:
)
|x − a| < δ
∀ε ∈ R ∃ δ ∈ R :
+ +
=⇒ | f (x) − f (a)| < ε
x∈A
Observa cómo en esta definición el conjunto A tiene mucho protagonismo: sólo se consideran
los valores de f en A, lo que le pueda pasara a f fuera de A no nos interesa.
No suele ser tarea fácil demostrar que una función dada es continua. Generalmente, lo que
se hace es descomponer la función que queremos estudiar en otras más sencillas cuya con-
tinuidad ya es conocida previamente. Es por ello interesante saber qué tipo de operaciones
realizadas con funciones continuas conducen a nuevas funciones continuas.
1. Las funciones f + g y f g son continuas en todo punto de A en el que las dos funciones f y g
sean continuas. En particular, las funciones suma y producto de funciones continuas son
funciones continuas.
1
2. Si g(x) , 0 para todo x ∈ A, la funciónes continua en todo punto de A en el que g sea con-
g
tinua. En consecuencia, la función cociente de dos funciones continuas cuyo denominador
no se anula nunca es una función continua.
Las propiedades anteriores no son difíciles de demostrar y, sin embargo, son de gran utilidad.
De hecho, todas las funciones elementales que conoces son continuas en sus dominios na-
turales de definición.
Demostración. Dado ε > 0, por la continuidad de g en f (a), existe ρ > 0 tal que para todo y ∈ B
con |y − f (a)| < ρ se tiene que |g(y) − g( f (a))| < ε. Ahora, por la continuidad de f en a, existe
δ > 0 tal que para todo x ∈ A con |x − a| < δ se tiene que | f (x) − f (a)| < ρ. Deducimos así que
|g( f (x)) − g( f (a))| < ε para todo x ∈ A con |x − a| < δ. Es decir, la función compuesta g ◦ f es
continua en a.
4.5 Teorema (Conservación local del signo). Sea f : A → R continua en un punto a ∈ A con
f (a) , 0. Entonces hay un número r > 0 tal que para todo x ∈ A con |x − a| < r se verifica que
f (x) f (a) > 0. (Es decir, f es positiva (si f (a) > 0) o negativa (si f (a) < 0) en todos los puntos de un
entorno de a)
Demostración. Supondremos que f (a) > 0. Podemos entonces tomar ε = f (a)/2 para obtener,
en virtud de la continuidad de f en a, un r > 0 tal que para todo x ∈ A con |x − a| < r se verifica
que | f (x) − f (a)| < f (a)/2, lo que implica que f (x) > f (a)/2 > 0. El caso en que f (a) < 0 se reduce
al anterior sin más que sustituir f por − f .
Si ahora mides 175cms. y hace 10 años medías 135cms., es seguro que en algún momento
intermedio medías con exactitud 161cms. Si una entrada de cine cuesta 5 euros y hace 3 años
costaba 4 euros, es seguro que en algún momento ir al cine costaba exactamente 4,99 euros.
¿Seguro? No, a ningún empresario de cine le parecería bien cobrar 4,99 euros por la entrada.
La diferencia está en que la talla de una persona es una función continua del tiempo y para
pasar de 135cms. a 175cms. tiene que pasar por todos los valores intermedios, pero el precio de
las entradas de cine no varía de forma continua con el tiempo y puede pasar “de golpe” de 4,5
euros a 5 euros.
4.6 Teorema (Teorema de los ceros de Bolzano). Toda función continua en un intervalo que
toma valores positivos y negativos se anula en algún punto de dicho intervalo.
Lo primero que llama la atención en este teorema es su evidencia. No está de más a este res-
pecto recordar que, como decía Bertrand Russell, “en matemáticas la evidencia es enemiga de
la corrección”. Precisamente, el mérito de Bernard Bolzano (1781-1848) está en haber llamado
la atención sobre la necesidad de demostrar muchas proposiciones, aparentemente evidentes,
que se refieren a las funciones continuas. Podemos añadir, además, que suele ser particular-
mente difícil demostrar matemáticamente lo que nuestra intuición presenta como evidente;
de hecho, con las herramientas que tenemos hasta ahora no podemos demostrar el teorema.
La función f (x) = x 2 − 2 es continua y f (0) < 0 < f (2), el teorema de Bolzano asegura que
existe un número positivo en el que f se anula. En otras palabras, el teorema prueba la exis-
√
tencia del número 2 y, como dicho número no es racional, deducimos que para probar el
teorema se precisa usar alguna propiedad que NO tienen los números racionales. Pero todas
las propiedades de los números reales que enunciamos en la primera lección las tienen tam-
bién los números racionales. Concluimos que los números reales deberán tener otra propiedad
que todavía no hemos considerado.
Comentamos el primer día que no debemos preocuparnos mucho por lo que sea el número
√
2, pero al menos deberíamos de tener alguna forma de probar su existencia; es decir, de las
propiedades de los números reales se debería poder deducir que hay un número cuyo cuadrado
√
es igual a 2. ¿Qué sabemos de 2? No es racional, pero podemos aproximarlo por racionales.
√
Con una calculadora obtenemos sucesivas aproximaciones racionales de 2 por defecto:
1,41, 1,414, 1,4142, 1,41421, 1,414213, ...
√
Es claro que 2 debe ser el menor número mayor que todas ellas. Pues bien, justamente
necesitamos una propiedad que garantice la existencia de ese “menor número mayor que”. Nos
vendrá bien introducir alguna terminología nueva.
4.7 Definición. Sea E un conjunto no vacío de números reales. Un número z ∈ R se dice que es
un mayorante o cota superior (resp. minorante o cota inferior) de E si x 6 z (resp. z 6 x) para
todo x ∈ E.
Si hay algún elemento de E que también sea mayorante (resp. minorante) de E, dicho ele-
mento es necesariamente único y se llama máximo (resp.
textbf mínimo) de E y lo representaremos por máx(E) (resp. mı́n(E) ).
Un conjunto que tiene algún mayorante (resp. minorante) se dice que está mayorado o
acotado superiormente (resp. minorado o acotado inferiormente). Un conjunto que está ma-
yorado y minorado se dice que está acotado.
Está claro que un conjunto puede no tener mínimo ni máximo. Los problemas de “optimi-
zación” consisten, justamente, en estudiar condiciones que garanticen la existencia de valores
máximos y mínimos para funciones de diversas clases. La siguiente propiedad garantiza que
ciertos conjuntos de números reales tienen mínimo.
P8 [Propiedad del supremo] Para todo conjunto de números reales no vacío y mayorado se
verifica que el conjunto de sus mayorantes tiene mínimo.
Con esta terminología lo que dice la propiedad del supremo es que todo conjunto de nú-
meros reales no vacío y mayorado tiene supremo (pero nótese que el supremo no tiene por qué
pertenecer al conjunto).
La propiedad del supremo es lo que distingue a los números reales de los racionales. Dicha
propiedad se usa para probar la existencia de números reales que cumplen alguna determinada
condición. La demostración del teorema de Bolzano es un ejemplo importante de ello.
Es suficiente probar que si f : [a, b] → R es continua y f (a) < 0 < f (b), entonces f se anula
en algún punto del intervalo ]a, b[ . Una buena estrategia para demostrar un teorema es “darlo
por demostrado” y trabajar hacia atrás. Tenemos que buscar un punto c ∈]a, b[ tal que f (c) = 0.
Por supuesto, puede haber muchos puntos donde f se anule (el teorema dice que al menos hay
uno), pero de todos ellos el más fácil de caracterizar es el “primero”, porque a la izquierda de él
la función es siempre negativa. Esto lleva a considerar el conjunto E de los puntos x ∈ [a, b] tales
que f toma valores negativos en [a, x]:
Por su definición, tenemos que E ⊂ [a, b] y a ∈E. La propiedad del supremo nos dice que hay un
número real, c, que es el supremo de E. Es evidente que a 6 c 6 b. La propiedad de conservación
local del signo implica que existe algún δ > 0 tal que a + δ < b − δ y f es negativa en todos los
puntos del intervalo [a, a + δ] y positiva en todos los puntos del intervalo [b − δ, b]. Esto implica
que a < c < b.
Veamos que [a, c[⊂ E. Sea a < xo < c. Como xo < c y c es el mínimo mayorante de E, tiene que
existir algún punto zo ∈E tal que xo < zo 6 c. Por tanto, si t ∈[a, xo ] también t ∈[a, zo ] y, como, zo ∈E,
será f (t) < 0, luego xo ∈ E. Nótese que hemos probado también que f (x) < 0 para todo x ∈ [a, c[.
Finalmente, probaremos que f (c) = 0. Como a la izquierda de c la función f toma valores nega-
tivos y f es continua, deducimos que no puede ser f (c) > 0 y, por tanto, f (c) 6 0. Pero tampoco
puede ser f (c) < 0, pues entonces, por la conservación local del signo, habría un intervalo de la
forma [c − ρ, c + ρ] ⊂ [a, b] tal que f (t) < 0 para todo t ∈ [c − ρ, c + ρ] lo que implica que en E hay
puntos mayores que c lo que es contradictorio. Concluimos así que f (c) = 0.
Hay consecuencias de este teorema que están lejos de ser evidentes. Por ejemplo, puede
probarse, con la ayuda del teorema de Bolzano, que si tenemos tres sólidos en el espacio (ima-
gina que son tres bocadillos de muy distintos tamaños), es siempre posible encontrar un plano
que los divida simultáneamente en partes iguales (puedes cortar a los tres bocatas exactamente
por la mitad de un sólo tajo).
4.9 Teorema (Teorema del valor intermedio). La imagen de un intervalo por una función con-
tinua es un intervalo.
Hemos demostrado así la evidencia inicial: una función continua en un intervalo toma todos
los valores comprendidos entre dos cualesquiera de sus valores.
4.10 Corolario (Existencia de raíces). Dados a > 0 y k ∈ N hay un único número c > 0 tal que
c k = a.
4.11 Corolario (Ceros de polinomios de grado impar). Toda función polinómica de grado im-
par se anula en algún punto.
4.12 Proposición (Propiedad del ínfimo). Para todo conjunto de números reales no vacío y mi-
norado se verifica que el conjunto de sus minorantes tiene máximo.
Con esta terminología lo que dice la propiedad del ínfimo es que todo conjunto de números
reales no vacío y minorado tiene ínfimo (pero nótese que el ínfimo no tiene por qué pertenecer
al conjunto).
4.3. Ejercicios
2. Sea f : [a, b] → R continua. Supongamos que a 6 f (x) 6 b para todo x en [a, b]. Prueba que
hay algún punto c ∈ [a, b] tal que f (c) = c.
3. Sea a > 1. Prueba que la ecuación x + e−x = a tiene al menos una solución positiva y otra
negativa.
4. Prueba que la ecuación x + ex + arc tg x = 0 tiene una sola raíz real. Da un intervalo de lon-
gitud uno en el que se encuentre dicha raíz.
5. Suponiendo que la temperatura varía de forma continua, prueba que siempre hay dos
puntos antípodas en el ecuador terrestre que están a la misma temperatura.
6. Sea f : [a, b] → R continua con f (a) = f (b). Dado n ∈ N, n > 2, prueba que hay algún punto
c ∈ [a, b − (b − a)/n] tal que f (c) = f (c + (b − a)/n).
8. Un reloj averiado marca inicialmente un tiempo t 0 . El reloj puede adelantar o atrasar, pero
cuenta con exactitud períodos de 12 horas, es decir, pasadas 12 horas el reloj marca un
tiempo t 0 + 12 horas. Demuestra que en algún momento dicho reloj mide con exactitud
una hora.
10. Sean f , g funciones continuas que no se anulan en un intervalo I, tales que ( f (x))2 = (g(x))2
para todo x ∈ I. Prueba que o bien f (x) = g(x) para todo x ∈ I, o bien f (x) = −g(x) para todo
x ∈ I. ¿Cuántas funciones hay ϕ : R → R continuas y verificando que (ϕ(x))2 = x2 para todo
x ∈ R?.
11. Justifica que toda función polinómica de grado impar se anula en algún punto.
12. Sea f : R → R continua y decreciente. Prueba que hay un único a ∈ R tal que f (a) = a.
Para probar desigualdades en las que intervienen supremos o ínfimos las siguientes ob-
servaciones, aunque evidentes, pueden ser útiles. Sea C ⊆ R un conjunto no vacío.
(I) Si queremos probar que un número real x verifica que sup(C) 6 x, lo que tenemos que
hacer es probar que x es un mayorante de C.
(II) Si queremos probar que un número real x verifica que x 6 ı́nf(C), lo que tenemos que
hacer es probar que x es un minorante de C.
13. Sean A, B conjuntos no vacíos de números reales. Supongamos que a 6 b para todo a ∈ A
y para todo b ∈ B. Prueba que sup A 6 ı́nf B.
A − B = {a − b : a ∈ A, b ∈ B}; AB = {ab : a ∈ A, b ∈ B}
15. Sea A un conjunto no vacío de números reales. Para cada x ∈ R definamos la “distancia
de x a A” por dist(x, A) = ı́nf{|x − a| : a ∈ A}. Prueba que para todos x, y ∈ R se verifica que:
16. Sea f : R → R continua, mayorada y tal que para todos a, b ∈ R con a < b, se verifica que
sup f (]a, b[) = sup f (R). Prueba que f es constante.
17. Sea f : [a, b] → R una función continua tal que f (a) < 0, f (b) < 0 y f (c) > 0 para algún
c ∈]a, b[. Prueba que hay dos números u, v tales que a < u < v < b, f (u) = f (v) = 0 y f (x) > 0
para todo x ∈]u, v[.
18. Sea f : [a, b] → R creciente. Supongamos que a 6 f (x) 6 b para todo x en [a, b]. Prueba que
hay algún punto c ∈ [a, b] tal que f (c) = c.
Sucesiones
Introducción
Las sucesiones aparecen de manera natural en muchos cálculos que responden a un esque-
2 6 2 1
ma iterativo. Por ejemplo, al dividir 2 entre 3 obtenemos = + , igualdad que podemos
3 10 3 10
usar ahora para obtener
2 6 6 2 1 1 6 6 2 1
= + + = + +
3 10 10 3 10 10 10 10 2 3 10 2
y de nuevo
2 6 6 6 2 1 1 6 6 6 2 1
= + + + = + + +
3 10 10 2 10 3 10 10 2 10 10 2 10 3 3 10 3
y así podemos continuar tantas veces como queramos, obteniendo para cada n ∈ N la igualdad:
n
2 X 6 2 1
= + .
3 10 k 3 10 n
k=1
n
X 6 2 2 1
Escribiendo xn = tenemos que 0 < − xn = . Nótese que, aunque los números xn
10 k 3 3 10 n
k=1
son todos ellos distintos de 2/3, dada una cota de error arbitrariamente pequeña ε > 0 y toman-
2 1
do n0 ∈ N de manera que < ε , deducimos que para todo número natural n>n0 se verifica
3 10 n0
que |xn − 2/3| < ε , lo que se expresa escribiendo 2/3 = lı́m {xn }.
n→∞
Este ejemplo está relacionado con la expresión decimal de 2/3 que, como todos sabemos, es
un decimal periódico con período igual a 6, lo que suele escribirse 2/3 = 0, b
6 igualdad en la que,
según se dice a veces, el símbolo 0, b
6 debe interpretarse como que el 6 se repite infinitas veces.
£Qué quiere decir esto? Lo que está claro es que, por mucho tiempo y paciencia que tengamos,
nunca podremos escribir infinitos 6 uno detrás de otro... bueno, podríamos escribir algo como
2
= 0, b
6 = 0, 6666666...( infinitos6)
3
45
46
lo que tampoco sirve de mucho pues seguimos sin saber cómo se interpreta esta igualdad. Pues
bien, para dar un significado matemático a lo que se quiere expresar con esa igualdad hay que
recurrir al concepto de límite de una sucesión tal como hemos hecho antes.
Veamos otro ejemplo en esta misma línea. Vamos a intentar calcular aproximaciones racio-
√ √ 10 √
nales a 10 . Si partimos inicialmente de un número x > 10, tendremos que < 10 < x.
x
1 10 √
Pongamos y = x+ . Entonces, en virtud de la desigualdad de las medias, 10 < y, y
2 x √
como también y < x , deducimos que y está más cerca de 10 que x. Podemos ahora repetir
√
este proceso sustituyendo x por y obteniendo una nueva aproximación mejor de 10. Nótese
que si x es racional también loserá y. Esto
sugiere que, partiendo
de un valor inicial, por ejem-
1 10 1 10
plo x1 = 4, calculemos x2 = x1 + , y después x3 = x2 + , y así podemos continuar
2 x1 2 x2
tantas veces como queramos, obteniendo para cada n ∈ N un número xn tal que
1 10
xn+1 = xn +
2 xn
con x1 = 4. Con una calculadora manual obtenemos enseguida los valores x2 = 3, 25;
x3 = 3, 1634615 ; x4 = 3, 1622779 con seis cifras decimales exactas:
√ x2 − 10 x2 − 10 0, 000005 1
0 < x4 − 10 = 4 √ < 4 < < 6
x4 + 10 6 6 10
√ √
es decir, x4 coincide con 10 hasta la sexta cifra decimal. De hecho, como xn > 10 tenemos
que:
√ 1 10 √ 1 1√ √ 1 √
0 < xn+1 − 10 = xn + − 10 < xn + 10 − 10 = (xn − 10)
2 xn 2 2 2
√ 1 √ 1
de donde se sigue que 0 < xn+1 − 10 < n (x1 − 10) < n , por tanto, dado cualquier ε > 0, y
2 2
tomando n0 ∈ N tal que 2−n0 < ε, deducimos que para todo número natural n > n0 se verifica
√ √
que |xn − 10 | < ε, lo que simbólicamente se expresa escribiendo 10 = lı́m {xn }.
n→∞
En los ejemplos anteriores hemos dado por supuesto que ya tienes cierta familiaridad con
los conceptos de “sucesión” y de “límite de una sucesión” de los cuales vamos a ocuparnos a
continuación con detalle.
Sea A un conjunto no vacío. Una sucesión de elementos de A es una aplicación del con-
junto N de los números naturales en A. En particular, una sucesión de números reales es una
aplicación del conjunto N de los números naturales en el conjunto R de los números reales.
En todo lo que sigue solamente consideraremos sucesiones de números reales por lo que
nos referiremos a ellas simplemente como “sucesiones”.
Dada una sucesión ϕ : N → R suele emplearse una notación especial para representarla. Pa-
ra n ∈ N suele notarse el número real ϕ(n) en la forma xn = ϕ(n) (naturalmente la letra “x” nada
tiene de especial y puede sustituirse por cualquier otra). La sucesión misma se representa por
ϕ = {xn }n∈N , es decir, el símbolo {xn }n∈N debe interpretarse como la aplicación que a cada n ∈N
hace corresponder el número real xn . Cuando no hay posibilidad de confusión escribimos sim-
plemente {xn } en vez de {xn }n∈N . Conviene insistir en que {xn } es, por definición, la aplicación
de N en R dada por n 7→ xn . No hay que confundir la sucesión {xn }, que es una aplicación, con
su conjunto imagen, que es el subconjunto de R formado por todos los números xn , el cual se
representa por {xn : n ∈ N}. Por ejemplo, {(−1)n } y {(−1)n+1 } son sucesiones distintas con el
mismo conjunto imagen. El número xn se llama término n-ésimo de la sucesión; para n = 1, 2, 3
se habla respectivamente de primero, segundo, tercer término de la sucesión.
5.1 Definición. Una sucesión {xn } se dice que converge a un número real x si, dado cualquier
número real ε > 0, existe un número natural mε tal que si n es cualquier número natural mayor
o igual que mε se cumple que |xn − x| < ε. Simbólicamente:
Se dice también que el número x es límite de la sucesión {xn } y se escribe lı́m {xn } = x o,
n→∞
simplemente, lı́m{xn } = x e incluso, si no hay posibilidad de confusión, {xn } → x.
En Matemáticas se dan definiciones para introducir nuevos conceptos y saber de qué es-
tamos hablando, pero las definiciones no suelen ser útiles para el cálculo. Por eso no debes
preocuparte si la definición anterior te parece difícil de aplicar en casos concretos. Debes hacer
un esfuerzo por comprenderla pero no tendrás que usarla para hacer cálculos.
5.2 Proposición. Supongamos que lı́m{xn } = x , lı́m{yn } = y y que existe m ∈ N tal que para todo
n > m se tiene que xn 6 yn . Entonces se verifica que x 6 y.
Respecto al resultado anterior, de muy fácil demostración, conviene advertir que aunque las
desigualdades sean estrictas no puede asegurarse que lı́m{xn } = x sea estrictamente menor que
lı́m{yn } = y. Por ejemplo, si xn = 0 e yn = 1/n, es claro que xn < yn para todo n ∈ N pero x = 0 = y.
5.3 Proposición (Principio de las sucesiones encajadas). Supongamos que {xn }, {yn }, {zn } son
sucesiones tales que lı́m{xn } = lı́m{zn } = α y existe un número natural m0 tal que para todo n > m0
se verifica que xn 6 yn 6 zn , entonces la sucesión {yn } es convergente y lı́m{yn } = α.
para todo p > m1 y todo q > m2 . Sea m3 = máx{m0 , m1 , m2 }. Para todo n > m3 las desigualdades (5.1)
se cumplen para p = q = n, además como n > m0 se tiene que xn 6 yn 6 zn . Deducimos que, para
todo n > m3 , se verifica que
α − ε < xn 6 yn 6 zn < α + ε
El principio de las sucesiones encajadas es de gran utilidad y se usa con mucha frecuen-
cia. Naturalmente, cuando apliquemos dicho principio a un caso concreto, la sucesión {yn } del
enunciado será la que queremos estudiar y tendremos que ser capaces de “inventarnos” las
sucesiones {xn } y {zn } de manera que se cumplan las condiciones del enunciado.
Observa que si una sucesión {xn } es creciente (resp. decreciente) entonces se verifica que
xm 6 xn (resp. xm > xn ) siempre que m 6 n.
Conviene advertir que cuando se dice que una sucesión es monótona no se excluye la posibi-
lidad de que, de hecho, sea estrictamente monótona. Es por ello que, en general, suele hablarse
de sucesiones monótonas y tan sólo cuando tiene algún interés particular se precisa si son es-
trictamente monótonas.
Demostración. Supongamos que lı́m{xn } = x. Todos los términos de {xn } a partir de uno en
adelante estarán en el intervalo ]x − 1, x + 1[, es decir, hay un número m ∈ N tal que para todo
n > m se verifica que |xn − x| < 1, lo que implica que
Tomando M = máx{1+|x|, |x1 |, · · · , |xm |}, tenemos que |xn | 6 M para todo n ∈ N.
La proposición anterior es útil a veces para probar que una sucesión no es convergente: para
ello basta probar que no está acotada.
En los resultados anteriores han intervenido de manera esencial las propiedades de la es-
tructura de orden de R. Vamos a estudiar ahora el comportamiento de las sucesiones conver-
gentes respecto de la adición y el producto de números reales. Los resultados que vamos a
obtener, conocidos tradicionalmente con el nombre de álgebra de límites, son básicos para el
estudio de la convergencia de sucesiones.
Dadas dos sucesiones {xn } e {yn }, se define su suma como la sucesión {xn + yn } y su producto
como la sucesión {xn yn }.
5.9 Proposición. El producto de una sucesión convergente a cero por una sucesión acotada es
una sucesión convergente a cero.
Demostración. Sea lı́m{xn } = 0, e {yn } acotada. Sea c > 0 tal que |yn | 6 c para todo n ∈ N. Dado
ε > 0, existe un número natural m tal que para todo n > m se verifica que |xn | < ε/c. Deducimos
ε
que, para todo n > m, se verifica que |xn yn | = |xn ||yn | < c = ε, lo que prueba que lı́m{xn yn } = 0.
c
5.10 Proposición (Álgebra de límites). Supongamos que lı́m{xn } = x y lı́m{yn } = y. Entonces se
verifica que:
lı́m{xn + yn } = x + y, lı́m{xn yn } = xy .
Si además suponemos que y , 0, entonces lı́m{xn /yn } = x/y.
para todo p > m1 y todo q > m2 . Sea m0 = máx{m1 , m2 }. Para todo n > m0 las desigualdades (5.2) se
cumplen para p = q = n, por lo que, sumándolas término a término, deducimos que x + y − ε <
xn + yn < x + y + ε cualquiera sea n > m0 , lo que prueba que lı́m{xn + yn } = x + y.
Finalmente, para probar que lı́m{xn /yn } = x/y, probaremos que la sucesión
xn x xn y − yn x
− =
yn y yn y
converge a cero, para lo cual, teniendo en cuenta que lı́m{xn y − yn x} = xy − yx = 0, bastará probar
que la sucesión {1/yn } está acotada. Puesto que lı́m{yn } = y, se deduce de la desigualdad ||yn | −
|y|| 6 |yn − y| que lı́m{|yn |} = |y|. Existirá, por tanto, un número m0 ∈ N tal que para todo n >
1 1 1 2 1
m0 es |yn | > |y|/2. Pongamos K = máx , ,..., , . Se tiene entonces que 6K
|y1 | |y2 | |ym0 | |y| |yn |
para todo n ∈ N. Hemos probado así que la sucesión {1/yn} está acotada, lo que concluye la
demostración del teorema.
Hay que leer con atención las hipótesis del teorema anterior para no hacer un uso incorrecto
del mismo. En particular, no hay que olvidar que la suma o el producto de dos sucesiones no
convergentes puede ser una sucesión convergente.
5.11 Definición. Sea {xn } una sucesión de números reales; dada una aplicación σ : N → N estric-
tamente creciente, la sucesión que a cada número natural n hace corresponder el número real
xσ(n) se representa por {xσ(n) } y se dice que es una sucesión parcial de {xn }. Nótese que {xσ(n)}
no es otra cosa que la composición de las aplicaciones {xn } y σ, esto es, {xσ(n) } = {xn } ◦ σ.
Se dice que un número real x es un valor de adherencia de la sucesión {xn } si hay alguna
sucesión parcial de {xn } que converge a x.
5.12 Ejemplo. Representemos por E(x) el mayor entero menor o igual que x. La sucesión {xn }
dada por xn = n/5 − E(n/5) para todo n ∈ N, tiene a 0, 1/5, 2/5, 3/5 y 4/5, como valores de adhe-
rencia.
En efecto, basta considerar que para cada j ∈ {0, 1, 2, 3, 4}, la sucesión parcial {x5n− j }n∈N viene
dada por x5n = 0, para j = 0, y x5n− j = 1 − j/5 para j = 1, 2, 3, 4.
5.13 Proposición. Si lı́m{xn } = x, toda sucesión parcial de {xn } también converge a x. En parti-
cular, una sucesión convergente tiene como único valor de adherencia su límite.
Observa que hay sucesiones, la de los números naturales por ejemplo, que no tienen ningún
valor de adherencia. También puede ocurrir que una sucesión tenga un único valor de adheren-
cia y no sea convergente. Por ejemplo, la sucesión dada para todo n∈N por xn = (1+ (−1)n )n + 1/n,
no es convergente y tiene a 0 como único valor de adherencia. Vamos a ver a continuación que
estos comportamientos no pueden darse con sucesiones acotadas.
Podemos visualizar el conjunto A como sigue. Consideremos en el plano los segmentos de ex-
tremos (n, xn ) y (n + 1, xn+1 ), n = 1, 2, 3, . . .. Resulta así una línea poligonal infinita y podemos
imaginar que dicha línea es el perfil de una cordillera cuyas cumbres y valles son los puntos
(n, xn ). Imaginemos ahora que los rayos de luz del Sol, paralelos al eje de abscisas, iluminan
dicha cordillera por el lado derecho (el Sol estaría, pues, situado en el infinito del eje de abs-
cisas positivo). Pues bien, un número natural n pertenece al conjunto A si el punto (n, xn ) está
iluminado y no pertenece a A si dicho punto está en sombra.
σ(1) = mı́n(A)
σ(n + 1) = mı́n{p ∈ A : σ(n) < p} para todo n ∈ N
Si A es finito podemos suponer que A = Ø. En tal caso, para todo n∈N hay algún p > n tal que
xn < x p (pues todo punto (n, xn ) está en sombra). Podemos definir ahora una aplicación σ : N → N
estrictamente creciente de la siguiente forma:
σ(1) = 1
σ(n + 1) = mı́n{p ∈ N : σ(n) < p y xσ(n) < x p } para todo n ∈ N
Resulta ahora evidente que la sucesión parcial {xσ(n) } es creciente (porque cada punto (σ(n), xσ(n) )
deja en la sombra al anterior).
5.15 Teorema (Teorema de Bolzano - Weierstrass). Toda sucesión acotada de números reales
tiene alguna sucesión parcial convergente.
Demostración. Sea {xn } una sucesión acotada. En virtud el lema anterior, hay una sucesión
parcial de {xn } que es monótona, dicha sucesión parcial está acotada por estarlo {xn } y, por
tanto, es convergente.
Si volvemos a leer la definición de sucesión convergente, parece que para estudiar la conver-
gencia de una sucesión {xn } debemos ser capaces de “adivinar”, de alguna manera, su posible
límite. De hecho, una idea bastante extendida consiste en pensar que es lo mismo probar la
convergencia de una sucesión que calcular su límite. Esto no es del todo correcto; son relativa-
mente pocas las sucesiones convergentes cuyo límite puede efectivamente calcularse. Cuando
se estudia la convergencia de una sucesión {xn }, la mayoría de las veces, lo que conocemos es,
justamente, la sucesión y, naturalmente, se desconoce su posible límite el cual pudiera, incluso,
no existir. Por ello interesa tener criterios de convergencia intrínsecos a la sucesión, es decir, que
no hagan intervenir a un objeto en principio extraño a ella como es su posible límite. Cono-
cemos ya un criterio de convergencia intrínseco para sucesiones monótonas. Usando dicho
X2n
1
criterio hemos probado la convergencia de la sucesión xn = sin necesidad de conocer su
k
k=n+1
límite.
5.16 Definición. Se dice que una sucesión {xn } satisface la condición de Cauchy, si para cada
número positivo, ε > 0, existe un número natural mε , tal que para todos p, q∈N con p>mε y q>mε
se verifica que |x p − xq | < ε.
La condición de Cauchy puede también expresarse de una manera equivalente, aunque for-
malmente distinta, como sigue:
Una sucesión {xn } satisface la condición de Cauchy, si para cada número positivo, ε > 0,
existe un número natural mε , tal que para todo p > mε y para todo número natural h, se verifica
que |x p+h − x p| < ε.
5.17 Teorema (Teorema de complitud de R). Una sucesión de números reales es convergente si,
y sólo si, verifica la condición de Cauchy.
Demostración. Supongamos que {xn } verifica la condición de Cauchy. Probemos primero que
{xn } está acotada. La condición de Cauchy implica que hay m0 ∈ N tal que |x p − xm0| < 1 para todo
p > m0 , y como |x p | 6 |x p − xm0| + |xm0|, deducimos que |x p | < 1 + |xm0| para p > m0 . En consecuencia
si definimos M = máx{|x1 |, |x2 |, . . . , |xm0|, 1+|xm0|}, obtenemos que |xn | 6 M para todo n ∈ N.
El teorema de Bolzano-Weierstrass garantiza que hay un número real x y una sucesión par-
cial {xσ(n) } que converge a x. Probaremos que {xn } también converge a x. Dado ε > 0, existe
no ∈ N tal que |x p − xq | < ε/2 siempre que p, q > no . También existe n1 ∈ N tal que |xσ(n) − x| < ε/2
siempre que n > n1 . Sea m = máx{no , n1 }. Para todo n > m se tiene que σ(n) > n > m por lo que
ε ε
|xn − x| 6 |xn − xσ(n)| + |xσ(n) − x| < + =ε
2 2
lo que prueba que lı́m {xn } = x.
n→∞
5.18 Definición. Una sucesión {xn } se dice que es positivamente divergente, y escribimos
{xn } → +∞, si para todo número real K > 0 existe un número natural mK ∈ N, tal que para
todo n ∈ N con n > mK se verifica que xn > K.
Una sucesión {xn } se dice que es negativamente divergente, y escribimos {xn } → −∞, si
para todo número real K < 0 existe un número natural mK ∈ N, tal que para todo n ∈ N con
n > mK se verifica que xn 6 K.
Diremos que una sucesión es divergente para indicar que es positivamente o negativamen-
te divergente.
ii) La suma de una sucesión positivamente divergente con una sucesión acotada es una sucesión
positivamente divergente.
iii) La suma de una sucesión positivamente divergente con una sucesión minorada es otra suce-
sión positivamente divergente. En particular, la suma de dos sucesiones positivamente divergen-
tes es otra sucesión positivamente divergente.
iv) El producto de dos sucesiones positivamente divergentes es otra sucesión positivamente diver-
gente.
v) El producto de una sucesión positivamente divergente por una sucesión que converge a un
número positivo es otra sucesión positivamente divergente.
i) {xn } → x ∈ R ⇐⇒ {e xn } → ex .
iii) {xn } → −∞ ⇐⇒ {e xn } → 0.
En consecuencia, las sucesiones del tipo {xn + yn} donde {xn } → +∞, {yn } → −∞, requieren un
estudio particular en cada caso. Tales sucesiones suele decirse que son una indeterminación
del tipo “∞−∞”.
Análogamente, si sabemos que {xn } → 0 y que {yn } es divergente, ello no proporciona nin-
guna información sobre el comportamiento de la sucesión {xn yn }; la cual se dice que es una
indeterminación del tipo “ 0 ∞”. Las indeterminaciones que aparecen al estudiar el cociente
de dos sucesiones divergentes o de dos sucesiones que convergen a cero, las llamadas inde-
terminaciones de los tipos “∞/∞′′ , “ 0/0”, pueden reducirse a una indeterminación del tipo
“ 0 ∞”.
5.21 Teorema (Criterio de Stolz). Sea {yn } una sucesión positivamente divergente y estrictamen-
Del Criterio de Stolz se deducen dos útiles criterios para estudiar la convergencia de suce-
siones de medias aritméticas o geométricas.
5.23 Proposición (Criterio de la media geométrica). Supongamos que {an } → L donde {an } es
una sucesión de números positivos y L es un número real o bien L = +∞. Entonces se verifica que
q
n
a1 a2 . . . an → L.
xn+1
5.24 Corolario. Supongamos que → L donde {xn } es una sucesión de números positivos
xn √
y L es un número real o bien L = +∞. Entonces se verifica que { n xn } → L.
Hay otras indeterminaciones que surgen al considerar sucesiones de potencias, es decir, su-
cesiones de la forma {xnyn } donde {xn } es una sucesión de números positivos e {yn } es una suce-
y
sión cualquiera de números reales. Puesto que xn n = exp(yn log(xn )), teniendo en cuenta la pro-
y
posición (5.20), la convergencia o divergencia de la sucesión {xn n } vendrá determinada por la
de {yn log(xn )}; la cual, a su vez, está determinada en todos los casos por el comportamiento de
las sucesiones {xn } e {yn }, excepto cuando dicha sucesión {yn log(xn )} es una indeterminación
del tipo “ 0 ∞”, lo que ocurre en los siguientes casos.
Cuando estudiemos las derivadas veremos algunas técnicas que permiten resolver en mu-
chos casos estas indeterminaciones.
5.25 Definición. Una sucesión de números complejos {zn } se dice que converge a un número
complejo z si, dado cualquier número real ε > 0, existe un número natural mε tal que si n es
cualquier número natural mayor o igual que mε se cumple que |zn − z| < ε. Simbólicamente:
Se dice que el número z es límite de la sucesión {zn } y se escribe lı́m {zn } = z o, simplemente,
n→∞
lı́m{zn } = z e incluso, si no hay posibilidad de confusión, {zn } → z.
{zn } → z ⇐⇒ |zn − z | → 0
Recordemos que máx{|Re z| , |Im z|} 6 |z | 6 |Re z| + |Im z|. Gracias a esta desigualdad tenemos que
)
|Re z n − Rez|
6 |z n − z| 6 |Re z n − Rez| + |Im z n − Imz|
|Im z n − Imz|
Deducimos que |z n − z| → 0 si, y sólo si, |Re z n − Re z| → 0 y |Im z n − Im z| → 0. Hemos probado así
el siguiente resultado.
5.26 Proposición. Una sucesión de números complejos {z n } es convergente si, y sólo si, las suce-
siones de números reales {Re z n } y {Im z n } son convergentes. Además, en dicho caso
Los resultados obtenidos para sucesiones de números reales en los que no interviene la es-
tructura de orden son también válidos para sucesiones de números complejos. Son válidos, en
particular, los resultados relativos a álgebra de límites, el teorema de Bolzano–Weierstrass y el
teorema de complitud.
5.3. Ejercicios
1. a) Sea {xn } una sucesión y supongamos que hay números ρ ∈]0, 1[, p ∈ N, tales que para
todo n > p es |xn+1 | 6 ρ|xn | . Prueba que lı́m{xn } = 0.
|xn+1 |
b) Sea {xn } una sucesión de números no nulos verificando que lı́m = λ, donde
|xn |
0 6 λ < 1. Prueba que lı́m{xn } = 0.
Aplicación. Dados a ∈] − 1, 1[, k ∈ N, prueba que lı́mn→∞ {nk an } = 0.
√
√ n−2+2 n
3. Utiliza la desigualdad de las medias para probar que n
n 6 . Deduce que
√ n
lı́m n n = 1.
1 · 3 · 5 · · ·(2n − 1) 1
4. Sea xn = . Prueba que xn < √ . Deduce que lı́m{xn } = 0.
2 · 4 · 6 · · ·2n 2n + 1
5. Como consecuencia inmediata de la formula del binomio de Newton, la desigualdad
(1 + x)n > 1 + nx es válida para todo x > 0. Usa dicha desigualdad para probar que la suce-
√ √
sión n n n + 1 − n n converge a 0.
√
1 + an − 1 1
6. Supongamos que {an } → 0. Prueba que lı́m = .
an 2
7. Sean a0 , a1 , . . . , a p números reales cuya suma es igual a cero. Justifica que
n √ √ √ √ o
lı́m a0 n + a1 n + 1 + a2 n + 2 + · · · + a p n + p = 0
n→∞
√
Sugerencia. Saca factor común n, resta a0 + a1 + · · · + a p y usa el ejercicio anterior.
an + bn p
an+1 = , bn+1 = an bn .
2
Justifica que las sucesiones así definidas son monótonas y convergen al mismo número
(que se llama media aritmético-geométrica de a1 y b1 ).
11. ¿Puede existir alguna sucesión acotada, {xn }, verificando que |xn − xm | > 10−75 siempre que
n , m? Razona tu respuesta.
12. Sea {xn } una sucesión de números reales y supongamos que existen ρ ∈]0, 1[, p ∈ N, tales
que |xn+2 − xn+1| 6 ρ|xn+1 − xn | para todo n > p. Prueba que {xn } es convergente.
Sugerencia. Deduce primero que |xn+2 − xn+1 | 6 ρn |x2 − x1 |. Teniendo ahora en cuenta que
para todos n, h ∈ N se verifica que:
ρn
ρn+h + ρn+h−1 + ρn+h−2 + · · · + ρn <
1−ρ
13. Sea I un intervalo cerrado (puede ser I = R); f : I → R una función, y supongamos que hay
un número α ∈]0, 1[ tal que
Supongamos además que f (x) ∈I para todo x ∈I. Dado un punto a ∈I, definamos {xn } por
x1 = a, y xn+1 = f (xn ) para todo n ∈ N. Prueba que {xn } converge a un punto x ∈ I que es el
único punto fijo de f , es decir, f (x) = x.
1k + 2k + 3k + · · · + nk
14. Sea k un número natural. Calcula el límite de la sucesión .
nk+1
15. Dadas dos funciones polinómicas P, Q, tales que el grado de Q es mayor
o igual que el
P(n)
grado de P y Q(n) , 0 para todo n ∈ N, justifica que la sucesión es convergente y
Q(n)
calcula su límite.
Introducción
Sabemos ya que la imagen, f (I), de un intervalo I por una función continua f es un intervalo.
Nos preguntamos ¿Es f (I) un intervalo del mismo tipo que I? Enseguida nos damos cuenta de
que no tiene por qué ser así.
2. f (x) = 1/x; f (]0, 1]) = [1, +∞[; f ([1, +∞[) =]0, 1].
Vemos así que la imagen por una función continua de un intervalo abierto, o semiabierto, o de
una semirrecta, puede ser un intervalo de distinto tipo. Nos queda por considerar qué ocurre
con los intervalos cerrados (y acotados), es decir, los de la forma [a, b]. Nótese que si f : [a, b] → R
es continua, para probar que f ([a, b]) es un intervalo cerrado y acotado basta probar que el
conjunto f ([a, b]) tiene máximo y mínimo, es decir, que hay números u, v ∈ [a, b] tales que para
todo x ∈ [a, b] es f (u) 6 f (x) 6 f (v), pues entonces será f ([a, b]) = [ f (u), f (v)].
6.1 Definición. Sea f : B → R . Se dice que f está acotada en E si el conjunto f (B) está acotado.
Se dice que f alcanza en B un máximo (resp. un mínimo) absoluto si el conjunto f (B) tiene
máximo (resp. mínimo), es decir, existe algún punto c ∈ B (resp. b ∈ B) tal que f (x) 6 f (c) (resp.
f (b) 6 f (x)) para todo x ∈ B.
6.2 Proposición. Sea f : A → R una función continua en un punto x ∈ A. Entonces para toda
sucesión {xn } de puntos de A que converge a x se verifica que la sucesión { f (xn )} converge a f (x).
59
Límite funcional 60
6.3 Teorema (Teorema de Weierstrass). Toda función continua en un intervalo cerrado y aco-
tado alcanza en dicho intervalo un máximo y un mínimo absolutos. En particular, toda función
continua en un intervalo cerrado y acotado está acotada en dicho intervalo.
Demostración. Sea f : [a, b] → R una función continua. Queremos probar que hay algún punto
c ∈ [a, b] en el que f alcanza un máximo absoluto.
Empezaremos probando que f está acotada en [a, b]. Razonamos por contradicción: supon-
dremos que f no está acotada y llegaremos a una contradicción. Si f no está acotada entonces
para cada n∈N tiene que haber algún punto xn ∈[a, b] tal que f (xn ) > n. La sucesión {xn } está aco-
tada y, por el teorema de Bolzano-Weierstrass, tiene alguna parcial yn = xσ(n) convergente. Sea
x = lı́m{xn }. Como a 6 yn 6 b se deduce que a 6 x 6 b y por tanto x ∈ [a, b] (aquí es donde se usa el
hecho de que [a, b] es un intervalo cerrado). Usando la proposición anterior y la continuidad de
f en x obtenemos que la sucesión { f (yn )} debe ser convergente. Pero esto es imposible porque
f (yn ) = f (xσ(n) ) > σ(n) > n lo que nos dice que la sucesión { f (yn )} no está acotada y por tanto no
puede ser convergente.
Como f está acotada, el conjunto f [a, b] es un conjunto acotado de números reales y, por
tanto, tiene supremo e ínfimo. Sea β = sup f [a, b]. Probaremos que β ∈ f [a, b]. Para cada n ∈ N
tiene que existir un zn ∈ [a, b] tal que β − 1/n 6 f (zn ) 6 β. Repitiendo el razonamiento anterior
obtenemos que la sucesión {zn } tiene alguna sucesión parcial convergente. Sin perder genera-
lidad, podemos suponer que la propia {zn } es convergente. Sea z = lı́m{zn }. Entonces z ∈ [a, b]
(por ser un intervalo cerrado) y f (z) = lı́m f (zn ) = β. En consecuencia f alcanza un máximo ab-
soluto en el punto z.
n
X
6.4 Proposición. Una función polinómica de grado par f (x) = ak xk alcanza un mínimo ab-
k=0
soluto en R si el coeficiente líder es positivo, an > 0, y alcanza un máximo absoluto en R si el
coeficiente líder es negativo, an < 0.
Podemos modificar un poco la situación anterior, suponiendo ahora que f está definida en
todo el intervalo I pero no es continua en a . En este caso queremos cambiar el valor de f en a ,
Nótese que ahora la condición “0 < |x − a|” es obligada porque nuestra función f no está defi-
nida en a de “forma apropiada”.
En los dos casos considerados la condición obtenida es la misma con independencia del hecho
de que f esté o no definida en a y, en caso de estarlo, del posible valor que f pueda tener en a.
Por ello, en lo que sigue consideraremos la siguiente situación.
Es fácil probar que el límite de una función en un punto, si existe, es único. Una consecuencia
inmediata de la definición dada es el siguiente resultado.
6.6 Proposición. Sea f : I → R una función definida en un intervalo y sea a ∈ I. Equivalen las
afirmaciones siguientes:
i) f es continua en a.
En la recta real es posible distinguir si nos acercamos “por la derecha” o “por la izquierda” a un
punto. Ello conduce de forma natural a la consideración de los límites laterales que pasamos a
definir.
Supongamos que:
A) El conjunto {x ∈I : a < x} no es vacío. En tal caso, se dice que f tiene límite por la derecha
en a, si existe un número α ∈ R tal que se verifica lo siguiente:
)
a < x < a+δ
∀ε ∈ R ∃ δ ∈ R :
+ +
=⇒ | f (x) − α| < ε
x∈I
B) El conjunto {x∈I : x < a} no es vacío. En tal caso, se dice que f tiene límite por la izquierda
en a, si existe un número β ∈ R tal que se verifica lo siguiente:
)
a − δ < x < a
∀ε ∈ R+ ∃ δ ∈ R+ : =⇒ | f (x) − β| < ε
x∈I
Dicho número se llama límite por la izquierda de f en a y, simbólicamente, escribimos
lı́m f (x) = β .
x→a
x<a
a) lı́m f (x) = L.
x→a
b) x→a
lı́m f (x) = x→a
lı́m f (x) = L.
x<a x>a
Límites en infinito
Sea f : I → R una función definida en un intervalo no mayorado I. Se dice que f tiene límite
en +∞ si existe un número L ∈ R tal que se verifica lo siguiente:
)
x > K
∀ε ∈ R+ ∃ K ∈ R+ : =⇒ | f (x) − L| < ε
x∈I
6.7 Proposición. Sea f una función y sean a, L ∈ R ∪ {+∞, −∞}. Equivalen las afirmaciones:
i) lı́m f (x) = L
x→a
ii) Para toda sucesión {xn } de puntos en el dominio de definición de f , tal que {xn } → a con xn , a,
se verifica que { f (xn )} → L.
Si f tiene límite en a y lı́m f (x) , f (a), se dice que f tiene en el punto a una discontinui-
x→a
dad evitable.
Si alguno de los límites laterales no existe se dice que f tiene en el punto a una disconti-
nuidad esencial.
Es evidente que el concepto de límite es, al igual que el de continuidad en un punto, un con-
cepto local; la existencia del límite de una función en un punto a depende solamente del com-
portamiento de la función en los puntos próximos al punto a.
Es importante advertir que el concepto de límite lateral es un caso particular del concepto ge-
neral de límite de una función en un punto. Por ello, cualquier resultado referente a límites de
funciones en un punto puede ser convenientemente enunciado para límites laterales sin más
que considerar la restricción de la función a la derecha o a la izquierda del punto en cuestión.
6.8 Teorema (Álgebra de límites). Supongamos que f y g tienen límite en a donde aceptamos
que a puede ser un número real, o +∞, o −∞. Se verifica entonces que:
1 1
ii) Si lı́m f (x) , 0, entonces lı́m =
x→a x→a f (x) lı́m f (x)
x→a
iii) Si f (x) 6 g(x) para todo x ∈ I, x , a, entonces lı́m f (x) 6 lı́m g(x)
x→a x→a
iv) Supongamos que f (x) 6 h(x) 6 g(x) para todo x ∈ I, x , a y lı́m f (x) = lı́m g(x) = L. Entonces
x→a x→a
se verifica que h tiene límite en a y lı́m h(x) = L.
x→a
6.9 Teorema. Supongamos que f es positivamente divergente en a, lı́m f (x) = +∞, donde acep-
x→a
tamos que a puede ser un número real, o +∞, o −∞.
i) Supongamos que hay un número M ∈ R tal que g(x) > M para todo x ∈ I, x , a . Entonces
lı́m ( f + g)(x) = +∞.
x→a
ii) Supongamos que hay un número M > 0 tal que g(x) > M para todo x ∈ I, x , a . Entonces
lı́m ( f g)(x) = +∞.
x→a
6.10 Teorema. Supongamos que lı́m f (x) = 0, y que hay un número M > 0 tal que |g(x)| 6 M para
x→a
todo x ∈ I, x , a . Entonces lı́m ( f g)(x) = 0.
x→a
6.11 Teorema. Si g es continua en el punto L = lı́m f (x), entonces lı́m (g ◦ f )(x) = g(L). Simbólica-
x→a x→a
mente:
lı́m (g ◦ f )(x) = g(lı́m f (x))
x→a x→a
6.12 Teorema (Límites de una función monótona). Sea f una función creciente definida en un
intervalo I.
6.13 Teorema (Discontinuidades de las funciones monótonas). Sea f una función monótona
en un intervalo. Entonces:
i) En los puntos del intervalo que no son extremos del mismo, f solamente puede tener dis-
continuidades de salto.
ii) Si el intervalo tiene máximo o mínimo, f puede tener en dichos puntos discontinuidades
evitables.
6.14 Teorema (Continuidad de una función monótona). Una función monótona definida en
un intervalo es continua si, y sólo si, su imagen es un intervalo.
y deducimos que
lı́m f (x) = f (a) = x→a
x→a
lı́m f (x)
x<a x>a
esto es, f es continua en a. Análogamente se prueba que si I contiene a alguno de sus extremos
entonces f es continua también en esos puntos.
Teniendo en cuenta que la función inversa de una función estrictamente monótona es también
estrictamente monótona (y del mismo tipo), se deduce de lo anterior el siguiente importante
resultado.
El siguiente resultado se demuestra haciendo uso del teorema de los ceros de Bolzano y se-
rá usado en el próximo capítulo para obtener una importante propiedad de las funciones con
derivada distinta de cero. Su demostración no añade nada nuevo a lo que ya sabemos y por eso
no la incluyo aquí; pero lo que se afirma en él es muy intuitivo: si una función es continua e in-
yectiva en un intervalo entonces es claro que su gráfica no puede subir y bajar, en consecuencia
o siempre sube o siempre baja.
6.16 Teorema (Funciones continuas e inyectivas en intervalos). Una función continua e in-
yectiva definida en un intervalo es estrictamente monótona.
Frecuentemente hay que estudiar el límite de una suma o producto de dos funciones preci-
samente cuando las reglas que hemos visto anteriormente no pueden aplicarse. Se trata de
aquellos casos en que el comportamiento de las funciones f + g, f g, no está determinado por el
de f y g. Por ejemplo, si sabemos que lı́m f (x) = +∞ y que lı́m g(x) = −∞, ¿qué podemos decir
x→a x→a
en general del comportamiento en el punto a de la función f + g? Respuesta: absolutamente
nada. En consecuencia, para calcular un límite del tipo lı́m ( f + g)(x) donde lı́m f (x) = +∞ y
x→a x→a
lı́m g(x) = −∞ se requiere un estudio particular en cada caso. Suele decirse que estos límites son
x→a
una indeterminación del tipo “∞−∞”.
es una indeterminación del tipo “ 0 ∞”. Las indeterminaciones que aparecen al estudiar el
cociente de dos funciones divergentes o de dos funciones con límite cero, es decir, las llamadas
indeterminaciones de los tipos “∞/∞”, “ 0/0”, pueden reducirse a una indeterminación del
tipo “ 0 ∞”.
Todavía hemos de considerar nuevas indeterminaciones que van a surgir al considerar funcio-
nes de la forma f (x) g(x) donde f es una función que toma valores positivos y g es una función
cualquiera. Puesto que:
f (x) g(x) = exp(g(x) log f (x))
teniendo en cuenta los resultados anteriores, el límite lı́m f (x) g(x) vendrá determinado por el
x→a
límite lı́m g(x) log f (x), el cual, a su vez, está determinado en todos los casos por el comporta-
x→a
miento en el punto a de las funciones f y g, excepto cuando dicho límite es una indetermina-
ción del tipo “ 0 ∞”, lo que ocurre en los siguientes casos:
Ni que decir tiene que no hay técnicas generales que permitan “resolver las indeterminacio-
nes”, ¡no serían tales si las hubiera! Es por ello que, los límites indeterminados, requieren un
estudio particular en cada caso. Es un hecho que la mayoría de los límites que tienen algún in-
terés matemático son límites indeterminados. Cuando estudiemos las derivadas obtendremos
técnicas que permitirán calcular con comodidad dichos límites.
Los resultados que siguen son de gran utilidad para calcular límites. Su justificación se verá
más adelante.
6.17 Proposición. Sea a un número real o +∞ o −∞. En los apartados b1), b2) y b3) se supone
que f (x) > 0.
xα
III ) lı́m = 0 para todos α > 0 y µ > 0.
x→+∞ e µx
6.6. Ejercicios
1. Sea f : [a, b] → R continua. Supongamos que para cada x ∈ [a, b] hay algún y ∈ [a, b] tal que
9
| f (y)| 6 10 | f (x)|. Prueba que f se anula en algún punto de [a, b].
2. Sea f : [a, b] → R continua. Prueba que la función g : [a, b] → R dada por g(x) = máx f ([a, x]),
(a 6 x 6 b), es continua.
3. Sea f : [a, b] → R continua, pongamos M = máx f ([a, b]), m = mı́n f ([a, b]) y supongamos que
f (a) = f (b) y que m < f (a) < M. Prueba que f toma todo valor de [ f (a), M[∪]m, f (a)] en al
menos dos puntos de [a, b].
5. Prueba que, dado x ∈ R, la ecuación logt + t 5 = x tiene una única solución, que represen-
tamos por ϕ(x). Justifica que la función x 7→ ϕ(x), (x ∈ R), así definida es continua.
6. Sea f : [0, 1] → R continua verificando que | f (s)− f (t)| > |s−t| para todos s,t ∈[0, 1], y f ({0, 1}) =
{0, 1}. Prueba que o bien es f (x) = x para todo x ∈ [0, 1], o bien es f (x) = 1 − x para todo
x ∈ [0, 1].
8. Justifica que una función polinómica de grado par o bien alcanza un máximo en R o bien
alcanza un mínimo absoluto en R.
Derivadas
Introducción
Los orígenes del Cálculo estuvieron motivados por el deseo de resolver diversos problemas
vinculados al movimiento de los cuerpos, así como problemas de tipo geométrico de impor-
tancia en Óptica y problemas de cálculo de valores máximos y mínimos de una función dada.
Simplificando podemos destacar dos problemas principales:
Determinar el área encerrada por una curva (el problema de las cuadraturas).
Son los conceptos de derivada e integral, respectivamente, los que permiten resolver satisfacto-
riamente dichos problemas. Mientras que el concepto de integral tiene sus raíces en la antigüe-
dad clásica, la otra idea fundamental del Cálculo, la derivada, no se formuló hasta el siglo XVII.
Fue el descubrimiento efectuado por Sir Isaac Newton (1642-1727) y Gottfried Wilhelm Leib-
nitz (1646-1716) de la relación entre estas dos ideas, tan dispares en apariencia, lo que inició
el magnífico desarrollo del Cálculo. Si bien los trabajos de Newton y Leibnitz son decisivos por
sus aportaciones e influencia, no hay que olvidar que ellos son el punto culminante de un largo
proceso en el que han participado científicos de la talla de Johannes Kepler (1571-1630), René
Descartes (1596-1650), Pierre de Fermat (1601-1665), John Wallis (1616-1703) e Isaac Barrow
(1630-1677) entre otros.
Para entender los resultados del Cálculo diferencial es necesario, antes que nada, compren-
der la idea básica del mismo: el concepto de derivada. La derivada de una función puede in-
terpretarse geométricamente como la pendiente de una curva, y físicamente como una razón
“instantánea” de cambio.
69
Concepto de derivada. Interpretación física y geométrica 70
A principios del siglo XVII no se sabía cómo calcular la tangente a una curva en un punto de la
misma. Este problema se presentaba con frecuencia en mecánica, en óptica y en geometría.
Vamos a estudiar el concepto general de tangente a una curva en un punto dado. En general,
no es un asunto sencillo hallar la pendiente de esta tangente. La razón es que, en principio, se
necesita para ello otro punto, además del de tangencia. Supongamos que queremos hallar la
tangente a la curva de ecuación cartesiana y = f (x) en el punto (a, f (a)). La estrategia, usada
primero por Pierre de Fermat y más tarde por Newton, consiste en aproximar la tangente por
rectas secantes cuyas pendientes sí pueden calcularse directamente. En particular, considérese
la recta que une el punto (a, f (a)) con un punto cercano, (x, f (x)), de la gráfica de f . Esta recta
se llama una secante (recta que corta, pero no es tangente a la curva). La pendiente de esta
secante es:
f (x) − f (a)
x−a
dicho número suele llamarse cociente incremental de f en a.
Razón de cambio
Muchas leyes de la Física, la Química, la Biología o la Economía, son funciones que relacionan
una variable “dependiente” y con otra variable “independiente” x, lo que suele escribirse en la
forma y = f (x). Si la variable independiente cambia de un valor inicial a a otro x , la variable y
lo hace de f (a) a f (x). La razón de cambio promedio de y = f (x) con respecto a x en el intervalo
[a, x] es:
f (x) − f (a)
Razón de cambio promedio =
x−a
Con frecuencia interesa considerar la razón de cambio en intervalos cada vez más pequeños.
Esto lleva a definir lo que podemos llamar “razón de cambio puntual de y = f (x) con respecto a
x en el punto a” como:
f (x) − f (a)
lı́m .
x→a x−a
El ejemplo más conocido de esto que decimos es el de una partícula que se mueve a lo lar-
go de una recta sobre la cual hemos elegido un origen. Sea f (t) la distancia de la partícula al
origen en el tiempo t. La razón de cambio promedio tiene en este caso una interpretación fí-
sica natural. Es la velocidad media de la partícula durante el intervalo de tiempo considerado.
Parece intuitivo que, en cada instante, la partícula se mueve con una determinada velocidad
instantánea. Pero la definición corriente de velocidad es en realidad una definición de veloci-
dad media; la única definición razonable de velocidad instantánea es como la razón de cambio
puntual. Es importante darse cuenta de que la velocidad instantánea es un concepto teórico, y
una abstracción, que no corresponde exactamente a ninguna cantidad observable.
Notación. En lo que sigue las letras I, J representan intervalos no vacíos de números reales.
Dicho número L se llama la derivada de f en a y suele representarse por f ′ (a) (notación debida
a Lagrange) y también, a veces, por d df (x)
x (notación de Leibnitz).
x=a
Observaciones
f (x) − f (a) f (a + h) − f (a)
i) El límite lı́m se escribe también en la forma lı́m .
x→a x−a h→0 h
ii) La derivabilidad de f en un punto a ∈ I es una propiedad local, depende solamente del com-
portamiento de f en los puntos de I próximos al punto a. Concretamente, si J es cualquier
intervalo abierto que contiene el punto a, se verifica que f es derivable en a si, y sólo si, la fun-
ción restricción f|I∩J es derivable en a y, por supuesto, en tal caso ambas funciones tienen la
misma derivada en a.
f (x) − f (a)
lı́m .
x→a
x<a
x−a
f (x) − f (a)
lı́m .
x→a
x>a
x−a
Teniendo en cuenta la relación que hay entre el límite de una función en un punto y los límites
laterales, es claro que:
a) f es derivable en a.
b) Las derivadas por la izquierda y por la derecha de f en a existen y coinciden.
El siguiente resultado nos dice que la derivabilidad es una propiedad más fuerte que la conti-
nuidad.
f (x) − f (a)
f (x) = f (a) + (x − a) (x ∈ I, x , a)
x−a
se sigue que lı́m f (x) = f (a), es decir, f es continua en a.
x→a
7.4 Teorema (Reglas de derivación). Sean f g : I → R dos funciones. Se verifican las siguientes
afirmaciones:
ii) Si g(x) , 0 para todo x ∈ I, la función cociente f /g es derivable en todo punto a ∈ I en el que
f y g sean derivables en cuyo caso se verifica que:
′
f f ′ (a)g(a) − f (a)g ′(a)
(a) =
g (g(a))2
7.5 Corolario. Las funciones polinómicas son derivables en todo punto y las funciones racionales
son derivables en todo punto de su conjunto natural de definición. Además la derivada de la
función polinómica f (x) = a0 + a1x + a2x2 + · · · + anxn en cada punto x ∈ R viene dada por:
h(x) − h(a)
Demostración. Pongamos b = f (a). Tenemos que probar que lı́m = g ′ (b) f ′ (a). Por
x→a x−a
hipótesis se cumple que :
g(y) − g(b) f (x) − f (a)
lı́m lı́m = g ′ (b) f ′ (a)
y→b y − b x→a x−a
La idea de la demostración es hacer en esta igualdad la sustitución y = f (x). Como no está ga-
rantizado por las hipótesis hechas que para x , a se tenga f (x) , b, no está justificado hacer
directamente la sustitución indicada (dividir por cero está prohibido). Podemos evitar esta di-
ficultad como sigue. Definamos la función ϕ : J → R por:
g(y) − g(b)
ϕ(y) = (y , b), ϕ(b) = g ′ (b)
y−b
Con ello la función ϕ es continua en b. Es inmediato ahora comprobar que para todo x ∈ I con
x , a se verifica que:
h(x) − h(a) f (x) − f (a)
= ϕ( f (x)) (1)
x−a x−a
ahora, como f es continua en a (porque es derivable en a) y ϕ es continua en b = f (a), se sigue
que ϕ ◦ f es continua en a, por lo que:
log x e x −1 log(1 + x)
lı́m = 1; lı́m = 1; lı́m = 1; lı́m (1 + x) 1/x = e
x→1 x − 1 x→0 x x→0 x x→0
Deducimos también un importante resultado que permite resolver en muchos casos las inde-
terminaciones “1∞ ” y “ 0 ∞”.
g(x)
ii) lı́m f (x) = +∞ si, y sólo si, lı́m g(x)( f (x) − 1) = +∞.
x→a x→a
iii) lı́m f (x) g(x) = 0 si, y sólo si, lı́m g(x)( f (x) − 1) = −∞.
x→a x→a
si, y sólo si
lı́m g(x)( f (x) − 1)) = L ∈ R ∪ {+∞} ∪ {−∞}
x→a
lo que prueba las afirmaciones hechas.
7.8 Proposición. Sean f , g : I → R, a ∈ I y g(x) > 0 para todo x ∈ I. Se verifica entonces que:
i) f es derivable en a si, y sólo si, la función h(x) = exp( f (x)) es derivable en a en cuyo caso
h′ (a) = f ′ (a) exp( f (a)).
ii) g es derivable en a si, y sólo si, la función ϕ(x) = log(g(x)) es derivable en a en cuyo caso
g ′ (a)
ϕ ′ (a) = .
g(a)
iii) Si f y g son derivables en a la función ψ(x) = [g(x)] f (x) también es derivable en a y
g ′ (a)
ψ ′ (a) = ψ(a) log(g(a)) f ′ (a) + f (a)
g(a)
Las funciones seno y coseno son derivables en todo punto verificándose que:
sen ′ (x) = cos x cos ′ (x) = − sen x.
En particular, se verifica que:
sen x cos x − 1
lı́m = 1, lı́m = 0.
x→0 x x→0 x
Las derivadas de las demás funciones trigonométricas se deducen con facilidad a partir de las
derivadas del seno y del coseno.
Las derivadas de las funciones hiperbólicas y de sus inversas se deducen con facilidad de las
derivadas del logaritmo y de la exponencial. Se comprueba sin dificultad que:
1
senh ′ (x) = cosh x, cosh ′ (x) = senh x, argsenh ′ (x) = p
x2 + 1
1 −1 −1
argcosh ′ (x) = p , argsech ′ (x) = p , argcosech ′ (x) = p
x2 − 1 x x2 − 1 x x2 + 1
Los resultados más útiles del cálculo diferencial se refieren a funciones derivables en todos
los puntos de un intervalo. El teorema del valor medio es frecuentemente atribuido a Joseph
Louis Lagrange; no obstante, fue publicado por vez primera en 1806 por el físico André Marie
Ampére que justificaba el resultado usando ideas de Lagrange y suponiendo que la función
derivada era continua lo cual, como se verá enseguida, es innecesario. Quince años más tarde
Augustin Louis Cauchy volvió a probar el teorema con las mismas hipótesis. El teorema del
valor medio es uno de los resultados más útiles del Cálculo. Su utilidad se debe principalmente
a que dicho teorema permite acotar el incremento de una función cuando se conoce una cota
de su derivada.
Michel Rolle (1652-1719) fue miembro de la Académie des Sciences y en 1691 estudiando
un método para resolver ecuaciones estableció sin demostrar el teorema que ahora lleva su
nombre que, como veremos, es esencialmente equivalente al teorema del valor medio.
7.9 Definición. Dada una función f : I → R derivable en todo punto de I, la función derivada
de f es la función f ′ : I → R que a cada punto x ∈ I hace corresponder la derivada de f en dicho
punto.
7.10 Definición. Dada una función cualquiera f : I → R, se dice que f tiene en un punto a ∈ I
un máximo relativo (resp. mínimo relativo) si hay algún número r > 0 tal que ]a − r, a + r[⊆ I y
∀x ∈]a − r, a + r[ se verifica que f (x) 6 f (a) (resp. f (x) > f (a)). La expresión extremo relativo se
utiliza para referirse indistintamente a un máximo o a un mínimo relativo.
(b, f (b))
El siguiente resultado nos dice que en los extremos relativos de una función derivable la tan-
gente es horizontal.
Es importante observar que esta condición necesaria no es suficiente. Por ejemplo, la función
f (x) = x3 no tiene ningún extremo relativo en R pero f ′ (0) = 0.
7.12 Teorema (Teorema de Rolle). Sea f : [a, b] → R una función continua en [a, b], derivable en
]a, b[ y verificando que f (a) = f (b). Entonces existe algún punto c ∈]a, b[ tal que f ′ (c) = 0.
Demostración
nula. Si {u, v} , {a, b}, entonces alguno de los puntos u, v está en ]a, b[ y es un extremo relativo
de f por lo que, en virtud de la proposición anterior, concluimos que la derivada de f se anula
en algún punto de ]a, b[.
7.13 Teorema (Teorema del valor medio). Sea f : [a, b] → R una función continua en [a, b], de-
rivable en ]a, b[. Entonces existe algún punto c ∈]a, b[ tal que
f (b) − f (a)
f ′ (c) =
b−a
Demostración. Definamos una función g : [a, b] → R por g(x) = λ f (x) + µ x donde λ, µ son nú-
meros que elegiremos por la condición de que g(a) = g(b), es decir λ( f (a) − f (b)) = µ(b − a).
Para ello basta tomar λ = b − a y µ = f (a) − f (b). Podemos aplicar ahora el teorema de Rolle
a la función g(x) = (b − a) f (x) + ( f (a) − f (b))x, para deducir que hay un punto c ∈]a, b[ tal que
g ′ (c) = (b − a) f ′ (c) + ( f (a) − f (b)) = 0, lo que concluye la demostración.
(b, f (b))
(a, f (a)) α
f (b) − f (a)
tg(α) = = f ′ (c)
b−a
a c b
7.14 Proposición. Sea f una función derivable en un intervalo I, y supongamos que existe M > 0
tal que | f ′ (x)| 6 M para todo x∈I. Entonces se verifica que | f (x) − f (y)| 6 M|x − y| para todos x, y∈I.
En particular, si f ′ (x) = 0 para todo x ∈ I entonces f es constante en I.
f (x) − f (a)
lo que prueba que x→a
lı́m = L, es decir, f es derivable por a izquierda en a y la derivada
x<a
x−a
por la izquierda de f en a es igual a L.
El resto de las afirmaciones del enunciado se deducen fácilmente de lo anterior.
Demostración. Supongamos que f ′ (x) > 0 para todo x ∈ I. Dados dos puntos u, v ∈ I con u < v,
podemos aplicar el teorema del valor medio a f en el intervalo [u, v] para deducir que existe
c∈]u, v[ tal que f (v)− f (u) = f ′ (c)(v−u) > 0, por lo que f (u) 6 f (v), es decir f es creciente. Recípro-
f (x) − f (a)
camente, si f es creciente en I entonces para todos a, x∈I, con x , a, se tiene que > 0,
x−a
lo que implica que:
f (x) − f (a)
lı́m = f ′ (a) > 0.
x→a x−a
7.18 Teorema. Sea f : I → R derivable en el intervalo I con f ′ (x) , 0 para todo x ∈ I. Se verifica
entonces que:
Demostración. Dados dos puntos u, v ∈ I con u , v, podemos razonar como antes para obtener
que existe c ∈]u, v[ tal que f (v) − f (u) = f ′ (c)(v − u) , 0. Hemos probado así que f es inyectiva en
el intervalo I. Como, además f es continua en I (por ser derivable), podemos usar un resultado
del capítulo anterior para deducir que f es estrictamente monótona en I. Es suficiente tener en
cuenta ahora el resultado inmediatamente anterior para concluir la demostración.
Es importante advertir que el resultado anterior nos dice que si una función f es derivable en
un intervalo y la derivada f ′ toma valores positivos y negativos, entonces f ′ se anula en algún
punto. Este resultado recuerda mucho al teorema de los ceros de Bolzano para funciones con-
tinuas en un intervalo, con una notable diferencia: aquí no exigimos que la función derivada f ′
sea continua. De hecho, se verifica el siguiente resultado.
7.19 Teorema (Propiedad del valor intermedio para derivadas). Sea ϕ una función definida
en un intervalo I que es la derivada de alguna función en dicho intervalo. Entonces se verifica
que la imagen por ϕ de I, ϕ(I), es un intervalo.
Demostración. Por hipótesis hay una función derivable f : I → R tal que ϕ(x) = f ′ (x) para todo
x ∈ I. Sean u = ϕ(a), v = ϕ(b) dos valores que toma la función ϕ, y supongamos u < v. Dado
λ ∈]u, v[, definimos la función g(x) = f (x) − λx. Tenemos entonces g ′ (a) = ϕ(a) − λ = u − λ < 0 y
g ′ (b) = ϕ(b) − λ = v − λ > 0. Por tanto la derivada de g toma valores positivos y negativos en
el intervalo I y, por tanto, tiene que anularse, es decir, existe algún punto c ∈ I tal que g ′ (c) =
ϕ(c) − λ = 0, esto es, ϕ(c) = λ. Hemos probado así que si ϕ toma dos valores también toma todos
los comprendidos entre ellos dos; es decir que ϕ(I) es un intervalo.
1
( f −1 ) ′ (y) = (y ∈ J).
f ′ ( f −1 (y))
f −1 (y) − f −1 (b)
h( f −1 (y)) =
y−b
1 1
arc tg ′ (x) = (x ∈ R), arc sen ′ (x) = p (x ∈] − 1, 1[)
1 + x2 x2 − 1
7.21 Teorema (Teorema del valor medio generalizado). Sean f , g : [a, b] → R funciones conti-
nuas en [a, b] y derivables en ]a, b[. Entonces existe algún punto c ∈]a, b[ tal que
Demostración. Definimos una función h(x) = λ f (x) + µ g(x) donde λ, µ son números que se
eligen de forma que g(a) = g(b), esto es, λ( f (a) − f (b)) = µ(g(b) − g(a)). Basta para ello to-
mar λ = g(b) − g(a), µ = f (a) − f (b). El teorema del Rolle, aplicado a la función h(x) = (g(b) −
g(a)) f (x) − ( f (b) − f (a))g(x), nos dice que hay un punto c∈]a, b[ tal que h ′ (c) = 0, lo que concluye
la demostración.
7.22 Teorema. Sean −∞ 6 a < b 6 +∞, f y g funciones derivables en ]a, b[ con g ′ (x) , 0, para
todo x∈]a, b[. Sea α∈{a, b} y supongamos que se verifica alguna de las dos condiciones siguientes:
b) lı́m |g(x)| = +∞
x→α
Y además
f ′ (x)
lı́m = L ∈ R ∪ {+∞, −∞}
x→α g ′ (x)
Demostración. Antes de dar una demostración al uso vamos a explicar por qué la hipóte-
sis de que el cociente de las derivadas tiene límite implica que también lo tiene el cocien-
te de las funciones. Para fijar ideas, consideremos el caso en que α = a es un número real y
lı́m f (x) = lı́m g(x) = 0. Definamos f (a) = g(a) = 0. Nótese que aunque el punto (g(x), f (x)) re-
x→α x→α
corre una trayectoria en en plano que termina en (0, 0) cuando x = a, el límite lı́m f (x)/g(x) no
x→a
tiene por qué existir. Ello se debe a que la proximidad a (0, 0) del punto (g(x), f (x)) no nos pro-
porciona ninguna información sobre el valor del cociente f (x)/g(x). Baste considerar que en
un círculo centrado en (0, 0) de radio ε, hay puntos (u, v) para los que el cociente u/v puede to-
mar cualquier valor. Geométricamente, podemos interpretar f (x)/g(x) como la pendiente de la
recta que une (0, 0) con el punto (g(x), f (x)). Si imaginamos la trayectoria que recorre el punto
(g(x), f (x)) como una curva, Γ, en el plano que termina en (0, 0), parece evidente que, cuando
dicho punto está muy próximo a (0, 0), el número f (x)/g(x) está muy próximo a la pendiente
de la tangente a Γ en (g(x), f (x)). Nótese que como f y g no se suponen derivables en x = a, no
está garantizado que Γ = {(g(x), f (x)) : x ∈ I} tenga tangente en el origen, es decir, para x = a.
Podemos, sin embargo, calcular la pendiente de la tangente a Γ en puntos distintos del origen.
Para ello observemos que las hipótesis hechas implican que g es inyectiva, por lo que, llamando
J = g(I), es claro que Γ = {(t, f (g−1 (t))),t ∈J}; es decir, Γ es la gráfica de la función h : J → R dada
por h(t) = f (g−1 (t)). Las hipótesis hechas garantizan que h es derivable en J y su derivada, es
decir, la pendiente de la tangente a Γ en el punto (t, f (g−1 (t))), viene dada por:
f ′ (g−1 (t))
h ′ (t) = .
g ′ (g−1 (t))
Para obtener la pendiente de la tangente a Γ en el punto (g(x), f (x)) basta sustituir t por g(x) en
la igualdad anterior, es decir, dicha pendiente viene dada por:
f ′ (x)
h ′ (g(x)) =
g ′ (x)
El dibujo siguiente puede ser de ayuda:
f ′ (xo )
y = f (xo ) + (x − g(xo))
g ′ (xo )
Γ
f (x)
f (xo )
y= g(xo ) x
y = Lx
f (xo )
g(xo ) g(x)
f (xo ) f ′ (xo )
≅ ≅L
g(xo ) g ′ (xo )
A la vista de lo anterior, se comprende ahora que si exigimos que f ′ (x)/g ′ (x) tenga límite L en el
punto a, estamos obligando a que el cociente f (x)/g(x) también tenga límite igual a L en a. En el
dibujo se ha supuesto que L es un número real, pero está claro que puede suponerse también
L = +∞ o L = −∞, lo que corresponde a los casos en que Γ tiene tangente vertical en el origen.
Daremos ahora una demostración formal del teorema en dos casos particulares.
Supongamos que α = a y L son números reales y lı́m f (x) = lı́m g(x) = 0. Definamos f (a) = g(a) = 0.
x→a x→a
Dado x ∈ I, x , a, aplicamos el teorema del valor medio generalizado a las funciones f y g en
el intervalo [a, x] para obtener cx ∈]a, x[ tal que ( f (x) − f (a))g ′ (cx ) = (g(x) − g(a)) f ′ (cx ), es decir,
f (x)g ′ (cx ) = g(x) f ′ (cx ). Las hipótesis hechas implican que g es estrictamente monótona en I y,
como g(a) = 0, deducimos que g(x) , 0 para todo x ∈ I. Obtenemos así que:
f (x) f ′ (cx )
= ′ (1)
g(x) g (cx )
′
f (t)
Por hipótesis, dado ε > 0, existe δ > 0 tal que para a < t < a + δ es ′ − L < ε. Deducimos de
g (t)
la igualdad (1) que si a < x < a + δ se tiene que:
f (x)
g(x) − L < ε.
Hemos probado así que lı́m f (x)/g(x) = L. Los casos en que L = +∞, L = −∞ se tratan de la
x→a
misma forma.
Supongamos que α = a y L son números reales y lı́m |g(x)| = +∞. Esta última condición implica
x→a
que g(x) , 0 para todo x∈I suficientemente próximo al punto a, y por el carácter local del límite
no es restrictivo suponer que g(x) , 0 para todo x ∈ I. Nótese también que las hipótesis hechas
implican que g es inyectiva en I. La hipótesis lı́m f ′ (x)/g ′ (x) = L, nos dice que dado ε > 0, hay
x→a
un número (fijo en lo que sigue) c ∈ I, tal que para a < t 6 c se verifica que:
′
f (t) ε
− L< (1)
g ′ (t) 4
Como lı́m |g(x)| = +∞, hay un número δ > 0 tal que a + δ 6 c y para a < x < a + δ se verifica que:
x→a
Hemos probado así que lı́m f (x)/g(x) = L. Los casos en que L = +∞, L = −∞ se tratan de la
x→a
misma forma.
Los demás casos tienen un tratamiento similar y también pueden reducirse a los ya estudiados
sin más que invertir la variable.
Nótese que, tal y como las hemos enunciado, las reglas de L’Hôpital permiten calcular límites
por la derecha y por la izquierda en un punto y, por tanto, podemos usarlas para calcular el
límite en un punto de un intervalo que no sea extremo del mismo.
Observemos que una función f derivable en un punto a puede ser aproximada localmente por
una función polinómica P(x) = f (a) + f ′ (a)(x − a) de grado 6 1, de forma que
f (x) − P(x)
lı́m =0
x→a x−a
Es natural preguntarse si, en el caso de que f sea derivable n veces en a, existirá una función
polinómica P de grado 6 n, de forma que
f (x) − P(x)
lı́m = 0.
x→a (x − a)n
verifica que P (k) (a) = Q (k) (0) = f (k) (a) para k = 0, 1, . . . , n y es el único polinomio de grado 6 n
que cumple dichas condiciones.
7.23 Definición. Sea f una función n veces derivable en un punto a. La función polinómica
n
X f (k) (a)
Tn ( f , a) definida para todo x ∈ R por Tn ( f , a)(x) = f (a) + (x − a)k se llama el polinomio
k!
k=1
de Taylor de orden n de f en a.
7.24 Teorema (Teorema de Taylor-Young). Sea f una función n veces derivable en un punto a,
y sea Tn ( f , a) el polinomio de Taylor de orden n de f en a. Entonces se verifica que:
f (x) − Tn ( f , a)(x)
lı́m = 0.
x→a (x − a)n
El siguiente resultado, consecuencia directa del que acabamos de probar, es muy útil para cal-
cular límites.
7.25 Corolario. Sea f una función definida en un intervalo I que es n + 1 veces derivable en un
punto a ∈ I, y sea Tn ( f , a) el polinomio de Taylor de orden n de f en a. Entonces se verifica que:
f (x) − Tn ( f , a)(x) 1
lı́m n+1
= f (n+1) (a).
x→a (x − a) (n + 1)!
Cuando en un ejercicio te piden calcular un límite, es casi seguro que se trata de una “in-
determinación”. Te recuerdo que aquellos límites de sumas, productos, cocientes o potencias
de funciones en los que el resultado no está predeterminado por el comportamiento particular
de cada una de las funciones se llaman “límites indeterminados”. La palabra “indeterminado”
quiere decir simplemente que se trata de límites cuyo cálculo no puedes hacerlo aplicando las
reglas básicas del “álgebra de límites” y tienes que usar alguna técnica apropiada para calcular-
los. Los límites interesantes son casi siempre de este tipo.
Las reglas de L’Hôpital son muy útiles para resolver las indeterminaciones, pero yo pienso
que se abusa de ellas. Las aplicamos sin pensar dos veces lo que hacemos, nos dejamos llevar
por la comodidad que proporcionan (aunque no siempre) y acabamos calculando límites de
forma mecánica sin saber muy bien qué es lo que hacemos. No tengo nada en contra de ellas,
tan sólo me parece que su uso casi exclusivo y de forma mecánica es empobrecedor. Por el
contrario, pienso que cada límite debe intentarse de la forma más adecuada a su caso. Para eso
tienes que fijarte en cómo es la función, relacionarla con otras parecidas, tratar de relacionar el
límite que te piden con otros bien conocidos, . . .
Voy a contarte las estrategias que suelo usar para calcular límites. Esencialmente, puedo
resumirlas en dos:
Vayamos con la primera. Si te preguntas qué entiendo por límites bien conocidos, la respues-
ta es bien fácil: los que siguen a continuación.
Observa que todos ellos, con la excepción de cuatro, son derivadas en el punto x = 0 de
las respectivas funciones. Por ello no son difíciles de recordar. Ahora bien, estos límites suelen
aparecer algo disfrazados. Realmente, más que como límites concretos, debes considerarlos
como modelos.
¿Entiendes lo que pasa? Esto puede hacerse con cualquiera de los límites. La justificación de
estos resultados es consecuencia de que la composición de funciones continuas es continua.
Como consecuencia, los límites de la lista anterior son muchos más de los que aparecen en ella.
Si te acostumbras a reconocerlos cuando vengan disfrazados podrás ahorrarte mucho trabajo
innecesario.
Vamos a la segunda estrategia. Sustituir funciones por otras más sencillas. Esto se basa en la
idea siguiente. Supón que estás calculando un límite de la forma lı́m f (x)g(x) y tú conoces otra
x→a
h(x)
función h(x) tal que lı́m = 1; entonces puedes sustituir en el límite lı́m f (x)g(x) la función
x→a f (x) x→a
f (x) por h(x) sin que ello afecte para nada al valor del límite.
7.28 Definición. Se dice que las funciones f y h son asintóticamente equivalentes en el punto
h(x)
a, y se escribe f (x) ∼ g(x) (x → a), cuando lı́m = 1.
x→a f (x)
Las estrategias anteriores son las más básicas, pero tengo otras un poco más elaboradas.
Esencialmente consisten en aplicar el teorema de Taylor-Young para tratar de reducir ciertos
límites al límite de un cociente de dos polinomios. Bueno, sorpresa, todos los límites de la lista
de límites bien conocidos son, sin excepción, casos particulares del teorema de Taylor-Young.
Ahora después te pondré algunos ejemplos de esta forma de proceder. Pero, para que pue-
das usar con comodidad este método, tienes que saberte de memoria, o ser capaz de deducirlos
en poco tiempo, los polinomios de Taylor de las funciones elementales. Además, esta forma de
proceder se adapta más a unos casos que a otros y tan sólo con la práctica se aprende cuándo
conviene usarla.
Notación de Landau
x → a y se lee f (x) es un infinitésimo de orden superior que g(x) en el punto a . La idea es que f (x)
tiene a cero más rápidamente que g(x) cuando x → a. Si no hay lugar a confusión, omitimos la
precisión “cuando x → a”.
Con esta notación, el teorema de Taylor-Young puede expresarse f (x) − Tn ( f , x, a) = o(x − a)n
cuando x → a. Lo que suele escribirse
Esta última igualdad suele llamarse en algunos textos Teorema de Taylor con resto infinitesimal
o forma infinitesimal del resto de Taylor. No es otra cosa que el teorema de Taylor–Young escrito
con la notación de Landau.
Lo interesante de esta notación es que si, por ejemplo, ϕ(x) = o(x − a) p y ψ(x) = o(x − a)q ,
ϕ(x)
entonces ϕ(x)ψ(x) = o(x − a) p+q y, si p > q, = o(x − a) p−q y (ϕ(x) + ψ(x)) = o(x − a)q. Además,
ψ(x)
si H(x) es una función acotada en un intervalo abierto que contenga al punto a y sabemos que
ϕ(x) = o(x − a) p entonces también H(x)ϕ(x) = o(x − a) p. Veamos los ejemplos prometidos.
(tg x)(arc tg x) − x2
7.30 Ejemplo. Si tratas de calcular por L’Hôpital el límite lı́m tendrás que ser
x→0 x6
paciente porque necesitarás derivar por lo menos cinco veces y en el numerador hay un pro-
ducto cuyas derivadas se van haciendo cada vez más complicadas. Ahora, si calculas los poli-
nomios de Taylor de orden 5 de tg x y arc tg x en a = 0, obtendrás que
1 2 1 1
tg x = x + x 3 + x 5 + o(x 6), arc tg x = x − x 3 + x 5 + o(x 6)
3 15 3 5
observa que como se trata de funciones impares sus derivadas de orden par en x = 0 son nulas,
por eso los polinomios anteriores son, de hecho, los polinomios de Taylor de orden 6 y eso
2
explica que aparezca el término o(x 6 ). Deducimos que tg x arc tg x = x 2 + x 6 + o(x 7 ) y
9
(tg x)(arc tg x) − x 2 2/9 x 6 + o(x 7 ) 2
lı́m = lı́m =
x→0 x6 x→0 x6 9
2
Observa que aunque tg x ∼ x y arc tg x ∼ x para x → 0, se tiene que tg x arc tg x − x 2 ∼ x 6 para x → 0.
9
Fíjate que al calcular el producto
1 2 1 1
tg x arc tg x = (x + x 3 + x 5 + o(x 6 ))(x − x 3 + x 5 + o(x 6))
3 15 3 5
tan sólo nos interesan las potencias de x hasta la de orden 6 inclusive, las demás potencias y
los términos de la forma x o(x 6 ), x 2 o(x 6 ), o(x 6 )o(x 6 ), etc. son todos ellos funciones de la forma
o(x7 ) y su suma también es una función de la forma o(x7 ) por lo que no es preciso calcularlos
para hacer el límite. Observa que, al proceder de esta manera, tienes que calcular las 5 prime-
ras derivadas en x = 0 de las funciones tg(x) y arc tg(x) pero te ahorras el trabajo de derivar su
producto. Si aún tienes dudas, calcula el límite por L’Hôpital y compara.
1
(cos x − 1)(log(1 + x) − x) − x 4
7.31 Ejemplo. Se trata de calcular lı́m 4 . Tenemos que
x→0 x5
1 1
cos x = 1 − x 2 + o(x 3 ), log(1 + x) = x − x 2 + o(x 3 )
2 2
1
luego (cos x − 1)(log(1 + x) − x) = x 4 + o(x 5 ), de donde se sigue que
4
1
(cos x − 1)(log(1 + x) − x) − x 4
lı́m 4 =0
x→0 x5
La estrategia general para calcular límites de sucesiones se basa en la proposición (6.7) que,
para tu comodidad, vuelvo a enunciar aquí.
Proposición. Sea f una función y sean a, L ∈ R ∪ {+∞, −∞}. Equivalen las afirmaciones:
i) lı́m f (x) = L
x→a
ii) Para toda sucesión {xn } de puntos en el dominio de definición de f , tal que {xn } → a con
xn , a, se verifica que { f (xn )} → L.
Una consecuencia inmediata de este resultado es que todo límite funcional que conozcas te
va a permitir resolver muchos límites de sucesiones. En particular, de la lista de límites básicos
que debes conocer se deducen los siguientes resultados.
7.32 Proposición. Para toda sucesión {xn } → 0 se verifica que
sen xn arc sen xn 1 − cosxn 1 arc tg xn tg xn
lı́m =1 lı́m =1 lı́m = lı́m =1 lı́m =1
n→∞ xn n→∞ xn n→∞ xn 2 2 n→∞ xn n→∞ xn
exn −1 xn − senxn 1 (1 + xn)α − 1 log(1 + xn)
lı́m =1 lı́m 3
= lı́m =α lı́m =1
n→∞ xn n→∞ (xn ) 6 n→∞ xn n→∞ xn
tg xn − xn 1 log(1 + xn) − xn −1
lı́m = lı́m =
n→∞ (xn ) 3 3 n→∞ xn 2 2
Por tanto, tu estrategia para calcular límites de sucesiones va a consistir en convertir el lí-
mite de la sucesión que tienes que calcular en un caso particular de un límite funcional. El por
qué de esta estrategia es que para calcular límites de funciones disponemos de muchas más
herramientas que las que tenemos para trabajar directamente con sucesiones (criterio de Stolz
y sus consecuencias).
log(n)
7.33 Ejemplo. Se trata de calcular el límite de la sucesión yn = √ .
n( n n − 1)
√ √
Para ello nos fijamos en que en el denominador aparece n n − 1. Poniendo xn = n n, sa-
bemos que xn → 1. La sucesión cuyo límite queremos calcular recuerda el límite funcional
log x log x
lı́mx→1 = 1. Pongamos f (x) = . Como caso particular de este límite funcional, tene-
x−1 x−1
mos que f (xn ) → 1, y es claro que f (xn ) = yn . Hemos probado así que yn → 1 y todo lo que hemos
tenido que hacer es relacionar dicho límite con un límite funcional que ha resultado ser (cosa
muy frecuente) una derivada: la derivada de la función log x en el punto x = 1.
7.34 Proposición (Criterio de equivalencia logarítmica). Sean {xn } una sucesión de números
positivos distintos de 1 que converge a 1, {yn } una sucesión cualquiera y L un número real. En-
tonces se tiene que:
y
i) lı́m{xn n } = eL ⇐⇒ lı́m{yn (xn − 1)} = L.
y
ii) {xn n } → +∞ ⇐⇒ {yn (xn − 1)} → +∞.
El siguiente resultado nos dice que para estudiar la convergencia de un producto de varias
sucesiones podemos sustituir las que queramos por otras que sean asintóticamente equivalen-
tes, sin que ello afecte a la convergencia o divergencia del producto ni a su eventual límite.
7.37 Proposición. Sean {xn } e {yn } sucesiones asintóticamente equivalentes y {zn } una sucesión
cualquiera. Se verifica que:
i) {xn zn } es convergente si, y sólo si, {yn zn } es convergente, en cuyo caso ambas sucesiones tienen
el mismo límite.
ii) {xn zn } es divergente si, y sólo si, {yn zn } es divergente, en cuyo caso ambas sucesiones son diver-
gentes del mismo tipo.
En particular, {xn } es convergente (resp. divergente) si, y sólo si, {yn } es convergente (resp. di-
vergente), en cuyo caso ambas tienen igual límite (resp. son divergentes del mismo tipo).
y/n
lı́m{nϕn } = lı́m{n }=y
1 + x/n
El siguiente resultado es de gran utilidad para el estudio de los extremos relativos de una
función.
Demostración. Basta observar que, en virtud de las hipótesis hechas, se verifica que:
f (x) − f (a) 1
lı́m n
= f (n) (a) , 0
x→a (x − a) n!
En virtud del teorema de conservación local del signo, existe un número r > 0 tal que ]a − r, a +
r[⊂ I y para x ∈]a − r, a + r[, x , a se verifica que:
para a − r < x < a y (x − a)n > 0 para a < x < a + r, deducimos que para a − r < x < a, f (x) − f (a)
tiene signo opuesto al que tiene para a < x < a + r. En consecuencia f no tiene un extremo
relativo en a.
El siguiente resultado es importante porque permite acotar el error que se comete al aproximar
f (x) por Tn ( f , a)(x) .
7.39 Teorema (Teorema de Taylor). Sea f una función n + 1 veces derivable en un intervalo
I. Dados dos puntos cualesquiera x, a en I con x , a, se verifica que existe algún punto c en el
intervalo abierto de extremos a y x tal que:
f (n+1) (c)
f (x) − Tn ( f , a)(x) = (x − a)n+1.
(n + 1)!
Demostración
En lo que sigue el punto x y el punto a están fijos. Definamos la función g : I → R dada para todo
t ∈ I por:
Xn
f (k) (t)
g(t) = f (x) − (x − t)k
k!
k=0
f (n+1) (t)
Se comprueba fácilmente que g ′ (t) = − (x − t)n . Aplicamos ahora el teorema del valor
n!
medio generalizado a las funciones g y h(t) = (x − t)n+1 en el intervalo de extremos x y a para ob-
tener que hay un punto c comprendido entre x y a tal que (h(x) − h(a))g ′ (c) =
= (g(x) − g(a))h ′(c). Como g(x) = h(x) = 0, obtenemos que:
f (n+1) (c)
(x − a)n+1 (x − c)n = g(a)(n + 1)(x − c)n.
n!
Simplificando, y teniendo en cuenta que g(a) = f (x) − Tn ( f , a)(x), se obtiene la igualdad del
enunciado.
Sea f : I → R una función derivable en el intervalo I. Se dice que f es una función convexa
en I si la gráfica de f queda siempre por encima de la recta tangente en cualquier punto, es
decir, si para todo par de puntos x, a ∈I se verifica que f (x) > f (a) + f ′ (a)(x − a). Se dice que f es
cóncava si − f es convexa.
7.40 Proposición. Sea f : I → R una función dos veces derivable en el intervalo I. Se verifica
entonces que f es convexa si, y sólo si, f ′ ′ (x) > 0 para todo x ∈ I.
7.41 Definición (Puntos de inflexión). Se dice que a es un punto de inflexión de una función f ,
si hay un número r > 0 tal que f es cóncava en el intervalo ]a − r, a[ y f es convexa en el intervalo
]a, a + r[ (o al revés). Es decir, los puntos en los que una función pasa de cóncava a convexa o de
convexa a cóncava se llaman puntos de inflexión.
7.4. Ejercicios
Empezaremos con algunas de las aplicaciones más sencillas y atractivas del cálculo dife-
rencial. En esquema, se trata de lo siguiente: calcular la tasa de variación de una magnitud
cuando se conoce la tasa de variación de otra magnitud relacionada con ella. En este tipo
de ejercicios la “tasa de variación” se interpreta como una derivada y, en la mayoría de los
casos, basta usar la regla de la cadena para obtener lo que se pide. Hay que elegir las uni-
dades de acuerdo con los datos del problema; por ejemplo, si un volumen se mide en litros
tendremos que medir longitudes con decímetros.
1. ¿Con qué rapidez baja el nivel del agua contenida en un depósito cilíndrico si estamos
vaciándolo a razón de 3000 litros por minuto?
3. Se está llenando un depósito cónico apoyado en su vértice a razón de 9 litros por segundo.
Sabiendo que la altura del depósito es de 10 metros y el radio de la tapadera de 5 metros,
¿con qué rapidez se eleva el nivel del agua cuando ha alcanzado una profundidad de 6
metros?
4. El volumen de un cubo está aumentando a razón de 70 cm3 por minuto. ¿Con qué rapidez
está aumentando el área cuando la longitud del lado es de 12 cm?
5. Un barco A se desplaza hacia el oeste con una velocidad de 20 millas por hora y otro
barco B avanza hacia el norte a 15 millas por hora. Ambos se dirigen hacia un punto O del
océano en el cual sus rutas se cruzan. Sabiendo que las distancias iniciales de los barcos
A y B al punto O son, respectivamente, de 15 y de 60 millas, se pregunta: ¿A qué velocidad
se acercan (o se alejan) los barcos entre sí cuando ha transcurrido una hora? ¿Y cuando
han transcurrido 2 horas? ¿En qué momento están más próximos uno de otro?
6. Una bola esférica de hielo se está derritiendo de forma uniforme en toda la superficie, a
razón de 50 cm3 por minuto. ¿Con qué velocidad está disminuyendo el radio de la bola
cuando este mide 15 cm?
Una de las aplicaciones más útiles de las derivadas es a los problemas de optimización.
En dichos problemas se trata, por lo general, de calcular el máximo o el mínimo absolutos
de una magnitud. Hay una gran variedad de problemas que responden a este esquema y
con frecuencia tienen contenido geométrico o económico o físico. Por ello cada uno de estos
ejercicios requiere un estudio particular. Los siguientes consejos pueden ser útiles:
a) Entiende bien el problema. Haz, si es posible, un dibujo o un esquema.
b) Elige las variables y la magnitud, Q, que tienes que optimizar.
c) Estudia las relaciones entre las variables para expresar la magnitud Q como función de
una sola de ellas, Q = f (x).
d) Las condiciones del problema deben permitir establecer el dominio de f .
e) Estudia la variación del signo de la derivada de f en su dominio para calcular máximos
y mínimos absolutos.
7. Dado un punto P = (a, b) situado en el primer cuadrante del plano, determina el segmento
con extremos en los ejes coordenados y que pasa por P que tiene longitud mínima.
8. Demuestra que entre todos los rectángulos con un perímetro dado, el que tiene mayor
área es un cuadrado.
9. Determina el rectángulo con lados paralelos a los ejes coordenados, inscrito en la elipse
x2 y2
de ecuación 2 + 2 = 1, y que tenga área máxima.
a b
10. Calcula el área máxima de un rectángulo que tiene dos vértices sobre una circunferencia
y su base está sobre una cuerda dada de dicha circunferencia.
13. Se quiere construir una caja sin tapa con una lámina metálica rectangular cortando cua-
drados iguales en cada esquina y doblando hacia arriba los bordes. Halla las dimensiones
de la caja de mayor volumen que puede construirse de tal modo si los lados de la lámina
rectangular miden: a) 10 cm. y 10 cm. b) 12 cm. y 18 cm.
14. Calcula las dimensiones (radio y altura) de una lata cilíndrica de un litro de capacidad
cuya superficie total sea mínima.
15. Calcula las dimensiones (radio y altura) de una lata cilíndrica de un litro de capacidad
cuyo costo de producción sea mínimo. Se supone que no se desperdicia aluminio al cortar
los lados de la lata, pero las tapas de radio r se cortan de cuadrados de lado 2r por lo que
se produce una pérdida de metal.
16. Calcula la longitud de la escalera más larga que llevada en posición horizontal puede pa-
sar por la esquina que forman dos corredores de anchuras respectivas a y b.
17. Calcula las dimensiones del rectángulo de área máxima que puede inscribirse dentro de
un semicírculo de radio 2.
18. Se necesita construir un depósito de acero de 500 m3 , de forma rectangular con base cua-
drada y sin tapa. Tu trabajo, como ingeniero de producción, es hallar las dimensiones del
depósito para que su costo de producción sea mínimo.
19. Halla el volumen del cilindro circular recto más grande que puede inscribirse en una es-
fera de radio (a > 0).
20. Halla el volumen del cilindro circular recto más grande que puede inscribirse en un cono
circular recto de altura h y radio r conocidos.
21. Halla el volumen del cono circular recto más grande que puede inscribirse en una esfera
de radio (a > 0).
24. Una empresa tiene 100 casas para alquilar. Cuando la renta es de 80 libras al mes, todas
las casas están ocupadas. Por cada 4 libras de incremento de la renta una casa queda des-
habitada. Cada casa alquilada supone a la empresa un coste de 8 libras para reparaciones
diversas. ¿Cuál es la renta mensual que permite obtener mayor beneficio?
25. Una empresa produce semanalmente 300 bicicletas de montaña que vende íntegramen-
te al precio de 600 euros cada una. Tras un análisis de mercados observa que si varía el
precio, también varían sus ventas (de forma continua) según la siguiente proporción: por
cada 7 euros que aumente o disminuya el precio de sus bicicletas, disminuye o aumenta
la venta en 3 unidades.
26. En la orilla de un río de 100 metros de ancho está situada una planta eléctrica y en la
orilla opuesta, y a 500 metros río arriba, se está construyendo una fábrica. Sabiendo que
el río es rectilíneo entre la planta y la fábrica, que el tendido de cables a lo largo de la orilla
cuesta a 9 euros cada metro y que el tendido de cables sobre el agua cuesta a 15 euros cada
metro, ¿cuál es la longitud del tendido más económico posible entre la planta eléctrica y
la fábrica?.
27. Se proyecta un jardín en forma de sector circular de radio R y ángulo central θ (medido
en radianes). El área del jardín ha de ser A fija. ¿Qué valores de R y θ hacen mínimo el
perímetro del jardín?.
28. Se corta un alambre de longitud L formando un círculo con uno de los trozos y un cua-
drado con el otro. Calcula por dónde se debe cortar para que la suma de las áreas de las
dos figuras sea máxima o sea mínima.
29. Dados dos puntos A y B situados en el primer cuadrante del plano, dígase cuál es el ca-
mino más corto para ir de A a B pasando por un punto del eje de abscisas.
30. Se desea construir una ventana con forma de rectángulo coronado de un semicírculo de
diámetro igual a la base del rectángulo. Pondremos cristal blanco en la parte rectangular y
cristal de color en el semicírculo. Sabiendo que el cristal coloreado deja pasar la mitad de
luz (por unidad de superficie) que el blanco, calcula las dimensiones de la ventana para
conseguir la máxima luminosidad si se ha de mantener un perímetro constante dado.
31. Se desea confeccionar una tienda de campaña cónica de un volumen determinado. Cal-
cula sus dimensiones para que la cantidad de lona necesaria sea mínima.
32. Se desea construir un silo, con un volumen V determinado, que tenga la forma de un ci-
lindro rematado por una semiesfera. El costo de construcción (por unidad de superficie)
es dable para la semiesfera que para el cilindro (la base es gratis). Determínense las di-
mensiones óptimas para minimizar el costo de construcción.
33. Demuestra que de todos los triángulos isósceles que se pueden circunscribir a una cir-
cunferencia de radio r, el de área mínima es el equilátero de altura 3r.
x2 y2
34. (*) Se considera la elipse + = 1. Calcula el triángulo isósceles de área máxima inscri-
a2 b2
to en dicha elipse, que tiene un vértice en el punto (0, b) y base paralela al eje de abscisas.
35. Con una cuerda de longitud L, en la que en uno de sus extremos hemos hecho un nudo
corredizo, rodeamos una columna circular de radio R haciendo pasar el otro extremo por
el nudo. Calcula la máxima distancia posible del extremo libre al centro de la columna.
Uno de los resultados más útiles del cálculo diferencial son las Reglas de L’Hôpital que per-
miten resolver las indeterminaciones en el cálculo de límites.
36. Calcula el límite en el punto a que en cada caso se indica de las funciones f :]0, π/2[→ R.
2
f (x) = (sen x + cosx)1/x , a = 0; f (x) = (1 + tgx)1/x , a = 0
1/x2
x2
f (x) = (cot x)sen x , a = 0, π/2; 2
f (x) = cos x + , a=0
2
log(sen x)
f (x) = (1 + sen x)cotg x , a = 0, π/2; f (x) = , a = π/3
(π − 1x)2
x − arc tgx (tg x)(arc tg x) − x2
f (x) = , a = 0; f (x) = , a=0
sen3 x √ x6
ex − cos 8 x − x sen x 1/(1−cosx)
f (x) = , a = 0; f (x) = , a=0
tg3 x x
37. Calcula el límite en el punto a que en cada caso se indica de las funciones f : R+ → R.
x2 sen 1/x √ √
f (x) = , a = +∞; f (x) = sen 1 + x − sen x, a = +∞
log x
x3
1 π
f (x) = sen x sen , a = 0, a = +∞; f (x) = cos , a = +∞
x x+2
38. Sea g : R → R derivable en R y dos veces derivable en 0 siendo, además, g(0) = 4. Defina-
g(x)
mos f : R → R por f (x) = si x , 0, f (8) = g ′ (0). Estudia la derivabilidad de f . ¿Es f ′
x
continua en 0?.
log(1 + x)
f (x) = , f (0) = 1; g(x) = e f (x)
x
Calcula las derivadas primera y segunda de f y g en 0 y deduce el valor del límite
e
(1 + x)1/x − e+ x
lı́m 2
x→0 x2
Sugerencia: pueden usarse directamente las reglas de L’Hôpital pero eso es más conve-
niente realizar previamente alguna transformación.
42. Explica si es correcto usar las reglas de L’Hôpital para calcular los límites:
x − senx x2 sen(1/x)
lı́m ; lı́m .
x→+∞ x + senx x→ 0 sen x
El teorema de los ceros de Bolzano, junto con el teorema de Rolle, permiten determinar en
muchas ocasiones el número de ceros reales de una función.
45. Determina el número de raíces reales de la ecuación 2x3 − 3x2 − 12x = m según el valor de
m.
46. Sea f una función polinómica y a < b. Justifica que, contando cada cero tantas veces como
su orden, si f (a) f (b) < 0 el número de ceros de f en ]a, b[ es impar; y si f (a) f (b) > 0 di-
cho número (caso de que haya algún cero) es par. Dedúzcase que si f tiene grado n, es
condición necesaria y suficiente para que f tenga n raíces reales distintas que su deri-
vada tenga n − 1 raíces reales distintas: c1 < c2 < · · · < cn−1 y que para α < c1 suficien-
temente pequeño y para β > cn−1 suficientemente grande, los signos de los números
f (α), f (c1 ), f (c2 ), . . . , f (cn−1 ), f (β) vayan alternando.
Aplicación:
a) Determina para qué valores de α la función polinómica 3x4 − 8x3 − 6x2 + 24x + α
tiene cuatro raíces reales distintas.
b) Estudia el número de raíces reales de la ecuación 3x5 + 5x3 − 30x = α , según los valo-
res de α.
47. Dado n∈N, sea f (x) = (x2 − 1)n (x∈R). Prueba que la derivada k-ésima (1 6 k 6 n) de f tiene
exactamente k raíces reales distintas en el intervalo ] − 1, 1[.
El teorema del valor medio permite acotar el incremento de una función por el incremento
de la variable y una cota de la derivada. Esto da lugar a muchas desigualdades interesantes.
Por otra parte, algunas de las desigualdades más útiles son consecuencia de la convexidad.
Los siguientes ejercicios tratan de ello.
48. Supuesto que a > 0, demuestra que −a e log x 6 x−a para todo x > 0.
50. Sean 0 < a < b. Prueba que si b 6 e entonces ab < ba , y si e 6 a entonces ba < ab . ¿Qué
puede decirse si a < e < b?.
log x
Sugerencia: considera la función x 7→ .
x
51. ¿Hay algún número a > 0 que verifique que ax/a > x para todo x ∈ R+ ?. £Cuál es dicho
número?
x2 2x
i) 1 − < cos x ; ii) < sen x < x < tg x
2 π
El teorema de Taylor se usa para obtener aproximaciones polinomiales de una función da-
da y para calcular valores aproximados con precisión prefijada.
√
3
1 + x − ϕ(x)
53. Calcúlese una función polinómica ϕ tal que lı́m = 0.
x→ 0 x5
log arc tg(x + 1) − ϕ(x)
54. Calcular una función polinómica ϕ tal que lı́m = 0.
x→ 0 x2
55. Justifica que las únicas funciones n veces derivables con derivada de orden n constante
son las funciones polinómicas de grado 6 n.
√
56. Calcula, usando un desarrollo de Taylor conveniente, 2 con nueve cifras decimales
exactas.
57. Calcular, usando un desarrollo de Taylor conveniente, un valor aproximado del número
real α con un error menor de 10−2 en cada uno de los casos siguientes:
√
3 √ 1
a) α = 7 b) α = e c) α = sen d) α = sen(61)
2
58. Calcula los polinomios de Taylor de orden n en el punto 0 de las funciones exp x, sen x, cos x,
log(1 + x), arc tg x, (1 + x) α (α ∈ R), arc sen x.
Una de las aplicaciones más comunes de las derivadas es el trazado de gráficas. Para trazar
la gráfica de una función f se debe tener en cuenta:
1. Propiedades de simetría o de periodicidad de f .
2. Los puntos en que se anula la primera o la segunda derivada de f y los puntos en los que
f no es derivable.
3. Los intervalos en que f ′ tiene signo constante. Lo que nos informa del crecimiento y de-
crecimiento de f y también de la naturaleza de los puntos singulares (máximos y mínimos
locales).
4. Los intervalos en que la derivada segunda tiene signo constante. Lo que nos informa de
la convexidad y concavidad, así como de los puntos de inflexión.
5. Hallar las asíntotas.
Asíntota vertical. La recta x = c es una asíntota vertical de la gráfica de f si alguno de los
límites laterales de f en c es infinito.
Asíntota horizontal. La recta y = L es una asíntota horizontal de la gráfica de f si f tiene
límite en +∞ o en −∞ igual a L.
Asíntota oblicua. Si f es una función racional con el grado del numerador una unidad ma-
yor que el grado del denominador, entonces puede escribirse de la forma f (x) = mx + b + g(x)
donde lı́m g(x) = 0 y la recta y = mx + b es una asíntota oblicua de la gráfica de f .
x→+∞
6. Dibujar máximos, mínimos, puntos de inflexión, cortes con los ejes y cortes con las asín-
totas.
60. La figura muestra la gráfica de una función f dos veces derivable. Estudia el signo de la
primera y la segunda derivada de f en cada uno de los seis puntos indicados.
B
A
C
D E
F
61. Una partícula se mueve a lo largo de una línea recta. En la siguiente gráfica se muestra la
distancia s de dicha partícula al origen en el tiempo t.
Indica, a la vista de la gráfica y de forma aproximada:
a) Cuándo la partícula se está alejando o acercando al origen;
b) Cuándo la partícula está acelerando y cuándo está frenando.
t
1 2
62. Traza la gráfica de una función f dos veces derivable en R, sabiendo que:
a) La gráfica de f pasa por los puntos (−2, 2), (−1, 1), (0, 0), (1, 1), (2, 2);
b) f ′ es positiva en los intervalos ] − ∞, −2[ y ]0, 2[, y es negativa en ] − 2, 0[ y ]2, +∞[;
c) f ′′ es negativa en los intervalos ] − ∞, −1[ y ]1, +∞[, y es positiva en el intervalo ] − 1, 1[.
63. a) ¿Es cierto que los puntos en los que la derivada segunda se anula son puntos de infle-
xión?
b) ¿Qué puedes decir de los puntos de inflexión de una función polinómica de grado 2 o
3?
Justifica tus respuestas.
64. ¿Es cierto que la gráfica de toda función polinómica de grado par tiene tangente horizon-
tal en algún punto? ¿Y si el grado es impar? Justifica tus respuestas.
Paso 3. Comparar los valores obtenidos en el Paso 2. El mayor de todos ello será el máximo
absoluto de f en [a, b] y el menor será el mínimo absoluto de f en [a, b].
65. Calcula los valores máximo y mínimo de las siguientes funciones en los intervalos que se
indican:
Cuando una función no está definida en un intervalo cerrado hay que estudiar el signo de
la derivada si queremos calcular máximos o mínimos absolutos cuya existencia habrá que
justificar.
Pn
66. Calcula el mínimo valor de k=1 (x − ak )
2 donde a1 , a2 , · · · an son números reales dados.
Los ejercicios que siguen son de cálculo de límites de sucesiones. Deberás usar los criterios
de Stolz y de las medias aritmética y geométrica y el criterio de equivalencia logarítmica.
En general, debes seguir la estrategia básica de relacionar un límite de una sucesión con un
límite funcional apropiado.
69. Supongamos que {xn } → 0, siendo −1 < xn , 0, y sea α ∈ R∗ . Prueba que {(1 + xn)α − 1} es
asintóticamente equivalente a {αxn }.
1 + 2k + 3k + · · · + nk 1
e) xn = n − , donde k ∈ N.
nk+1 k+1
n 2
3 1 + 32 + 52 + · · · + (2n − 1)2
f ) xn =
4 n3
n
1
g) xn = n 1 + 3 −1
n log(1 + 1/n)
1 n−1 n−2 2 1
h) xn = n+ + + ···+ + − log(n!)
n 2 3 n−1 n
73. Calcula los límites de las sucesiones {xn } definidas por:
√ √ √
log 1 + 12 + · · · + 1n e e 3 e··· n e
a) xn = ; b) xn =
log(log n) n
n
log n log(n + 2) n log n
c) xn = 1 + α (α > 0); d) xn =
n log(n + 1)
n k √
1X1 Y 1 j (2 n n − 1)n
e) xn = log 1+ ; f ) xn =
n k j n2
k=1 j=1
n s
log(n + 1) (pn)!
g) xn = log n − 1 ; h) xn = n (p, q ∈ N)
log n (qn) p n
76. Sea {xn } una sucesión de números positivos, α un p número real, y supongamos que
{nαxn } → L ∈ R+o . Calcula el límite de la sucesión nα x1 x2 · · · xn .
n
77. Sean a, b números positivos; definamos xk = a+(k−1)b para cada k ∈ N y sea Gn la media
Gn
geométrica de x1 , x2 , . . . , xn y An su media aritmética. Calcula el límite de la sucesión .
An
78. Sea {xn } → x, {yn } → y, x , y. Definamos z2n−1 = xn , y z2n = yn . Justifica que la sucesión
z1 + z2 + · · · + zn
n
es convergente.
79. Sean {xn }, {yn } sucesiones de números positivos tales que {(xn )n } → x > 0 {(yn )n } → y > 0.
Dados α, β ∈ R+ , con α+β = 1, calcula lı́m(αxn +βyn )n .
80. Sea {an } una sucesión de números positivos tal que {a1 + a2 + · · · + an } es divergente, y sea
{bn} → L, donde L puede ser un número real o ±∞. Justifica que
a1 b1 + a2 b2 + · · · + an bn
→ L.
a1 + a2 + · · · + an
n
1X n
Aplicación. Supuesto que {xn } → x, calcula lı́m xk .
2n k
k=1
Acabamos esta larga relación con algunos ejercicios que me ha parecido que no encajaban
propiamente en ninguno de los apartados anteriores.
82. Sea f : [a, b] → R derivable y f ′ creciente. Prueba que la función g :]a, b] → R dada para
f (x) − f (a)
todo x ∈]a, b] por g(x) = , es creciente.
x−a
83. Sea f : [a, b] → R continua en [a, b] y derivable dos veces en ]a, b[. Supongamos que el seg-
mento de extremos (a, f (a)), (b, f (b)) corta a la gráfica de f en un punto (c, f (c)) con
a < c < b. Demuestra que existe algún punto d ∈]a, b[ tal que f ′ ′ (d) = 0.
Sugerencia: interpreta gráficamente el enunciado.
84. Justifica que existe una función g : R → R derivable y que verifica que g(x) + eg(x) = x para
todo x ∈ R. Calcula g ′ (1) y g ′ (1 + e).
Integral de Riemann
Introducción
El cálculo integral tiene sus orígenes en problemas de cuadraturas en los que se trataba de
calcular áreas de regiones planas limitadas por una o varias curvas. Se atribuye a Eudoxo (ca.
370 A.C.) la invención del método de exhaución, una técnica para calcular el área de una región
aproximándola por una sucesión de polígonos de forma que en cada paso se mejora la aproxi-
mación anterior. Arquímides (287-212 A.C.) perfeccionó este método y, entre otros resultados,
calculó el área de un segmento de parábola y el volumen de un segmento de paraboloide, así
como el área y el volumen de una esfera.
Sorprende que, siendo tan antiguos sus orígenes, la primera definición matemática de in-
tegral no fuera dada hasta el siglo XIX por Augustin Louis Cauchy (1789-1857). Una posible
explicación es que, durante los siglos XVII y XVIII, la integración fue considerada como la ope-
ración inversa de la derivación; el cálculo integral consistía esencialmente en el cálculo de pri-
mitivas. Naturalmente, se conocía la utilidad de las integrales para calcular áreas y volúmenes,
pero los matemáticos de la época consideraban estas nociones como dadas de forma intuitiva
y no vieron la necesidad de precisar su significación matemática. Los trabajos de Joseph Fou-
rier (1768-1830) sobre representación de funciones por series trigonométricas hicieron que el
concepto de función evolucionara, desde la idea restrictiva de función como fórmula, hasta la
definición moderna de función dada por Dirichlet en 1837. Para entender el significado de la
integral de estas nuevas funciones más generales se vio la necesidad de precisar matemática-
mente los conceptos de área y de volumen.
La originalidad de Cauchy es que unió dos ideas, la de límite y la de área, para dar una
definición matemática de integral. Poco después Georg F.B. Riemann (1826-1866) generalizó
la definición de integral dada por Cauchy. La teoría de la integral de Riemann fue un avance
importante pero, desde un punto de vista matemático, insuficiente. Hubo que esperar hasta el
siglo XX para que Henri Lebesgue (1875-1941) estableciera en su libro Leçons sur l’intégration
et la recherché des fonctions primitives (1904) los fundamentos de una teoría matemáticamente
satisfactoria de la integración.
102
Sumas de Riemann 103
La integración es una de las herramientas más versátiles del Cálculo, sus aplicaciones no
se limitan a calcular áreas de regiones planas o volúmenes de sólidos, también se utiliza para
calcular longitudes de curvas, centros de masas, momentos de inercia, áreas de superficies,
para representar magnitudes físicas como el trabajo, la fuerza ejercida por una presión, o la
energía potencial en un campo de fuerzas.
En este curso vamos a estudiar la integración desde un punto de vista esencialmente prác-
tico. Nos interesa la integral como herramienta de cálculo y para ese propósito es suficiente la
integral de Riemann.
Todo lo que sigue puedes verlo también como página Web y en formato de cuaderno de
Mathematica en el sitio http://wwww.ugr.es/local/fjperez.
Sea f : [a, b] → R una función acotada. Representaremos por G( f , a, b) la región del plano
comprendida entre la gráfica y = f (x), el eje de abscisas y las rectas x = a y x = b. Aquí puedes
ver dos de estas regiones coloreadas en amarillo.
Nos proponemos calcular el área de regiones de este tipo. Puesto que, en general, G( f , a, b)
no puede descomponerse en triángulos o rectángulos, no hay una fórmula que nos permita
calcular directamente su área.
En situaciones como esta, una estrategia básica consiste en obtener soluciones aproximadas
que permitan definir el valor exacto del área como límite de las mismas. Fíjate que, al proceder
así, estamos definiendo dicho valor exacto, es decir, estamos dando una definición matemática
del concepto intuitivo de área 1 . Naturalmente, queremos que dicha definición sea lo más gene-
ral posible, lo que depende del tipo de soluciones aproximadas que elijamos. Las aproximaciones
consideradas en la teoría de la integral de Lebesgue conducen a un concepto de área muy ge-
neral. En lo que sigue vamos a considerar las aproximaciones que conducen a la integral de
Riemann.
Como los conceptos que vamos a introducir se interpretan con más facilidad cuando la
función f es positiva, es conveniente tener bien presente en lo que sigue el siguiente artificio
1 Ellotrae como consecuencia inevitable que haya regiones extrañas en el plano que, según la definición dada, no
tengan área.
que permite representar cualquier función como diferencia de dos funciones positivas.
sitiva de f , y la función f − se llama parte negativa de f . Si f (x) > 0 se tiene que f (x) = f + (x) y
f − (x) = 0; mientras que si f (x) 6 0 se tiene que f (x) = − f − (x) y f + (x) = 0. Fíjate que, a pesar de
su nombre y de la forma en que se simboliza, la función f − es una función positiva. También
es consecuencia de las definiciones dadas que | f (x)| = f + (x) + f − (x).
En lo que sigue, representaremos el valor exacto (que aún no hemos definido) del área de
la región G( f , a, b) por λ(G( f , a, b)) (la letra “λ” alude a la inicial de “Lebesgu”). En la integral
de Riemann, el área buscada se aproxima por rectángulos de la siguiente forma. Primero, se
divide el intervalo [a, b] en un número finito de subintervalos [xk−1 , xk ], 1 6 k 6 n, cuyas longitudes
pueden ser distintas y con la única condición de que no se solapen:
a = x0 < x1 < x2 < · · · < xn−1 < xn = b
Se dice que estos puntos constituyen una partición de [a, b]. A continuación se elige en cada
subintervalo un punto tk ∈ [xk−1 , xk ], y se forma el rectángulo cuya base es el intervalo [xk−1 , xk ] y
altura igual a f (tk ). Dicho rectángulo está en el semiplano superior si f (tk ) > 0 y en el semiplano
X n
inferior si f (tk ) < 0. Finalmente se forma la suma f (tk )(xk − xk−1 ).
k=1
8.1 Definición. Dada una partición P = {a = x0 , x1 , x2 , . . . , xn−1 , xn = b} del intervalo [a, b], y un
punto tk ∈ [xk−1 , xk ] en cada uno de los intervalos de la misma, el número
n
X
σ( f , P) = f (tk )(xk − xk−1 )
k=1
Observaciones
• Fíjate que, como hay libertad para elegir los puntos tk ∈ [xk−1 , xk ], para cada partición P hay
infinitas sumas de Riemann.
1 0 2 4 6 8
-0.25
0.5
-0.5
0 1 2 3 4 5 6 7 -0.75
8.2 Definición. Dada una partición P = {a = x0 , x1 , x2 , . . . , xn−1 , xn = b} del intervalo [a, b], defina-
mos Mk = sup f [xk−1 , xk ], mk = ı́nf f [xk−1 , xk ]. Los números
n
X n
X
S( f , P) = Mk (xk − xk−1), I( f , P) = mk (xk − xk−1 )
k=1 k=1
Observaciones
• Puesto que para todo tk ∈ [xk−1 , xk ] es mk 6 f (tk ) 6 Mk , deducimos que para toda suma de
Riemann, σ( f , P) de f para la partición P se cumple que I( f , P) 6 σ( f , P) 6 S( f , P).
• Para cada partición hay una única suma superior y otra inferior.
Supongamos que la función f es positiva en [a, b]. Es claro que, en tal caso, el valor exacto del
área de la región G( f , a, b) debe verificar que I( f , P) 6 λ(G( f , a, b)) 6 S( f , P) para toda partición
P de [a, b]. Tenemos, en consecuencia, dos candidatos para λ(G( f , a, b)), a saber:
λ(G( f , a, b)) = ı́nf {S( f , P) : P ∈ P[a, b]} , λ(G( f , a, b)) = sup {I( f , P) : P∈ P[a, b]}
Donde hemos representado por P[a, b] el conjunto de todas las particiones de [a, b]. Llegados
aquí, podemos ya dar la definición principal de la teoría de la integral de Riemann.
8.3 Definición. Sea f una función acotada y positiva en [a, b]. Se dice que el conjunto G( f , a, b)
tiene área cuando
ı́nf {S( f , P) : P ∈ P[a, b]} = sup {I( f , P) : P ∈ P[a, b]}
Dicho valor común es, por definición, el valor del área y lo representaremos por λ(G( f , a, b)).
Cuando esto ocurre, se dice también que la función f es integrable Riemann en [a, b] y, por
definición, la integral de f en [a, b] es igual a λ(G( f , a, b)). Simbólicamente escribimos
wb
f (x) dx = λ(G( f , a, b))
a
En el caso general en que la función f toma valores positivos y negativos, se dice que f es inte-
grable Riemann en [a, b] cuando lo son las funciones f + y f − , en cuyo caso se define la integral
de f en [a, b] como el número:
wb
f (x) dx = λ(G( f + , a, b)) − λ(G( f −, a, b))
a
Observaciones
wb
• No te confundas con la notación. El símbolo f (x) dx representa un número. La variable
a
x que figura en él se suele decir que es una variable muda. Naturalmente, la letra x no tiene
ningún significado especial y puede sustituirse por la que tú quieras o no poner ninguna; por
ejemplo
wb wb wb
f (t) dt , f (s) ds , f
a a a
son tres formas de escribir lo mismo. Volveremos sobre esta notación cuando estudiemos téc-
nicas de integración.
• En el caso en que la función f toma valores positivos y negativos, observa que la gráfica de
f− se obtiene por simetría respecto al eje de abscisas de las partes de la gráfica de f en las que
f (x) < 0. Como regiones simétricas respecto de una recta tienen la misma área, se sigue que:
wb
λ(G( f , a, b)) = λ(G( f + , a, b)) + λ(G( f −, a, b)) = λ(G( f + + f − , a, b)) = λ(G(| f | , a, b)) = | f (x)| dx
a
wb
Seamos prácticos. ¿Cómo podemos, a partir de la definición dada, calcular f (x) dx ? Una pri-
a
mera idea en este sentido consiste en observar que cuanto mayor sea el número de intervalos
de la partición y más pequeña la anchura de cada uno de ellos cabe esperar que la aproxima-
ción obtenida sea mejor. Para precisar esta idea, definimos el paso de una partición P, y lo
representamos por δ(P), como la mayor de las longitudes de los subintervalos de dicha parti-
ción.
8.4 Teorema (Convergencia de las sumas integrales). Sea f : [a, b] → R una función integrable,
{Pn } una sucesión de particiones de [a, b] tal que {δ(Pn )} → 0 y σ( f , Pn ) una suma de Riemann de
f para la partición Pn . Se verifica entonces que
wb
lı́m S( f , Pn ) = lı́m σ( f , Pn ) = lı́m I( f , Pn ) = f (x) dx
n→∞ n→∞ n→∞
a
Este resultado permite en algunos casos particulares y con bastante esfuerzo e ingenio cal-
cular ciertas integrales. Como más adelante aprenderemos a calcular integrales con facilidad,
es más interesante usar dicho resultado sensu contrario para calcular los límites de ciertas su-
cesiones.
Ha llegado el momento de preguntarse por condiciones que garanticen que una función es
integrable Riemann. Nos vamos a contentar con una respuesta parcial a esta pregunta, que es
suficiente para nuestros propósitos.
i) f está acotada en [a, b] y tiene un número finito de discontinuidades en [a, b]. En particular,
toda función continua en un intervalo cerrado y acotado es integrable en dicho intervalo.
Teniendo en cuenta que σ(α f + β g, P) = α σ( f , P) + β σ(g, P), cualesquiera sean las funciones
f , g y los números α, β, se deduce, haciendo uso del resultado sobre convergencia de sumas
integrales, que la integral es lineal. Esta propiedad, junto con otras propiedades básicas de las
integrales se recogen en el siguiente resultado.
wb wb wb
(α f (x) + β g(x)) dx = α f (x) dx + β g(x) dx
a a a
ii) Conservación del orden. Si f , g son integrables en [a, b] y f (x) 6 g(x) para todo x ∈ [a, b],
entonces se verifica que
wb wb
f (x) dx 6 g(x) dx
a a
En particular, si f es integrable en [a, b] y m 6 f (x) 6 M para todo x ∈ [a, b], entonces se verifica la
siguiente acotación fundamental
wb
m(b − a) 6 f (x) dx 6 M(b − a)
a
iv) El producto de funciones integrables Riemann también es una función integrable Rie-
mann.
v) Aditividad respecto del intervalo. Sea a < c < b. Una función f es integrable en [a, b] si, y
sólo si, es integrable en [a, c] y en [c, b], en cuyo caso se verifica la igualdad
wb wc wb
f (x) dx = f (x) dx + f (x) dx
a a c
Dada una función integrable f : [a, b] → R , podemos definir una nueva función F : [a, b] → R
por
wx
F(x) = f (t) dt para todo x ∈ [a, b]
a
Observa que aquí la variable es x – el límite superior de la integral. Por eso, es obligado no usar
la misma letra x como variable de la función f en el integrando. F(x) es la integral de la función
f en el intervalo [a, x].
Sabemos que F(x) = λ(G( f + , a, x))−λ(G( f − , a, x)). Por supuesto, si f es una positiva entonces
F(x) = λ(G( f , a, x)) es el área de la región del plano limitada por la gráfica de f , el eje de abscisas
wx
y las rectas verticales X = a, X = x. No debes olvidar en lo que sigue que F(x) = f (t) dt se ha
a
definido en términos de áreas. A la función F la llamaremos la función área de f .
wx
A veces hay que considerar funciones de la forma H(x) = f (t) dt en donde a < c < b y
c
wx
x∈[a, b]; por lo que es necesario precisar lo que se entiende por f (t) dt cuando x < c. El conve-
c
nio que se hace es que
wv wu
f (t) dt = − f (t) dt
u v
cualquiera sean los números u y v. La justificación de este convenio es que, con él, la igualdad
wy wz wx
f (t) dt + f (t) dt + f (t) dt = 0
x y z
se cumple cualesquiera sean los puntos x, y, z del intervalo [a, b]. Compruébalo.
8.7 Teorema (Teorema Fundamental del Cálculo). Sea f : [a, b] → R una función integrable y
definamos F : [a, b] → R por
wx
F(x) = f (t) dt para todo x ∈ [a, b]
a
Entonces:
ii) En todo punto c de [a, b] en el que f sea continua se verifica que F es derivable en dicho
punto siendo F ′ (c) = f (c). En particular, si f es continua en [a, b], entonces F es derivable en [a, b]
y F ′ (x) = f (x) para todo x ∈ [a, b].
Demostración.
i) Como f es integrable debe estar acotada. Sea M > 0 tal que | f (x)| 6 M para todo x ∈ [a, b].
Entonces, si x < y son puntos de [a, b] tenemos que
y y
w w
|F(y) − F(x)| = f (t) dt 6 | f (t)| dt 6 M(y − x)
x x
Por la misma razón, si suponemos que y < x, tendremos que |F(y) − F(x)| 6 M(y − x). Estas dos
desigualdades nos dicen que |F(y) − F(x)| 6 M |y − x| para todo par de puntos x, y ∈ [a, b]. De esta
desigualdad se sigue inmediatamente la continuidad de F en [a, b].
ii) Pongamos
wx wx wx
f (t) dt − f (c) dt ( f (t) − f (c)) dt
F(x) − F(c) F(x) − F(c) − (x − c) f (c) c c c
− f (c) = = =
x−c x−c x−c x−c
Dado, ε > 0, la continuidad de f en c nos dice que hay un δ > 0 tal que para todo t ∈ [a, b] con
|t − c| < δ se tiene que | f (t) − f (c)| < ε. Tomemos ahora un punto cualquiera x ∈ [a, b] tal que
|x − c| < δ. Entonces es claro que para todo t comprendido entre x y c se tendrá que |t − c| < δ y,
por tanto, | f (t) − f (c)| < ε por lo que
x
w
( f (t) − f (c)) dt 6 ε |x − c|
c
Deducimos que para todo x ∈ [a, b] tal que |x − c| < δ, y x , c, se verifica que
wx
( f (t) − f (c)) dt
F(x) − F(c) c ε |x − c|
|x − c| = ε
− f (c)= 6
x−c x−c
F(x) − F(c)
Hemos probado así que lı́m = f (c), esto es, F es derivable en c y F ′ (c) = f (c).
x→c x−c
8.8 Definición. Dada un función h : [a, b] → R , cualquier función H : [a, b] → R que sea continua
en [a, b], derivable en ]a, b[ y verifique que H ′ (x) = h(x) para todo x ∈]a, b[, se llama una primitiva
de f en el intervalo [a, b].
Es importante advertir que no todas las funciones tienen primitivas. Por ejemplo, una condi-
ción necesaria que debe cumplir una función para tener primitivas es que dicha función tenga
la propiedad del valor intermedio pues, como recordarás, las funciones derivadas tienen esa
propiedad. También, como consecuencia del teorema del valor medio, es inmediato que dos
primitivas de una función en un mismo intervalo se diferencian en una constante. Por ello,
si conocemos una primitiva de una función en un intervalo las conocemos todas.
Una consecuencia muy importante del Teorema Fundamental del Cálculo es que toda fun-
ción continua en un intervalo tiene primitivas en dicho intervalo. Además, el teorema nos di-
rx
ce que la función área, esto es, la función F(x) = a f (t) dt , es la primitiva de la función continua
f : [a, b] → R que se anula en a, F(a) = 0. Es importante que aprecies que este es un teorema de
existencia; es la definición que hemos dado de área - y por consiguiente de integral - lo que nos
ha permitido construir la función primitiva de f . No lo olvides: la integración es una potente
herramienta para construir nuevas funciones.
El Teorema Fundamental del Cálculo proporciona una técnica para calcular la integral de
una función continua en un intervalo [a, b]. Para ello lo que hacemos es calcular una primitiva
rx
de f en [a, b]. Si h es una tal primitiva, entonces las funciones F(x) = a f (t) dt , y h(x) − h(a) son
dos primitivas de f en [a, b] que coinciden en un punto, pues ambas se anulan en a. Deducimos
rb
que F(x) = h(x) − h(a) para todo x ∈ [a, b] y, por tanto, F(b) = a f (t) dt = h(b) − h(a). Podemos
generalizar este resultado como sigue.
8.9 Teorema (Regla de Barrow). Sea f : [a, b] → R integrable y supongamos que h es una primi-
tiva de f en [a, b]. Entonces
wb
f (t) dt = h(b) − h(a)
a
La igualdad anterior nos dice que para toda partición P de [a, b] hay alguna suma de Riemann de
f asociada a dicha partición, σ( f , P), que es igual a h(b) − h(a). Si ahora tomamos una sucesión
{Pn } de particiones del intervalo [a, b] tales que δ(Pn ) → 0, tenemos que h(b)− h(a) = σ( f , Pn ) para
alguna suma de Riemann, σ( f , Pn ) de f asociada a la partición Pn . Pero sabemos que σ( f , Pn ) →
rb rb
a f , por lo que obtenemos que h(b) − h(a) = a f .
Fíjate que en la regla de Barrow no se supone que f sea continua sino tan sólo que es inte-
grable y que, además, tiene una primitiva.
1.5
y=1x
0.5 2
à
1
dx=log 2
1 x
Espero que estés de acuerdo conmigo: la forma más fácil e intuitiva de imaginar el número
logt es como el área de la región plana limitada por la curva y = 1/x, las rectas y = 1, y = t, y el
eje de abscisas. Dicha área se considera positiva si t > 1 y negativa si t < 1. Dicho de otra forma
wt 1
logt = dx
x
1
Es frecuente interpretar esta igualdad de la siguiente forma: la función log x es derivable y log ′ x =
wt 1
1/x ; por tanto dx = logt − log 1 = logt. ¡Parece que hemos probado algo! Y no es así porque
x
1
en este razonamiento estamos usando que la función logaritmo es derivable y eso es algo que
no hemos probado. Todavía peor: ni siquiera hemos dado una definición de la función loga-
ritmo que permita probar las propiedades de dicha función. Usualmente se define log x como
el número y que verifica que ey = x. La existencia de ese número y está lejos de ser evidente. El
propio número e tiene que ser definido de alguna forma apropiada.
Hago estas reflexiones para que te des cuenta de que lo que sabes de las funciones logarit-
mo, exponencial, trigonométricas . . . , es un conocimiento sin una base matemática correcta.
De estas funciones conoces, porque te lo han dicho, su comportamiento; pero no creo que
nunca hayas demostrado sus propiedades, ni siquiera que conozcas una definición matemáti-
camente correcta de las mismas. Bueno, no quiero que pienses que tus profesores te ocultan
información, lo que ocurre es que una definición correcta de estas funciones requiere herra-
mientas matemáticas que no tienen cabida en las enseñanzas medias. Precisamente, el Teore-
ma Fundamental del Cálculo permite definir estas funciones de forma fácil, elegante y correcta.
Olvida ahora todo lo que sepas de la función logaritmo natural. ¿Lo has olvidado ya? Siga-
mos.
El Teorema Fundamental del Cálculo nos dice que la función logaritmo natural es derivable
(y por tanto continua) y que log ′t = 1/t. Como la derivada es positiva, deducimos que dicha
función es estrictamente creciente.
Dado a > 0, sea h(x) = log(ax). Entonces h ′ (x) = a/(ax) = 1/x. Luego la función h(x) − log(x)
tiene derivada nula en R+ , por lo que es constante y, como para x = 1 es igual a log a, se sigue
que h(x) − log(x) = log a. Hemos probado así que log(ax) = log a + log x para todo a > 0 y para todo
x > 0.
Observa que en poco más de tres líneas hemos obtenido ya las propiedades principales del
logaritmo. Sigamos nuestro estudio.
De lo ya visto se sigue que log(2n ) = n log 2 para todo número entero n. De aquí se deduce
que la función logaritmo natural no está mayorada ni minorada y, como es estrictamente cre-
ciente, concluimos que lı́m log x = −∞ y lı́m log x = +∞. Por tanto, podemos afirmar que dicha
x→0 x→+∞
función es una biyección estrictamente creciente de R+ sobre R.
Hemos probado así que ϕ(x + y) = ϕ(x)ϕ(y) para todos x, y ∈ R. De esta igualdad se deduce fácil-
mente que apara todo número racional r se verifica que ϕ(r) = ϕ(1)r . El número ϕ(1) se repre-
we 1
senta con la letra e, es decir, es el número definido por la igualdad log e = dx = 1. Con ello
x
1
apara todo número racional r se tiene que ϕ(r) = er , por lo que se usa la notación ϕ(x) = ex para
representar a la función exponencial.
Fíjate con qué facilidad y elegancia hemos obtenido las propiedades principales de las fun-
ciones logaritmo y exponencial naturales.
Lo que constituye un punto de partida para definir las demás funciones trigonométricas. Este
proceso está desarrollado con detalle en el libro de Michael Spivak Calculo etcétera. Veremos
más adelante otro procedimiento más directo para definir las funciones trigonométricas.
w1 1 √
√ dx = h(1) − h(t) = 2 − 2 t
t
x
Por tanto
w1 1
lı́m √ dx = 2
t→0
t
x
Es natural definir
w1 1
√ dx = 2
x
0
8.13 Definición. Sea f : [c, b[→ R una función continua en el intervalo [c, b[, donde suponemos
que c ∈ R y que b un número real mayor que c o bien b = +∞. Se define la integral impropia de
Riemann de f en [c, b[ como el límite
wb wt
f (x) dx = lı́m f (x) dx (8.1)
t→b
c c
Supuesto, claro está, que dicho límite exista y sea un número real, en cuyo caso se dice también
que la integral de f es convergente en [c, b[.
Sea f :]a, c] → R una función continua en el intervalo ]a, c], donde suponemos que c∈R y que
a un número real menor que c o bien a = −∞. Se define la integral impropia de Riemann de f
en ]a, c] como el límite
wc wc
f (x) dx = lı́m f (x) dx (8.2)
t→a
a t
Supuesto, claro está, que dicho límite exista y sea un número real, en cuyo caso se dice también
que la integral de f es convergente en ]a, c].
Cuando el límite (8.1) o (8.2) existe y es igual a +∞ (resp. −∞) se dice que la respectiva
integral es positivamente o negativamente divergente.
Sea f :]a, b[→ R una función continua en el intervalo ]a, b[, donde −∞ 6 a < b 6 +∞. Sea
c ∈ R con a < c < b. Se dice que la integral de f es convergente en ]a, b[ cuando las integrales de
f en ]a, c] y en [c, b[ son convergentes, en cuyo caso se define
wb wc wb
f (x) dx = f (x) dx + f (x) dx (8.3)
a a c
Deducimos que
w
+∞
1 1 si a > 1
dx = a−1
xa +∞ si a < 1
1
Análogamente
w1 1 1 si a < 1
dx = 1 − a
xa +∞ si a > 1
0
8.15 Ejemplo. Sea a , 1. Usando la técnica de integración por partes, que estudiaremos más
log x
adelante, es fácil calcular una primitiva de la función f (x) = a . Comprueba que
x
x1−a (−1 + (1 − a) logx)
F(x) =
(1 − a)2
wt
es una primitiva de f en R+ . Por tanto f (x) dx = F(t) − F(1). En consecuencia
1
w
+∞
log x 1 si a > 1
dx = (1 − a)2
xa
1 +∞ si a < 1
Análogamente
w1 log x − 1 si a < 1
dx = (1 − a)2
xa
0 −∞ si a > 1
Naturalmente, no siempre vamos a disponer de una primitiva expresable por medio de fun-
ciones elementales, bien porque no exista o porque su cálculo efectivo sea muy complicado.
Por ello, interesa conocer condiciones que aseguren la convergencia de una integral sin nece-
sidad de conocer una primitiva elemental. Lógicamente, estas condiciones no nos permitirán
calcular el valor numérico de la integral; tan sólo nos dirán si es o no convergente. El caso en
que la función integrando es positiva es particularmente sencillo de estudiar.
8.16 Proposición (Criterio básico de convergencia). Sea f continua y positiva en [c, b[. Enton-
wx
ces, la integral de f en [c, b[ es convergente si, y sólo si, la función F(x) = f (t) dt está mayorada
c
en [c, b[, en cuyo caso
( )
wb wx
f (t) dt = sup f (t) dt : x ∈ [c, b[
c c
Las afirmaciones hechas son consecuencia de que, por ser f positiva en [c, b[, la función
wx
F(x) = f (t) dt es creciente en [c, b[.
c
8.17 Proposición (Criterio de comparación). Sean f y g continuas y positivas en [c, b[. Supon-
gamos que la integral de g en [c, b[ es convergente y que f (x) 6 g(x) para todo x ∈ [c, b[. Entonces la
integral de f en [c, b[ también es convergente.
8.18 Proposición (Criterio límite de comparación). Sean f y g continuas y positivas en [c, b[.
Supongamos que
f (x)
lı́m = ρ ∈ R+
x→b g(x)
Naturalmente, los criterios de convergencia antes vistos para integrales de funciones posi-
tivas, pueden usarse para estudiar la convergencia absoluta de la integral de cualquier función.
Por ello, el siguiente resultado, que no demostraremos, es de gran utilidad.
Ejercicios
w
+∞
x + sen x
I= xα dx
x − sen x
0
Introducción
rb
Para calcular a f (x)dx donde f es una función continua, hay que calcular una primitiva de
f , evaluarla en a y en b y hacer la diferencia. Pero, ¿para qué calcular una primitiva? ¿no sabe-
rx
mos ya que una primitiva de f es la función F(x) = a f (t)dt ? Y, naturalmente, cualquier otra
será de la forma F(x) + C donde C es una constante. ¿Qué interés tiene entonces el cálculo de
primitivas de funciones continuas? Respuesta: desde un punto de vista teórico ninguno. Ahora,
rb
si lo que queremos es aplicar la regla de Barrow para calcular el número a f (x)dx, entonces la
rx
primitiva F(x) = a f (t)dt no nos sirve para nada porque si la evaluamos en a y en b y hacemos la
diferencia obtenemos una identidad perfectamente inútil para nuestros propósitos. Lo que ne-
cesitamos es conocer una primitiva de f que sea realmente evaluable, es decir que al evaluarla
en a y en b proporcione valores numéricos.
Pero no hay que olvidar que, si bien la derivada de una función elemental también es una
función elemental, es frecuente que una función elemental no tenga primitivas que puedan
expresarse por medio de funciones elementales. Esto ocurre, por ejemplo, con las funciones
2 sen x √
e−x , , sen(x 2 ), x3 + 1, y muchas más. En tales casos la forma más sencilla de representar
x rx
una primitiva de f es justamente mediante la función F(x) = a f (t)dt y, para obtener valores
concretos de dicha función hay que recurrir a métodos numéricos de cálculo de integrales.
2 Las funciones que se obtienen por medio de sumas, productos, cocientes y composiciones a partir de las funciones
En lo que sigue vamos a considerar algunos tipos de funciones elementales cuyas primiti-
vas también pueden expresarse por medio de funciones elementales y pueden calcularse con
procedimientos más o menos sistemáticos.
Para leer lo que sigue necesitas tener papel y un bolígrafo a mano para ir haciendo los ejerci-
cios que se proponen. A calcular primitivas se aprende practicando; la imprescindible agilidad
en los cálculos la lograrás haciendo decenas de ejercicios. Fíjate que, en la mayoría de los ca-
sos, se trata de ejercicios en los que tan sólo tienes que aplicar una técnica general a un caso
particular. Esto es tan “fácil” que lo saben hacer los programas de cálculo simbólico, como
Mathematica, Derive, Mapple y otros. Cuando se logre fabricar una calculadora de bolsillo que
pueda ejecutar estos programas quizás ya no sea imprescindible aprender a calcular primitivas,
pero hasta que llegue ese momento sigue siendo necesario que aprendas a calcular primitivas
con agilidad. Sería lamentable que, por no saber calcular una primitiva, no puedas resolver una
sencilla ecuación diferencial, ni calcular una probabilidad, ni el área de una superficie, . . . Las
aplicaciones del cálculo integral son tan variadas, que el tiempo que dediques a la práctica del
cálculo de primitivas será más rentable de lo que ahora puedas imaginar.
r
Para representar una primitiva de una función f , suele usarse la notación f (x)dx. Así, por
w 1
ejemplo, se escribe dx = log |x − a|. Esta notación es algo imprecisa porque no especifica
x−a
el intervalo en que se considera definida f . En el ejemplo anterior hay que interpretar que la
1
función está definida en uno de los intervalos ] − ∞, a[ o ]a, +∞[ y elegir la primitiva corres-
x−a
pondiente. Estos pequeños inconvenientes están compensados por la comodidad en los cálcu-
los que proporciona esta notación. Es frecuente también, aunque no lo haremos en lo que sigue
w 1
(pero mira el ejercicio 3), añadir una constante arbitraria, C, y escribir dx = log |x − a| +C.
x−a
rb
La integral de una función en un intervalo, a f (x)dx, se llama a veces “integral definida”
r
de f (y es un número), y al símbolo f (x)dx se le llama “integral indefinida” o, simplemente,
“integral” de f (y representa una primitiva cualquiera de f ). Aunque esto puede ser confuso, no
r
olvides que, cuando hablamos de calcular la integral f (x)dx lo que realmente queremos decir
es que queremos calcular una primitiva de f .
r rb
Como ya sabes, en los símbolos f (x)dx o a f (x)dx la letra “x” puede sustituirse por cual-
quier otra y el símbolo “dx” (que se lee “diferencial x”) sirve para indicar la variable de integra-
ción. Esto es muy útil si la función f contiene parámetros. Por ejemplo, son muy diferentes las
r r
integrales x y dx y x y dy.
Si u y v son funciones con derivada primera continua en un intervalo, por la regla de deriva-
ción para un producto sabemos que: (u(x) v(x))′ = u ′ (x)v(x) + u(x)v ′ (x). Deducimos que la fun-
r
ción producto u v es una primitiva de la función u ′ v + v ′ u, es decir, (u ′ (x)v(x) + u(x)v ′ (x))dx =
u(x) v(x). Lo que suele escribirse en la forma:
w w
u dv = u v − v du
Por supuesto, esta igualdad podemos usarla para calcular integrales definidas:
wd x=d wd
u(x)v ′ (x)dx = u(x)v(x)x=c − v(x)u ′ (x)dx (8.4)
c c
Veamos algunas situaciones en las que este método puede aplicarse con éxito.
r r
• Cuando la integral v(x)u ′ (x)dx es inmediata. Por ejemplo, para calcular una integral f (x)dx
en la que la derivada de f (x) es más sencilla que la propia función, como es el caso de log x,
arc sen x, arc tg x. Entonces conviene tomar u(x) = f (x) y v ′ (x) = w(x) = 1 en (8.6).
8.21 Ejemplo.
1
w u = arc tg x → d u = dx w x 1
1+x 2
arc tg x dx = = x arc tg x − dx = x arc tg x + log(1 + x 2 )
1 + x2 2
d v = dx → v = x
r
• Cuando la integral v(x)u ′ (x)dx es del mismo tipo que la integral de partida, pero más sen-
cilla, de manera que reiterando el proceso se llega a una integral inmediata. Este es el caso
cuando f (x) es de la forma P(x) e ax , P(x) sen(ax), P(x) cos(ax), donde P(x) es una función polinó-
mica. En todos los casos se elige u(x) = P(x), y v ′ (x) = e ax , v ′ (x) = sen(ax), v ′ (x) = cos(ax).
8.22 Ejemplo.
w u = P(x) → du = P ′ (x)dx ax w
P(x) e ax dx = ax = P(x) e − 1 P ′ (x)e ax dx
e a a
d v = e ax dx → v =
a
La última integral es del mismo tipo que la primera pero con el grado del polinomio rebajado en
una unidad. El proceso se repite tantas veces como sea necesario.
r
• Cuando la integral v(x)u ′ (x)dx es parecida a la de partida, de forma que al volver a aplicar
el proceso la integral de partida se repite y es posible despejarla de la igualdad obtenida.
8.23 Ejemplo.
w 1 w
u = cos(log x) → du = − sen(log x)dx
cos(log x)dx = x = x cos(log x) + sen(log x)dx =
d v = dx → v = x
1 w
u = sen(log x) → du = cos(log x)dx
= x = x cos(log x) + x sen(log x) − cos(log x)dx
d v = dx → v = x
w x
deducimos que cos(log x)dx = cos(log x) + sen(log x) .
2
Ejercicios
Ahora que estás empezando a hacer ejercicios de cálculo de primitivas es una buena prác-
tica que compruebes los resultados. Además es muy sencillo: basta derivar la primitiva que has
obtenido.
La técnica de integración por partes permite en algunas ocasiones relacionar una integral
r
de la forma In = f (x, n)dx en la que interviene un parámetro n (con frecuencia un número na-
tural) con otra del mismo tipo en la que el parámetro ha disminuido en una o en dos unidades.
Las expresiones así obtenidas se llaman fórmulas de reducción o de recurrencia y permiten el
cálculo efectivo de la integral cuando se particularizan valores del parámetro. Los siguientes
ejemplos son ilustrativos de esta forma de proceder.
8.24 Ejemplo.
w (log x)n−1
n w
u = (log x) → du = n dx
(log x)n dx = x n n−1
= x(log x) − n (log x) dx
d v = dx → v = x
8.25 Ejemplo.
w u = x n → d u = n x n−1
In = x n e a x dx = ax = 1 (x n e a x −n In−1)
e a
d v = e a x dx → v = dx
a
8.26 Ejemplo.
" #
w u = senn−1 x → d u = (n − 1) senn−2 x cos x dx
n
In = sen x dx = =
d v = sen x dx → v = − cosx
w w
= − cos x senn−1 x + (n − 1) senn−2 x cos2 x dx = − cos x senn−1 x + (n − 1) senn−2 x dx − (n − 1)In
w 1 n−1 w
Y deducimos fácilmente que senn x dx = − cos x senn−1 x + senn−2 x dx . En particular,
n n
π/2
w π/2
n n−1 w
sen x dx = sen n−2 x dx. De aquí se obtienen las igualdades
n
0 0
π/2
w π/2
w
2 · 4 · 6 · · ·2n 1 · 3 · 5 · · ·(2n − 1) π
sen 2n+1 x dx = , sen 2n x dx =
3 · 5 · 7 · · ·(2n + 1) 2 · 4 · 6 · · ·2n 2
0 0
Ejercicios
n−1
Prueba que para n > 2 es In = In−1. Calcula I1 , I2 e I3 .
n+2
Sean g : J → R una función con derivada primera continua en un intervalo J que toma valo-
res en un intervalo I, y f una función continua en I. Sea F una primitiva de f en I, y pongamos
H = F ◦ g. Tenemos, por la regla de la cadena, que H ′ (t) = F ′ (g(t))g ′ (t) = f (g(t))g ′ (t), es decir,
la función H es una primitiva en J de la función h(t) = f (g(t))g ′ (t). Si c, d son puntos de J,
deducimos que
wd w
g(d)
f (g(t))g ′ (t) dt = H(d) − H(c) = F(g(d)) − F(g(c)) = f (x) dx
c g(c)
Esta igualdad se conoce con el nombre de “fórmula de integración por sustitución o cambio de
rb
variable”. En ella se supone que queremos calcular, por ejemplo, la integral a f (x) dx y lo que
hacemos es la sustitución x = g(t), con lo que dx = g ′ (t)dt y se eligen c y d por la condición de
que g(c) = a, g(d) = b. Naturalmente, esto tiene interés cuando la función f (g(t))g ′ (t) es más
fácil de integrar que la función f . Simbólicamente este proceso suele representarse en la forma
" #
wb x = g(t), dx = g ′ (t)dt wd
f (x) dx = = f (g(t))g ′ (t) dt
a a = g(c), b = g(d) c
Para el caso de integrales indefinidas este proceso de sustitución de representa de forma menos
precisa y se escribe simplemente
" #
w x = g(t) w
f (x) dx = = f (g(t))g ′ (t) dt
dx = g ′ (t)dt
r r
En este contexto, es frecuente calcular f (g(t))g ′ (t) dt = H(t), y escribir f (x) dx = H(t), igual-
dad que no tiene mucho sentido si no se especifica también la relación entre las variables t y
r
x, escribiendo “ f (x) dx = H(t) donde x = g(t)”. Desde luego, el conocimiento de H(t) y de la
relación x = g(t) es suficiente para calcular integrales definidas de f , pero también podemos
“deshacer el cambio” para obtener una primitiva de f . Para eso la función g debe ser una biyec-
ción de J sobre I con derivada no nula. En tal caso, la función F(x) = H(g−1 (x)) es una primitiva
de f en I. En efecto:
1
F ′ (x) = H ′ (g−1 (x))(g−1 ) ′ (x) = f (g(g−1 (x)))g ′ (g−1 (x))(g−1 ) ′ (x) = f (x)g ′ (g−1 (x)) = f (x)
g ′ (g−1 (x))
No olvides que la fórmula del cambio de variables puede usarse en un sentido (de izquierda a
derecha) o en otro (de derecha a izquierda) según convenga.
Puede ocurrir que al hacer un cambio de variable en una “integral corriente” obtengamos
una “integral impropia”. No hay que preocuparse porque para estudiar la convergencia de una
integral pueden hacerse cambios de variable biyectivos: ello no altera la eventual convergen-
cia de la integral ni su valor.
8.27 Ejemplo. Con frecuencia se hacen cambios de variable para quitar radicales.
√
w2 2 π/4
1
x = 2 tgt, dx = 2t 1 w cost 1 −1 π/4 2 − 2
√ dx = cos = dt = =
√ x2 x2 + 4
√ 4 sen2 t 4 sent π/6 4
2/ 3 2/ 3 = 2 tg(π/6), 2 = 2 tg(π/4) π/6
wb 1
p dx
a (x − a)(b − x)
Suponemos que a < b. El cambio que hacemos consiste en llevar el intervalo ] − 1, 1[ al ]a, b[ por
una biyección del tipo g(t) = αt + β. Las condiciones g(−1) = a, g(1) = b nos dan que
α = (b − a)/2, β = (b + a)/2. Con ello:
wb b−a w1
1 x = g(t), dx = dt
p dx = 2 = √ =π
a (x − a)(b − x) a = g(−1), b = g(1) −1
1 − t2
Ejercicios
w p w dx we4 dx w4 1 r 1 w e x +3 e 2x
4 − x 2 dx , √ , √ , 1 + dx , dx
x x2 − 1 e
x log x x2 x 2 + ex
1
ra
9. Sea a > 0. Prueba que si f es impar, es decir, f (−x) = − f (x), entonces −a f (t)dt = 0. Y si f
ra ra
es una función par, es decir, f (−x) = f (x), entonces −a f (t)dt = 2 0 f (t)dt.
r P(x)
Dadas dos funciones polinómicas P(x) y Q(x), queremos calcular dx. Si el grado de P
Q(x)
es mayor o igual que el de Q, podemos dividir los dos polinomios obteniendo
P(x) G(x)
= H(x) + ,
Q(x) Q(x)
donde H(x) y G(x) son polinomios y el grado de G es menor que el grado de Q. Por tanto, su-
pondremos siempre que el grado de P es menor que el grado de Q. Supondremos también que
el coeficiente líder del polinomio Q es 1. La técnica para calcular la integral consiste en des-
P(x)
componer la fracción en otras más sencillas llamadas “fracciones simples”. Estudiaremos
Q(x)
dos formas de hacerlo: el método de los coeficientes indeterminados y una variante del mismo
conocida como Método de Hermite.
Observaciones
• Esto se dice muy pronto, pero puede ser muy difícil de hacer si no imposible. Afortunada-
mente, en los casos prácticos esta descomposición o se conoce o es muy fácil de realizar.
• En la descomposición (8.7) cada a j es una raíz real de orden α j del polinomio Q, y los factores
cuadráticos del tipo (x 2 + b j x + c j )β j corresponden a raíces complejas conjugadas de orden β j .
Tales factores cuadráticos son irreducibles, es decir, su discriminante es negativo o, lo que es
igual, x 2 + b j x + c j > 0 para todo x ∈ R.
Paso 2
Método de los coeficientes indeterminados
P(x)
Escribimos el cociente como suma de fracciones de la siguiente forma:
Q(x)
• Por cada raíz real a j de orden α j escribimos α j fracciones cuyos numeradores son constantes
Ak j que hay que determinar, y los denominadores son de la forma (x − a j )k j donde k j toma va-
lores de 1 hasta α j .
• Por cada factor cuadrático irreducible (x 2 + b j x + c j )β j escribimos β j fracciones cuyos nume-
radores son de la forma Bk j x + Ck j siendo Bk j y Ck j constantes que hay que determinar, y los
denominadores son de la forma (x 2 + b j x + c j )k j donde k j toma valores de 1 hasta β j .
• La descomposición es de la forma:
n αj m βj
P(x) X X Ak j X X Bk j x + Ck j
= + (8.8)
Q(x)
j=1
(x − a j )k j
k j =1 j=1
(x 2 + b j x + c j )k j
k j =1
Método de Hermite
P(x)
Escribimos el cociente de la siguiente forma:
Q(x)
P(x) A1 An B1 x + C1 Bm x + Cm
= + ···+ + + ···+ 2 +
Q(x) x − a1 x − a n x 2 + b 1 x + c1 x + b m x + cm
d F(x)
+
dx (x − a1)α1 −1 · · · (x − an)αn −1 (x 2 + b1 x + c1)β1 −1 · · · (x 2 + bm x + cm )βm −1
donde A1 , . . . , An , B1 , . . . , Bm ,C1 , . . . ,Cm son coeficientes que tenemos que determinar y, en la frac-
ción que aparece con una derivada, F(x) es un polinomio genérico de grado uno menos que el
P(x)
denominador. En resumen, se trata de escribir como suma de fracciones simples, una por
Q(x)
cada factor, más la derivada de un cociente que tiene por denominador lo que queda de Q(x).
Observa que en ambos métodos hay que calcular tantos coeficientes como el grado de Q.
Tanto en un caso como en otro, se reducen todas las fracciones a común denominador (que
será Q(x)), y se iguala a P(x) al numerador resultante. Esto nos producirá un sistema de ecua-
ciones cuya resolución nos dará el valor de todos los coeficientes. Naturalmente, en el método
de Hermite hay que efectuar la derivada antes de reducir a común denominador.
Observaciones
• En ambos métodos tenemos que calcular el mismo número de coeficientes pero en el mé-
todo de Hermite la obtención del sistema de ecuaciones es un poco más trabajosa debido a la
presencia de la derivada.
• El método de Hermite es interesante de aplicar cuando hay factores cuadráticos de orden
elevado (raíces imaginarias múltiples).
Sólo nos queda saber calcular las integrales que hemos dejado pendientes:
w A
• dx = A log |x − a|.
x−a
w Bx +C
• dx. Siempre se puede escribir x 2 + bx + c = (x − d)2 + k 2 , con lo que descompo-
x 2 + bx + c
nemos nuestra integral en dos:
w Bx +C w Bx +C w B(x − d) + C + Bd
dx = dx = dx =
x 2 + bx + c 2
(x − d) + k 2 (x − d)2 + k 2
w B(x − d) w C + Bd
= 2 2
dx + dx =
(x − d) + k (x − d)2 + k 2
B w dx
= log (x − d)2 + k 2 + (C + Bd)
2 (x − d)2 + k 2
y la última integral es inmediata (del tipo arcotangente) si hacemos el cambio de variable
x−d
t= .
k
En el método de los coeficientes indeterminados aparecen también, cuando hay raíces múlti-
ples, otros dos tipos de fracciones elementales:
A
• Fracciones del tipo donde k ∈ N y k > 2, correspondientes a raíces reales múltiples, las
(x − a)k
cuales no ofrecen dificultad pues
w A A 1
• dx = − .
(x − a)k k − 1 (x − a)k−1
Bx +C
• Fracciones del tipo donde k ∈ N y k > 2, correspondientes a raíces imaginarias
(x 2 + bx + c)k
múltiples, la integración de las cuales ofrece bastante dificultad a partir de k > 3. Suelen hacerse
usando la fórmula de reducción del ejercicio número 6.
w x2 − 2
8.29 Ejemplo. Se trata de calcular dx. Como hay raíces imaginarias múltiples apli-
x3 (x 2 + 1)2
caremos el método de Hermite.
x2 − 2 A Bx +C d ax3 + bx 2 + cx + d
= + 2 +
x3 (x 2 + 1)2 x x + 1 dx x 2 (x 2 + 1)
a = 0, b = 5/2, c = 0, d = 1, A = 5, B = −5, C = 0;
por lo tanto
w x2 − 2 (5/2)x 2 + 1 5
dx = + 5 log x − log(x 2 + 1).
x3 (x 2 + 1)2 x 2 (x 2 + 1) 2
w
+∞
x+1
8.30 Ejemplo. Calcular la integral dx. Aplicaremos el método de los coefi-
x(x + 1)(x 2 + 1)
2
cientes indeterminados.
x+1 A B Cx + D
2
= + + 2
x(x + 1)(x + 1) x x+1 x +1
Reduciendo a común denominador obtenemos:
x+1 −A + (A + B − D)x + (−A −C+ D)x 2 + (A + B + C)x3
2
=
x(x + 1)(x + 1) x(x + 1)(x 2 + 1)
Deducimos que:
wt wt dx wt dx wt dx
x+1 t−1
dx = − − = log 2 − arc tgt + arc tg2
x(x + 1)(x 2 + 1) x−1 x x2 + 1 t
2 2 2 2
Por tanto:
w
+∞
x+1 π
dx = log 2 − + arc tg 2
x(x + 1)(x 2 + 1) 2
2
Ejercicios
w 2 − x2 w
1/2
dx w x 4 + 6x 3 − 7x 2 − 4x − 3
dx , dx , dx
x 3 − 3x 2 4
x −1 x 3 − 2x 2 + x − 2
−1/2
w
+∞
x−1 w
+∞
dx w1 dx
dx , dx , dx
x 3 − 3x 2 + x + 5 −∞
(x 2 − 2x + 2)2 1 + x4
1 0
w x2 w dx w 3x 2 + 30 w x2
dx , , dx , dx
(x 4 − 1)2 x(1 + x 4 ) x 4 + 2x 2 − 8 (x 2 + 1)2
Acabamos de ver que la primitiva de una función racional siempre puede expresarse me-
diante funciones elementales. Nos vamos a ocupar ahora de algunos tipos de funciones no
racionales cuyas integrales se pueden transformar, por medio de un cambio de variable, en
integrales de funciones racionales. Se dice entonces que la integral de partida se ha raciona-
lizado y esta técnica se conoce como “integración por racionalización”. Conviene advertir que
los cambios de variable que siguen son los que la práctica ha confirmado como más útiles en
general, pero que en muchas ocasiones la forma concreta de la función que queremos integrar
sugiere un cambio de variable específico que puede ser más eficaz.
En lo que sigue, representaremos por R = R(x, y) una función racional de dos variables, es decir,
un cociente de funciones polinómicas de dos variables. Te recuerdo que una función polinó-
n X
X m
mica de dos variables es una función de la forma P(x, y) = ci j xi y j .
i=0 j=0
2t 1 − t2 2 dt
sen x = , cos x = , dx =
1 + t2 1 + t2 1 + t2
Con ello resulta:
w w
2t 1 − t 2 2 dt
R(sen x, cos x)dx = t = tg(x/2) = R ,
1 + t2 1 + t2 1 + t2
8.31 Ejemplo.
w w w t2 − 1
dx cos x dx
= = tg x/2 = t = · · · = dt
sen x − tg x sen x cos x − sen x 2t 3
1 logt 1 1
= 2+ = 2
+ log | tg(x/2)|.
4t 2 4 tg (x/2) 2
Casos particulares
• Cuando R(− sen x, − cos x) = R(sen x, cos x) se dice que “R es par en seno y coseno”. En este caso
es preferible el cambio tg x = t. Con lo que
t 1 dt
sen x = √ , cos x = √ , dx =
1 + t2 1 + t2 1 + t2
En el caso particular de tratarse de una integral del tipo
w
senn x cosm x dx
con n y m números enteros pares, es preferible simplificar la integral usando las identidades
1 + cos2x 1 − cos2x
cos2 x = sen2 x = .
2 2
• Cuando R(− sen x, cos x) = −R(sen x, cos x) se dice que “R es impar en seno” y el cambio cos x = t
suele ser eficaz.
• Cuando R(sen x, − cos x) = −R(sen x, cos x) se dice que “R es impar en coseno” y el cambio sen x = t
suele ser eficaz.
w
8.32 Ejemplo. Calcular I = sen2 x cos2 x dx . Tenemos:
w w w w 1 + cos2x w 1 + cos2x 2
I = (1 − cos2 x) cos2 x dx = cos2 x dx − cos4 x dx = dx − dx
2 2
x sen 2x 1 w x + sen 2x x 1 w 1 1 + cos4x
= + − (1 + 2 cos 2x + cos2 2x)dx = − − cos 2x dx − dx
2 4 4 4
4 2 4 2
x + sen2x sen 2x x sen 4x 1 sen 4x
= − − − = x−
4 4 8 32 8 4
8.33 Ejemplo.
" #
w cos3 x w (1 − sen2 x) cos x dx t = sen x w 1 − t2
dx = = = dt
sen2 x sen2 x dt = cos x dx t2
−1 −1
= −t = − sent.
t sent
w sen2 x cos x
8.34 Ejemplo. Sea I = dx. Se trata de una función par en seno y en coseno. Ha-
sen x + cosx
ciendo t = tg x, obtenemos:
w t2
I= dt
(t + 1)(t 2 + 1)2
Aplicando el método de Hermite escribimos:
t2 A Bt + C d αt + β
= + +
(t + 1)(t 2 + 1)2 t + 1 t 2 + 1 dx t2 + 1
Deducimos que:
1 1 1 1+t 1 1
I= log |t + 1| − log(t 2 + 1) − 2
= log | sen x + cosx | − cos x(sen x + cosx)
4 8 4 1+t 4 4
8.36 Ejemplo.
w w w w w
tg5 x dx = tg3 x tg2 x dx = tg3 x(sec2 x − 1) dx = tg3 x sec2 x dx − tg3 x dx
tg4 x w 3 tg4 x w tg4 x w
= − tg x dx = − tg x tg2 x dx = − tg x(sec2 x − 1) dx
4 4 4
tg4 x w w tg4 x 1 2
= − tg x sec2 x dx + tg x dx = − tg x + log| cos x |
4 4 2
Ejercicios
w π/4
w w w w
dx cos(3x + 4) dx dx
, p dx , , sen2 x cos3 x dx ,
sen x cos2 x
2
1 + tg 2 (x + 2) (1 + senx) cos x cos3 x
0
wπ wπ wπ
13. Calcular sen px cos qx dx , sen px sen qx dx , cos px cos qx dx donde p y q son enteros.
−π −π −π
n
ao X
14. Para x ∈ R, y n ∈ N, definamos F(x) = + (ak coskx + bk sen kx). Para −n 6 p 6 n prueba
2
k=−n
k,0
que:
π π
1w 1w
ap = F(x) cos px dx y bp = F(x) sen px dx
π −π π −π
w
Integrales del tipo R x, [L(x)]r , [L(x)]s , . . . dx
ax+ b
Donde L(x) = , a, b, c, d ∈ R con ad − bc , 0 y r , s, . . . son números racionales.
cx + d
Se racionalizan con el cambio t q = L(x) donde q es el mínimo común denominador de las
fracciones r, s, . . .. Pues entonces tenemos que
d tq − b
x= = r(t)
a − ct q
y la integral se transforma en w
R(r(t),t rq ,t sq , . . .)r ′ (t) dt
en la que el integrando es una función racional de t.
w x + 1 1/3 1 x+1
8.37 Ejemplo. Sea I = dx. El cambio de variable = t 3 racionaliza la inte-
x−1 1+x x−1
t3 + 1
gral pues se tiene que x = 3 , con lo que:
t −1
w 1 w t +2 1
1
2
t +t +1
√ 2t + 1
I = −3 3 dt = 2
− dt = log 2
+ 3 arc tg √
t −1 t +t +1 t −1 2 (t − 1) 3
r
x+1
donde t = 3 .
x−1
Integrales binomias
w p α+1
8.38 Ejemplo. Sea I = x x2/3 + 2 dx . En este caso es α = 1, β = 2/3, γ = 1/2 y = 3.
β
Deducimos que la primitiva buscada puede expresarse por funciones elementales. Haciendo
3w 2√
x2/3 = t obtenemos I = t t + 2dt , la cual se racionaliza haciendo t + 2 = s2 (s > 0), con lo
w 2
que I = 3 (s2 − 2)2s ds que es inmediata.
w
Integrales del tipo R(ex )dx
Se racionalizan
w con el cambio x = logt. Un caso particular de este es el de las integrales de la
forma R(cosh x, senh x)dx que también admiten un tratamiento parecido al de las trigonomé-
tricas.
w 2
8.39 Ejemplo. Sea I = dx. Desarrolla los cálculos para comprobar que
senh x + tghx
w 2(1 + t 2) x 1
I = [x = logt] = 3
dt = log tgh −
(t − 1)(1 + t) 2 1 + coshx
2
Por otra parte, como la función es impar en senh x, también podemos proceder
senh x + tghx
como sigue
w 2t 1 1 1
I = [t = cosh x] = dt = − + log(−1 + coshx) − log(1 + coshx)
(−1 + t)(1 + t)2 1 + coshx 2 2
Por supuesto, puedes comprobar que las dos primitivas encontradas son de hecho iguales.
p
Integración de funciones del tipo R(x, ax 2 + bx + c)
w p
Una integral de la forma R(x, ax 2 + bx + c)dx puede racionalizarse por medio de las sustitu-
ciones siguientes.
• Si el trinomio ax 2 + bx + c no tiene raíces reales, entonces debe ser ax 2 + bx + c > 0 para todo
x ∈ R, en particular c > 0. La sustitución:
p √
2
√ b − 2t c
ax + bx + c = t x + c , x = 2 = g(t)
t −a
w √
transforma la integral en R g(t),t g(t) + c g ′ (t)dt donde el integrando es una función racio-
nal de t.
w x x
8.40 Ejemplo. Cálcular 2 3/2
dx. Observa que, si R(x, y) = 3 , la integral que nos
r √ (7x − 10 − x ) y
piden es R(x, 7x − 10 − x 2)dx del tipo que acabamos de considerar.
donde G es una función racional de dos variables. Los cambios de variable respectivos
a) x = sec u , b) x = sen u ,
c) x = tg u
w
convierten las integrales anteriores en otras de la forma F(sen x, cos x)dx donde F es una fun-
ción racional de dos variables.
• Si el trinomio h(x) = ax 2 + bx + c tiene dos raíces reales α < β , lo que se hace es transformar
dicho trinomio en otro que tenga como raíces −1 y 1. Para ello llevamos −1 a α y 1 a β mediante
una función de la forma ϕ(t) = λt + µ. Las condiciones ϕ(−1) = α, ϕ(1) = β, determinan que
β−α β+α
λ= ,µ= . Con el cambio
2 2
β−α β+α
x = ϕ(t) = t+
2 2
(β − α)2 2
tenemos que h(ϕ(t)) = a (t − 1). Ahora, si a > 0, deducimos que
4
w p w √ (β − α) p 2
β−α
R(x, ax + bx + c)dx = [x = ϕ(t)] = R ϕ(t), a
2 t −1 dt
2 2
• Si el trinomio ax 2 +√bx + c no tiene raíces reales, entonces debe ser d = 4ac − b2 > 0 y también
d
a > 0. Poniendo γ = √ , podemos escribir:
2 a
2 2 " √ 2 #
√ b b2 √ b a b
2
ax + bx + c = ax + √ +c− = ax + √ +γ = γ
2 2
x+ √ +1 =
2 a 4a 2 a γ 2 aγ
" 2 #
2a b
= γ2 √ x+ √ +1
d d
El cambio √
2a b dt −b
√ x + √ = t , esto es , x = = φ(t)
d d 2a
transforma la integral en
w w √
p p d
R(x, ax 2 + bx + c)dx = [x = φ(t)] = R φ(t), γ t 2 + 1 dt
2a
que es del tipo c) anterior.
Casos particulares
w
P(x)
• Las integrales de la forma p dx donde P(x) es una función polinómica pueden
ax 2 + bx + c
resolverse con facilidad por el método de reducción. Se procede de la siguiente forma.
Escribimos
P(x) d p C
p = 2
Q(x) ax + bx + c + p
ax 2 + bx + c dx ax 2 + bx + c
donde Q(x) es un polinomio, cuyos coeficientes hay que calcular, de grado una unidad me-
nos que el polinomio P(x) y C es una constante que también hay que calcular. Observa que la
igualdad anterior puede escribirse
1
P(x) = Q ′ (x)(ax 2 + bx + c) + Q(x)(2ax + b) + C
2
y a la derecha queda un polinomio de igual grado que P(x) lo que permite identificar coeficien-
tes. Una vez calculados el polinomio Q y la constante C tenemos que
w P(x) p w 1
p dx = Q(x) ax 2 + bx + c + C p dx
ax 2 + bx + c ax 2 + bx + c
w 1
con lo que todo se reduce a calcular una integral de la forma p dx. Haciendo uso
2
ax + bx + c
de los cambios antes visto, esta integral, salvo constantes, puede escribirse de alguna de las
formas
w 1 w 1 w 1
√ dt = arc sen(t) , √ dt = argsenh(t) , √ dt = argcosh(t)
1−t 2 1+t 2 2
t −1
√ √
Recuerda que argsenh(t) = log t + t 2 + 1 y argcosh(t) = log t + t 2 − 1 .
Ejercicios
Con una integral puedes calcular magnitudes tan diversas como áreas, volúmenes, longitu-
des de curvas, el trabajo realizado por una fuerza, la masa de un sólido, momentos de inercia,
el campo eléctrico, el flujo de un fluido a través de una superficie y muchas más. Es notable,
sin embargo, que la forma de proceder sea casi siempre la misma, y consiste en expresar el va-
lor exacto de la magnitud que se quiere calcular como un límite de sumas de Riemann, para
deducir, a partir de ellas, la integral cuyo cálculo proporciona la solución del problema. Podrás
comprobar en lo que sigue que esta técnica es bastante sencilla e intuitiva. Con un poco de
práctica tú mismo podrás aplicarla con éxito en situaciones distintas de las que aquí se consi-
deran.
wb
λ(G( f , a, b)) = | f (x)| dx
a
por (x, 0), es decir, | f (x)| es la longitud de la sección vertical de G( f , a, b) por el punto (x, 0), y el
área de la región G( f , a, b) es igual a la integral de las longitudes de sus secciones. Intuitivamente:
integrando longitudes obtenemos áreas. Como el área es invariante por rotaciones, este resul-
tado es también válido si consideramos secciones por rectas paralelas a una recta cualquiera
dada. Deducimos así el siguiente resultado.
Principio de Cavalieri. El área de una región plana es igual a la integral de las longitudes de sus
secciones por rectas paralelas a una recta dada.
Regiones de tipo I
Supongamos que f , g son funciones continuas y llamemos Ω a la región del plano compren-
dida entre las curvas y = f (x) e y = g(x) para a 6 x 6 b. Se dice que Ω es una región de tipo I. Es
evidente que las longitudes de las secciones verticales de Ω son iguales a | f (x) − g(x)| por lo que
su área viene dada por
wb
| f (x) − g(x)| dx (8.9)
a
Observa que esta integral expresa el área de Ω como límite de las sumas de Riemann
n
X
| f (tk ) − g(tk )| (xk − xk−1 )
k=1
lo que tiene una sencilla interpretación que puedes ver en la siguiente figura.
3 3
2 2
1 1
1 2 3 4 5 6 1 2 3 4 5 6
-1 -1
Cuando la función f − g no tiene signo constante en el intervalo [a, b], para calcular la inte-
gral (8.9) se descompone dicho intervalo en intervalos en los que la función f − g es siempre
positiva o siempre negativa, lo que permite quitar el valor absoluto en el integrando.
A veces interesa expresar una región de tipo I como unión de dos o más regiones de tipo
I disjuntas y más sencillas, entonces su área es la suma de las áreas de cada una de dichas
regiones.
1.5
0.5
1 2 3 4
-0.5
-1
Podemos considerar Ω como una región de tipo I. La función cuya gráfica limita a Ω por
√
arriba es g(x) = x . La función cuya gráfica limita a Ω por abajo viene dada por
( √
− x 06x61
f (x) =
x−2 16x64
En consecuencia
w4 w1 √ √ w4 √ 9
λ(Ω) = |g(x) − f (x)| dx = ( x − ( x )) dx + ( x − (x − 2)) dx =
2
0 0 1
Observa que podemos ver Ω como unión de dos regiones de tipo I como se indica en la siguien-
te figura.
1.5
0.5
-0.5
-1
Y lo que hemos hecho antes ha sido calcular el área de cada una de estas dos regiones.
Regiones de tipo II
Supongamos que f , g son funciones continuas y llamemos Ω a la región del plano compren-
dida entre las curvas x = f (y) y x = g(y) para a 6 y 6 b. Se dice que Ω es una región de tipo II. Es
evidente que las longitudes de las secciones horizontales de Ω son iguales a | f (y) − g(y)| por lo
lo que tiene una sencilla interpretación que puedes ver en la siguiente figura.
6 6
5 5
4 4
3 3
2 2
1 1
-1 1 2 3 -1 1 2 3
Es importante advertir que la distinción entre regiones de tipo I y de tipo II es tan sólo una
cuestión de conveniencia. No son conjuntos de distinta naturaleza sino formas distintas de
describir un conjunto. En la práctica te vas a encontrar siempre con regiones que puedes con-
siderar tanto de tipo I como de tipo II y deberás elegir la descripción que más facilite el cálculo
de la correspondiente integral.
De todas formas, no debes olvidar que basta cambiar la variable x por la variable y para
convertir una región de tipo II en otra de tipo I. Geométricamente, lo que hacemos es una
simetría respecto a la recta y = x, lo que deja invariante el área. Por tanto, si en un ejercicio
resulta conveniente considerar la región cuya área quieres calcular como una región de tipo
II y te encuentras más cómodo trabajando con regiones de tipo I, basta con que cambies los
nombres de las variables.
Observa que las figuras (8.4) y (8.5) son simétricas respecto de la recta y = x.
8.43 Ejemplo. La región del ejemplo (8.42) puedes considerarla como una región de tipo II.
1.5
0.5
1 2 3 4
-0.5
-1
La curva que limita esta región por la derecha es la gráfica de la recta x = y + 2 y la curva que
limita esta región por la derecha es la gráfica de la parábola x = y2 . La variable y está compren-
dida entre −1 y 2.
Ω = (x, y) : y2 6 x 6 y + 2, −1 6 y 6 2
Tenemos que
w2 9
λ(Ω) = (y + 2 − y2) dy =
2
−1
También puedes transformar directamente Ω en una región de tipo I más sencilla mediante
una simetría. Aquí la tienes.
Aunque la región así obtenida no es la misma Ω tiene, sin embargo, igual área que Ω pues
ambas regiones se transforman una en otra por medio de una simetría respecto de la recta y = x.
8.4.2. Ejercicios
1. Calcula el área de las regiones del plano limitadas por las siguientes curvas.
Curvas en el plano
Seguramente te imaginas una curva en el plano como una línea continua que puede dibu-
jarse de un trazo, sin levantar el lápiz del papel. Esa idea es esencialmente correcta. Las circun-
ferencias, las elipses, las cardioides son todas ellas curvas. Faltaría más. Ninguna de ellas pue-
des representarla por una igualdad de la forma y = f (x). Las curvas que pueden representarse
por una ecuación cartesiana del tipo y = f (x) son curvas muy particulares pues son gráficas de
funciones. No olvides que cuando dices “sea la curva dada por la ecuación y = f (x)” te estás
refiriendo a la curva cuya imagen es el conjunto de puntos del plano {(x, y) : x ∈ [a, b], y = f (x)}
es decir, a la gráfica de f .
Si lo piensas un momento verás que muy pocas curvas son gráficas. Para que una curva sea
una gráfica es necesario que cualquier recta vertical la corte a lo más en un solo punto; ningu-
na curva cerrada cumple esta condición. Precisamente entre las curvas cerradas se encuentran
algunas de las curvas más interesantes, a ellas pertenecen los distintos tipos de óvalos y lem-
niscatas, las astroides, las cardioides y muchas más.
Vamos a ver ahora una forma de representar curvas planas mucho más general que las ecua-
ciones cartesianas del tipo y = f (x) que sólo sirven para representar curvas que también son
gráficas. Para empezar, consideremos una curva que viene dada por una ecuación cartesiana
de la forma y = f (x) donde x ∈ [a, b]. Nuestra curva es, por tanto, la imagen de la aplicación
γ : [a, b] → R2 definida por γ(x) = (x, f (x)) para todo x ∈ [a, b]. Intuitivamente, cuando x recorre el
intervalo [a, b], el punto (x, f (x)) recorre la curva. Es fácil generalizar esta situación sin perder la
idea intuitiva de curva. Lo esencial es que podamos describir las coordenadas de los puntos de
la curva como funciones continuas de un parámetro. En la situación que estamos consideran-
do se tiene que y = f (x), es decir, la segunda coordenada es función continua de la primera. La
generalización consiste en que ambas coordenadas sean funciones continuas de un parámetro.
Llegamos así a la definición siguiente.
Si γ(t) = (x(t), y(t)), decimos que x = x(t), y = y(t) son las ecuaciones paramétricas de la cur-
va. El punto γ(a) es el origen y γ(b) el extremo de la curva. Si γ(a) = gamma(b) se dice que la curva
es cerrada. Se dice que una curva γ es simple si no se corta a sí misma, es decir, si para s,t ∈[a, b]
con s , t se verifica que γ(s) , γ(t). Una curva cerrada se llama simple si la función γ es inyectiva
en ]a, b[.
8.45 Ejemplo. • La curva de ecuaciones paramétricas x(t) = a + r cost, y(t) = b + R sent donde
0 6 t 6 2π es una elipse cuyo centro es el punto (a, b) y semiejes de longitudes r y R. Cuando
r = R se trata de una circunferencia.
• La curva de ecuaciones paramétricas x(t) = r(t − sent), y(t) = r(1 − cost) para 0 6 t 6 2π es la
cicloide. Es la curva que describiría una chincheta clavada en una rueda de radio r que avanza
girando sin deslizar.
• La curva de ecuaciones paramétricas x(t) = cost(1 + cost), y(t) = sent(1 + cost) para 0 6 t 6 2π
se llama cardioide. Es la curva que describe un punto fijo del borde de un círculo que rueda sin
deslizar sobre otro del mismo radio.
2
0.5
0.5 1 1.5 2
Π 2Π
-0.5
Cicloide
-1
Cardioide
Sea Ω la región rodeada por una curva cerrada simple γ(t) = (x(t), y(t)), a 6 t 6 b, y supon-
gamos que las funciones x(t), y(t) tienen primera derivada continua. En estas condiciones se
verifica que el área de Ω viene dada por
b b
w w
′
λ(Ω) = x(t)y (t) dt = x (t)y(t) dt
′ (8.11)
a a
(la igualdad entre las dos integrales se deduce fácilmente integrando por partes y teniendo en
cuenta que por ser γ una curva cerrada es x(b)y(b) − x(a)y(a) = 0).
Ejercicios
1. Calcula el área encerrada por la elipse x(t) = a + r cost, y(t) = b + R sent donde 0 6 t 6 2π.
2. Calcula el área encerrada por la cardioide x(t) = cost(1 + cost), y(t) = sent(1 + cost) para
0 6 t 6 2π.
Dado un punto (x, y) , (0, 0), hay un único par de números (ρ, ϑ) tales que ρ > 0, −π < ϑ 6 π,
que verifican las igualdades x = ρ cosϑ, y = ρ sen ϑ. Dichos números se llaman coordenadas po-
lares del punto (x, y). Si consideras el número complejo x + iy, entonces ρ es su módulo y ϑ es
su argumento principal.
Una curva puede venir dada en coordenadas polares por medio de una ecuación de la forma
ρ = f (ϑ) donde f : [α, β] → R es una función continua. Esta forma de representar una curva no
es más que la parametrización dada por
(
x(ϑ) = f (ϑ) cos ϑ
(α 6 ϑ 6 β) (8.12)
y(ϑ) = f (ϑ) sen ϑ
Queremos calcular el área de la región del plano Ω = {(ρ cos ϑ, ρ cos ϑ) : 0 < ρ 6 f (ϑ), α 6 ϑ 6 β}.
Ρ=fHΘL
Θk-1
Θk
Α
Β
Para ello lo que hacemos es aproximar Ω por medio de sectores circulares. Recuerda que
1
el área de un sector circular de radio ρ y amplitud ϕ (medida en radianes) es igual a ρ2 ϕ.
2
Consideramos para ello una partición {α = ϑ0 , ϑ1 , ϑ2 , . . . , ϑn−1 , ϑn = β} de [α, β] y formamos la
X n
1 1
suma f (ϑk )2 (ϑk − ϑk−1 ). Como el número f (ϑk )2 (ϑk − ϑk−1 ) es el área del sector circular,
2 2
k=1
representado en azul en la figura, de radio f (ϑk ) y amplitud igual a ϑk − ϑk−1 , es claro que la
X n
1
suma anterior representa una aproximación del área de Ω. Como f (ϑk )2 (ϑk − ϑk−1 ) es una
2
k=1
1
suma de Riemann de la función ϑ 7→ f (ϑ) , se sigue que el área de Ω viene dada por la integral
2
2
β
1w
f (ϑ)2 dϑ
2α
Con frecuencia, las ecuaciones en coordenadas polares se usan para representar distintos
tipos de curvas simétricas llamadas “rosa”. Por ejemplo, aquí tienes una rosa de 8 hojas o lazos,
cuya ecuación en coordenadas polares es ρ = cos(4ϑ), 0 6 ϑ 6 2π.
Ejercicios
1. Calcula el área de la región del plano rodeada por un lazo de la lemniscata de ecuación
polar ρ2 = cos(2ϑ), (−π/4 6 ϑ 6 π/4).
5. Calcular el área del lóbulo del folium de Descartes de ecuación x3 + y3 − 3axy = 0, a > 0.
Sugerencia. Expresa la ecuación en coordenadas polares.
Se trata de calcular la longitud de la curva plana γ dada por las ecuaciones paramétricas
(
x = x(t)
(a 6 t 6 b)
y = y(t)
donde suponemos que x(t), y(t) tienen derivada primera continua. Para ello aproximamos la
curva por poligonales inscritas en ella. Cada partición {a = t0 ,t1 ,t2 , . . . ,tn−1 ,tn = b} induce una
poligonal cuyos vértices son los puntos γ(tk ) = (x(tk ), y(tk )), (0 6 k 6 n).
Donde hemos usado el teorema del valor medio y la continuidad de las derivadas. Pero esta es
p
una suma de Riemann de la función t 7→ x ′ (t)2 + y ′(t)2 . Deducimos que la longitud de la curva
γ viene dada por
wb q
ℓ(γ) = x ′ (t)2 + y ′(t)2 dt (8.13)
a
Para el caso particular de que la curva sea la gráfica de una función y = f (x), esto es γ(x) =
(x, f (x)), entonces su longitud viene dada por
wb q
ℓ(γ) = 1 + f ′ (x)2 dx
a
Para el caso particular de que la curva venga dada por una parametrización polar de la forma
(8.12), su longitud viene dada por
wβ q
ℓ(γ) = f (ϑ)2 + f ′ (ϑ)2 dϑ
α
Si interpretamos que la curva γ(t) = (x(t), y(t)) es la función de trayectoria seguida por un mó-
vil, entonces la velocidad de dicho móvil en cada instante t viene dada por el vector derivada
p
γ ′ (t) = (x ′ (t), y ′ (t)), y la rapidez es la norma euclídea de dicho vector, es decir x ′ (t)2 + y ′ (t)2 .
La igualdad (8.13) tiene ahora una interpretación clara: la distancia recorrida por un móvil se
obtiene integrando la rapidez. Volveremos sobre esto más adelante.
Ejercicios
Al igual que podemos calcular áreas de regiones planas integrando las longitudes de sus
secciones por rectas paralelas a una dada, podemos también calcular volúmenes de regiones
en R3 integrando las áreas de sus secciones por planos paralelos a uno dado. Este resultado es
un caso particular del teorema de Fubini que veremos al estudiar integrales múltiples.
Cálculo de volúmenes por secciones planas. El volumen de una región en aes igual a la integral
del área de sus secciones por planos paralelos a uno dado.
Z
W
WHxL
X
a x b
V (x + h) − V(x)
de donde se deduce que lı́m = λ(Ω(x)). Hemos obtenido así que V ′ (x) = λ(Ω(x)).
h→0 h
Deducimos que el volumen de Ω viene dado por la integral
wb
Vol(Ω) = λ(Ω(x)) dx (8.14)
a
El razonamiento anterior se ha hecho para secciones por planos verticales al eje OX, es decir
planos paralelos al plano Y Z; pero el resultado obtenido también es válido para secciones por
planos paralelos a un plano dado.
Podemos llegar también a este resultado considerando sumas de Riemann. Para ello apro-
ximamos la región Ω por cilindros de la siguiente forma. Consideremos una partición
{a = x0 , x1 , x2 , . . . , xn−1 , xn = b}
de [a, b]. La parte de Ω comprendida entre los planos perpendiculares al eje OX por los pun-
tos (xk−1 , 0, 0) y (xk , 0, 0) puede aproximarse por un cilindro de altura xk − xk−1 y base Ω(xk ) cu-
yo volumen es igual λ(Ω(xk ))(xk − xk−1 ). La suma de los volúmenes de todos estos cilindros,
Xn
λ(Ω(xk ))(xk − xk−1 ) es por tanto una aproximación del volumen de Ω, pero dicha suma es
k=1
una suma de Riemann de la función x 7→ λ(Ω(x)), por lo que el volumen de Ω viene dado por
wb
λ(Ω(x)) dx .
a
Vamos a estudiar algunos casos en los que es fácil calcular el área de las secciones de Ω.
Los cuerpos de revolución o sólidos de revolución son regiones de R3 que se obtienen giran-
do una región plana alrededor de una recta llamada eje de giro.
Sea f : [a, b] → R una función continua. Girando la región del plano comprendida entre la
curva y = f (x), el eje de abscisas y las rectas x = a y x = b, alrededor del eje OX obtenemos un
sólido de revolución Ω. Es evidente que la sección, Ω(x), de Ω por el plano perpendicular al eje
OX en el punto (x, 0, 0), es un disco contenido en dicho plano de centro (x, 0, 0) y radio | f (x)|. Por
tanto el área de Ω(x) es λ(Ω(x)) = π f (x)2 ; en consecuencia el volumen de Ω es igual a
wb
Vol(Ω) = π f (x)2 dx
a
El volumen del sólido de revolución, Ω, obtenido girando alrededor del eje OX una región de
tipo I definida por dos funciones continuas f , g : [a, b] → R tales que 0 6 f (x) 6 g(x) para todo
x ∈ [a, b], viene dado por
wb
Vol(Ω) = π (g(x)2 − f (x)2 ) dx
a
Una expresión similar se obtiene para el volumen de un sólido de revolución obtenido girando
alrededor del eje OY una región de tipo II.
Ejercicios
2. Calcula el volumen del cono circular recto de altura h y radio de la base R obtenido girando
la recta y = Rx/h entre x = 0 y x = h.
3. Calcula el volumen del sólido engendrado al girar alrededor del eje OX la parte de la curva
y = sen2 x comprendida entre 0 y π.
4. Calcula el volumen del sólido engendrado al girar alrededor del eje OX la gráfica de la
18x
función f : [0, +∞[→ R dada por f (x) = 2 .
x +9
5. Calcula el volumen del sólido engendrado al girar la región limitada por la parábola y2 = 4x
y la recta x = 4 alrededor de dicha recta.
6. Calcula el volumen del sólido engendrado al girar la región limitada por las parábolas
y2 = x,x2 = y alrededor del eje OX.
x2 y2 z2
7. Calcula el volumen del elipsoide + + = 1.
a 2 b 2 c2
x2 y2
8. Calcula el volumen limitado por el paraboloide + = z y el plano z = 7.
9 16
Consideremos una partición {a = x0 , x1 , x2 , . . . , xn−1 , xn = b} de [a, b]. Al girar alrededor del eje
OY un rectángulo vertical cuya base es el intervalo [xk−1 , xk ] y altura f (xk ), obtenemos una lámina
de un cilindro circular recto, esto es, un tubo cuya base tiene área π(x2k − x2k−1 ) y altura f (xk ), cuyo
volumen es, por tanto, igual a
π(x2k − x2k−1) f (xk ) = π(xk − xk−1 )(xk + xk−1 ) f (xk ) = xk f (xk )(xk − xk−1 ) + xk−1 f (xk )(xk − xk−1 )
Pero estas dos sumas son sumas de Riemann de la función x 7→ πx f (x), deducimos que el volu-
men de Ω viene dado por
wb
Vol(Ω) = 2π x f (x) dx
a
Esto es lo que se conoce como método de las capas o de los tubos. Puedes adaptar fácilmente
esta expresión para el caso de que el eje de giro sea la recta vertical x = c. En general, si notamos
por R(x) el “radio de giro” de la lámina, entonces
wb
Vol(Ω) = 2π R(x) f (x) dx
a
Ejercicios
1. Calcula el volumen del toro engendrado al girar el círculo de centro (a, 0) y radio R < a
alrededor del eje OY .
2. Calcular el volumen del sólido Ω engendrado al girar la región limitada por las parábolas
y = x2 , x = y2 alrededor del eje OY .
3. Calcular el volumen del toro engendrado al girar el círculo de centro 0 y radio 3 alrededor
de la recta x = 6.
4. Calcular el volumen del sólido Ω engendrado al girar la región limitada por las parábolas
y = x2 , x = y2 alrededor la recta x = 4.
5. Un flan tiene forma de tronco de paraboloide de revolución, siendo r y 2r los radios de sus
bases y h su altura. Calcular su volumen volumen y el volumen de la porción obtenida al
cortarlo verticalmente desde un punto del borde superior.
Una superficie de revolución se obtiene girando una curva dada alrededor de una recta. Sea
f : [a, b] → R una función con derivada primera continua. Girando la gráfica de dicha función
alrededor del eje OX obtenemos una superficie de revolución, Γ. Fíjate en la siguiente repre-
sentación.
LHxL
LHx+hL
y=fHxL
SHxL
a x x+h b
Sea S(x) el área de la parte de la superficie comprendida entre los planos X = a, y X = x. Re-
wx q
presentemos por L(x) la longitud de la gráfica de f entre a y x. Recuerda que L(x) = 1 + f ′ (t)2 dt .
a
Sea h > 0. Teniendo en cuenta que el área lateral de un cilindro circular recto es igual a la longi-
tud de la base por la altura, se deduce que
Por tanto
L(x + h) − L(x) S(x + h) − S(x) L(x + h) − L(x)
2π mı́n { f (t) : x 6 t 6 x + h} 6 6 2π máx { f (t) : x 6 t 6 x + h}
h h h
Y tomando límite para h → 0 se sigue que
q
S ′ (x) = 2π f (x)L ′ (x) = 2π f (x) 1 + f ′ (x)2
wb q
λ(Γ) = 2π f (x) 1 + f ′ (x)2 dx
a
Ejercicios
3. Calcula el área de la superficie de revolución engendrada al girar la curva x2/3 + y2/3 = a2/3 ,
a > 0, alrededor del eje OX.
x2 y2
4. Calcular el área de la superficie de revolución engendrada al girar la elipse + =1
a2 b2
alrededor del eje OY .
7. Se perfora una esfera de radio r con un agujero cilíndrico (ver figura) de modo que el anillo
esférico resultante tiene altura h. Calcula el volumen del anillo y el área de la superficie
total del anillo.
-h2 h2
10. Calcula el volumen de una esfera de radio 3 en la que, siguiendo un diámetro, se ha per-
forado un agujero cilíndrico de radio r < 3. Calcula el área de la superficie total del solido
obtenido. Calcula los valores de r para los que dicha área alcanza sus valores extremos.
Series
Introducción
Las series son una de las herramientas más útiles del Análisis Matemático. Las series de Fou-
rier permiten representar señales complejas como superposición de señales sinusoidales, las
series de Taylor permiten representar funciones analíticas como límites de funciones polinómi-
cas, la transformada z es una serie de Laurent. Al igual que la integral, las series son una pode-
rosa herramienta para definir funciones; muchas funciones se definen por medio de series.
En esta lección vamos a estudiar los conceptos y resultados básicos de la teoría de series.
Lo único que necesitas para entender lo que sigue es comprender bien el concepto de suce-
sión convergente al que ya hemos dedicado suficiente atención en la lección correspondiente.
Puede ser conveniente que vuelvas a repasarlo antes de seguir.
En lo que sigue vamos a considerar sucesiones numéricas que pueden ser de números reales
o complejos. Naturalmente, todo resultado que se enuncie para números complejos también
será válido, en particular, para números reales. En una primera lectura puedes suponer, si te es
más cómodo, que se trata de sucesiones de números reales.
9.1 Definición. Dada una sucesión (de números reales o complejos), {zn }, podemos formar a
partir de ella otra sucesión, {Sn }, cuyos términos se obtienen sumando consecutivamente los
términos de {zn }, es decir:
S1 = z1 , S2 = z1 + z2 , S3 = z1 + z2 + z3 , . . . , Sn = z1 + z2 + · · · + z n , . . .
La sucesión
X {Sn } así obtenida se llama serie de término general z n y es costumbre representarla
P
por z n o, más sencillamente, z n . El número Sn se llama suma parcial de orden n de la serie
P n>1
z n.
149
Conceptos básicos 150
Debe quedar claro desde ahora que una serie es una sucesión cuyos términos se obtienen
sumando consecutivamente los términos de otra sucesión.
Ni que decir tiene que, siendo las series sucesiones, los conceptos y resultados vistos para
sucesiones conservan su misma significación cuando se aplican a series. En particular, es inne-
cesario volver a definir qué se entiende cuando se dice que una serie es “convergente”. Si una
X ∞
X
serie z n es convergente se usa el símbolo z n para representar el límite de la serie que suele
n>1 n=1
∞
X
llamarse suma de la serie. Naturalmente z n es el número definido por
n=1
∞
X n
X
z n = lı́m{Sn } = lı́m zk
n→∞
n=1 k=1
n
X n−1
X
P
Observa que si la serie z n converge entonces la sucesión z n = zj − z j es diferencia de
j=1 j=1
dos sucesiones que convergen al mismo límite y por tanto converge a cero.
9.2 Proposición (Condición necesaria para la convergencia de una serie). Para que la serie
P
z n sea convergente es necesario que lı́m{zn } = 0.
9.3 Ejemplo (Serie geométrica). Dado z∈C, la sucesión {1 + z + z 2 + · · · + z n } se llama serie geo-
métrica de razón z. Observa que dicha serie se obtiene sumando consecutivamente los térmi-
nos de la sucesión 1, z, z 2 , z3 , . . . , z n , . . . . Es costumbre representar la serie geométrica de razón
X
z con el símbolo z n . Dicha serie converge si, y sólo si, |z| < 1, en cuyo caso se verifica que
n>0
∞
X 1
zn = .
1−z
n=0
z n+1
si |z| < 1 entonces lı́m = 0 y obtenemos que
n→∞ 1 − z
∞
X n
X 1
z n = lı́m zk = (|z| < 1)
n→∞ 1−z
n=0 k=0
9.4 Ejemplo (Serie armónica). Se llama así la serie de término general 1/n; es decir, la serie
{1 + 1/2 + · · ·+ 1/n}. Se verifica que la serie armónica diverge positivamente
∞
X 1
= lı́m {1 + 1/2 + · · ·+ 1/n} = +∞
n n→∞
n=1
wn 1 X w 1
n−1 j+1 X w 1
n−1 j+1 n−1
X 1 1 1 1
log n = dx = dx 6 dx = < 1 + + ···+ +
x x j j 2 n−1 n
1 j=1 j j=1 j j=1
y por tanto
∞
X 1
lı́m {1 + 1/2 + · · ·+ 1/n} > lı́m log n = +∞ =⇒ = +∞
n→∞ n→∞ n
n=1
Este resultado es también consecuencia directa de que, según vimos al estudiar las sucesiones,
sabemos que
1 + 1/2 + 1/3 + · · ·+ 1/n
lı́m =1
n→∞ log n
(−1)n−1
9.5 Ejemplo (Serie armónica alternada). Se llama así la serie de término general ; es
n
X (−1)n−1
decir, la serie . Se verifica que la serie armónica alternada es convergente y su suma
n
n>1
es igual a log 2.
∞
X (−1)n−1
= log 2
n
n=1
1 xn+1
= 1 − x + x 2 − x3 + · · · + (−1)n xn + (−1)n+1 (9.2)
1+x 1+x
Integrando esta igualdad entre 0 y 1 tenemos que:
De donde
(−1)k−1 w xn+1 w1
n
X 1
1
log 2 − = dx 6 xn+1 =
k 1+x n+2
k=1 0 0
Y deducimos que
∞
(−1)k−1
n
X X
(−1)n−1
lı́m log 2 − = 0 =⇒ log 2 =
n→∞ k n
k=1 n=1
Reordenando términos en la serie armónica alternada podemos obtener otra serie con dis-
tinta suma.
Como hemos vista, la serie armónica alternada es la sucesión que se obtiene sumando con-
secutivamente los términos de la sucesión
(−1)n−1 1 1 1 1 1 1 1 1 1 1 1
= 1, − , , − , , − , , − , , − , , − , . . . . . . (9.3)
n 2 3 4 5 6 7 8 9 10 11 12
Vamos a cambiar el orden de los términos en esta sucesión poniendo uno positivo seguido de
dos negativos manteniendo sus posiciones relativas. Obtenemos así la sucesión
1 1 1 1 1 1 1 1 1 1 1
1, − , − , , − , − , , − , − , , − , − , . . . . . . (9.4)
2 4 3 6 8 5 10 12 7 14 16
Cuya serie asociada, obtenida sumando consecutivamente sus términos, es la sucesión {Sn }
dada por:
S1 = 1
1
S2 = 1−
2
1 1
S3 = 1− −
2 4
1 1 1
S4 = 1− − +
2 4 3
1 1 1 1
S5 = 1− − + −
2 4 3 6
1 1 1 1 1
S6 = 1− − + − −
2 4 3 6 8
...... = ......
1 1 1 1 1 1 1 1
S9 = 1− − + − − + − −
2 4 3 6 8 5 10 12
...... = ......
Xn
1 1 1
S3n = − −
2j−1 4j−2 4j
j=1
Tenemos que
1 1 1 1 1 1 1 1 1 1 1
S3n = 1− − + − − + − − + ······ + − −
2 4 3 6 8 5 10 12 2n − 1 4n − 2 4n
1 1 1 1 1 1 1 1 1 1 1
= 1− − + − − + − − + · · ·· · · + − −
2 4 3 6 8 5 10 12 2n − 1 4n − 2 4n
1 1 1 1 1 1 1 1
= − + − + − + ······ + −
2 4 6 8 10 12 2(2n − 1) 4n
1 1 1 1 1 1 1 1
= 1 − + − + − + · · ·· · · + −
2 2 3 4 5 6 2n − 1 2n
Xn j−1
1 (−1)
=
2 j
j=1
Deducimos que
nX (−1) j−1 1
1
lı́m S3n = lı́m = log 2
n→∞ 2 n→∞ j 2
j=1
Es claro que lı́m {S3n − S3n−1} = lı́m {S3n − S3n−2} = 0 de donde se sigue que
1
lı́m {Sn } = log 2
2
Es decir, hemos probado que la serie obtenida reordenando los términos de la serie armónica
alternada por el criterio de sumar uno positivo seguido de dos negativos, es convergente y su
1
suma es log 2.
2
El ejemplo anterior pone claramente de manifiesto que la suma de una serie convergen-
te no es una suma en el sentido usual de la palabra, es decir, no es una suma algebraica de
números. Observa que los conjuntos de números (9.3) y (9.4) son los mismos pero las series
1
correspondientes tienen distinta suma; la primera tiene suma log 2 y la segunda log 2. Si la
2
suma de una serie consistiera en sumar los infinitos términos de una sucesión, entonces el or-
den en que los sumáramos sería indiferente porque la suma de números tiene la propiedad
conmutativa. Debes tener claro, por tanto, que cuando calculas la suma de una serie no estás
haciendo una suma infinita sino que estás calculando un límite de una sucesión cuyos términos
se obtienen sumando consecutivamente los términos de otra sucesión dada. Insisto: calcular
la suma de una serie no es una operación algebraica, no consiste en sumar infinitos términos,
es un proceso analítico que supone un límite.
Ahora viene la pregunta del millón: si las series no son nada más que sucesiones, ¿por qué
dedicarles una atención especial? La respuesta a esta pregunta es que en el estudio de las se-
ries hay una hipótesis implícita que los libros silencian. A saber: se supone que las series son
sucesiones demasiado difíciles de estudiar directamente.
Si lo piensas un poco, esta forma de proceder no es del todo nueva. Ya estás acostumbrado a
usar la derivada de una función para estudiar propiedades de la función; pues bien, la situación
aquí es parecida: para estudiar la serie {z1 + z2 + · · · + zn} (la función) estudiamos la sucesión {zn }
(la derivada). Un buen ejemplo de esto que digo son los criterios de convergencia que veremos
seguidamente.
Otra dificultad adicional en el estudio de las series es la notación tan desafortunada que se
X∞
emplea. En la mayoría de los textos se representa con el mismo símbolo, zn , la serie (que es
n=1
una sucesión) y su suma (que es un límite que no siempre existe). Esto es un disparate: se está
confundiendo una sucesión con un número. ¿Es lo mismo la sucesión {1/n} que el número
0 que es su límite? En ninguna parte verás escrita la igualdad disparatada {1/n} = 0 ¿Por qué
X∞ X 1
1
entonces, al tratar con series, se confunde el número = 1 con que es la sucesión
2n 2k
( n ) n=1 k>1
X 1
?
2k
k=1
Quizás esto se debe a que, parece increíble pero es cierto, no hay acuerdo general para re-
presentar
X de forma apropiada la serie de término general zn . La notación que estamos usando
aquí, zn , tiene la ventaja de que es clara y evita las confusiones que estoy comentando pero
n>1
no la verás en los libros. Advertido quedas.
Todavía queda una última sorpresa. Estamos de acuerdo en que las series son sucesiones.
¿Muy especiales? En absoluto. Toda sucesión podemos verla, si así nos interesa, como una serie.
Pues toda sucesión {zn } es la serie definida por la sucesión de sus diferencias, esto es, por la
sucesión {wn } dada por
w1 = z1 , w2 = z2 − z1 , w3 = z3 − z2 , . . . , wn+1 = zn+1 − zn , . . .
n
X
Es claro que zn = w j . Por tanto, toda sucesión podemos considerarla como una serie.
j=1
Creo que con lo dicho ya puedes hacerte una idea correcta de lo que son las series. Insisto en
esto porque en los libros encontrarás disparates para todos los gustos. Algunos textos definen
una serie como. . . ¡un par de sucesiones!, otros dicen que una serie es. . . ¡una suma infinita! En
fin.
está {An }.
X X
9.7 Proposición (Criterio límite de comparación). Sean an y bn dos series de términos
n>1 n>1
positivos, y supongamos que
an
lı́m = L ∈ R+o ∪ {+∞} .
bn
X X
a) Si L = +∞ y bn es divergente también an es divergente.
n>1 n>1
X X
b) Si L = 0 y bn es convergente también an es convergente.
n>1 n>1
X X
c) Si L ∈ R+ las series an y bn son ambas convergentes o ambas divergentes.
n>1 n>1
Demostración. Supongamos que L ∈ R+ . Sea 0 < α < L < β. Todos los términos de la sucesión
{an /bn }, a partir de uno en adelante, están en el intervalo ] α, β [, es decir, existe k ∈N tal que para
todo n > k es α < an /bn < β , y, por tanto, α bn < an < β bn . Concluimos, por el criterio de compa-
ración, que la convergencia de una de las series implica la convergencia de la otra. Queda, así,
probado el punto c) del enunciado. Los puntos a) y b) se prueban de manera parecida.
9.8 Proposición (Criterio integral). Sea f : [1, +∞[→ R una función positiva y decreciente. En-
tonces se verifica que
n+1
X w
n+1 n
X
f (k) 6 f (x) dx 6 f (k)
k=2 1 k=1
X w
+∞
En consecuencia, la serie f (n) y la integral f (x) dx ambas convergen o ambas divergen.
n>1 1
Demostración. Por ser f decreciente se tiene que f (k + 1) 6 f (x) 6 f (k) para todo x ∈ [k, k + 1].
Integrando, deducimos que
w
k+1
f (k + 1) 6 f (x) dx 6 f (k)
k
Sumando estas desigualdades desde k = 1 hasta k = n, obtenemos la desigualdad del enunciado.
Unas series de términos positivos muy útiles para comparar con otras series son las siguien-
tes.
X 1
9.9 Proposición (Series de Riemann). Dado un número real α, la serie se llama serie de
nα
n>1
Riemann de exponente α. Dicha serie es convergente si, y sólo si, α > 1.
Demostración. Para que se cumpla la condición necesaria de convergencia es preciso que sea
α > 0. Supuesto que esto es así, podemos aplicar el criterio integral a la función f (x) = 1/x α y
tener en cuenta los resultados vistos en el ejemplo (8.14).
X
9.10 Proposición (Criterio de Prinsheim). Sea an una serie de términos positivos, α un nú-
n>1
mero real y supongamos que {nα an } → L ∈ R+o ∪ {+∞}. Entonces:
X
i) Si L = +∞ y α 6 1, an es divergente.
n>1
X
ii) Si L = 0 y α > 1, an es convergente.
n>1
X
iii) Si L ∈ R+ , an converge si α > 1 y diverge si α 6 1.
n>1
Vamos a estudiar a continuación dos criterios de convergencia que se aplican a series que
pueden compararse con una serie geométrica. Puesto que la serie geométrica de término gene-
an+1
ral an = xn , donde x > 0, converge si = x < 1, esto nos lleva, en el caso general de una serie
X an
términos positivos an , a considerar el comportamiento de la sucesión {an+1/an }.
n>1
9.11 Proposición (Criterio del cociente o de D’Alembert (1768)). Supongamos que an > 0 para
todo n ∈ N y que
an+1
lı́m = L ∈ R+o ∪ {+∞} .
an
X
a) Si L < 1 la serie an es convergente;
n>1
X
b) Si L > 1 o si L = +∞, entonces an es divergente.
n>1
Demostración. a) Sea λ un número tal que L < λ < 1. La definición de límite implica que existe
no ∈ N tal que para todo n > no se verifica que
an an−1 an +1 an
· · · o ano 6 λn−no ano = no λn
an =
an−1 an−2 a no λo
X
y como, por ser 0 < λ < 1, la serie λn es convergente, deducimos en virtud del criterio de
X n>1
comparación, que an es convergente.
n>1
b) Si L > 1 entonces, tomando λ tal que 1 < λ < L y razonando como antes, obtenemos que
a
para todo n > no es an > λnnoo λn y, como, λ > 1, se sigue que la sucesión {an } diverge positivamente
X
y, con mayor razón, la serie an diverge positivamente.
n>1
Análogamente, puesto que la serie geométrica de término general an = xn , donde x > 0,X con-
√
verge si n an = x < 1, esto nos lleva, en el caso general de una serie de términos positivos an ,
√ n>1
a considerar el comportamiento de la sucesión { n an }.
9.12 Proposición (Criterio de la raíz o de Cauchy (1821)). Supongamos que para todo n ∈ N es
an > 0, y que p
lı́m an = L ∈ R+o ∪ {+∞}.
n
X
a) Si L < 1 la serie an es convergente;
n>1
X
b) Si L > 1 o si L = +∞, entonces an es divergente.
n>1
Demostración. a) Sea λ un número tal que L < λ < 1. La definición de límite implica que existe X
√
no ∈ N tal que para todo n > no es n an 6 λ, es decir, an 6 λn . Puesto que 0 < λ < 1, la serie λn
X n>1
es convergente y, en virtud del criterio de comparación, se sigue que an es convergente.
n>1
b) Si L > 1 entonces, tomando λ tal que 1 < λ < L y razonando como antes, obtenemos que
para todo n > no es an > λnX
y, como, λ > 1, se sigue que la sucesión {an } diverge positivamente y,
con mayor razón, la serie an diverge positivamente.
n>1
an+1 √
Cuando lı́m = 1, también es lı́m n an = 1. En esta situación los criterios del cociente y
an X
de la raíz no proporcionan información suficiente sobre el comportamiento de la serie an .
n>1
an+1
Por ejemplo, para las series de Riemann, an = 1/n α,
se tiene que lı́m = 1 cualquiera sea α.
an
Observa que estos criterios solamente pueden proporcionar información sobre la convergencia
de series que pueden compararse con una serie geométrica. El siguiente criterio suele aplicarse
cuando fallan los anteriores.
9.13 Proposición
(Criterio
de Raabe (1832)). Supongamos que an > 0 para todo n ∈N, y ponga-
an+1
mos Rn = n 1 − .
an
X
i) Si {Rn } → L , donde L > 1 o L = +∞, la serie an es convergente.
n>1
ii) Si {Rn } → L , donde L < X1 o L = −∞, o bien si existe algún k ∈ N tal que Rn 6 1 para todo
n > k, entonces la serie an es divergente.
n>1
Demostración. i) Las hipótesis hechas implican que existen α > 1 y no ∈ N tales que para todo
n > no es Rn > α. Sea δ = α − 1 > 0. Tenemos que
an+1
Rn − 1 = (n − 1) − n > δ (n > no )
an
por lo que
1
an 6 (n − 1)an − nan+1 (n > no ).
δ
Como an > 0 , deducimos que nan+1 < (n − 1)an para todo n > no . Así la sucesión {nan+1} es de-
creciente para n > no y, como es de números positivos, deducimos que es convergente. Sea
γ = lı́m{nan+1} = ı́nf{nan+1 : n > no }. Tenemos que
n
X 1 1
an 6 (no − 1)ano − nan+1 6 (no − 1)ano − γ
δ δ
j=no
y,
Xpor el criterio general de convergencia para series de términos positivos, deducimos que
an es convergente (lo que, dicho sea de paso, implica que γ = 0 ).
n>1
ii) Si Rn 6 1 para todo n > k , entonces (n − 1)an − nan+1 6 0 y resulta que la sucesión {nan+1} es
1
creciente para n > k , luego nan+1 > kak+1 , es decir, para todo n > k , es an+1 > kak+1 y, por el
X n
criterio de comparación, deducimos que an es divergente.
n>1
Parece que estos criterios son muy restrictivos pues solamente pueden aplicarse a series
de términos positivos, pero no es así porque estos criterios pueden aplicarse para estudiar la
convergencia absoluta de una serie. Precisemos este concepto.
P
9.14 Definición. Se dice que una serie (de números reales o complejos) z n es absolutamente
convergente si la serie de términos positivos
X
|z n | = {|z1 | + |z2 | + · · · + |zn |}
n>1
es convergente.
Cuando una serie no es absolutamente convergente se utilizan los siguientes criterios para
estudiar su convergencia.
9.16 Teorema. Sea {an } una sucesión de números reales y {z n } una sucesión de números reales o
complejos.
P
Criterio de Dirichlet. Si {an } es monótona y converge a cero y la serie z n tiene sumas parciales
P
acotadas, entonces an z n converge.
P P
Criterio de Abel. Si {an } es monótona y acotada y la serie z n converge, entonces an z n es con-
vergente.
X Podemos particularizar el criterio de Dirichlet para series alternas, es decir, series del tipo
(−1)n+1 an donde an > 0 para todo n ∈ N.
n>1
P
Para estudiar la convergencia de una serie zn numérica lo primero que debes hacer es
estudiar la convergencia absoluta, es decir la convergencia de la serie de términos positivos
P
|zn |, para lo que se aplican los criterios de convergencia para series de términos positivos.
P P
Si la serie |zn | converge hemos acabado. Cuando la serie |zn | no converge se aplican los
P
criterios de Dirichlet o de Abel para estudiar directamente la convergencia de la serie zn .
9.2.1. Ejercicios
X (n + 1)n X 1 n n X1
− log(1+ 1/n)
3n n! n! e n
n>1 n>1 n>1
X X nlog n X n 2
alog n (a > 0) e − 1+ 1/n 2
(log n)n
n>1 n>2 n>1
X X n2 + 1 n
2
X √
n 1 n
( 2 − 1)n 1− √
n n2 + n + 1
n>1 n>1 n>1
X P n X p √ X α log n n
nα
n
α j=1 1/ j , (α > 0) n
n + 1/n − n , (α ∈ R) 1− , (α ∈ R)
n
n>1 n>1 n>1
X√
4 √ X 2 · 4 · 6 · · ·(2n) α
n + 1 − 4 n a log n, (a > 0); , (α ∈ R)
5 · 7 · · ·(2n + 3)
n>1 n>1
X1 X α
(e − (1 + 1/n)n) ; nn − 1 , (α ∈ R)
n
n>1 n>1
X X n
X
α 1 1 1
n 1+ + · · · + , (α ∈ R); nα exp −β , (α, β ∈ R)
2 n k
n>1 n>1 k=1
∞
X ∞
X
5. Sea ρ ∈ R con |ρ| < 1 y ϑ ∈ R. Calcula los límites ρn cos(n ϑ) y ρn sen(n ϑ).
n=0 n=0
9.18 Definición. Dadas una sucesión de números complejos {cn }n∈No y un número a ∈ C , se
llama serie de potencias centrada en a a la sucesión
en la cual zX
representa un número complejo arbitrario. Dicha serie se representa simbólica-
mente por cn (z − a)n . La sucesión {cn } recibe el nombre de sucesión de coeficientes de la
n>0
serie.
Dados a ∈ C y r > 0, definimos D(a, r) = {z ∈ C : |z − a| < r}. El conjunto D(a, r) se llama disco
abierto de centro a y radio r.
X
El primer problema que plantea una serie de potencias, cn (z − a)n , es estudiar para qué
n>0
valores de z dicha serie es convergente. El siguiente resultado es clave a este respecto.
9.19 Lema (Lema de Abel). Sea ρ > 0 un número positivo X tal que la sucesión {cn ρ } está acotada.
n
Demostración. Sea z ∈ D(a, ρ). Pongamos r = |z − a| < ρ. Puesto que {cn ρn } está acotada existe
una constante M > 0 tal que |cn ρn | 6 M para todo número natural n. Tenemos que
n n n
n (z − a)n
|cn (z − a) | = cn ρ
n = |cn ρn | |z − a| 6 M |z − a| = M r
ρn ρn ρ ρ
X
Pongamos {αn } = {M(r/ρ)n }. Como la serie αn converge por ser una serie geométrica de
n>0 X
razón r/ρ menor que 1, el criterio de comparación nos dice que la serie |cn (z − a)n | converge,
X n>0
es decir, la serie cn (z − a)n es absolutamente convergente.
n>0
El lema anterior conduce de manera natural a considerar el más grande ρ > 0 tal que la
sucesión {an ρn } está acotada. Introducimos para ello el conjunto
y definimos R = sup(A) ∈ R+
0 ∪ {+∞}. Pueden presentarse los casos:
El siguiente
X resultado, consecuencia directa de aplicar los criterios del cociente o de la raíz
a la serie |cn (z − a)n|, permite en muchos casos calcular el radio de convergencia.
n>0
El siguiente resultado es muy útil para calcular la suma de una serie de potencias en puntos
de la frontera de su disco de convergencia.
P
9.21 Teorema (Continuidad radial). Sea cn z n una serie de potencias con radio de convergen-
cia 0 < R < +∞. Sea f : D(0, R) → C la función suma de la serie y supongamos que la serie es
convergente en un punto z 0 de la frontera del disco D(0, R). Entonces se verifica que
∞
X
lı́m f (rz 0 ) = cn zn0
r→1
0<r<1 n=0
En lo que sigue vamos a estudiar la derivabilidad de funciones definidas por series de poten-
cias, por ello supondremos que se trata de series de potencias reales, es decir, los coeficientes
de la serie son números reales y la variable, que representaremos por la letra x, solamente puede
tomar valores reales.
X
Consideremos, pues, una serie de potencias reales cn (x − a)n con radio de convergen-
n>0
cia R > 0. El dominio de convergencia de esta serie es el intervalo Ω = {x ∈ R : |x − a| < R} =
]a − R, a + R[, con el convenio de que dicho intervalo es todo R cuando el radio de convergen-
cia es R = +∞. Como consecuencia del estudio realizado, sabemos que la serie es convergente
absolutamente para todo x ∈]a − R, a + R[ y, por tanto, es convergente para todo x ∈]a − R, a +
R[. Podemos definir la función suma de la serie, f :]a − R, a + R[→ R que viene dada para cada
x ∈]a − R, a + R[ por
∞
X
f (x) = cn (x − a)n
n=0
Observa que f (x) viene dada como un límite de una sucesión de funciones polinómicas. Cabe
esperar que las propiedades de las funciones polinómicas se “hereden” de alguna forma por f .
X
9.22 Teorema (Teorema de derivación de una serie de potencias). Sea a ∈ R, cn (x − a)n una
n>0
serie de potencias no trivial y Ω su dominio de convergencia. Sea f : Ω → R la función suma de la
serie ∞
X
f (x) = cn (x − a)n x∈Ω
n=0
f (k) (a)
ck = para todo k ∈ N ∪ {0}
k!
9.23 Definición. Sea f una función indefinidamente derivable en un intervalo Ω ⊂ R y sea a∈Ω.
La serie de potencias
X f (n) (a)
(x − a)n
n!
n>0
9.24 Corolario. Las únicas series de potencias no triviales son series de Taylor (de su función
suma).
Las siguientes preguntas surgen de manera inmediata: ¿Son no triviales las series de Taylor
de una función indefinidamente derivable? ¿La función suma de una serie de Taylor de una
función indefinidamente derivable coincide con dicha función? La respuesta a ambas pregun-
tas es que no. Si partimos de una función real indefinidamente derivable y formamos su serie
de Taylor en un punto, no hay garantía de que dicha serie tenga radio de convergencia no nulo
o de que, en caso de que sea convergente en un intervalo, su suma sea igual a la función de
partida.
f (n+1) (c)
f (x) − Tn ( f , a)(x) = (x − a)n+1 (9.5)
(n + 1)!
En esta igualdad el lado de la derecha parece mucho más manejable que el de la izquierda. Si
somos capaces de probar que
f (n+1) (c)
lı́m (x − a)n+1 = 0 (9.6)
n→∞ (n + 1)!
habremos probado que lı́m ( f (x) − Tn ( f , a)(x)) = 0, esto es f (x) = lı́m Tn ( f , a)(x), es decir, habre-
n→∞ n→∞
mos probado que para ese valor de x la serie de Taylor de f en a converge a f (x). La dificultad
está en que en el límite (9.6) el punto c no está fijo: depende de n (además de x, pero el punto
x está fijo en este razonamiento). El que se verifique la igualdad en (9.6) dependerá del com-
portamiento de las derivadas sucesivas de f . El caso más sencillo de todos es cuando dichas
derivadas están acotadas en el intervalo I, es decir, hay un número M > 0 (independiente de n)
tal que se verifica
(n+1)
f (t) 6 M ∀t ∈ I, ∀n ∈ N (9.7)
(x − a)n+1
Cuando esto es así, como lı́mn→∞ = 0 cualquiera sea x ∈ R, se deduce que la serie de
(n + 1)!
Taylor de f centrada en a es convergente en todo punto x ∈ I y su suma es igual a f (x).
Función exponencial.
Las derivadas de la función exponencial natural, exp(x), en x = 0 valen todas 1. Por tanto, el
polinomio de Taylor de orden n en el punto a = 0 de la función exponencial es
n
X 1 k
Tn (exp, 0)(x) = 1 + x
k!
k=1
Sea ahora x∈R, fijo en lo que sigue. Tomemos ρ > 0 de forma que x∈]− ρ, ρ[. El teorema de Taylor
afirma que hay un número c comprendido entre x y 0 y, por tanto c ∈] − ρ, ρ[, tal que
n
X 1 k exp(c) n+1
exp(x) = 1 + x + x
k! (n + 1)!
k=1
xn+1
De esta forma hemos eliminado el punto c y como lı́m = 0, obtenemos que
n→∞ (n + 1)!
∞
X 1 k
exp(x) = x (9.8)
k!
k=0
∞
X 1
En particular, para x = 1 tenemos que e = .
n!
n=0
Como sen ′ (x) = cos(x) = sen( π2 +x), se sigue que sen(n) (x) = sen( nπ (n)
2 +x). En particular, sen (0) =
sen( nπ
2 ). Por tanto el polinomio de Taylor de orden n de la función seno en el punto a = 0 es
n
X sen( kπ )
Tn (sen, 0)(x) = 2
xk
k!
k=1
(2q−1)π
Como para k par es sen( kπ
2 ) = 0 y para k impar k = 2q − 1 es sen( 2 ) = (−1)q+1 , resulta que
n
X (−1)k+1 2k−1
T2n−1 (sen, 0)(x) = T2n (sen, 0)(x) = x
(2k − 1)!
k=1
Como las funciones seno y coseno tienen derivadas acotadas en todo R, se sigue por lo antes
visto que
∞
X (−1)n 2n+1
sen x = x (x ∈ R) (9.9)
(2n + 1)!
n=0
X∞
(−1)n 2n
cos x = x (x ∈ R) (9.10)
(2n)!
n=0
Pongamos f (x) = (1 + x) α . Tenemos que f (n) (x) = α(α − 1)(α − 2) · · · (α − n + 1)(1 + x)α−n. Por
lo que el polinomio de Taylor de orden n de f en a = 0 es
n
X α(α − 1)(α − 2) · · ·(α − k + 1)
Tn ( f , 0)(x) = 1 + xk
k!
k=1
En este caso el teorema de Taylor no es el camino más sencillo y es preferible razonar como
sigue.
X α
La serie de potencias x n tiene radio de convergencia 1 porque, poniendo an = αn ,
n
n>0
|an+1 | |α − n|
tenemos que = → 1. Definamos ϕ :] − 1, 1[→ R por
|an | n+1
∞
X α n
ϕ(x) = x , x ∈] − 1, 1[
n
n=0
El teorema de derivación nos dice que ϕ es derivable en ] − 1, 1[. Ahora es fácil comprobar que
la función h(x) = ϕ(x)(1 + x)−α tiene derivada nula en ] − 1, 1[, por lo que es constante en dicho
intervalo y, como h(0) = 1, concluimos que h(x) = 1 para todo x ∈] − 1, 1[, es decir, (1 + x)α = ϕ(x)
para todo x ∈] − 1, 1[, como queríamos probar.
Así podemos seguir. Pero también podemos invertir el proceso: en vez de derivar la serie (9.12),
podemos construir una primitiva suya.
El cálculo de una primitiva de una función definida por una serie de potencias es inme-
diato. Si la función viene dada por
∞
X
f (x) = cn (x − a)n |x − a| < R
n=0
Entonces, en virtud del teorema de derivación, la primitiva de f que coincide con f en el punto
x = a es
∞
X cn
F(x) = f (a) + (x − a)n+1 |x − a| < R
n+1
n=0
Las series de potencias proporcionan la herramienta adecuada para definir con comodi-
dad la función seno. Olvida ahora todo lo que sabes de la función seno. ¿Lo has olvidado ya?
Sigamos.
X (−1)n
Como la serie de potencias x 2n+1 tiene radio de convergencia R = +∞ la suma
(2n + 1)!
n>0
de dicha serie está definida en todo R.
9.25 Definición. La función seno es la función sen : R → R definida para todo x ∈ R por
∞
X (−1)n 2n+1
sen x = x
(2n + 1)!
n=0
A partir de esta definición se obtienen las propiedades usuales de la función seno. La fun-
ción coseno se define como la derivada de la función seno. Las demás funciones trigonomé-
tricas se definen, como puedes imaginar, a partir del seno y el coseno. El número π se define
como el mínimo número positivo en el que se anula el seno (hay que probar su existencia con
ayuda del teorema de Bolzano).
Ejercicios
Estudia en los casos c)y f), el comportamiento de la serie en los puntos de la circunferen-
cia unidad.
x2 − 3x + 1
f (x) =
x2 − 5x + 6
e indica su dominio de convergencia.
Sugerencia. Usa la descomposición en fracciones simples.
X
4. Sea la serie de potencias (2n+1 − n)x n . Calcula su dominio de convergencia y su suma.
n>0
X (−1)n n
5. Sea la serie de potencias − xn . Calcula su dominio de convergencia y su
(n + 1)2n 3n
n>0
suma.
6. Calcula, por medio de series de potencias primitivas de las funciones sen(x2 ), exp(x2 ),
√
1 + x3 .
Cálculo diferencial en Rn
Como sabes, Rn es un espacio vectorial en el que suele destacarse la llamada base canóni-
ca formada por los vectores {e1 , e2 , . . . , en } donde ek es el vector cuyas componentes son todas
nulas excepto la que ocupa el lugar k que es igual a 1. Dados dos vectores x = (x1 , x2 , . . . , xn )
y = (y1 , y2 , . . . , yn ) se define su producto escalar a por:
n
X
xy = xk yk = x1 y1 + x2 y2 + · · · + xn yn
k=1
Este producto escalar se llama producto escalar euclídeo. Observa que el producto escalar de
dos vectores no es un vector sino un número real. La notación xẏ es frecuentemente usada en
los libros de Física para representar el producto escalar de los vectores x e y. Las dos notaciones
son útiles y las usaremos en lo que sigue.
Desigualdad de Cauchy-Schwarz.
Para todos x, y ∈ Rn se verifica que x y 6 kxk kyk. Además, supuesto que x e y no son nulos,
la igualdad x y = kxk kyk equivale a que hay un número λ ∈ R tal que x = λ y (es decir, los
vectores x e y están en una misma recta que pasa por el origen).
169
Estructura euclídea y topología de Rn 170
Desigualdad triangular.
Para todos x, y ∈ Rn se verifica que kx + yk 6 kxk + kyk. Además, supuesto que x e y no son nulos,
la igualdad kx + yk = kxk + kyk equivale a que hay un número λ > 0 tal que x = λ y (es decir, los
vectores x e y están en una misma semirrecta que pasa por el origen).
10.1 Definición. Se dice que los vectores x e y son ortogonales, y escribimos x ⊥ y, cuando su
producto escalar es cero. Se dice que un vector x es ortogonal a un conjunto de vectores E ⊂ Rn
cuando x es ortogonal a todo vector en E. Un conjunto de vectores no nulos que son mutua-
mente ortogonales se dice que es un conjunto ortogonal de vectores; si, además, los vectores
tienen todos norma 1 se dice que es un conjunto ortonormal de vectores. Una base vectorial
que también es un conjunto ortogonal (ortonormal) se llama una base ortogonal (ortonormal).
y
y vy
Ejercicios
3. Teorema de Pitágoras. Prueba que los vectores x e y son ortogonales si, y solo si,
kx + yk2 = kxk2 + kyk2 .
Q
4. Prueba que el vector x − y (x) es ortogonal a y.
• Es fácil comprobar que los conjuntos de la forma B(x, r) son conjuntos abiertos. El conjunto
B(x, r) se llama bola abierta de centro x y radio r.
• Se dice que un conjunto E ⊂ Rn es acotado cuando hay un número M > 0 tal que kxk 6 M
para todo x ∈ E.
• Sea E ⊂ Rn . Decimos que un punto x∈Rn es un punto de acumulación del conjunto E si toda
bola abierta centrada en x tiene puntos de E distintos de x. El conjunto de todos los puntos de
acumulación de E se llama la acumulación de E y se representa por E ′ .
Π j (x) = Π j ((x1 , x2 , . . . , xn )) = x j
Ejercicios
10.1.1. Sucesiones en Rn
10.3 Definición. Una sucesión {xm } de puntos de Rn se dice que es convergente si hay un vector
x ∈ Rn tal que kxm − xk → 0. En tal caso escribimos lı́mm→∞ {xm } = x o, simplemente, {xm } → x y
decimos que x es el límite de la sucesión {xm }.
Una sucesión {xm } de puntos de Rn se dice que es acotada si ha un número M > 0 tal que
kxm k 6 M para todo m ∈ N.
Se deduce fácilmente que {xm } → x si, y sólo si, {Π j (xm )} → Π j (x) para (1 6 j 6 n), esto es, la
convergencia en Rn equivale a la convergencia por coordenadas.
10.4 Teorema (Teorema de Bolzano – Weierstrass). Toda sucesión acotada de puntos de Rn
tiene alguna sucesión parcial convergente.
10.5 Teorema (Caracterización de los conjuntos compactos). Un conjunto E ⊂ Rn es compacto
si, y sólo si, toda sucesión de puntos de E tiene alguna sucesión parcial que converge a un punto
de E.
Un campo escalar de una variables es, simplemente, una función real de variable real; un
campo escalar de dos variables es una función definida en un subconjunto del plano que toma
valores reales; un campo escalar de tres variables es una función definida en un subconjunto
del espacio que toma valores reales.
Los campos escalares de una o dos variables se pueden visualizar por medio de sus repre-
sentaciones gráficas que son, respectivamente, curvas en el plano o superficies en el espacio.
No es posible visualizar campos escalares de tres o más variables porque sus gráficas están en
espacios de dimensión mayor o igual que 4.
Naturalmente, los campos escalares se pueden sumar y multiplicar al igual que lo hacemos
con las funciones reales.
10.6 Definición. Sea f un campo escalar definido en un conjunto E ⊂ Rn y sea a∈E. Se dice que
f es continuo en a si para todo ε > 0 existe un δ > 0 tal que se verifica k f (x) − f (a)k < ε siempre
que x ∈ E y kx − ak < ε.
b) Sea f un campo escalar definido en un conjunto E ⊂ Rn y sea h una función real de varia-
ble real continua definida en un intervalo I que contiene la imagen de f , I ⊃ f (E). Entonces la
función compuesta h ◦ g es continua en todo punto de E donde f sea continua.
Los campos escalares más sencillos son las funciones polinómicas de varias variables. Di-
chas funciones se obtienen como sumas de productos de las proyecciones canónicas y son, por
tanto, continuas.
Componiendo funciones continuas reales de una variable con funciones polinómicas y ra-
cionales en varias variables obtenemos muchísimos ejemplos de campos escalares continuos.
Aquí tienes unos pocos.
1 + xy2 + xz2 p
f (x, y) = sen(xy), f (x, y) = log(1 + x2 + y2 ), f (x, y, z) = , f (x, y, z) = cos( y2 + z2 )
1 + arc tg(x y z)
10.8 Proposición. Sea Sea f un campo escalar definido en un conjunto E ⊂ Rn y sea a ∈ E. Equi-
valen las siguientes afirmaciones:
a) f es continua en a.
b) Para toda sucesión {xn } de puntos de E tal que {xn } → a se verifica que { f (xn )} → f (a).
El siguiente resultado se demuestra de la misma forma que su análogo para funciones rea-
les.
10.9 Teorema (Teorema de Weierstrass). Todo campo escalar continuo en un conjunto com-
pacto alcanza en dicho conjunto un valor máximo absoluto y un valor mínimo absoluto.
a) lı́m f (x) = L.
x→a
b) Para toda sucesión {xn } de puntos de E distintos de a, tal que {xn} → a se verifica que
{ f (xn )} → L.
10.1.3. Curvas en Rn
Una curva en Rn es una aplicación continua γ : [a, b] → Rn . El punto γ(a) se llama origen y el
punto γ(b) extremo de la curva. Naturalmente, como γ(t) ∈ Rn podremos expresarlo por medio
de sus componentes en la base canónica que serán funciones de t.
Dado un punto a = γ(t0 ) tal que γ ′ (t0 ) , 0, se define la recta tangente a γ en el punto a (aunque es
más apropiado decir en el punto t0 ) como la recta de ecuación paramétrica a + t γ ′ (t0 ), es decir,
la recta que pasa por a con vector de dirección γ ′ (t0 ).
wb
kγ ′ (t)k dt .
a
10.12 Definición. Un conjunto abierto Ω ⊂ Rn con la propiedad de que cualesquiera dos de sus
puntos pueden unirse por una curva que queda dentro de Ω se llama un dominio.
Acabamos de ver que los conceptos de continuidad y límite para funciones reales de una
variable se generalizan fácilmente para campos escalares de varias variables. No ocurre lo mis-
mo con el concepto de derivabilidad el cual no puede generalizarse de forma inmediata. La
razón es que el concepto de derivabilidad hace intervenir la división de números reales, pues
una derivada es un límite de cocientes incrementales, y en Rn no podemos dividir por vecto-
res, es decir, la estructura algebraica de Rn no permite generalizar algo parecido a un “cociente
incremental”. Si f es un campo escalar, la expresión
f (x) − f (a)
x−a
no tiene ningún sentido.
• Dados un punto a∈Rn y una dirección u, la recta que pasa por a con dirección u es la imagen
de la aplicación γ : Rn → R dada por γ(t) = a+tu, es decir, es el conjunto de puntos {a + tu : t ∈ R}.
Observa que las derivadas que acabamos de definir son derivadas de funciones reales de
una variable real pues, para calcular la derivada de un campo escalar f en un punto a en la
dirección u lo que se hace es derivar en t = 0 la función t 7→ f (a + t u) que es una función real de
una variable real.
Observa que la segunda igualdad de (10.3) nos dice que, para calcular la derivada parcial
Dk f (a), lo que se hace es derivar f respecto a la variable k-ésima considerando fijas las demás
variables. Por eso se llaman derivadas parciales.
La gráfica de f , es decir, el conjunto S = {(x, y, f (x, y)) : (x, y) ∈ E} es una superficie en R3 . Las
funciones
γ1 (x) = (x, b, f (x, b)), γ2 (y) = (a, y, f (a, y))
son curvas contenidas en dicha superficie que pasan por el punto (a, b). Dichas curvas se obtie-
nen cortando la superficie S por los planos y = b y x = a respectivamente. Los vectores tangentes
a dichas curvas en los puntos γ1 (a) y γ2 (b) son, respectivamente
Cuando un campo escalar f tiene derivadas parciales en todos los puntos de un conjunto
E ⊂ Rn , podemos definir las funciones derivadas parciales de f , Dk f : E → R que a cada punto
x ∈ E hace corresponder el número Dk f (x). Dichas funciones son también campos escalares.
Definamos
f (x) − f (a) − ∇ f (a) x − a
R(x, a) =
kx − ak
La igualdad (10.4) dice que lı́m R(x, a) = 0. Con lo que, otra forma equivalente de escribir la
x→a
igualdad (10.4) es la siguiente.
f (x) = f (a) + ∇ f (a) x − a + R(x, a) kx − ak donde lı́m R(x, a) = 0 (10.5)
x→a
f (a + t u) − f (a) |t|
lı́m = lı́m R(a + t u, a) = 0
t→0 t t→0 t
10.18 Corolario. Sea f un campo escalar diferenciable en un punto a con vector gradiente no
nulo en a.
Y la igualdad se da si, y solo si, hay un número λ ∈ R tal que w = λ∇ f (a). Tomando normas
en esta igualdad se deduce que |λ| = 1/ k∇ f (a)k, es decir las direcciones w que hacen máximo
∇ f (a) ∇ f (a)
|Dw f (a)| = ∇ f (a) w son u = y v=− .
k∇ f (a)k k∇ f (a)k
Para la primera se tiene que
∇ f (a) 1
Du f (a) = ∇ f (a)
= ∇ f (a) ∇ f (a) = k∇ f (a)k
k∇ f (a)k k∇ f (a)k
Dv f (a) = − k∇ f (a)k
El resultado anterior nos dice que el vector gradiente en un punto señala la dirección en la
que el campo tiene máximo crecimiento en dicho punto. Mientras que en la dirección opuesta a
la del vector gradiente en un punto el campo tiene máximo decrecimiento.
γ(t) − γ(t0 )
Teniendo en cuenta que lı́m = γ ′ (t0 ) se deduce que
t→t0 t − t0
h(t) − h(t0)
lı́m = ∇ f (a) γ ′ (t0 )
t→t0 t − t0
como queríamos demostrar.
Que un campo escalar tenga derivadas parciales en un punto es una propiedad muy dé-
xy
bil. Por ejemplo, el campo escalar f (x, y) = 2 , f (0, 0) = 0 tiene derivadas parciales nulas
x + y2
en (0, 0) pero no es continuo en dicho punto. La propiedad de ser diferenciable es mucho más
fuerte que tener derivadas parciales. Por ejemplo, es fácil probar que un campo escalar dife-
renciable en un punto es continuo en dicho punto. El siguiente resultado proporciona una
condición suficiente de diferenciabilidad muy útil.
10.20 Teorema (Condición suficiente de diferenciabilidad). Un campo escalar que tiene deri-
vadas parciales continuas en un conjunto abierto es diferenciable en todo punto de dicho con-
junto.
En la práctica suele suponerse que los campos escalares tienen derivadas parciales conti-
nuas. Esta hipótesis garantiza que son diferenciables y es suficiente para justificar la mayoría
de los resultados que siguen.
Es sabido que una función derivable en un intervalo con derivada nula es constante. Para
campos escalares hay un resultado análogo. Observa la hipótesis de que el campo esté definido
en un dominio.
10.21 Proposición. Un campo escalar definido en un dominio con derivadas parciales nulas en
todo punto del mismo es constante.
En la siguiente sección te digo cómo calcular rectas y planos tangentes a curvas y superficies
considerando las distintas formas en que éstas pueden venir dadas. Mi propósito es esencial-
mente práctico, a saber, que entiendas la forma de proceder en cada caso; por lo que no me
preocupo de justificar con detalle todo lo que digo.
Curvas en el plano
Γ = {(x, f (x)) : x ∈ I}
c) De forma implícita como el conjunto de puntos g(x, y) = 0 donde se anula una función dife-
renciable de dos variables.
Γ = (x, y) ∈ R2 : g(x, y) = 0
Suele usarse la siguiente terminología. Si h(x, y) es un campo escalar diferenciable, las curvas
de ecuación implícita h(x, y) = c o, lo que es igual h(x, y) − c = 0, donde c es una constante, se
llaman curvas de nivel. Dichas curvas se obtienen cortando la gráfica de h con planos de la
forma z = c. Estas curvas son las que ves representadas en los mapas topográficos.
Se supone que ∇g(a, b) , 0 pues en otro caso, la tangente en (a, b) no está definida. El vector
gradiente ∇g(a, b) es ortogonal a Γ en el punto (a, b).
Estas últimas afirmaciones requieren alguna justificación. Para ello, supongamos que cono-
cemos una representación paramétrica local de Γ en torno al punto (a, b). Es decir, hay una
curva de la forma α(t) = (α1 (t), α2 (t)) ∈ Γ que pasa por el punto (a, b) y que es derivable1.
Pongamos α(t0 ) = (a, b). Por lo visto en b′ ), sabemos que la tangente a Γ en (a, b) es la rec-
ta que pasa por el punto (a, b) con vector de dirección α ′ (t0 ). Pongamos h(t) = g(α(t)). En
virtud de la igualdad (10.6), tenemos que h ′ (t) = ∇g(α(t)) α ′ (t) . Pero h(t) = 0, por lo que
h ′ (t) = ∇g(α(t)) α ′ (t) = 0. Resulta así que el vector ∇g(α(t)) es ortogonal al vector tangen-
te α ′ (t). En particular, el vector ∇g(a, b) es ortogonal al vector α ′ (t0 ) tangente a Γ en (a, b).
Concluimos que la recta que pasa por (a, b) y tiene como vector ortogonal ∇g(a, b) es la
recta tangente a Γ en (a, b), pero dicha recta es justamente la recta de ecuación cartesiana
∇g(a, b) (x − a, y − b) = 0.
De lo antes visto, merece la pena destacar la siguiente propiedad.
El vector gradiente ∇g(x, y) de un campo escalar es ortogonal en todo punto (x, y) (en el que
∇g(x, y) , 0) a la curva de nivel que pasa por dicho punto.
Superficies en R3
b) Por medio de ecuaciones paramétricas γ(s,t) = (x(s,t), y(s,t), z(s,t)) donde (s,t) ∈ A ⊂ R2 .
c) De forma implícita como el conjunto de puntos g(x, y, z) = 0 donde se anula una función
diferenciable de tres variables.
S = (x, y, z) ∈ R3 : g(x, y, z) = 0
a′ ) El plano tangente en un punto (a, b, c) = (a, b, f (a, b)) ∈ S es el plano de ecuación cartesiana
∂f ∂f
z − f (a, b) =
(a, b)(x − a) + (a, b)(y − b)
∂x ∂y
∂f ∂f
Los vectores 1, 0, (a, b) y 0, 1, (a, b) son tangentes a S en (a, b, c) y el vector
∂x ∂y
∂f ∂f
(a, b), (a, b), −1
∂x ∂y
∂γ ∂γ
(x, y, z) = γ (s0 ,t0 ) + s (s0 ,t0 ) + t (s0 ,t0 )
∂s ∂t
Donde
∂γ ∂x ∂y ∂z
(s0 ,t0 ) = (s0 ,t0 ), (s0 ,t0 ), (s0 ,t0 )
∂s ∂s ∂s ∂s
y
∂γ ∂x ∂y ∂z
(s0 ,t0 ) = (s0 ,t0 ), (s0 ,t0 ), (s0 ,t0 )
∂t ∂t ∂t ∂t
Dichos vectores son tangentes a S en (a, b, c).
Se supone que ∇g(a, b, c) , 0 pues en otro caso, el plano tangente a S en (a, b, c) no está
definido. El vector gradiente ∇g(a, b, c) es ortogonal a S en el punto (a, b, c).
Curvas en R3
b) Por medio de ecuaciones paramétricas γ(t) = (x(t), y(t), z(t)) donde t ∈I ⊂ R e I es un intervalo.
Γ = γ(I) = {(x(t), y(t), z(t)) : t ∈ I}
Donde se supone que los vectores gradiente ∇ f (a, b, c), ∇g(a, b, c) son linealmente indepen-
dientes pues, en otro caso, la recta tangente a la curva Γ en (a, b, c) no está definida.
10.1.6. Ejercicios
Como para calcular derivadas parciales de una función de varias variables se consideran fijas
todas las variables menos aquella respecto a la que se deriva, calcular derivadas parciales es lo
mismo que derivar funciones de una variable. Solamente debes tener cuidado para darte cuen-
ta qué tipo de función es la que tienes que derivar porque ello puede depender de la variable
respecto de la que derivas. Por ejemplo, la función f (x, y) = xy cuando fijas y (para derivar res-
pecto a x) es una función potencia (la variable está en la base y el exponente está fijo) y cuando
fijas x (para derivar respecto a y) es una función exponencial (la variable está en el exponente y
la base está fija).
Te recuerdo que es muy frecuente, sobre todo en libros de Física e ingenierías diversas, re-
presentar las funciones por letras. Así, lo que los matemáticos solemos escribir f (x, y) = cos(xy)+
xy2 , para indicar que f es una función de dos variables x e y cuyo valor en el punto (x, y) viene
dado por cos(xy) + xy2 , suele expresarse de forma menos precisa en la forma z = cos(xy) + xy2 ,
cuyo significado es exactamente el mismo que el anterior cambiando f por z. Naturalmente, en
vez de z puede usarse cualquier otro símbolo que sea distinto de x e y. Tienes que acostumbrarte
a esta notación y entender cuándo una letra representa una variable y cuándo representa una
función.
Te recuerdo que una dirección viene dada por un vector de norma euclídea 1. Si a y b son
b−a
puntos de Rn la dirección del punto a hacia el punto b viene dada por el vector .
kb − ak
p
4. Calcula la derivada direccional de f (x, y) = log(1 + x2 + y2 ) en el punto (1, 2) en la direc-
ción hacia el origen.
xy
5. Calcula la derivada direccional de z(x, y) = arc tg 2 en el punto (1, 1) en la dirección
x + y2
hacia el punto (2, 1).
en el punto (1, 2, −1) tenga un valor máximo igual a 64 en la dirección del eje OZ.
x2 y2
+ =1
a2 b2
en un punto (u, v) de la misma.
8. Considera la curva dada por las ecuaciones paramétricas x(t) = et + cost, y(t) = e−t + sent.
Calcula la ecuación de la recta tangente en el punto (x(0), y(0)).
9. Calcula, para los siguientes campos escalares, el vector normal en P0 a la curva de nivel
que pasa por dicho punto.
!
y
a) f (x, y) = arc tg p P0 = (1, 1).
1 + x2 + y2
sen(x + y)
b) f (x, y) = P0 = (π/2, π/4).
2 + cos(x − y)
x−y
10. Calcula la derivada de h(x, y) = en el punto (−1, −1) en la dirección da-
1 + log(1 + x2y2 )
da por el vector ortogonal (de norma 1) en el punto (1, 1) a la curva de nivel del campo
f (x, y) = x y3 + x3 y que pasa por dicho punto.
11. Calcula las ecuaciones del plano tangente y de la recta normal a cada una de las siguientes
superficies en el punto Po indicado.
12. Halla la ecuación de la tangente a la curva dada como intersección del elipsoide x2 + 4y2 +
2z2 = 27 y el hiperboloide x2 + y2 − 2z2 = 11 en el punto (3, −2, 1).
13. Calcula la ecuación de la recta tangente a la curva definida por la intersección de las su-
perficies z = x y, x2 + y2 − 2z = 4 en el punto (3, 1, 3). Comprueba el resultado expresando
la curva por sus ecuaciones paramétricas.
14. Calcula la ecuación de la recta tangente a la curva definida por la intersección de las su-
perficies 4xz = (x + z)y, 3z2 + y = 5x en el punto (1, 2, 1).
10.24 Definición. Sea f un campo escalar definido en un conjunto E ⊂ Rn . Se dice que f tiene
un máximo relativo (resp. mínimo relativo) en un punto a ∈ E, si a es un punto interior de E
y existe un número r > 0 tal que B(a, r) ⊂ E y f (x) 6 f (a) (resp. f (a) 6 f (x)) para todo x ∈ B(a, r).
Cuando estas desigualdades se verifican de forma estricta se dice que el máximo o el mínimo
relativo es estricto.
Los puntos en los que f tiene un máximo o un mínimo relativos se llaman extremos relati-
vos de f .
10.25 Proposición (Condición necesaria de extremo relativo). Sea f un campo escalar defi-
nido en un conjunto E ⊂ Rn y supongamos que f tiene un extremo relativo en un punto a ∈ E y
además que el vector gradiente de f en a está definido. Entonces se verifica que ∇ f (a) = 0. Es decir,
las derivadas parciales de primer orden de f en a son todas nulas.
Demostración. Supongamos que f tiene un máximo relativo en a y sea r > 0 tal que B(a, r) ⊂ E y
f (x) 6 f (a) para todo x ∈ B(a, r). Definamos ϕ :] − r, r[→ R por ϕ(t) = f (a + tek). La función ϕ está
definida en el intervalo ] − r, r[ pues para todo t ∈] − r, r[ se tiene que ka + tek − ak = |t| < r por lo
que a + tek ∈ B(a, r) ⊂ E. Además, para todo t ∈] − r, r[ se tiene que ϕ(t) = f (a + tek ) 6 f (a) = ϕ(0).
Luego ϕ tiene en t = 0 un máximo relativo. Además como, por hipótesis, existe Dk f (a), tenemos
que ϕ es derivable en t = 0. Luego ϕ ′ (0) = 0, pero ϕ ′ (0) = Dk f (a).
10.26 Definición. Los puntos donde se anula el gradiente de un campo escalar f se llaman
puntos críticos de f . Los puntos críticos de un campo escalar que no son extremos relativos se
llaman puntos de silla.
Al igual que para funciones de una variable, la derivada segunda proporciona una condición
suficiente de extremo relativo, para campos escalares de varias variables las derivadas parciales
de segundo orden nos van a permitir dar una condición suficiente de extremo relativo. Necesi-
taremos para ello el siguiente resultado.
Donde hemos tenido en cuenta que las componentes de γ son γ j (t) = a j + tx j . En particular
n
X
hx′ (0) = D j f (a)x j (10.10)
j=1
Volviendo a derivar la igualdad (10.9) en t = 0, aplicando otra vez la misma regla de derivación
a los campos escalares D j f (γ(t)), obtenemos
n n
! n X
n
X X X
hx′′ (0) = D j,k f (a)xk x j = D j,k f (a)xk x j (10.11)
j=1 k=1 j=1 k=1
Solo queda probar que r(1, x) puede escribirse en la forma r(1, x) = kxk2 ϕ(x) con lı́mx→0 ϕ(x) = 0
pero esto vamos a dejarlo para otra ocasión.
10.28 Definición. Sea f un campo escalar de n variables que tiene derivadas parciales de se-
gundo orden continuas en un punto a. La matriz n × n
H( f , a) = Di j f (a) 16i, j6n
Observa que la matriz hessiana es simétrica porque Di j f (a) = D ji f (a). En consecuencia, di-
cha matriz define una forma cuadrática, que representaremos por Q( f , a), que viene dada para
todo x = (x1 , x2 , . . . , xn ) ∈ Rn por
n X
X n
Q( f , a)(x) = x · H( f , a) · xt = D j,k f (a)xk x j
j=1 k=1
donde el punto “·” indica producto matricial y xt es el vector columna x. Con esta notación
podemos escribir la igualdad (10.7) en la forma
1
f (a + x) = f (a) + ∇ f (a) x + Q( f , a)(x) + kxk2 ϕ(x) donde lı́m ϕ(x) = 0 (10.12)
2 x→0
f (a + x) − f (a) 1
2
= Q( f , a)(x) + ϕ(x) donde lı́m ϕ(x) = 0
kxk 2 kxk2 x→0
Teniendo en cuenta que las formas cuadráticas son polinomios homogéneos de grado 2, es
1 1
decir, Q( f , a)(λx) = λ2 Q( f , a)(x), se tiene que Q( f , a)(x) = Q( f , a)(x/ kxk). Resulta así la
2 kxk2 2
igualdad
f (a + x) − f (a) 1
= Q( f , a)(x/ kxk) + ϕ(x) donde lı́m ϕ(x) = 0 (10.14)
kxk2 2 x→0
P
10.29 Definición. Una forma cuadrática Q(x) = ni, j=1 αi j xi x j se llama:
• No definida si hay vectores x para los que Q(x) > 0 y hay vectores x para los que Q(x) < 0.
Demostración. Como Q( f , a) es una función polinómica y, por tanto, continua, y la esfera uni-
dad de Rn , S(0, 1) = {u ∈ Rn : kuk = 1}, es un conjunto compacto, en virtud del teorema de Weiers-
trass, dicha función alcanza un mínimo valor y un máximo valor en S(0, 1). Sea
m = mı́n {Q( f , a)(u) : kuk = 1} , M = máx {Q( f , a)(u) : kuk = 1}
a) Supongamos que Q( f , a) es definida positiva. Entonces se tiene que m > 0. y, por la igualdad
(10.14), tenemos que
f (a + x) − f (a) 1 m
= Q( f , a)(x/ kxk) + ϕ(x) > + ϕ(x) donde lı́m ϕ(x) = 0
kxk2 2 2 x→0
La condición lı́m ϕ(x) = 0 garantiza la existencia de un número s > 0 tal que |ϕ(x)| < m/4 siempre
x→0
que 0 < kxk < s. En consecuencia, si en la desigualdad anterior suponemos que 0 < kxk < s, se
tiene
f (a + x) − f (a) m m m m
2
> + ϕ(x) > − = > 0
kxk 2 2 4 4
Deducimos que f (a + x) − f (a) > 0 para todo x con 0 < kxk < s. O, lo que es igual, f (z) − f (a) > 0
para todo z tal que 0 < kz − ak < s. Lo que prueba que f tiene en a un mínimo relativo estricto.
Para poder usar el resultado anterior hay que saber clasificar una forma cuadrática. Hay
varios procedimientos sencillos para ello. Los dos que siguen a continuación son los que me
parecen más cómodos.
la forma cuadrática definida por A . Los valores propios de A son las raíces del polinomio carac-
terístico p(λ), que se define como el determinante de la matriz A − λ I :
p(λ) = A − λ I
Es sabido que, en la situación que estamos considerando, las raíces de dicho polinomio son
todas reales.
Sean λ j (1 6 j 6 n) los valores propios de A . Se demuestra que hay una base B = {u1 , u2 , . . . , un }
en Rn tal que para todo vector x ∈ Rn se tiene que
n
X
QA (x) = λ j x2j
j=1
donde (x1 , x2 , . . . , xn ) son los coordenadas del vector x en la base B. De aquí se siguen los siguien-
tes criterios.
• La forma cuadrática QA es definida positiva si, y sólo si, todos los valores propios de A son
positivos.
• La forma cuadrática QA es definida negativa si, y sólo si, todos los valores propios de A son
negativos.
• La cuadrática QA es no definida si, y sólo si, A tiene valores propios positivos y negativos.
• La forma cuadrática QA es semidefinida positiva si, y sólo si, todos los valores propios de A
son mayores o iguales que 0.
• La forma cuadrática QA es semidefinida negativa si, y sólo si, todos los valores propios de A
son menores o iguales que 0.
Para aplicar estos criterios no es preciso calcular los valores propios de A sino solamente
saber cuántos de ellos son positivos, negativos o nulos. Afortunadamente, hay un criterio que
nos proporciona esta información sin más que observar los coeficientes del polinomio carac-
terístico.
10.31 Proposición (Regla de los signos de Descartes). Sea f (x) = an xn + an−1 xn−1 + · · · + a1x + a0
un polinomio con coeficientes reales y cuyas raíces son todas números reales. Se verifica entonces
que:
Para contar los cambios de signo en la sucesión de coeficientes se saltan los coeficientes nu-
los. Por ejemplo, si f (x) = 2x6 +x5 −x3 +x2 −5, la sucesión de coeficientes de f es (2, 1, 0, −1, 1, 0, −1)
cuyo número de cambios de signo es 3.
• Si p(λ) tiene grado n, todos sus coeficientes son distintos de cero y tienen igual sigo, se verifica
que f tiene un máximo relativo estricto en a.
• Si p(λ) tiene grado n, todos sus coeficientes son distintos de cero y van alternando su sigo, se
verifica que f tiene un mínimo relativo estricto en a.
• Si p(λ) tiene grado n, sus coeficientes nulos van seguidos y llegan hasta el término indepen-
diente y los coeficientes no nulos tienen igual signo o van alternando su sigo, entonces no puede
afirmarse nada.
Otro criterio para estudiar el carácter de la forma cuadrática (10.15) se basa en la sucesión
de signos de los menores principales de la matriz A . El menor principal de orden k es el deter-
minante ∆k = ai, j 16i, j6k . Se verifica que:
• Si todos los determinantes principales son positivos la forma cuadrática es definida posi-
tiva.
• Si los determinantes principales son todos distintos de cero y van alternando signo siendo
el primero de ellos negativo, la forma cuadrática es definida negativa.
• Si los determinantes principales son nulos a partir de uno de ellos en adelante y los no nu-
los son positivos o van alternando signo siendo el primero de ellos negativo, no puede afirmarse
nada.
Sea A ⊂ R2 un conjunto abierto y sea f un campo escalar definido en A que tiene derivadas
parciales de segundo orden continuas. Supongamos que (a, b) ∈ A es un punto crítico de f y sea
2
∂ f ∂2 f
∂x2 (a, b) (a, b)
H( f , (a, b)) = ∂x∂y
∂2 f ∂ f
2
(a, b) (a, b)
∂x∂y ∂y 2
∂2 f
Si detH( f , (a, b)) > 0 y (a, b) > 0 entonces f tiene en (a, b) un mínimo relativo estricto.
∂x2
∂2 f
Si detH( f , (a, b)) > 0 y (a, b) < 0 entonces f tiene en (a, b) un máximo relativo estricto.
∂x2
Si detH( f , (a, b)) < 0 entonces f no tiene extremo relativo en (a, b). Se dice que (a, b) es un
punto de silla de f .
Cuando detH( f , (a, b)) = 0 el conocimiento de la matriz hessiana no permite decidir si hay
o no hay extremo relativo en (a, b). Cuando esto sucede puede ser interesante estudiar el
comportamiento de las curvas f (a,t + b) y f (a + t, b). Si alguna de dichas curvas no tie-
ne extremo relativo o tienen extremos relativos de distinta naturaleza en t = 0, podemos
concluir que en (a, b) no hay extremo relativo de f .
Ejercicios
2. Trazar un plano que pase por el punto (1, 2, 3) y que forme con los ejes coordenados un
tetraedro de volumen mínimo (el volumen del tetraedro es un tercio del área de la base
por la altura).
Una función vectorial es cualquier función que toma valores en un espacio vectorial de di-
mensión mayor mayor que 1. Las curvas en el plano o en el espacio son funciones vectoriales
de una variable. Ahora nos interesa considerar funciones vectoriales de varias variables.
10.33 Definición. Sean f1 , f2 , . . . , fm campos escalares definidos en un subconjunto E ⊂ Rn . La
función F : E → Rm definida para todo x = (x1 , x2 , . . . , xn ) ∈ E por
F(x) = f1 (x), f2 (x), . . . , fm (x)
D F(a)(x) = J( f , a) · x t
Es fácil deducir a partir de esta igualdad y de la definición de campo escalar diferenciable que
se verifica
F(x) − F(a) − D F(a)(x − a)
lı́m =0
x→0 kx − ak
10.35 Teorema (Regla de la cadena). Sean F : E → Rm , E ⊂ Rn , y G : A → Rn , A ⊂ Rq , funciones
vectoriales tales que G(A) ⊂ E de manera que la composición H = F ◦ G : A → Rm está definida.
Supongamos que G es diferenciable en un punto a∈A y que F es diferenciable en el punto G(a)∈E.
Entonces se verifica que la función compuesta H es diferenciable en a, y su diferencial viene dada
como la composición de las respectivas diferenciales :
De donde se sigue
n
∂hi X ∂ fi ∂gk
(a) = (b) (a) b = G(a) (1 6 i 6 m, 1 6 j 6 q) (10.18)
∂y j ∂xk ∂y j
k=1
Esta igualdad constituye la regla de la cadena para derivadas parciales y es importante que
aprendas a aplicarla y que entiendas lo que dice. Voy a intentar facilitarte las cosas.
Primero, lo más frecuente es que F sea un campo escalar. Supongamos, pues, que en lo
anterior, F = f es un campo escalar, en cuyo caso h = f ◦ G también es un campo escalar. La
igualdad (10.18) queda ahora
n
∂h X ∂f ∂gk
(a) = (b) (a) b = G(a) (1 6 j 6 q) (10.19)
∂y j ∂xk ∂y j
k=1
Para derivar la función nueva h, respecto a una nueva variable y j , se deriva la función
antigua f respecto a cada una de sus variables xk y se multiplica por la derivada de
cada una de ellas xk = gk (y1 , y2 , . . . , yq ) respecto a la variable y j .
Ya se ve que la situación está pidiendo que hagamos algunas simplificaciones que, además, son
las que se hacen siempre en la práctica porque, aunque son algo confusas facilitan mucho los
cálculos.
Lo primero que se hace es identificar las funciones gk que introducen las nuevas coordena-
das con las coordenadas antiguas xk , es decir, vemos las coordenadas antiguas como funciones
de las nuevas y esto lo escribimos en la forma siguiente.
Observa el doble papel que desempeña a la derecha de esta igualdad la letra xk ; cuando se deriva
respecto de ella representa una variable y cuando ella se deriva respecto de una variable nueva
representa una función.
Todavía suele darse un pasito más que consiste en representar la función f con una letra que
suele usarse para representar variables; a saber, la letra z. Esto es frecuente también en textos
de Física. Vamos a hacerlo así.
n
∂z X ∂z ∂xk
(a) = (b) (a) b = G(a) (1 6 j 6 q) (10.24)
∂y j ∂xk ∂y j
k=1
Todavía hay algo que podemos simplificar. Habrás observado que siempre indico la relación
que hay entre los puntos b y a. Eso es muy importante para entender lo que se hace. Hay que
saber dónde se evalúan las derivadas parciales de cada función. Pues bien, eso no se indica
jamás en textos de Física. Nunca se indica en dónde se evalúan las derivadas parciales. Así que
vamos a suprimirlo.
n
∂z X ∂z ∂xk
= (1 6 j 6 q) (10.25)
∂y j ∂xk ∂y j
k=1
Debes de familiarizarte con esta igualdad y saber reconocer en ella la igualdad de partida. Y no
olvides la forma en que se evalúa esta igualdad. Lo vuelvo a poner.
n
∂z X ∂z ∂xk
(y) = (G(y)) (y) (1 6 j 6 q) (10.26)
∂y j ∂xk ∂y j
k=1
Si tuviéramos que volver a derivar en esta igualdad respecto a una variable yk se derivaría como
de costumbre: la derivada de una suma es la suma de las derivadas y para derivar el producto se
∂z
aplica la regla usual. Pero hay un detalle muy importante y es que la función (G(y)) vuelve
∂xk
∂z
a ser la función compuesta del campo escalar con la función G. Por tanto para derivarla
∂xk
hay que aplicarle la misma regla que hemos aplicado para derivar z como función compuesta
y que nos ha llevado a la igualdad anterior. Es por eso que el cálculo de derivadas parciales de
segundo orden en funciones compuestas suele ser bastante engorroso y es fácil equivocarse si
no se sabe lo que se hace.
∂z
10.36 Ejemplo. Vamos a calcular siendo z = u2 + v5 + 3uv donde u = x2 + y2 , v = sen(xy).
∂x
Así es como suelen enunciarse estos ejercicios y debes entender bien el enunciado. Nos
están dando una función de las variables (u, v) a la que llaman z. Esto es la letra z representa
una función, a saber, z = u2 + v5 + 3uv. Nos están dando un cambio de variables por medio de las
∂z
igualdades u = x2 + y2 , v = sen(xy). Y nos piden calcular . Esto último ya nos dice claramente
∂x
∂z
que debemos ver z como función de x e y, es decir, la letra z en es la función que nos dan
∂x
después de sustituir en ella las nuevas variables, o sea, la función compuesta de z = u2 + v5 + 3uv
con G(x, y) = (x2 + y2 , sen(xy)).
Sabemos que
∂z ∂z ∂u ∂z ∂v
= + = (2u + 3v)2x + (5v4 + 3u)y cos(xy)
∂x ∂u ∂x ∂v ∂x
∂z
Si lo dejamos así escrito parece que depende de 4 variables. Pero no es así porque en la
∂x
igualdad anterior las variables son x e y (las nuevas variables) mientras que u y v (las antiguas
variables) vienen dadas por u = x2 + y2 , v = sen(xy). Por tanto, es mejor hacer la sustitución, con
lo que resulta
∂z
= (2(x2 + y2 ) + 3 sen(xy))2x + (5 sen4 (xy) + 3x2 + y2 )y cos(xy)
∂x
que nos da el valor de la derivada parcial de la función compuesta en un punto (x, y). En este
caso es muy sencillo calcular la función compuesta. Hazlo y comprueba el resultado obtenido.
Ejercicios
Consideremos una función de dos variables x e y, z = z(x, y), y supongamos que expresamos
x e y en función de nuevas variables u y v, lo que indicamos en la forma x = x(u, v), y = y(u, v). De
esta forma la función z es función (función compuesta) de las “variables libres” u y v, a través de
las “variables dependientes” x e y. Se trata de calcular las derivadas parciales de z respecto de
las nuevas variables u y v. La regla para hacerlo es la siguiente: para derivar una función
respecto de una nueva variable, se deriva z respecto de cada una de las antiguas variables y se
multiplica por la derivada de cada antigua variable respecto de la nueva variable. Se entiende
mejor si lo escribimos simbólicamente
∂z ∂z ∂x ∂z ∂y
= +
∂u ∂x ∂u ∂y ∂u
En esta igualdad debes darte cuenta de que a la izquierda, como estamos derivando respecto a
u, la letra z representa a la función compuesta z = z(x(u, v), y(u, v)) y la derivada está calculada en
un punto (u, v). En la parte derecha de la igualdad la letra z representa la función dada z = z(x, y)
y las letras x e y representan variables (cuando se deriva respecto de ellas) y funciones (cuando
se derivan respecto de u). Debe entenderse que cuando se sustituye un valor de (u, v) en la
igualdad los valores de x e y deben sustituirse por x = x(u, v), y = y(u, v).
∂z
1. Sea z = cos(xy) + ey−1 cos x donde x = u2 + v, y = u − v2. Calcular en el punto (u, v) = (1, 1).
∂u
∂u
2. Sea u = (x+ y)4 + y2 (z+ x)3 donde x = rs e−t , y = rs log(1 +t 2), z = r2 s cost. Calcula cuando
∂s
r = 2, s = 1, t = 0.
∂u
Calcular cuando r = 2, s = 1, t = 0, sabiendo que ϕ ′ (3/2) = −1.
∂s
∂z ∂z ∂z
5. Sea z = f (x, y) donde x = s4 + r4 , y = 2 r s2 . Calcula (2, 2) y (2, 2). Siendo (1, 1) = −2
∂x ∂y ∂r
∂z
y (1, 1) = 3.
∂s
y
6. Prueba que la función F(x, y) = f ( x2 −y2 ), donde f es una función real derivable, verifica la
igualdad
∂F ∂F
(x2 + y2 ) + 2x y =0
∂x ∂y
7. Prueba que la función F(u, v) = f (u v, (u2 − v2 )/2), donde f : R2 → R es una función dife-
renciable, verifica la igualdad
" #
∂f 2 ∂f 2 ∂F 2 ∂F 2
(u2 + v2) + = +
∂x ∂y ∂u ∂v
8. Sea z = f (x, y), donde x = ρ cos ϑ, y = ρ sen ϑ. Calcula ∂z/∂ρ y ∂z/∂ϑ y prueba que
2 2 2 2
∂z ∂z ∂z 1 ∂z
+ = + 2
∂x ∂y ∂ρ ρ ∂ϑ
∂g ∂g
9. Sea g(s,t) = f (s2 − t 2 ,t 2 − s2 ). Prueba la igualdad t + s = 0.
∂s ∂t
10. Sea u = f (x, y) donde x = es cost, y = es sent. Justifica que
2
∂2u ∂2u −2s ∂ u ∂2u
+ = e +
∂x2 ∂y2 ∂s2 ∂t 2
12. Sea z = f (x, y) donde x = x(u, v), y = y(u, v). Prueba que
2
∂2z ∂2 z ∂x ∂2 z ∂x ∂y ∂2 z ∂y 2 ∂z ∂2x ∂z ∂2y
= 2x +2 + + +
∂u2 ∂x ∂u ∂x∂y ∂u ∂u ∂y2 ∂u ∂x ∂u2 ∂y ∂u2
13. Una función se llama homogénea de grado n ∈ N si f (tx,ty) = t n f (x, y). Prueba que en tal
caso se verifica la igualdad
∂f ∂f
x +y = n f (x, y)
∂x ∂y
14. Sean las funciones f (x, y, z) = (ex +y2 , λ ez +y), g(u, v) = v2 + log u para (u, v) ∈ R × R+ . ¿Qué
valor debe tener λ para que la derivada direccional máxima de g ◦ f en (0, 0, 0) sea igual a
1?
En la teoría de extremos relativos se supone que las variables pueden tomar valores en cual-
quier punto de un conjunto abierto, es decir, pueden “moverse libremente” en dicho conjunto.
En muchos, por no decir que en la mayoría, de los problemas reales las variables no tienen
tanta libertad y están obligadas a satisfacer ciertas condiciones que en Física suelen llamar-
se ‘‘ligaduras”. Por ejemplo, supongamos que un móvil se mueve en una curva Γ dada por la
intersección de dos superficies; para cada punto (x, y, z) ∈ Γ la energía cinética del móvil viene
dada por una función conocida f (x, y, z) y queremos calcular los puntos de la trayectoria donde
dicha energía es máxima o mínima. En esta situación las variables x , y , z no son libres sino que
deben satisfacer la condición (x, y, z) ∈ Γ. Otro ejemplo; supongamos que la temperatura en un
punto (x, y, z) de la superficie terrestre viene dada por una función T (x, y, z) y queremos calcular
los puntos de mayor y menor temperatura. Aquí las variables tampoco son libres pues deben
verificar una condición de la forma x2 + y2 + z2 = R2 donde R es el radio de la Tierra. Igualmente,
en problemas de optimización de costes o beneficios las variables están siempre sometidas a
restricciones que dependen de las condiciones de producción o del mercado.
2 2
10.37 Ejemplo. La función f (x, y) = xy ex +y tiene un único punto crítico, el origen, que es un
punto de silla. Por tanto dicha función no tiene extremos relativos en R2 . Supongamos que
imponemos a las variables la condición x2 + y2 = 1 y queremos calcular el máximo valor de
f (x, y) cuando se verifique que x2 + y2 = 1. Fíjate en que el problema es completamente distinto.
Ahora solamente nos interesan los valores que toma la función f (x, y) en el conjunto
K = (x, y) ∈ R2 : x2 + y2 = 1
Sabemos que dicho conjunto es un conjunto compacto (es cerrado – porque coincide con su
frontera – y acotado); además la función f es continua, por tanto podemos asegurar, de entrada,
que tiene que haber algún punto (a, b) ∈ K en el cual la función f alcanza su mayor valor en K
(y tiene que haber otro donde alcance su menor valor en K). Calcular dicho punto es, en este
caso, muy sencillo pues para (x, y)∈K se tiene que f (x, y) = e x y. Como para (x, y)∈K se tiene que
√
y = ± 1 − x2 y los valores negativos de f no nos interesan porque queremos calcular el mayor
valor que toma en K, se sigue que
n p o
máx { f (x, y) : (x, y) ∈ K} = máx e x 1 − x2 : −1 6 x 6 1
√
Nuestro problema se ha convertido en calcular el máximo absoluto de la función h(x) = e x 1 − x2
para −1 6 x 6 1.
10.38 Ejemplo. Entre todos los rectángulos cuyo perímetro es igual a 16 calcular el que tiene
área máxima.
Este ejercicio puedes plantearlo como sigue. Sea f (x, y) = xy la función que da el área de un
rectángulo cuyos lados tienen longitudes x e y. Se trata de calcular el máximo de f (x, y) cuando
las variables verifican la condición 2x + 2y = 16. Por tanto, es un problema de extremos condi-
cionados. Seguro que ahora recuerdas algunos otros ejercicios parecidos a este que has hecho
sin saber que estabas haciendo problemas de extremos condicionados. La razón es clara: la
condición que nos dan es tan sencilla que permite despejar una variable en función de la otra,
y = 8 − x, con lo que nuestra función se convierte en xy = x(8 − x) y el problema queda reducido
a calcular el mayor valor de x(8 − x) cuando −8 6 x 6 8.
Los ejemplos anteriores ponen de manifiesto que los problemas de extremos condicionados
en los que puede utilizarse la condición que nos dan para despejar una variable en función de
otra, se reducen fácilmente a problemas de extremos de funciones de una variable. Pero supon-
gamos ahora que cambiamos la condición del ejemplo 1 por la siguiente:
x − ex +y + ey + sin(1 + xy) = 2
La cosa se complica porque ahora es imposible usar la condición impuesta para despejar una
variable en función de la otra. Ahora sí tenemos un auténtico problema de extremos condicio-
nados.
Lo antes dicho para funciones de dos variables puedes generalizarlo para funciones de tres
variables. Por ejemplo el problema de calcular las dimensiones de un ortoedro de volumen
igual a 8 para que su superficie lateral sea mínima, puedes plantearlo como sigue: calcular el
máximo de
f (x, y, z) = 2xy + 2xz + 2yz
(la función que da la superficie lateral de un ortoedro cuyos lados tiene longitudes x, y, z) con la
condición xyz = 8. Se trata de un problema de extremos condicionados, pero la condición dada
permite despejar una variable en función de las otras dos z = 8/(xy) con lo que nuestra función
queda 2xy + 2xz + 2yz = xy + 16/y + 16/x función de la que hay que calcular su mínimo absoluto
cuando 0 < x, 0 < y. Hemos convertido así el problema en uno de extremos relativos de una
función de dos variables. Pero si cambiamos la condición anterior por la siguiente
entonces no podemos usar esa condición (o condiciones) para despejar una variable (o dos
variables) en función de las otras (de la otra).
La teoría de extremos condicionados te dice cómo proceder en este tipo de problemas inde-
pendientemente de que la condición (o condiciones) que nos den sea más o menos fácil y per-
mita o no despejar variables. El resultado básico de esa teoría, que proporciona una condición
necesaria de extremo condicionado, es el teorema de Lagrange. Para facilitar su comprensión,
en vez de dar un enunciado general, lo enuncio en los tres casos que se presentan con mayor
frecuencia. Antes de enunciarlo conviene dar la definición de extremo local condicionado.
Teorema de Lagrange
En lo que sigue supondremos que las funciones que intervienen tienen derivadas parciales de
primer orden continuas.
a) Consideremos el problema de calcular los extremos locales una función de dos variables
f (x, y) cuando las variables están obligadas a moverse en una curva Γ dada por g(x, y) = 0:
Γ = (x, y) ∈ R2 : g(x, y) = 0
Además de las condiciones de derivabilidad que se han supuesto al principio, hay que supo-
ner que el vector gradiente de g no se anula en los puntos de Γ. En estas hipótesis, para que un
punto (a, b)∈Γ sea un extremo local condicionado de f , es necesario que los vectores gradiente
de f y de g en el punto (a, b) sean linealmente dependientes; es decir, que exista un número real
λ0 tal que
∂f ∂g
(a, b) + λ0 (a, b) = 0
∂x ∂x
∇ f (a, b) + λ0∇g(a, b) = 0 ⇐⇒
∂ f (a, b) + λ0 ∂g (a, b) = 0
∂y ∂y
Como debe cumplirse también que g(a, b) = 0, para recordar estas tres condiciones que debe
cumplir el punto (a, b) se suele definir una nueva función de tres variables, llamada función de
Lagrange, por
F(x, y, λ) = f (x, y) + λg(x, y)
y las condiciones anteriores nos dicen que el punto (a, b, λ0 ) es un punto crítico de la función
de Lagrange, es decir, es solución del sistema de ecuaciones (llamado sistema de Lagrange):
∂F ∂f ∂g
(x, y, λ) = (x, y) + λ (x, y) = 0
∂x ∂x ∂x
∂F ∂f ∂g
(x, y, λ) = (x, y) + λ (x, y) = 0
∂y ∂y ∂y
∂F (x, y, λ) = g(x, y) = 0
∂λ
b) Consideremos el problema de calcular los extremos locales una función de tres variables
f (x, y, z) cuando las variables están obligadas a moverse en una superficie S dada por g(x, y, z) = 0:
S = (x, y, z) ∈ R3 : g(x, y, z) = 0
Es decir, se trata de un problema de extremos condicionados por la condición (x, y, z)∈S o, equi-
valentemente, g(x, y, z) = 0.
Además de las condiciones de derivabilidad que se han supuesto al principio, hay que su-
poner que el vector gradiente de g no se anula en los puntos de S. En estas hipótesis, para que
un punto (a, b, c) ∈ S sea un extremo local condicionado de f , es necesario que los vectores gra-
diente de f y de g en el punto (a, b, c) sean linealmente dependientes; es decir, que exista un
número real λ0 tal que
∂f ∂g
(a, b, c) + λ0 (a, b, c) = 0
∂x ∂x
∂f ∂g
∇ f (a, b, c) + λ0∇g(a, b, c) = 0 ⇐⇒ (a, b, c) + λ0 (a, b, c) = 0
∂y ∂y
∂f ∂g
(a, b, c) + λ0 (a, b, c) = 0
∂z ∂z
Como debe cumplirse también que g(a, b, c) = 0, para recordar estas cuatro condiciones que
debe cumplir el punto (a, b, c) se suele definir una nueva función de cuatro variables, llamada
función de Lagrange, por
F(x, y, z, λ) = f (x, y, z) + λg(x, y, z)
y las condiciones anteriores nos dicen que el punto (a, b, c, λ0 ) es un punto crítico de la función
de Lagrange, es decir, es solución del sistema de ecuaciones (llamado sistema de Lagrange):
∂F ∂f ∂g
(x, y, z, λ) = (x, y, z) + λ (x, y, z) = 0
∂x ∂x ∂x
∂F ∂f ∂g
(x, y, z, λ) = (x, y, z) + λ (x, y, z) = 0
∂y ∂y ∂y
∂F ∂f ∂g
(x, y, z, λ) = (x, y, z) + λ (x, y, z) = 0
∂z ∂z ∂z
∂F
(x, y, z, λ) = g(x, y, z) = 0
∂λ
c) Consideremos el problema de calcular los extremos locales una función de tres variables
f (x, y, z) cuando las variables están obligadas a moverse en una curva Γ dada por g(x, y, z) =
h(x, y, z) = 0:
Γ = (x, y, z) ∈ R3 : g(x, y, z) = h(x, y, z) = 0
Es decir, se trata de un problema de extremos condicionados por la condición (x, y, z) ∈ Γ o,
equivalentemente, g(x, y, z) = h(x, y, z) = 0.
Además de las condiciones de derivabilidad que se han supuesto al principio, hay que supo-
ner que los vectores gradiente de g y de h son linealmente independientes en todo punto de Γ.
En estas hipótesis, para que un punto (a, b, c)∈Γ sea un extremo local condicionado de f , es ne-
cesario que los vectores gradiente de f , g y h en el punto (a, b, c) sean linealmente dependientes;
es decir, que existan números reales λ0 , µ0 tales que
∂ f (a, b, c) + λ0 ∂g (a, b, c) + µ0 ∂h (a, b, c) = 0
∂x ∂x ∂x
∂f ∂g ∂h
∇ f (a, b, c) + λ0 ∇g(a, b, c) + µ0∇h(a, b, c) = 0 ⇐⇒ (a, b, c) + λ0 (a, b, c) + µ0 (a, b, c) = 0
∂y ∂y ∂y
∂f ∂g ∂h
(a, b, c) + λ0 (a, b, c) + µ0 (a, b, c) = 0
∂z ∂z ∂z
Como debe cumplirse también que g(a, b, c) = h(a, b, c) = 0, para recordar estas cinco condicio-
nes que debe cumplir el punto (a, b, c) se suele definir una nueva función de cinco variables,
llamada función de Lagrange, por
y las condiciones anteriores nos dicen que el punto (a, b, c, λ0 , µ0 ) es un punto crítico de la fun-
ción de Lagrange, es decir, es solución del sistema de ecuaciones (llamado sistema de Lagran-
ge):
∂F ∂f ∂g ∂h
(x, y, z, λ, µ) = (x, y, z) + λ (x, y, z) + µ (x, y, z) = 0
∂x ∂x ∂x ∂x
∂F ∂f ∂g ∂h
(x, y, z, λ, µ) = (x, y, z) + λ (x, y, z) + µ (x, y, z) = 0
∂y ∂y ∂y ∂y
∂F ∂f ∂g ∂h
(x, y, z, λ, µ) = (x, y, z) + λ (x, y, z) + µ (x, y, z) = 0
∂z
∂z ∂z ∂z
∂F
(x, y, z, λ, µ) = g(x, y, z) = 0
∂λ
∂F
(x, y, z, λ, µ) = h(x, y, z) = 0
∂µ
Esta es la teoría que debes saber referente a extremos condicionados. El método que hemos
descrito se conoce como método de los multiplicadores de Lagrange porque las variables λ, µ
que se introducen se llaman multiplicadores de Lagrange.
La situación que consideraremos en los ejercicios será la siguiente: deberás calcular el má-
ximo o el mínimo absolutos de los valores de una función cuando las variables están sometidas
a una condición como las que hemos considerado anteriormente (las variables deben estar en
una curva Γ en el plano, o en una superficie S en el espacio, o en una curva Γ dada como inter-
sección de dos superficies) donde, además la curva Γ o la superficie S, según sea el caso, son
conjuntos compactos (lo que deberás justificar en cada caso). En esta situación, el teorema de
Weierstrass asegura que hay puntos de Γ o S en los que la función alcanza un máximo y un mí-
nimo absolutos, es decir, son puntos en los que la función toma el mayor valor o el menor valor
de todos los valores que toma en Γ o S. Para calcular dichos puntos lo único que debes hacer es
calcular los puntos críticos de la función de Lagrange y calcular el valor de la función en cada
uno de ellos, aquél punto (o puntos, puede haber más de uno) donde la función tome el mayor
valor será el punto donde se alcanza el máximo absoluto; aquél punto (o puntos, puede haber
más de uno) donde la función tome el menor valor será donde se alcanza el mínimo absoluto.
• Si p(z) es de grado n − m y todos sus coeficientes son distintos de cero y van alternando su
signo, entonces a es un mínimo local condicionado de f .
• Si p(z) es de grado n − m sus coeficientes nulos están seguidos y llegan hasta el término
independiente y los no nulos o bien tienen todos igual signo o van alternando su signo, no se
puede decir nada.
Ejercicios
1. Calcular el valor mayor y el valor menor que toma la función f (x, y, z) = xyz en los puntos
del elipsoide x2 + 4y2 + 9z2 = 3.
2. Calcular el valor mayor y el valor menor que toma la función f (x, y, z) = y2 + 4z2 − 4yz −
2xz − 2xy en los puntos del elipsoide 2x2 + 3y2 + 6z2 = 1.
5. Calcular el punto P(x, y, z) en el plano de ecuación 2x + y − z = 5 que está más cerca del
origen.
8. Dado el elipsoide
x2 y2 z2
+ + =1
a 2 b 2 c2
calcular un punto de coordenadas positivas tal que el plano tangente al elipsoide en dicho
punto determine con los ejes coordenados un tetraedro de volumen mínimo.
11. Calcular los valores máximo y mínimo de la función f (x, y, z) = xyz cuando el punto (x, y, z)
pertenece a la curva definida por la intersección del plano x + y + z = 0 y la esfera x2 + y2 +
z2 − 1 = 0.
15. El área de una caja rectangular sin tapa es de 108cm2 . Calcular sus dimensiones para que
el volumen sea máximo.
En este tipo de ejercicios se trata de calcular el máximo o el mínimo absolutos de una función
f con derivadas parciales continuas en un conjunto compacto K formado por la unión de un
conjunto abierto acotado y de su frontera, K = U ∪ Fr(U). En este tipo de ejercicios la existencia
de dichos extremos está asegurada de antemano en virtud del teorema de Weierstrass. Se trata
realmente de dos problemas, pues lo que hay que hacer es estudiar los extremos relativos de f
en el abierto U (un problema de extremos relativos) y estudiar los extremos locales condicio-
nados de f en Fr(U). Si la frontera de U está definida de forma apropiada (es una curva o una
superficie) éste último es un problema de extremos condicionados. Cuando la frontera de U
está dada por condiciones sencillas que permiten despejar variables puede hacerse un estudio
directo sin necesidad de recurrir a la teoría de extremos condicionados.
2 −y2
1. Calcular los extremos absolutos de f (x, y) = (x2 + 2y2) e−x en el disco x2 + y2 6 4.
Sea f (x, y) una función de dos variables con derivadas parciales de primer orden continuas y
consideremos la ecuación f (x, y) = 0. Las soluciones de dicha ecuación representan una curva
en el plano. Bueno, hablando con propiedad pueden representar algo más general que una
curva. Para que te convenzas de ello basta que consideres la ecuación
Ese conjunto (ver figura (10.1)) no es exactamente una curva pero localmente se parece a
una curva. La palabra “localmente” quiere decir que si fijamos un punto (a, b) tal que f (a, b) = 0
entonces hay una bola abierta centrada en (a, b) de radio positivo, B((a, b), r) tal que el corte
de dicha bola con el conjunto de puntos V = {(x, y) : f (x, y) = 0} es una curva, donde la palabra
“curva” tiene el significado que le hemos dado en el apartado dedicado al cálculo de rectas tan-
gentes. De hecho, no es cierto que la condición anterior se verifique para todos los puntos (a, b)
tales que f (a, b) = 0. Dicha condición falla en los puntos donde se cortan dos de las curvas cuya
unión forma V , pues es claro que en dichos puntos el conjunto V no parece localmente una
curva. Pues bien, dichos puntos son justamente los puntos donde se anula el vector gradiente
de f . En dichos puntos la recta tangente no está definida. Este ejemplo te ayudará a entender
lo que sigue.
Volvamos al caso general de una función de dos variables f (x, y) con derivadas parciales con-
tinuas de primer orden. Consideremos ahora la ecuación f (x, y) = 0 desde otro punto de vista.
Intuitivamente, una ecuación es una condición que debe ligar a una de las variables, es decir,
que si en la igualdad f (x, y) = 0 se fija un valor de x entonces el valor de y queda determinado
de manera única por dicho valor de x. A veces esto es verdad como en el siguiente ejemplo.
Consideremos
f (x, y) = y3 + y ex + sen x
Fijado un valor de x la ecuación f (x, y) = 0 es un polinomio de tercer grado en y que tiene una
única solución real pues su derivada respecto de y es 3y2 + ex que no se anula. Es decir, en este
Se dice que la función ϕ está implícitamente definida por la igualdad (10.27). Puedes calcu-
lar con Mathematica el valor de dicha función y comprobarás que es bastante complicada. El
hecho es que la mejor forma de trabajar con la función ϕ es la igualdad (10.28) que la define.
Por ejemplo, si queremos calcular la derivada de ϕ en un punto basta con que derivemos dicha
igualdad para obtener
3ϕ ′ (x)ϕ(x)2 + ϕ ′ (x) ex +ϕ(x) ex + cos x = 0
lo que permite calcular ϕ ′ (x) en función de ϕ(x).
En general, no es cierto que una igualdad de la forma f (x, y) = 0 permita despejar una va-
riable en función de la otra. Para convencerte, considera el primer ejemplo que pusimos. Ni
tan siquiera una igualdad tan sencilla como x2 + y2 − 1 = 0 permite despejar una variable como
función de la otra pues es claro que para cada valor que fijemos de una variable (comprendido
entre -1 y 1) hay dos posibles valores de la otra que verifican dicha igualdad.
Relacionemos ahora los dos puntos de vista que hemos considerado. Pongamos
Γ = (x, y) ∈ R2 : f (x, y) = 0
es decir, el conjunto Γ sería la gráfica de ϕ, que, como sabemos, es un tipo muy particular de
curva. Pero ya hemos visto que el conjunto Γ puede ser una “curva” mucho más general que la
gráfica de una función. Pero incluso en este caso, dicha “curva” es localmente, excepto en los
puntos donde se anula el gradiente, una gráfica de una función.
Las consideraciones anteriores se pueden llevar al caso de una función de tres variables
f (x, y, z) considerando ahora la “superficie” definida por la ecuación f (x, y, z) = 0. La pregun-
ta ahora es si fijados un valor de x y otro de y queda determinado de manera única un valor de
z = ϕ(x, y) que verifica dicha ecuación. En caso afirmativo tendríamos que la superficie de ecua-
ción f (x, y, z) = 0 coincidiría con la gráfica de ϕ. Ya puedes suponer que esto no es cierto en
general pues la mayoría de las “superficies” no son gráficas de funciones.
El siguiente resultado, conocido como teorema de la función implícita, nos dice lo que po-
demos afirmar en general en una situación como la que estamos considerando.
Suponemos que las funciones que consideramos en lo que sigue tienen derivadas parciales de
primer orden continuas.
∂f
(a, b) , 0
∂y
Entonces existe una función ϕ : I → R, definida en un intervalo I tal que a ∈ I y ϕ(a) = b, que
verifica que f (x, ϕ(x)) = 0 para todo x ∈ I. La función ϕ se dice que está implícitamente definida
por la ecuación f (x, y) = 0. Dicha función es derivable en I y su derivada se calcula derivando la
igualdad f (x, ϕ(x)) = 0 respecto a x con lo que se obtiene
∂f
∂f ∂f − (x, ϕ(x))
(x, ϕ(x)) + (x, ϕ(x))ϕ ′ (x) = 0 =⇒ ϕ ′ (x) = ∂x
∂x ∂y ∂f
(x, ϕ(x))
∂y
es decir, Γ es localmente en el punto (a, b) una curva que viene dada por la gráfica de ϕ.
∂f
(a, b, c) , 0
∂z
∂f
∂f ∂f ∂ϕ ∂ϕ − (x, y, ϕ(x, y))
(x, y, ϕ(x, y)) + (x, y, ϕ(x, y)) (x, y) = 0 =⇒ (x, y) = ∂x
∂x ∂z ∂x ∂x ∂f
(x, y, ϕ(x, y))
∂z
∂f
− (x, y, ϕ(x, y))
∂f ∂f ∂ϕ ∂ϕ ∂y
(x, y, ϕ(x, y)) + (x, y, ϕ(x, y)) (x, y) = 0 =⇒ (x, y) =
∂y ∂z ∂y ∂y ∂f
(x, y, ϕ(x, y))
∂z
es decir, S es localmente en el punto (a, b, c) una superficie que viene dada por la gráfica de ϕ.
El teorema de la función implícita es mucho más general pero nos limitaremos a los casos
considerados. En las hipótesis hechas pueden admitirse variaciones. La hipótesis que hay que
hacer siempre es que el vector gradiente de f no sea cero en el punto considerado. En el caso
a) puede suponerse igualmente que
∂f
(a, b) , 0
∂x
y la conclusión es que x puede expresarse localmente como función de y, es decir, que hay una
función ψ : J → R definida en un intervalo J tal que b∈J y ψ(b) = a que verifica que f (ψ(y), y) = 0
para todo y ∈ J. Lo que sigue ya lo puedes suponer.
define a z como función implícita de (x, y) en un entorno de (1, 1), con z(1, 1) = 6. Comprobar
que (1, 1) es un punto crítico de la función z = z(x, y).
Solución. Pongamos f (x, y, z) = xyz+ sen(z− 6)− 2(x+ y+ x2 y2 ) que tiene derivadas parciales con-
∂f ∂f
tinuas de todo orden. Tenemos que = xy + cos(z − 6), por lo que (1, 1, 6) = 2 , 0. Como,
∂z ∂z
además, f (1, 1, 6) = 0, el teorema de la función implícita garantiza que hay una función con de-
rivadas parciales continuas, (x, y) 7→ z(x, y), definida en un entorno, U, de (1, 1) tal que z(1, 1) = 6,
y
f (x, y, z(x, y)) = 0 para todo (x, y) ∈U.
Derivando esta identidad tenemos que:
∂ f ∂ f ∂z ∂z
+ = yz − 2(1 + 2xy 2) + (xy + cos(z − 6)) = 0 (1)
∂x ∂z ∂x ∂x
∂ f ∂ f ∂z ∂z
+ = xz − 2(1 + 2x 2y) + (xy + cos(z − 6)) = 0 (2)
∂y ∂z ∂y ∂y
Donde las derivadas parciales de la función implícita z = z(x, y) están calculadas en un punto
(x, y)∈U y las de f están calculadas en el punto (x, y, z(x, y)). Haciendo x = y = 1, z = z(1, 1) = 6, en
∂z ∂z
las igualdades anteriores, se obtiene que (1, 1) = (1, 1) = 0, esto es, (1, 1) es un punto crítico
∂x ∂y
de z = z(x, y).
El ejemplo anterior es todavía demasiado explícito, nos dice muy claramente lo que hay que
hacer. Lo más frecuente es que nos encontremos con ejercicios como el siguiente.
y cos(xz) + x3 ez y −z + 1 = 0 (10.29)
∂z
Calcular (x, y) y particularizar para el punto (x, y) = (0, 0).
∂x
Solución. En un ejercicio como este lo más fácil es que en la igualdad (10.29) sustituyas men-
talmente z = z(x, y) y la veas como
y cos x z(x, y) + x3 ez(x,y) y −z(x, y) + 1 = 0 (10.30)
es decir, supones que has calculado para valores de x e y dados la solución respecto a z de la
igualdad (10.29). Esta solución (que de hecho no es posible expresar de forma explícita, esto es,
que no puede calcularse) la representamos por z = z(x, y) y es la función implícita definida por
la igualdad (10.29) (el teorema de la función implícita que es un teorema de existencia garantiza
que dicha función existe). Ahora derivamos en la igualdad (10.30) respecto a x para obtener
∂z ∂z ∂z
−y sen x z(x, y) z(x, y) + x (x, y) + 3x2 ez(x,y) y +x3 y (x, y) ez(x,y) y − (x, y) = 0
∂x ∂x ∂x
de donde
∂z y z(x, y) sen x z(x, y) − 3x2 ez(x,y) y
(x, y) = 3 z(x,y) y
∂x x ye −x y sen(x z(x, y)) − 1
Naturalmente, esta igualdad tiene sentido siempre que el denominador de la fracción sea dis-
tinto de cero. Puedes comprobar que si llamas f (x, y, z) = y cos(xz)+x3 ez y −z+1 entonces la igual-
dad anterior es precisamente
∂f
− (x, y, z)
∂x
∂f
(x, y, z)
∂z
calculada en el punto (x, y, z(x, y)). Para (x, y) = (0, 0) se tiene que z(0, 0) viene dado por la ecua-
ción que se obtiene haciendo x = 0 e y = 0 en la igualdad (10.29) de donde se sigue z(0, 0) = 1.
Además
∂f ∂f
(0, 0, z(0, 0)) = (0, 0, 1) = −1 , 0
∂z ∂z
Por lo que
∂z 0
(0, 0) = =0
∂x −1
Ejercicios
1. Calcular las derivadas parciales de primer orden de la función z = z(x, y) definida implíci-
tamente por y z4 + x2 z3 − ex y z = 0. Particularizar para el punto (x, y) = (1, 0).
2. Calcular las derivadas parciales de primer orden de la función z = z(x, y) definida implíci-
tamente por z3 + z ex + cos y = 0.
3. Calcular las derivadas parciales de primer orden de la función z = z(x, y) dada implícita-
mente por 3x2 y2 + 2z2 xy − 2zx3 + 4zy3 − 4 = 0, en el punto (2, 1) siendo z(2, 1) = 2.
w
y+z wz2
g(t)dt + h(t)dt = 0
xy 3x+y
xy + 3x2 − 2y2 − 2y = 0
y log(x2 2 + y2) − 2x y = 0