Matemáticas ENM

ENM Matemáticas I Álgebra lineal 1
TEMA 1
ESPACIOS VECTORIALES
Espacio vectorial
Definición. Se dice que un conjunto V tiene estructura de espacio vectorial sobre el cuerpo K si:
1º. En V hay definida una operación interna (suma +: V×V → V) que confiere a V estructura de
grupo abeliano; es decir; en V y para la suma (+) se verifica:
1. Asociativa: (u + v) + w = u + (v + w), ∀ u, v, w ∈ V,
2. Neutro: ∃ o ∈ V (vector cero) tal que o + u = u + o, ∀ u ∈ V,
3. Simétrico: ∀ u ∈ V, ∃ -u (opuesto de u) tal que u + (-u) = (-u) + u = o,
4. Conmutativa: u + v = v + u, ∀ u, v ∈ V.
2º. En V hay definida una operación externa (producto ⋅: K×V → V), cuyo dominio de operadores es
el cuerpo K, tal que se cumplen los siguientes axiomas:
5. λ(u + v) = λu + λv, ∀ u, v ∈ V, ∀ λ ∈ K,
6. (λ + µ)u = λu + µu, ∀ u ∈ V, ∀ λ, µ ∈ K,
7. λ(µu) = (λ⋅µ)u, ∀ u ∈ V, ∀ λ, µ ∈ K,
8. 1u = u, ∀ u ∈ V, siendo 1 la unidad de K.
Notación. A los elementos del espacio vectorial V, los llamaremos vectores y se designaran por u, v,
w,....; y a los elementos del cuerpo K los llamaremos escalares y se designarán por λ, µ, ν, ... Cuando el
cuerpo K de escalares sea Q, R o C, se dirá que se dispone, respectivamente, de un espacio vectorial
racional, real o complejo.
Notación. El vector cero, neutro de V para la suma, lo representaremos por o, y el elemento nulo del
cuerpo K lo representaremos por 0.
Notación. Tanto para la suma de V como la de K se utiliza el mismo signo "+"; para el producto de K
y para la operación externa no se utiliza signo de operación.
Ejemplos. Son ejemplos típicos de espacios vectoriales los siguientes:
1. Todo cuerpo K es un espacio vectorial sobre sí mismo, ya que para la suma es grupo abeliano y,
considerando como operación externa el producto de elementos del cuerpo, se satisfacen los
restantes axiomas de un espacio vectorial.
2. Sea C[a, b] = {f: [a, b] → R / f continua en [a, b]}. C[a, b] con las operaciones de suma de
funciones y el producto de una función por un número real, es un espacio vectorial real.
3. El conjunto C de los números complejos es un espacio vectorial sobre R si se considera en él la

suma habitual de números complejos, que le da estructura de grupo abeliano, y se toma para
operación externa el producto ordinario de números reales por complejos.
4. El conjunto K[x], de las funciones polinómicas con una variable y con coeficientes pertenecientes a
un cuerpo K, con las definiciones habituales de suma de funciones polinómicas y producto de un
escalar por una función polinómica, es un espacio vectorial sobre el cuerpo K.
5. El conjunto Kn = {(x1, x2, ..., xn) | xi ∈ K}, en el que se han definido las operaciones: suma,
(x1, x2, ..., xn) + (y1, y2, ..., yn) = (x1 + y1, x2 + y2, ..., xn + yn);
producto por un elmento de K,
λ(x1, x2, ..., xn) = (λx1, λx2, ..., λxn)
es un espacio vectorial sobre K.
Nota. El alumno puede comprobar, haciendo uso de la definición de espacio vectorial, que estos
ejemplos son espacios vectoriales.
Teorema.
a) En un espacio vectorial sobre un cuerpo K, el neutro (el vector cero) es único.
b) Todo elemento tiene exactamente un simétrico (opuesto).
Ejercicio. Hacer la demostración (por reducción al absurdo).
Propiedades. En un espacio vectorial V sobre un cuerpo K, para cualesquiera que sean los vectores u
y v y los escalares λ y µ, se verifican las siguientes propiedades:
1. 0u = o;
2. λo = o;
3. λu = o ⇒ (λ = 0 ó u = o);
4. -(λu) = (-λ)u = λ(-u);
5. [λu = µu y u ≠ o] ⇒ λ = µ;
6. [λu = λv y λ ≠ 0] ⇒ u = v.
Ejercicio. En R2 se definen las operaciones: (x1, x2) + (y1, y2) = (x1 + y1, x2 + y2) y
a) λ(x1, x2) = (λx1, x2) b) λ(x1, x2) = (λx1, 0)
c) λ(x1, x2) = (λx2, λx1) c) λ(x1, x2) = (λx12, λx2)
¿Es (R2, +, ⋅R) un espacio vectorial real?
Solución
a) (λ + µ)(x1, x2) = ((λ + µ)x1, x2) = (λx1 + µx1, x2) ≠ (λx1, x2) + (µx1, x2) = λ(x1, x2) + µ(x1, x2); por
tanto (R2, +, ⋅R) no es espacio vectorial real.
b) 1(x1, x2) = (x1, 0) ≠ (x1, x2) si x2 ≠ 0; por tanto (R2, +, ⋅R) no es espacio vectorial real.
c) 1(x1, x2) = (x2, x1) ≠ (x1, x2) si x1 ≠ x2; por tanto (R2, +, ⋅R) no es espacio vectorial real.
d) 1(x1, x2) = (x12, x2) ≠ (x1, x2) si x12 ≠ x1; por tanto (R2, +, ⋅R) no es espacio vectorial real.
Subespacios vectoriales
Definición. Sea V un espacio vectorial sobre un cuerpo K, y sea U ⊂ V y U ≠ «; se dice que U es un

subespacio vectorial de V cuando U, con las mismas operaciones de V, es un espacio vectorial sobre K.
Observación. Para cualquier espacio vectorial V, son subespacios vectoriales de V; O = {o} y V.
Si U es un subespacio de V con U ≠ V y U ≠ O, decimos que U es un subespacio propio de V.
Teorema. Sea V un espacio vectorial sobre un cuerpo K, y sea U ⊂ V y U ≠ «. U es un subespacio

vectorial de V, ⇔ [1) ∀ u, v ∈ U, ⇒ u + v ∈ U; y 2) ∀ u ∈ U, y ∀ λ ∈ K, es λu ∈ U].
Teorema. Sea V un espacio vectorial sobre un cuerpo K, y sea U ⊂ V y U ≠ «. U es un subespacio

vectorial de V, sí y sólo sí, ∀ u, v ∈ U, y ∀ λ, µ ∈ K ⇒ λu + µv ∈ U.
Ejemplos. Son subespacios vectoriales los siguientes:

1. Para el espacio vectorial R4 = {(x1, x2, x3, x4) | xi ∈ R}, el conjunto {(x1, x2, x3, 0) | xi ∈ R} es un
subespacio vectorial.
2. Para el espacio vectorial F(I = [a, b], R) de las funciones de I en R, es subespacio vectorial el
subconjunto de las funciones acotadas; también constituyen subespacio todas las funciones que se
anulan en un subconjunto de I.
3. Para el espacio vectorial K[x] de funciones polinómicas es un subespacio vectorial el subconjunto
formado por aquellas cuyo grado es menor que n ∈ N.
Nota. El alumno deberá comprobar, haciendo uso de los teoremas, que dichos ejemplos son
subespacios vectoriales.
Ejercicio. En el espacio vectorial real R4, indicar cuáles de los siguientes subconjuntos son
subespacios vectoriales.
a) S = {(x1, x2, x3, x4) | x1 ∈ Z} b) T = {(x1, x2, x3, x4) | x2 - x3 - x4 = 1}
c) R = {(x1, x2, x3, x4) | x1⋅x2⋅x3 = 0} d) A = {(x1, x2, x3, x4) | |x2| = |x3|}
e) B = {(x1, x2, x3, x4) | x1⋅x2 = 0 ó x2⋅x3 = 0}
Solución.
a) π(1, 1, 1, 1) = (π, π, π, π) y π ∉ Z ⇒ S no es subespacio vectorial.
b) (0, 0, 0, 0) ∉ T ⇒ T no es subespacio vectorial.
c) (0, 1, 1, 1), (1, 0 , 0, 0) ∈ R, y (0, 1, 1, 1) + (1, 0 , 0, 0) = (1, 1, 1, 1) ∉ R ⇒ R no es subespacio

vectorial.
d) (0, 1, -1, 0), (0, 1, 1, 0) ∈ A, y (0, 1, -1, 0) + (0, 1, 1, 0) = (0, 2, 0, 0) ∉ A ⇒ A no es subespacio

vectorial.
e) (0, 1, 1, 1), (1, 0 , 0, 0) ∈ B, y (0, 1, 1, 1) + (1, 0 , 0, 0) = (1, 1, 1, 1) ∉ B ⇒ B no es subespacio

vectorial.
Intersección y suma de subespacios
Teorema. Dados un espacio vectorial V, sobre el cuerpo K, y dos subespacios suyos U1 y U2, el
conjunto U1…U2 es también un subespacio vectorial de V; en general si {Ui | i ∈ I} es una familia de
subespacios vectoriales de V, su intersección, 3 U i (abreviadamente …Ui), es también un subespacio
icI
vectorial de V.
Ejercicio. Hacer la demostración.
Observación. Como el vector nulo de V pertenece a todos sus subespacios, no hay subespacios de
intersección vacía. Cuando se diga que dos subespacios U1 y U2 son disjuntos, se debe entender que no
tienen más elemento en común que el vector cero, es decir, U1…U2 = {o} = O.
Ejemplo. Sea V = F(R, R), el espacio vectorial real de todas las funciones reales definidas en R, con
las definiciones usuales de suma de funciones y producto de un número real por una función;
consideremos los subespacios: U1, de las funciones polinómicas, y U2 de las funciones pares; la
intersección de U1 y U2 es, evidentemente, el conjunto de las funciones polinómicas que tienen nulos
todos los coeficientes de las potencias impares de la variable; pues bien, este subconjunto de V es también
un subespacio vectorial suyo.
Observación. En general, la unión conjuntista de dos subespacios de un espacio vectorial no es un

subespacio suyo.
Definición. Dados un espacio vectorial V, sobre un cuerpo K, y dos subespacios suyos U1 y U2, se
llama suma de dichos subespacios, y se representa por U1 + U2, al conjunto de todos los vectores de V
que pueden expresarse como suma de un vector de U1 y otro U2; es decir
U1 + U2 = {u = u1 + u2 | u1 ∈ U1, u2 ∈ U2}
Teorema. La suma de dos subespacios es, a su vez, un nuevo subespacio.
Ejemplo. En el espacio vectorial V = F(R, R) de las funciones reales definidas en toda la recta real,
considérense los subespacios U1 de las funciones que se anulan en los puntos 0 y 1 y U2 de las funciones
que se anulan en los puntos 0 y -1. El subespacio U1 + U2 es, ahora el formado por las funciones que se
anulan en el punto cero; en efecto, la suma de una función de U1 y otra de U2, como ambas se anulan en
cero, también se anula en 0; y, recíprocamente, si f ∈ V es tal que f(0) = 0, como siempre se cumple que f
= ( 12 f + g) + ( 12 f - g), tomando como g una de las infinitas funciones, de R en R, tal que g(0) = 0, g(1) = - 12
f(1) y g(-1) = 12 f(-1), como entonces 12 f + g ∈ U1 y 12 f - g ∈ U2, resulta ya evidente que f ∈ U1 + U2.
Definición. La definición de suma se extiende, de un modo natural, al caso de varios subespacios de la

siguiente manera: dados los subespacios U1, U2, ..., Un, del espacio vectorial V, se llama suma de dichos
n
subespacios, y se representa mediante U i (abreviadamente ΣUi), al conjunto de todos los vectores de V
i=1
expresables como suma de vectores de los subespacios dados; es decir:
n
U i = U 1 + U 2 + ... + U n = u = u 1 + u 2 + ... + u n / u i c U i , i=1,2,...,n
i=1
También sucede que la suma de varios subespacios es un subespacio.

Definición. Dos subespacios U1 y U2, de un espacio vectorial V, se dicen suplementarios si son

disjuntos y su suma es todo el espacio vectorial V. Es decir:
U1 y U2 son subespacios suplementarios de V ⇔ U1 + U2 = V y U1…U2 = O.
Si U1 y U2 son suplementarios, escribiremos: U1 ⊕ U2 = V.
Subespacio engendrado por un conjunto de vectores
Definición. Sea S un subconjunto no vacío (finito o infinito) de un espacio vectorial V. Un elemento u

de la forma:
u = λ1u1 + λ2u2 + ... + λnun,
en donde u1, u2, ..., un ∈ S y λ1, λ2, ..., λn ∈ K, se llama combinación lineal de los elementos de S.
Teorema. Sea V un espacio vectorial sobre el cuerpo K, y S un subconjunto no vacío de V. El

conjunto de todas las combinaciones lineales finitas de elementos de S;
L(S) = 〈S〉 = {λ1u1 + λ2u2 + ... + λnun | u1, u2, ..., un ∈ S y λ1, λ2, ..., λn ∈ K},
es un subespacio vectorial de V.
Definición. Dado subconjunto S no vacío de un espacio vectorial V sobre un cuerpo K, se llama

subespacio engendrado por S a L(S)
También suele decirse que S es un conjunto generador del subespacio L(S). Si L(S) = V, se dice que
V es un espacio vectorial generado por S, y si S es finito, se dice que V es de tipo finito.
Ejemplo. En el espacio vectorial V = F(R, R) de la funciones de R en R, las funciones f0(x) = 1, f1(x) = x

y f2(x) = x2 engendran el subespacio de todas las funciones polinómicas de grado menor o igual que dos.
Independencia lineal
Definición. Sea S un subconjunto no vacío de un espacio vectorial V, sobre un cuerpo K, se dice que S
es dependiente si existe un conjunto finito de elementos de S, u1, u2, ..., un y un conjunto de escalares λ1,
λ2, ..., λn, no todos nulos y tales que
λ1u1 + λ2u2 + ... + λnun = o
El conjunto S se llama independiente si no es dependiente. En tal caso, cualesquiera que sean los
elementos distintos u1, u2, ..., un ∈ S y los escalares λ1, λ2, ..., λn, tales que
λ1u1 + λ2u2 + ... + λnun = o, implica que λ1 = λ2 = ... = λn = 0.
Si bien la dependencia y la independencia son propiedades de los conjuntos de elementos, podemos

también aplicar esas denominaciones a los elementos mismos.
Teorema. S = {u1, u2, ..., un} ⊂ V es dependientes ⇔ uno de los vectores de S es combinación lineal
de todos los demás.

Ejercicio. Pruébense las siguientes afirmaciones:
- Si o ∈ S, entonces dicho conjunto es dependiente.
- Si S es dependiente, también es dependiente T si S ⊂ T.
- Si T es independiente, tambien es independiente S si S ⊂ T.
Ejercicio. Probar que en el espacio vectorial de las funciones reales de variable real, la sucesión de
funciones fn(x) = sen nx es un conjunto de vectores independientes.
Solución. f1(x) = sen x es independiente, ya que λ1sen x = 0 ∀ x ∈ R ⇒ λ1 = 0.
Supongamos ahora que f1(x), ..., fn-1(x) son independientes, y consideremos
λ1f1(x) + ... + λn-1fn-1(x) + λnfn(x) = 0 ∀ x ∈ R. ⇒
1f1
n + ... + n−1 f n−1 n + n f n n = 0 e 1 f 1 n + ... + n−1 f n−1 n = 0 e 1 = ... = n−1 = 0
⇒ λnfn(x) = 0 ∀ x ∈ R. ⇒ λn = 0 y por tanto f1(x), ..., fn(x) son independientes.
Teorema. Sea S = {u1, u2, ..., uk} un subconjunto independiente de un espacio vectorial V sobre un
cuerpo K. Entonces todo conjunto de k + 1 elementos de L(S) es dependiente.
Bases y dimensión
Definición. Sea V un espacio vectorial sobre un cuerpo K y sea B = {e1, e2, ..., en} ⊂ V; se dice que B
es una base de V si:
1. B es independiente.
2. B genera V; es decir L(B) = V.
Teorema. B = {e1, e2, ..., en} es una base de V ⇔ todo vector v ∈ V se puede expresar de forma única
como combinación lineal de los vectores de B.
Definición. Sea B = (e1, e2, ..., en) una base ordenada de V y sea v ∈ V; se llaman coordenadas de v en
la base B a los únicos escalares λ1, λ2,..., λn tales que v = λ1e1 + ... + λnen. A los vectores λ1e1, λ2e2,..., λnen
se le llaman componentes de v en la base B.
Teorema. Todo espacio vectorial V ≠ O de tipo finito posee, al menos, una base.
Teorema. En un espacio vectorial V de tipo finito, todas las bases tienen igual número de vectores.
De estos dos teoremas se deduce que todo espacio vectorial V ≠ O de tipo finito posee al menos una
base y que todas las bases de V tienen igual número de vectores, por tanto estamos en condiciones de
establecer la siguiente definición:
Definición. Sea V un espacio vectorial sobre el cuerpo K, V ≠ O y de tipo finito. Se llama dimensión
de V y se representa por dim(V), al número de vectores de cualquiera de sus bases.
El espacio vectorial O es de tipo finito, pero no tiene ninguna base; por tanto, la precedente definición
no es válida para este espacio. Se conviene en decir que el espacio vectorial O tiene dimensión cero.
Base canónica de Kn. Los vectores e1 = (1, 0, ..., 0), e2 = (0, 1, ..., 0), ..., en = (0, 0, ..., 1), constituyen
una base de Kn, ya que el conjunto formado por {e1, e2, ..., en}, es:
Conjunto de generadores de Kn, pues, ∀ k = (k1, k2, ..., kn) ∈ Kn; k = k1e1 + k2e2 + ... + knen.
Conjunto independiente de Kn, ya que λ1e1 + λ2e2 + ... + λnen = o ⇔ (λ1, λ2, ..., λn) = (0, 0, ..., 0).
A esta base de Kn, se la llama base canónica de dicho espacio vectorial; como esta base consta de n
vectores, ⇒ Kn es de tipo finito y dim(Kn) = n.
Observación. Puede generalizarse el concepto de base y definir bases infinitas. Un ejemplo de la

generalización del concepto de base es: En el espacio vectorial R[x], de las funciones polinómicas reales,
la sucesión infinita de polinomios {1, x, x2, ..., xn, ...} es una base infinita.
Propiedades
Sin entrar en demostraciones, daremos algunas propiedades relativas a bases y dimensiones de los
espacios vectoriales de tipo finito, que nos ayudaran a completar la visión que hasta el momento tenemos
de ellas.
1. Si V es un espacio vectorial de tipo finito y {v1, v2, ..., vp} es un conjunto independiente de vectores
de V, siempre es posible encontrar unos vectores vp+1,..., vn de V tales que, siendo n ≥ p, el conjunto
{v1, v2, ..., vn} sea una base de V.
2. Si un espacio vectorial V tiene dimensión n, todo conjunto de más de n vectores de V es
dependiente.
3. Si un espacio vectorial V es de dimensión n, todo conjunto generador de V tiene, al menos, n
vectores.
4. Si U es un subespacio propio del espacio vectorial de tipo finito V, entonces se verifica que
dim(U) < dim(V)
5. Si V es un espacio vectorial de dimensión n, un conjunto de n vectores B = {e1, e2, ..., en} de V es
base si, y sólo si, se cumple una cualquiera de estas condiciones: a) B es independiente; b) B es un
conjunto generador de V.
6. Si {e1, e2, ..., en} es una base de un espacio vectorial V y {v1, v2, ..., vr} es un conjunto
independiente, de vectores de V, se puede asegurar que hay n - r vectores de la base que añadidos a
los v1, v2, ..., vr constituyen una nueva base.
Dimensiones de los subespacios y rango
Definición. Se llama rango de un conjunto de vectores {v1, v2, ..., vm} de un espacio vectorial V, y se
representa por rang{v1, v2, ..., vm}, al mayor número de vectores independientes del conjunto, es decir, el
rango de {v1, v2, ..., vm} es la dimensión del subespacio vectorial que engendra dicho conjunto, o sea:
rang{v1, v2, ..., vm} = dim(L{v1, v2, ..., vm}).
De acuerdo con esta definición, un conjunto de m vectores será independiente si, y sólo si, su rango es
igual a m, número de vectores del conjunto. Un conjunto de n vectores de un espacio de dimensión n será
una base sii su rango es igual a n.
Teorema. Sean U1 y U2 dos subespacios de tipo finito de un espacio vectorial V, se verifica que:
dim(U1) + dim(U2) = dim(U1 + U2) + dim(U1 ∩ U2)
Teorema. Si una base {e1, ..., en}, de un espacio vectorial V, se divide en dos conjuntos {e1, e2, ..., ep}
y {ep+1, ep+2, ..., en}, los subespacios U1 = L{e1, e2, ..., ep} y U2 = L{ep+1, ep+2, ..., en} son suplementarios.
Cambios de base
Sean B = {e1, e2, ..., en} y B' = {e'1, e'2, ..., e'n} dos bases de V, entonces, un vector x ∈ V puede
expresarse en una u otra base de la siguiente manera:
x = x1e1 + x2e2 + ... + xnen, x = x'1e'1 + x'2e'2 + ... + x'ne'n,

Como:
e'1 = a11e1 + a21e2 + ... + an1en
e'2 = a12e1 + a22e2 + ... + an2en
⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅
e'n = a1ne1 + a2ne2 + ... + annen
sustituyendo en x = x'1e'1 + x'2e'2 + ... + x'ne'n, e igualando coordenadas se tiene:
x1 = x'1a11 + x'2a12 + ... + x'na1n

x2 = x'1a21 + x'2a22 + ... + x'na2n
⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅
xn = x'1an1 + x'2an2 + ... + x'nann
Cuando veamos matrices, estas ecuaciones las escribiremos en notación matricial.

Aplicaciones lineales
Definición. Dados dos espacios vectoriales V y W, ambos sobre el mismo cuerpo K, una aplicación f:
V → W se dice que es una aplicación lineal u homomorfismo entre espacios vectoriales si, para
cualesquiera que sean los vectores u, v ∈ V y para todo escalar λ ∈ K, se verifica:
f(u + v) = f(u) + f(v),
f(λu) = λf(u).
Es trivial comprobar que, de acuerdo con esta definición, f es aplicación lineal si, y sólo si, para
cualesquiera que sean los vectores u, v ∈ V y los escalares λ, µ ∈ K, es:
f(λu + µv) = λf(u) + µf(v).
Definición. Sea f: V → W aplicación lineal.

1. Si f es inyectiva, diremos que f es un monomorfismo.
2. Si f es sobreyectiva, diremos que f es un epimorfismo.
3. Si f es biyectiva, diremos que f es un isomorfismo.
4. Si V = W, diremos que f es un endomorfismo.
5. Si f es un endomorfismo biyectivo, diremos que f es un automorfismo.
Ejemplos:
1. La aplicación f: K2 → K3, definida mediante f(x, y) = (x - 2y, 3x, -x + y) es lineal.
2. Si V = D(R, R) es el espacio vectorial de la funciones reales definidas en R que son derivables y W

= F(R, R) es el espacio vectorial de todas las funciones definidas en R, la aplicación derivada, es
decir D: V → W que a toda función derivable φ le asocia su derivada, D(φ) = φ', es lineal entre
espacios vectoriales.
3. Si V = J(I, R) es el espacio vectorial de las funciones reales integrables en I = [a, b] Õ R y W = R,

la aplicación ¶ a : V → W, que a cada función φ le atribuye su integral ¶ a #, es lineal entre espacios
b b
vectoriales.
4. (Homomorfismo nulo). Dados dos espacios vectoriales cualesquiera V y W, la aplicación nula, es

decir, aquella que a todo vector de V le asocia el vector nulo de W, es evidentemente lineal.
5. (Automorfismo identidad). La aplicación idéntica, de un espacio vectorial en sí mismo, es

evidentemente lineal y biyectiva; por tanto, se trata de un automorfismo.
6. (Homotecias). Dado un espacio vectorial V, para cualquiera que sea el escalar k del cuerpo base K
del espacio vectorial, la aplicación fk: V → V, que a cada vector v ∈ V le hace corresponder fk(v) =
kv, recibe el nombre de homotecia de razón k; toda homotecia es, evidentemente, una aplicación
lineal de un espacio vectorial en sí mismo. Si k = 0, la homotecia correspondiente es el
endomorfismo nulo; si k = 1, la correspondiente homotecia es el automorfismo identidad. Si k ≠ 0,
la homotecia fk es, evidentemente, una aplicación biyectiva y, por tanto, se trata de una
automorfismo.
Propiedades de las aplicaciones lineales
Propiedades. Sea f: V → W, una aplicación lineal entre espacios vectoriales; se verifica que:
1. f(o) = o y f(-v) = - f(v), ∀ v ∈ V.
2. Si U es subespacio de V, entonces f(U) es subespacio de W.
3. Si U es subespacio de W, entonces f -1(U) es subespacio de V.
4. Si {v1, ..., vn} ⊂ V es dependiente, ⇒ {f(v1), f(v2), ..., f(vn)} ⊂ W también lo es.
5. Si {v1, ..., vn} ⊂ V es conjunto generador de un subespacio U de V, ⇒ {f(v1), f(v2), ..., f(vn)} es
conjunto generador del subespacio f(U) de W.
Núcleo e Imagen de una aplicación lineal
Definición. Sea f: V → W una aplicación lineal entre espacios vectoriales; se llama imagen de la
aplicación lineal f y se representará por Im(f), al subespacio vectorial f(V).
Definición. Sea f: V → W una aplicación lineal entre espacios vectoriales; se llama núcleo de la
aplicación lineal f y se representará por Ker(f), al subespacio vectorial f -1({o}).
Imagen recíproca de un vector. Sea f: V → W una aplicación lineal, y w ∈ W; si w ∉ Im(f) ⇒ f -1(w)

= «. Si w ∈ Im(f) ⇒ ∃ v0 ∈ V | f(v0) = w, ⇒ Si v ∈ f -1(w) ⇔ f(v) = w, ⇒ f(v0) = f(v), ⇔ f(v0 - v) = o,
por tanto v0 - v ∈ Ker(f), ⇒ f -1(w) = v0 + Ker(f).
Teorema. Sea f: V → W una aplicación lineal entre espacios vectoriales sobre el mismo cuerpo K; f es
inyectiva ⇔ Ker(f) = {o}.
Teorema. Sea f: V → W una aplicación lineal entre espacios vectoriales sobre el mismo cuerpo K; f es
inyectiva ⇔ ∀ v1, v2, ..., vn ∈ V independientes, ⇒ f(v1), f(v2), ..., f(vn) ∈ W son independientes.
Aplicaciones lineales entre espacios vectoriales de dimensión finita
Teorema. Sea V un espacio vectorial sobre el cuerpo K, con dim(V) = n, ⇒ ∃ f: V → Kn tal que f es
un isomorfismo (V ≈ Kn).
Este teorema nos dice que el comportamiento de los espacios vectoriales de dimensión finita es el
mismo que el de los espacios Kn, para n ≥ 1.
Teorema. Sea V un espacio vectorial de tipo finito y f: V → W una aplicación lineal entre espacios
vectoriales, ⇒ Im(f) = f(V) es un espacio vectorial de tipo finito.
vectoriales; f es inyectiva ⇔ dim(V) = dim(Im(f)).
Dimensiones del núcleo y la imagen de una aplicación lineal
vectoriales; se verifica que:
dim(V) = dim(Ker(f)) + dim(Im(f))
Rango de una aplicación lineal
Definición. Sea V un espacio vectorial de tipo finito y f: V → W una aplicación lineal entre espacios
vectoriales, se llama rango de f, y se representa por rang(f) a la dimensión del espacio vectorial imagen,
es decir:
rang(f) = dim(Im(f))
por tanto, si {e1, ..., en} es una base de V, como {f(e1), ..., f(en)} es un conjunto de generadores de Im(f), se
tiene que
rang(f) = rang{f(e1), ..., f(en)}.
Determinación y existencia de aplicaciones lineales
Teorema. Sean V y W dos espacios vectoriales sobre el cuerpo K, si dim(V) = n y B = {e1, ..., en} es
una base de V y si C = {w1, w2, ..., wn} ⊂ W, ⇒ existe una única aplicación lineal f: V → W tal que f(ei) =
wi, ∀ i = 1, 2, ..., n. Si, además, C es un conjunto independiente de W, entonces la aplicación lineal es
inyectiva.
Ecuaciones de una aplicación lineal
Sea f: V → W una aplicación lineal entre espacios vectoriales de tipo finito sobre el mismo cuerpo K,
y sea B = {e1, ..., en} una base de V y C = {w1, w2, ..., wm} una base de W. Sabemos que f queda
determinada si conocemos f(e1), f(e2), ..., f(en), entonces si:
f(e1) = a11w1 + a21w2 + ... + am1wm
f(e2) = a12w1 + a22w2 + ... + am2wm
⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅
f(en) = a1nw1 + a2nw2 + ... + amnwm
∀ x ∈ V, f(x) = (y1, y2, ...ym) donde

y1 = x1a11 + x2a12 + ... + xna1n
y2 = x1a21 + x2a22 + ... + xna2n
⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅
ym = x1am1+ x2am2 + ... + xnamn
Se puede entonces afirmar que, para unas bases dadas de V y W, toda aplicación lineal f: V → W
queda determinada, de forma única, por m × n escalares; las relaciones anteriores reciben el nombre de
ecuaciones coordenadas de la aplicación f en las bases B = {e1, ..., en} y C = {w1, ..., wm} de V y W,
respectivamente. Cuando veamos matrices, escribiremos estas ecuaciones en notación matrical.
Ejercicios propuestos
1. Sea V el espacio vectorial real de las funciones reales de una variable real, con las operaciones
usuales. Si Φ: R3 → V es la aplicación que a cada terna (a, b, c) ∈ R3 le asocia la función:
x → asen2x + bcos2x +c
a) Pruébese que Φ es lineal.
b) Hállense el núcleo y la imagen de Φ, analizando si Φ es inyectiva.
c) Localícese Φ-1(U), donde U es el subespacio de V que forman las funciones constantes.
2. Sea S = {x1, x2, ..., xn} un conjunto de vectores de un espacio vectorial; considérese el nuevo
conjunto T = {y1, x2, ..., xn}, donde y1 = x1 + a2x2 + ... + anxn, para cualesquiera escalares a2, ..., an.
Pruébese que T es independiente si, y sólo si, lo es S.
3. Sea V un e.v. de tipo finito sobre el cuerpo K con dim(V) = 2n (n ∈ N) y f: V → V un

endomorfismo de V tal que f ≠ O. Demostrar que:
Ker(f) = Img(f) ⇔ [rang(f) = n y f 2 = O].
4. Sea V un e.v. de tipo finito sobre el cuerpo K y f: V → V un endomorfismo de V tal que f 2 = O

demostrar que la aplicación I - f es un automorfismo de V.
2
5. Sea V un espacio vectorial sobre un cuerpo K, y sea f un endomorfismo de V, tal que f = f
(idempotente). Demostrar que Imgf y Kerf son subespacios suplementarios.
6. Sea V un espacio vectorial de dimensión "n", sobre el cuerpo K, y sea f un endomorfismo de V,

idempotente (f 2 = f), y tal que rang(f) = r. Demostrar que:
a) f(v) = λv (v ≠ o) ⇒ λ = 0 o λ = 1
b) El subespacio U = {v ∈ V / f(v) = v} tiene dimensión r.
7. Sea V un K - espacio vectorial y f, g dos endomorfismos de V. Probar que:
Ker(g ) f ) = f −1 (Kerg 3 Im f )
MATRICES
Primeras definiciones
×n a una tabla de m×n

Definición. Sea K un cuerpo conmutativo (R ó C). Se llama matriz de orden m×
números (elementos de K) dispuestos en m filas y n columnas de la forma:
a 11 a 12 $$$ a 1n
a 21 a 22 $$$ a 2n
$$$ $$$ $$$ $$$
a m1 a m2 $$$ a mn
En una matriz el elemento aij se encuentra en la fila "i" y la columna "j".
De manera abreviada, representaremos una matriz de la forma
 1[i[m
(a ij ) 
 1[j[n
En general cuando hablemos de una matriz A de orden m×n escribiremos A = (aij) entendiendose que
los índices varían de la forma: 1 ≤ i ≤ m y 1 ≤ j ≤ n.
El conjunto de todas las matrices de orden m×n se representa por Mm××n(K).
Definición. Cuando en una matriz el número de filas sea igual al número de columnas (m = n),
diremos que es una matriz cuadrada de orden "n" y representaremos por Mn(K) al conjunto de todas las
matrices cuadradas de orden "n".
Definición. Sean A = (aij), B = (bij) ∈ Mm×n(K), decimos que A es igual a B, si, y sólo si:
aij = bij ∀ i, j
Definición. Sea A = (aij) ∈ Mn(K), se llama diagonal principal al conjunto {a11, a22, ..., ann}.
Definición. Sea A = (aij) ∈ Mn(K), se llama diagonal secundaria al conjunto {aij / i + j = n + 1}.
Definición. Sea A = (aij) ∈ Mn(K), se dice que A es una matriz triangular superior cuando son nulos
todos sus elementos situados por debajo de la diagonal principal; es decir cuando aij = 0 si i > j.
Se dice que A es una matriz triangular inferior cuando son nulos todos sus elementos situados por
encima de la diagonal principal; es decir cuando aij = 0 si i < j.
Definición. Sea A = (aij) ∈ Mn(K), se dice que A es una matriz diagonal cuando todos los elementos
no situados en la diagonal principal son cero; es decir A = (aijδij).
Definición. Sea A = (aij) ∈ Mn(K), se dice que A es una matriz escalar cuando todos los elementos no
situados en la diagonal principal son cero y los elementos de la diagonal principal son todos iguales; es
decir A = (aδij). Cuando a = 1, se dice que A es una matriz unidad y se representará por In.
Definición. Sea A = (aij) ∈ Mm×n(K), se dice que A es la matriz nula cuando todos los elementos son
cero; es decir A = (0).
Definición. Si A es una matriz que sólo posee una fila recibirá el nombre de matriz fila. Si A es una
matriz que sólo posee una columna recibirá el nombre de matriz columna.
×n
Espacio vectorial de la matrices de orden m×
Definición. Sean A = (aij) y B = (bij) ∈ Mm×n(K), se llama matriz suma de A y B y se representa por
A + B, a la matriz que resulta de sumar los elementos de las matrices A y B que ocupan el mismo lugar,
es decir; A + B = (aij + bij) ∈ Mm×n(K).
Propiedades de la suma de matrices.

1. Asociativa: (A + B) + C = A + (B + C) ∀ A, B, C ∈ Mm×n(K).
2. Elemento neutro (Matriz Nula): ∀ A ∈ Mm×n(K) ∃ O = (0) ∈ Mm×n(K) / A + O = O + A = A.
3. Elemento opuesto: Dada A = (aij) ∈ Mm×n(K) ∃ -A = (-aij) ∈ Mm×n(K) / A + (-A) = (-A) + A = O.
4. Conmutativa: A + B = B + A ∀ A, B ∈ Mm×n(K).
Definición. Sea A = (aij) ∈ Mm×n(K) y sea λ∈K, se llama matriz producto de λ por A y se representa
por λA, a la matriz que resulta de multiplicar todos los elementos de la matriz A por el escalar λ, es
decir; λA = (λaij) ∈ Mm×n(K).
Propiedades de la multiplicación de una matriz por un escalar.

5. λ(A + B) = λA + λB ∀ A, B ∈ Mm×n(K) y ∀ λ ∈ K.
6. (λ + µ)A = λA + µA ∀ A ∈ Mm×n(K) y ∀ λ, µ ∈ K.
7. (λµ)A = λ(µA) ∀ A ∈ Mm×n(K) y ∀ λ, µ ∈ K.
8. 1A = A ∀ A ∈ Mm×n(K) y siendo 1 el elemento unidad de K.
Por tanto, tenemos que Mm×n(K) es un espacio vectorial sobre el cuerpo K.
Producto de matrices
Definición. Sea A = (aij) ∈ Mm×p(K), y B = (bjk) ∈ Mp×n(K). Se llama matriz producto de A por B y se
representa por AB a la matriz (cik) ∈ Mm×n(K) donde cik = ai1b1k + ai2b2k + ... + ainbnk.
1. Observación: De acuerdo con la reciente definición de producto de matrices, en general, dos

matrices cualesquiera no se podrán multiplicar; de modo que, para que el producto AB tenga
sentido, se precisa que el número de columnas de A sea igual al número de filas de B.
2. Observación: Cuando las matrices A y B son cuadradas de orden "n", tienen sentido los productos
AB y BA y ambos son matrices cuadradas de orden "n", pero en general AB ≠ BA. Lo que se
resume diciendo que el producto de matrices no verifica la propiedad conmutativa.
Propiedades del producto de matrices.
Siempre que se puedan efectuar las operaciones que se indican a continuación, se verifican las
siguientes propiedades:
1. Asociativa: (AB)C = A(BC).
2. Distributiva: (A + B)C = AC + BC y C(A + B) = CA + CB.
3. El producto de dos matrices no nulas puede ser una matriz nula; como por ejemplo:
0 0 1 0 1 0 0 0
=
0 1 0 0 0 0 0 0
Anillo de las matrices cuadradas de orden n
La estructura algebraica (Mn(K); +, ⋅) es un anillo, ya que, se verifica:
(Mn(K); +) es un grupo conmutativo.
El producto de matrices es asociativo.
El producto es distributivo, por la izquierda y por la derecha, respecto de la suma.
Propiedades del anillo Mn(K).

1. El anillo de las matrices cuadradas de orden n es un anillo unitario; la matriz unidad es la In, ya
que AIn = InA = A, ∀ A ∈ Mn(K).
2. El anillo Mn(K) no es conmutativo, pues el producto de matrices no es conmutativo.
3. El anillo Mn(K) (para n > 1) es un anillo con divisores de cero, es decir el producto de dos matrices
no nulas puede ser la matriz nula.
Matrices inversibles o regulares
Definición. Sea A ∈ Mn(K), decimos que A es una matriz regular si ∃ A-1 ∈ Mn(K), llamada inversa
de A, tal que:
AA-1 = A-1 A = In
Las matrices cuadradas no regulares se llaman matrices singulares; ellas son, pues, matrices no
inversibles.
Propiedades
1. Sean A y B ∈ Mn(K), si A y B son matrices regulares, entonces AB es una matriz regular y se
verifica que (AB)-1 = B-1A-1.
2. Si A es una matriz regular, si, y sólo si, es simplificable para el producto.
El conjunto de las matrices regulares de orden n constituyen un grupo multiplicativo de matrices, al

que se denota por GLn(K).
EQUIVALENCIA, SEMEJANZA Y CONGRUENCIA DE MATRICES
Expresión matricial de una aplicación lineal
Las ecuaciones de una aplicación lineal, vistas anteriormente, se pueden ahora escribir en notación
matricial de la forma:
y1 a 11 a 12 $$$ a 1n x1
y2 a 21 a 22 $$$ a 2n x2
= ,
$$$ $$$ $$$ $$$ $$$ $$$
ym a m1 a m2 $$$ a mn xn
o de forma abreviada Y = AX, siendo A = (aij) fl Mmµn(K).
Expresión matricial de un cambio de base
Las ecuaciones del cambio de base, vistas anteriormente, se pueden ahora escribir en notación matricial
de la forma:
x1 a 11 a 12 $$$ a 1n x ,1
x2 a 21 a 22 $$$ a 2n x ,2
= ,
$$$ $$$ $$$ $$$ $$$ $$$
xn a n1 a n2 $$$ a nn x ,n
o de forma abreviada X = CX', siendo A = (aij) ∈ GLn(K).
Equivalencia de matrices
Definición. Sean A = (aij), B = (bij) ∈ Mm×n(K), se dice que A y B son matrices equivalentes si existen
dos matrices, P ∈ GLn(K) y Q ∈ GLm(K), tales que B = Q-1AP.
Matrices asociadas, en distintas bases a una misma aplicación lineal.
Sea f: V → W una aplicación lineal, del e.v. V de dimensión n en el e.v. W de dimensión m, ambos
sobre el mismo cuerpo K. Sea BV = {v1, v2, ..., vn} una base de V y BW = {w1, w2, ..., wm} una base de W;
sabemos que respecto de estas bases hay una, y sólo una, matriz A = (aij) ∈ Mm×n(K) asociada a la
aplicación lineal f, que permite escribir la ecuación de f, en dichas bases de la forma Y = AX.
Supóngase que en V tomamos otra base B'V = {v'1, v'2, ..., v'n}, y que en W también se elige una nueva
base B'W = {w'1, w'2, ..., w'm}; respecto de estas bases, la aplicación f tiene asociada una nueva matriz
B = (bij) ∈ Mm×n(K), la cual proporciona la ecuación de f, en las nuevas bases, es decir, Y' = BX'. Sabemos
que a los cambios de base en V y W están determinados, por dos matrices P ∈ GLn(K) y Q ∈ GLm(K),
que son las que permiten expresar los cambios de coordenadas de la siguiente forma:
X = PX' e Y = QY'
En estas condiciones, como Y = AX, será QY' = A(PX') y, por tanto, Y' = (Q-1AP)X' de donde se
deduce que B = Q-1AP, es decir, A y B son equivalentes.
Semejanza de matrices
La semejanza de matrices puede ser considerada como un caso particular de la equivalencia. Así como
la equivalencia se definía entre matrices rectangulares cualesquiera, pero ambas de igual tamaño, la
semejanza sólo se define entre matrices cuadradas del mismo tamaño.
Definición. Sean A = (aij), B = (bij) ∈ Mn(K), se dice que A y B son matrices semejantes si existe una
matriz, P ∈ GLn(K), tal que B = P-1AP.
Matrices asociadas, al cambiar de base, en una misma transformación lineal.
Sea V un espacio vectorial de dimensión n, sobre el cuerpo K y sea f: V → V un endomorfismo, que

transforma todo vector x de V en otro y = f(x). Sea {v1, v2, ..., vn} una base de V, sabemos que respecto de
esta base hay una, y sólo una, matriz A = (aij) ∈ Mn(K) asociada a la aplicación f; esta matriz proporciona
la ecuación de f, respecto de dicha base, de la forma Y = AX, siendo X e Y las matrices columnas de las
coordenadas de x e y, respectivamente. Supóngase que en V tomamos otra base {v'1, v'2, ..., v'n}, respecto
de ella, la matriz asociada a f será una nueva matriz B = (bij) ∈ Mn(K), la cual proporciona la ecuación de
f, en esta base, en la forma Y' = BX'. Sabemos que el cambio de base en V están determinado, por la
matriz P ∈ GLn(K), que permiten expresar los cambios de coordenadas de la siguiente forma:
X = PX' e Y = PY'
En estas condiciones, como Y = AX, será
PY' = A(PX')
y, por tanto,
Y' = (P-1AP)X'
de donde se deduce que B = P-1AP, es decir, A y B son semejantes y es P la matriz que transforma A en B.
Propiedades
Para la semejanza entre matrices de Mn(K), se verifica que:

1. P-1(A1 + A2)P = P-1A1P + P-1A2P.
2. P-1(kA)P = k(P-1AP).
3. P-1(A1 A2)P = (P-1A1P)(P-1A2P).
4. P-1IP = I.
5. P-1(A-1)P = (P-1AP)-1.
Trasposición de matrices
Definición. Sea A = (aij) ∈ Mm×n(K), se llama traspuesta de A, y se representa por At, a la matriz que
se obtiene de cambiar filas por columnas, es decir At = (aji) ∈ Mn×m(K).
Propiedades
1. (At)t = A.
2. (A + B)t = At + Bt.
3. (kA)t = kAt .
4. (AB)t = BtAt .
5. Si A es una matriz regular, ⇒ (A-1)t = (At )-1.
6. Si dos matrices son equivalentes, también lo son sus traspuestas.
7. Si dos matrices cuadradas son semejantes, también lo son sus traspuestas.
Matrices simétricas y antisimétricas
Definición. Sea A = (aij) ∈ Mn(K), decimos que A es simétrica cuando A = At.
Definición. Sea A = (aij) ∈ Mn(K), decimos que A es antisimétrica cuando A = -At.
Definición. Sea A = (aij) ∈ Mn(K), decimos que A es hermitiana cuando A = A t .
Definición. Sea A = (aij) ∈ Mn(K), decimos que A es hemi-hermitiana cuando A = -A t .
Ejercicios
1. Demostrar las propiedades 6) y 7).
2. Demostrar que toda matriz cuadrada, puede descomponerse en suma de una matriz simétrica y otra
antisimétrica.
Congruencia de matrices
Definición. Sean A = (aij), B = (bij) ∈ Mn(K), se dice que A y B son matrices congruentes si existe
una matriz, P ∈ GLn(K), tal que B = PtAP.
Si A = (aij) ∈ Mn(K) es una matriz simétrica, también son simétricas todas las matrices congruentes con
ella; es decir, si A = At, entonces B = PtAP también satisface que Bt = B, ya que
Bt = (PtAP)t = PtAtP = PtAP = B.

Rango de una matriz
Rango de filas y rango de columnas de una matriz
Definición. Sea A = (aij) ∈ Mm×n(K), para ella se define:

1. Rango de filas de la matriz A es el rango del conjunto de vectores fila de la matriz; dicho de otra
forma, el rango de filas de A es el mayor número de vectores fila de A que son independientes.
2. Rango de columnas de la matriz A es el rango del conjunto de vectores columna de la matriz;
dicho de otra forma, el rango de columnas de A es el mayor número de vectores columna de A que
son independientes.
Teorema. Sea Α = (aij) ∈ Mm×n(K). El rango de filas de A = El rango de columnas de A.
Definición. Sea Α = (aij) ∈ Mm×n(K); se llama rango de una matriz A, al rango de filas o al rango de
columnas de la misma, ya que ambos son iguales, y se representa por rang A.
Consecuencia inmediata de esta definición es que el rango de una matriz es el mismo que el de su
matriz traspuesta, es decir, que:
rang A = rang At
Rango y matrices regulares
Teorema.- Una matriz cuadrada de tamaño n es regular si, y sólo si, su rango es n.
Consecuencia.- Una matriz cuadrada es regular si, y sólo si, sus vectores columna son independientes;
igualmente ocurre con su vectores fila.
Operaciones elementales en una matriz. Cálculo del rango
Es evidente que si, en un conjunto de vectores {v1, v2, ..., vp} de un espacio vectorial, se realiza
cualquiera de las manipulaciones siguientes:
1. permutar entre sí los vectores del conjunto,
2. sustituir el vector vi por el vi + λvj (λ escalar),
3. multiplicar vi por λ ≠ 0,
se obtiene un nuevo conjunto equivalente al dado, es decir, un conjunto con igual rango.
Las anteriores manipulaciones, aplicadas al conjunto de vectores fila o al conjunto de vectores columna
de una matriz, reciben el nombre de operaciones elementales para la matriz dada.
Por consiguiente, al aplicar a una matriz operaciones elementales, se obtiene una nueva matriz de igual
rango que la dada. Este hecho se puede utilizar, entre otras cosas, para localizar el rango de una matriz y
para hallar la matriz inversa de una matriz regular.
Cálculo del rango de una matriz, mediante operaciones elementales
Ejemplo.- Para calcular el rango de la matriz
1 −3 2 1 5
−1 5 1 2 −3
A=
2 2 −3 4 −6
−4 6 2 −3 −2
se puede proceder, aplicando operaciones elementales a sus filas, del siguiente modo:
En A, se sustituyen: F2 por F2 + F1; F3 por F3 - 2F1; y F4 por F4 + 4F1, obteniendo la matriz equivalente a
la matriz dada A:
1 −3 2 1 5
0 2 3 3 2
0 8 −7 2 −16
0 −6 10 1 18
En la matriz así obtenida se sustituyen: F3 por F3 - 4F2; F4 por F4 + 3F2, obteniendo la matriz equivalente
a la matriz dada A:
1 −3 2 1 5
0 2 3 3 2
0 0 −19 −10 −24
0 0 19 10 24
En la matriz así obtenida, se sustituye la F4 por F4 + F3, obteniendo la matriz equivalente a la matriz
dada A:
1 −3 2 1 5
0 2 3 3 2
0 0 −19 −10 −24
0 0 0 0 0
y como quiera que el rango de esta última es tres, resulta que el rang A = 3.
Cálculo de matrices inversas mediante operaciones elementales
Ejemplo. Hállese la matriz inversa de
2 −1 −3 5
3 2 −1 1
A=
−2 2 4 −3
1 4 1 −2
utilizando las operaciones elementales:
Se comenzará escribiendo la matriz (A I), es decir,
2 −1 −3 5 1 0 0 0
3 2 −1 1 0 1 0 0
−2 2 4 −3 0 0 1 0
1 4 1 −2 0 0 0 1
si, en las filas de esta matriz, se realizan las operaciones elementales consistentes en sustituir: F2 por 2F2 -
3F1; F3 por F3 + F2; y F4 por 2F4 - F1, se llega a:
2 −1 −3 5 1 0 0 0
0 7 7 −13 −3 2 0 0
0 1 1 2 1 0 1 0
0 9 5 −9 −1 0 0 2
si, en las filas de esta matriz, se realizan las operaciones elementales consistentes en sustituir: F2 por F2 -
7F3; y F4 por F4 - 9F3, se llega a:
2 −1 −3 5 1 0 0 0
0 0 0 −27 −10 2 −7 0
0 1 1 2 1 0 1 0
0 0 −4 −27 −10 0 −9 2
si, en las filas de esta matriz, se realizan las operaciones elementales consistentes en permutar F2 con F3 y
después F4 con F3, se llega a:
2 −1 −3 5 1 0 0 0
0 1 1 2 1 0 1 0
0 0 −4 −27 −10 0 −9 2
0 0 0 −27 −10 2 −7 0
si, en las filas de esta matriz, se realizan las operaciones elementales consistentes sustituir: F1 por F1 + F2;
F2 por 4F2 + F3; y F3 por F3 - F4, se llega a:
2 0 −2 7 2 0 1 0
0 4 0 −19 −6 0 −5 2
0 0 −4 0 0 −2 −2 2
0 0 0 −27 −10 2 −7 0
si, en las filas de esta matriz, se realizan las operaciones elementales consistentes en sustituir: F1 por 2F1 -
F3: y F2 por 27F2 - 19F4, se llega a:
4 0 0 14 4 2 4 −2
0 108 0 0 28 −38 −2 54
0 0 4 0 0 2 2 −2
0 0 0 −27 −10 2 −7 0
si, en las filas de esta matriz, se realiza la operación elemental consistente en sustituir: F1 por 27F1 + 14F4, se
llega a:
54 0 0 0 −16 41 5 −27
0 108 0 0 28 −38 −2 54
0 0 4 0 0 2 2 −2
0 0 0 −27 −10 2 −7 0
si, en las filas de esta matriz, se realizan las operaciones elementales consistentes en multiplicar la F1 por
1/54, multiplicar la F2 por 1/108, multiplicar la F3 por 1/4 y multiplicar la F4 por -1/27, se llega finalmente
a:
− 8 41 5 −1
1 0 0 0 27 54 54 2
7 − 19 − 1 1
0 1 0 0 27 54 54 2
0 0 1 0 0 1 1 −1
2 2 2
0 0 0 1 10 − 2 7 0
27 27 27
por tanto, la matriz inversa de la matriz dada A es la constituida por las cuatro últimas columnas de esta
última matriz.
1. Calcular las potencias sucesivas de

1 0 ... 0 0
0 1 ... 0 0
0 0 ... 0 0
.. .. ... ... .. ..
0 0 0 ... 1
0 0 0 ... 0
2. Si es A ∈ Mp(R) la matriz:
0 1 0 ... 0 0
0 0 1 ... 0 0
0 0 0 ... 0 0
.. .. ... ... .. ..
0 0 0 ... 0 1
0 0 0 ... 0 0
2 n
Calcúlese I + A + A + ... + A + ...
1! 2! n!
3. Se llama traza de una matriz A ∈ Mn(R) a la suma de los elementos de la diagonal principal.
Pruébese que:
a) Si A, B ∈ Mn(R), se verifica que:
traza(λA) = λ⋅traza(A), ∀ λ ∈ K.
traza(A + B) = traza(A) + traza(B),
traza(A⋅B) = traza(B⋅A).
b) Si A, B ∈ Mn(R) son matrices semejantes, entonces tienen sus trazas iguales.
4. Si A y B son dos matrices simétricas del mismo tamaño, pruébese que AB es simétrica si, y sólo si,
A y B conmutan.
5. Sea f el endomorfismo de R3 dado por:

f(1, 0 ,0) = (2, 1, 2).
Kerf = {(x, y, z) / x = z, y = 0}.
(0, 1, 0) es imagen de un vector de R3.
f(1, 1, 0) = (1, a, a).
Hallar la matriz asociada a f respecto de la base {(1, 1, 1), (0, 1, 1), (0, 0, 1)}.
DETERMINANTES
Permutaciones
Definición. Se llama permutación para un conjunto finito A = {1, 2, ..., p} a toda aplicación biyectiva
σ: A → A. Si σ es la permutación de A que transforma 1 en h, 2 en k, ..., p en 1, se la representará
escribiendo:
1 2 $$$ p
= ,
h k $$$ 1
en donde, debajo de cada elemento i de A se escribe su imagen σ(i). En ocasiones, para abreviar la
notación, a la imagen σ(i) se la denotará por σi. Dado un conjunto de p elementos, el número de
permutaciones que se pueden establecer en él es, evidentemente p!.
El conjunto de las p! permutaciones de un conjunto de p elementos se designará por S(p).
Definición. Se llaman transposiciones para un conjunto finito A = {1, 2, ..., p} a las permutaciones
que sólo cambian un par de elementos entre sí. La permutación τ: A → A es, pues, una transposición si
existen i, j ∈ {1, 2,..., p} tales que τ(i) = j, τ(j) = i y, ∀ h ≠ i, j, τ(h) = h; es decir es de la forma:
1 2 $$$ i $$$ j $$$ p

!= ,
1 2 $$$ j $$$ i $$$ p
p(p − 1 )
El número de transposiciones para un conjunto de p elementos es, (combinaciones de p
2
elementos tomados de dos en dos).
Grupos de permutaciones. Dado un conjunto A de p elementos, para el conjunto,
S(p) = {σ: A → A | σ es biyección},
de las p! permutaciones sobre A, la composición de aplicaciones es una operación interna, pues la

composición de biyecciones es también una aplicación biyectiva. Esta ley de composición interna (—)
recibe el nombre de producto de permutaciones. La estructura algebraica (S(p); —) es un grupo.
Teorema. Toda permutación puede ser expresada como producto de transposiciones.
Definición. Una permutación σ: A → A del conjunto de p elementos A = {1, 2, ..., p}, proporciona,
para los elementos de A, la nueva ordenación σ(1), σ(2), ..., σ(p). Se dice que los elementos σ(i) y σ(j)
forman una inversión si, en la nueva ordenación, tienen distinta posición relativa que la que tenían
inicialmente; es decir, suponiendo que i < j, formarán inversión si σ(j) ocupa un lugar anterior, en la
nueva ordenación, que σ(i). Se representará por I(σ) al número total de inversiones que presenten entre sí
los elementos de la permutación σ(1), σ(2), ..., σ(p); se dice que σ es de clase par si I(σ) es par, y que es
de clase impar cuando I(σ) sea impar.
Definición. Se llama signatura de una permutación σ: A → A, al número real ε(σ) = (-1)I(σ), donde
I(σ) es el número de inversiones de σ; la signatura de σ es, pues, igual a 1 si σ es de clase par, e igual a -1
si σ es de clase impar.
Teorema. Si en una permutación se efectúa una transposición, la permutación cambia de clase.

Determinante de una matriz cuadrada
Definición. Sea A = (aij) ∈ Mn(K), se llama determinante de A, y se representa por det(A), a:
det(A) = ( )a 1,(1 ) a 2,(2 ) , ..., a n,(n ) = ( )a (1 ),1 a (2 ),2 , ..., a (n ),n ,
cS(n ) cS(n )
donde la suma se extiende a las n! permutaciones de {1, 2, ..., n} y ε(ν) y ε(σ) denotan las signaturas de
las permutaciones ν y σ, respectivamente.
Por tanto podemos decir que, det(A) es la suma de todos los productos de la forma:
± a1ia2j ... ank (respectivamente, ± ai1aj2 ... akn)

tales que:
1. En cada sumando (producto de n elementos) figura un, y sólo un, elemento de cada fila de A, así
como un único elemento de cada una de sus columnas.
2. Cualquiera de los productos de n elementos de la matriz en los que hay un sólo elemento de cada
una de sus filas y un sólo elemento de cada una de sus columnas, es uno de los sumandos que
forman parte de la expresión del determinante de la matriz.
3. Cada sumando va afectado del signo más o menos, según que sea par o impar, respectivamente, la
permutación de los segundos subíndices (respectivamente, primeros subíndices) de los n factores
que constituyen el sumando.
4. Aun cuando es consecuencia de lo anterior, hay que hacer notar que el número de dichos sumandos
es n!, es decir, igual al número de permutaciones de {1, 2, ..., n}.
Notación. Dada la matriz
a 11 a 12 $$$ a 1n
a 21 a 22 $$$ a 2n
A= = (a ij ) c M n (K ) ,
$$$$ $$$$ $$$ $$$$$
a n1 a n2 $$$ a nn
a su determinante se lo representa por:
a 11 a 12 $$$ a 1n
a 21 a 22 $$$ a 2n
det(A) = ,
$$$$ $$$$ $$$ $$$$$
a n1 a n2 $$$ a nn
También suele usarse para representar el determinante de A, la notación |A|.
Ejemplos (determinantes de las matrices de orden 2 y orden 3).
Para obtener el determinante de la matriz
a 11 a 12
A=
a 21 a 22
el cual constará de 2! = 2 sumandos, como las permutaciones de {1, 2} son (1, 2), de clase par y (2,1), de
clase impar, se obtendrá:
det(A) = a11a22 - a12a21.
Para la matriz
a 11 a 12 a 13
A= a 21 a 22 a 23
a 31 a 32 a 33
det(A) será la suma algebraica de 3! = 6 sumandos. Como las permutaciones de {1, 2, 3} son (1,2,3), de
clase par; (1,3,2) de clase impar; (2,1,3), de clase impar; (2,3,1), de clase par; (3,1,2), de clase par, y
(3,2,1), de clase impar, será:
det(A) = a11a22a33 + a12a23a31 + a13a21a32 - a13a22a31 - a11a23a32 - a12a21a33
(los tres sumandos positivos se obtienen de la diagonal principal y sus paralelas; los tres sumandos
negativos, de la diagonal secundaria y sus paralelas: regla de Sarrus).
Consecuencia. Consecuencia inmediata de la definición es que el determinante de una matriz unidad,

cualquiera que sea su tamaño, es la unidad:
det(I) = 1
Ejercicios. Demuéstrese que el determinante de una matriz triangular es el producto de los elementos
de su diagonal principal.
Propiedades de los determinantes
Sea A = (aij) ∈ Mn(K), designando, por Aj al vector columna que ocupa el lugar j de la matriz A,
escribiremos:
det(A) = det(A1, A2, ..., An)
1. det(A) = det(At). (Todo lo que se diga para columnas, se verifica pues para filas)
2. det(A1, A2, ..., Ai, ..., Aj, ..., An) = - det(A1, A2, ..., Aj, ..., Ai, ..., An).
3. det(A1, A2, ..., Ai + Bi, ..., An) = det(A1, A2, ..., Ai , ..., An) + det(A1, A2, ..., Bi, ..., An).
4. det(A1, A2, ...,λAi, ..., An) = λdet(A1, A2, ..., Ai, ..., An).
5. det(A1, A2, ..., Ai, ..., An) = 0 ⇔ A1, A2, ..., Ai, ..., An son dependientes.
6. det(A1, A2, ..., Ai, ..., An) = det(A1, ..., Ai + λ1A1 + ... + λi-1Ai-1 + λi+1 Ai+1 + ... + λnAn, ..., An).
Como consecuencias de estas propiedades obtenemos:
Consecuencia 1ª. El determinante de una matriz antisimétrica, de orden "n", cuando "n" es impar es
nulo (si la característica del cuerpo es distinta de dos).
En efecto, si A es una matriz antisimétrica, se verifica que At = - A; ⇒ como det(A) = det(At), se tiene
que det(A) = det(At) = det(-A) = (-1)ndet(A) = - det(A) (por n impar) ⇒ 2det(A) = 0, y como la
característica del cuerpo K no es dos, se tiene que det(A) = 0.
Consecuencia 2ª. (Determinante de Vandermonde) Se llaman con este nombre a los determinantes de la
forma:
1 1 1 $$$ 1
x1 x2 x3 $$$ xn
D n = x 21 x 22 x 23 $$$ x 2n
$$$$ $$$$ $$$$ $$$ $$$$
x n−1
1 x n−1
2 x n−1
3 $$$ x n−1
n
Para resolver este determinante, procederemos de la siguiente forma: Fk - xnFk-1, con k = n, ..., 2, y
aplicando la propiedad d) obtenemos:
1 1 1 $$$ 1 1 1 1 $$$ 1
x1 x2 x3 $$$ xn x1 x2 x3 $$$ x n−1
D n = x 21 x 22 x 23 $$$ x 2n = (x n − x 1 ) $ $(x n − x n−1 ) x 21 x 22 x 23 $$$ x 2n−1
$$$$ $$$$ $$$$ $$$ $$$$ $$$$ $$$$ $$$$ $$$ $$$$
x n−1
1 x n−1
2 x n−1
3 $$$ x n−1
n x n−2
1 x n−2
2 x n−2
3 $$$ x n−2
n−1
y repitiendo el proceso anterior, obtenemos:
Dn = (xn - x1)(xn - x2)⋅⋅⋅(xn - xn-1)(xn-1 - x1)⋅⋅⋅(xn-1 - xn-2)⋅⋅⋅(x3 - x1)(x3 - x2)(x2 - x1),
de donde se desprende que un determinante de Vandermonde sólo puede ser nulo en el caso de tener dos
de sus columnas iguales.
Cálculo de determinantes, aplicando las propiedades
Descripción del método. Supóngase que queremos determinar el valor del determinante de una matriz
A = (aij) ∈ Mn(K); entonces, se puede proceder de la siguiente forma:
1. Si ai1 = 0 ∀ i = 1, 2, ..., n ⇒ det(A) = 0. Si ∃ ai1 ≠ 0 con i ∈ {1, 2, ..., n}, e i ≠ 1 intercambiamos
entre si la primera fila con la fila "i", obteniendo una matriz A(1) = (aij(1)) tal que
det(A(1)) = - det(A).
En la matriz A(1) así obtenida, hacemos: Fk - (ak1(1)/a11(1))F1 ∀ k = 2, ..., n; con ello se obtiene otra
matriz A(2) = (aij(2)) tal que a11(2) ≠ 0 ai1(2) = 0 ∀ i = 2, ..., n, y det(A(2)) = det(A(1)).
2. Si ai2(2) = 0 ∀ i = 2, ..., n ⇒ det(A(2)) = 0 (ya que las dos primeras columnas serian proporcionales).
Si ∃ ai2(2) ≠ 0 con i ∈ {2, ..., n}, e i ≠ 2 intercambiamos entre si la segunda fila con la fila "i",
obteniendo una matriz A(3) = (aij(3)) tal que
det(A(3)) = - det(A(2)).
En la matriz A(3) así obtenida, hacemos: Fk - (ak2(3)/a22(3))F2 ∀ k = 3, ..., n; con ello se obtiene otra
matriz A(4) = (aij(4)) tal que a22(4) ≠ 0 ai2(4) = 0 ∀ i = 3, ..., n, y det(A(4)) = det(A(3)).
3. Siguiendo este proceso se llega a una matriz triangular superior cuyo determinante es el producto
de los elementos de su diagonal principal.
Evidentemente, el proceso que se acaba de describir admite multitud de variantes. Obsérvese, a este
respecto, que la elección de unas u otras líneas, para, mediante los pasos sucesivos, conseguir matrices
que cada vez tengan mayor número de elementos nulos, es totalmente arbitrario; no se han de elegir
forzosamente las 1ª, 2ª, ..., nª columnas, sino que se tomarán aquellas para las que, en cada caso concreto,
se espere que el proceso vaya a resultar lo mas breve posible. Nótese también que, para conseguir que se
transforme en cero un elemento aij, i > j, a la fila del lugar "i" se le ha restado la de lugar "j" multiplicada
por aij/ajj; en muchas ocasiones, sin embargo, es preferible operar de este modo: multiplicar la fila de lugar
"i" por ajj, con lo que el determinante queda multiplicado por dicho elemento, y a continuación restarle la
fila de lugar j multiplicada por aij. Estas y otras modificaciones, utilizadas con acierto, pueden reducir el
proceso de cálculo que se acaba de describir.
Determinante de la matriz producto de otras dos
Teorema. Sean A = (aij) y B = (bij) ∈ Mn(K), ⇒ det(A⋅B) = det(A)⋅det(B).
Desarrollo de un determinante por menores complementarios
Definición. Sea A = (aij) ∈ Mn(K), se llama menor del elemento aij de la matriz A, al determinante de
la submatriz cuadrada de A; que resulta de eliminar la fila i y la columna j de la matriz A, es decir:
a 11 ... a 1(j−1 ) a 1(j+1 ) ... a 1n
........ ... ............ ............. ... .........
a (i−1 )1 ... a (i−1 )(j−1 ) a (i−1 )(j+1 ) ... a (i−1 )1
ij =
a (i+1 )1 ... a (i+1 )(j−1 ) a (i+1 )(j+1 ) ... a (i+1 )1
........ ... ............. ............. ... .........
a n1 ... a n(j−1 ) a n(j+1 ) ... a nn
En general, dada A ∈ Mm×n(K), llamaremos menor de orden p, al determinante formado por la

intersección de p filas y p columas de la matriz A.
Definición. Sea A = (aij) ∈ Mn(K), se llama cofactor del elemento aij de la matriz A, al menor del
elemento aij multiplicado por (-1)i+j, es decir:
Aij = (-1)i+jαij
Teorema (Desarrollo de Laplace). Sea A = (aij) ∈ Mn(K);
det(A ) = a 1i A 1i + a 2i A 2i + $ $ $ + a ni A ni = a i1 A i1 + a i2 A i2 + $ $ $ + a in A in,
Propiedad. Sea A = (aij) ∈ Mn(K). La suma de los productos de los elementos de una línea (fila o
columna) por los cofactores de una paralela es cero; es decir:
a 1i A 1j + a 2i A 2j + $ $ $ + a ni A nj = 0, si i ! j,
a i1 A j1 + a i2 A j2 + $ $ $ + a in A jn = 0, si i ! j.
Matriz inversa de una matriz regular
Definición. Sea A = (aij) ∈ Mn(K). Se llama matriz cofactor de la matriz A, a la matriz:
(A ij ) c M n (K )
donde Aij es el adjunto del elementos aij.

Teorema. Sea A = (aij) ∈ Mn(K). A es una matriz regular (o inversible) ⇔ det(A) ≠ 0.
Demostración. ⇒) Supongamos que A es regular, ⇒ ∃ A-1 tal que AA-1 = I y, ⇒
det(A)⋅det(A-1) = 1;
por tanto det(A) ≠ 0.
⇐) Supongamos que det(A) ≠ 0 ⇒ ∃ B = 1 (A ) t , y como A⋅B = B⋅A = I, entonces B es la

ij
det(A )
inversa de A, es decir A-1 = B.
Teorema. Sean A, B ∈ Mn(K), dos matrices semejantes, ⇒ det(A) = det(B).
La demostración es trivial y se deja como ejercicio al alumno.
Teorema. Sea A ∈ Mm×n(K). Si A tiene un menor de orden p, no nulo, entonces las p columnas (filas)
que determinan tal menor son independientes.
Teorema. El rango de una matriz A ∈ Mm×n(K) es el mayor de los órdenes de sus menores no nulos.
Cálculo práctico del rango de una matriz recurriendo a sus menores. Sea A ∈ Mm×n(K). Veamos
como se determina el rango de A.
1. Si A no es la matriz nula, su rango es mayor o igual que 1.
2. Para determinar si tiene rango mayor o igual que 2, se busca un menor de orden 2 distinto de cero.
Si todos los menores de orden 2 son cero, entonces el rango de la matriz A es 1. Si existe un menor
de orden 2 distinto de cero, el rango de la matriz A es mayor o igual que 2.
3. Para determinar si tiene rango mayor o igual que 3, partiendo del menor de orden 2 distinto de cero,
se estudian todos los posibles menores de orden 3 que lo contengan. Si todos ellos son nulos, el
rango de A es 2. Si, por el contrario, alguno de ellos es distinto de cero, el rango de A es mayor o
igual que 3.
4. El proceso se repite de forma análoga, hasta obtener el rango de la matriz.

1. Sea una matriz regular A ∈ Mn(K) tal que sus elementos son números enteros. Pruébese que A-1
tiene todos sus elementos enteros si, y sólo si, det(A) = ± 1.
2. Sea A = (aij) ∈ Mn(K) una matriz que tiene nulos más de n2 - n de sus elementos; pruébese que
det(A) = 0.
3. Calcúlense los determinantes de las siguientes matrices de Mn(R):

0 1 1 $$$ 1 1 1 1 $$$ 1
1 0 1 $$$ 1 −1 0 1 $$$ 1
1 1 0 $$$ 1 −1 −1 0 $$$ 1
$$$ $$$ $$$ $$$ $$$ $$$ $$$ $$$ $$$ $$$
1 1 1 $$$ 0 −1 −1 −1 $$$ 0
4. Hállese el determinante de la siguiente matriz de Mn(R):

−1 a a $$$ a
a −1 a $$$ a
a a −1 $$$ a
$$$ $$$ $$$ $$$ $$$
a a a $$$ −1
5. Calcúlese el determinante:
12 22 32 $$$ n2
22 32 42 $$$ (n + 1 ) 2
32 42 52 $$$ (n + 2 ) 2
$$$ $$$ $$$ $$$ $$$
n n+1 n + 2) (2n − 1 ) 2
2 ( 2 2
) ( $$$
6. Calcúlese el determinante:
1 1 1 $$$ 1
1 1+a 1 $$$ 1
1 1 1+a $$$ 1
$$$ $$$ $$$ $$$ $$$
1 1 1 $$$ 1+a
ENDOMORFISMOS O MATRICES DIAGONALIZABLES
Valores y vectores propios de un endomorfismo o de una matriz
Sean V un espacio vectorial sobre el cuerpo K, f: V → V un endomorfismo de V, y A ∈ Mn(K).
Definición. Se dice que λ ∈ K es un autovalor o valor propio de f o de A, si existe un vector no nulo

x de V, o una matriz columna, no nula, X ∈ Mn×1(K), tal que f(x) = λx, o AX = λX. Al vector x, o a la
matriz X, se le llama vector propio o autovector de f o de A asociado al autovalor λ.
Definición. Se llama espectro de f o de A, al conjunto:
σ(f o A) = {λ ∈ K | λ es autovalor de f o de A}
Observación. No todos los endomorfismos o matrices poseen autovalores, como pone de manifiesto el
siguiente ejemplo:
Sea f: R2 → R2, definido por f(x, y) = (y, -x). La ecuación f(x, y) = λ(x, y), ⇒ x = - λy, e y = λx, de las
cuales se deduce que para que λ sea autovalor de f ha de satisfacerse que λ2 = -1, ecuación que no tiene
solución en el cuerpo R y, por tanto, f no tiene ningún autovalor.
Propiedades.
1. Sea λ ∈ σ(f o de A) ⇒ Vλ = {x ∈ V | f(x) = λx} o Vλ = {X ∈ Mn×1(K) | AX = λX} es un subespacio
vectorial de V o de Mn×1(K), y se denomina subespacio propio correspondiente a λ (en Vλ están los
vectores propios asociados a λ y el vector nulo).
2. Sean λ1 y λ2 ∈ σ(f o de A), con λ1 ≠ λ2 ⇒ V 1 3 V 2 = O.
3. Sean λ1, λ2, ..., λr ∈ σ(f o de A), con λi ≠ λj si i ≠ j, y sean xi o Xi ∈ V i − o , ∀ i = 1, 2, ..., r ⇒
{x1, x2, ..., xr} o {X1, X2, ..., Xr} es un conjunto de vectores independientes.
Ecuación característica de un endomorfismo o de una matriz
Sean V un espacio vectorial de dimensión finita, n, sobre un cuerpo K, B = {e1, e2, ..., en} una base de V,
y A = (aij) ∈ Mn(K) la matriz asociada a f en la base B o una matriz de orden n cualquiera.
Los autovectores correspondientes al autovalor λ son, pues, aquellos vectores no nulos tales que la
matriz columna de sus coordenadas X ∈ Mn×1(K), verifican:
(A - λI)X = O,
es decir, constituyen una solución no nula del conjunto homogéneo de ecuaciones lineales:
(a 11 − )x 1 + a 12 x 2 + $ $ $ + a 1n x n = 0
a 21 x 1 + (a 22 − )x 2 + $ $ $ + a 2n x n = 0
$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$
a n1 x 1 + a n2 x 2 + $ $ $ + (a nn − )x n = 0
Para que exista solución no nula, ha de verificarse que |A - λI| = 0.
Definición. Se llama ecuación característica del endomorfismo f: V → V o de la matriz A, a la

ecuación:
|A - λI| = 0
o lo que es lo mismo
a 11 − a 12 $ $ $ a 1n
a 21 a 22 − $ $ $ a 2n
=0
$$$$$$$ $$$$$$$ $$$ $$$$$$
a n1 a n2 $ $ $ a nn −
Las soluciones de la ecuación característica son los autovalores del endomorfismo f o de la matriz A;
es decir, el espectro de f o de A es el conjunto de las soluciones de esta ecuación.
Definición. Se llama polinomio característico asociado al endomorfismo f o a la matriz A, a:
p(λ) = |A - λI|.
Desarrollando |A - λI|, obtenemos:
p(λ) = a0 + a1λ + a2λ2 + ... + an-1λn-1 + anλn,
donde:
a0 =|A|
n
ak = (-1)k[suma de los menores diagonales de orden n - k de la matriz A]
k
an-1 = (-1)n-1(a11 + a22 + ... + ann)
an = (-1)n.
Teorema. Sea p(λ) = |A - λI|, el polinomio característico del endomorfismo f o de la matriz A, y sea
q(λ) = |A' - λI|, el polinomio característico del endomorfismo f, donde A' es la matriz asociada a f en una
base B' = {e1', e2', ..., en'} de V o A' es una matriz semejante a A. Pues bien, se verifica que: p(λ) = q(λ).
Este resultado, permite decir que el polinomio característico del endomorfismo f depende única y
exclusivamente de f.
Nota. No obstante, conviene destacar que en general, del sólo hecho de tener dos matrices los mismos
autovalores y éstos de igual orden, no se infiere que dichas matrices sean semejantes.
Así, por ejemplo, las matrices cuadradas de orden dos:
1 0 1 1
A= y B=
0 1 0 1
tienen ambas por ecuación característica a (λ - 1)2 = 0, esto es, tienen un sólo autovalor, λ = 1, de orden
dos. Sin embargo, no son semejantes, pues, de serlo, existiría una matriz regular de tamaño dos:
a b
P= ,
c d
tal que B = P-1AP, esto es, PB = AP; ahora bien
a a+b a b
PB = y AP = ,
c c+d c d
luego, para que fuesen iguales, habría de ser a = 0 y c = 0, con lo cual P no sería regular.
Definición. Si λ0 es una raíz múltiple, de la ecuación característica de f o de A, con orden de

multiplicidad α, se dirá que λ0 es un autovalor de orden α del endomorfismo f o de la matriz A; si λ0 es
raíz simple de la ecuación característica de f o de A, se dirá que es un autovalor simple de f o de A.
Cuando el cuerpo K sea algebraicamente cerrado, y en particular si es K = C, como todo polinomio de

grado n > 0 se puede expresar entonces como producto de n polinomios de grado uno, para el polinomio
característico se tiene la factorización:
|A - λI| = (−1 ) ( − 1 ) 1 ( − 2 ) 2 ...( − r ) r , ∀ λ ∈ K,

n
(α1 + α2 + ... + αr = n),
donde λ1, λ2, ..., λr son todos los autovalores de f o de A, que son, respectivamente de órdenes α1, α2, ...,
αr. En este supuesto, de ser K algebraicamente cerrado, f o A, tienen al menos un autovalor y como
máximo tiene n; si cada autovalor se cuenta tantas veces como indica su orden de multiplicidad, se puede
afirmar que f o A tienen exactamente n autovalores.
Dimensión de los subespacios propios. Dado un endomorfismo f: V → V, siendo V un espacio

vectorial de dimensión finita n, o A ∈ Mn(K), para cada autovalor λ de f o de A, es decir, para cada raíz de
su ecuación característica, los vectores propios de f o de A correspondientes a λ, junto con el vector nulo,
constituyen el subespacio propio Vλ.
La dimensión del subespacio Vλ, esto es, el número máximo de vectores propios correspondientes a λ
que son independientes, será pues:
d = dimVλ = dim(Ker(A - λΙ)) = n - rang(A - λI).
donde I es la matriz unidad.
Invarianza, por semejanza, de las dimensiones de los subespacios propios. Si A y A' son matrices
semejantes, para cualquiera que sea su autovalor λ, los subespacios propios de una y otra matriz, que
serán distintos subespacios, son las expresiones en coordenadas, en distintas bases de Mn×1(K), del
subespacio propio del endomorfismo asociado a ambas matrices (en las referidas bases) correspondientes
al autovalor λ; como la dimensión de un subespacio no varía por el hecho de expresar éste en una u otra
base, los subespacios propios de A y A', correspondientes a λ, tienen igual dimensión, la del subespacio
propio, correspondiente a λ, del susodicho endomorfismo.
Número máximo de autovectores independientes
Teorema. Dado un endomorfismo f, en un espacio vectorial V de dimensión n sobre un cuerpo K o

dada una matriz A ∈ Mn(K), para cualquiera que sea el autovalor λ0 de f o de A, si α es su orden de
multiplicidad y d la dimensión del correspondiente subespacio propio, se verifica que:
1 ≤ d ≤ α.
Número máximo de vectores propios independientes. Sea dado un endomorfismo f, en un espacio

vectorial V de dimensión n sobre un cuerpo K, o bien, sea una matriz A ∈ Mn(K); se designan por λ1, λ2,
..., λr ∈ K sus autovalores, por α1, α2, ..., αr los órdenes de dichos autovalores y por d1, d2, ..., dr las
dimensiones de los subespacios propios respectivos,V 1 , V 2 , ..., V r . Puesto que, según se acaba de
probar, es 1 ≤ di ≤ αi, para i = 1, 2, ..., r y dado que subespacios propios correspondientes a autovalores
distintos tienen intersección nula, se pueden obtener las siguientes conclusiones:
1. El número máximo de vectores propios independientes es d1 + d2 + ... + dr, número éste que está
comprendido entre r y n.
2. Para que los vectores propios de f o de A engendren todo el espacio V o Mn×1(K), es decir, para
exista una base de él formada por autovectores, se precisa que d1 + d2 + ... + dr = n; en
consecuencia, habrá una tal base si: 1º) α1 + α2 + ... + αr = n, esto es, si la ecuación característica
tiene, si se cuenta cada una de sus raíces tantas veces como indica su orden de multiplicidad,
exactamente n raíces, y 2º) para todos y cada uno de los autovalores, la dimensión de su
subespacio propio ha de ser igual a su orden, esto es, αi = di, para i = 1, 2, ..., r.
3. Si K es cerrado (en particular si, K = C), como en tal caso es α1 + α2 + ... + αr = n, es condición
necesaria y suficiente para que V o Mn×1(K) admita una base formada por vectores propios de f o de
A, que αi = di, para i = 1, 2, ..., r; cuando así ocurra, en una tal base hay di vectores propios
correspondientes al autovalor λi, para i = 1, 2, ..., r.
4. Si f o A tienen n autovalores distintos, entonces hay en V o en Mn×1(K) una base formada por
autovectores.
Endomorfismos o matrices diagonalizables
Definición. Sea f: V → V un endomorfismo de V, siendo V un espacio vectorial de dimensión n sobre

un cuerpo K; decimos que f es un endomorfismo diagonalizable, si existe una base de V en la que la
matriz asociada a f sea una matriz diagonal.
Definición. Sea A ∈ Mn(K); decimos que A es diagonalizable (por semejanza), sí, y sólo sí, existe D
= (dijδij) ∈ Mn(K), y una matriz regular P ∈ GLn(K), tal que D = P-1AP.
Teorema. Una matriz D ∈ Mn(K) es diagonal ⇔ admite por vectores propios a las n matrices, de
Mn×1(K):
1 0 0
0 1 0
E1 = , E2 = , ..., E n =
$$ $$ $$
0 0 1
Además, el autovalor correspondiente al vector propio Ei, para i = 1, 2, ..., n, es el elemento de la

diagonal principal de D que ocupa el lugar (i, i); el orden de cada autovalor es el número de veces que él
figura repetido en la diagonal principal.
Teorema. A ∈ Mn(K) es diagonalizable (por semejanza) si, y sólo si, admite n vectores propios
independientes. Es decir: una matriz A ∈ Mn(K) es diagonalizable (por semejanza) si, y sólo si, se
verifican las dos condiciones siguientes:
1. La matriz A admite, si se cuenta cada uno un número de veces igual a su orden de multiplicidad,
exactamente n autovalores (pertenecientes a K). Cuando el cuerpo K es algebraicamente cerrado, y
en particular si es K = C, esta condición se satisface para toda matriz A ∈ Mn(K).
2. La multiplicidad de cada uno de los autovalores de A es igual a la dimensión del subespacio propio.
Consecuencia. Si una matriz A ∈ Mn(K) admite n autovalores distintos, entonces es diagonalizable (por
semejanza).
Observación. Sea f: V → V un endomorfismo, donde V es un espacio vectorial de dimensión finita n

sobre un cuerpo K, y sea A ∈ Mn(K) la matriz asociada a f en una cierta base {e1, e2,..., en} de V.
Diagonalizar el endomorfismo f se reduce a diagonalizar (por semejanza) la matriz A ∈ Mn(K).
Ejemplo. Diagonalizar si es posible, la matriz
1 0 0 0
1 −4 −1 6
A= c M 4 (C )
−1 3 2 −4
0 −2 0 3
Solución. 1º) Calculamos su ecuación característica, es decir
1− 0 0 0
1 −4 − −1 6
= 0,
−1 3 2 − −4
0 −2 0 3−
obteniendo: (λ - 1)(λ3 - λ2 + λ - 1) = 0.
2º) Calculamos los autovalores, es decir, las raíces de la ecuación característica; obteniendo:
λ1 = λ2 = 1, λ3 = i, λ4 = -i.
3º) Calculamos los subespacios propios de A, correspondientes a todos sus autovalores, es decir,
1 0
0 1
V1 = { X ∈ M4×1(C) / (A - 1I)X = O} = < , > ⇒ dimV1 = 2.
1 1
0 1
0
3−i
V3 = { X ∈ M4×1(C) / (A - iI)X = O} = < > ⇒ dimV3 = 1.
−1 + i
2
0
3+i
V4 = { X ∈ M4×1(C) / (A + iI)X = O} = < > ⇒ dimV4 = 1.
−1 − i
2
Como la matriz A posee 4 autovalores, si cada uno se cuenta tantas veces como indica su orden de
multiplicidad, y el orden de cada autovalor de A es igual a la dimensión del subespacio propio asociado,
entonces A es diagonalizable por semejanza (en C); es decir, se verifica que D = P-1AP, siendo
1 0 0 0 1 0 0 0
0 1 0 0 0 1 3−i 3+i
D= , yP=
0 0 i 0 1 1 −1 + i −1 − i
0 0 0 −i 0 1 2 2
Diagonalización de matrices reales simétricas
Teorema. Sea A una matriz simétrica, y sean λ1, y λ2 dos autovalores de A con λ1 ≠ λ2, entonces si X1
es un vector propio correspondiente a λ1 y X2 es un vector propio correspondiente a λ2, se verifica que
X2t⋅X1 = 0.
Teorema. Todos los autovalores de una matriz real y simétrica son números reales.
Teorema. Si A es una matriz real simétrica de orden n; entonces, A tiene un vector propio real.
Teorema. Toda matriz real simétrica es siempre diagonalizable.

1. Determínese, según valores de a, b ∈ R, los subespacios propios del endomorfismo f: R3 → R3 que,

respecto de la base canónica, tiene asociada la matriz:
a b 0
0 −1 0
0 0 1
Analícese en qué casos f es diagonalizable.
2. Estúdiese, según los valores reales de α, la diagonalizabilidad (por semejanza) de las matrices:
1 −2 −2 − 1 + −
A= 0 1 y B= 2 + − − 1
0 0 1 0 −1 0
Para los valores de α que las hacen diagonalizables, hállense sus formas diagonales D y una matriz
regular P tal que D = P-1AP y D = P-1BP, respectivamente.
3. De un f œ End(R3) se sabe que son vectores propios (1, 0, 0), (1, 1, 0), (0, 1, 0) y (0 ,0, 1).
Sabiendo, además que hay vectores de R3 que no son vectores propios, hállense todos los vectores
propios de f.
4. Sea f: R3 → R3 el endomorfismo que admite los autovalores λ1 = 1, λ2 = 2 y λ3 = -1 y que tiene por

vectores propios correspondientes a dichos autovalores a los (1, 1, 0), (0, 1, 2) y (1, 2, 1),
respectivamente. Obténgase la matriz asociada a f respecto de la base canónica de R3.
5. Sea f: R4 → R4 el endomorfismo definido por f(x, y, z, t) = (x, 2x, x, x + ay). Hállese a ∈ R para
que f sea diagonalizable, localizando, cuando lo sea, una base de R4 en la que f tenga su matriz
asociada diagonal.
6. Si f es un endomorfismo nilpotente, esto es, tal que f k = O, para cierto k ∈ N, pruébese que f
admite a cero como su único autovalor.
7. Sea A ∈ Mn(K) una matriz idempotente, esto es, tal que A2 = A, de rango r.
a) Pruébese que sus únicos autovalores son 0 y 1.
b)Pruébese que el subespacio propio Vλ = 0 tiene dimensión n - r y que Vλ = 1 tiene dimensión r;
dedúzcase de ello que A es diagonalizable y hállese su forma diagonal.
2 1 a
8. Dada la matriz A = 1 2 1 . Se pide:
1 1 1
a) Estudiar para que valores de "a", es diagonalizable la matriz A.
b) Hallar una matriz C tal que C-1AC sea una matriz diagonal y calcular dicha matriz diagonal.
c) Hallar para algún valor de "a", una matriz ortogonal P ∈ M3(R) tal que PtAP sea una matriz
diagonal.
ESPACIO VECTORIAL EUCLÍDEO
Producto interior (generalización del producto escalar)
Definición. Sea V un espacio vectorial real, se llama producto interior sobre V a toda aplicación
〈 , 〉 : V2 → R
(x, y) → 〈x, y〉
que verifica los axiomas:
1. 〈x, y〉 = 〈y, x〉, ∀ x, y ∈ V, (conmutatividad, o simetría)
2. 〈x, y + z〉 = 〈x, y〉 + 〈x, z〉, ∀ x, y, z ∈ V, (distributiva o linealidad)
3. 〈λx, y〉 = λ〈x, y〉, ∀ x, y ∈ V y ∀ λ ∈ R, (asociatividad, u homogeneidad)
4. 〈x, x〉 ≥ 0, ∀ x ∈ V, 〈x, x〉 = 0 ⇔ x = o. (positividad)
Definición. Se llama espacio real euclídeo al par (V, 〈 , 〉) donde V es un espacio vectorial real y 〈 , 〉
es un producto interior sobre V.
En un espacio vectorial complejo, un producto interior 〈x, y〉 es un número complejo que satisface los
mismos axiomas que los del producto interior real, excepto el de la simetría que se reemplaza por
…x, y = …y, x (simetría hermitiana).
Un espacio vectorial complejo, con un producto interior se llama espacio euclídeo complejo (a veces
se le llama espacio unitario).
Aunque nos interesan principalmente los espacios euclídeos reales, los teoremas son válidos para
espacios euclídeos complejos. Cuando decimos espacio euclídeo, sin más, entenderemos que puede ser
real o complejo.
Propiedades. De los axiomas del producto interior se deducen las siguientes propiedades:
1. 〈y + z, x〉 = 〈y, x〉 + 〈z, x〉, ∀ x, y, z ∈ V.
2. 〈x, λy〉 = 〈x, y〉, ∀ x, y ∈ V y ∀ λ ∈ K (R o C).
3. 〈x, o〉 = 0.
4. Si 〈x, y〉 = 0 ∀ y ∈ V, ⇒ x = o.
Ejemplo. En el espacio vectorial real C[a, b], mediante

b
〈f, g〉 = ¶ a f(x )g(x )dx
para cualesquiera f, g ∈ C[a, b], se define un producto interior.
Si U es un subespacio vectorial de un espacio vectorial euclídeo, es evidente que U también es un

espacio vectorial euclídeo.
Desigualdad de Schwarz. En un espacio euclídeo V, todo producto interior satisface:
|〈x, y〉|2 ≤ 〈x, x〉〈y, y〉 ∀ x, y ∈ V.

Norma
Definición. Sea V un espacio vectorial real (o complejo), se llama norma en V a toda aplicación:
|| ||: V → R
que satisface los siguientes axiomas:

1. ||x|| ≥ 0, ∀ x ∈ V; ||x|| = 0 ⇔ x = o.
2. ||λx|| = |λ|⋅||x||, ∀ λ ∈ K y ∀ x ∈ V.
3. ||x + y|| ≤ ||x|| + ||y||, ∀ x, y ∈ V.
Definición. Se llama espacio vectorial normado al par (V, || ||), donde V es un espacio vectorial real
(o complejo) y || || es una norma en V.
Definición. Sea x ∈ V; decimos que x es un vector unitario o normalizado si ||x|| = 1.
Teorema. Sea x ∈ V y x ≠ o, ⇒ x es un vector unitario.

æx æ
Teorema. Sea V = (V, 〈 , 〉) un espacio vectorial euclídeo; la aplicación definida de la forma:
æx æ = …x, x
es una norma en V.
A esta norma se le llama norma euclídea, y es la que emplearemos normalmente.
Definición. En un espacio euclídeo real V, el ángulo formado por dos vectores no nulos x e y se
define como el número θ del intervalo 0 ≤ θ ≤ π que satisface la ecuación:
…x, y
cos() =
æx æ $ æy æ
Métrica
Definición. Sea A un conjunto cualquiera, se llama métrica en A a toda aplicación

d: A × A → R
(x, y) → d(x, y)
que verifica los siguientes axiomas:

1. d(x, y) ≥ 0 ∀ x, y ∈ A. d(x, y) = 0 ⇔ x = y.
2. d(x, y) = d(y, x) ∀ x, y ∈ A.
3. d(x, y) ≤ d(x, z) + d(z, y) ∀ x, y, z ∈ A.
Definición. Al par (A, d), donde A es un conjunto cualquiera y d es una métrica, se le llama espacio
métrico.
Teorema (Métrica subordinada a una norma). Sea V un espacio vectorial normado, la aplicación:
d: V × V → R
(x, y) → d(x, y) = ||x - y||.
es una métrica en V.
Teorema. La métrica subordinada a una norma es invariante frente a traslaciones; es decir:
d(x + z, y + z) = d(x, y), ∀ x, y, z ∈ V.
Ortogonalidad
Definición. Sean x, y ∈ V (espacio vectorial euclídeo), decimos que x e y son ortogonales si
〈x, y〉 = 0
Observación. El vector o es el único vector de V que es ortogonal a todos los vectores de V.
Notación. Para denotar que x e y son ortogonales, escribiremos x ⊥ y.
Teorema (de Pitágoras). En un espacio vectorial euclídeo, x ⊥ y ⇔ ||x + y||2 = ||x||2 + ||y||2.
Demostración. ||x + y||2 = 〈x + y, x + y〉 = ||x||2 + 〈x, y〉 + …x, y + ||y||2 = ||x||2 + ||y||2.
Conjuntos ortogonales y ortonormales de vectores
Definición. Sea {v1, v2, ...., vk} ⊂ V (espacio vectorial euclídeo), decimos que:
{v1, v2, ...., vk} es ortogonal ⇔ 〈vi, vj〉 = 0, si i ≠ j. {v1, v2, ...., vk} es ortonormal ⇔ 〈vi, vj〉 = δij
Teorema. Sea {v1, v2, ...., vk} ⊂ V (espacio vectorial euclídeo) con vi ≠ o ∀ i = 1, 2, ..., k, un conjunto
ortogonal ⇒ {v1, v2, ...., vk} es un conjunto de vectores independientes.
Teorema. (Proceso de ortonormalización de Gram-Schmidt). Sea {v1, v2, ...., vk} ⊂ V (espacio
vectorial euclídeo) un conjunto vectores independientes ⇒ ∃ {w1, w2, ...., wk} ⊂ V conjunto ortonormal
tal que: 〈{v1, v2, ...., vk}〉 = 〈{w1, w2, ...., wk}〉
v1
Demostración. El vector w 1 = es unitario, y es tal que 〈{v1}〉 = 〈{w1}〉. Sea ahora el vector
æv 1 æ
v'2 = v2 - 〈v2, w1〉w1, que es no nulo y ortogonal a w1, ya que 〈v'2, w1〉 = 〈v2, w1〉 - 〈v2, w1〉 = 0;
v’ 2
entonces el vector w 2 = es unitario, y es tal que 〈{v1, v2}〉 = 〈{w1, w2}〉. Sea ahora el vector
æv’ 2 æ
v'3 = v3 - 〈v3, w1〉w1 - 〈v3, w2〉w2
que es no nulo y ortogonal a w1 y a w2 ya que
〈v'3, w1〉 = 〈v3, w1〉 - 〈v3, w1〉 = 0 y 〈v'3, w2〉 = 〈v3, w2〉 - 〈v3, w2〉 = 0
v’ 3
entonces el vector w 3 = es unitario, y el tal que 〈{v1, v2, v3}〉 = 〈{w1, w2, w3}〉. Siguiendo este
æv’ 3 æ
proceso, se llega a definir un vector
r−1
v'r = vr - 〈vr, wi〉wi
i=1
que es no nulo, pues vr no depende de {w1, w2, ..., wr-1}, y es ortogonal a w1, w2, ..., wr-1, ya que, para i = 1,
2, ..., r - 1, se verifica que
〈v'r, wi〉 = 〈vr, wi〉 - 〈vr, wi〉 = 0;

v’ r
entonces w r = es unitario y tal que 〈{v1, v2, ..., vr}〉 = 〈{w1, w2, ..., wr}〉.
æv’ r æ
Bases ortonormales en un espacio vectorial euclídeo de dimensión finita
Definición. Sea Vn un espacio vectorial euclídeo de dimensión n, se dice que {v1, v2,...., vn} ⊂ Vn es
una base ortonormal si: 〈vi, vj〉 = δij
Teorema. Sea Vn un espacio vectorial euclídeo de dimensión n ≥ 1, entonces, existe al menos una base
ortonormal de Vn.
Teorema. Sea Vn un espacio vectorial euclídeo de dimensión finita n. Dado un conjunto ortonormal
{v1, v2, ...., vp} ⊂ Vn con p < n, existen vp+1, vp+2, ...., vn tales que {v1, v2, ...., vn} es una base ortonormal de
Vn.
Localización de una base ortonormal. Sabiendo que, en un espacio vectorial euclídeo Vn existen
bases ortonormales, se plantea el problema de cómo, a partir de una base dada, se puede encontrar una
base ortonormal. Este problema lo resuelve perfectamente el "proceso de ortonormalización de
Gram-Schmidt".
En efecto: si {v1, v2, ...., vn} es una base de Vn como se trata de un conjunto independiente, dicho
proceso de ortonormalización proporciona un conjunto ortonormal de n vectores de Vn que es
forzosamente, una base del espacio.
Desde un punto de vista práctico es aconsejable introducir alguna variante en el proceso de

ortonormalización antes descrito: en lugar de dividir por su norma a cada uno de los vectores v'i, antes de
proceder a determinar el siguiente vector v'i+1, es más aconsejable no dividir por las normas hasta que se
hayan obtenido todos los v'1, v'2,..., v'n.
Expresión del producto interior
Sea Vn un espacio vectorial euclídeo de dimensión n, en el que por consiguiente, dados dos vectores
cualesquiera x e y, existe su producto interior 〈x, y〉; la cuestión que ahora se aborda es la de encontrar la
manera de expresar el número real 〈x, y〉 en función de las coordenadas de x e y respecto de una
determinada base.
Sea pues {e1, e2, ...., en} una base de Vn, respecto de la cual siempre es posible expresar, de modo
único, x = x1e1 + ... + xnen e y = y1e1 + ... + ynen, donde (x1, x2, ..., xn) e (y1, y2, ..., yn) ∈ Kn son,
respectivamente, las coordenadas de los vectores x e y de Vn; por consiguiente, de acuerdo con la
axiomática del producto interior, se tiene que
1 2 n
〈x, y〉 = 〈 x1e1 + ... + xnen, y1e1 + ... + ynen〉 = x1y 〈e1, e1〉 + x1y 〈e1, e2〉 + ... + xny 〈en, en〉
de donde se deduce que, en un espacio vectorial euclídeo, el producto interior de dos vectores
cualesquiera queda perfectamente determinado en el momento que se conozcan los productos interiores
de los vectores de una base; es decir, el producto interior está totalmente definido por los números 〈ei, ej〉,
para i, j = 1, 2, ..., n. Llamando entonces gij = 〈ei, ej〉, se obtiene:
1
g 11 g 12 ... g 1n y
2
g 21 g 22 ... g 2n y
〈x, y〉 = x 1 x 2 ... x n = XtGY
.... .... ... .... ...
n
g n1 g n2 ... g nn y
A G se le llamará matriz métrica del producto interior respecto de la base B = {e1, e2, ...., en}.
Variación de la matriz métrica o coordenada con los cambios de base. Si en el espacio vectorial
euclídeo Vn se cambia la base B = {e1, e2, ...., en} por la nueva base B' = {e'1, e'2, ...., e'n}, las coordenadas
de los vectores cambiarán y, por tanto, la expresión en función de las coordenadas del producto interior
〈x, y〉 será distinta; de manera que la matriz métrica G' del producto interior respecto de la nueva base
será distinta de la matriz G en la base primitiva. Se trata de localizar la relación que guardan entre sí las
matrices G y G' siendo conocido claro está, el cambio de base.
Sea, pues, la expresión de los vectores e'i = q1ie1 + q2ie2 + ... + qnien en función de la base antigua;
entonces, como G = (ghk) y G' = (g'ij), donde ghk = 〈eh, ek〉 y g'ij = 〈e'i, e'j〉, tenemos que
G' = (g'ij) = (〈e'i, e'j〉) = (〈q1ie1 + q2ie2 + ... + qnien, q1je1 + q2je2 + ... + qnjen〉) =
q 11 q 21 ... q n1 g 11 g 12 ... g 1n q 11 q 12 ... q 1n

q 12 q 22 ... q n2 g 21 g 22 ... g 2n q 21 q 22 ... q 2n
= = QtGQ
.... .... ... .... .... .... ... .... .... .... ... ....
q 1n q 2n ... q nn g n1 g n2 ... g nn q n1 q n2 ... q nn
Teorema. La matriz métrica del producto interior de un espacio vectorial euclídeo Vn respecto de
cualquier base, es una matriz regular.
Expresión del producto interior en una base ortonormal. Si B = {e1, e2, ...., en} es una base
ortonormal de un espacio vectorial euclídeo de dimensión n, se verifica que
gij = 〈ei, ej〉 = δij, ⇒ G = I (matriz unidad)
Sea {e1, e2, ...., en} una base ortogonormal de V (espacio vectorial euclídeo). Entonces:
n
x = …x, e i e i .
i=1
Sea {e1, e2, ...., en} una base ortonormal de V (espacio vectorial euclídeo). ∀ x e y ∈ V, tenemos:
n n
…x, y = …x, e i …y, e i = x i y i (Fórmula de Parseval).
i=1 i=1
n
En particular, si x = y, tenemos æx æ 2 = …x, e i 2 .
i=1
Coordenadas covariantes y contravariantes
Coordenadas covariantes y contravariantes de un vector. Sea B = {e1, e2, ...., en} una base
cualquiera de un espacio euclídeo Vn de dimensión n; el conjunto de coordenadas, respecto de dicha base,
de un vector cualquiera x de Vn es la n-upla de números reales (x1, x2, ..., xn) ∈ Kn que verifica:
x = x1e1 + ... + xnen
Considérese ahora la nueva n-upla (x1, x2, ..., xn) ∈ Rn, definida mediante:
xi = 〈x, ei〉, para i = 1, 2, ..., n.
Las dos n-uplas (x1, x2, ..., xn) y (x1, x2, ..., xn) están relacionadas entre sí, de forma tal que puede
obtenerse la una en función de la otra;
xi = 〈x, ei〉 = 〈 x1e1 + ... + xnen, ei〉 = x1〈e1, ei〉 + x2〈 e2, ei〉 + ... + xn〈en, ei〉
Por tanto, en términos de matrices, se tendrá:
x1 x1 x1 x1
x2 x2 x2 x2
=G$ y = G −1 .
... ... ... ...
xn xn xn xn
Por consiguiente, cualquier vector x del espacio vectorial euclídeo Vn queda determinado respecto de la
base {e1, e2, ...., en} o bien por la n-upla (x1, x2, ..., xn) o bien por la (x1, x2, ..., xn); como, por otra parte,
ocurre que esta última n-upla es de gran utilidad, se le da también el nombre de conjunto de coordenadas
de x. Para distinguir estas nuevas coordenadas de las únicas que hasta ahora se conocían, se les dan los
calificativos de contravariantes y covariantes:
(x1, x2, ..., xn) = conjunto de coordenadas contravariantes o paralelas del vector x.
(x1, x2, ..., xn) = conjunto de coordenadas covariantes o perpendiculares del vector x.
Caso de bases ortonormales. Cuando, en un espacio vectorial euclídeo Vn de dimensión n, se

considera una base ortonormal {e1, e2, ...., en}, hemos visto que la matriz métrica correspondiente es la
unidad, y el producto interior de dos vectores toma, en términos de sus coordenadas una expresión muy
sencilla. Pues bien, en tal caso, ocurre además que las coordenadas contravariantes y las coordenadas
covariantes, de un vector cualquiera x ∈ Vn, constituyen dos n-uplas iguales.
Este hecho viene a confirmar que la utilización de bases ortonormales simplifica de modo notable todo
tipo de expresiones relativas al producto interior.
PROYECCIÓN ORTOGONAL Y DISTANCIA
Introducción
Definición. Sea S un subconjunto de un espacio euclídeo V. Se dice que un elemento de V es

ortogonal a S si es ortogonal a todo elemento de S. El conjunto de todos los elementos ortogonales a S se
designa por S⊥ = {x ∈ V | 〈x, y〉 = 0 ∀ y ∈ S} .
Teorema. S⊥ es un subespacio vectorial de V, y si S es subespacio, se llama complemento ortogonal a

S.
Teorema. Sea V un espacio vectorial euclídeo y S un subespacio de V de dimensión finita. Todo

elemento x de V puede representarse en forma única como una suma de dos elementos, uno de S y otro de
S⊥. Es decir: ∀ x ∈ V
x = s + s⊥, donde s ∈ S y s⊥ ∈ S⊥
Además, la norma de x viene dada por la fórmula pitagórica:
||x||2 = ||s||2 + ||s⊥||2
Definición. Sea S un subespacio de dimensión finita de un espacio euclídeo V, y sea {e1, ..., en} una
base ortonormal para S. Si x ∈ V, el elemento s definido por
n
s = …x, e i e i
i=1
se denomina proyección de x sobre el subespacio S.
Mínima distancia de un vector a un subespacio de dimensión finita
Teorema. Sean, en un espacio vectorial euclídeo cualquiera V, un vector x y un subespacio S de

dimensión finita n. La proyección de x sobre S es más próxima a x que cualquier otro elemento de S. Esto
es, si s es la proyección de x sobre S, tenemos:
||x - s|| ≤ ||x - t||
para todo t ∈ S; el signo de la igualdad es válido si y sólo si t = s.
Definición. Sea S un subespacio de dimensión finita de un espacio euclídeo V, y sea {e1, ..., en} una
base ortonormal para S. Si x ∈ V, y s es la proyección de x sobre el subespacio S, se llama distancia de x
a S a: d(x, S) = ||x - s||.
Teorema. En un espacio vectorial euclídeo V, la distancia (mínima) de un vector x ∈ V a un

subespacio de dimensión finita S, está dada por:
n
d(x, S) = æx æ 2 − …x, e i 2
donde {e1, e2, ..., en} es una base ortonormal de S.
i=1
MATRICES ORTOGONALES
Definición y caracterización
Definición. Se dice que A ∈ Mn(R) es ortogonal si, y sólo si, AtA = I (⇔ At = A-1). I ∈ Mn(R).
Teorema. Sea A = (aij) ∈ Mn(R). A es ortogonal si, y sólo si, sus vectores fila o bien sus vectores
columna, forman una base ortonormal del espacio vectorial euclídeo Rn.
Cambios de bases ortonormales
Según ya es sabido, en un espacio vectorial Vn de dimensión n, las coordenadas de un vector x, en dos

bases distintas B = {e1, e2, ...., en} y B' = {e'1, e'2, ...., e'n}, están relacionadas por
x1 a 11 a 12 ... a 1n x’ 1
x2 a 21 a 22 ... a 2n x’ 2
= ,
... .... .... ... .... ...
xn a n1 a n2 ... a nn x’ n
siendo (x1, x2, ..., xn) las coordenadas del vector x en la base B, (x'1, x'2, ..., x' n) las coordenadas de x en la
base B' y la matriz A = (aij) (matriz de cambio) es la que permite relacionar los vectores de las bases entre
sí: e'i = a1ie1 + a2ie2 + ... + anien. Cuando Vn es un espacio vectorial euclídeo, las cosas ocurren como en el
caso general; ahora bien, las bases que son de mayor utilidad y, por tanto, las realmente aconsejables en
espacios vectoriales euclídeos son las ortonormales, y por ello merece la pena analizar las peculiaridades
que se presentan cuando tanto la primera base como la segunda son ortonormales. Poner de manifiesto
que un cambio de coordenadas se realiza partiendo de una base B ortonormal y llegando a otra base B'
también ortonormal, se reduce a expresar que ha de verificarse, para cualesquiera i, j = 1, 2, ..., n, que
〈eh, ek〉 = δhk y 〈e'i, e'j〉 = δij
es decir, se ha de satisfacer
δij = 〈e'i, e'j〉 = 〈a1ie1 + a2ie2 + ... + anien, a1je1 + a2je2 + ... + anjen〉 = a1ia1j + a2ia2j + ... + anianj
que, según la caracterización de las matrices ortogonales, es lo mismo que decir que la matriz A del
cambio es ortogonal; por tanto, un cambio de coordenadas que pase de una base ortonormal a otra
también ortonormal está caracterizado por tener ortogonal su matriz de cambio de base.
Diagonalización ortogonal de matrices reales simétricas
Teorema (Espectral). Sea f: Rn → Rn una aplicación lineal simétrica de matriz asociada A. Entonces
existe una base ortonormal de Rn constituida por los vectores propios de f.
Teorema. Toda matriz real y simétrica es ortogonalmente diagonalizable; es decir:
Si A ∈ Mn(R) y simétrica ⇒ ∃ P, matriz ortogonal, tal que D = P-1AP = PtAP es diagonal real.
1. Sea (V, 〈 , 〉) un e. v. euclídeo y f: W → V una aplicación lineal. Se define ∀ (x, y) ∈ W2;
(x | y) = 〈f(x), f(y)〉
Pruébese que ( | ) es un producto interior en W si, y sólo si, f es inyectiva.
2. Si (V, 〈 , 〉) es un e. v. euclídeo, pruébese que, para cualesquiera vectores x, y, z ∈ V, se verifica:
||x + y + z||2 = ||x||2 + ||y||2 + ||z||2 + 2〈x, y〉 + 2〈x, z〉 + 2〈z, y〉.
3. Pruébese que, en un espacio vectorial euclídeo V, si x, y son dos vectores tales que ||x|| = ||y||,
entonces x + y y x - y son dos vectores ortogonales.
4. Demostrar que, en un espacio vectorial euclídeo de dimensión finita V, para cualesquiera que sean
los subespacios U y V, se verifica que:
(U + W)⊥ = U⊥ ∩ W⊥; (U ∩ W)⊥ = U⊥ + W⊥
5. Sea V el espacio vectorial de las funciones reales continuas definidas en el intervalo [0, 1];
considérese en V el producto interior definido, ∀ f, g ∈ V, mediante
1
〈f, g〉 = ¶ 0 f(x )g(x )dx.
Por medio del proceso de ortonormalización de Gram-Schmidt, localícese un conjunto ortonormal

de funciones equivalentes al formado por las funciones:
f0(x) = 1, f1(x) = x, f2(x) = x2 y f3(x) = x3.
6. Sea V un espacio vectorial euclídeo tridimensional; si B = {e1, e2, e3} es una base de V tal que 〈e1,
e1〉 = 1, 〈e2, e2〉 = 1, 〈e3, e3〉 = 2, 〈e1, e2〉 = 0, y el vector 2e2 - e3 es ortogonal a los vectores e1 y e3,
se pide:
a) La matriz métrica del producto interior respecto de la base B.
b) Una base ortonormal de V.
7. En el espacio vectorial euclídeo R3, se considera una base B = {e1, e2, e3} tal que:
||e1|| = ||e2|| = 3; ||e3|| = 2; ∠e1e2 = ∠e2e3 = ∠e1e3 =

3 2
a) Hállese la matriz métrica G, del producto interior, en la base B.
b) Ángulo que forma el vector u1 = e1 - e3 con el vector u2 que tiene por coordenadas covariantes,
en la base B, a (3, 2, 3).
c) Hállese la matriz métrica G', del producto interior, en la base {u1, u2, u3} siendo u3 = - e2 + e3.
d) Determínese el suplementario ortogonal del subespacio engendrado por u1, y u3.
e) Hállese una base ortonormal que tenga uno de sus vectores proporcional a u1.
8. Sea el espacio vectorial euclídeo (V, 〈 , 〉), donde V es el espacio vectorial de los polinomios sobre
R de grado menor o igual que dos, y 〈 , 〉 es el producto interior definido como:
…p, q = ¶ 0 p(x)q(x)dx
1
Se pide:
a) Demostrar que 〈 , 〉, es un producto interior.
b) Hallar una base del subespacio W, ortogonal al polinomio p(x) ∈ V, cuyas coordenadas covariantes
en la base {1, x, x2} son (1, 1, 1).
c) Hallar una base ortonormal de V.
9. Sea (V, 〈 , 〉) un espacio vectorial euclídeo, donde V = {f: [0, 1] → R / f continua en [0, 1]} y 〈 , 〉
es el producto interior:
1
…f, g = ¶ 0 f(x)g(x)dx
Hallar:
a) d(x3, x2 + 1)
b) ||senx||
c) Proyección de senx sobre cosx.
d) Ángulo que forman x2 y x3.
10. Sea (V, 〈 , 〉) un espacio vectorial euclídeo, donde V es el espacio vectorial de los polinomios sobre
R de grado menor o igual que tres, y 〈 , 〉 es el producto interior:
1
…p, q = ¶ −1 p(x)q(x)dx
Se pide:
a) Hallar la matriz métrica G respecto de la base {1, x, x2, x3}.
b) Hallar una base del subespacio W, ortogonal al subespacio generado por el polinomio p(x) ∈ V,
cuyas coordenadas covariantes en la base {1, x, x2, x3} son (1, 0, 1, 0).
c) Hallar una base ortonormal de V.
d) Hallar la mínima distancia del polinomio 1 + x + x2 al subespacio W.
ENM Matemáticas I Sucesiones y series 1
TEMA 2
SUCESIONES DE NÚMEROS REALES
Definición. Se llama sucesión de números reales, a toda función real a(x) en la que el dominio de
definición de la función "a" son los números naturales.
Para representar las sucesiones se suele emplear la notación an = a(n). Los diversos valores que toma la
función se llaman términos de la sucesión; así se dice que a1 es el primer término, a2 es el segundo
término etc. Al término an (n-ésimo) se le llama término general de la sucesión.
Ejemplos.- {an} = 1 , {b } = {n2}, {c } = {(-1)n}.

n n
n3
Para representar gráficamente una sucesión, marcamos los términos a1, a2, a3,..., sobre una recta. Este
tipo de diagrama indica hacia donde va la sucesión. Así, en las sucesiones de los ejemplos tenemos que la
sucesión {an} va hacia 0, la sucesión {bn} va hacia +∞ y la sucesión {cn} va dando saltos entre -1 y 1.
1 1
27 8 1
{a n}
0 a3 a a
2 1
1 4 9
{bn } b1 b2
0 b3
-1 0 +1
{c n }
c = c 3 = c1 c2 = c = c 6
5 4
Estos tres tipos de sucesiones dan lugar a las siguientes definiciones.
Definiciones generales
Definición. Decimos que una sucesión {an} converge hacia "a ∈ R" si:
∀ ε > 0 ∃ n0 ∈ N / ∀ n ≥ no ⇒ |an - a| < ε
Simbólicamente se representa por lim a = a ó {an} → a. La sucesión 1 converge a 0.

nd∞ n n3
Ejemplo.- Demostrar que para a > 0, lim n a = 1.

nd∞
Solución.- ¿∀ ε > 0 ∃ no ∈ N / ∀n ≥ no ⇒ n a − 1 < ?

 La La
 n a − 1 si a m 1 e n a − 1 < e n a < + 1 e n > L(1 + ) e n o > E L(1 + )

n a − 1 =   Si m 1 e n o m 1
 1 − n a si a < 1 e  La La
  Si < 1 e 1 − < n a e n > L(1 − ) e n o > E L(1 − )
 
Definición. Decimos que una sucesión {bn} diverge hacia "+∞" ("-∞") si:
∀ K > 0 (∀ K < 0) ∃ n0 ∈ N / ∀ n ≥ no ⇒ bn > K (bn < K)
Simbólicamente se representa por lim b = +∞ ó {bn} → +∞. La sucesión {n2} diverge hacia +∞.
nd∞ n
Ejemplo.- Demostrar que lim n 2 + 1 = +∞.

nd∞ n + 3
Solución.- ¿∀ Κ > 0 ∃ no ∈ N / ∀ n ≥ no ⇒ n + 1 > K?

2
n+3
K + K 2 − 4(1 − 3K )
n + 1 > Kn + 3K ⇒ n - Kn + 1 - 3K > 0 ⇒ no > E
2 2
2
Definición. Decimos que una sucesión {cn} es oscilante, si no es una sucesión convergente ni
divergente. La sucesión {(-1)n} es una sucesión oscilante.
Definición. Decimos que una sucesión {an} es monótona creciente si: an+1 ≥ an ∀ n ∈ N.
Si an+1 > an ∀ n ∈ N diremos que la sucesión es estrictamente creciente.
La sucesión {n2} es estrictamente creciente.
Definición. Decimos que una sucesión {an} es monótona decreciente si:
an+1 ≤ an ∀ n ∈ N.
Si an+1 < an ∀ n ∈ N diremos que la sucesión es estrictamente decreciente.
La sucesión 1 es estrictamente decreciente.

n3
Definición. Decimos que una sucesión {an} está acotada superiormente si:
∃ k ∈ R / an ≤ k ∀ n ∈ N
Están acotadas superiormente las sucesiones 1 y {(-1)n}.

n3
Definición. Decimos que una sucesión {an} está acotada inferiormente si:
∃ h ∈ R / h ≤ an ∀ n ∈ N
Las sucesiones 1 , {n2}, y {(-1)n} están acotadas inferiormente.

n3
Definición. Decimos que una sucesión {an} está acotada, si está acotada superior e inferiormente, es
decir:
∃ k ∈ R+ / |an| ≤ k ∀ n ∈ N
Las sucesiones 1 y {(-1)n}, están acotadas.

n3
Definición. Decimos que una sucesión {an} es una sucesión de Cauchy si:
∀ ε > 0 ∃ n0 ∈ N / ∀ p, q ≥ no ⇒ |ap - aq| < ε
La sucesión 1 , es una sucesión de Cauchy.

n3
Vistas estas definiciones sobre sucesiones, daremos una serie de teoremas sobre la convergencia de
sucesiones.
Teoremas sobre sucesiones
Teorema. Toda sucesión monótona creciente (decreciente), acotada superiormente (inferiormente), es

convergente.
El empleo de este teorema suele ser útil en los problemas en los cuales la sucesión se define por
recurrencia.
Ejemplo.- Sea la sucesión {an} definida por
a 1 = 2 , ..., a n+1 = 2a n .
Demostrar que {an} es una sucesión convergente.
Solución.- 1) Vamos a ver que la sucesión {an} está acotada superiormente por "2";
a 1 = 2 [ 2, suponemos que a n−1 [ 2 e a n = 2a n−1 [ 2 $ 2 = 2.
Por tanto an ≤ 2 ∀ n ∈ N
2) Veamos ahora que {an} es una sucesión monótona creciente.
an+1 ≥ an ∀ n ∈ N ⇔ 2a n m a n ∀ n ∈ N (an > 0 ∀ n ∈ N) ⇔ 2an ≥ an2 ∀ n ∈ N ⇔ 2 ≥ an ∀n ∈ N;
cierto por (1); entonces la sucesión {an} es monótona creciente.
Por tanto, como la sucesión {an} está en las hipótesis del teorema, es convergente.
Teorema. Toda sucesión de Cauchy {an} está acotada.
Teorema. Toda sucesión convergente {an} es una sucesión de Cauchy.
Teorema. Toda sucesión de Cauchy {an} de números reales converge a un número real; lo que también
se expresa diciendo que R es completo.
Propiedades de las sucesiones
Teorema. El límite de una sucesión, cuando existe (finito), es único.
Teorema. Si {an} → a ∈ R y a ≠ 0, ⇒ ∃ no ∈ N / ∀ n ≥ no, an⋅a > 0.
Teorema. Si ∃ µ ∈ N / ∀ n ≥ µ, se verifica que bn ≤ an ≤ cn y lim b = lim

nd∞ n
c = a c R, ⇒ lim
nd∞ n
a =a
nd∞ n
Este teorema se emplea fundamentalmente para determinar el límite de una sucesión cuando el cálculo
directo de éste no es fácil pero, en cambio, se dispone de dos sucesiones mas sencillas que comprenden a
la dada y tienen límites iguales. Veámoslo con el siguiente ejemplo:
Ejemplo.- Calcular el límite:

lim
nd∞
n sen 1n
Solución.- Sabemos que ∀ n ∈ N sen 1n < 1n < tg 1n por tanto dividiendo por sen 1n se tiene:
1
1< n < 1
sen 1n cos 1n
o lo que es igual cos 1n < n sen 1n < 1
En este caso bn = cos 1n , an = n sen 1n , cn = 1 y como:
lim b = lim
nd∞ n
c = 1 elim
nd∞ n
a =1
nd∞ n
Operaciones con las sucesiones
Teorema. Sean {an} y {bn} dos sucesiones de números reales, tales que lim a = a ∈ R y lim
nd∞ n
b =b∈
nd∞ n
R. Se verifica que:
1. lim
nd∞
[a n + b n ] = a + b ∀ λ, µ ∈ R.
2. lim
nd∞
[ a n $ b n ] = a $ b.
3. Si {an} es una sucesión acotada, y lim c = 0, ⇒ lim

nd∞ n nd∞
[ a n $ c n ] = 0.
4. Si an ≠ 0 ∀ n ∈ N, y lim a = a ! 0 e lim 1 = 1.
nd∞ n nd∞ a n a
an
5. Si bn ≠ 0 ∀ n ∈ N, lim b = 0 y lim
nd∞ n
a = a ! 0 e lim
nd∞ n
= +∞.
nd∞ bn
6. Si an > 0 ∀ n ∈ N, ⇒ lim
nd∞
L(a n ) = L lim a .
nd∞ n
7. Si c > 0 y lim a = a e lim

nd∞ n nd∞
c an = c a .
8. Si an > 0 ∀ n ∈ N, y lim a = a > 0 e ≤r c R, lim

nd∞ n nd∞
(a n ) r = a r .
9. Si an > 0 ∀ n ∈ N, lim a = a > 0 y lim

nd∞ n
b = b e lim
nd∞ n nd∞
(a n ) b n = a b .
Teorema.
1. Si {an} y {bn} tienden hacia infinito con el mismo signo, la suma {an + bn} tiende hacia infinito con
este signo. Si {an} tiende hacia infinito mientras que {bn} está acotada, {an + bn} tiende hacia
infinito.
En cambio, si {an} tiende hacia "+∞" mientras que {bn} lo hace hacia "-∞", no se puede decir nada
a priori sobre el comportamiento de {an + bn}.
2. La sucesión {|an ⋅ bn|} tiene por límite "+∞" cuando una de las dos sucesiones tiende hacia infinito y
el valor absoluto de la otra se mantiene superior a un número fijo.
Si {an} tiende hacia cero y {bn} tiende hacia infinito no se puede establecer ninguna conclusión
general sobre el límite de {an ⋅ bn}.
an
3. Si la sucesión {an} está acotada, y {bn ≠ 0} tiende a "∞", el cociente tiende hacia cero.
bn
an
Si {an} tiende hacia "∞" y {bn ≠ 0} está acotada, el cociente tiende hacia "+∞".
bn
an
Tampoco se puede establecer ninguna conclusión general sobre el límite del cociente cuando
bn
las dos sucesiones {an} y {bn} tienden simultáneamente hacia infinito o hacia cero.
Nota.- En resumen, los teoremas anteriores, satisfacen el enunciado general que el límite de la operación
es igual a la operación efectuada con los límites.
Los casos de indeterminación, son
∞ - ∞, 0⋅∞, 0 , ∞ , ∞0, 00 y 1∞
0 ∞
En estos casos el límite de la operación correspondiente no depende solamente de los límites de las
sucesiones que intervienen en ella, como sucede en los demás, sino también de la ley con que dichas
sucesiones tienden a sus límites respectivos. Por esto es necesario realizar un estudio particular en cada
caso.
Criterio de Stolz.- Sean {an} y {bn} dos sucesiones de números reales tales que
a n − a n−1
lim = (donde λ ∈ R o λ = ∞)
nd∞ b n − b n−1
an
Si la sucesión {bn} es creciente y lim b = +∞, se tiene también que lim
nd∞ n
=
nd∞ bn
a 1 + a 2 + ... + a n
Ejemplo.- Si lim a = a, calcular lim
nd∞ n nd∞ n
Solución.- Aplicando el criterio de Stolz, tenemos que:
a 1 + a 2 + ... + a n (a 1 + a 2 + ... + a n ) − (a 1 + a 2 + ... + a n−1 )

lim n = lim = lim a =a
nd∞ nd∞ n − (n − 1 ) nd∞ n
Infinitésimos e infinitos equivalentes
Definición. Se dice que la sucesión {an} es un infinitésimo cuando "n" tiende a "∞" si:
lim a =0
nd∞ n
Sean {an} y {bn} dos infinitésimos cuando n → ∞; calculemos

an
lim =
nd∞ bn
entonces, si λ = 0, diremos que {an} es un infinitésimo de orden superior a {bn}. Si λ = ∞, diremos que
{an} es un infinitésimo de orden inferior a {bn}. Por último, si λ ≠ 0 y λ ≠ ∞, diremos que {an} y {bn}
son infinitésimos del mismo orden, además si λ = 1 se dice que {an} y {bn} son infinitésimos
equivalentes. Si no existe λ, diremos que los infinitésimos {an} y {bn} no son comparables.
El concepto de orden de un infinitésimo (respecto de otro infinitésimo) que hasta ahora sólo tiene
carácter cualitativo se puede precisar cuantitativamente conviniendo en asignar el orden "1" al
infinitésimo 1n , al que llamaremos principal, y definiendo a continuación el orden "r" del infinitésimo
{an} mediante la condición
an
lim =
nd∞ 1 r
n
con λ finito y distinto de cero, en caso de que exista límite.
Ejemplo.- n + 1 − 1 para n → ∞ es un infinitésimo de orden 1 , pues

n 2
n+1 −1 n+1−n
n n
lim
nd∞
= lim
nd∞
=1
1 1
n n
Definición. Sea {an} un infinitésimo de orden "r" cuando n → ∞; se llama parte principal de {an} al
producto n1r . Dicho producto es evidentemente, un infinitésimo equivalente a {an}.
Una propiedad de los infinitésimos, muy interesante para el cálculo de límites, es: Si en la expresión
de una sucesión se sustituye un factor o divisor infinitésimo {an} por otro equivalente {bn}, el límite
de la sucesión no varía.
⊗} → 0
TABLA DE INFINITÉSIMOS EQUIVALENTES PARA {⊗
e⊗ - 1 ≈ ⊗ a⊗ - 1 ≈ ⊗La
(1 + ⊗)m - 1 ≈ m⊗ L(1 + ⊗) ≈ ⊗
sen⊗ ≈ ⊗ sh⊗ ≈ ⊗
tg⊗ ≈ ⊗ th⊗ ≈ ⊗
arcsen⊗ ≈ ⊗ argsh⊗ ≈ ⊗
arctg⊗ ≈ ⊗ argth⊗ ≈ ⊗
1 - cos ⊗ ≈ ⊗ /2 ch⊗ - 1 ≈ ⊗2/2
2
⊗ - sen⊗ ≈ ⊗3/6 sh⊗ - ⊗ ≈ ⊗3/6

tg⊗ - ⊗ ≈ ⊗3/3 ⊗ - th⊗ ≈ ⊗3/3
Definición. Se dice que la sucesión {an} es un infinito cuando n → ∞ si:
lim a =∞
nd∞ n
Desarrollando consideraciones análogas con los infinitos se obtienen resultados correlativos.

an
Así, se dirá que dos infinitos {an} y {bn} son del mismo orden si el cociente tiende a un número
bn
finito y distinto de cero; cuando este cociente tienda a 1 los dos infinitos son equivalentes. Se dirá que
a
{an} es de orden superior o inferior a {bn} según que la razón n tienda hacia infinito o hacia cero,
bn
respectivamente.
an
Cuando d (λ finito y λ ≠ 0), el producto λAr constituye la parte principal del infinito {an}.
Ar
Como infinito principal A se toma "n". De la propia definición se deduce que an ≈ λAr. También se
puede sustituir un factor o un divisor infinito por otro equivalente sin que por ello varíe el límite.
TABLA DE INFINITOS EQUIVALENTES PARA ⊗, n → ∞
1! l 11 e −1 2 1
Ln l 1 + 1 + $ $ $ + 1n
2
k+1
1 + 2 + ... + n k l n
k k
k+1
a k n k + ... + a 1 n + a 0 l a k n k
Nota.- Para finalizar diremos que los métodos más frecuentes para resolver, en gran número de casos,
la indeterminación y hallar el límite buscado son:
1. Simplificar la expresión.
2. Aplicar técnicas del cálculo de límites del Bachillerato.
3. Sustituir factores o divisores por otros, infinitésimos o infinitos, equivalentes.
4. Aplicar el criterio de Stolz.
5. Aplicar a toda la expresión dada o a ciertas partes de ella la fórmula de Taylor.
6. Acotar entre dos sucesiones que tengan el mismo límite.
L(n + p) n$Ln
Ejemplo.- Hallar: lim
nd∞ Ln
L(n + p) n$Ln
Solución.- Como lim = 1 ∞ e (por el número "e")
nd∞ Ln
L(n+p) L(n+p)−Ln
L(n + p) n$Ln p
limn$Ln$ Ln −1 limn$Ln$ limn$L 1+ n
lim =e nd∞
=e nd∞ Ln
=e nd∞
= ep
nd∞ Ln
Ejemplo.- Hallar: lim 1 + 2 + $ $ $ + n

nd∞ n +1
n +1
Solución.- Aplicando infinitos equivalentes, tenemos: lim 1 + 2 + $ $ $ + n = lim + 1 = 1

nd∞ n +1 nd∞ n +1 +1
(2n )!
Ejemplo.- Hallar: lim n
nd∞ n n n!
Solución.- Aplicando infinitos equivalentes, tenemos:
(2n )! (2n ) 2n e −2n 22n

lim n = lim n = 4e
nd∞ n n n! nd∞ n
n n en −n 2n
sen 3n L 1 + tg 2 5n
arctg 7n 1 − cos 3n
nd∞
Solución.- Aplicando infinitésimos equivalentes, tenemos:
Como sen 3n l 3n , arctg 7n l 7n , L 1 + tg 2 5n l tg 2 5n l 252 y 1 − cos 3n l 9 2 , obtenemos que:

n 2n
3 $ 25
sen 3n L 1 + tg 2 5n n n2
lim = lim = 50
arctg 7n 1 − cos 3n
nd∞ nd∞ 7 9 21
n $ 2n 2
n
nd∞
1 + sen 1n
n n 1 1
Solución.- Como lim
nd∞
1 + sen 1n = 1 ∞ e lim
nd∞
1 + sen 1n = e nd∞
limn$sen n
= e nd∞
limn$ n
=e
Calcular los siguientes límites:

n
tan 2 2n−1
1. lim sen n 2
nd∞ 2n − 1
2. lim
nd∞
n n
b −1 (b > 0 y b ! 0 )
3. lim (n + n )L 1 + 1 (α > 0 y α ≠ 1)
nd∞
2n 2 + 1
1+2 2 +$$$ +nnn

4. lim
nd∞ n2
(n + 1 ) $ $ $(2n )
5. lim n
nd∞ n!
n a1 + $ $ $ + n ak kn
6. lim
nd∞ k
7. lim
nd∞
n − n 2 L 1 + 1n
8. lim 1 2 $ n−1 + 3 $ n−2 +$$$ + n−1 $ 2 + n $ 1

nd∞ n 1 n 2 n−1 n−2 3 n−1 2
a2 a
a1 + + $ $ $ + nn
9. lim 2 siendo lim a =a
nd∞ Ln nd∞ n
10. Demostrar que 2 + 2 + 2 + $ $ $ tiene límite y hallarlo.
11. Sea {xn} la sucesión definida por:
x1 > 1, x n+1 = 1
2 x 2n + 12
xn
Se pide:
a) Probar que {xn} es una sucesión convergente.
b) Calcular el límite de la sucesión {xn}.
12. Sea f: [0, +∞) → [0, 1) una función continua, y sea {xn} la sucesión definida por:
x0 > 0, xn+1 = xnf(xn)

a) Probar que {xn} es una sucesión convergente.
b) Calcular el límite de la sucesión {xn}.
SERIES NUMÉRICAS
Las sucesiones se introdujeron en el capítulo anterior con la intención especial de considerar en este
capítulo sus sumas
a1 + a2 + ⋅⋅⋅ + an + ⋅⋅⋅⋅
Estas sumas no se pueden hacer sin más, ya que hasta ahora la suma de infinitos números no ha sido
nunca definida. Lo que puede definirse son las sumas parciales
Sn = a1 + a2 + ⋅⋅⋅ + an
y se puede presumir que las sumas infinitas deban definirse en términos de estas sumas parciales.
Afortunadamente, el mecanismo para formular esta definición ha sido desarrollado ya en la lección
anterior. Si existe alguna esperanza de poder calcular la suma infinita a1 + a2 + ⋅⋅⋅ + an + ⋅⋅⋅⋅, las sumas
parciales Sn deben representar aproximaciones cada vez más cercanas a medida que "n" se va haciendo
grande. Esta última afirmación equivale a poco más que una definición grosera de límite: La suma infinita
a1 + a2 + ⋅⋅⋅ + an + ⋅⋅⋅⋅
debería ser
lim S
nd∞ n
Este modo de abordar el asunto dejará necesariamente sin definir la suma de muchas sucesiones,
puesto que la sucesión Sn puede fácilmente dejar de tener un límite.
Definición. Dada la sucesión {an} formemos la sucesión {Sn} definida como Sn = a1 + a2 + ⋅⋅⋅ + an: Se
denomina serie, y se representa por el símbolo
∞
a n o abreviadamente por ∑an,
n=1
al par de sucesiones ({an},{Sn}).
Definición. Decimos que la serie ∑an es convergente si, y sólo si, existe S ∈ R tal que
lim S =S
nd∞ n
A "S" se le llama suma de la serie.
Definición. Decimos que la serie ∑an es divergente si, y sólo si, la sucesión {Sn} es divergente.
Definición. Decimos que la serie ∑an es oscilante si, y sólo si, la sucesión {Sn} es oscilante.
∞
Definición. Se llama resto de índice k a la expresión: R k = a n .
n=k+1
Ejemplos de series
∞
1) Series geométricas: kr n con k ≠ 0
n=1
Para estudiar este tipo de series, consideremos
r(1 − r n ) 1 − rn
S n = k(r + r 2 + $ $ $ + r n ) = k e lim S = kr lim
1−r nd∞ n nd∞ 1 − r
Casos que pueden suceder (suponemos k > 0):

∞
a) |r| < 1 ⇒ rn →0 ⇒ lim S n = kr e S n converge g kr n converge y tiene suma kr .
nd∞ 1−r n=1 1−r
b) Si |r| > 1 hay dos casos:
b1) r > 1 ⇒ rn → +∞ ⇒ lim S = +∞ ⇒ {Sn} diverge ⇔ ∑krn diverge.

nd∞ n
 +∞ si n par
b2) r < -1 ⇒ rn →  ⇒ {Sn} oscila ⇔ ∑krn es oscilante.
 −∞ si n impar
c) Si |r| = 1 hay otros dos casos:
c1) r = 1 ⇒ ∑krn = ∑k, que es una serie divergente.
 1 si n par
c2) r = -1 ⇒ rn →  ⇒ {Sn} oscila ⇔ ∑krn es oscilante.
 −1 si n impar
2) Series Telescópicas: Una serie ∑an decimos que es telescópica si: an = bn + 1 - bn.
En este caso
Sn = a1 + a2 + ⋅⋅⋅ + an = b2 - b1 + b3 - b2 + ⋅⋅⋅ + bn + 1 - bn = -b1 + bn + 1
Por tanto
lim S = −b 1 + lim
nd∞ n
b
nd∞ n+1
Luego para que la serie telescópica sea convergente, ha de existir el lim b .

nd∞ n+1
Ejemplo.- Calcular la suma de la serie:

∞
n+1 .
n=1 (n + 2 )!
Solución.- La serie dada es telescópica ya que
an = n + 1 = 1 − 1
(n + 2 )! (n + 1 )! (n + 2 )!
y por tanto la suma n-ésima es
S n = a 1 + a 2 + ... + a n = 1 − 1 + 1 − 1 + ... + 1 − 1 + 1 − 1 = 1 − 1
2! 3! 3! 4! n! (n + 1 )! (n + 1 )! (n + 2 )! 2! (n + 2 )!
y por tanto la suma de la serie es S = lim S = 1.

nd∞ n 2
∞
3) Series Aritmético-geométricas: n $ r n con |r| < 1
n=1
Para resolverlas habrá que efectuar los siguientes pasos:
Sn = 1r + 2r2 + ⋅⋅⋅ + nrn
rSn = r2 + 2r3 + ⋅⋅⋅ + nrn+1
(1 - r)Sn = r + r2 + ⋅⋅⋅ + rn - nrn+1
(1 − r )S n = r 1 − r − nr n+1
( n)
1−r
Por tanto
lim S = r y la serie ∑nrn es convergente y tiene suma r .

nd∞ n (1 − r ) 2 (1 − r ) 2
a n +
4) Series hipergeométricas: ∑an con an+1
n
= n + y α y γ no nulos simultáneamente. Entonces
a 2 1 +
a 1 = 1 + e 1a 2 + a 2 = 1a 1 + a 1
a 3 2 +
a 2 = 2 + e 2a 3 + a 3 = 2a 2 + a 2
⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅
a n+1 n +
a n = n + e na n+1 + a n+1 = na n + a n
sumando miembro a miembro estas igualdades y simplificando, queda
a n (n + ) − a 1
Sn =
+−
Si existe el lim S diremos que la serie converge, y su suma será el valor de dicho límite.
nd∞ n
Resultados relativos al carácter de una serie
Teóricamente el carácter de una serie ∑an se reduce al estudio del carácter de la sucesión {Sn} de sus
sumas parciales, pero en la práctica, importa poder decir si la serie es o no convergente a la vista de como
se comportan los términos an. Los siguientes teoremas tratan de cumplir este objetivo.
Teorema. (Criterio general de Cauchy) La condición necesaria y suficiente para que la serie ∑an sea
convergente es que
n+h
∀ ε > 0 ∃ n0 ∈ N / ∀ n ≥ n0 y ∀ h ∈N ⇒ ak <
k=n+1
Teorema. Si ∑an es convergente ⇒ lim a = 0.

nd∞ n
Por tanto si lim a ! 0 ⇒ ∑an no es convergente. Si lim

nd∞ n
a = 0, ∑an pude ser convergente o no
nd∞ n
convergente.
∞
Ejemplo.- Estudiar el carácter de la serie: n2 .
n=1 (n + 1)(n + 2)
Solución.- Como
lim n2 =1!0
nd∞ (n + 1)(n + 2)
la serie dada diverge.
Teorema. Si el resto de índice "k" tiende a cero cuando k → ∞, entonces la serie es convergente.
Teorema. El carácter de una serie no se altera cuando se suprimen los "k" primeros términos de la
misma.
Teorema. El carácter de una serie no se altera, cuando multiplicamos todos sus términos por una
constante no nula.
Teorema. El carácter de una serie convergente o divergente, no se altera, así como la suma de la
misma en el primer caso, si se sustituyen grupos de términos consecutivos por sus correspondientes
sumas.
En cambio, si la serie fuese oscilante, con la transformación anterior se puede obtener otra serie de
distinto carácter que la dada. Así, por ejemplo, de la serie ∑(-1)n, claramente oscilante, se deduce esta
otra:
- 1 + (1 - 1) + (1 - 1) + ⋅⋅⋅⋅
cuya suma es igual a menos uno.

Series de términos positivos
Definición. Dada la serie ∑an, decimos que es una serie de términos positivos si: an ≥ 0 ∀n ∈ N.
Propiedades de las series de términos positivos.

1. Si ∑an es una serie de términos positivos, es convergente o divergente, pero nunca oscilante.
2. Cada término de una serie de términos positivos se puede descomponer arbitrariamente en varios
sumandos positivos sin alterar el carácter de la serie, así como su suma cuando esta sea
convergente.
Criterios de convergencia para series de términos positivos
1.- Criterio de comparación: Sea ∑an y ∑bn dos series de términos positivos, ∑an de carácter
desconocido y ∑bn de carácter conocido. Entonces:
a) Si an ≤ bn ∀ n ∈ N, ⇒ si ∑bn converge ⇒ ∑an converge.
b) Si bn ≤ an ∀ n ∈ N, ⇒ si ∑bn diverge ⇒ ∑an diverge.
2.- Criterio de comparación por paso al límite: Sean ∑an y ∑bn dos series de términos positivos, ∑an
de carácter desconocido y ∑bn de carácter conocido. Entonces:
 ! 0 y ! ∞ a n y b n tienen el mismo carácter.

an 
Si lim
nd∞ b n
=e =0 Si b n converge, a n también converge.
 = +∞ Si b n diverge, a n también diverge.

Nota.- Para poner en práctica los criterios anteriores debemos disponer de algunas series cuyo
comportamiento sea conocido, a las cuales podemos comparar la serie propuesta. Los patrones más
apropiados para este objeto son la serie geométrica ya estudiada y la serie de Riemann
∞
1p
n=1 n
llamada también serie armónica general, cuyo carácter es el siguiente:

a) Si p > 1 es convergente
b) Si p ≤ 1 es divergente
Ejemplo.- Estudiar el carácter de la serie:

∞ 4
sen
n=1 n2
n
4 ∞
Solución.- sen2 n [ 12 ≤n c N e como 12 es convergente, la serie dada converge.
n n n=1 n

∞
1
n=1
n −2
3
∞
Solución.- 1 [ 1 e como 1 diverge, la serie dada diverge.
n n −2 n=1 n
3

∞1 − cos
n

n=1 nk
Solución.-
1 − cos
n
2 2
= lim n p−(2+k ) = si p = 2 + k ⇒
n k
lim
nd∞ 1 2 nd∞ 2
np
Si 2 + k > 1 ⇒ k > -1, la serie dada converge.
Si 2 + k ≤ 1 ⇒ k ≤ -1, la serie dada diverge.
Ejemplo.- Estudiar el carácter de la serie: 2 + cos

∞
n.
n=1 n
Solución.- Aplicando el criterio de comparación se tiene que
1 < 2 + cos n
n n
∞
y como 1n , es una p-serie divergente, la serie dada diverge.
n=1
∞
Ejemplo.- Estudiar el carácter de la serie: 1 .
n=1 n+ n
Solución.- Aplicando el criterio de comparación se tiene que
1 [ 1
2n n + n
∞
y como 1 , es una serie divergente, la serie dada diverge.
n=1 2n
3.- Criterio de cociente o de D'Alembert: Sea la serie ∑an con an ≥ 0 ∀ n ∈ N:

 < 1 la serie converge.
a n+1 
Si lim
nd∞ a n
= e  > 1 la serie diverge.
 = 1 el criterio no decide.

1 +n!n
∞ 2
n=0
Solución.- Aplicando el criterio del cociente se tiene que:
1 + (n + 1 )
2
a n+1 (n + 1 )! 1 + (n + 1 )
2
lim = lim = lim = 0 < 1⇒ la serie dada converge.
nd∞ a n nd∞ 1 + n2 nd∞ (1 + n 2 )(n + 1 )
n!

∞ n
2
n=1 n!
Solución.- Aplicando el criterio del cociente se tiene que:
2 n+1
(n + 1)! 2 = 0 < 1 ⇒ la serie dada converge.
lim = lim
nd∞ n + 1
nd∞ 2n
n!
4.- Criterio de la raíz o de Cauchy: Sea la serie ∑an con an ≥ 0 ∀ n ∈ N:
 < 1 la serie converge.


Si lim n a n = e  > 1 la serie diverge.
nd∞

∞ n
Ejemplo.- Estudiar el carácter de la serie: cos a + bn 0<a<
n=1 2
Solución.-
n
lim
nd∞
n a n = lim
nd∞
n cos a + bn = lim
nd∞
cos a + bn = cos a < 1
ya que a ∈ (0, ), entonces la serie dada converge.

2
5.- Criterio logarítmico: Sea la serie ∑an con an ≥ 0 ∀ n ∈ N:
 > 1 la serie converge.

L a1n 
Si lim
nd∞ Ln
= e  < 1 la serie diverge.

1 1
∞ 1+ 2 +$$$+ n−1
1
n=2 3
Solución.-
L a1n 1 + 1 + $ $ $ + 1 L3 L(n − 1 )L3

lim = lim 2 n−1 = lim = L3 > 1
nd∞ Ln nd∞ Ln nd∞ Ln
entonces, la serie dada converge.
6.- Criterio de Raabe: A este criterio se recurre, principalmente cuando no decide el criterio del
cociente. Sea la serie ∑an con an ≥ 0 ∀ n ∈ N:
 > 1 la serie converge.

a n+1 
Si lim n 1 − a n = e  < 1 la serie diverge.
nd∞


∞
1 1− k 1− k $$$ 1− k
n=1 n 1 2 n
Solución.-
a n+1 n 1− k
lim = lim
nd∞ n + 1
=1
nd∞ a n n+1
⇒ aplicamos el criterio de Raabe
n 1− k n 2 (k + 1 ) + n
lim n 1− = lim =k+1
nd∞ n+1 n+1 nd∞ (n + 1 ) 2
Si k + 1 > 1 ⇔ k > 0 ⇒ la serie dada converge.
Si k + 1 < 1 ⇔ k < 0 ⇒ la serie dada diverge.
Si k + 1 = 1 ⇔ k = 0, no decide; pero la serie se transforma en 1n que es una serie divergente.
∞
2$3$$$ n+1( )
n=1 4 $ 5 $ $ $(n + 3)
.
Solución.- Aplicamos el criterio del cociente:
2 $ 3 $ $ $(n + 2 )
4 $ 5 $ $ $(n + 4) n+2 =1
lim
nd∞ 2 $ 3 $ $ $(n + 1 )
= lim
nd∞ n + 4
4 $ 5 $ $ $(n + 3)
como el criterio del cociente no decide, aplicamos el criterio de Raabe:
lim n 1 − n + 2 = lim 2n = 2 > 1

nd∞ n+4 nd∞ n + 4
entonces la serie dada converge.
7.- Criterio integral: Sea f: [1, +∞) → R una función positiva, decreciente y sea an = f(n) ∀ n ∈ N.
∞
Entonces, la serie an y la integral impropia
n=1
¶ 1∞ f(x)dx tienen el mismo carácter.

∞
1
n=2 nLn
Solución.- La serie dada diverge ya que:
¶ 2∞ xLx
1 dx = lim [L Ln
nd∞
− L L2 ] = ∞
Series de términos positivos y negativos
Supongamos ahora una serie: a1 + a2 + ⋅⋅⋅ + an + ⋅⋅⋅, que contiene infinitos términos positivos y otros
infinitos negativos. Formemos la serie |a1| + |a2| + ⋅⋅⋅ + |an| + ⋅⋅⋅, a la que llamaremos serie de los valores
absolutos de la serie ∑an y que representaremos por ∑|an|.
Definición. La serie ∑an es absolutamente convergente, si la serie ∑|an| es convergente.
Teorema. Si ∑an es absolutamente convergente, entonces ∑an es convergente.
Se debe advertir que el teorema recíproco no es, por lo general, cierto. Si la serie ∑an es convergente,
no es forzoso que lo sea la serie ∑|an|. Cuando este caso se presenta, se dice que la serie ∑an es
condicionalmente convergente.
Series alternadas
Ofrecen interés especial aquellas series cuyos términos son alternativamente positivos y negativos. Por
ello se llaman alternadas. Si no son absolutamente convergentes, se puede aplicar el teorema siguiente:
Teorema. (Criterio de Leibnitz) Si los términos de una serie alternada ∑an verifican las condiciones:
a) |an+1| < |an| ∀n ∈ N
b) lim a =0
nd∞ n
entonces la serie ∑an es convergente.
(−1 ) n
∞
Ejemplo.- Estudiar el carácter de la serie: n .
n=1
∞
Solución.- Si consideramos la serie de valores absolutos, obtenemos 1n , que es una serie divergente;
n=1
∞ (−1 ) n
pero, esto no nos dice nada del carácter de la serie n .
n=1
Como la serie dada es alternada, aplicamos el criterio de Leibnitz;
a) |an+1| = 1 [ 1 = |a |
n+1 n n
(−1 ) n
b) lim
nd∞ n =0
∞ (−1 ) n
y por verificarse a) y b), la serie n , es convergente (condicionalmente convergente).
n=1
∞
Ejemplo.- Estudiar el carácter de la serie: (−1 ) n tg 1n .
n=1
Solución.- Es una serie alternada y verifica que:
(−1 ) n+1 tg 1 = tg 1 [ tg 1n = (−1 ) tg 1n

n
y lim (−1 ) n tg 1n = 0
n+1 n+1 nd∞
entonces, por el criterio de Leibnitz, la serie dada converge.

Estudiar el carácter de las series:
∞ 1 + 1 + $ $ $ + 1n
1. 2
n=2 n 3 Ln
∞
2. ( n a − 1 ) n (a > 0 )
n=1
∞ (n! ) 2 x 2n
3.
n=0 (2n )!
∞
4. 1
n=0 n!
∞
5. 1 ≤p c R
n=2 (Ln ) p
∞
6. 1
n=2 (Ln ) Ln
∞
1
7.
n=0 e n 2 +1
8. 2 − 1
∞ 2n
n=1 2n − 1
∞
9. ( n n − 1 )
n
n=1
∞
10. arcsen 1
n=1 n
∞
11. an a, b c N
n=0 n + bn
12. a) Estudiar el caracter de la serie según los distintos valores del parametro "a":
∞ n
a 2
n=1 n(1 + na )
b) Sumar la serie para a = 1.
13. Hallar la convergencia de la serie:

∞
1 $ 3 $ 5 $ $ $(2n − 1) n

n=1 2 $ 4 $ 6 $ $ $(2n)
a
para los distintos valores del parámetro "a"

SERIES DE FUNCIONES
Sea {fn} una sucesión cuyos términos son funciones definidas en un cierto conjunto D ⊂ R.
Definición. Se llama campo de convergencia de la sucesión {fn} al conjunto
C = {x0 ∈ D / {fn(x0)} es una sucesión convergente}
Entonces tenemos un conjunto de valores límites en correspondencia con los valores x0 ∈ C, es decir
una función definida en el campo de convergencia de la sucesión {fn} y que se llama límite puntual de
ésta, representándose por
f = lim f
nd∞ n
Ejemplo.- Sea la sucesión {fn(x)} definida por
f n (x ) = nx
n+1
En este caso D = R y
f(x) = lim f (x ) = lim nx = x; por tanto C = R
nd∞ n nd∞ n + 1
Gráficamente.-
y=x
Y
f3
ε
f2
f1
0
X
Ahora bien interesa estudiar en qué forma ciertas propiedades de las funciones {fn} se transmiten a la
función límite "f". Por ejemplo, si cada fn es continua en un punto x0 ∈ C ¿la función f también es
continua en el punto x0? La respuesta no es siempre afirmativa, como muestran las funciones
fn(x) = xn
definidas en el intervalo [0, 1], las cuales son continuas en todo punto de dicho intervalo, mientras que,
como
 0 si 0 [ x < 1
f(x) = lim f (x ) = lim x n
= 
 1 si x = 1
nd∞ n nd∞
resulta que la función límite es discontinua en x = 1.

Gráficamente.-
Y
f1
·
fn
0 X
Definición. Decimos que la sucesión {fn} converge uniformemente a f(x) en C si:
∀ ε > 0 ∃ n0 ∈ N / ∀ n ≥ n0 ⇒ |fn(x) - f(x)| < ε ∀ x ∈ C.
Gráficamente.-
Y
f(x) + ε
f(x)
f(x) - ε
0 a b X
Gráficamente, la convergencia uniforme de una sucesión de funciones impone la existencia de una

banda limitada por las gráficas de las funciones y = f(x) ± ε, en la cual estarán contenidas las gráficas de
todas las funciones fn desde n ≥ n0.
Teorema. El límite de una sucesión uniformemente convergente de funciones continuas, es una

función continua.
Ejemplo.- Estudiar la convergencia uniforme en (0, 1) de la sucesión de funciones:
f n (x ) = 2
2 + nx
Solución.-
1. lim f (x ) = f(x) = 0.
nd∞ n
2. 2 − 0 < e n > 2 − 2; como la elección de n depende de "x", no existe convergencia

2 + nx x x
uniforme.
Ejemplo.- Estudiar la convergencia uniforme en (0, 1) de la sucesión de funciones: f n (x ) = x

2 + nx
Solución.-
1. lim f (x ) = f(x) = 0.
nd∞ n
2. x − 0 < e n > 1 − 2 . Pero si n > 1 e n > 1 − 2; que no depende de "x", entonces existe
2 + nx x x
convergencia uniforme.
2 2
Ejemplo.- Estudiar la convergencia uniforme de la sucesión de funciones f n (x ) = n x2 2 en el
1+n x
intervalo [-1, 1].
 1 si x ! 0
Solución.- lim
nd∞
f n (x ) = f(x) = 
 0 si x = 0
Como las fn son continuas en [-1, 1] ∀ n ∈ N, y la función f no es continua en [-1, 1], no existe
convergencia uniforme.
Series de funciones
Definición. Dada la sucesión {fn(x)} formemos la sucesión {Sn(x)} definida como
Sn(x) = f1(x) + f2(x) + ⋅⋅⋅⋅⋅ + fn(x)
Se denomina serie de funciones, y se representa por el símbolo ∑fn(x), al par de sucesiones

({fn(x)},{Sn(x)}).
Definición. Se llama campo de convergencia de la serie ∑fn(x) al conjunto
C = {x0 ∈ D / ∑fn(xo) es una serie convergente}
y donde D es el conjunto en el que estan definidas todas las fn.
Ejemplo.- Hallar el campo de convergencia de la serie:

∞ 2n+1
x
n=0 2n + 1
.
Solución.- Aplicamos el criterio del cociente:
x 2(n+1)+1  Si x 2 < 1 La serie converge

2(n + 1) + 1 
lim
x 2n+1 = x 2
e  Si x 2 > 1 La serie diverge
nd∞
 Si x 2 = 1 El criterio no decide
2n + 1 
Por tanto, si x ∈ (-1, 1), la serie converge, y si x ∈ (-∞, -1) ∪ (1, +∞), la serie diverge.
∞
Para x = 1, obtenemos 1 , que es una serie divergente.
n=0 2n + 1
Para x = -1, obtenemos −1 , que es una serie divergente.

∞
n=0 2n + 1
Entonces la serie converge en (-1, 1).
Definición. Se dice que la serie ∑fn(x) es uniformemente convergente, a una función f en C cuando la
sucesión {Sn(x)} es uniformemente convergente a f en C.
Teorema. (Criterio de Weierstrass) Si ∑an es una serie convergente de términos positivos y tal que
|fn(x)| ≤ an ∀ n ∈ N y ∀ x ∈ C,
entonces la serie ∑fn(x) es uniformemente convergente en C.
Teorema. Una serie uniformemente convergente de funciones continuas define una función continua.
Teorema. Sea ∑fn una serie de funciones derivables y con derivada finita en (a, b) y supongamos que
para cada c ∈ (a, b) la serie numérica ∑fn(c) converge y que la serie de las derivadas ∑fn' converge
uniformemente en (a, b). Entonces la serie de las funciones ∑fn converge uniformemente en (a, b) a una
función derivable f y se verifica
∞
f ∏ (x ) = f n∏ (x )
n=1
∞
Teorema. Sea {fn} una sucesión de funciones continuas en [a, b] y supongamos que fn converge
n=1
uniformemente en [a, b]. Entonces se verifica que:
∞ ∞
¶ ab n=1 b
¶ a f n (x )dx
f n (x ) dx = n=1
Series de potencias. Propiedades radio de convergencia
Definición. Se llama serie de potencias a la serie de funciones que tiene la forma

∞
anx n
n=0
Teorema. (Teorema de Abel) Si la serie ∑anxn converge para x = xo ≠ 0, entonces converge

absolutamente para todo x tal que |x| < |xo|.
Como consecuencia del teorema de Abel resulta que si la serie ∑anxn no converge para x = x1, tampoco
converge para cualquier "x" tal que |x| > |x1|, pues si fuese convergente en algún "c" tal que |c| > |x1|, por el
teorema de Abel también debería converger en el punto x1, contra lo que hemos supuesto.
RADIO DE CONVERGENCIA. Una serie de potencias es convergente para x = 0. Si dicha serie no

converge para algún valor x ≠ 0, según acabamos de ver, tampoco converge para otro valor cuyo módulo
supere el módulo de "x", luego el conjunto C formado por todos los puntos en los cuales la serie es
convergente está acotado, y entonces existe un extremo superior. Sea R dicho extremo superior. Según el
teorema de Abel, para todo "x" tal que |x| < R la serie es absolutamente convergente, ya que entre "x" y R
hay puntos de C, mientras que para todo punto "x" tal que |x| > R la serie no converge, pues de lo
contrario no sería R el extremo superior del conjunto C; para |x| = R la serie puede converger o no, pues el
extremo superior R puede pertenecer o no al conjunto C.
Definición. Al número R se le llama radio de convergencia de la serie; siendo (-R, R) el intervalo de

convergencia.
CÁLCULO DEL RADIO DE CONVERGENCIA.- En los criterios del cociente y de la raíz, dados
en el capítulo anterior para estudiar el carácter de una serie numérica, se fundan los siguientes resultados
que permiten determinar en muchos casos el radio de convergencia de una serie de funciones.
a n+1
1.- Dada la serie ∑anxn, si lim = ! 0 el radio de convergencia es R = 1 .
nd∞ an
Aplicando el criterio del cociente a la serie ∑|anxn| resulta que la serie dada será absolutamente
convergente para todo "x" tal que
a n+1 x n+1 a n+1

lim = x $lim = x < 1es decir, ∀ x ∈ R tal que x < 1
nd∞ anx n nd∞ an
En cambio, si λ|x| > 1, lo que ocurre cuando x > 1 , los términos |anxn| crecen con "n", luego no

tienden a cero; por tanto la serie dada no converge. Se deduce pues, que R = 1 es el radio de

convergencia. Si λ = 0, diremos que R es ∞.
2.- Si lim n
a n = el radio de convergencia de la serie ∑anxn es R = 1
nd∞
Aplicando el criterio de la raíz a la serie ∑|anxn| resulta
lim
nd∞
n
anxn = x
de modo que la serie será absolutamente convergente para todo "x" tal que λ|x| < 1 o sea |x| < 1 .

En cambio, si λ|x| > 1, lo que tiene lugar si |x| > 1 habrá una infinidad de términos |anxn| > 1, y en

consecuencia la serie no puede converger. Si λ = 0, diremos que R es ∞.
∞ n−1
Ejemplo.- ¿Para que valores de "x" converge la serie de funciones: x n ?
n=1 n3
Solución.-
lim
a n+1
= lim n3 n = 1 ⇒ el intervalo de convergencia es (-3, 3)
nd∞ an nd∞ (n + 1 )3 n+1 3
∞
Si x = 3 la serie se transforma en 1 que es divergente.
n=1 3n
(−1 ) n−1
∞
Si x = -3 la serie se transforma en que es convergente.
n=1 3n
Por tanto el campo de convergencia de la serie es [-3, 3).

∞ n
Ejemplo.- Hallar el campo de convergencia de la serie: x
n=1 n3
Solución.-
lim n
a n = lim 1 =1
nd∞ nd∞ n
n3
entonces el intervalo de convergencia es (-1, 1).
(−1 ) n
∞
Para x = -1 la serie se transforma en que es una serie convergente.
n=1 n3
∞
Para x = 1 la serie se transforma en 1 que es también convergente.
n=1 n3
Por tanto el campo de convergencia de la serie dada es [-1, 1].
∞
Como x n [ 1 ∀ x ∈ [-1, 1] y la serie 1 es convergente, ⇒ la serie dada converge
n3 n3 n=1 n3
uniformemente en todo el campo de convergencia.
∞
Ejemplo.- Hallar el campo de convergencia de la serie: (−1 )
n−1 xn
n=0 n
Solución.- Como es una serie de potencias, empezamos calculando el radio de convergencia:
(−1 ) n 1
= lim n+1 =1eR= 1 =1
nd∞ n−1 1
(−1 ) n
∞
Para x = 1, obtenemos (−1 ) n−1 1n , que es una serie alternada, y aplicando el criterio de Leibnitz,
n=0
converge.
∞ (−1 ) n ∞
1 , que es una serie divergente.
Para x = -1, obtenemos (−1 ) n−1 n = −
n=0 n=0 n
Operaciones con series de potencias
Si las series ∑anxn y ∑bnxn son convergentes en (-R, R), se verifica que:
1. ∑anxn ± ∑bnxn = ∑(an ± bn)xn.
2. ∑canxn = c∑anxn ∀ c ≠ 0.
3. (∑anxn)(∑bnxn) = ∑cnxn donde cn = aobn + a1bn-1 + ⋅⋅⋅⋅ + anbo.
Teorema. Sea la serie ∑anxn convergente en (-R, R) (R > 0), y e ∈ (0, R), entonces la serie converge
absoluta y uniformemente en [-e, e].
Teorema. La función f(x) = ∑anxn definida por una serie de potencias es derivable en (-R, R), y la
función derivada
∞
f ∏ (x ) = na n x n−1
n=1
se obtiene derivando término a término la serie dada. Las series
∑anxn y ∑nanxn-1
tienen el mismo radio de convergencia.

Desarrollo de una función en serie de potencias
Desarrollar una función en serie de potencias de x es obtener una serie entera cuya suma en todos los
puntos de un determinado conjunto coincide con los valores que toma la función en dicho conjunto.
El desarrollo en serie de potencias de "x" de una función f(x), cuando existe, es único y adopta la
forma de serie de Mac-Laurin
∞
f (n (0 ) n
f(x ) = x
n=0 n!
En efecto, si una función f(x) admite un desarrollo en serie de potencias:
f(x) = ∑anxn
válido para los puntos del intervalo de convergencia de la serie, aplicando reiteradamente el teorema
anterior encontramos que sus derivadas tienen el mismo intervalo de convergencia y se expresan de la
forma siguiente:
∞ ∞ ∞
f (1 (x ) = na n x n−1 , f (2 (x ) = n(n − 1 )a n x n−2 , ..., f (k (x ) = n! a x n−k
n=k (n − k )!
n
n=1 n=2
Entonces, si hacemos x = 0, resulta: f(0) = ao, f(1(0) = 1!a1, f(2(0) = 2!a2,... f(k(0) = k!ak,..., y teniendo
en cuenta el convenio de que f(0 = f, queda finalmente
f (k (0 )
ak = , k = 0, 1, 2,..
k!
lo que significa que todos los coeficientes del desarrollo f(x) = ∑anxn están determinados.
Observación. Para que una función f(x) pueda desarrollarse en serie de potencias ∑anxn se necesita que
f (n (0 )
sea indefinidamente derivable en el punto x = 0, y entonces a n = . Pero, además, es preciso que en
n!
los puntos donde la serie converge su suma coincida con f(x).
Desarrollo de algunas funciones fundamentales
∞ n
1. e x = x , ≤x c R.

n=0 n!
∞
(−1 ) n x 2n+1
2. sen x = , ≤x c R.
n=0 (2n + 1 )!
∞
(−1 ) n x 2n
3. cos x = , ≤x c R.
n=0 (2n )!
∞
(−1 ) n−1 x n
4. L(1 + x ) = n , ≤x c (−1, 1 ].
n=1
∞
m n
5. (1 + x ) m = x , ≤x c (−1, 1 ).
n=0 n
∞
(−1 ) n−1 x 2n−1
6. arctan x = , ≤x c [−1, 1 ].
n=1 2n − 1
Hallar el campo de convergencia de las siguientes series de funciones:

∞ n
x
1.
n=1 n
3
∞
(−1 ) n (x − 1 ) n
2.
n=1 2 n (3n − 1 )
∞
1
3.
n=1 n (1 + x2 )
n
∞
1−x n
4.
n=1
n2
1+x
∞ nx
e
5.
n=1 n 2 (nx + 1)
6. Empleando la definición, investigar la convergencia uniforme de la serie

∞
x

n=1 1 + n − 1 )x ](1 + nx )
[ (
(Sugerencia: Descomponer el término n-ésimo en fracciones simples)
7. Estudiar la convergencia uniforme de la serie:

∞ n
x

n=1 3

∞ 2
sen nx

n=1 2 − 1
n

∞
x , siendo x ≥ 0

n=0 (1 + x )
n
10. Estudiar si la sucesión de funciones
f n (x ) = 1 , n = 1, 2, 3,...
1 + x 2n
es uniformemente convergente.
11. Hallar el campo de convergencia de la serie:
(1 - x) + x(1 - x) + x2(1 - x) + ⋅⋅⋅⋅⋅
1 (x + 2 ) ?
∞ n
12. ¿Para que valores de "x" converge la serie de funciones:
n=1 2n − 1 (x − 1 ) n
SERIES DE FOURIER
Introducción
FUNCIONES PERIÓDICAS.- En la física y en la técnica son innumerables los fenómenos de

carácter periódico, es decir, fenómenos en los cuales las cantidades que en ellos varían toman sucesiones
de valores que se repiten a intervalos iguales de tiempo. Basta citar todos los fenómenos vibratorios y
oscilatorios que son el fundamento de la acústica, de la telecomunicación de la transmisión de energía a
distancia etc.
En todos estos fenómenos físicos las cantidades variables dependen periódicamente del tiempo. En
matemáticas se prescinde de la naturaleza física de la variable independiente que se designa usualmente
por "x" y se da la siguiente definición general de periodicidad:
Definición. Sea f(x) una función definida en un conjunto D ⊂ R. Se dice f(x) es periódica de período
"p" cuando se verifica que:
f(x + p) = f(x) ∀ x ∈D.
Si "p" es el menor número positivo que verifica esta condición, lo llamaremos período fundamental.
Definición. Se llama serie trigonométrica a la serie de funciones de la forma:

ao ∞ (
+ a n cos nx + b n sen nx )
2 n=1
Si esta serie converge, su suma es una función periódica f(x) de período 2π, puesto que sennx y cosnx
son funciones periódicas de período 2π. Los números ao, an, bn (n = 1, 2,...) se llaman coeficientes de la
serie trigonométrica.
Determinación de los coeficientes de la serie mediante las fórmulas de Fourier
Supongamos que una función periódica f(x) de período 2π es tal que podemos representarla como una
serie trigonométrica que converja hacia la función dada en el intervalo (-π, π), es decir, que sea la suma de
esta serie:
a ∞
f(x) = o + (a n cos nx + b n sen nx ) (*)
2 n=1
Los coeficientes ao, an, bn (n = 1, 2,...) se calculan de la foma:
1
a0 = ¶ − f(x)dx.
1
ak = ¶ − f(x) cos kxdx.
1
bk = ¶ − f(x) sen kxdx.
Los coeficientes así determinados, se llaman coeficientes de Fourier de la función f(x), y la serie
trigonométrica formada con tales coeficientes se llama serie de Fourier de la función f(x).
Existencia del desarrollo en serie de Fourier de una función f(x)
Definición. Decimos que una función f(x) es monótona a tramos en el intervalo [a, b], si existe una
partición del intervalo {a = xo, x1,..., xn = b} tal que f(x) es monótona en (xi-1, xi) ∀ i = 1, 2,..., n.
Gráficamente.-
De la definición se deduce que si la función
Y y = f(x) f(x) es monótona a tramos y acotada en el
intervalo[a, b], entonces puede tener sólo puntos
de discontinuidad de primera especie (con salto
finito).
Teorema. Si la función periódica f(x) de

período 2π es monótona a tramos y acotada en
el intervalo (-π, π), entonces la serie de Fourier,
correspondiente a esta función, converge en
todos los puntos. La suma de la serie obtenida
0 a x1 x2 b S(x) es igual al valor de la función f(x) en los
X
puntos de continuidad de la función. En los
puntos de discontinuidad de la función f(x), la
suma de la serie es igual a la media aritmética de los límites de la función f(x) a la derecha y a la
izquierda; es decir, si x = c es un punto de discontinuidad de la función f(x), entonces
lim f(x) +xdc

xdc +
lim− f(x)
S(c ) =
2
De este teorema se deduce que la clase de las funciones que pueden ser representadas por las series de
Fourier, es bastante amplia.
Ejemplos de desarrollos de funciones en series de Fourier
Ejemplo.- Sea una función periódica f(x) de período 2π definida del modo siguiente
f(x) = x -π < x ≤ π
Y
π
−3π −π π 3π
−4π −2π 0 2π 4π
X
−π
Solución.-
Es una función monótona a tramos y acotada por tanto admite desarrollo en serie de Fourier
1
ao = ¶ − xdx = 0; a k = 1 ¶ − x cos kxdx = 0; b k = 1 ¶ − x sen kxdx = (−1 ) k+1 2k
De este modo, obtenemos la serie
f(x) = 2 sen x − sen 2x + sen 3x − $ $ $ (−1 ) sen kx $ $ $

k+1
1 2 3 k
 −x si − [ x [ 0

f(x) = 
 x si 0 < x [

Solución.- Calculemos los coeficientes
1 ¶ f(x)dx = 1 ¶ 0 (−x )dx + ¶ xdx =

ao = − − 0
 0 para k par
1 ¶ 0 (−x ) cos kxdx + ¶ x cos kxdx = 
ak = − 0 
 − 4 para k impar
 k 2
1 ¶ 0 (−x ) sen kxdx + ¶ x sen kxdx = 0
bk = − 0
De este modo, obtenemos la serie
4 cos x + cos 3x + cos 5x + $ $ $ + cos(2p + 1 )x + $ $ $

f(x) = −
2 12 32 52 (2p + 1 ) 2
Esta serie converge en todos los puntos y su suma es igual a la función dada.
 −1 si − [ x < 0

f(x) = 
 1 si 0 [ x [

Solución.- Esta función es monótona a tramos y acotada en el [-π, π].

Y
1
−3π −π π 3π
−4π −2π 0 2π 4π
X
−1
Calculemos los coeficientes
1
ao = ¶ − f(x)dx = 1 ¶ −0 (−1 )dx + ¶ 0 1dx =0
1
ak = ¶ −0 (−1 ) cos kxdx + ¶ 0 1 cos kxdx =0
 0 para k par
1 ¶ 0 (−1 ) sen kxdx + ¶ x sen kxdx = 
bk = − 0 
 4 para k impar
 k
Por consiguiente, la serie de Fourier de la función considerada tiene la forma
4 sen x + sen 3x + sen 5x + $ $ $ + sen(2p + 1 )x + $ $ $

f(x) =
1 3 5 (2p + 1 )
Esta igualdad es válida en todos los puntos, excepto los de discontinuidad, en los que la suma vale
cero.
Observación sobre el desarrollo en serie de Fourier
Indiquemos la siguiente propiedad de una función f(x) periódica de período 2π:
¶ − f(x)dx = ¶ +2 f(x)dx ≤ c R
Gráficamente.- (Las áreas sombreadas son iguales)
−4π −3π −2π −π 0 π 2π λ 3π 4π λ+2π

X
De esta propiedad se deduce que, al calcular los coeficientes de Fourier, podemos sustituir el intervalo
de integración (-π, π) por otro intervalo (λ, λ + 2π), es decir podemos poner:
1
ao = ¶ +2 f(x)dx, 1
ak = ¶ +2 f(x) cos kxdx, 1
bk = ¶ +2 f(x) sen kxdx,
donde λ es un número arbitrario.
Esto se deduce del hecho que la función f(x) es, por hipótesis, periódica de período 2π; por
consiguiente, las funciones f(x)cosnx y f(x)sennx son también funciones periódicas de período 2π.
Mostremos con un ejemplo como en algunos casos la propiedad demostrada simplifica el proceso de
cálculo de los coeficientes.
Ejemplo.- Supongamos que se desea desarrollar en serie de Fourier la función f(x) de período 2π, que,
en el intervalo 0 ≤ x ≤ 2π, viene dada por:
f(x) = x
La gráfica de f(x) es
Y
−4π −3π −2π −π 0 π 2π 3π 4π

X
Esta función viene dada en el intervalo [-π, π] por las fórmulas
 x + 2 si − [ x < 0

f(x) = 
 x si 0 [ x [

Ahora bien, en el intervalo [0, 2π], esta función está definida de modo muy simple por una sola
fórmula f(x) = x. Por eso, para desarrollar esta función en serie de Fourier es más conveniente utilizar las
fórmulas
1
ao = ¶ +2 f(x)dx, 1
ak = ¶ +2 f(x) cos kxdx, 1
bk = ¶ +2 f(x) sen kxdx,
haciendo λ = 0.
1
ao = ¶ 02 xdx = 2, 1
ak = ¶ 02 x cos kxdx = 0, 1
bk = ¶ 02 x sen kxdx = − 2k ,
Por consiguiente
f(x) = − 2 sen x − 2 sen 2x − 2 sen3x − $ $ $

1 2 3
Esta serie representa la función dada en todos los puntos excepto en los de discontinuidad (es decir,
excepto en los puntos x = 2kπ k ∈ Z). En estos puntos la suma de la serie es igual a la mitad de la suma de
los límites de la función f(x) a la derecha y a la izquierda (es decir, en el caso dado, al número π).
Series de Fourier de funciones pares e impares
Sabemos que una función f(x) es par, cuando f(x) = f(-x) ∀ x ∈ Domf. Entonces si f(x) es una función
par se verifica que
¶ −aa f(x)dx = 2 ¶ 0a f(x)dx

Análogamente, sabemos que una función f(x) es impar, cuando f(x) = - f(-x) para todo ∀x ∈ Domf.
Entonces si f(x) es una función impar se verifica que
¶ −aa f(x)dx = 0
Si f(x) se desarrolla en serie de Fourier y es una función impar, el producto de f(x)coskx es también
una función impar y f(x)senkx es una función par; por consiguiente,
1
a0 = ¶ − f(x)dx = 0; 1
ak = ¶ − f(x) cos kxdx = 0; 2
bk = ¶ 0 f(x) sen kxdx
es decir, la serie de Fourier de una función impar contiene solamente senos.
Si una función f(x) par se desarrolla en serie de Fourier, el producto de f(x)senkx es una función impar,
y f(x)coskx es una función par, por consiguiente,
2
a0 = ¶ 0 f(x)dx; 2
ak = ¶ 0 f(x) cos kxdx; 1
bk = ¶ − f(x) sen kxdx = 0
λ
Series de Fourier de funciones de periodo 2λ
Si f(x) es una función periódica de período 2λ. Su desarrollo en serie de Fourier es:
a ∞
f(x ) = o + a k cos k x + b k sen k x
2 k=1
donde
ao = 1

¶ − f(x)dx,
ak = 1

¶ − f(x) cos k xdx,
bk = 1

¶ − f(x) sen k xdx
Notemos que todos los teoremas formulados para las series de Fourier de las funciones periódicas de
período 2π, son válidos también para las series de Fourier de las funciones periódicas de cualquier otro
período 2λ. En particular, subsiste el criterio suficiente para el desarrollo de una función en serie de
Fourier, la observación sobre la posibilidad de calcular los coeficientes de la serie, integrando en un
intervalo arbitrario de longitud igual al período, así como la observación sobre la posibilidad de
simplificar el cálculo de los coeficientes de la serie, cuando la función sea par o impar.
Desarrollo de una función no periódica en serie de Fourier
Supongamos que en un cierto intervalo [a, b] está definida una función monótona a tramos f(x).
Mostremos que podemos representar esta función f(x) en los puntos de continuidad por una serie de
Fourier. Para ello, consideremos una función arbitraria periódica monótona a tramos f1(x) de período 2µ >
b - a, que coincide con la función f(x) en el intervalo [a, b]. Desarrollemos f1(x) en serie de Fourier. La
suma de la serie en todos los puntos del intervalo [a, b] (excepto en los de discontinuidad) coincide con la
función f(x), lo que significa que hemos desarrollado f(x) en serie de Fourier en el intervalo [a, b].
Consideremos ahora el siguiente caso. Sea f(x) una función definida en el intervalo [0, λ].
Completando la definición de esta función de modo arbitrario en el intervalo (-λ, 0) (conservando la
monotonía a tramos), podemos desarrollar esta función en serie de Fourier. En particular, si completamos
la definición de la función dada, de modo que en el intervalo -λ < x < 0 se tenga que f(x) = f(-x),
obtenemos en definitiva una función par. (En este caso se dice que la función f(x) es prolongada de
manera par). Esta función se desarrollada en serie de Fourier, que contiene solamente cosenos. De este
modo la función f(x), definida en el intervalo [0, λ], la hemos desarrollado en serie de cosenos.
Si completamos la definición de la función f(x) para -λ < x < 0 de modo que f(x) = -f(-x), obtenemos
una función impar que se desarrolla en serie de senos. (La función f(x) es prolongada de manera impar).
De este modo, si en el intervalo [0, λ] está definida una cierta función monótona a tramos f(x), podemos
desarrollarla tanto en serie de Fourier de cosenos como en serie de Fourier de senos.
Ejemplo.- Desarrollar la función f(x) = x en el intervalo [0, π] en serie de senos.
Solución.- Prolongando esta función de manera impar de la forma:
 f(x) Si x c [0, ]
f 1 (x ) = 
 g(x) Si x c (−, 0 ) / f 1 es una función impar en (−, )
∞
e f 1 (x ) = b n sen n x = f(x) ≤x c (0, ), y donde λ en este caso es π.
n=1
f(x) = 2 sen x − sen 2x + sen 3x − $ $ $ (−1 ) sen kx $ $ $

k+1
1 2 3 k
Ejemplo.- Desarrollar la función f(x) = x en el intervalo [0, π] en serie de cosenos.
Solución.- Prolongando la función de manera par, tenemos
 f(x) Si x c [0, ]
f 1 (x ) = 
 g(x) Si x c (−, 0 )/ f 1 es una función par en (−, )
a0 ∞
e f 1 (x ) = + a n cos n x = f(x) ≤x c (0, ), y donde λ en este caso es π.
2 n=1
4 cos x + cos 3x + cos 5x + $ $ $ + cos(2p + 1 )x + $ $ $

f(x) = −
2 12 32 52 (2p + 1 ) 2
1. a) Hallar los coeficientes de Fourier de la función:

 0 si −5 < x < 0

f(x) = 
 3 si 0 < x [ 5

b) Escribir la serie de Fourier correspondiente.
c) ¿Como hay que definir f(x) en x = -5, x = 0, y x = 5 para que la serie de Fourier converja hacia
f(x) para -5 ≤ x ≤ 5?
2. Desarrollar f(x) = x2, 0 < x < 2 en serie de Fourier.
3. Desarrollar f(x) = senx, 0 < x < π, en serie de Fourier de cosenos.
4. Desarrollar f(x) = x, 0 < x < 2, en serie a) de cosenos, b) de senos.
5. Hacer la gráfica, y el desarrollo en serie de Fourier de la función:

 8 si 0 < x < 2

f(x) = 
 −8 si 2 < x < 4


 −x si −4 [ x [ 0

f(x) = 
 x si 0 [ x [ 4

f(x) = 4x, 0 < x < 10

 2x si 0 [ x < 3

f(x) = 
 0 si −3 < x < 0

9. Desarrollar f(x) = cosx, 0 < x < π, en serie de senos de Fourier.
10. Desarrollar f(x) = cosx, 0 < x < π, si el período es π.
11. Desarrollar a) en serie de senos b) en serie de cosenos; la función:

 x si 0 < x < 4

f(x) = 
 8 − x si 4 < x < 8

ENM Matemáticas I Funciones de varias variables 1
TEMA 3
LIMITES Y CONTINUIDAD
Introducción
Vamos a estudiar las funciones f: G ⊂ Rn → Rm. Cuando m = 1 se llaman campos escalares y cuando
m > 1 se llaman campos vectoriales. Ejemplos de estas funciones son los siguientes:
Ejemplo. El volumen V de un paralelepípedo recto, cuyas aristas tienen longitudes x, y, z, viene dada
por la fórmula V = xyz. Aquí V: G ⊂ R3 → R es un campo escalar que depende tres variables.
Ejemplo. La función que a cada punto del espacio le asocia su temperatura. T: G ⊂ R3 → R es un

campo escalar que depende de tres variables (o cuatro si consideramos el tiempo).
Ejemplo. La función que a cada punto de un fluido le asocia su velocidad. V: G ⊂ R3 → R3 es un

campo vectorial que depende de tres variables (o cuatro si consideramos el tiempo).
Definición. Sean x = (x1, ..., xn) e y = (y1, ..., yn) ∈ Rn. Se llama producto interior de x por y a:
x⋅y = x1y1 + ... + xnyn
Definición. Sea x = (x1, ..., xn) ∈ Rn. Se llama norma (euclídea) de x al número real:
æx æ = x$x = x 21 + ... + x 2n
Desigualdad de Cauchy-Schwarz. |x⋅y| ≤ ||x||⋅||y||.
Propiedades: ∀ x, y ∈ Rn y ∀ λ ∈ R, se verifica:
1. ||x|| ≥ 0; ||x|| = 0 ⇔ x = 0 = (0, ... ,0).
2. ||λx|| = |λ|⋅||x||.
3. ||x + y|| ≤ ||x|| + ||y||.
Definición. Se llama bola (abierta) de centro el punto x0 ∈ Rn y radio δ > 0, al conjunto:
B(x0, δ) = {x ∈ Rn / ||x - x0|| < δ}
Definición. Se llama bola reducida de centro el punto x0 y radio δ > 0, al conjunto:
B*(x0, δ) = B(x0, δ) - {x0}
Definición. Sean G ⊂ Rn y x0 ∈ G. Decimos que x0 es un punto interior de G si: ∃ δ > 0 / B(x0, δ) ⊂ G.

Definición. Sea G ⊂ Rn. Decimos que G es un conjunto abierto de Rn, si todos sus puntos son interiores.
Definición. Sea G ⊂ Rn. Se llama frontera de G, al conjunto:
F(G) = {x0 ∈ Rn / ∀ δ > 0 B(x0, δ) ∩ G ≠ ∅ y B(x0, δ) ∩ Gc ≠ ∅}
Definición. Sea G ⊂ Rn. Decimos que G es un conjunto cerrado de Rn, si:
Gc = Rn - G es un conjunto abierto de Rn
Definición. Decimos que un conjunto G ⊂ Rn está acotado cuando:
∃ δ > 0 / G ⊂ B(0, δ)
Definición. Decimos que un conjunto G ⊂ Rn es compacto, si es cerrado y acotado.
Definición. Decimos que un conjunto G ⊂ Rn es convexo si:
∀ x0, x1 ∈ G, x0 + λ(x1 - x0) ∈ G ∀ λ ∈ (0, 1)
Definición. Decimos que un conjunto G ⊂ Rn es no conexo si:
G = (A ∩ G) ∪ (B ∩ G) y (A ∩ G) ∩ (B ∩ G) = ∅
donde A y B son conjuntos no vacíos y ambos abiertos de Rn.
Definición. Un conjunto G ⊂ Rn se llama conexo si no es "no conexo".
Definición. Decimos que un conjunto G ⊂ Rn es arco conexo si:
∀ x0, x1 ∈ G, ∃ α: [a, b] ⊂ R → G, continua en [a, b] tal que α(a) = x0 y α(b) = x1
Definición. Sean G ⊂ Rn y x0 ∈ Rn. Decimos que x0 es un punto de acumulación de G si:
∀ δ > 0 / B*(x0, δ) ∩ G ≠ ∅
Definición. Sean G ⊂ Rn y x0 ∈ G. Decimos que x0 es un punto aislado de G si:
∃ δ > 0 / B(x0, δ) ∩ G = {x0}

Límites
Sean f = (f1, ..., fm): G ⊂ Rn → Rm, x0 un punto de acumulación de G y λ ∈ Rm.
Definición. Se dice que la función f(x) tiene límite λ cuando x tiende hacia x0, si:
∀ ε > 0 ∃ δ > 0 / ∀ x ∈ [G ∩ B*(x0, δ)] ⇒ f(x) ∈ B(λ

λ, ε)
o también
∀ ε > 0 ∃ δ > 0 / ∀ x ∈ G y 0 < ||x - x0|| < δ ⇒ ||f(x) - λ|| < ε ⇔ lim æf(x) − æ = 0.
æx−x 0 æd0
Cuando esto ocurre se escribe:
lim f(x) =
xdx0
Teorema. El límite de f(x) cuando x tiende hacia x0, si existe, es único.
Ejemplo. Demostrar, usando directamente la definición que:
lim (x + y) = 3
(x,y )d(2,1 )
Solución. El dominio de definición de la función f(x, y) = x + y es G = R2.
Se ha de demostrar que: ∀ ε > 0, ∃ δ > 0 / 0 < (x − 2 ) 2 + (y − 1 ) 2 < δ ⇒ |(x + y) - 3| < ε
|(x + y) - 3| = |(x - 2) + (y - 1)| ≤ |x - 2| + |y - 1| < 2δ
y dicha desigualdad es menor que ε si es δ ≤ .

2
Propiedades de los límites
Sean x0 un punto de acumulación de G ⊂ Rn, f, g: G → Rm y λ, µ ∈ Rm tales que:
lim
xdx 0
f(x) = , xdx
lim0 g(x) =
lim0 [f(x) + g(x) ] =

1. xdx +
∀ α, β ∈ R.
lim0 [f(x) $ g(x) ] = $
2. xdx
lim0 æf(x) æ = æ æ
3. xdx
f(x)
4. Si m = 1 y µ ≠ 0, ⇒ xdx
lim0 g(x) =
lim0 f(x) = = ( 1 , ..., m ) w xdx

5. xdx lim0 f i (x) = i ∀ i = 1, 2, ..., m.
Límite dirigido. Casos particulares
LÍMITE DIRIGIDO. Se llama así, al límite cuando el punto x tiende hacia x0 y x ∈ L ⊂ G, siendo x0
un punto de acumulación de L. Puede ocurrir que tomando distintos conjuntos L se encuentren límites
distintos. Naturalmente que si existe límite en x0, existe el límite dirigido (cualquiera que sea el L) y
coincide con aquél. Pero puede existir el segundo y no el primero.
Como casos particulares (f: G ⊂ R2 → R, x0 = (x0, y0)) de límites dirigidos, veremos los siguientes:
LÍMITES RADIALES. El conjunto L es la recta y - y0 = m(x - x0). Para que exista el límite, en estos
límites radiales el resultado no debe depender de m.
LÍMITES POR PARÁBOLAS. El conjunto L es y - y0 = m(x - x0)2 ó x - x0 = m(y - y0)2. Para que
exista el límite, en estos límites por parábolas el resultado no debe depender de m.
LÍMITES REITERADOS. Consiste en hacer tender primero x hacia x0 y después y hacia y0, o bien al
revés. En este caso (x, y) tiende hacia (x0, y0) siguiendo una quebrada de lados paralelos a los ejes. Para
que exista el límite, estos límites reiterados deben coincidir.
LÍMITES POR POLARES. Consiste en sustituir x por x0 + ρcosθ e y por y0 + ρsenθ y tomar límites
cuando ρ → 0. Para que exista el límite por polares, el resultado no debe depender de θ.
Ejemplo. Comprobar que la función:
 x 2 − y2
 x 2 + y 2 si (x, y) ! (0, 0 )
f : (x, y ) c R d f(x, y) = 
2

 0 si (x, y) = (0, 0)
no posee límite en el origen.
Solución.
x 2 − y2 x 2 = 1; lim lim x − y = lim −y = −1

2 2 2
lim lim = lim
xd0 yd0 x 2 + y2 xd0 x 2 yd0 xd0 x 2 + y 2 yd0 y 2
al no coincidir los límites reiterados, no existe límite.
Ejemplo (muy interesante). Averiguar si las funciones
xy xy 2 xy xy 3
f 1 (x, y ) = , f ( x, y ) = , f (x, y ) = , f 4 (x, y ) = 2
x 2 + y2 2 x 2 + y4 3 x 2 + y2 x + y6
definidas en G = R2 - {(0, 0)} tienen límite cuando (x, y) → (0, 0), y, en caso afirmativo, hallarlo.
2
Solución. En la primera función, los límites radiales (y = mx) valen: lim 2 mx 2 2 = m 2 ; y como
xd0 x + m x 1+m
dependen de m, no existe límite.
2 3
En la segunda función todos los límites radiales valen: lim 2 m x 4 4 = 0; sin embargo, el límite
xd0 x + m x
y2 y2 1
2
dirigido según la parábola x = y es: lim = , luego, tampoco tiene límite.
2 yd0 (y 2 ) + y 4 2
No se puede, por tanto, asegurar que una función de dos variables tenga límite en un punto ni aunque
sean iguales todos sus límites radiales. El límite debe ser igual, no sólo acercándose (x, y) hacia (x0, y0) en
cualquier dirección, sino de cualquier manera (ver la cuarta función).
La tercera función tiene límite y éste es cero, ya que aplicando la definición:
xy x $ y x $ y x $ y
−0 = [ = = x d 0 si (x, y) → (0, 0)
x 2 + y2 x +y
2 2 y 2 y
La cuarta función no tiene límite. Los límites reiterados, radiales, por parábolas y por polares, dan
y3 y3
todos cero; sin embargo, tomando el arco x = y3, el límite es: lim = 1.
yd0 (y ) + y
3 2 6 2
Continuidad
Definición. Sean f = (f1, ..., fm): G ⊂ Rn → Rm y x0 ∈ G. Se dice que f es continua en x0, si:
∀ ε > 0 ∃ δ > 0 / ∀ x ∈ [G ∩ B(x0, δ)] ⇒ f(x) ∈ B(f(x0), ε)
Es decir, cuando se verifica (si x0 es un punto de acumulación de G):
lim f(x) = f(x 0 ) lim æf(x) − f(x 0 ) æ = 0

xdx 0 æx−x 0 æd0
Definición. Se dice que la función f es continua en G, cuando es continua en todos sus puntos.
Propiedades. Sean x0 ∈ G ⊂ Rn y f y g: G → Rm continuas en x0. Se verifica que:

1. αf + βg es continua en x0 ∀ α, β ∈ R.
2. f⋅g es continua en x0.
3. Si m = 1 y g(x0) ≠ 0 ⇒ gf es continua en x0.
4. f es continua en x0 ⇔ fi es continua en x0 ∀ i = 1, 2, ..., m.
Teorema. Toda aplicación lineal, K: Rn → Rm, es continua en Rn.
Definición. Sean G ⊂ Rn y f: G → Rm. Decimos que f está acotada en G, si f(G) está acotado.
Teorema. Sean G ⊂ Rn y H ⊂ Rm. Si f: G → H es continua en x0 ∈ G y g: H → Rp es continua en f(x0),

entonces la función compuesta gºf es continua en x0.
Ejemplo. Suponiendo que fi(0, 0) = 0, en las cuatro funciones que figuran en el último ejemplo,
solamente la tercera es continua en el punto (0, 0).
xy
Ejemplo. La función f 1 (x, y ) = si (x, y) ≠ (0, 0) y f1(0, 0) = 0, no es continua en el punto (0, 0),
x 2 + y2
pues carece de límite en ese punto. Sin embargo, es continua respecto de cada una de las variables por
separado, como muestran las igualdades siguientes:
lim f 1 (x, y) = f 1 (0, y) = 0, lim f 1 (x, y) = f 1 (x, 0) = 0

xd0 yd0
En cambio, es evidente que si una función es continua respecto de ambas variables lo es también
respecto de cada una por separado.
1. Demostrar que
xy 2
lim , 2x 4
(x,y )d(0,0) x 2 + y2 x + y
no existe.
2. Estudiar la continuidad en (0, 0) de la función de R2 en R3 siguiente:
x2y x2
f(x, y) = , , (x + y ) sen 2 1 2 , si (x, y) ! (0, 0 ), f(0, 0 ) = (0, 0, 0 )
x 2 + y4 x 2 + y2 x +y
3. Comprobar que la función:

2y
f(x, y) = , si y ! −x 2 , f(x, −x 2 ) = 0
x2 + y
tiene límite en el origen según la dirección de cualquier recta que pase por él, pero no posee límite
en dicho punto.
4. Hallar el conjunto o conjuntos de R2 en los que es continua la función:

x 2 + y2
f(x, y) = , si x ! y , f(x, y ) = 0, si x = y
x 2 − y2
5. Demostrar que la función:

y
f(x, y) = x sen(x 2 + y 2 ), si x ! 0, f(0, y ) = 0
tiene límite igual a 0 según todas las direcciones en el origen, pero carece de límite en dicho punto.
DIFERENCIAL DE UNA FUNCIÓN
Derivada según un vector de un campo escalar
Sean G ⊂ Rn un conjunto abierto, x0 ∈ G y f: G → R
Definición. Sea v = (v1, ..., vn) un vector no nulo de Rn. El límite
f(x 0 + tv ) − f(x 0 )
lim t
td0
si existe, se llama derivada según el vector v de la función f en el punto x0 y se designa por f '(x0; v) o por
Dvf(x0). Si ||v|| = 1, entonces f '(x0; v) se llama derivada direccional según el vector v de la función f en el
punto x0. Como v = ||v||⋅u (con ||u|| = 1) entonces f '(x0; v) = ||v||f '(x0; u) (esta igualdad expresa la relación
entre la derivada según un vector y la derivada direccional).
Definición. Sea ei = (0,..,1,..,0) el vector i-ésimo de la base canónica de Rn. La derivada f '(x0; ei) si
existe, se llama derivada parcial respecto de la i-ésima variable de la función f en el punto x0 y se
designa por Dif(x0).
Así, pues,
f(x 01 , ..., x 0i + t, ..., x 0n ) − f(x 01 , ..., x 0i , ..., x 0n ) Øf(x 0 )

lim t = f ∏ (x 0 ; e i ) = D i f(x 0 ) =
td0 Øx i
Las derivadas parciales de f(x) se obtienen sin más que suponer constantes las variables respecto de las
cuales no se deriva, todas las reglas para derivar funciones de una variable se pueden aplicar ahora.
Ejemplo. Si v = 0, f '(x0; 0) = 0.
Ejemplo. Si f es lineal en G, f '(x0; v) = f(v).
Teorema. Si g(t) = f(x0 + tv) (v ≠ 0) y si una de las derivadas g'(t) o f '(x0 + tv; v) existe, entonces
también existe la otra y coinciden. Además g'(0) = f '(x0; v)
Teorema (valor medio para campos escalares). Supongamos que existe f '(x0 + tv; v) ∀ t ∈ [0, 1].
Entonces existe un c ∈ (0, 1) tal que: f(x0 + v) - f(x0) = f '(x0 + cv; v).
Ejemplo. Sea f: R2 → R la función definida por:
 x3
 x 2 + y 2 si (x, y) ! 0, 0
( )
f(x, y) = 

 0 si (x, y) = (0, 0)
Las derivadas parciales de f existen en todo punto (x, y) ≠ (0, 0), puesto que en el abierto R2 -
{(0, 0)} f es un cociente de funciones derivables respecto de x y de y (polinomios) con el denominador
distinto de cero. Aplicando la regla de derivación de un cociente y considerando y constante en el primer
caso y x constante en el segundo, se obtienen
x 2 (x 2 + 3y 2 ) 2x 3 y
D 1 f(x, y) = , D 2 f(x, y) = −
(x 2 + y 2 ) 2 (x 2 + y 2 ) 2
para cada (x, y) ≠ (0, 0). También existen las derivadas parciales de f en (0, 0), pues para t ≠ 0,
f(t, 0 ) − f(0, 0)
D 1 f(0, 0) =lim t =lim tt = 1
td0 td0
f(0, t ) − f(0, 0)
D 2 f(0, 0) =lim t =lim 0t = 0
td0 td0
Interpretación geométrica de las derivadas parciales
Sean G un abierto de R2, (x0, y0) ∈ G y f: G → R. Veamos qué representan geométricamente las dos
derivadas parciales de la función f(x, y). Supongamos que la superficie ABCD sea la imagen geométrica
de la función z = f(x, y), definida en el conjunto rectangular OB'C'D' (G).
Cortemos esta superficie por los planos LHN y QSR

Z de ecuaciones x = x0 e y = y0, respectivamente paralelos
a los planos ZOY y ZOX. Sean LMT y QMP las
correspondientes líneas de intersección, que tienen en
A
común el punto M de coordenadas (x0, y0, z0), siendo z0
Q
= f(x0, z0). La línea LMT, referida a los ejes HN
L
M
(abscisas "y") y HL (ordenadas "z"), tienen por ecuación
D
la función z = f(x0, y).
0 D'
B S
P
T
α Y
El coeficiente angular tgα de la tangente KM a la
B'
H
C
C'
M' N K curva LMT en el punto de contacto M, es igual al valor
R
que toma la derivada respecto de "y" de la función de
una variable z = f(x0, y) cuando se pone y0 en lugar de
"y". Pero, recordando las definiciones de las derivadas
X parciales, dicho coeficiente angular es igual al valor
D2f(x0, y0) que tiene la derivada parcial de "z" respecto
a "y" en el punto (x0, y0). La otra derivada tiene igual significado con relación a la curva QMP.
Según esto, la ecuación de la recta tangente KM en el plano LHN es:
z - z0 = D2f(x0, y0)(y - y0)
y, por tanto, en el espacio:
x = x0 + 0t
y = y0 + 1t
z = z0 + D2f(x0, y0)t
luego a = (0, 1, D2f(x0, y0)) es un vector director de esta tangente. Análogamente b = (1, 0, D1f(x0, y0)) es un
vector director de la tangente en M a la línea QMP. Por tanto, a×b = (D1f(x0, y0), D2f(x0, y0), -1), es un vector
asociado al plano que determinan esas dos tangentes, al que se llamara plano tangente en M(x0, y0, z0) a
la superficie representada por la ecuación z = f(x, y). De esto resulta que este plano tiene por ecuación
cartesiana:
z - z0 = D1f(x0, y0)(x - x0) + D2f(x0, y0)(y - y0)
Ejemplo. Si (xo, yo, zo) es un punto del paraboloide elíptico

2 y2
2z = x 2 + 2
a b
la ecuación del plano tangente en él es:
xx o yy o
z + zo = + 2 .
a2 b
Diferenciabilidad de un campo escalar
Definición. Sean G ⊂ Rn un conjunto abierto, x0 ∈ G y f: G → R. Se dice que f es diferenciable en el

punto x0 si existe una aplicación lineal K: Rn → R tal que
f(x 0 + h ) − f(x 0 ) − K(h )

lim =0
hd0 æh æ
La aplicación K (que es única) se llama diferencial de f en x0, y se representa por Df(x0).
Ejemplo. Estudiar la diferenciabilidad de f(x, y) = x2 + y2 en el punto (1, 1).
Solución. f(1 + h1, 1 + h2) - f(1, 1) = (1 + h1)2 + (1 + h2)2 - 2 = 2h1 + 2h2 + h 21 + h 22 .
Tenemos que:
1º. K(h1, h2) = 2h1 + 2h2 es una aplicación lineal de R2 en R.
2º. f(1 + h1, 1 + h2) - f(1, 1) - K(h1, h2) = h 21 + h 22 .
Por tanto f es diferenciable en (1, 1) ya que:
f(x 0 + h ) − f(x 0 ) − K (h ) h 21 + h 22
lim = lim = lim h 21 + h 22 =0
hd0 æh æ (h 1 ,h 2 )d (0,0 )
h 21 + h 22 (h 1 ,h 2 )d (0,0 )
Definición. Se dice que la función f, definida en el conjunto abierto G ⊂ Rn, es diferenciable en G, si

lo es en cada punto de dicho conjunto.
Definición. Sean G ⊂ Rn un conjunto abierto, x0 ∈ G y f: G → R. Si existen todas las derivadas

parciales de f en x0, el vector ∇f(x0) = (D1f(x0), ..., Dnf(x0)), se llama gradiente de f en x0.
Teorema. Sean G un abierto de Rn, x0 ∈ G y f: G → R diferenciable en x0. Entonces existe f '(x0; v) para
todo v de Rn y Df(x0)(v) = f '(x0; v). Además f '(x0; v) = ∇f(x0)⋅v.
Observación. Como f '(x0; v) = ∇f(x0)⋅v = ||∇f(x0)||⋅⋅||v||⋅⋅cosθ; la derivada direccional, f '(x0; u), de f(x0),
es máxima en la dirección de ∇f(x0), y es igual a la proyección del gradiente sobre u.
Teorema. Sean G ⊂ Rn un conjunto abierto, x0 ∈ G y f: G → R. Si f es diferenciable en x0, f es

continua en x0.
Definición. Sean G un abierto de Rn, f: G → R y x0 ∈ G, se dice que f es continuamente

diferenciable en el punto x0, si están definidas en una bola B(x0, δ) ⊂ G, y son continuas en x0, las
derivadas parciales: Dif: B(x0, δ) → R, i = 1, 2, ..., n.
La función f se dice continuamente diferenciable en un abierto G de Rn, si lo es en cada uno de sus

puntos. Se dice entonces que f es de clase 1 en G, y se representa f ∈ C1(G).
Teorema. Sean G un abierto de Rn, f: G → R y x0 ∈ G. Si f es continuamente diferenciable en el

punto x0, entonces f es diferenciable en x0.
Ejercicio. Probar que la función

 (x 2 + y 2 ) sen 1 si (x, y) ! (0, 0 )
 x2 + y2
f : (x, y ) c R 2 d f(x, y) = 

 0 si (x, y) = (0, 0)
es continua y diferenciable en el origen, pero D1f y D2f no son continuas en él; es decir, no es
continuamente diferenciable en el origen.
Curvas y superficies de nivel
Definición. Sean G ⊂ Rn y f: G → R. Se llama conjunto de nivel a:
L(c) = {x ∈ G | f(x) = c}
El conjunto L(c) se llama curva de nivel en R2 y superficie de nivel en R3.
Sean x0 y x0 + v ∈ L(c), como f(x0 + v) - f(x0) = c - c = 0 entonces, si f es diferenciable x0 ∈ L(c),

Df(x0)(v) = ∇f(x0)⋅v → 0 para v → 0, ⇒ ∇f(x0) es ortogonal al L(c) en x0.
Derivada según un vector de un campo vectorial
Sean G ⊂ Rn un conjunto abierto, x0 ∈ G y f: G → Rm.
Definición. Sea v = (v1, ..., vn) un vector no nulo de Rn. El límite
f(x 0 + tv ) − f(x 0 )
lim t
td0
si existe, se llama derivada según el vector v de la función f en el punto x0 y se designa por f '(x0; v) o por
Dvf(x0). Si ||v|| = 1, entonces f '(x0; v) se llama derivada direccional según el vector v de la función f en el
punto x0. Si f = (f1, ..., fm); f '(x0; v) = (f1'(x0; v), ..., fm'(x0; v)).
Ejemplo. Si v = 0, f '(x0; 0) = 0.
Ejemplo. Si f es lineal en G, f '(x0; v) = f(v).

Diferenciabilidad de un campo vectorial
Definición. Sean G ⊂ Rn un conjunto abierto, x0 ∈ G y f: G → Rm. Se dice que f es diferenciable en

el punto x0 si existe una aplicación lineal K: Rn → Rm tal que
æf(x 0 + h ) − f(x 0 ) − K(h )æ

lim =0
hd0 æh æ
La aplicación K (que es única) se llama diferencial de f en x0, y se representa por Df(x0).
Definición. Se dice que la función f, definida en el conjunto abierto G, es diferenciable en G, si lo es

en cada punto de dicho conjunto.
Teorema. Sean G un abierto de Rn y x0 ∈ G. f = (f1, ..., fm): G → Rm es diferenciable en x0, si, y sólo si,
las fi son diferenciables en x0 ∀ i = 1, 2, ..., m. Además Df(x0)(h) = (Df1(x0)(h), ..., Dfm(x0)(h)).
Teorema. Sean G ⊂ Rn un conjunto abierto, x0 ∈ G y f: G → Rm. Si f es diferenciable en x0, f es

continua en x0.
Teorema. Sean G ⊂ Rn un conjunto abierto, x0 ∈ G y f y g: G → Rm diferenciables en x0. Entonces las

funciones f + g y f⋅g son diferenciables en x0 y
D(f + g)(x0) = Df(x0) + Dg(x0)
D(f⋅g)(x0) = g(x0)⋅Df(x0) + f(x0)⋅Dg(x0)
Si además m = 1 (campos escalares) y g(x0) ≠ 0 entonces gf es también diferenciable en x0 y
g(x 0 )Df(x 0 ) − f(x 0 )Dg(x 0 )

D gf (x 0 ) =
[g(x )] 2 0
Teorema. Sea G un conjunto abierto de Rn, x0 ∈ G y f: G → Rm diferenciable en x0. ï $ f '(x0; v) para

n
todo v de Rn y Df(x0)(v) = f '(x0; v). Además Df(x0)(v) = (∇fi(x0)⋅v)ei
i=1
Notación. En notación matricial Df(x0)(v) es:
D 1 f 1 (x 0 ) ... D n f 1 (x 0 ) v1
.............. ... .............. ...
D 1 f m (x 0 ) ... D n f m (x 0 ) vn
A la matriz (Difj(x0)) se le llama matriz jacobiana de f en el punto x0 y se designa por f '(x0).
Teorema. (Regla de la cadena) Sea G un conjunto abto. de Rn, H un conjunto abierto de Rm, f: G → H
una función diferenciable en x0 ∈ G y g: H → Rp una función diferenciable en f(x0). Entonces gºf es
diferenciable en x0 y se verifica que D(gºf)(x0) = Dg(f(x0))ºDf(x0).
Ejemplo. Sean:
f: (x, y, z) ∈ R3 → f(x, y, z) = (x2, yez) ∈ R2
g: (u, v) ∈ R2 → g(u, v) = (uv, u + v) ∈ R2
(x, y, z ) d (x 2 , ye z ) d (x 2 ye z , x 2 + ye z )
g)f
En la definición de f y g aparecen únicamente funciones elementales, que son diferenciables en R3 y R2

respectivamente. Por tanto: D(gºf)(x, y, z) = Dg(f(x, y, z))⋅Df(x, y, z) ∀ (x, y, z) ∈ R3
v u 2x 0 0
Dg(u, v) = , Df(x, y, z) =
1 1 0 e z ye z
ye z x 2 2x 0 0 2xye z e z x 2 ye z x 2
D(g ) f)(x, y, z) = $ =
1 1 0 e z ye z 2x ez ye z
Ejemplo. Sean G un conjunto abierto de R2, H un conjunto abierto de R2, X: G → H una función
diferenciable en (u, v) ∈ G y f: H → R una función diferenciable en (x1(u, v), x2(u, v)) ∈ H. Entonces
f(x1(u, v), x2(u, v)) = F(u, v) es diferenciable y se verifica que:
D1F(u, v) = D1f(x1, x2)D1x1(u, v) + D2f(x1, x2)D1x2(u, v)
D2F(u, v) = D1f(x1, x2)D2x1(u, v) + D2f(x1, x2)D2x2(u, v)
Ejemplo. Sean G un conjunto abierto de R, H un conjunto abierto de R2, X: G → H una función

diferenciable en t ∈ G y f: H → R una función diferenciable en (x1(t), x2(t)) ∈ H. Entonces f(x1(t), x2(t)) =
F(t) es diferenciable y se verifica que:
F '(t) = D1f(x1, x2)x1'(t) + D2f(x1, x2)D1x2'(t)
Ejemplo. Sean G un conjunto abierto de R2, H un conjunto abierto de R, x: G → H una función

diferenciable en (u, v) ∈ G y f: H → R una función diferenciable en x(u, v) ∈ H. Entonces f(x(u, v)) =
F(u, v) es diferenciable y se verifica que:
D1F(u, v) = f '(x)D1X(u, v)
D2F(u, v) = f '(x)D2X(u, v)
Ejemplo. Demostrar que la función
 x3
 x 2 + y 2 si (x, y) ! 0, 0
( )
f : (x, y ) c R d f(x, y) = 
2

 0 si (x, y) = (0, 0)
es diferenciable en la dirección de todo vector v = (v1, v2), ||v|| = 1 en (0, 0), pero no es diferenciable en
dicho punto.
f(0 + tv 1 , 0 + tv 2 ) − f(0, 0)
Solución. En efecto: D v f(0, 0) =lim t = v 31
td0
Por tanto, si f es diferenciable, la matriz asociada a la aplicación lineal seria
∇f(0, 0) = (D1f(0, 0), D2f(0, 0)) = (1, 0)
y habría de ser cero el límite:

f(h, k) − f(0, 0) − 1h − 0k −hk 2
lim =lim
(h,k )d(0,0 ) h2 + k2 (h,k )d(0,0 )
(h 2 + k 2 ) 3
Una condición necesaria para la existencia de este límite es, que exista y sea el mismo, en el pto. (0, 0),
según todas las direcciones, cosa que no ocurre, pues en la dirección de la recta h = mk, es:
lim −hk 2 = −m
(h,k )d(0,0 )
(h 2 + k2 )
3
(1 + m 2 ) 3
y por tanto, la función f(x, y) no es diferenciable en el punto (0, 0).
Teorema (valor medio). Sean G un abierto de Rn, f: G → R y x, y ∈ G tales que el segmento L(x, y)
que une x e y está contenido en G. Existe entonces un punto c ∈ L(x, y) tal que
f(y) - f(x) = ∇f(c)(y - x)
Definición. Sean G un abierto de Rn, f = (f1, ..., fm): G → Rm y x0 ∈ G, se dice que f es continuamente
diferenciable en el punto x0, si están definidas en una bola B(x0, δ) ⊂ G, y son continuas en x0, las
funciones: Difj: B(x0, δ) → R, i = 1, 2, ..., n, j = 1, 2, ..., m.
La función f se dice continuamente diferenciable en un abierto G de Rn, si lo es en cada uno de sus

puntos. Se dice entonces que f es de clase 1 en G, y se representa f ∈ C1(G).
Teorema. Sean G un abierto de Rn, f = (f1, ..., fm): G → Rm y x0 ∈ G. Si f es continuamente

diferenciable en el punto x0, entonces f es diferenciable en x0.
Ejemplo. La función
 x3
 x 2 + y 2 si (x, y) ! 0, 0
( )
f : (x, y ) c R d f(x, y) = 
2

 0 si (x, y) = (0, 0)
es diferenciable continuamente y por tanto diferenciable en R2 - {(0, 0)}, porque sus derivadas:
x 2 (x 2 + 3y 2 ) 2x 3 y
D 1 f(x, y) = , D 2 f(x, y) = −
(x 2 + y 2 ) 2 (x 2 + y 2 ) 2
son funciones continuas en R2 - {(0, 0)}.

y y y
1. Si z = xne(ax+by)f( x ), donde f( x ) es una función arbitraria de x , demuéstrese que
xD1z + yD2z = (ax + by + n)z
2. Comprobar que la función f(x, y) = x 2 + y 2 , es continua en (0, 0), pero no es diferenciable en el.
3. Estudiar si es diferenciable la función; f(x, y) = (x2·y, x + y, x - y2), y en caso afirmativo determinar

su diferencial.
4. Probar que la función:

 x3
 x 2 + y 2 si (x, y) ! 0, 0
( )
f : (x, y ) c R 2 d f(x, y) = 

 0 si (x, y) = (0, 0)
es continua y posee derivadas parciales en cualquier punto de R2, pero no es diferenciable en el

origen.
5. Comprobar que la función:

 2xy
si (x, y) ! (0, 0 )
 x 2 + y 2
f : (x, y ) c R d f(x, y) = 
2

 0 si (x, y) = (0, 0)
no es continua ni posee (en general) derivadas direccionales en el origen, pero si posee derivadas
parciales en el.
6. Dada la función:
f(x, y, z) = x2yz + 3xyz2

Se pide:
a) Calcular Dif(P) (i = 1, 2, 3) siendo P(1, 2, -1).
b) Idem Dvf(P) siendo v el vector unitario en la dirección (1, 0, 1).
c) Comprobar que f es diferenciable en todo R3.
d) Obtener Df(P).
f(x, y) = |x|seny
Se pide:
Conjunto ó conjuntos en los que:
a) f es continua. b) Existe el gradiente de f.
c) f es diferenciable continuamente. d) f es diferenciable.
 xy si y ! 0

8. Dada la función: f : (x, y ) c R 2 d f(x, y) = 

 0 si y = 0
Comprobar si las siguientes afirmaciones son ciertas:
a) Es continuamente diferenciable en R² - OX.
b) No es continua ni admite derivadas parciales en los puntos de la forma (a, 0) si a ≠ 0.
c) Es continua en (0, 0) y admite derivadas parciales en él.
 x 3 − y2
 x 2 + y 2 si (x, y) ! (0, 0 )
f : (x, y ) c R d f(x, y) = 
2

 0 si (x, y) = (0, 0)
a) Hallar el conjunto ó conjuntos en los que:
a1) f es continua.
a2) Existe el gradiente de f.
a3) f es diferenciable.
a4) f es continuamente diferenciable.
b) Calcular D1f y D2f.
c) Calcular Dvf(1, 1) usando la definición en la dirección del vector (3, 4). Comprobar que está bien
hallada usando que Dvf(1, 1) = ∇f(1, 1)⋅v.
y
10. Derivar la función f(x, y) = x2 + y2 + sen x en la dirección de la bisectriz del primer cuadrante.
11. Derivar la función f(x, y, z) = x2 + 3y2 + 8z2 + 2xyz en la dirección del vector (4, 7, 2).
12. Hallar la derivada de la función f(x, y) = 3x4 - xy + y3 en el punto (1, 2) según la dirección que
forma con el eje "OX" un ángulo de 60º.
13. Estudiar la diferenciabilidad y hallar la matriz jacobiana y la diferencial de la aplicación:
f(x, y) = (x + y, x 1+ y )
14. Comprobar que es diferenciable la aplicación:
f(x, y, z) = (x, xy2, xy2z3)
15. Dada la aplicación:
f(x, y) = (exy, Lx)

Se pide:
a) Conjunto ó conjuntos en los que f está definida.
b) Idem. donde es diferenciable.
c) [Df(x, y)](dx, dy).
d) Puntos en los que se anula el jacobiano.
16. Hallar la ecuación del plano tangente y la recta normal a la superficie definida por:
f(x, y) = x2 + y2
en el punto (1, -2).
17. Aplicando la regla de la cadena, obtener la matriz jacobiana de la aplicación gºf en el punto (1, π)
siendo:
f(x, y) = xy
g(u) = (senu, 3u, eu)
18. Obtener, mediante la regla de la cadena, la matriz jacobiana de la aplicación gºf en (1, 1, 1), siendo:
f(x, y, z) = (ex+y, eyz)
g(u, v) = L(uv)
19. Dada f: R2 → R, función diferenciable en todo R2; estudiar la diferenciabilidad y calcular la matriz
jacobiana, así como la diferencial de la aplicación:
g(x, y) = ef(x, x + y)
en un punto arbitrario (x, y) ∈ R2.

Derivadas de orden superior al primero
Definición. Sean G ⊂ Rn un conjunto abierto y f: G → R. Supongamos que existe:
Djf: G → R
Si para cada x ∈ G existe Di(Djf), esta derivada parcial se llama derivada parcial segunda respecto de
las variables xj, xi de la función f en el punto x y se representa por Dijf(x).
De forma análoga se definen las derivadas parciales de cualquier orden.
Si todas las derivadas parciales de orden p de f existen en cada punto de G y son continuas en G,
entonces se dice que f es una función de clase p en G y se escribe f ∈ Cp(G)
Si f: G → Rm, decimos que f ∈ Cp(G) si fj ∈ Cp(G) ∀ j = 1, 2, ..., m.
Ejemplo. La función:
f: (x, y) ∈ R2 → f(x, y) = |x| ∈ R
es tal que
 1 si x > 0
D 1 f : (x, y) c R 2 − x = 0 d D 1 f(x, y) = 
 −1 si x < 0
D2f: (x, y) ∈ R2 → D2f(x, y) = 0
D12f(0, 3) = D1(D2f)(0, 3) = 0
mientras que D21f no está definida en el punto (0, 3).
Teorema. (Teorema de Schwarz) Sean G un abierto de R2 y f: G → R, supongamos que D1f, D2f, D12f
y D21f existen en B((x0, y0), δ) ⊂ G. Si D12f y D21f son continuas (x0, y0) se verifica que:
D12f(x0, y0) = D21f(x0, y0)
Nota. Existe una versión más fuerte de este teorema que dice que: si D1f, D2f, y D21f $ en B((x0, y0), δ)
⊂ G, y si D21f es continua (x0, y0) entonces existe D12f(x0, y0) y D12f(x0, y0) = D21f(x0, y0).
Ejemplo. He aquí un ejemplo en que D12f(0, 0) no es igual a D21f(0, 0).
Consideremos la función f(x, y) definida como:
x 2 − y2
f(x, y) = xy , si (x, y) ≠ (0,0); y f(0, 0) = 0
x 2 + y2
Solución.
f(h, y) − f(0, y) h 2 − y2
D 1 f(0, y) = lim = lim hy = −y
hd0 h hd0 h(h 2 + y 2 )
D 1 f(0, k) − D 1 f(0, 0)
D 21 f(0, 0) = lim = lim −k = −1
kd0 k kd0 k
y análogamente: D2f(x, 0) = x, D12f(0, 0) = +1.
Definición. Sea f: G ⊂ R2 → R, donde G es abierto. Se define diferencial de orden n de la función f

en el punto (x0, y0) ∈ G, como:
2 2
D n f(x 0 , y0 )(h 1 , h 2 ) = ... i=1 Di ...i f(x 0 , y0 )h i ...h i
1 n 1 n
i =1
1 n
(siempre que existan todas las derivadas parciales de orden n en (x0, y0)).
Si f ∈ Cn(G),
Dnf(x0, y0)(h1, h2) = ( n0 ) h1nD1...1f (x0, y0) + ( n1 )h1n-1h2D1..12f (x0, y0) + ⋅⋅⋅ + ( nn )h2nD2...2f (x0, y0)
Teorema. (Fórmula de Taylor) Sean G un conjunto abierto de R2, (x0, y0) ∈ G, f: G → R, verificando
que f ∈ Cn+1(G). Entonces ∀ (h1, h2) tal que (x0 + h1, y0 + h2) ∈ B((x0, y0), δ) ⊂ G, ∃ θ ∈ (0, 1) tal que:
n
f(x 0 + h 1 , y 0 + h 2 ) − f(x 0 , y 0 ) = 1 D i f(x 0 , y 0 )(h 1 , h 2 ) + 1 D n+1 f(x + h , y + h )(h , h )
i=1 i! (n + 1 )! 0 1 0 2 1 2
Definición. Sea f: D ⊂ Rn → R. Decimos que f se llama homogénea de grado m en D si:
f(tx) = tmf(x) ∀ x ∈ D,
en donde t ∈ R.
Ejemplo. Son homogéneas las funciones:

y
x 3 + y 3 , x2 + 2xy + 4y2, arctg x ,
y sus grados respectivos son 3 , 2 y 0. No es homogénea en cambio la función log(x2 + y2).

2
Teorema. (Teorema de Euler) Sean G un abierto de Rn y f: G → R diferenciable en G. f, es

homogénea de grado m, si, y sólo si, verifica:
x1D1f(x) +...+ xnDnf(x) = mf(x)

Teorema. (De la función inversa) Sean G un abierto de Rn, x0 ∈ G y f: G → Rn verificando:
1. f ∈ C1(G).
D 1 f 1 (x 0 ) ... D n f 1 (x 0 )
2. .............. ... .............. ! 0 .
D 1 f n (x 0 ) ... D 1 f n (x 0 )
Entonces se verifica que ∃ B(x0, r) ⊂ G, tal que:
1º) f es uno a uno en B(x0, r).
D 1 f 1 (x ) ... D n f 1 (x )
2º) ∀ x ∈ B(x0, r) ⇒ .............. ... .............. !0 .
D 1 f n (x ) ... D 1 f n (x )
2º) ∃ f -1: f(B(x0, r)) → B(x0, r) tal que f -1 ∈ C1(f(B(x0, r))).
3º) ∀ y ∈ f(B(x0, r)) se verifica que

−1
D 1 f 1−1 (y ) ... D n f 1−1 (y ) D 1 f 1 (f −1 (y )) ... D n f 1 (f −1 (y ))
Df -1(y) ≈ ............... ... ............... = ...................... ... ......................
D 1 f n−1 (y ) ... D n f n−1 (y ) D 1 f n (f −1 (y )) ... D n f n (f −1 (y ))
El teorema de la función inversa es esencialmente local. Una función f puede verificar todas las
hipótesis del teorema en cualquier punto x0 ∈ Rn, lo que garantiza la existencia de una inversa local
diferente para cada x0 ∈ Rn y no ser inyectiva, con lo que no tendrá inversa global.
Ejemplo. La función f: R2 → R2 definida por
f(x, y) = (excosy, exseny)
es evidentemente de clase C1 en R2 y
e x cos y −e x sen y
= e 2x > 0
e x sen y e x cos y
para todo (x, y) ∈ R2, luego f verifica las hipótesis del teorema de la función inversa en todo punto (x, y) ∈
R2. Por consiguiente, para cada (x, y) ∈ R2 existen una B((x, y), r) tal que la restricción de f a B((x, y), r)
tiene una inversa de clase C1. Con otras palabras, f tiene una inversa local de clase C1 en una bola de
centro cada punto. Sin embargo, f no tiene inversa global, pues f(x, y) = f(x, y + 2π) y, por tanto, f no es
inyectiva en R2.
Teorema. (Teorema de la función implícita) Sean G un conjunto abierto de Rn+m, (x0, y0) ∈ G, donde
x0 ∈ Rn e y0 ∈ Rm, y sea f = (f1, ..., fm): G → Rm verificando:
1. f ∈ C1(G).
2. f(x0, y0) = (0, ..., 0) ∈ Rm.
D n+1 f 1 (x 0 , y 0 ) ... D n+m f 1 (x 0 , y 0 )

3. ...................... ... ...................... !0
D n+1 f m (x 0 , y 0 ) ... D n+m f m (x 0 , y 0 )
Entonces se verifica que: ∃ B(x0, r) ⊂ Rn, tal que
1º) ∃ g = (g1, ..., gm) : B(x0, r)→ Rm, tal que g ∈ C1(B(x0, r)).
2º) f(x, g(x)) = 0 ∀ x ∈ B(x0, r); g(x0) = y0.
D n+1 f 1 (x, g(x )) ... D n+m f 1 (x, g(x ))

3º) ∀ x ∈ B(x0, r), se verifica: ....................... ... ....................... ! y0
D n+1 f m (x, g(x )) ... D n+m f m (x, g(x ))
−1
D n+1 f 1 (x, g(x) ) ... Dn+m f 1 (x, g(x) ) D1 f 1 (x, g(x) ) ... Dn f 1 (x, g(x) )
Dg(x) ≈ − ...................... ... ....................... ................... ... .....................
D n+1 f m (x, g(x) ) ... Dn+m f m (x, g(x) ) D1 f m (x, g(x) ) ... Dn f m (x, g(x) )
Ejemplo. La función f: R4 → R2 definida por f(x, y, z, t) = (x2 + y2 - 2zt, x3 - y3 + z3 - t3) es de clase C1

en R4 y verifica que f(1, 1, 1, 1) = (0, 0) y
D 3 f 1 (1, 1, 1, 1) D 4 f 1 (1, 1, 1, 1) −2 −2
= = 12 ! 0
D 3 f 2 (1, 1, 1, 1) D 4 f 2 (1, 1, 1, 1) 3 −3
Por el teorema de la función implícita, existen B((1, 1), r) ⊂ R2 y una función:
g = (g1, g2): B((1, 1), r)→ R2
de clase C1(B((1, 1), r)) tal que f(x, y, g1(x, y), g2(x, y)) = (0, 0) ∀ (x, y) ∈ B((1, 1), r). En particular, se
tiene que g1(1, 1) = 1 y g2(1, 1) = 1.
Además:
−1
D 3 f 1 (1, 1, 1, 1) D 4 f 1 (1, 1, 1, 1) D 1 f 1 (1, 1, 1, 1) D 2 f 1 (1, 1, 1, 1) 0 1
Dg(1, 1) = − =
D 3 f 2 (1, 1, 1, 1) D 4 f 2 (1, 1, 1, 1) D 1 f 2 (1, 1, 1, 1) D 2 f 2 (1, 1, 1, 1) 1 0
Máximos y mínimos relativos
Definición. Sean G ⊂ Rn, x0 ∈ G y f: G → R. Se dice que x0 es un máximo (mínimo) relativo de f en

G cuando existe B(x0, δ) tal que f(x0) ≥ f(x) (f(x0) ≤ f(x)) ∀ x ∈ G ∩ B(x0, δ).
Teorema. Sean G un conjunto abierto de Rn y f: G → R. Si x0 ∈ G es un punto extremo relativo de f y

existe Dif(x0), entonces Dif(x0) = 0.
Definición. Sean G un conjunto abierto de Rn, x0 ∈ G y f: G → R con derivadas parciales en x0. Si

Dif(x0) = 0 para i = 1, 2, ..., n se dice que x0 es un punto crítico de f.
El último teorema nos dice que si f tiene derivadas parciales en un punto x0 que es extremo relativo de
f, entonces x0 es un punto crítico de f. Sin embargo, una función puede tener puntos críticos que no sean
extremos relativos.
Teorema. Sean G un conjunto abierto de Rn, x0 ∈ G y f: G → R tal que f ∈ C2(G). Supongamos que x0
es un punto crítico de f y sea Hk = |Dijf(x0)|, con 1 ≤ i, j ≤ k. Entonces
1. Si es Hk > 0 para k = 1, 2, ..., n, entonces x0 es un punto mínimo relativo de f.
2. Si (-1)kHk > 0 para k = 1, 2, ... ,n, entonces x0 es un punto máximo relativo de f.
3. Si Hk ≥ 0 o (-1)kHk ≥ 0 ∀ k, con algún Hi = 0, entonces x0 puede ser extremo relativo de f o no. Hay
que hacer un estudio local.
4. En cualquier otro caso, x0 no es extremo relativo de f.
Ejemplo. Sea f: R2 → R la función definida por: f(x, y) = x2 + xy. Hallar sus extremos relativos.
Solución. D1f(x, y) = 2x + y, D2f(x, y) = x
Su único punto crítico es (0, 0) y como
D 11 f(0, 0) D 12 f(0, 0) 2 1
= <0
D 21 f(0, 0) D 22 f(0, 0) 1 0
entonces, f no tiene ni máximo ni mínimo relativo en (0, 0) (punto de silla).
Ejemplo. Sea f: R3 → R la función definida por
f(x, y, z) = x2 + y2 + z2 - xy + x - 2z.
Hallar sus extremos relativos.
Solución. D1f(x, y, z) = 2x - y + 1, D2f(x, y, z) = 2y - x, D3f(x, y, z) =2z - 2
Su único punto crítico es a = − 2 , − 1 , 1 y como, H1 = D11f(a) = 2 > 0,

3 3
D 11 f(a) D 12 f(a) D 13 f(a) 2 −1 0
D 11 f(a) D 12 f(a)
H2 = = 3 > 0, H 3 = D 21 f(a) D 22 f(a) D 23 f(a) = −1 2 0 = 10 > 0
D 21 f(a) D 22 f(a)
D 31 f(a) D 32 f(a) D 33 f(a) 0 0 2
f tiene en "a" un mínimo relativo.

Máximos y mínimos condicionados
Sea G un abierto de Rn. El problema de determinar los extremos de una función f: G → R sobre un
conjunto M ⊂ G, se llama problema de extremos condicionados, aludiendo al hecho de que las variables
x1 ,..., xn están sometidas a la condición de que (x1 ,..., xn) ∈ M.
Teorema. (Multiplicadores Lagrange) Sean G un conjunto abierto de Rn, f: G → R / f ∈ C1(G), g =

(g1, ...,gm): G → Rm, m < n, / g ∈ C1(G) y M = {x ∈ G | g(x) = (0, ..., 0)}. Si x0 ∈ M es un punto de
extremo relativo de f sobre M y ∃ |Digj(x0)| ≠ 0, entonces existen m números reales λ1, ..., λm tales que x0
es un punto crítico de la función
F = f + λ1g1 + ⋅⋅⋅ + λmgm
 uH F (x 0 )u t > 0 x 0 es mínimo
Teorema. Si x0 ∈ M, es punto crítico de F y F ∈ C2(G), ⇒ si  donde
 uH F (x 0 )u < 0 x 0 es máximo
t
HF(x0) = (DijF(x0)) (con 1 ≤ i, j ≤ n) y ∀ u tal que Dg(x0)u = 0.
Ejemplo. Hallar el máximo de la función
V = xyz
donde xy + yz + zx - a = 0 y x > 0, y > 0, z > 0.
Solución. Formemos la función auxiliar:
F(x, y, z) = xyz + λ(xy + yz + xz - a).
Hallemos sus derivadas parciales de F y formemos el sistema:
D1F = yz + λ(y + z) = 0
D2F = xz + λ(x + z) = 0
D3F = xy + λ(x + y) = 0
xy + yz + zx = a
resuelto el sistema, obtenemos x = y = z = a . Así, obtenemos el único sistema de valores x,y,z para los
3
cuales la función puede tener un máximo o un mínimo.
a a
0 12 12
HF(x0) = a
12 0 a
12
, Dg(x0) = 2 a
2 2 a
2 2 a
2 ⇒ u1 = (-1, 1, 0) y u2 = (-1, 0, 1)
a a
12 12 0
u1HF(x0)u1t = - a < 0 y u H (x )u t = - a <0

2 F 0 2
3 3
por tanto, es un máximo.

1. Comprobar que se verifica el teorema de Euler para la función:
f(x, y, z) = xy + yz + z2
en cualquier punto (x, y, z) ∈ R3.
2. Determinar el conjunto ó conjuntos de R2 en los que la ecuación:
ey - e-y - xy = 0
define implícitamente una solución de la forma y = f(x).
3. Estudiar si la ecuación funcional:
y - ex+y = 0
define implícitamente una solución de la forma y = f(x), en que conjunto ó conjuntos y para que
datos iniciales. Calcular además, f '(x) cuando sea posible.
4. Estudiar si la ecuación funcional:
xy - zLy + exz = 1
define en el punto (0, 1, 1) una solución de la forma: a) z = f(x, y), b) y = g(x, z) y, determinar en
caso afirmativo, el gradiente de la solución en un punto arbitrario "y", en particular, en el punto por
el que pasa dicha solución (dato inicial).
5. Estudiar si es posible la existencia de una solución de la forma:
f: (x, y) ∈ B((a, b),δ) → f(x, y) = (u, v) ∈ R2
definida implícitamente por el sistema de ecuaciones funcionales:

x2 - yu = 0
xy + uv = 0
para un dato inicial (que se ha de hallar) y, en caso afirmativo, determinar la matriz jacobiana en un
punto arbitrario (x, y) ∈ R2 en el que esté definida. Obtener explícitamente f en este caso (es
posible por la naturaleza sencilla del sistema de ecuaciones).
6. Estudiar si el sistema de ecuaciones:

xy2 + xzu + yv2 = 3
u3yz + 2xv - u2v2 = 2
define implícitamente una solución de la forma:
f: (x, y, z) ∈ R3 → f(x, y, z) = (u, v) = (f1(x, y, z), f2(x, y, z))
en un B((a, b, c),δ) para el dato inicial (1, 1, 1, 1, 1).
7. Comprobar que se verifica el teorema de Schwarz para la función: f(x, y) = sen(xy + 1).
Obtener, para la misma función, el desarrollo en serie de Taylor de grado 2 en un punto arbitrario
(a, b) y el resto correspondiente.
8. Determinar los extremos relativos de:
f(x, y) = x3 + 3xy2 - 15x - 12y
especificando su naturaleza (máximos, mínimos).
9. Hallar los extremos relativos de las funciones:

f(x, y) = x3 + y3 - 9xy + 27
f(x, y) = x3 - 2xy2 + y4 - y5
especificando su naturaleza.
10. Determinar los extremos relativos de la función:
f(x, y, z) = x3y - 3yz + z2x
especificando su naturaleza.
11. Determinar los extremos de la función:
f(x, y) = 6 - 4x - 3y
con la condición x2 + y2 = 1.
12. Determinar los máximos y mínimos de:
f(x, y, z) = x2 + y2 + z2
sujeto a las restricciones:

2
x 2 + y + z 2 = 1; x + y - z = 0
4 5 25
13. Descomponer un número positivo "a" en tres sumandos, de modo que sea mínima la suma de sus
cubos.
14. Dada la ecuación de la curva
5x2 + 5y2 - 6xy + 6x - 10y - 3 = 0,
y el punto P(0, 1), hallar los puntos de la curva cuyas distancias a P sean máximas o mínimas.
15. Calcular los extremos relativos de la función f(x, y) = x2 + xy + y2 estando "x" e "y" ligados por la
relación x3y + y3x = a, en donde "a" es una constante.
16. Hallar: La distancia mínima entre la superficie z = x2 + y2 y el plano x + 2y - z = 4. La ecuación de

la recta que contiene a dicha mínima distancia. El ángulo de esta recta con el eje "OZ". Las
distancias de esa recta a los tres ejes coordenados.
17. Descomponer el número 23 en tres sumandos cuyo producto sea máximo.
18. Hallar los máximos y mínimos de la función f(x, y) = (x2 + y2)2 - 4x2.
19. Dada la esfera x2 + y2 + z2 = 3 encontrar en el primer octante un punto P en la superficie tal que el
plano tangente determine con los planos coordenados un tetraedro de volumen mínimo y hallar
éste.
20. a) Demostrar que el sistema de ecuaciones

x2 + y - 2z = 0
x + 3y2 - 4z = 0
define una función (z, y) = g(x) en una bola de centro el punto (1, 1, 1). Hallar Dg(1).
b) Probar que la función f: R2 → R2 definida por f(u, v) = (u2 - v2, 2uv) es localmente invertible de
clase uno en el punto (1, 1), y calcular la diferencial de la función inversa en el punto (0, 2).
21. Hallar, aplicando el método de los multiplicadores de Lagrange, el punto de la parábola y2 = 4x más
próximo o más alejado (si existe) del punto (1, 0).
22. Hallar los máximos y mínimos de la función: f(x, y) = x4 + y4 - 2x2 + 4xy - 2y2.
ENM Matemáticas I Trigonometría esférica 1
TEMA 4
TRIGONOMETRÍA ESFÉRICA
Conceptos preliminares
Circunferencias máxima y menor. La intersección de un plano y una Circunferencia P

esfera es una circunferencia que recibe el nombre de circunferencia menor
máxima si el plano secante pasa por el centro de la esfera; en los demás
casos, se llama circunferencia menor. Los polos de tales circunferencias
(máximas o menores) son los puntos de intersección de la esfera y el O
diámetro que es perpendicular al plano de las circunferencias.
P Circunferencia
Mínima distancia. Dos puntos diferentes de una máxima
A
B
esfera A y B que no son extremos de un diámetro P'
pertenecen a una sola circunferencia máxima. El
O menor arco AB de esta circunferencia máxima es la mínima distancia (curva más
corta) que hay desde A a B.
P'
Ángulos esféricos. Se llama ángulo esférico, al ángulo P
formado en una esfera por dos arcos secantes de
circunferencias máximas. Los arcos de las circunferencias máximas son los
lados del ángulo esférico, y el punto de intersección de los arcos es el vértice.
La medida del ángulo esférico viene dada por el ángulo diedro formado por los
planos de las circunferencias máximas. O
P Triángulos esféricos. Se llama triángulo esférico, a A B
la región de la superficie de una esfera limitada por los
arcos de tres circunferencias máximas. Los arcos son los
C
a
lados del triángulo esférico, y los vértices de los tres P'
b
O ángulos esféricos son los vértices (ángulos) del
A c B triángulo esférico.
Notación. Los ángulos se denominan A, B, C, y los respectivos lados opuestos

P' a, b, c.
Observación. A no ser que se especifique lo contrario, trabajaremos únicamente con triángulos

esféricos en los que cualquier lado y cualquier ángulo es menor que 180º. Para estos triángulos se
verifican las propiedades:
1. La suma de dos lados cualesquiera es mayor que el tercer lado.
2. La suma de los tres lados es menor que 360º.
3. Si dos lados son iguales, los ángulos opuestos son iguales y recíprocamente.
4. Si dos lados son desiguales, los ángulos opuestos son desiguales, y el ángulo mayor se opone al
lado mayor y recíprocamente.
5. La suma de los tres ángulos es mayor que 180º y menor que 540º.
Exceso esférico de un triángulo esférico. Se llama exceso esférico E de un triángulo esférico a:
E = A + B + C - 180º
2
Área de un triángulo esférico. A = R E
180
C'
Triángulos Polares. Sean A, B, C los vértices de un triángulo
C
esférico. Trácense las tres circunferencias máximas cuyos polos
son los tres vértices dados. Denomínese A' la intersección de las a'
circunferencias máximas cuyos polos son B y C y que se b' a
encuentra, respecto de BC, al mismo lado que A; B' la intersección b
de las circunferencias máximas cuyos polos son C y A y que se
encuentra respecto de CA, al mismo lado que B; C' la intersección
de las circunferencias máximas cuyos polos son A y B y que se B
B
encuentra, respecto de AB, al mismo lado que C. El triángulo A c
A'B'C' es el triángulo polar de ABC. Sus lados se denominarán a',
A' c'
b', c'.
Propiedades del triángulo polar.

1. Si A'B'C' es el triángulo polar de ABC, entonces ABC es el triángulo polar de A'B'C'.
2. Dados un triángulo y su triángulo polar, se verifica:
A = 180º - a' B = 180 - b' C = 180 - c'
A' = 180º - a B' = 180 - b C' = 180 - c
Aplicaciones. Para simplificar algunos cálculos, se acostumbra a considerar la Tierra como una esfera.
El eje de rotación de esta esfera interseca la superficie de ésta en dos polos norte y sur, Pn y Ps La
circunferencia máxima cuyos polos son Pn y Ps recibe el nombre de ecuador. Dado un punto cualquiera
A, de la superficie de la tierra, diferente de los polos, se llama meridiano de A a la semi-circunferencia
PnAPs. El primer meridiano o meridiano cero pasa por el observatorio astronómico de Greenwich,
Inglaterra.
Pn
La latitud (lat.) de A es la distancia angular desde el ecuador
hasta A. Se mide por el ángulo A'OA o por el arco AA' del
meridiano A. La latitud se denomina norte o sur según que el A G Primer
punto dado se encuentre en el hemisferio norte o en el hemisferio meridiano
sur. La diferencia de latitud entre dos puntos cuyas latitudes son L
L1 y L2 (L1 > L2), es L1 - L2 si ambos puntos se encuentran en el O O E
mismo hemisferio, y es L1 + L2 si se encuentran en hemisferios G'
diferentes. A' Lo
Ecuador
La longitud (long.) de A es el ángulo (no mayor que 180º)
entre el primer meridiano y el meridiano de A. Se mide por el Ps
arco G'A' determinado en el ecuador por los dos meridianos o
por el ángulo esférico G'PnA'. La longitud se denomina este u oeste según que el punto dado se encuentre
al este o al oeste del primer meridiano. La diferencia de longitud entre dos puntos cuyas longitudes
respectivas son λ1 y λ2 (λ1 > λ2) es λ1 - λ2 si ambos puntos se encuentran hacia un mismo lado del primer
meridiano y es menor que λ1 + λ2 y es 360º - (λ1 + λ2) si se encuentran en lados diferentes.
Los meridianos que pasan por dos puntos de la superficie de la Tierra y los arcos menores de
circunferencia máxima que unen dichos puntos determinan dos triángulos esféricos APnB y APsB. Las
distancias a lo largo de un arco de circunferencia máxima se expresan, generalmente, en millas náuticas.
Por definición
1' de un arco de circunferencia máxima = 1 milla náutica = 6080 pies.
Cuando un barco o un avión recorre un arco de circunferencia máxima Pn

entre dos puntos, su rumbo es el ángulo que el recorrido forma con el
meridiano del barco o del avión. En náutica y en aeronáutica, el rumbo se
mide a partir del norte y con sentido horario. B
Si en la figura un barco ha de navegar desde A hasta B, el rumbo de O O E

salida es el ángulo PnAB y el rumbo de llegada es 180º menos el ángulo
PnBA.
A
Si en la figura un barco ha de navegar desde B hasta A, el rumbo de
salida es 360º menos el ángulo PnBA y el rumbo de llegada es 180º más el Ps
ángulo PnAB.
Triángulos esféricos rectángulos
Se llama triángulo esférico rectángulo a un triángulo esférico tal que uno de sus ángulos sea recto.
Cualquier triángulo rectángulo ABC, donde el ángulo recto siempre se encuentra en C, se resuelve de la
siguiente forma (reglas de Neper):
Del triángulo rectángulo ABC,

B
a
c
C
A b
obtenemos el triángulo:
co-B
a
co-c
co-A b
y aplicamos la siguiente regla: Escójase una cualquiera de las cinco partes y denomínesela parte media;
llámense partes adyacentes a los elementos que se encuentran a ambos lados de la parte media, y llámense
partes opuestas a los elementos restantes. Entonces, las reglas de Neper son:
1. El seno de cualquier parte media es igual al producto de las tangentes de las partes adyacentes.
2. El seno de cualquier parte media es igual al producto de los cosenos de las partes opuestas.
Leyes de los cuadrantes para triángulos rectángulos. En todo triángulo esférico rectángulo deben
verificarse siempre las leyes siguientes:
1. El lado "a" y el ángulo "A" (lo mismo que el lado "b" y el ángulo "B") pertenecen al mismo
cuadrante.
2. Si c < 90º, entonces los lados "a" y "b" (lo mismo que los ángulos "A" y "B") pertenecen al mismo
cuadrante; si c > 90º, entonces los lados "a" y "b" (lo mismo que los ángulos "A" y "B") pertenecen
a cuadrantes diferentes.
Ejemplo.- Resolver el triángulo esférico rectángulo ABC, dados a = 46º 12,3' y c = 75º 48,6'.
Solución.- sen(co-B) = tan(co-c)⋅tan a ⇒ cos B = cot c⋅tan a = 0,2637 ⇒ B = 74º 42' 32"
sen a = cos(co-c)⋅cos(co-A) ⇒ sen A = cosec c⋅sen a = 0,7445 ⇒ A = 48º 7' 9"
sen(co-c) = cos a⋅cos b ⇒ cos b = cs c⋅sec a = 0,3542 ⇒ b = 69º 15' 19"
Ejemplo.- Resolver el triángulo esférico rectángulo ABC, dados a = 109º 15,8' y B = 38º 45,4'.
Solución.-
sen(co-A) = cos(co-B)⋅cos a ⇒ cos A = sen B⋅cos a = -0,20652 ⇒ A = 101º 55' 8"
sen a = tan(co-B)⋅tan B ⇒ tan b = tan B⋅sen a = 0,7578 ⇒ b = 37º 9' 21"
sen(co-B) = tan(co-c)⋅tan a ⇒ cot c = cos B⋅cot a = -0,2725 ⇒ c = 105º 14' 39"
Ejemplo.- El rumbo inicial de un derrotero a lo largo de una circunferencia máxima, a partir de Nueva
York (lat. 40º 42' N, long. 74º 1' O) es 30º 10'. Localizar el punto M del recorrido más cercano al polo
norte, y calcular (en millas náuticas) las distancias, en las circunferencias máximas, desde M hasta el polo
y hasta Nueva York.
P
Solución.- La distancia mínima entre el recorrido y el polo norte n
'
m
10
P se mide a lo largo del meridiano que es perpendicular a la ruta. En 30
º
p M
el triángulo esférico NPM, M = 90º, m = NP = 90º - 40º 42' = 49º 18' N
y N = 30º 10'; P, n y p son las partes buscadas.
40º 42'
O E
sen n = cos(co-m)⋅cos(co-N) = sen m⋅sen N = 0,3809 ⇒
⇒ n = 22º 23' 38"
sen(co-m) = tan(co-N)⋅tan(co-P) ⇒ cot P = cos m⋅ tan N =
= 0,3790 ⇒ P = 69º 14' 31"
sen(co-N) = tan(co-m)⋅tan p ⇒ tan p = tan m⋅cos N =1,0051 ⇒ p = 45º 8' 49"
La latitud de M es 90º - n = 67º 36,4' N; la longitud de M es 74º 1' - P = 4º 46,4' O. La distancia de M a

P es n = 22º 23,6' = 1343,6' = 1343,6 millas, y la distancia de M a Nueva York es p = 45º 8,8' = 2708,8
millas.
Ejemplo.- El rumbo inicial de un derrotero a lo largo de una circunferencia máxima, a partir de San
Francisco (lat. 37º 48,5' N, long. 122º 24' O) es 220º 30'. Localizar el punto M donde el recorrido corta el
ecuador, y calcular la distancia, en la circunferencia máxima, desde M hasta San Francisco.
Solución.- Consideremos el triángulo rectángulo SMT en P

el que m = 37º 48,5', T = 90º, S = 220º 30' - 180º = 40º 30'. 220º 30'
sen m = tan s⋅tan(co-S) ⇒ tan s = sen m⋅tan S = 0,5235 ⇒

S
⇒ s = 27º 38' 6"
t m
O E
sen(co-S) = tan(co-t)⋅tan m ⇒ cot t = cot m⋅cos S = 0,9800 ⇒
M s T
t = 45º 34' 41".
37º 48,5'
La longitud de M es 122º 24' + s = 150º 2,1' O y la

distancia buscada es t = 45º 34,7' = 2734,7 millas.
Ejemplo.- Encontrar el rumbo inicial y el rumbo de llegada de un derrotero, a lo largo de una

circunferencia máxima que, a partir de Chicago (lat. 41º 50' N, long. 87º 31,7' O) corta al ecuador en M
(long. 170º 15' E). Encontrar la distancia entre M y Chicago.
Solución.- Consideremos el triángulo rectángulo MCT en el que m P

= 41º 50', T = 90º y c = 360º - 170º 15' - 87º 31,7' = 102º 13,3'.
sen m = tan c⋅tan(co-C) ⇒ cot C = cot c⋅sen m = -0,1444 ⇒

C
⇒ C = 98º 13' 13" t m
O E
sen c = tan m⋅tan(co-M) ⇒ cot M = sen c⋅cot m = 0,9159 ⇒ T 41º 50'
M c
⇒ M = 42º 29' 12" 102º 13,3'
sen(co-t) = cos c⋅cos m ⇒ cos t = cos c⋅cos m = -0,1577 ⇒
t = 99º 4' 30".
Entonces R.S. = 180º + 98º 13,2' = 278º 13,2', R.LL. = 270º - 42º 29,2' = 227º 30,8', y la distancia es t =
99º 4,5' = 5944,5 millas.
Triángulos esféricos oblicuángulos
Para resolver un triángulo esférico oblicuángulo, necesitamos conocer tres de sus elementos. En este
caso, calcularemos los restantes elementos con el uso de las fórmulas:
Ley de senos. sena = senb = senc .

senA senB senC
Ley de cosenos para lados. cos a = cos b⋅cos c + sen b⋅sen c⋅cos A.
Ley de cosenos para ángulos. cos A = -cos B⋅cos C + sen B⋅sen C⋅cos a.
sen(s − b ) $ sen(s − c )
Fórmulas para el ángulo mitad. tan A = donde s = a + b + c.
2 sen s $ sen(s − a ) 2
cos(S − B ) $ cos(S − C )
Fórmulas para el semi-lado. cot a = donde S = A + B + C .
2 − cos S $ cos(S − A ) 2
Analogías de Gauss.
sen A − B sen a − b sen A + B cos a − b

2 = 2 2 = 2
cos C sen c cos C cos c
2 2 2 2
cos A − B sen a + b cos A + B cos a + b

2 = 2 2 = 2
sen C sen c sen C cos c
2 2 2 2
Analogías de Neper.
tan A − B sen a − b tan a − b sen A − B

2 = 2 2 = 2
+ sen + B
C a b tan c A
cot sen 2
2 2 2
tan A + B cos a − b tan a + b cos A − B

2 = 2 2 = 2
cot C
cos a + b tan c
cos + B
A
2 2 2 2
Ejemplo.- Resolver el triángulo esférico ABC, dados a = 121º 15,4', b = 104º 54,7', c = 65º 42,5'.
Solución.- Aplicando la ley de cosenos para lados, obtenemos:
cos a = cos b⋅cos c + sen b⋅sen c⋅cos A ⇒ cos A = cos a − cos b $ cos c = -0,4689 ⇒ A = 117º 57' 51".
sen b $ sen c
Análogamente:
b − cos a $ cos c = -0,0563 ⇒ B = 93º 13' 4"

cos B = cos sen a $ sen c
cos C = cos c − cos b $ cos a = 0,3363 ⇒ C = 70º 20' 39"

sen b $ sen a
Ejemplo.- Resolver el triángulo esférico ABC, dados A = 117º 22,8', B = 72º 38,6', C = 58º 21,2'
Solución.- Aplicando la ley de cosenos para ángulos, obtenemos:
cos A = -cos B⋅cos C + sen B⋅sen C⋅cos a ⇒ cos a = cos A + cos B $ cos C = -0,3733 ⇒ a = 111º 55,4'
sen B $ sen C
Análogamente:
cos b = cos B + cos A $ cos C = 0,0754 ⇒ b = 85º 40' 25"

sen A $ sen C
cos c = cos C + cos B $ cos A = 0,4571 ⇒ c = 62º 47' 39"

sen B $ sen A
Ejemplo.- Resolver el triángulo esférico ABC, dados a = 106º 25,3', c = 42º 16,7', B = 114º 53,2'
Solución.- Aplicando la ley de cosenos para lados, obtenemos:
cos b = cos a⋅cos c + sen a⋅sen c⋅cos B = -0,4807 ⇒ b = 118º 43' 57"
cos A = cos a − cos b $ cos c = 0,1237 ⇒ A = 82º 53' 37"

sen b $ sen c
cos C = cos c − cos b $ cos a = 0,7180 ⇒ C = 44º 6' 12"

sen b $ sen a
Ejemplo.- Resolver el triángulo esférico ABC, dados A = 48º 44,6', B = 60º 42,6', c = 76º 22,4'
Solución.- Aplicando la ley de cosenos para ángulos, obtenemos:
cos C = -cos A⋅cos B + sen A⋅sen B⋅cos c = -0,1681 ⇒ C = 99º 40' 48"
cos a = cos A + cos B $ cos C = 0,6173 ⇒ a = 47º 49' 47"

sen B $ sen C
cos b = cos B + cos A $ cos C = 0,5105 ⇒ b = 59º 17' 57"

sen A $ sen C
Ejemplo.- Resolver el triángulo esférico ABC, dados a = 80º 26,2', c = 115º 30,6', A = 72º 24,4'
Solución.- Aplicando la ley de los senos, tenemos:
sen a = sen c e sen C = sen c $ sen A = 0,8724 ⇒  C = 119 15’31” .

o
sen a 
 C = 60 44’28”
sen A sen C o
Como c > a ⇒ C > A, por tanto C = 119º 15' 31"
Aplicando las analogías de Neper, tenemos:
tan C − A sen c − a sen c + a $ tan C − A

2 = 2 B
e cot = 2 2 = 1,4240 ⇒ B = 70º 9' 17"
B c + a 2 sen c − a
cot sen
2 2 2
Aplicando la ley de cosenos para lados, obtenemos:
cos b = cos a⋅cos c + sen a⋅sen c⋅cos B = 0,2305 ⇒ b = 76º 40' 8"
Ejemplo.- Resolver el triángulo esférico ABC, dados A = 35º 52,5', a = 40º 38,6', B = 56º 10,7'
Solución.- Aplicando la ley de los senos, tenemos:
sen a = sen b e sen b = sen a $ sen B = 0,9233 ⇒  b 1 = 112 34’24”

o

 b 2 = 67 25’35”
sen A sen B sen A o
Aplicando ahora las analogías de Neper, tenemos:
tan A − B sen a − b sen a + b $ tan A − B  0, 2965 Si b = b 1

2 = 2 C
e cot = 2 2 =
C a + b 2 a − b  e
cot sen sen  0, 6257 Si b = b 2
2 2 2

u  C 1 = 146 57’ 34”
o
 C 2 = 115 o 55’ 42”
Aplicando la ley de cosenos para lados, obtenemos:
 −0, 7954 Si b = b 1 y C = C 1  c 1 = 142 o 42’

cos c = cos a⋅cos b + sen a⋅sen b⋅cos C =  e
 c 2 = 88 22’ 12”
o
 0, 0284 Si b = b 2 y C = C 2
Ejemplo.- Encontrar la distancia, el rumbo de salida y el rumbo de llegada correspondientes a un viaje

desde Honolulú (lat. 21º18,3' N, long. 157º52,3' O) hasta San Francisco (lat. 37º47,5' N, long. 122º25,7' O).
Solución.- En la figura, A es Honolulú, B es San Francisco y C es el polo norte.
Entonces a = 90º - 37º 47,5' = 52º 12,5', b = 90º - 21º 18,3' = 68º 41,7' y C = 157º 52,3' - 122º 25,7' =
35º 26,6'.
C
Por la ley de cosenos para lados, tenemos que:
cos c = cos a⋅cos b + sen a⋅sen b⋅cos C = 0,8224 ⇒ c = 34º 40,2' b a

cos A = cos a − cos b $ cos c = 0,5924 ⇒ A = 53º 40,2'
sen b $ sen c
b − cos a $ cos c = -0,3129 ⇒ B = 108º 14'
cos B = cos sen c B
a $ sen c
A
La distancia buscada es c = 34º 40,2' = 2080,2 millas. El rumbo de salida es
A = 53º 40,2' y el rumbo de llegada es 180º - B = 71º 45' 54".
Ejemplo.- Un barco navega a lo largo de una circunferencia máxima desde Dutch Harbor (lat. 53º 53'
N, long. 166º 35' O) hasta Melbourne (lat. 37º 50' S, long. 144º 59' E). a) Encontrar la distancia, el rumbo
de salida y el rumbo de llegada. b) Localizar el punto donde el recorrido corta al ecuador. Encontrar el
rumbo y la distancia desde este punto a Dutch Harbor. c) Localizar el punto del recorrido cuya longitud es
180º. Encontrar el rumbo y la distancia desde este punto a Dutch Harbor.
Solución.- a) En la figura (a), A es Dutch Harbor, B es Melbourne y C es

el polo norte. Entonces b = 90º - 53º 53' = 36º 7', a = 90º + 37º 50' = 127º 50' C
y C = 360º - (166º 35' + 144º 59') = 48º 26'. b
a A
Por la ley de cosenos para lados, tenemos que:
cos c = cos a⋅cos b + sen a⋅sen b⋅cos C = -0,1866 ⇒ c = 100º 45,4' c
cos A = cos a − cos b $ cos c = -0,7988 ⇒ A = 143º 1,4'

sen b $ sen c
B fig. a
b − cos a $ cos c = 0,8935 ⇒ B = 26º 40,4'
cos B = cos sen a $ sen c
La distancia buscada es 100º 45,4' = 6045,4 millas. El rumbo de salida es 360º - A = 216º 58,6' y el
rumbo de llegada es 180º + B = 206º 40,4'.
b) Llamando D a la intersección del recorrido con el ecuador, y G la

Pn
intersección del meridiano que pasa por A y el ecuador, tenemos el siguiente
ecuador
triángulo rectángulo AGD de la figura (b), en el que G = 90º d = 53º 53' y A =
180º - 143º 1,4' = 36º 58,6'. A
g
d
Aplicando las reglas de Neper (para triángulos rectángulos), obtenemos:
D a G
tan a = sen d⋅tan A = 0,6082 ⇒ a = 31º 18,5'
B fig. b
cos D = cos d⋅sen A = 0,3545 ⇒ D = 69º 14,1'
tan g = tan d⋅sec A = 1,7155 ⇒ g = 59º 45,7'
La longitud de D es 166º 35' + 31º 18,5' = 197º 53,5' O = 162º 6,5' E. El rumbo de llegada a D es de
270º - D = 200º 45,9'. La distancia de D a Dutch Harbor es g = 59º 45,7' = 3585,7 millas.
c) Llamemos M al punto del recorrido cuya longitud es 180º y consideremos el triángulo esférico AMC
de la figura (c) en el que C = 180º - 166º 35' = 13º 25', m = 90º - 53º 53' = 36º 7' y A = 143º 1,4'
Por el teorema del coseno para ángulos, tenemos: C

m
cos M = -cos A⋅cos C + sen A⋅sen C⋅cos m = 0,8898 ⇒ M = 27º 8' 57"
a A
cos a = cos A + cos M $ cos C = 0,6295 ⇒ a = 50º 59' c
sen M $ sen C M
cos c = cos C + cos A $ cos M = 0,9540 ⇒ c = 17º 26' 27"
sen A $ sen M
La latitud de M es 90º - a = 39º 1' N. El rumbo desde M es 180º + M = 207º 8' 57" B fig. c
y la distancia entre M y Dutch Harbor es c = 17º 26' 27" = 1046,4 millas.
Ejemplo.- Un buque parte de Nueva York (lat. 40º 48,6' N, long. 73º 57,5' O) para efectuar una
travesía a lo largo de una circunferencia máxima. El rumbo de salida es 36º. (a) Encontrar la latitud y la
longitud de su posición B cuando ha recorrido 500 millas. (b) Localizar el punto de la travesía que se
encuentra más hacia el norte.
C
Solución.- a) En la figura (a), A es Nueva York ⇒
⇒ b = 90º - 40º 48,6' = 49º 11,4', c = 500 millas = 8º 20' y A = 36º.
Aplicando el teorema del coseno para lados, tenemos: b

a
cos a = cos b⋅cos c + sen b⋅sen c⋅cos A = 0,7353 ⇒ a = 42º 39' 32"
b − cos a $ cos c = - 0,7543 ⇒ B = 138º 57' 52"
cos B = cos sen a $ sen c B
c
cos C = cos c − cos a $ cos b = 0,9920 ⇒ C = 7º 13'19" A
sen a $ sen b fig. a
La latitud de B es 90º - a = 47º 20,4' N y la longitud es 73º 57,5' - C = 66º 44,2' O.
b) El punto de la travesía que se encuentra más al norte es D, cuyo meridiano es C

perpendicular al recorrido. En el triángulo esférico rectángulo ACD de la figura (b),
a
d = 49º 11,4' y A = 36º.
d D
Aplicando las reglas de Neper, tenemos que:
c
sen a = sen d⋅sen A = 0,4448 ⇒ a = 26º 24' 57"
tan C = sec d⋅cot A = 2,1059 ⇒ C = 64º 36'

A fig. b
La latitud de D es 90 - a = 63º 35,1' N y la longitud es 73º 57,5' - C = 9º 21,5' O.
Resolver cada uno de los siguientes triángulos esféricos rectángulos ABC, en los que C = 90º.
1. a = 125º 24,8' y b = 32º 16,5'
2. a = 46º 46,4' y A = 57º 28,3'
3. c = 70º 25,2' y A = 52º 54,8'
4. A = 67º 38,8' y B = 155º 12,6'
Resolver los siguientes triángulos esféricos oblicuángulos ABC.
5. a = 56º 22,3', b = 65º 54,9' y c = 78º 27,4'
6. A = 71º 2,8', B = 119º 25,2' y C = 60º 45,6'
7. a = 61º 51,7', c = 67º 55,4' y B = 111º 57,9'
8. 8.- B = 66º 42,7', C = 84º 57,5' y a = 107º 8,4'
9. b = 37º 47,2', c = 103º 1,4' y B = 24º 25,6'
10. a = 98º 53,2', c = 64º 35,8' y A = 95º 23,4'
11. Un barco parte de Nueva York (lat 40º 42' N, long. 74º 1' O) con un rumbo inicial hacia el este a lo
largo de una circunferencia máxima. Encontrar su rumbo y posición cuando ha recorrido 525 millas
náuticas.
12. El rumbo inicial a lo largo de una circunferencia máxima, a partir de Yokohama (lat. 35º 37' N, long.
139º 39' E) es 40º 40'. Localizar el punto del recorrido más cercano al polo norte.
13. Un barco que parte de A (lat. 36º 50' N, long. 76º 20' O) y que navega a lo largo de una
circunferencia máxima corta el ecuador en un punto cuya longitud es 50º O. Encontrar el rumbo
inicial y la distancia recorrida.
14. Encontrar la distancia más corta entre:

a) Chicago (lat 41º 50' N, long. 87º 37' O), y Dutch Harbor (lat. 53º 54' N, long. 166º 30' O).
b) Nueva York (lat 40º 43' N, long. 74º O), y Río de Janeiro (lat. 22º 54' S, long. 43º 11' O).
c) Dutch Harbor y Río de Janeiro.
15. Encontrar la distancia a lo largo de la circunferencia máxima, el rumbo inicial y el rumbo de

llegada de un vuelo desde Washington (lat. 38º 55' N, long. 77º 4' O) hasta Moscú (lat 55º 45' N,
long. 37º 34' E).
16. Encontrar la distancia a lo largo de la circunferencia máxima, el rumbo inicial y el rumbo de

llegada de un vuelo desde Calcuta (lat. 22º 35' N, long. 88º 27' E) hasta Melbourne (lat 37º 48' S,
long. 144º 58' E).
ENM Matemáticas II Curvas y Superficies 1
TEMA 1
CURVAS
Definición de curva
Definición.- Sea P œ Rn; se llama bola (abierta) de centro P y radio r a:
BP = B(P, r) = {Q œ Rn / d(Q, P) < r}.
Definición.- Sea f: A ⊂ Rn → B ⊂ Rm, decimos que f es un homeomorfismo entre A y B si f es

biyectiva y bicontinua, y decimos que f es un homeomorfismo local si ∀ P ∈ A ∃ BP = B(P, r) tal que f es
un homeomorfismo entre BP…A y f(BP…A).
Definición (de curva simple).- Sea C ⊂ Rn (n = 2 o 3) un conjunto conexo. Decimos que C es una
curva simple o curva de Jordan si ∀ P ∈ C, ∃ BP ⊂ Rn tal que BP…C = a(I), donde I = (a, b) ⊂ R y a es
un homeomorfismo entre (a, b) y BP…C. Al par (I, a) se le llama carta o representación paramétrica de
C en el entorno a(I) del punto P. A una colección de cartas que recubre la curva C se le llama atlas. Las
curvas simples se clasifican en elementales y cerradas:
C es una curva simple elemental si C = a((a, b)), donde a es un homeomorfismo

entre (a, b) ⊂ R y C.
BP
P C es una curva simple cerrada si C = a([a, b]), donde a es continua en [a, b]
⊂ R, a(a) = a(b) y a es un homeomorfismo entre (a, b) y C - {a(a)}. Toda curva
C simple cerrada es un subconjunto compacto (cerrado y acotado).
α(I)
Proposición.- La imagen de una curva simple mediante un homeomorfismo de

Rn en Rn es una curva simple.
Definición.- Sean P, Q dos puntos de una curva C = a(I), se llama arco de curva (o camino) g de
extremos P y Q a la porción de curva C que une P y Q. g = a([c, d]) con [c, d] Õ I.
Definición (de curva general).- Decimos que C ⊂ Rn es una curva general no cerrada si C = a((a, b)),
donde a homeomorfismo local de (a, b) en C; y decimos que C es una curva general cerrada si C =
a([a, b]), donde a es un homeomorfismo local de [a, b] en C y a(a) = a(b).
Definición.- Un punto P ∈ C se dice simple, si ∃ BP tal que C…BP es una curva

elemental, en caso contrario se dice múltiple (P es doble si C…BP son dos curvas P
elementales, P es triple si C…BP son tres curvas elementales etc...). punto doble
Definición.- Se llaman ecuaciones paramétricas de una curva C a: x1 = α1(t), ..., xn = αn(t) en donde t
∈ (a, b) si no es cerrada o bien t ∈ [a, b] con a(a) = a(b) si es cerrada. Ejemplo: La hélice circular definida
por a(t) = (aÿcost, aÿsent, bÿt) a > 0, b > 0 y t œ R.
Definición.- Dada la curva C = a(I), se llama cambio de parámetro a cualquier homeomorfismo g

entre un intervalo J ⊂ R y el intervalo I. La nueva parametrización de la curva es: C = (a°g)(J).
Curvas regulares
Definición.- Una curva C es diferenciable, de clase q ≥ 1 o analítica en el punto P ∈ C si existe una

parametrización (I, a) en un entorno de P tal que a es diferenciable, de clase q o analítica en I.
Definición.- Un punto P = a(t0) de una curva diferenciable C = a(I) se llama singular para la
parametrización dada si a'(t0) = 0 y regular si a'(t0) ≠ 0. Una parametrización de clase q ≥ 1 se dice
regular si no tiene ningún punto singular. Una curva C es regular si posee una parametrización regular.
Observación.- Si a'(t0) ≠ 0, entonces a'(t0) es un vector tangente a C en P.
Definición.- Dada una representación regular (I, a) de C, se llama cambio admisible de parámetro a
un homeomorfismo g de otro intervalo J ⊂ R en I de clase q ≥ 1, tal que g'(u) ≠ 0 para todo u ∈ J.
Definición.- Una curva simple (I, a) es regular a trozos si existe una partición {t0,..., tm} de I tal que
la curva es regular en cada subintervalo abierto (ti-1, ti) con i = 1, ..., m.
Curvas rectificables
Sea γ = a([c, d]) ⊂ C un arco de curva. La partición σ = {c = t0,..., tm = d} determina una línea poligonal
m
inscrita en γ cuya longitud es: L( ) = æ(t i ) − (t i−1 )æ.
i=1
Definición.- Se dice que γ es un arco de curva rectificable si el conjunto {L(σ) / σ ∈ P[c, d]} está
acotado. Su supremo se denomina longitud de γ y se representa por L(c, d). Una curva C es rectificable si
los son todos sus arcos.
Teorema.- Si a ∈ C1[c, d] (a' existe y es continua en [c, d]) ⇒ γ es rectificable.
Definición.- Sea C = a(I) una curva rectificable. Se llama abscisa curvilínea de origen t0 ∈ I relativa a
a a la función s: I → J ⊂ R definida por: s(t) = L(t0, t) si t ≥ t0 y s(t) = -L(t0, t) si t ≤ t0.
Teorema.- "s" es una función estrictamente creciente y continua en I.
Teorema.- Si la curva regular C = a(I) es de clase uno en I, "s" es de clase uno en I y s'(t) = ||a'(t)||.
Como consecuencia la longitud de arco de una curva regular de clase uno desde el punto t0 al punto t
t
viene dada por: s(t) = ¶ t0 æ ∏ (u )ædu.
Como la abscisa curvilínea de origen t0 relativa a a es estrictamente creciente y continua, si (I, a) es

una parametrización de C, entonces el par (J = s(I), x = a)s-1) es otra parametrización de C.
ESTUDIO LOCAL DE UNA CURVA
Recta tangente y plano normal
Sea C una curva dada por una parametrización natural (el parámetro es la longitud de arco) x(s) o una
parametrización regular a(t) y sea P = x(s0) = a(t0) un punto fijo de C.
Definición.- Se llama vector tangente unitario a C en el punto P al vector: t = x'(s0).
∏ (t 0 )
Proposición.- Se verifica que: t = .
æ ∏ (t 0 )æ
Definición.- Se llama recta tangente a C en el punto P al la recta: x = a(t0) + λ a'(t0).
Definición.- Se llama plano normal a C en el punto P al plano: (x - a(t0))⋅⋅a'(t0) = 0.
Curvatura. Normal principal. Plano osculador
Definición.- Se llama vector curvatura de C en el punto P al vector: K(s0) = x"(s0) y se llama

curvatura de C en el punto P a: χ(s0) = ||x"(s0)|| (Se supone que x(s) es de clase mayor o igual que dos). Si
x"(s) = 0 para todo s ∈ I, entonces C es una recta.
Propiedades.-
1. El vector K(s) no depende de la orientación de la curva.
2. K(s) ⊥ t.
æ ∏ (t 0 ) % ∏∏ (t 0 ) æ
Teorema.- Si la curva viene dada por a(t), la curvatura en el punto P es: χ(t0) = .
æ ∏ (t 0 )æ 3
Definición.- Un punto cuya curvatura es cero se llama punto de inflexión o singular de orden uno.
x ∏∏ (s 0 )
Definición.- Si ||x"(s0)|| ≠ 0 se llama vector normal principal en el punto P al vector: n = .
æx ∏∏ (s 0 )æ
Proposición.- El vector (a'(t0) × a"(t0)) × a'(t0) tiene la misma dirección y sentido que n.
Definición.- Se llama recta normal a C en el punto P a la recta: x = a(t0) + λ n.
Definición.- Se llama plano osculador a C en el punto P al plano: (x - a(t0))⋅(t × n) = 0.
Proposición.- Los vectores a'(t0) × a"(t0) y t × n, son linealmente dependientes.
Definición.- Se llama radio de curvatura de la curva C en el punto P a: R = %1 . R es el radio de un

círculo situado en el plano osculador, cuyo centro, llamado centro de curvatura esta situado en la recta
normal en el sentido del vector n y a una distancia R del punto dado. Este círculo se llama círculo
osculador y a su circunferencia se llama osculatriz.
Triedro móvil. Torsión
b Definición.- Se llama vector binormal a C en P al vector: b = t × n.
Definición.- Se llama recta binormal a C en P a la recta: x = a(t0) + λ b.

Plano normal
e
nt
ica
tif
n
ec
P
or
Definición.- Se llama plano rectificante a C en P al plano: (x - a(t0))⋅⋅n = 0.

an
Pl
Plano osculador
t
Definición.- Se llama triedro de Frenet o triedro móvil a C en P a: {t, n, b}.
C
Definición.- Si ||x"(s0)|| ≠ 0 se llama torsión de la curva C, dada por x(s) (de

clase mayor o igual que tres), en el punto P a: τ(s0) = - b'(s0)⋅n(s0).
La torsión, al igual que la curvatura, es independiente de la orientación de C.
[x ∏ (s 0 ), x ∏∏ (s 0 ), x ∏∏∏ (s 0 )]
Teorema.- La torsión en el punto P viene dada por: !(s 0 ) = .
%(s 0 ) 2
[ ∏ (t 0 ), ∏∏ (t 0 ), ∏∏∏ (t 0 )]
Teorema.- Si C viene dada por a(t) la torsión en P vale: !(t 0 ) = .
æ ∏ (t 0 ) % ∏∏ (t 0 )æ 2
Teorema.- Si C es una curva de clase tres sin puntos de inflexión, entonces C es plana si y sólo si su
torsión es idénticamente nula.
Fórmulas de Frenet. Ecuaciones intrínsecas de la curva
t ∏ (s ) 0 %(s ) 0 t(s )
Definición.- Se llaman fórmulas de Frenet a: n ∏ (s ) = −%(s ) 0 !(s ) n(s ) .
b ∏ (s ) 0 −!(s ) 0 b(s )
Teorema fundamental de la teoría de curvas: Dadas dos funciones χ(s) y τ(s) de I en R,

diferenciables en I, existe una única curva regular C de ecuaciones paramétricas x = x(s) tal que χ(s) es la
curvatura y τ(s) es la torsión. La unicidad es salvo su posición en el espacio. A χ = χ(s) y τ = τ(s) se
denominan ecuaciones intrínsecas de la curva.
Ejemplo tipo
Ejercicio.- Dada la curva C = a(I), con a(t) = (1, t2, t3) e I = (0, ∞), calcular todo en P(1, 1, 1).
Solución: a'(t) = (0, 2t, 3t2) ⇒ a'(1) = (0, 2, 3), a''(t) = (0, 2, 6t) ⇒ a''(1) = (0, 2, 6), a'''(t) = (0, 0, 6).
t t 3
Parametrización natural: s(t ) = ¶ 0 æ ∏ (u )ædu = ¶ 0 0 2 + (2u ) + (3u 2 ) du = 1 (9t 2 + 4 ) 2 − 8 ⇒
2 2

27
3
2
(27s + 8 ) − 4 (27s + 8 ) − 4
2 2
(27s + 8 ) − 4
2 3
3 3
et= e x(s) = 1, , ;
3 9 27
por tanto, haremos todos los cálculos con a(t), ya que x(s) tiene derivadas más largas.
3 3
La longitud del arco entre los puntos t0 = 1 y t0 = 2 es: s(2) - s(1) = 1 (9 $ 2 2 + 4 ) 2 − (9 $ 1 2 + 4 ) 2 .
27
Triedro de Frenet, {t, n, b}, en P:
∏ (1 ) (0, 2, 3 ) (0, 2, 3 ) 1 (0, 2, 3 ).

Vector tangente unitario en (1, 1, 1): t = = = =
æ (1 )æ æ(0, 2, 3 )æ
∏
02 + 22 + 32 13
( ∏ (1 ) % ∏∏ (1 )) % ∏ (1 ) (0, −18, 12 ) 1 (0, −3, 2 ).

Vector normal unitario en (1, 1, 1): n = = =
æ( ∏ (1 ) % ∏∏ (1 )) % ∏ (1 )æ æ(0, −18, 12 )æ 13
Vector binormal en (1, 1, 1): b = t × n = ( 1, 0, 0).
Rectas y planos en P:
Recta tangente en (1, 1, 1): (x, y, z) = (1, 1, 1) + λ(0, 2, 3).

b
Recta normal en (1, 1, 1): (x, y, z) = (1, 1, 1) + λ(0, -3, 2).
Plano normal
e
(x, y, z) = (1, 1, 1) + λ(1, 0, 0).

nt
Recta binormal en (1, 1, 1):

i ca
tif
n
ec
P
or
Plano normal en (1, 1, 1): 0(x - 1) + 2(y - 1) + 3(z - 1) = 0.

an
Pl
Plano osculador
Plano osculador en (1, 1, 1): 1(x - 1) + 0(y - 1) + 0(z - 1) = 0. t

C
Plano rectificante en (1, 1, 1): 0(x - 1) - 3(y - 1) + 2(z - 1) = 0.
Curvatura, radio de curvatura, centro de curvatura y torsión en P:
æ ∏ (1 ) % ∏∏ (1 )æ æ(6, 0, 0 )æ 6 6 .
Curvatura en (1, 1, 1): %(1 ) = 3 = = =
æ ∏ (1 )æ æ(0, 2, 3 )æ 3 ( 13 ) 3 13 13
Si χ(1) = 0, P sería un punto de inflexión; si χ(t) = 0 ∀ t ∈ I, la curva sería una recta.
Vector curvatura en (1, 1, 1): k = % $ n = 6 1 (0, −3, 2 ) = 1 (0, −18, 12 ).

13 13 13 169
13 13
Radio de curvatura en (1, 1, 1): R = 1% = .
6
13 13 1 (0, −3, 2 ) = 1, − 11 , 16 .
Centro de curvatura en (1, 1, 1): (1, 1, 1 ) +
6 13 2 3
0 2 3
0 2 6
[ ∏ (1 ), ∏∏ (1 ), ∏∏∏ (1 )]0 0 6
Torsión en (1, 1, 1): !(1 ) = = = 0 = 0.
æ ∏ (1 ) % ∏∏ (1 )æ 2 æ(6, 0, 0 )æ 2 36
Como τ(t) = 0 ∀ t ∈ I, la curva está contenida en el plano osculador (x = 1).

EL CONCEPTO DE SUPERFICIE
Superficies elementales, simples y generales
Definición.- Sea Ω Õ R2, se dice que Ω es una región elemental de R2, si es un subconjunto abierto y
acotado limitado por una curva simple cerrada.
Definición.- Se llama superficie elemental de R3 a la imagen S de una región elemental Ω por medio
de un homeomorfismo r (S = r(Ω)). Al par (Ω, r = (r1, r2, r2)) se le llama carta o representación
paramétrica de S y a x = r1(u, v), y = r2(u, v) y z = r3(u, v) ecuaciones paramétricas de S. Si Ω está
contenida en uno de los planos coordenados, (Ω, r) se llama carta de Monge o representación explícita
de S.
Definición.- Se llaman líneas coordenadas de S, a las curvas: x = r(u, v0), x = r(u0, v). Si P = r(u0, v0),
a (u0, v0) se le llaman coordenadas curvilíneas de P.
Definición.- Un conjunto conexo S de R3 es una superficie

simple si ∀ P ∈ S ∃ BP, tal que S…BP es una superficie elemental, BP
es decir: S…BP = r(Ω). Al par (Ω, r) se le llama carta o
representación paramétrica de S en un entorno de P. Por tanto P
una superficie simple se determina por una colección de cartas S
llamada atlas. Una superficie elemental es una superficie simple
cuyo atlas consta de una sola carta.
Definición.- Si una superficie simple S es un conjunto cerrado (S' Õ S), entonces se denomina
superficie simple completa. Si además S es acotada, se denomina superficie simple compacta. Estas
últimas superficies también se llaman cerradas (en sentido geométrico).
Definición.- Una superficie general es la imagen de una superficie simple por medio de un
homeomorfismo local.
Definición.- Un punto P de una superficie S es un punto simple si ∃ BP, tal que S…BP es una superficie
elemental, en caso contrario se dice que P es un punto múltiple (P es doble si S…BP son dos superficies
elementales, P es triple si S…BP son tres superficies elementales etc...)..
Definición.- Una superficie elemental es diferenciable, de clase q ≥ 1 o analítica si posee una

parametrización (Ω, r) tal que r es diferenciable, de clase q ≥ 1 o analítica en Ω. Un punto P = r(u0, v0) se
dice que es singular para la parametrización dada si el vector ru × rv = 0 y regular si ru × rv ≠ 0. Una
parametrización diferenciable es regular si no tiene ningún punto singular. Una superficie elemental es
regular si posee una parametrización regular. Una superficie cualquiera S se dice que es diferenciable, de
clase q ≥ 1, analítica o regular si para cada punto P de S ∃ BP, tal que S…BP admite una parametrización
diferenciable, de clase q ≥ 1, analítica o regular.
Plano tangente y recta normal en un punto a una superficie
Sea P = r(u0, v0) = (x0, y0, z0) un punto regular de una superficie regular S.
N(u 0 , v 0 )
Notación.- N(u 0 , v 0 ) = r u (u 0 , v 0 ) % r v (u 0 , v 0 ); n(u 0 , v 0 ) = .
æN(u 0 , v 0 )æ
Definición.- Un vector w es tangente a una superficie S en el punto P si w es tangente en P a una

curva C contenida en S.
Observación.- Una curva C contenida en S es la imagen por medio de r de una curva g contenida en
W, de ecuaciones u = α1(t) y v = α2(t). Por tanto, w = a1'ru+ a2'rv.
Definición.- Se llama plano tangente a S en el punto P al plano: [ru, rv, PX] = 0 (donde X = (x, y, z)).
Definición.- Se llama recta normal a S en el punto P a la recta: X = P + λN.
1ª Forma fundamental
Definición.- Se llama primera forma fundamental de S en el punto P a la forma cuadrática:
IP(h, k) = 〈hru + krv, hru + krv〉 = Eh2 + 2Fhk + Gk2;
donde E = 〈ru, ru〉, F = 〈ru, rv〉 y G = 〈rv, rv〉.
Teorema.- IP es definida positiva e invariante respecto a cualquier otra representación regular.
Aplicaciones de la 1ª forma fundamental.
Sea el arco de curva de clase uno ([a, b], a) en la región Ω, de ecuaciones u = α1(t) y v = α2(t). Su
imagen por medio de r es un arco de curva ([a, b], r±a), contenido en S. Su longitud viene dada por:
b
L = ¶a Ir((t)) ( ∏ (t )) dt
Cálculo del ángulo que forman en un punto P dos curvas a y b contenidas en la superficie. Sean
h = h1ru + h2rv y k = k1ru + k2rv
dos vectores tangentes en P a las curvas a y b respectivamente. Si q es el ángulo que forman, se tiene:
h$k Eh 1 k 1 + F(h 1 k 2 + h 2 k 1 ) + Gh 2 k 2
cos( ) = =
æh æ $ æk æ Eh 21 + 2Fh 1 h 2 + Gh 22 Ek 21 + 2Fk 1 k 12 + Gk 22
En particular, si h y k son los vectores tangentes a las curvas r = r(u, v0) y r = r(u0, v) en el punto, el
ángulo que forman viene dado por:
ru $ rv F
cos( ) = =
ær u æ $ ær v æ EG
2ª Forma fundamental
Definición.- Se llama segunda forma fundamental de S en el punto P a la forma cuadrática:
IIP(h, k) = -〈hru + krv, hnu + knv〉 = Lh2 + 2Mhk + Nk2;
donde L = 〈n, ruu〉, M = 〈n, ruv〉 y N = 〈n, rvv〉.
Teorema.- IIP es invariante respecto a cualquier otra representación regular que conserve la orientación
del espacio.
Aplicación de la 2ª forma fundamental. P
Clasificación de un punto de la superficie: P

elíptico hiperbólico
Si LN - M2 > 0, el punto P es elíptico.
Si LN - M2 < 0, el punto P es hiperbólico.
Si LN - M2 = 0 y no son nulos todos los coeficientes, el P
punto P es parabólico. P
parabólico plano
Si L = M = N = 0, el punto P es plano.
Curvaturas normal, de Gauss y geodésica
Sea C una curva contenida en una superficie S. Supongamos que K es el vector curvatura a C en P y n
es el vector normal unitario a S en P.
Definición.- Se llama vector curvatura normal de C en P, y se representa por Kn, al vector proyección
de K sobre la recta normal a S en P.
Kn = (Kÿn)n
El producto cn = Kÿn se denomina curvatura normal.
II P (u ∏ (t), v ∏ (t ))
Proposición.- Si la curva C viene dada por a(t) = r(u(t), v(t)) con t œ I, entonces, % n = .
I P (u ∏ (t), v ∏ (t ))
Teorema (de Meusnier).- Todas las curvas sobre la superficie que tienen la misma recta tangente en un
punto, tienen la misma curvatura normal en él.
Definición.- Se llaman direcciones principales aquellas en las que la curvatura normal alcanza sus
valores extremos. A las curvaturas normales correspondientes se le denominan curvaturas principales.
A las curvaturas principales las representaremos por c1 y c2.
Cálculo de las direcciones y curvaturas principales:
Si w = hru + krv ª (h, k) es el vector de una dirección principal, satisface la ecuación:
k 2 −hk h 2
E F G = 0.
L M N
Si podemos tomar h = 1, la ecuación anterior toma la forma
k 2 −k 1
E F G =0
L M N
Esta ecuación determina dos valores k1 y k2, salvo en los puntos en los que E = F = G , llamados
L M N
puntos umbílicos. Análogo para k = 1.
Proposición.- En cada punto no umbílico de la superficie las dos direcciones principales (1, k1) y (1, k2)
((h1, 1) y (h2, 1)) son ortogonales.
Las curvaturas principales pueden obtenerse de dos formas:
II P (1, k 1 ) II (1, k 2 ) II (h , 1 ) II (h , 1 )
%1 = , %2 = P o, % 1 = P 1 , %2 = P 2 .
(
I P 1, k 1 ) (
IP 1, k 2 ) (
IP h 1 , 1 ) I p (h 2 , 1 )
Como soluciones de la ecuación: (EG - F2)cn2 - (EN + GL - 2FM)cn + (LN - M2) = 0.
Definición.- Se llama curvatura de Gauss o curvatura total a:
% t = % 1 % 2 = LN − M2
2
EG − F
Definición.- Se llama curvatura de media a:

% 1 + % 2 EN + GL − 2FM
%m = =
2 2(EG − F 2 )
Definición.- Se llama vector curvatura geodésica de C en P, y se representa por Kg, al vector

proyección de K sobre el plano tangente a S en P.
Como consecuencia de las definiciones K = Kn + Kg.
Si designamos por v el vector unitario en la dirección de Kg, tal que t, v y n formen una terna positiva,
resulta que
Kg = (Kÿv)v
El producto cg = Kÿv = [K, n, t] se denomina curvatura geodésica.
Líneas de curvatura
Definición.- Una curva regular C sobre una superficie S se dice que es una línea de curvatura si la
recta tangente en cada uno de sus puntos coincide con una dirección principal.
Su ecuación diferencial es: (EM - FL)du2 + (EN - GL)dudv + (NF - GM)dv2 = 0.
Definición.- Dados dos puntos P y Q de una superficie S, se llama distancia intrínseca entre P y Q al
ínfimo de las longitudes de los arcos de curva contenidos en S que unen P y Q. Cuando existe tal arco se
denomina arco mínimo. Los arcos mínimos se caracterizan porque su curvatura geodésica es cero.
Definición.- Una curva sobre una superficie se llama línea geodésica si su curvatura geodésica en cada
punto es cero. Los arcos de línea geodésica son arcos mínimos.
La ecuación diferencial de las líneas geodésicas se obtiene sustituyendo en la condición [K, n, t] = 0

u(t) = u, v(t) = v, u'(t)dt = du, v'(t)dt = dv, etc.
Definición.- Una dirección en un punto se llama asintótica si la curvatura normal del punto es cero en
esa dirección.
Definición.- Una curva sobre una superficie se llama línea asintótica si su curvatura normal en cada
punto es cero.
La ecuación diferencial de las líneas asintóticas es: Ldu2 + 2Mdudv + Ndv2 = 0.

Ejemplo tipo
Ejercicio.- Dada la superficie r(u, v) = (u, v, u2 + v2) , hallar todo en el punto P, de coordenadas
curvilíneas (1, 1).
Solución.- Las coordenadas cartesianas de P son (1, 1, 2).
Cálculo de los vectores ru, rv, ruu, ruv, rvv, N y n en el punto P
ru(u, v) = (1, 0, 2u); fl ru(1, 1) = (1, 0, 2).
rv(u, v) = (0, 1, 2v); fl rv(1, 1) = (0, 1, 2).
ruu(u, v) = (0, 0, 2); fl ruu(1, 1) = (0, 0, 2).
rvv(u, v) = (0, 0, 2); fl rvv(1, 1) = (0, 0, 2).
ruv(u, v) = (0, 0, 0); fl ruv(1, 1) = (0, 0, 0).
N(u, v) = (1, 0, 2u) µ (0, 1, 2v) = (-2u, -2v, 1) fl N(1, 1) = (-2, -2, 1).
N(1, 1)
n(1, 1) = = (−0.667, −0.667, 0.333 ) .
æN(1, 1) æ
Cálculo de la primera y segunda forma fundamental:
E = ru(1, 1)ÿru(1, 1) = 5, F = ru(1, 1)ÿrv(1, 1) = 4, G = rv(1, 1)ÿrv(1, 1) = 5
L = n(1, 1)ÿruu(1, 1) = 0.668, M = n(1, 1)ÿruv(1, 1) =0, N = n(1, 1)ÿrvv(1, 1) = 0.668,
La primera forma fundamental en P es: IP(h, k) = 5h2 + 8hk + 5k2.
La segunda forma fundamental en P es: IIP(h, k) = 0.667h2 + 0.667k2.
Ángulo que forman las curvas coordenadas sobre la superficie en P:
cos( ) = F = 4 = 0.8 e = 0.644

EG 5$5
Clasificación de P:
LN - M2 = 0.445 > 0, fl el punto es elíptico.
La curvatura normal en la dirección del vector hru + krv ((h,k)) es:
II P (h, k ) 0.667h 2 + 0.667k 2

%n = =
I P (h, k ) 5h 2 + 8hk + 5k 2
Cálculo de las direcciones principales y curvaturas principales
k 2 −k 1
Si h = 1, fl E F G = 0, e k 1 = −1 y k 2 = 1
L M N
IIP (1, −1 ) 0.667 + 0.667

%1 = = = 0.667
I P (1, −1 ) 5−8+5
II (1, 1 ) 0.667 + 0.667
%2 = P = = 0.074
I P (1, 1 ) 5+8+5
Las curvaturas principales también pueden obtenerse como soluciones de la ecuación
(EG - F2)cn2 - (EN + GL - 2FM)cn + (LN - M2) = 0.
Por tanto, la curvatura de Gauss es:
% t = % 1 % 2 = LN − M2 = 0.049
2
EG − F
y la curvatura media es:
% 1 + % 2 EN + GL − 2FM
%m = = = 0.371
2 2(EG − F 2 )
Curvatura geodésica:
Sea la curva g(t) = (t, t), entonces la curva sobre la superficie es
a(t) = r(g(t)) = (t, t, 2t2)
Si t0 = 1, entonces a(1) = r(g(t)) = (1, 1, 2)
a'(t) = (1, 1, 4t), fl a'(1) = (1, 1, 4)
∏ (1)
Por tanto, el vector tangente unitario t en el punto t0 = 1 es: t = = (0.236, 0.236, 0.943)
æ ∏ (1) æ
Cálculo del vector normal a la curva m en el punto t0 = 1:
a''(t) = (0, 0, 4), fl a''(1) = (0, 0, 4)

( ∏ (1) % ∏∏ (1) ) % ∏ (1)
m= = (−0.667, −0.667, 0.333)
æ( ∏ (1) % ∏∏ (1) ) % ∏ (1) æ
Cálculo de la curvatura y del vector curvatura el punto t0 = 1:
æ ∏ (1) % ∏∏ (1 æ)
%= = 0.074, fl K = cÿm = (-0.049, -0.049, 0.025)
æ ∏ (1) æ 3
Por tanto, la curvatura geodésica en el punto t0 = 1 es:
cg = [K, n, t] = 0.
Longitud de la curva entre los puntos t0 = 1 y t1 = 2:
E = ru(t, t)ÿru(t, t) = 1 + 4t2, F = ru(t, t)ÿrv(t, t) = 4t2, G = rv(1, 1)ÿrv(1, 1) = 1 + 4t2
IP(t) = 2 + 16t2
2
L = ¶0 IP (t ) dt = 6.17
ENM Matemáticas II Integrales de campo 1
TEMA II
INTEGRALES CURVILÍNEAS
Integrales curvilíneas
De ahora en adelante G ⊂ Rn (en este curso n = 2 o 3) es un conjunto abierto y conexo por arcos
regulares a trozos, y C = x([a, b]) ⊂ G es un arco de curva.
Definición. Sea f: G → Rn una función acotada en G (f es un campo vectorial), P = {a = t0, ..., tm = b}

una partición de [a, b] y ck ∈ [tk-1, tk]. Formemos la suma
m
f(x(c k )) $ (x(t k ) − x(t k−1 ))
k=1
Si existe el límite de esta suma cuando máx||(x(tk) - x(tk-1)|| → 0, tal límite se llama integral curvilínea
de f a lo largo de C y se denota por
¶C f⋅dx
Dicho límite existe, por ejemplo, si C es rectificable y f es continua en C. El valor de la integral
curvilínea depende en general del campo f, la curva C y los puntos de la curva x(a) y x(b).
Si en ¶ C f⋅dx hacemos el producto escalar f⋅dx, la integral curvilínea también puede venir escrita como:
¶ f 1 dx 1 + ... + f n dx n
Como calcular ¶ C f⋅dx: Si C = x([a, b]) es un arco regular a trozos entonces:
dx
b b a
¶C f $ dx = ¶ a f(x(t )) $x t )dt= ¶ a f 1 (x(t ))x ∏1 (t )dt + ... + ¶ b f n (x(t ))x ∏n (t )dt
∏(
siempre que existan cada una de las integrales del último miembro.
Propiedades
1. Linealidad. Si existen las integrales curvilíneas de f y g a lo largo de la curva C, también existe la

integral curvilínea de αf + βg y se verifica que:
¶C (f + g ) $ dx = ¶C f $ dx + ¶C g $ dx.
2. Caminos equivalentes. Si x y x' describen la misma curva C y f es integrable respecto a C = x(I)
entonces f es integrable respecto a C = x'(J)
¶C f $ dx = ! ¶C f $ dx ∏ ("+" mismo sentido,"-" sentido opuesto).
3. Unión de caminos. Sean las curvas: C = x([a, b]), C1 = x([a, c]) y C2 = x([c, b]) (c ∈ (a, b)). Siempre
que existan dos de las tres integrales siguientes, existe la tercera y se verifica:
¶C f $ dx = ¶C 1
f $ dx + ¶C 2 f $ dx.
Ejemplo.- Calcular la integral curvilínea:

¶C fÿdx
siendo f(x1, x2) = (x1x2, 0) a lo largo del arco de circunferencia con centro el origen de coordenadas, desde
el punto A(2, 0) al punto B(0, 2).
Solución.- El arco de circunferencia viene dado por x1 = 2cost, x2 = 2sent, donde t ∈ 0,
2 .

¶C (x 1 x 2 , 0 )(dx 1 , dx 2 ) = ¶C x 1 x 2 dx 1 = ¶ 2
2 cos t $ 2sen t $ (−2sen t )dt = − 8 3
3 sen t
2
= −8.
0 0 3
Ejemplo.- Calcúlese
¶C (x 2
+ y)dx + xydy
desde el punto A al punto D, a lo largo del camino ABCD, compuesto por los segmentos AB, BC, CD,
donde A(0, 0), B(2, 2), C(2, 6) y D(3, 9).
Solución.- Las ecuaciones paramétricas de las diferentes partes del camino son:
AB: x = t, y = t; dy = dx = dt; t ∈ [0, 2]
BC: x = 2, y = t; dx = 0, dy = dt; t ∈ [2, 6]
CD: x = t, y = 3t; dx = dt, dy = 3dt; t ∈ [2, 3]
I = ¶ C [(x 2 + y )dx + xydy ] = I1 + I2 + I3
donde
2
I 1 = ¶AB (x 2 + y )dx + xydy = ¶ 0 [(t 2 + t )dt + t 2 dt ] = 22
3
6
I 2 = ¶BC (x 2 + y )dx + xydy = ¶ 2 2tdt = 32
I 3 = ¶CD (x 2 + y)dx + xydy = ¶ 2 [(t 2 + 3t )dt + t3t3dt ] = 425

3
6
por tanto
I = I1 + I2 + I3 = 661
6
Físicamente, si una partícula se mueve a lo largo de una curva C = x([a, b]) regular a trozos, bajo la
acción de una fuerza f, el trabajo realizado por f es:
w = ¶ C f⋅dx
Integrales curvilíneas con respecto a la longitud de arco
Definición. Sean G ⊂ Rn, C = x([a, b]) ⊂ G una curva regular, y g: G → R una función acotada en G (g
es un campo escalar). Se define la integral curvilínea de g con respecto a la longitud de arco a lo largo de
la curva C como:
ds
b
¶C gds = ¶ a g(x(t )) æx ∏(
t )ædt (si existe)
donde:
æx ∏ (t )æ = [x ∏1 (t )] 2 + ... + [x ∏n (t )] 2
Físicamente, ¶ C gds puede representar la masa de un alambre C de densidad variable g(x, y, z).
Ejemplo.- Calcular
¶C (x 1
4
+ x24)ds
donde C es la circunferencia x12 + x22 = a2.
Solución.- La curva viene dada por: x1 = a⋅cost, x2 = a⋅sent, y t ∈ [0, 2π]. En este caso
æx ∏ (t )æ = [x ∏1 (t )] 2 + [x ∏2 (t )] 2 = a 2 (sen 2 t + cos 2 t ) = a
Por tanto,
¶C (x 41 + x 42 )ds = ¶ 02(a 4 cos 4 t + a 4 sen 4 t )adt = 3a 5 2

Relación entre los dos tipos de integrales (campos vectoriales y escalares):
t(t)
ds
b b x ∏ (t) b
¶C f $ dx = ¶ a f(x(t)) $ x ∏ (t)dt = ¶ a f(x(t)) $ ∏
æx (t) æ
æx ∏ (t) ædt = ¶ a f(x(t)) $ t(t)ds = ¶C gds
siendo g(x(t)) = f(x(t))⋅t(t).

Teoremas
Teorema (Segundo teorema fundamental del cálculo para integrales de línea).- Sea F: G → R una
función (campo escalar) de clase uno en G. ∀ p1, p2 ∈ G y para toda curva regular a trozos C = x([a, b])
⊂ G que una p1 con p2, se tiene:
¶C →
= F $ dx = F(p 2 ) − F(p 1 )
Teorema (Primer teorema fundamental del cálculo para integrales de línea).- Si f: G → Rn es una
función (campo vectorial) continua en G y su integral curvilínea es independiente del camino en G,
→
entonces existe una función escalar F: G → R tal que = F(x) = f(x) ∀ x ∈ G. F(x) = ¶ C f $ dx en donde C
es una curva regular a trozos contenida en G que une los puntos a (fijo) y x ∈ G.
Teorema (Caracterización de un campo gradiente).- Sea f: G → Rn una función continua en G. Se

verifica que: f es un gradiente en G ⇔ La integral curvilínea de f es independiente del camino en G ⇔ La
integral curvilínea de f a lo largo de cualquier camino cerrado contenido en G es cero.
Teorema (Caracterización de un gradiente en un abierto estrellado). Sean G ⊂ Rn un conjunto abierto y

estrellado (G es estrellado si: ∃ x0 ∈ G tal que x0 + t(x - x0) ∈ G ∀ t ∈ [0, 1] y ∀ x ∈ G), y f: G → Rn tal
que f ∈ C1(G). El campo vectorial f es gradiente en G de un campo escalar F, si, y sólo si
Dkfj(x) = Djfk(x) ∀ x ∈ G y k, j = 1, 2, ..., n.
Nota. Este teorema también se verifica si G es abierto y simplemente conexo (en R2 no tiene agujeros).
El cálculo directo de F se puede hacer de la forma:
x 1
F(x) = ¶ x 0 f $ dx = ¶ 0 f(x 0 + t(x − x 0 )) $ (x − x 0 )dt
Hay tres métodos de calcular una integral que satisface esta condición: 1º) hallar la función F y calcular
F(B) - F(A), 2º) buscar el camino de integración más fácil (generalmente por paralelas a los ejes de
coordenadas), e integrar a lo largo de él, o 3º) aplicar la definición de integral curvilínea.
Ejemplo.- Demuéstrese que la integral curvilínea
I = ¶ C (y2 + 4, 2xy + 3)(dx, dy)

es independiente del camino de integración entre los puntos A(1, 2) y B(3, 4) y hállese su valor:
Solución.- En este ejemplo G = R2 que es abierto y estrellado, f = (y2 + 4, 2xy + 3) por tanto, f1 = y2 + 4
y f2 = 2xy + 3. f ∈ C1(G) ya que D1f1 = 0, D2f1 = 2y, D1f2 = 2y y D2f2 = 2x, existen y son continuas en G.
Entonces, como
D2f1 = 2y = D1f2
→
existe un campo escalar F tal que = F(x, y) = (y2 + 4, 2xy + 3); siendo:
D1F = y2 + 4 ⇒ F = ∫(y2 + 4)dx = y2x + 4x + g(y)
D2F = 2xy + 3 = 2yx + g'(y) ⇒ g'(y) = 3 ⇒ g(y) = 3y + C, ⇒ F(x, y) = y2x + 4x + 3y + C y
¶C (f (x, y), f (x, y))(dx, dy) = F(3, 4) - F(1, 2) = 58.
1 2
Segundo método: elegimos el camino entre A y B formado por los segmentos AC y CB, dados por:
Sobre AC, x = t, y = 2; ⇒ dx = dt, dy = 0, t ∈ [1, 3]
Sobre CB, x = 3, y = t; ⇒ dx = 0, dy = dt, t ∈ [2, 4]
Entonces
¶AB f dx + f dy = ¶AC f dx + f dy + ¶CB f dx + f dy = ¶ 13 8dt + ¶ 24(6t + 3)dt

1 2 1 2 1 2 = 58.
−y
¶C , x $ (dx, dy )
x2 + y2 x 2 + y 2
siendo C la circunferencia x2 + y2 = 1.
Solución.- Observa que:
−x 2 − y 2 + y2y y2 − x 2
D2f1 = = = D1f2
(x 2 + y 2 ) 2 (x 2 + y 2 ) 2
sin embargo,
−y
, 2 x 2 (dx, dy ) = ¶ 0 −sent (−sent ) + cos t cos t dt = 2 ! 0
2
¶C x2 +y x +y
2 1 1
¿Cuál es la explicación?
1. Si O, A, B son los puntos (0, 0), (a, 0), (a, 2a), respectivamente, calcúlese la integral curvilínea
¶OB (3xy 2
+ y3, x3 + 3xy2)(dx, dy)
cuando el camino de integración es:
a) el segmento OB,
b) el segmento OA y después AB,
c) el arco de parábola y2 = 4ax comprendido entre O y B.
2. Calcúlese
¶C (-y , x )(dx, dy)
2 2
entre (b + a, 0) y (b - a, 0) a lo largo del arco del círculo (x - b)2 + y2 = a2, con y ≥ 0.
3. Calcúlese
y
¶C , x (dx, dy )
x2 + y2 x 2 + y 2
siendo C la parte del eje "x" comprendida entre +∞ y el punto (a, 0), más el arco x2 + y2 = a2 sobre
el primero, segundo y tercer cuadrantes, desde (a, 0) hasta (0, -a), más la parte del eje "y"
comprendida entre (0, -a) y +∞.
4. Demuéstrese que la integral curvilínea

2x − y 2y + x
¶C ,
x 2 + y2 x 2 + y 2
(dx, dy )
es independiente del camino de integración en G = {(x, y) ∈ R2 / x > 0 e y > 0}. Hállese su valor
entre los puntos (1, 1) y (2, 3).
5. Demuéstrese que existe un valor constante de α tal que la integral curvilínea

1 + y 2 1 + x 2 (dx, dy )
¶C ,
(1 + xy ) 2 (1 + xy ) 2
es independiente del camino entre dos puntos del conjunto G = {(x, y) ∈ R2 / x > 0 e y > 0}.
Calcúlese la integral en función del valor genérico α:
a) desde (1, 1) hasta (2, 1) y de ahí a (2, 2) unidos esos puntos mediante segmentos.
b) desde (1, 1) hasta (2, 2), unidos mediante un segmento.
6. Demuéstrese que existe una función z(x, y) tal que

→ y
= z = 2xy + + sen 2 y, x 2 + arctgx + xsen2y
1 + x2
De ahí pruébese que
y
+ sen 2 y, x 2 + arctgx + xsen2y (dx, dy ) = 2 1 +
(1,2 )
¶ (0,0 ) 2xy +
1 + x2 4
7. Hállese el valor de
¶C (y , xy, zx)(dx, dy, dz)
2
entre los puntos (0, 0, 0), (1, 1, 1) si el camino C es:

a) El segmento que une ambos puntos.
b) A lo largo del eje "x", después paralelo al eje "y", y después paralelo al eje "z".
c) A lo largo de la curva x = t, y = t2, z = t3.
8. Demuéstrese que existe una función w(x, y, z) tal que

→
= w = (2xy + 3z2, x2 + 4yz, 2y2 + 6xz),
y hállese dicha función De ahí, calcúlese la integral curvilínea
¶C (2xy + 3z , x
2 2
+ 4yz, 2y2 + 6xz)(dx, dy, dz)
a lo largo de cualquier camino que una los puntos de coordenadas (0, 0, 0) y (1, 1, 1). Compruébese
el resultado por integración directa sobre el camino formado por el segmento x = y = z.
INTEGRALES MÚLTIPLES
Concepto de integral múltiple
Definición. Se llama rectángulo cerrado de Rn (n = 2 ο 3) a: R = [a1, b1] × [a2, b2] ×...× [an, bn]. Se
llama rectángulo abierto a R = (a1, b1) ×...× (an, bn). Al área o volumen de R lo representaremos por |R|.
Definición. Sea D ⊂ Rn (n = 2 ο 3), D tiene medida nula, si ∀ ε > 0 existen {R1, R2, ....} rectángulos
∞ ∞
(abiertos o cerrados) de Rn tales que: D _ 4 R i y R i < . Ejemplos: Son conjuntos de medida nula:
i=1 i=1
una curva simple en R2 o R3, Una superficie simple en R3 etc.
Definición. Sea D ⊂ Rn un conjunto acotado y ∂D su frontera. D es medible-Jordan si, y sólo si, ∂D

tiene medida nula. Un conjunto acotado y medible-Jordan se llama recinto de integración.
Concepto de integral múltiple.- Sea D ⊂ Rn un recinto de integración y f: D → R una función acotada

en D. Descompongamos D en "m" recintos de integración Di sin puntos interiores comunes, cuyas áreas o
m
volúmenes llamaremos |Di|, de modo que D i = D (área o volumen de D). Sea ci ∈ Di; si existe el límite
i=1
m
lim f(c i ) D i (máx D i → 0 ⇒ m → ∞),
máx D i d0 i=1
se dice que f es integrable en D y al valor de dicho límite se llama integral múltiple de la función f en el
conjunto D, y se denota por ¶ D f(x)d D o simplemente por ¶ D f. Cuando n = 2 o n = 3 escribimos:
¶¶ D f(x, y)dxdy o ¶¶¶ D f(x, y, z)dxdydz

Teorema de Lebesgue.- Sea f acotada en D. f es integrable en D si, y sólo si, su conjunto de puntos de
discontinuidad tiene medida nula.
Interpretación geométrica de la integral doble
Volumen de un cilindro. Sea z = f(x, y), una función continua y positiva en D ⊂ R2 recinto de
integración cerrado. Vamos a ver como se calcula el volumen de forma cilíndrica, de generatrices
paralelas a "OZ", cerrado en la parte inferior por D, y en la superior, por una superficie D' ((x, y, f(x, y))
(véase figura).
Descompongamos D en m recintos de integración Di,
Z
mediante líneas paralelas a los ejes coordenados. Entonces,
D'
el valor aproximado del elemento de volumen de la figura es
f(ci)|Di| (área de la base |Di| por altura f(ci)), donde ci ∈ Di.
Cuanto más pequeña sea el área |Di| mejor será la
O ∆yi Y aproximación de este volumen. Por tanto el volumen total
será:
∆x i
|D i | Di D m
X
V = lim f(c i ) D i
máx D i d0 i=1
Como la función f es continua en D, existe dicho límite, y es precisamente:

V = ¶ D f = ¶¶ D f(x, y)dxdy
Propiedades de la integral
1. Linealidad. Si f y g son integrables en D, también lo es αf + βg ∀ α, β ∈ R, y se verifica:
¶D (αf + βg) = α¶D f + β¶D g.
2. Propiedad aditiva del conjunto de integración. Si f es integrable en D y éste puede
descomponerse en dos recintos de integración D1 y D2 sin puntos interiores comunes, entonces f es
integrable en cada uno de ellos, y se verifica
¶D f = ¶D f + ¶D f.
1 2
3. Acotación. Si f y g son integrables en D, y f(x) ≤ g(x) ∀ x ∈ D ⇒ ¶ D f ≤ ¶ D g.

4. Acotación modular. Si f es integrable en D, también lo es |f|, y se verifica: |¶ D f | ≤ ¶ D |f|.
Teorema (del valor medio). Sean D ⊂ Rn un recinto de integración cerrado y conexo y sea f: D → R
una función continua en D. Entonces existe xµ ∈ D tal que: ¶ D f(x)d|D| = f(xµ )|D|.
Cálculo de ¶¶ D f(x, y)dxdy
Teorema (Fubini caso particular).- Sea D ⊂ R2 un recinto de integración cerrado y conexo tal que las
rectas paralela al eje "OY" que cortan a D determinan un único segmento de extremos (x, α(x)) y (x, β(x))
o un punto (véase fig.). Sean "a" y "b" (a < b) los valores extremos de "x" en D. Si f es continua en D,
entonces se verifica que:
(x)
Y ¶¶ D f(x, y)dxdy = ¶ ab ¶ (x) f(x, y)dy dx
β(x) El alumno habrá observado que por ser α y β funciones de

x, primero se ha de integrar con respecto a "y", y nos resultará
D una función de x, en la que habrá que integrar después con
respecto a x, entre los límites "a" y "b" que son constantes.
α(x)
De manera análoga, supongamos que las rectas paralelas al
eje "OX" que cortan a D determinan un único segmento de
extremos (γ(y), y) y (δ(y), y) o un punto. Sean "c" y "d" (c < d)
o a x b X los valores extremos de "y" en D. Si f es continua en D,
entonces se verifica que:
(x)
¶¶ D f(x, y)dxdy = ¶ cd ¶ (x) f(x, y)dx dy
Podemos integrar en cualquier orden; el valor de la integral es independiente del orden de integración,
pero los límites de integración han de depender de éste.
El proceso seguido para calcular una integral doble consta de los siguientes pasos:
a) Una idea gráfica del conjunto D.
b) Decidir el orden de integración.
c) Determinación de los límites.
d) Integración.
Ejercicio. Calcúlese
¶¶ D 2xydxdy
sobre el conjunto D limitado por y2 = x, x2 = y, x = 1 , para el cual x ≤ 1 .
2 2
Solución.
Las parábolas y2 = x, x2 = y se cortan en (0, 0) y en el punto C(1, 1). El recinto de integración es OBA,
donde B es el punto ( 12 , 14 ), y A es el punto 12 , 12 . Comencemos a integrar, primero con respecto a "y".
Tenemos que determinar los límites para "y" como funciones de "x". El campo de variación de "x" es de 0
a 12 . Si mantenemos "x" constante en este campo, por ejemplo, en E, entonces "y" varía de F a G; esto es,
desde y = x2 en F, hasta y = x G. De ahí,
1 1 1
¶¶ D 2xydxdy = ¶ 02 dx ¶ x x 2xydy = ¶ 02 x[y 2 ] x 2 dx = ¶ 02 x[x − x 4 ]dx = 5
x
Y
2
128
C(1,1)
A
0,7 Sabemos que se llega al mismo resultado integrando primero con respecto
G
a "x". Esto implicaría mantener "y" constante para hallar los límites de "x" en
H función de "y", haciendo variar a "y" de 0 a 1 .
B(1/2,1/4) 2
F 1
1 1
y 2
0 E 1/2 1
X
¶¶ D 2xydxdy = ¶ 0
4
dy ¶ y2 2xydx + ¶ 1 dy ¶ y22 2xydx
4
El alumno observará en la figura que no son válidos los mismos límites de "x" en todo el campo de
variación de "y". Tenemos que descomponer el campo de "y" desde 0 a 1 y desde 1 a 1 .
4 4 2
Cálculo de ¶¶¶ D f(x, y, z)dxdydz
Z
Sea D ⊂ R3 un recinto de integración cerrado y conexo tal que
D las rectas paralelas al eje "OZ" que cortan a D determinan un único
·µ (x, y) segmento de extremos (x, y, δ(x, y)), (x, y, µ(x, y)) o un punto.
Supongamos que cualquier paralela al eje OY que corta a la
·δ(x, y)
proyección de D sobre el plano XY determina un segmento de
0 extremos (x, α(x), 0) y (x, β(x),0 ) o un punto (véase fig.). Sean "a"
a Y y "b" (a < b) los valores extremos de "x" en D. Si f es continua en
α (x)
x · (x, y) ·β (x) D, entonces se verifica:
b
( ) ( )
X ¶¶¶ D f(x, y, z)dxdydz = ¶ ab(¶ (xx) (¶ (x,yx,y) f(x, y, z)dz)dy)dx
El proceso seguido para calcular una integral triple consta de los siguientes pasos:
a) Una idea gráfica del conjunto D.
b) Decidir el orden de integración.
c) Determinación de los límites.
d) Integración.
Ejemplo.- Calcúlese la integral ¶¶¶ D (x + y + z + 1)-3dxdydz, tomada sobre el volumen D encerrado por
los planos x = 0, y = 0, z = 0, x + y + z = 1.
Z C(0,0,1) Solución.- El volumen de integración es el tetraedro OABC dibujado en

la figura, limitado por los planos coordenados y el plano ABC que tiene por
Q
ecuación x + y + z = 1. "x" varía a lo largo de OA desde x = 0 a x = 1. Para
B(0,1,0)
0
P
"x" tomado constante en OA, por ejemplo, en R, "y" varía desde su valor en
R Y
S R a su valor en S, de donde "y" varía desde 0 a 1 - x. Para "x" e "y" tomados
x+y=1
A(1,0,0)
constantes en el triángulo OAB, por ejemplo, en P, z varía desde su valor en
z=0
X P hasta su valor en Q, es decir, z varía desde 0 hasta 1 - x - y. Por tanto,
(x + y + z + 1)-3dz = 1 L2 − 5 .
1 1−x 1−x−y
¶¶¶ D (x + y + z + 1) -3
dxdydz = ¶ 0 dx¶ 0 dy¶ 0
2 8
Cambio de variable en integrales múltiples
Teorema (Cambio de variable). Sean D' ⊂ Rn un recinto de integración cerrado, G ⊂ Rn un conjunto

abierto que contiene a D' y T: G → Rn una transformación inyectiva tal que T ∈ C1(G) y el jacobiano de
T, JT = |DiTj(y)| ≠ 0 ∀ y ∈ G. Sea f: D = T(D') → R integrable en D; entonces se verifica que:
¶D f(x)d|D| = ¶D f(T(y))|J |d|D'|

∏ T
¶¶ D L(x 2
+ y2)dxdy,
siendo D el conjunto limitado por x2 + y2 = a2, x2 + y2 = b2, cuando a > b, x ≥ 0 e y ≥ 0.
Solución.- Hacemos el cambio: T(ρ, θ) = (ρcosθ, ρsenθ) (cambio a coordenadas polares),
cos −sen
JT = =
Y sen cos
a
D El conjunto D', viene dado por: ρ = a, ρ = b y θ ∈ [0, 2 ]. Por tanto,
b
a
Q I = ¶¶ D L(x2 + y2)dxdy = ¶¶ D ∏ L(ρ2)ρdρdθ = ¶ 02 dθ¶ b 2ρLρdρ.
P
Integrando en el segundo miembro con respecto a ρ por partes, hallamos
θ

0 b a X I = ¶ 02 [ρ2Lρ - 1 ρ2] ab dθ = 1 π[a2La - b2Lb - 1 (a² - b²)]
2 2 2
Teorema de Green en el plano
Teorema (de Green). Sea G ⊂ R2 un conjunto abierto y f = (f1, f2): G → R2 tal que f ∈ C1(G). Sea C ⊂
G una curva simple cerrada regular a trozos, tal que la unión de C con su interior esté contenido en el
conjunto G. Sea D dicha unión. Entonces se verifica que
¶¶ D (D f 1 2 - D2f1)dxdy = “ C (f1dx + f2dy),

en la que la integral curvilínea de f a lo largo de C se toma en sentido positivo (contrario al de las agujas
del reloj).
¶C[(2y 2
- x2)dx + (3x2 - y2)dy]
donde C es la circunferencia (x - a)2 + y2 = a2.
Solución. En este ejemplo, G = R2 que es un conjunto abierto, f = (2y2 - x2, 3x2 - y2) donde f1 = 2y2 - x2,
y f2 = 3x2 - y2. Como D1f1 = -2x, D2f1 = 4y, D1f2 = 6x y D2f2 = -2y, existen y son continuas en G, f ∈ C1(G).
Por tanto, por el teorema de Green, tenemos
¶C [(2y
2
- x2)dx + (3x2 - y2)dy] = ¶¶ D (6x - 4y)dxdy,
donde D es el conjunto encerrado por C.
Y
C
D
θ
0 (a,0) X
Por simetría podemos afirmar inmediatamente que
¶¶ D ydxdy = 0
y el resto de la integral da:
2a a 2 −(x−a ) 2 2a
¶¶ D 6xdxdy = ¶ 0 6x ¶ − a 2 −(x−a ) 2
dy = 12 ¶ 0 x a 2 − (x − a ) 2 dx =

= 12a 3 ¶ −2 (1 + sen ) cos 2 d = 6a 3

2
1. Demuéstrese que el valor de

¶¶ D e
x-y
dxdy,
(a − 1 ) 2
donde D es el recinto de integración limitado por los ejes y por x + y = La (a > 1), es .
2a
2. Calcúlese la integral
¶¶ D x ydxdy,
2
donde D es el recinto de integración limitado por las curvas y2 = 8x, x2 = y.
3. Calcúlese
¶¶ D cos[π(x + y)]dxdy,
donde D es el recinto de integración limitado por los ejes y la línea x + y = 1. Hállese también la
integral cuando D es el recinto de integración limitado por los ejes y las líneas x + y = 1, x + y = 2.
4. Calcúlese
¶¶ D x ydxdy,
2
donde D es el recinto de integración limitado por x = 0, x = y, x = 2 - y.
5. Cámbiese el orden de integración en la integral

ye x
¶ 01 dy ¶ yy 2 x dx,
y hállese su valor.
6. Señálense en un diagrama los recintos de integración de

2−x 2
¶ 01 dx ¶ 0x xydy, ¶ 1 2 dx ¶ 0 xydy.
Cámbiese el orden de integración en ambas, expresando la suma de estas integrales por medio de
una integral doble, y calcúlese esta última.
7. Usando la transformación u = x - y, v = x + 2y, calcúlese

¶¶ D (x + y) dxdy, 2
donde D es el recinto de integración definido por 0 ≤ x - y ≤ 1, 0 ≤ x + 2y ≤ 2.
8. Demuéstrese que el valor de la integral doble

¶¶ D 1 − x 2 − y 2 dxdy,
tomada sobre recinto de integración x2 + y2 ≤ 1 es 2π/3.
9. Calcúlese directamente
¶C [(x 3
+ y2)dx + (x2 + y3)dy],
donde C es la frontera del pentágono de vértices (0, 0), (1, 0), (2, 1), (1, 2), (0, 1). Compruébese el
resultado mediante el teorema de Green.
10. Aplíquese el teorema de Green para calcular

¶C [(x 3
+ 6x2y + y2 - 3y)dx + (2x3 - 4xy2 -2xy + 3y)dy],
donde C es el círculo (x - 2)2 + (y - 2)2 = 4.
11. Aplíquese el teorema de Green para calcular

¶C [(y - cosx)dx + senxdy],
donde C es el perímetro del triángulo formado por las líneas y = 2x
, x = 2 , y = 0.
12. Calcúlese
¶¶¶ D xy dxdydz
2
donde el recinto de integración D es la pirámide limitada por x = a, y = 0, y = x, z = 0, z = x.
13. Calcular
¶¶¶ D (2x + 3y + 4z) dxdydz,
2
2 y2 2
donde el recinto de integración D es el elipsoide x 2 + 2 + z 2 = 1.
a b c
14. Un orificio cilíndrico de diámetro "a" se perfora en una esfera sólida de radio "a", de manera que el
centro de la esfera quede sobre la superficie del cilindro. Hállese el volumen del material quitado
de la esfera.
2 y2
15. Demuéstrese que el volumen encerrado entre el paraboloide 2z = xp + q , el cilindro x2 + y2 = a2 y
a 4 (p + q )
el plano z = 0 es .
8pq
16. Un agujero cilíndrico de radio "b" se perfora simétricamente a través de una esfera de radio "a", de
manera el eje del cilindro pase por el centro de la esfera. Hállese el volumen del material sacado de
la esfera.
17. Los ejes de tres cilindros de revolución, todos de radio "a", se cortan en ángulos rectos.
Demuéstrese que el conjunto interior a los tres cilindros tiene un volumen 8a3(2 - 2 ).
INTEGRALES DE SUPERFICIE
Área de una superficie curva
Sea S una superficie elemental (S = r(Ω), Ω ⊂ R2 región elemental y r es un homeomorfismo de Ω en

S ⊂ R3) regular, excepto quizá, en un conjunto de medida nula.
dS = ||D1r × D2r||dudv = ||(D1r1, D1r2, D1r3) × (D2r1, D2r2, D2r3)||dudv = EG − F 2 dudv
donde E = D1r⋅D1r, G = D2r⋅D2r, y F = D1r⋅D2r.
Entonces el área A de la superficie "S", viene dada por:
A = ¶¶
||D 1 r % D 2 r||dudv = ¶¶
EG − F 2 dudv
Si la superficie esta dada en forma explícita por z = f(x, y) con (x, y) ∈ Ω, siendo f ∈ C1(Ω). Podemos
pensar en esta forma, como un caso particular de la forma paramétrica, dada por r(x, y) = (x, y, f(x, y)).
Aplicando los resultados anteriores tenemos:
A = ¶¶
1 + (D 1 f ) 2 + (D 2 f ) 2 dxdy
Si la superficie S esta dada implícitamente por F(x, y, z) = 0 y es posible definir z como función de x e
y (es decir z = f(x, y) con (x, y) ∈ Ω), entonces, por el teorema de la función implícita, en los puntos
D F D F
donde D3F ≠ 0, D 1 f = − 1 y D 2 f = − 2 , y sustituyendo en la expresión anterior, tenemos:
D3F D3F
(D 1 F ) 2 + (D 2 F ) 2 + (D 3 F ) 2
A = ¶¶
dxdy
D3F
Ejemplo.- Hállese el área de la superficie de la esfera x2 + y2 + z2 = a2, en el octante positivo.
Solución.- La esfera en el octante positivo está dada por z = a 2 − x 2 − y 2 , donde (x, y) ∈ Ω limitado
por el círculo x2 + y2 = a2, x ≥ 0 e y ≥ 0. Como z = a 2 − x 2 − y 2 , al derivar parcialmente tendremos
x y
Z D1z = − , D2z = − ,y
a 2 − x 2 − y2 a 2 − x 2 − y2
1 + (D 1 z ) + (D 2 z ) =
2 2 a2 = a
0 a2 − x 2 − y2 a2 − x 2 − y2
Ω Y
por tanto: A = ¶¶
a dxdy = a ¶¶
1 dxdy
x² + y² = a² z = 0 a 2 − x 2 − y2 a 2 − x 2 − y2
X
Para calcular esta integral, pasamos a coordenadas polares. Entonces

2
d = a .
a
¶¶
dd = a ¶ 02 d ¶ 0
a2 − 2 a2 − 2 2
∏
Integral de superficie
Sea una superficie elemental S = r(Ω) tal que r ∈ C1(Ω). En los puntos regulares (D1r × D2r ∫ 0)
podemos definir dos vectores unitarios y normales a la superficie S:
D1r % D2r
n1 = y n2 = -n1.
æD 1 r % D 2 r æ
Definición.- Sean f = (f1, f2, f3): S → R3 y n uno de los vectores anteriores. Se llama integral de
superficie de f respecto a la cara de S determinada por n a la integral:
F dS
¶¶ S f $ n dS = ¶¶
f(r ) $ n æD 1 r % D 2 r ædudv = ! ¶¶
f(r ) $ (D 1 r % D 2 r )dudv
siempre que exista la integral doble del segundo miembro ("+" si se usa n1 y "-" si se usa n2).
Interpretación física: ¶¶ S f $ ndS es el flujo del campo vectorial f a través de la superficie S en la
dirección y sentido de n.
Ejemplo.- Calcúlese la integral
¶¶ S 1 1 1
x , y , z $ nds
2 y2 2
sobre el exterior de la superficie S: x 2 + 2 + z 2 = 1.
a b c
Solución.- Las ecuaciones del elipsoide son: r(u, v) = (a⋅senu⋅cosv, b⋅senu⋅senv, c⋅cosu)
¶¶ S 1 , 1 , 1 $ nds = ¶¶ f(r ) $ (D r % D r )dudv =

x y z
1 2
¶¶
bc + ac + ab senududv = ¶ 2 dv ¶ bc + ac + ab senudu = 4 bc + ac + ab
a b c 0 0 a b c a b c
Ejemplo.- Calcúlese ¶¶ S (x² + y² - 3z²)dS, siendo S la superficie de la esfera x2 + y2 + z2 = 4 que está

por encima del plano z = 0.
Solución.- Las ecuaciones de la esfera son: r(u, v) = (2⋅senu⋅cosv, 2⋅senu⋅senv, 2⋅cosu)
¶¶ S (x 2 + y2 − 3z 2 )dS = ¶¶
((2senu $ cos v ) 2 + (2senu $ senv ) 2 − 3(2 cos u ) 2 )æD 1 r % D 2 r ædudv =

= ¶¶ D (16sen 2 u − 12 )4senududv = 4 ¶ 0 dv ¶ 0 (16sen 3 u − 12senu )du = − 32

2 2
Operadores vectoriales
→
Sea f = (f1, f2, f3) un campo vectorial, F un campo escalar y sea el operador (nabla) = = (D1, D2, D3).
→
Se llama gradiente de F al campo vectorial: gradF = (D1F, D2F, D3F) = = F.
→
Se llama divergencia de f al campo escalar: divf = D1f1 + D2f2 + D3f3 = = ⋅f.
→
Se llama rotacional de f al campo vectorial: rotf = (D2f3 - D3f2, D3f1 - D1f3, D1f2 - D2f1) = = ×f.
El teorema de Gauss
Teorema (de Gauss). Sea S una superficie simple cerrada regular y D el volumen encerrado por dicha
superficie. Sea G un abierto que contiene a S y D, y f = (f1, f2, f3) ∈ C1(G), entonces
¶¶¶ D divfdxdydz = ¶¶ S f $ ndS
donde n es el vector normal saliente.
El teorema de Gauss es de gran importancia práctica, ya que nos permite sustituir integrales de
superficie por integrales triples, lo cual introduce a veces una simplificación considerable.
¶¶ S (x , y , z )⋅⋅ndS,
3 3 3
donde S es la esfera de centro 0 y radio "a".

Solución.- Aquí,
f1(x, y, z) = x3, f2(x, y, z) = y3, f3(x, y, z) = z3.
El teorema de Gauss nos permite hacer

¶¶ S (x , y , z )⋅⋅ndS = ¶¶¶ D 3(x
3 3 3 2
+ y2 + z2)dxdydz,
donde D es el volumen encerrado por la esfera S. En la integral triple pasamos a coordenadas esféricas
polares. Entonces
3
+ y2 + z2)dxdydz = 3¶¶¶ D ∏ ρ4senθdρdθdµ = 3¶ 0 dµ ¶ 0 senθdθ ¶ 0 ρ4dρ = 12a .
2 a
¶¶¶ D 3(x 2
5
El teorema de Stokes
Teorema (de Stokes). Sea Ω ⊂ R2 una región plana limitada por una curva simple cerrada regular a
trozos γ = a(I), y sea S = r(Ω) una superficie regular de clase q ¥ 2 cuyo borde es C = r(a(I)) = x(I). Sea
G un abierto que contiene a S y C y f = (f1, f2, f3) ∈ C1(G), entonces
¶C f⋅dx = ¶¶ S (rotf⋅n)dS
en donde n determina la orientación de S, y en C se considera el sentido inducido por dicha orientación
(Si el avance del sacacorchos coincide con n, entonces el sentido de giro determina el sentido de C).
1. Una superficie viene dada por las ecuaciones paramétricas:

x = (2 + senθ)cosµ, y = (2 + senθ)senµ, z = cosθ,
donde 0 ≤ θ ≤ 2π, 0 ≤ µ ≤ 2π. Demuéstrese que el área de esta superficie viene dada por la integral
¶ 02 d ¶ 02(2 + sen )d,

y calcúlese esta integral.
2. Una esfera de radio "a" se corta por un cilindro circular de diámetro "a", estando el centro de la
esfera sobre una generatriz del cilindro. Demuéstrese que el área de la parte de esfera cortada por el
cilindro es 2(π - 2)a2.
3. Una superficie cerrada está engendrada por la rotación de la cardioide ρ = a(1 + cosφ) alrededor de
la línea inicial φ = 0. Tomando el eje "z" como línea inicial y el origen como polo, demuéstrese que
2
la superficie total es 32a .
5
4. Hállese el área de la parte de paraboloide z = 9 - x2 - y2 para la cual z ≥ 0.
5. Calcúlese
¶¶ S (zx, yz, z )⋅ndS
2
sobre la parte de superficie de la esfera x2 + y2 + z2 = a2 que está en el octante positivo.
6. Un sólido finito está limitado por el paraboloide de ecuación x2 + y2 = 4z y el plano z = 4. Hállese

el valor de
¶¶ S (0, y, (x + y + z))⋅ndS
tomada sobre dicho sólido.
7. Calcúlese
¶¶ S (x 4
+ y4 + z4)dS,
donde S es la superficie de la esfera x2 + y2 + z2 = a2.
8. Calcúlese
¶¶ S 1 dS,
p
x 2 y2 z 2
siendo S la superficie del elipsoide de ecuación 2 + 2 + 2 = 1y p es la distancia desde el origen
a b c
al plano tangente al elipsoide en el punto donde está situado dS.
9. Aplíquese el teorema de Gauss para calcular

¶¶ S (x , y , z )⋅ndS
3 3 3
siendo S la superficie del cubo limitada por los planos x = ± a, y = ± a, z = ± a.
10. Demuéstrese que

¶¶ S (a x, b y, c z)⋅ndS = 4abc(a 3+ b + c2 )
2 2
2 2 2
2 y2 2
siendo S la superficie del elipsoide x 2 + 2 + z 2 = 1.
a b c
11. Aplicando el teorema de Stokes calcúlese

¶¶ S (6y - 4z, 6z - 4x, 6x - 4y)⋅ndS,
donde S es la parte de superficie de la esfera x2 + y2 - 2ax + z2 = 0 para la cual z ≥ 0.
12. Calcúlese directamente

¶¶ S (x 2
+ 2z, -2xy, 3y2)⋅ndS,
donde S es la parte de la superficie x2 + y2 + z2 = a2 que está en el octante positivo. Compruébese
este resultado utilizando el teorema de Stokes.
13. Un orificio cuadrado de lado 2 2 pulg. se perfora simétricamente en una esfera de radio 2.
Demuéstrese que el área de la superficie que se ha quitado es 16π( 2 - 1) pulg².
14. Hállese el área de la parte de la superficie de la esfera x2 + y2 + z2 = 1, que es interior al cilindro

doble (x2 + y2)2 = (x2 - y2).
ENM Matemáticas II Variable compleja 1
TEMA 3
FUNCIONES DE VARIABLE COMPLEJA
Los números complejos
Definición.- Un número complejo z es un par ordenado de números reales z = (a, b). El primero "a", se
llama parte real de z (a = Re(z)) y el segundo, "b", se llama parte imaginaria de z (b = Im(z)). Al
conjunto de los números complejos lo representamos por Â. (El par (a, b) también se llama afijo de z).
Dos complejos z = (a, b) y z' = (c, d) son iguales si, y sólo si, a = c y b = d.
Se llama conjugado de z a: z = (a, -b).
Operaciones.- z + z' = (a + c, b + d), z⋅z' = (ac - bd, ad + bc). (Â, +, ⋅) es un cuerpo conmutativo.
El opuesto de z es: -z = (-a, -b) y si z ≠ (0, 0) el inverso de z es: z −1 = a , −b .

a2 + b2 a2 + b2
La aplicación j: R → Â definida como: j(a) = (a, 0), es un isomorfismo entre R y j(R) ⊂ Â. Por esta
razón se considera al conjunto de los números reales como un caso especial de los números complejos. Se
representa (a, 0) = a.
Representación.- El número complejo z = (a, b) se representa como el vector de coordenadas (a, b).
Definición.- El número complejo (0, 1) se representa por "i" y se llama la unidad imaginaria.
Teorema.- i2 = -1.
Demostración.- i2 = (0, 1)(0, 1) = (-1, 0) = -1.
Teorema.- Todo número complejo z = (a, b) se puede escribir de la forma (binómica) z = a + b⋅i.
Demostración.- z = (a, 0) + (0, b) = (a, 0) + (b, 0)(0, 1) = a + b⋅i.
Definición.- Se llama módulo de z = (a, b) al número real z = a 2 + b 2 = z $ z .
Propiedades.-
a) |z| ≥ 0; |z| = 0 ⇔ z = 0. b z
b) |z⋅z'| = |z|⋅|z'|
θ
c) |z/z'| = |z|/|z'| si z' ≠ 0.
a
d) |z + z'| ≤ |z| + |z'|
Definición.- Dados z y z' ∈ Â, se llama distancia de z a z' al número: d(z, z') = |z - z'|.
Definición.- Se llama bola abierta de centro z0 ∈ Â y radio r a: B(z0, r) = {z ∈ Â / |z - z0| < r}.
Con esta notación, la circunferencia de centro z0 y radio r es: |z - z0| = r.
Definición.- Sea z = (a, b) ≠ 0. Se llama argumento principal de z (arg(z) = θ) al único número real
θ ∈ [0, 2π) que verifica: a = |z|cosθ, b = |z|senθ.
Definición.- Se llama forma polar de z = (a, b) a: z = |z|∠θ.
Cuando dos números complejos están en forma polar, tenemos que:
z = z' ⇔ |z| = |z'| y arg(z) = arg(z') + n2π (n ∈ N).
Definición.- Si en la forma binómica de un número complejo, sustituimos "a" por |z|cosθ y "b" por
|z|senθ, se obtiene la forma trigonométrica de z: z = |z|(cosθ + i ÿsenθ).
Definición.- Si z = (a, b) definimos ez = ea(cosb + i⋅senb).
Fórmula de Euler: Si z = (0, b), eib = cosb + i⋅senb.
Propiedades.- a) ez + z' = ez⋅ez', b) ez ≠ 0, c) Si Re(z) = 0 ⇒ |ez| = 1, d) ez = 1 ⇔ z = n2πi (n ∈ N).
Definición.- Si en la forma trigonométrica de un número complejo, aplicamos la fórmula de Euler, se

obtiene la forma exponencial de z: z = |z|eiθ. Esta forma es muy cómoda para productos (potencias) y
divisiones de números complejos.
Definición.- Dados un número complejo z y un entero n, definimos la potencia n-ésima de z así:
z0 = 1 y zn+1 = zn⋅z, si n ≥ 0, z-n = (z-1)n si z ≠ 0 y n > 0
Propiedades.- zn+m = znzm, (zÿz')n = znz'n.
Teorema (de De Moivre).- zn = |z|n(cos(nθ) + i ÿsen(nθ)).
Teorema.- Si z = |z|∠θ ≠ 0, y n es un entero positivo, existen exactamente n números complejos distintos

z0, z1, ..., zn-1 (llamados raíces n-ésimas de z), tales que zkn = z para k = 0, 1, ..., n-1. Es decir:
n z = zk = n
z + k2 .
ø n
Definición.- Sea z ≠ 0 un número complejo. Si w es un número complejo tal que ew = z, entonces w se
llama logaritmo de z. El valor particular de w dado por w = ln|z| + i⋅arg(z) se denomina logaritmo
principal de z, y se representa por w = ln(z).
Definición.- Si z ≠ 0 y si w es cualquier complejo, definimos zw = ewÿln(z).
Propiedades.- z w 1 +w 2 = z w 1 z w 2 , (z $ z ∏ ) w = z w $ z ∏w .
−iz −iz
Definición.- cos z = e + e , senz = e − e .
iz iz
2 2i
Funciones complejas de variable real y compleja
Definición.- Una función compleja de variable real es una aplicación z: M ⊂ R → Â. A partir de z(t)
se definen las funciones parte real x(t) = Rez(t) y parte imaginaria y(t) = Imz(t) de M en R. Es decir:
z(t) = x(t) + i⋅y(t) donde z: M ⊂ R → Â, x: M ⊂ R → R e y: M ⊂ R → R.
Ejemplo.- z(t) = t2 + 3 + i⋅(sent + cost); x(t) = t2 + 3 e y(t) = sent + cost; M = R.
Las definiciones de límites, continuidad y derivabilidad (z'(t) = x'(t) + i⋅y'(t)) para funciones complejas
de una variable real son análogas a las de las funciones reales de variable real.
Teorema.- z ∈ Ck(M) ⇔ x, y ∈ Ck(M).
La clase de funciones complejas de variable real más importantes son las curvas.
Ejemplo.- La ecuación de la circunferencia de centro 0 y radio 2: z(t) = 2cost + i⋅2sent, con t ∈ [0, 2π].
Definición.- Una función compleja de variable compleja es una aplicación f: A ⊂ Â→ Â. A partir de

f(z) se definen las funciones parte real u(x, y) = Ref(z) y parte imaginaria v(x, y) = Imf(z) de A ⊂ R2 en
R. Es decir:
Si z = x + i⋅y ⇒ f(z) = u(x, y) + i⋅v(x, y) donde f: A ⊂ Â→ Â, u: A ⊂ R2 → R y v: A ⊂ R2 → R.
Ejemplo.- f(z) = z2 = (x + i⋅y)2 = x2 - y2 + i⋅2xy; u(x, y) = x2 - y2 y v(x, y) = 2xy; A = Â (o R2).
Otros ejemplos de funciones complejas de variable compleja son:

Las funciones potenciales: f(z) = zn.
Las funciones polinómicas: f(z) = a0 + a1z + a2z2 + ...+ anzn.
P (z )
Las funciones racionales: f(z ) = Q (z )
donde P(z) y Q(z) son polinomios.
La función exponencial: f(z) = ez = ex(cosy + i⋅seny) donde z = (x, y).
Observación: La función ez no es inyectiva, ex + iÿy = ex + iÿ(y + 2p). Para que sea inyectiva, debemos
limitarnos al conjunto: W = {(x, y) œ Â / a < y < a + 2p}; fl f(W) = Â - [{ex+iÿa / x œ R} » {(0, 0)}].
La función logarítmica: f(z) = ln(z) = ln|z| + i⋅arg(z).

Observación: Para que ln(z) sea una función, e inversa de la función exponencial, su dominio
debe ser: Â - [{ex+iÿa / x œ R} » {(0, 0)}]. Por tanto la función ln(z) no estará definida en la
semirrecta que sale del origen y forma un ángulo a con la parte positiva de eje OX.
−iz −iz
Las funciones seno y coseno: f(z) = senz = e − e y g(z) = cos z = e + e .
iz iz
2i 2
Las definiciones de límites y continuidad para funciones complejas de una variable compleja son
análogas a las de las funciones reales de variable real.
Funciones holomorfas
En lo que sigue, supondremos A un abierto de Â, z0 = x0 + i⋅y0 un punto de A y f: A → Â.
Definición.- Se dice que f es derivable en z0 si existe y es finito el límite:
f(z) − f(z 0 )
lim
zdz 0 z − z0
Al valor de este límite se le llama derivada de f en z0 y se representa por f '(z0). Se dice que f es
holomorfa en z0 si existe r > 0 tal que f es derivable en B(z0, r). f se dice que es holomorfa en A, si es
derivable en todos los puntos de A.
Son funciones holomorfas en A (abierto en el que está definida f): La función polinómica, la función
racional, la función exponencial, la función logarítmica, etc..
Ecuaciones de Cauchy - Riemann.- Una condición necesaria para la existencia de la derivada de f

en z0 = x0 + i⋅y0 es que se verifiquen las ecuaciones:
Øu(x 0 , y 0 ) Øv(x 0 , y 0 ) Øu(x 0 , y 0 ) Øv(x 0 , y 0 )

= ; =−
Øx Øy Øy Øx
Por tanto, la diferenciabilidad de u(x, y) y v(x, y) en (x0, y0) no basta para que f sea derivable en z0,
además es necesario que se cumplan las ecuaciones de Cauchy - Riemann.
Ejemplo: La función f(z) = x2 + y2 + i⋅(x + y) no es derivable en z = 0 + i⋅0 ≡ 0 ya que:
Øu(0, 0) Øv(0, 0)
=0! =1
Øx Øy
y por tanto no se verifican las condiciones de Cauchy-Riemann.
Teorema.- f es derivable en z0 = (x0, y0) ∈ A ⊂ Â ⇔ u(x, y) y v(x, y) son diferenciables y verifican las
condiciones de Cauchy - Riemann en (x0, y0) ∈ A ⊂ R2.
Nota.- Una condición suficiente para que las funciones u, v: A ⊂ R2 → R sean diferenciables en A
(abierto), es que u, v ∈ C1(A).
Ejemplo: La función f(z) = |z|2 es derivable en 0 pero no en otro punto de Â ya que:
Øu(x, y) Øu(x, y) Øv(x, y) Øv(x, y)

u(x, y) = x2 + y2, v(x, y) = 0, = 2x, = 2y, = 0, =0
Øx Øy Øx Øy
u y v son diferenciables en todo R2, pero las condiciones de Cauchy-Riemann sólo se verifican en el punto
(0, 0). f es derivable en 0 pero no es holomorfa en 0.
Las propiedades elementales de las funciones reales derivables de variable real y sus demostraciones se
trasladan a las funciones de variable compleja sin más que cambiar la notación. Por ejemplo, si f es
derivable en z0 es continua en z0, (f(z) + g(z))' = f '(z) + g'(z), (f(z)⋅g(z))' = f '(z)⋅g(z) + f(z)⋅g'(z), etc.
Integración compleja
La integral definida en el campo complejo es una integral de línea. Por lo tanto, interviene un camino
de integración o arco de curva γ y una función compleja f definida en un subconjunto A de Â que
contenga a γ. Supondremos los caminos de integración z(t) = x(t) + i⋅y(t) t ∈ [a, b] regulares a trozos. Se
define la integral de f respecto de γ por:
dz
b
¶ f(z)dz = ¶ a f(z(t)) z (t)dt
∏
siempre que dicha integral exista, para lo cual es suficiente con que f(z(t)) sea continua en [a, b] salvo a lo
más en un conjunto de medida nula (Teorema de Lebesgue).
Ejemplo.- Calcular ¶ 1z dz siendo la curva γ dada por z(t) = 1 + t⋅i, con t œ [0, 2].
dz
idt = ¶ 0 t + i2 dt = 1 ln(1 + t 2 ) + i $ arctg(t)

2
Solución.- ¶ 1 dz = ¶ 2 1 2
= 1 ln 5 + i $ arctg(2)
z 0 1+t$i 1+t 2 0 2
f(z(t))
Propiedades de la integral compleja.
a) Linealidad.- Sean f y g funciones integrables respecto al camino γ y sean λ y µ dos números

complejos cualesquiera. La función λf + µg es integrable respecto a γ y se cumple:
¶ (f(z ) + g(z ))dz = ¶ f(z )dz + ¶ g(z )dz.
b) Unión de caminos. Si γ = γ1 + γ2 y f es integrable respecto a γ1 y respecto a γ2, entonces f es
integrable respecto a γ y se cumple:
¶ f(z )dz = ¶ 1
f(z )dz + ¶ 2 f(z )dz
c) Caminos equivalentes. Si z1 y z2 son caminos equivalentes (describen la misma curva γ) y f es

integrable respecto a γ = z1(I) entonces f es integrable respecto a γ = z2(J) y se cumple:
¶ f(z 1 )dz 1 = ! ¶ f(z 2 )dz 2 ("+" mismo sentido,"-" sentido opuesto)
d) Acotación. Si f es continua en γ se cumple que:
¶ f(z )dz [ ¶ f(z ) dz [ ML( ),
donde M es una cota superior de |f(z)| en γ y L(γ) es la longitud del camino γ.

e) Regla de Barrow. Sea f continua en un abierto A ⊂ Â, y sea γ un camino regular a trozos contenido
en A. Si F es una primitiva de f en A (F'(z) = f(z) ∀ z ∈ A), se cumple que:
¶ f(z )dz = F(z 2 ) − F(z 1 )

en donde z1 es el extremo inicial de γ y z2 su extremo final. Si z1 = z2, es decir si γ es cerrado, entonces el
valor de la integral es cero. En el ejemplo anterior: ¶ 1z dz = ln(1, 2) − ln(1, 0).
Teorema.- Sea A un abierto conexo por arcos regulares a trozos de Â y f: A → Â continua. Entonces:
[Existe un primitiva F de f en A] ‹ [La integral de f respecto a cualquier camino γ que una dos puntos
de A es independiente de γ] ‹ [La integral de f a lo largo de cualquier camino cerrado es nula]
Si f es holomorfa en un conjunto abierto y estrellado, estas tres condiciones no sólo son equivalentes
sino que se satisfacen siempre.
Teorema de Cauchy
Teorema (Cauchy).- Sea A un abierto de Â y f: A → Â holomorfa en A. Sea γ una curva simple

cerrada tal que tanto γ como la región encerrada por γ están contenidas en A. Entonces:
¶ f(z )dz = 0
En dicha región (la limitada por γ) la integral entre dos puntos z1 y z2 es independiente del camino que
los une. Tales integrales se pueden calcular por la diferencia F(z2) - F(z1) siendo F'(z) = f(z) en la región.
Teorema.- Si f es holomorfa en un conjunto abierto A que contiene a las curvas

γ1 y γ2 (γ2 contenida en la región delimitada por γ1) y a la región delimitada por
γ1
ellas (zona sombreada) . Se verifica que: γ2
¶ 1
f(z )dz = ¶ 2 f(z )dz A
Ejemplo (importante).- Calcular ¶ 1 dz siendo γ una curva simple cerrada que encierra una
(z − z 0 ) n
región en cuyo interior esta z0.
Solución.- Como z0 está en el interior de la región, ∃ B(z0, r) contenida en la región; sea Γ la curva que
limita a B(z0, r), entonces por el teorema anterior: ¶ 1 dz = ¶ 1 dz.
(z − z 0 ) n (z − z 0 ) n
1 2 i $ r $ e i i  0 si n ! 1
¶ (z − z 0 ) n dz = ¶ 0
r n $ e in
d = n−1
r
¶ 02 e i(1−n) d =  2i si n = 1

Definición.- Se llama índice de z0 ∈ Â - γ a Ind (z 0 ) = 1 ¶ 1

z − z 0 dz.
2i
Fórmulas integrales de Cauchy
Sea A un abierto de Â y f: A → Â holomorfa en A. Sea γ una curva simple cerrada tal que tanto γ como
la región encerrada por γ están contenidas en A. Entonces si z0 es un punto interior a dicha región, se
verifica que:
f(z )
f (n (z 0 ) = n! ¶ dz " n = 0, 1, 2,....
2i (z − z 0 ) n+1
donde γ se recorre en sentido positivo.
Así, si una función de variable compleja tiene primera derivada, tiene todas las derivadas de orden
superior también, cosa que no es cierta para funciones de variable real.
Series
Teorema (Serie de Taylor).- Sea f holomorfa en un conjunto abierto A ⊂ Â y sea z0 ∈ A. Entonces, ∀
B(z0, r) ⊂ A, se verifica que:
∞ (n (
f z0 ) (
f(z ) = z − z 0 ) , ∀ z ∈ B(z0, r)
n
n=0 n!
Definición.- El punto z0 se dice que es una singularidad aislada de f si f no esta definida en z0 y f es

holomorfa en un entorno reducido de z0 (B(z0, r) - {z0}). Existen tres clases de singularidades aisladas
según que el límite de la función en z0 sea finito (evitables), infinito (polos) o no exista (esenciales).
g(z )
Caracterización de los polos.- f posee un polo de orden n en z0 si: f(z) = , con g(z0) ≠ 0, g
(z − z 0 ) n
holomorfa en B(z0, r), y n ∈ N. Si n = 1, 2,... etc. el polo se dice simple, doble,.... etc.
Corolario.- Si f tiene un polo de orden n en z0 entonces g(z) = (z - z0)nf(z) es holomorfa en B(z0, r) y g

g (k (z 0 )
tiene desarrollo en serie de Taylor en B(z0, r) (g(z ) = ∞k=0 k!
(z − z 0 ) k , ∀ z ∈ B(z0, r)) y por tanto
a −n a −(n−1) a −1
f(z ) = n + + ... + + a 0 + a 1 (z − z 0 ) + a 2 (z − z 0 ) + ...
2
(z − z 0 ) (z − z 0 ) n−1
(z − z 0 ) 1
g (k (z 0 )
Los coeficientes de esta serie se obtienen con la fórmula: a −n+k = .
k!
Esta serie se llama serie de Laurent para f. La parte a0 + a1(z - z0) + a2(z - z0)2 + ... se llama parte
analítica o regular, en tanto que el resto, que consiste en los inversos de las potencias de z - z0 se llama
parte principal o singular.
Ejemplos.- Hallar la serie de Laurent en torno a la singularidad de f(z) = ez .

(z − 1 ) 2
∞
e (z − 1 ) n e f(z ) = e e z−1 ( )
Solución.- (z - 1)2f(z) = ez = + e + e + + ...
n=0 n! (z − 1 ) 2 z − 1 2! 3!
Residuos
Definición.- Sea z0 un polo de orden n de f; se llama residuo de f en z0 al coeficiente a-1. El residuo, se

puede hallar por la fórmula:
a −1 = zdz
lim0 1 d n−1 [(z − z ) n f(z )]
(n − 1 )! dz n−1 0
Teorema del residuo.- Sea A un abierto de Â y f: A → Â holomorfa en A excepto en un número finito

de polos. Sea γ una curva simple cerrada tal que tanto γ como la región encerrada por γ están contenidas
en A. Supongamos que la región encerrada por γ contiene un número finito de polos z1, z2, ..., zn, con
residuos r1, r2, ..., rn, respectivamente, y que no existen polos en γ, entonces:
¶ f(z )dz = 2i(r 1 + r 2 + ... + r n )

donde γ se recorre en sentido positivo.
Ejemplos
1º.- Sea f(x, y) = xy + (y - x)i. Estudiar si f es derivable y holomorfa en (1, 1) y (2, 2).
Solución.- u(x, y) = xy, v(x, y) = y - x. Øu = y, Øu = x, Øv = −1, Øv = 1. Por tanto, las derivadas

Øx Øy Øx Øy
parciales de u y v existen y son continuas en R , entonces, u y v son diferenciables en R2. Como en (1, 1)
2
Øu(1, 1) Øv(1, 1) Øu(1, 1) Øv(1, 1)

=1= , =1=−
Øx Øy Øy Øx
Øu(1, 1 + ) Øv(1, 1 + )
la función f es derivable en (1, 1). Por otra parte =1+! = 1, y por tanto la
Øx Øy
función no es holomorfa en (1, 1).
Como en (2, 2)
Øu(2, 2) Øv(2, 2)
=2!1= ,
Øx Øy
f no es derivable en (2, 2).
2º.- Sea f(z) = z3. Estudiar si f es derivable y holomorfa en Â.
Solución.- u(x, y) = x3 - 3xy2, v(x, y) = 3x2y - y3. Como
Øu = 3x 2 − 3y 2 , Øu = −6xy, Øv = 6xy, Øv = 3x 2 − 3y 2 ,
Øx Øy Øx Øy
las derivadas parciales de u y v existen y son continuas en R2, entonces, u y v son diferenciables en R2 y
como siempre se verifican las condiciones de Cauchy-Riemann, la función f es holomorfa en todo Â.
3º.- Calcular ¶ 1z dz siendo g la curva dada por a) |z| = 1, b) |z - 4| = 1.
2 2
Solución.- a1) Aplicando la definición: ¶ 1z dz = ¶ 0 1 (−sent + i $ cos t)dt = ¶ 0 idt = 2i.
cos t + i $ sent
a2) Aplicando el teorema de residuo: ¶ 1z dz = 2ia −1 , y a −1 = lim 1 d 1−1 (z − 0 ) 1 1 = 1

zd0 (1 − 1 )! dz 1−1 z
f(z )
a3) Aplicando la fórmula integral de Cauchy: f(z) = 1; f(0 ) = 1 ¶ dz = 1 e ¶ 1z dz = 2i.
2i z−0
2 2 −4sent + i(cos t + 1)
b1) ¶ 1z dz = ¶ 0 1 (−sent + i $ cos t)dt = ¶ 0 dt = 0.
4 + cos t + i $ sent 17 + 8 cos t
b2) Como f(z) = 1z es holomorfa en Â - {(0, 0)} aplicando el Teorema de Cauchy ¶ 1z dz = 0.
z
4º.- Hallar la serie de Laurent de la función f(z) = ez en torno a la singularidad.
Solución.- zf(z) = 1 + 1 z + 1 z 2 + ... + 1 z n + ... e f(z) = 1

z + 1 + 1 z + ... + 1 z n−1 + ...
1! 2! n! 1! 2! n!
parte singular parte regular
ENM Matemáticas II Ecuaciones diferenciales 1
TEMA IV
ECUACIONES DIFERENCIALES DE PRIMER ORDEN
Definiciones generales y teorema de existencia
Definición. Se llama ecuación diferencial ordinaria de primer orden (abreviadamente edo) a toda
relación de la forma:
f(x, y, y') = 0
que ligue una variable independiente "x" con una función "y" de ella y la primera derivada.
Cuando la ecuación diferencial se presenta con la y' despejada, es decir y' = f(x, y) se dice que está en
forma normal.
Definición. Se llama solución general de la ecuación y' = f(x, y) en el dominio D (conjunto abierto y
conexo) a una función y = g(x, C), dependiendo de una constante arbitraria C, tal que:
a) g'(x, C) = f(x, g(x, C)) (verifica la ecuación diferencial).
b) ∀ (x0, y0) ∈ D ∃ C0 ∈ R, de modo que y0 = g(x0, C0) (pasa por el punto).
A la función y = g(x, C0) verificando la edo y' = f (x, y) y la condición inicial (de pasar por (xo, yo)), la
llamaremos solución particular o integral particular de la edo y' = f(x, y).
Observaciones: Una ecuación diferencial puede no tener solución ((y')2 + x2 + 1 = 0 no posee solución
(una suma de cuadrados nunca es negativa)), no tener solución que satisfaga una condición inicial dada
((y')2 - xy' + y + 1 = 0 no tiene solución pasando por (0, 0), ya que esto exigiría que (y')2 = -1 cuando x = 0),
o puede tener más de una solución que satisfaga una condición inicial dada (y' = 3y2/3 tiene dos soluciones
distintas pasando por (0, 0); y1 = 0 e y2 = x3).
También, incluso cuando existe solución, puede que no sea posible determinarla explícitamente.
Comúnmente se dice que la ecuación diferencial ha sido resuelta o integrada cuando se llega a una
fórmula implícita del tipo F(x, y, C) = 0 en la que no aparecen derivadas de la función incógnita.
Pero ¿que condiciones debe cumplir la edo y' = f(x, y) para que exista solución?, caso de existir, ¿es
única?. Las respuestas a las preguntas planteadas, nos las da el siguiente teorema.
Teorema. (Existencia y unicidad para la edo y' = f(x, y)). Si f(x, y) y D2f(x, y) son funciones continuas
en un dominio D (conjunto abierto y conexo) por cada punto (x0, y0) ∈ D ∃ δ > 0 y una única función g(x)
tales que:
g'(x) = f(x, g(x)), ∀ x ∈ [x0 - δ, x0 + δ] y g(x0) = y0.
Ejemplo. La solución general de la ecuación y' = y es:
y = cex
La solución particular de y' = y que pasa por el punto (0, 2) (condición inicial), se obtiene sustituyendo
el punto en la solución general; obtenemos C = 2, y por tanto la solución particular es: y = 2ex.
Ejemplo. La solución general de la ecuación y' = 3y2/3 es:
y = (x + c)3
D2f(x, y) = 2y -1/3 no está definida en puntos de la forma (x0, 0). El teorema no es aplicable en cualquier
dominio que contenga puntos del eje OX. No hay unicidad en el cero: por ese punto pasan dos soluciones
y1 = 0 e y2 = x3. La solución y1 = 0 es una solución singular (no viene dada para ningún valor de C en la
solución general).
El problema inverso consiste en pasar de la solución general (o familia de curvas) F(x, y, C) = 0, a la

ecuación diferencial.
Ejemplo. Dada la familia de hipérbolas xy = C, obtener su ecuación diferencial.
Solución. Derivando y eliminando la constante obtenemos:
xy' + y = 0.
Ejemplo. Dada la familia de rectas y = Cx, obtener su ecuación diferencial.
Solución. Derivando y eliminando la constante obtenemos:

y
y' = x .
Escribir la ecuación diferencial de cada una de las curvas definidas mediante las condiciones dadas.
1. En cada punto (x, y) la pendiente de la tangente es igual al cuadrado de la abscisa del punto.
2. El eje "y" divide en dos partes iguales al segmento que une P(x, y) con el punto de intersección de
la normal en P, con el eje de las "x".
3. El área limitada por el arco de curva, el eje "x" y dos ordenadas, una fija y otra variable, es igual al
doble de la longitud del arco entre las ordenadas.
4. Obtener la ecuación diferencial del haz de circunferencias x2 + (y - c)2 = 1.

Ecuaciones de variables separadas. Ecuaciones Homogéneas
Definición. Dada la edo y' = f(x, y) diremos que es una edo en variables separadas, si dicha ecuación
se puede poner de la forma:
Q(y)dy = P(x)dx
Resolución. El coeficiente de "dx" es sólo función de "x", el de "dy" es sólo función de "y". La
solución general viene dada por:
¶ Q(y)dy = ¶ P(x)dx + C
Ejemplo. Resolver la ecuación diferencial
x3dx + (y + 1)²dy = 0.
Solución. Las variables están separadas. Integrando, pues, término a término, tenemos
3x4 + 4(y + 1)3 = C.
Ejemplo. Resolver la ecuación diferencial
x(y - 3)dy - 4ydx = 0.
Solución. Esta ecuación diferencial se puede poner de la forma:
y−3 4
y dy = x dx
por tanto, integrando se tiene
y - 3Ly = 4Lx + C
ADVERTENCIA ACERCA DE LA CONSTANTE DEL HAZ INTEGRAL: Es frecuente expresar

en distintas formas la solución general, variando la expresión de la constante, es decir, sustituyendo C por
φ(K), K nueva constante. Pero para afirmar que la solución general es la misma, es preciso asegurarse de
que no se han añadido ni quitado soluciones en la sustitución: es decir, que a cada valor de C corresponde
uno de K y viceversa.
Definición. Una función f(x, y) es homogénea de grado k si f(tx, ty) = tkf(x, y) ∀ (x, y) ∈ Domf.
Definición. Una edo P(x, y)dx + Q(x, y)dy = 0 se llama homogénea (de grado k) si P(x, y) y Q(x, y)
son funciones homogéneas de grado k, o también aquéllas en las que y' = una función homogénea de
grado cero de "x" e "y" (y' = f(y/x)).
Resolución. Para resolver una edo homogénea, se efectúa el cambio y = u⋅x, que transforma la edo
homogénea en una edo en variables separables. Una vez integrada, deshacemos el cambio.
Ejemplo. Resolver la ecuación diferencial: (x3 + y3)dx - 3xy²dy = 0.
Solución. Esta ecuación diferencial es homogénea (de grado 3). Mediante el cambio
y = u⋅x, dy = u⋅dx + x⋅du se obtiene

x3{(1 + u3)dx - 3u²(udx + xdu)} = 0,
de donde obtenemos: (1 - 2u3)dx - 3u²xdu = 0, que es una edo en variables separables,
dx = 3u 2 du,
x 1 − 2u 3
por tanto, integrando obtenemos
Lx = K - 1 L(1 - 2u3),
2
y deshaciendo el cambio tenemos
2y 3
x2 1 − = C o bien x3 - 2y3 = Cx.
x3
Ecuaciones reducibles a homogéneas
Las edo reducibles a homogéneas son de la forma:
dy ax + by + c
=f
dx dx + ey + g
Resolución.
1º) Si c = g = 0 entonces la edo anterior es homogénea.
2º) Si c y g no son simultáneamente nulos y las rectas
ax + by + c = 0 y dx + ey + g = 0
se cortan en el punto (α, β), este caso se reduce al anterior efectuando el cambio x = X + α, y = Y + β.
Pues entonces la edo se transforma en la edo homogénea
dY = f aX + bY
dX dX + eY
3º) Si a = be = r ! gc las rectas antedichas son paralelas y la transformación Y = d⋅x + e⋅y da

d
dY = d + ef rY + c
dx Y+g
que es una edo en variables separables.
Ejemplo. Resolver la ecuación diferencial: (x + y)dx + (3x + 3y - 4)dy = 0.
Solución. Como las rectas

x+y=0
3x + 3y - 4 = 0
son paralelas, haciendo el cambio x + y = Y, tenemos que y = Y - x y que dy = dY - dx, entonces

sustituyendo en la ecuación diferencial y simplificando se tiene,
(4 - 2Y)dx + (3Y - 4)dY = 0
que es una ecuación diferencial en variables separables, integrando y deshaciendo el cambio, obtenemos
x + 3y + 2L(2 - x - y) = C
Ejemplo. Resolver la ecuación diferencial: (2x - 5y + 3)dx - (2x + 4y - 6)dy = 0.
Solución. Resolviendo primero el sistema de ecuaciones
2x - 5y + 3 = 0
2x + 4y - 6 = 0
se obtiene x = α = 1, y = β = 1. La transformación x = X + 1 (dx = dX), y = Y + 1 (dy = dY), convierte la

ecuación dada en
(2X - 5Y)dX - (2X + 4Y)dY = 0
que es una edo homogénea de grado 1. Empleando la transformación Y = u⋅X (dY = u⋅dX + X⋅du), se
obtiene
(2 - 7u - 4u²)dX - X(2 + 4u)du =0
y, finalmente,
dX = 2 + 4u du
X 2 − 7u − 4u 2
que integrando y deshaciendo los cambios da:
(4y - x - 3)(y + 2x - 3)² = C
Resolver las siguientes ecuaciones diferenciales:
1. 4ydx + xdy = 0.
2. (1 + 2y)dx + (4 - x²)dy = 0.
3. y²dx - x²dy = 0.
y y y
4. (xsen x - ycos x )dx + xcos x dy = 0.
5. (x² + y²)dx - x x 2 + y 2 dy = 0.
6. (x + y + 1)dx + (2x + 2y + 1)dy = 0.
7. (3y - 7x + 7)dx + (7y - 3x + 3)dy = 0.
En cada una de las siguientes ecuaciones hallar la solución particular indicada.
8. xdy + 2ydx = 0; pasando por (2, 1).
9. (x² + y²)dx + xydy = 0; pasando por (1, -1).
10. cosydx + (1 + e-x)senydy = 0; pasando por (0, ).

4
11. (y² + xy)dx - x²dy = 0; pasando por (1, -1).

Ecuaciones diferenciales exactas. Factor Integrante
Definición. Una edo P(x, y)dx + Q(x, y)dy = 0, es exacta si existe U(x, y) tal que dU = Pdx + Qdy.
Si P y Q son de clase uno en un conjunto abierto y estrellado de R2, existe U si, y sólo si, D2P = D1Q.
Resolución. La solución es U(x, y) = C. Como dU = Pdx + Qdy ⇒ D1U = P ⇒ U = ÛP(x, y)dx + h(y).
Como D2U = Q entonces:
h'(y) = Q(x, y) - D2ÛP(x, y)dx
Ejemplo. Resolver la ecuación diferencial: (2x3 + 3y)dx + (3x + y - 1)dy = 0.
Solución. En este ejemplo P y Q son de clase uno en R2 que es un conjunto abierto y estrellado. Como
D2P = D1Q = 3, entonces la ecuación diferencial es exacta, y, por tanto, la solución es U(x, y) = C.
4
Cálculo de U(x, y): D1U = 2x3 + 3y ⇒ U = x + 3xy + h(y),
2
y2
D2U = Q = 3x + y - 1 = 3x + h'(y) ⇒ h'(y) = y - 1 ⇒ h(y) = −y+c
2
Definición. Si la edo P(x, y)dx + Q(x, y)dy = 0 no es diferencial exacta. Se llama factor integrante de
dicha edo, a una función µ(x, y) tal que la ecuación que resulta de multiplicar por µ
µPdx + µQdy = 0,
es una edo exacta. Supuesta la existencia de µ(x, y), su cálculo se efectúa de la siguiente forma:
CÁLCULO DEL FACTOR INTEGRANTE. La condición que habrá de cumplir es

D2(µP) = D1(µQ)
o sea, desarrollando
µD2P + PD2µ = µD1Q + QD1µ
que es (en general) una ecuación diferencial en derivadas parciales.
La integración de esta ecuación es más complicada que la integración directa de Pdx + Qdy = 0, pero
como no se trata aquí de hallar todos los factores integrantes sino que con uno nos basta, no es difícil, en
los casos corrientes, hallar condiciones simplificadoras. Por ejemplo, la ecuación
P(x, y)dx + Q(x, y)dy = 0
admite un factor integrante que sólo depende de "x" o sólo de "y" si:
D2P − D1Q
= #(x), entonces, (x) = e ¶ #(x)dx es un factor integrante de P(x, y)dx + Q(x, y)dy = 0.
Q
D2P − D1Q
P = #(y ), entonces, (y) = e −¶ #(y)dy es un factor integrante de P(x, y)dx + Q(x, y)dy = 0.
Ejemplo. Resolver la ecuación diferencial: (x² + y² + x)dx + xydy = 0.
Solución. D2P = 2y, D1Q = y; la ecuación no es exacta. Sin embargo
D2P − D1Q 1
= x
Q
entonces µ(x) = x es un factor integrante. Introduciendo el factor integrante se tiene
(x3 + xy² + x²)dx + x²ydy = 0
4 x 2 y2 x 3
Resolviendo obtenemos: U(x, y) = x + + = C.
4 2 3
1. (x² - y)dx - xdy = 0.
2. y(x - 2y)dx - x²dy = 0.
3. (x² + y²)dx + xydy = 0.
4. (x² + y²)dx + 2xydy = 0.
5. (x + ycosx)dx + senxdy = 0.
6. (x x 2 + y 2 - y)dx + (y x 2 + y 2 - x)dy = 0.
7. xdy - ydx = x²exdx.
8. (1 + y²)dx = (x + x²)dy.
9. (2y - x3)dx + xdy = 0.
10. y²dy + ydx - xdy = 0.
11. (2y + 3xy²)dx + (x + 2x²y)dy = 0.
12. y(x + y)dx - x²dy = 0.

Ecuaciones Lineales, de Bernoulli y de Riccati
Definición. Se llama ecuación diferencial lineal de primer orden, a:
y' + f(x)y = g(x)
donde f(x) y g(x) son funciones continuas en un cierto intervalo abierto I Õ R.
Resolución. Multiplicando la ecuación por e ¶ f(x )dx se tiene:

∏
e ¶ f(x )dx [y' + f(x)y = g(x)] ⇔ e ¶ f(x )dx y = e ¶ f(x )dx g(x ) ⇒ (integrando)
e ¶ f(x )dx y = ¶ e ¶ f(x)dx g(x )dx + K w y = e −¶ f(x )dx ¶ e ¶ f(x)dx g(x )dx + K
Ejemplo. Resolver la ecuación diferencial: y' + 2xy = 4x.
Solución. y = e −¶ 2xdx ¶ 4xe ¶ 2xdx dx + K = 2 + Ke −x

2
PROPIEDAD DE LA ECUACIÓN LINEAL: Como la solución general de y' + f(x)y = g(x), es de la

forma y = Cφ(x) + γ(x). Entonces si y1 e y2 son dos soluciones particulares se tiene que yi = Ciφ(x) + γ(x),
i = 1, 2; por tanto
y − y1 C − C1
y2 - y1 = (C2 - C1)φ(x) de donde y 2 − y 1 = K, siendo K =
C2 − C1
Expresión muy cómoda de la solución general, y que puede escribirse por tanto, sin efectuar ninguna
integración cuando se conocen dos integrales particulares y1, y2.
Definición. Se llama ecuación de Bernoulli, a toda edo de la forma
y' + f(x)y = g(x)yn
1 .
Resolución. Dicha ecuación se transforma en una edo lineal mediante el cambio u = n−1
y
Ejemplo. Resolver la ecuación diferencial: y' + 2xy = -xy4.
Solución. Haciendo la transformación u = y -3, la ecuación se transforma en
u' - 6xu = 3x
cuya solución viene dada por
u = e ¶ 6xdx ¶ 3xe −¶ 6xdx dx + K = − 1 + Ke 3x

2
2
por tanto
y −3 = − 1 + Ke 3x
2
2
Aplicaciones
Ejemplo. (Desintegración radioactiva). Sabiendo que todas las sustancias tienen la propiedad común
de que la velocidad de descomposición en cada instante es proporcional a la cantidad de sustancia
existente en aquel instante. Calcular la cantidad de sustancia en función del tiempo.
Solución. y' = -ky donde k es una constante positiva (llamada constante de desintegración) cuyo valor
depende de cada elemento. y(t) = y(0)e-kt.
Ejemplo. (Caída de un cuerpo en un medio resistente). Un cuerpo en reposo de masa m es soltado a

gran altura en la atmósfera terrestre. Supuesto que cae en línea recta y que las únicas fuerzas que actúan
sobre él son la de la gravedad terrestre y una fuerza resistente (debida a la resistencia del aire) que es
proporcional a su velocidad, calcular su velocidad máxima.
Solución. Por la segunda ley de Newton: mg - kv = ma, por tanto v ∏ + mk v = g. Resolviendo la ecuación
diferencial lineal, y teniendo en cuenta que v = 0 cuando t = 0, obtenemos:
mg mg
1 − e− m d
kt
v= k k si t d +∞
Ejemplo. (Ley de enfriamiento de Newton). Sabiendo que el coeficiente de variación de la

temperatura de un cuerpo es proporcional a la diferencia entre su temperatura y la del medio ambiente,
hallar la temperatura en cada instante.
Solución. y' = -k(y - m(t)) ⇒ y' + ky = km(t) ⇒ y(t ) = e −kt ¶ km(t )e kt dt + C .
Ejemplo. (Disoluciones). Un depósito contiene 100 litros de una disolución salina cuya concentración
es 2,5 g de sal por litro. Una disolución conteniendo 2 g de sal por litro entra en el depósito a razón de 5
litros por minuto y la mezcla (que se hace uniforme por el movimiento) sale a la misma velocidad.
Encontrar la cantidad de sal que hay en cada instante en el depósito.
Solución. La variación del número de gramos de sal que hay en el depósito respecto del tiempo es
igual a la sal que entra menos la que sale: y' = 10 - 201 y ⇒ y' + 201 y = 10. Como en t = 0 y = 250;
y = 200 + 50e − 20
t
Ejemplo. (Circuitos eléctricos). Por la segunda ley de Kirchhoff sabemos que
L di + R $ i = V(t)
dt
donde L es la inductancia de la bobina y R es el valor de la resistencia.
Un tipo corriente de preguntas relativas a tales circuitos es este: Si se aplica

en el circuito un cierto voltaje V(t), ¿cuál es la intensidad resultante i(t)?
Solución. i(t ) = e − L t
R
¶ VL(t) e R
L t
dt + i(0 )
Definición. Se llama ecuación de Riccati, a toda edo de la forma
y' = g(x) + f(x)y + h(x)y²
Resolución. En general esta edo no se puede integrar; pero si se conoce una integral particular de ella
y1, la integración es posible. Basta, en efecto, hacer
∏
y = y 1 + 1u , y ∏ = y ∏1 − u2
u
y queda, teniendo en cuenta que y1 es solución de la ecuación de Riccati
u' + (f(x) + 2h(x)y1)u + h(x) = 0
que es lineal. Integrada ésta y hallada u, se sustituye en
y = y 1 + 1u
1. y' + y = 2 + 2x.
2. y' - y = xy².
3. di - 6i = 10sen2t.
dt
4. xdy + ydx = x3y6dx.
5. (2 + y²)dx - (xy + 2y + y3)dy = 0.
6. yy' - xy² + x = 0.
7. (1 + seny)dx = [2ycosy - x(secy + tgy)]dy.
8. En cada punto (x, y) de una curva el segmento que la tangente intercepta en el eje "y" es igual a
2xy². Hallar la curva.
9. Hallar la familia de curvas para las que la longitud de la parte de la tangente entre el punto de
contacto (x, y) y el eje "y" es igual al segmento interceptado en "y" por la tangente.
10. Hallar la ecuación de la curva para la que la normal en un punto cualquiera (x, y) pasa por el origen.
Ecuaciones de primer orden no lineales en y'
ECUACIONES RESOLUBLES EN y': Sea una ecuación diferencial de la forma:
P0(x, y) + P1(x, y)⋅y' + P2(x, y)⋅(y')² + ⋅⋅⋅ + Pn(x, y)⋅(y')n = 0.
Si esta ecuación, algebraica en y', se puede factorizar, obtenemos
(y' - f1(x, y))⋅(y' - f2(x, y))⋅⋅⋅(y' - fn(x, y)) = 0,
teniendo por tanto, n-ecuaciones diferenciales:
y' = f1(x, y), y' = f2(x, y), ....., y' = fn(x, y).
Si es posible resolver estas ecuaciones, y' = fi(x, y), y designamos por φi(x, y, C) = 0 su solución, la
solución general está formada por el conjunto:
{φi(x, y, C) = 0 / i = 1, 2, ...., n}
Ejemplo. Resolver la ecuación diferencial:
(y')4 - (x + 2y + 1)(y')3 + (x + 2y + 2xy)(y')2 - 2xyy' = 0
Solución. Descomponiendo en factores esta ecuación, tenemos
y'(y' - 1)(y' - x)(y' - 2y) = 0

Las soluciones de las ecuaciones
y' = 0, y' = 1, y' = x, y' = 2y,

son respectivamente
y - C = 0, y - x - C = 0, 2y - x² - C = 0, y - Ce2x = 0.
Por tanto la solución general es:
{y - C = 0, y - x - C = 0, 2y - x² - C = 0, y - Ce2x = 0}
ECUACIONES RESOLUBLES EN y O EN x: Si en la ecuación de primer orden no podemos

despejar y' pero sí "y"
y = f(x, y')
Para resolverla hacemos el cambio y' = p, obteniendo
y = f(x, p)
y, por derivación, supuesto f derivable,

dp dp p − D 1 f
p = D1f + D2f , de donde = = g(x, p)
dx dx D2f
dp
ecuación diferencial con la despejada, que puede ser, por esta circunstancia, más sencilla de resolver
dx
que la propuesta. Si es así y podemos hallar su solución general
φ(x, p, C) = 0,
esta ecuación, unida a y = f(x, p), define parametricamente la solución general buscada en función del
parámetro p.
Análogamente puede procederse si en la ecuación diferencial está despejada "x"
x = f(y, y') con y' = p, x = f(y, p)
y derivando con relación a x

dp dp 1 − p $ D 1 f
1 = D1f $ p + D2f $ $ p, de donde = = h(y, p)
dy dy p $ D2f
De cuya integración podemos hallar
φ(y, p, C) = 0,
que junto con x = f(y, p) define la solución general en función del parámetro p.
Ejemplo. Resolver la ecuación diferencial: y = 2y'x + (y')4x2.
Solución. Haciendo y' = p y derivando respecto de "x", tenemos,
p = 2xp' + 2p + 2p4x + 4p3x2p',

y simplificando obtenemos,
p + 2xp' = 0
cuya solución es: xp² = C
Y por tanto la solución general en forma paramétrica será:
x = C2
p
y = 2C
p +C
2
Ecuación diferencial de Lagrange y Clairaut
Definición. Se llama ecuación diferencial de Lagrange, a toda edo de la forma
y = xf(y') + g(y')
Resolución. La ecuación diferencial de Lagrange es una ecuación resoluble en "y", por tanto, haciendo
y' = p, tenemos y = xf(p) + g(p), y derivando respecto de "x" da, supuestas f y g derivables
dx − f (p) x = g (p)
∏ ∏
dp
p = f(p) + [xf ∏ (p) + g ∏ (p) ] $ , o bien
dx dp p − f(p) p − f(p)
que es lineal tomando "p" como variable y "x" como función, y cuya solución es
f ∏ (p) f ∏ (p)
¶ ¶
¶ pg−(p)
∏ −
x = e p − f(p) p − f(p) dp + K
dp dp
e
f(p)
que da "x" en función del parámetro "p", pendiente de la curva integral. La ordenada "y" se obtendrá
análogamente en función de "p" sustituyendo simplemente la expresión obtenida en
y = xf(p) + g(p)
Ejemplo. Resolver la ecuación diferencial: y = (1 + y')x + (y')².
Solución. Teniendo en cuenta que f(p) = 1 + p y que g(p) = p², tenemos
x = e ¶ −dp ¶ −2pe ¶ dp dp + C
por tanto la solución general en forma paramétrica es:
x = 2(1 - p) + Ce-p
y = 2 - p² + C(1 + p)e-p
El procedimiento supone p - f(p) ≠ 0 por lo cual no es válido en los siguientes casos:
1º) Para las ecuaciones de la forma y = xy' + g(y') llamadas de Clairaut, en que f(p) = p, que
resolveremos en el párrafo siguiente.
2º) Para las soluciones lineales de la ecuación dada (supuesto f(p) no idéntico a p) de la forma
y = pix + g(pi)
cuya pendiente pi sea raíz de la ecuación numérica f(p) = p.
Se comprueba fácilmente que estas rectas, si existen, satisfacen la ecuación y = xf(y') + g(y'). Ahora
bien, puede ocurrir que g(pi) ∉ R, en cuyo caso no existe tal recta, y si existe puede ocurrir que pertenezca
o no a la solución general. En este último caso se llama una solución singular de la ecuación.
Definición. Se llama ecuación de Clairaut, a toda edo de la forma
y = xy' + g(y')
Resolución. La solución general de esta ecuación viene dada por
y = xC + g(C)
La solución general de toda ecuación de Clairaut es, pues, un haz de rectas que se obtiene sustituyendo
y' por una constante C. Si este haz tiene una curva envolvente ésta será una solución singular de la
ecuación, puesto que en cada uno de sus puntos será tangente a una recta involuta y tendrá en él los
mismos valores x, y, y' que los de dicha recta, verificando, por tanto la ecuación de Clairaut. Esta
envolvente se halla, por eliminación de C entre la ecuación del haz y su derivada respecto de C
y = xC + g(C)
0 = x + g'(C)
Ejemplo. Resolver la ecuación diferencial: y = xy' - 2(y')².
Solución. Como esta ecuación es de Clairaut, su solución general viene dada por:
y = xC - 2C²
Cálculo de la envolvente:
0 = x - 4C
entonces C = x , y eliminando C, en la solución general tenemos la envolvente del haz, x² = 8y.

4
Trayectorias. Trayectorias ortogonales
Definición. Se llaman trayectorias de un haz de curvas F(x, y, C) = 0, a las curvas que cortan a las del
haz según un ángulo constante.
Y ∏ − y∏
Sea w dicho ángulo, entonces, tgw = (tangente del ángulo que forman dos rectas conocidas
1 + Y ∏ y∏
sus pendientes); despejando y', obtenemos:
Y ∏ − (!tgw)
y∏ =
1 + (!Y ∏ $ tgw )
Por tanto, si f(x, y, y') = 0 es la ecuación diferencial del haz dado, la de sus trayectorias será:
Y ∏ − (!tgw)
f x, Y, =0
1 + (!Y ∏ $ tgw )
El problema se simplifica si w = 90º pues la relación entre y' e Y' es simplemente y ∏ = − 1∏ . Por tanto,
Y
se hallará la ecuación diferencial de las trayectorias ortogonales de un haz F(x, y, C) = 0 hallando la
ecuación diferencial f(x, y, y') = 0 del haz y cambiando en ella y' por − 1∏ ; es decir,
y
f(x, y, − 1∏ ) = 0
y
Ejemplo. Hallar las trayectorias ortogonales de las hipérbolas xy = C.
Solución. La ecuación diferencial de la familia dada es
xy' + y = 0,
obtenida derivando xy = C. La ecuación diferencial de las trayectorias ortogonales, obtenida sustituyendo

y' por − 1∏ , es
y
-x 1∏ + y = 0,
y
que da lugar a: ydy - xdx = 0.
Integrando, las trayectorias ortogonales son las curvas (hipérbolas) correspondientes a la familia
y² - x² = C.
Hallar las trayectorias ortogonales de cada una de las siguientes familias de curvas.
1. x + 2y = C.
2. x² + 2y² = C.
3. y² = 2x²(1 - Cx).
Resolver las ecuaciones:
4. xy(y')² + (x² + xy + y²)(y')² + x² + xy = 0.
5. (x² + x)(y')² + (x² + x - 2xy - y)y' + y² - xy = 0.
6. x(y')² - 2yy' + 4x = 0.
7. y²(y')² + 3y'x - y = 0.
8. y = 2y' + 1 + y’ 2 .
9. y = -xy' + x4y'.
10. Hallar una curva tal que la tangente en cualquiera de sus puntos P sea la bisectriz del ángulo
determinado por la ordenada que pasa por P y la recta que une P con el origen.
11. Hallar la curva para la que cada una de sus tangentes forme con los ejes coordenados un triángulo
de área constante a².
12. Hallar la curva para la que el producto de las distancias de los puntos (a, 0) y (-a, 0) a las tangentes
es igual a k.
13. Hallar la curva para la que la proyección sobre el eje "y" de la perpendicular desde el origen a
cualquiera de sus tangentes es igual a k.
ECUACIONES DE ORDEN SUPERIOR AL PRIMERO
Introducción
Definición. Se llama ecuación diferencial ordinaria de orden n a toda relación de la forma:
f(x, y, y', y" ,...,y(n) = 0
que ligue una variable independiente "x" con una función "y" de ella y las n primeras derivadas.
Ejemplo. La ecuación
(y")² + (y')3 + 3y = x²
es una ecuación diferencial de segundo orden.
Definición. Al haz de curvas F(x, y, C1, C2,..., Cn) = 0 verificando la edo f(x, y, y', y" ,...,y(n) = 0 se le
llama solución general. Si y(x) es una curva del haz la llamaremos solución particular de la edo.
Ejemplo. Dada la ecuación diferencial y" - 5y' + 6y = 12, tenemos que la solución general es
y = C1e2x + C2e3x + 2,
ya que verifica la ecuación diferencial y depende de tantas constantes como el orden.
Son soluciones particulares de dicha ecuación diferencial
y = C1e2x + 2
y = e2x + e3x + 2,
ya que se obtienen de la solución general, la primera para C2 = 0 y la segunda para C1 = 1 y C2 = 1.
Cuando una curva y = g(x) verifica la ecuación diferencial y no forma parte de la solución general, se
llama solución singular.
ECUACIONES DIFERENCIALES LINEALES
Introducción
Definición. Se llama ecuación diferencial lineal de orden n, a toda ecuación diferencial que es de
primer grado respecto de la función incógnita "y" y sus n primeras derivadas. Es decir
dny d n−1 y dy
a n (x) n + a n−1 (x) n−1 + $ $ $ + a 1 (x) + a 0 (x)y = g(x).
dx dx dx
Las funciones a0(x),..., an(x) (que supondremos continuas en un cierto intervalo I Õ R (acotado o no
acotado)) se llaman coeficientes de la ecuación. El coeficiente an(x) desempeña un papel especial, puesto
que determina el orden de la ecuación. Los puntos en los que an(x) = 0 se llaman puntos singulares de la
ecuación. La presencia de puntos singulares introduce, algunas veces, complicaciones que requieren un
estudio especial. Para evitarlas supongamos que la función an(x) nunca es cero en I. Entonces podemos
dividir ambos miembros de la ecuación por an(x) y escribir la ecuación diferencial con primer coeficiente
igual a 1. Por tanto, supondremos que la ecuación diferencial tiene la forma:
dny d n−1 y dy
+ a n−1 (x) + $ $ $ + a 1 (x) + a 0 (x)y = g(x).
dx n dx n−1 dx
Si el término independiente g(x) es nulo, la ecuación resultante
dny d n−1 y dy
n + a n−1 (x) n−1 + $ $ $ + a 1 (x) + a 0 (x)y = 0,
dx dx dx
se llama homogénea o incompleta, mientras que la ecuación
dny d n−1 y dy
n + a n−1 (x) n−1 + $ $ $ + a 1 (x) + a 0 (x)y = g(x),
dx dx dx
con g(x) ≠ 0 se llamará no homogénea o completa.
El estudio de las ecuaciones lineales puede simplificarse mediante el uso de operadores. Sea C(I) el
espacio vectorial de las funciones reales continuas en I, y sea Cn(I) es subespacio de C(I) de todas las
funciones de clase n en I. Sean a0(x),..., an-1(x) ∈ C(I); definamos el operador P(D): Cn(I) → C(I) de la
forma:
P(D)y = Dny + an-1Dn-1y + ⋅⋅⋅ + a1Dy + a0y,
donde Dky = y(k.
Con esta notación la ecuación

dny d n−1 y dy
n + a n−1 (x) n−1 + $ $ $ + a 1 (x) + a 0 (x)y = g(x),
dx dx dx
podrá ponerse de la forma: P(D)y = g(x).
PROPIEDAD DEL OPERADOR P(D). El operador P(D) es lineal; es decir
P(D)(C1y1 + C2y2) = C1P(D)y1 + C2P(D)y2

Teorema. Si y1,..., yn, son n soluciones independientes de la ecuación diferencial homogénea P(D)y = 0
en I, entonces la solución general de la ecuación homogénea es:
y = C1y1 + ⋅⋅⋅ + Cnyn,
siendo C1, ..., Cn constantes.
Teorema. Si y1,..., yn, son n soluciones independientes de la ecuación diferencial homogénea P(D)y = 0
e yp es una solución particular de la ecuación no homogénea P(D)y = g(x), donde g ∈ C(I), entonces la
solución general de la ecuación no homogénea es:
y = C1y1 + ⋅⋅⋅ + Cnyn + yp,
siendo C1, ..., Cn constantes.
CONDICIÓN DE INDEPENDENCIA. Las funciones y1,..., yn son independientes si:
α1y1 + ⋅⋅⋅ + αnyn = 0 ⇒ α1 = ⋅⋅⋅ = αn = 0 (únicos)
Por tanto, derivando n-1 veces, α1y1 + ⋅⋅⋅ + αnyn = 0, se tiene el sistema homogéneo
1 y1 +$$$+ n yn =0
1 y ∏1 +$$$+ n y ∏n =0
........... .......... ........... .....
1 y (n−1
(n−1
1 +$$$+ n yn =0
Para que dicho sistema posea sólo la solución trivial α1 = ⋅⋅⋅ = αn = 0, ha de verificarse (por el teorema
de Rouche-Froebenius), que sea distinto de cero el determinante (W) wronskiano
y1 ......... yn
y∏ ......... y ∏n
W(x) = 1
....... ......... .......
y (n−1
1 ........ y (n−1
n
Por tanto, la condición necesaria y suficiente para que "n" soluciones particulares y1,..., yn de una
ecuación lineal homogénea sean independientes es que el determinante wronskiano de ellas no se anule en
ningún punto.
Método de variación de las constantes
Sean y1,..., yn, n soluciones independientes de la ecuación diferencial lineal homogénea de orden n
P(D)y = 0 en un intervalo I. Entonces una solución particular yp de la ecuación P(D)y = g(x) viene dada
por:
yp = C1(x)y1 + ⋅⋅⋅ + Cn(x)yn
donde C1(x), ..., Cn(x) se determinan de la siguiente forma: Se resuelve (por Cramer) el sistema
C1'y1 + ⋅⋅⋅ + Cn'yn = 0

C1'y1' + ⋅⋅⋅ + Cn'yn' = 0
⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅
C1'y1(n-2 + ⋅⋅⋅ + Cn'yn(n-2 = 0
C1'y1(n-1 + ⋅⋅⋅ + Cn'yn(n-1 = g(x)
obteniendo:
g(x)
Ci' = (−1 )
W w(y 1 , ..., y i−1 , y i+1 , ..., y n )
n+i
= fi(x) i = 1,.., n
indicándose con w(....) el wronskiano de las y1,.., yi-1, yi+1,.., yn
Finalmente, integrando y sustituyendo obtenemos
y p = [¶ # 1 (x )dx ]y 1 + [¶ # 2 (x )dx ]y 2 + $ $ $ + [¶ # n (x )dx ]y n
Por tanto, la solución general será:
y = K 1 y1 + K 2 y2 + $ $ $ + K n yn + yp
y = [K 1 + ¶ # 1 (x )dx ]y 1 + [K 2 + ¶ # 2 (x )dx ]y 2 + $ $ $ + [K n + ¶ # n (x )dx ]y n
Ejercicio. Hallar, aplicando el método de variación de las constantes, la solución general de la edo
(2x - 3)y"' - (6x - 7)y" + 4xy' - 4y = 8.
(Soluciones particulares y1 = x, y2 = ex, y3 = e2x).

Solución de las ecuaciones homogéneas con coeficientes constantes
Supongamos constantes los coeficientes ao, ..., an-1 de P(D)y = 0. Para resolver dicha ecuación, haremos
lo siguiente:
1º) Resolvemos la ecuación algebraica (llamada ecuación característica) P(r) = 0.
2º) a) CASO DE RAÍCES SIMPLES. Si P(r) tiene n raíces distintas r1,...,rn , la solución general es:
y = C 1 e r 1 x + $ $ $ + C n e r nx
Ejemplo. Resolver la ecuación diferencial: (D² + 2D - 15)y = 0.
Solución. Hallamos las raíces de la ecuación característica
r² + 2r - 15 = 0.
Las raíces características son r = 3 y r = -5, por tanto la solución general de la ecuación dada es:
y = C1e3x + C2e-5x.
b) CASO DE RAÍCES MÚLTIPLES. Supongamos que r1 tiene multiplicidad k y el resto rk+1,... rn son
simples, en este caso la solución general es:
y = C 1 e r 1 x + C 2 xe r 1 x + C 3 x 2 e r 1 x + ... + C k x k−1 e r 1 x + C k+1 e r k+1 x + ... + C n e r nx
Ejemplo. Resolver la ecuación diferencial: (D3 - 3D2 + 3D - 1)y = 0.
Solución. Hallamos las raíces de la ecuación característica: r3 - 3r2 + 3r - 1 = 0.
Las raíces características son r = 1 triple, por tanto la solución general de la ecuación dada es:
y = C1ex + C2xex + C3x²ex.
c) CASO DE RAÍCES COMPLEJAS. Si se emplean exponenciales complejas, no hay necesidad de

distinguir entre raíces reales y complejas de la ecuación característica de la ecuación P(D)y = 0. Si se
desean soluciones de valor real, haremos lo siguiente: Agrupamos los términos correspondientes a dos
raíces imaginarias conjugadas simples r1 = α + βi, r2 = α - βi y aplicamos la fórmula de Euler, obteniendo:
C1e(α+βi)x + C2e(α-βi)x = eαx[(C1 + C2)cosβx + i(C1 - C2)senβx],
que se suele escribir
eαx(Acosβx + Bsenβx),
donde A = C1 + C2 y B = i(C1 - C2). Obsérvese que para tener soluciones en el campo real hemos de
atribuir a C1 y C2 valores conjugados, con lo que A y B serán constantes arbitrarias reales.
Análogamente, una raíz α + βi de orden k y su conjugada α - βi originan en la solución general un

conjunto de términos que pueden agruparse escribiendo eαx[Q(x)cosβx + R(x)senβx], donde Q y R son
polinomios de grado k-1 y coeficientes arbitrarios.
Ejemplo. Resolver la ecuación diferencial: (D² - 2D + 10)y = 0.
Solución. Las raíces de la ecuación característica, r² - 2r + 10 = 0, son: r = 1 ± 3i, por tanto la solución
general de la ecuación dada es:
y = ex(C1cos3x + C2sen3x)
1. (D3 + D2 - 2D)y = 0.
2. (D² + 6D + 9)y = 0.
3. (D4 - 6D3 + 12D2 - 8D)y = 0.
4. (D² + 4D + 13)y = 0.
5. (D² + 25)y = 0.
6. (D3 - D2 + 9D - 9)y = 0.
7. (D4 + 4D2)y = 0.
8. (D4 - 6D3 + 13D2 - 12D + 4)y = 0.
9. (D6 + 9D4 + 24D2 + 16)y = 0.

Ecuación completa con coeficientes constantes. Casos particulares
Como hemos dicho anteriormente, para formar la solución general de la ecuación completa bastará
añadir a la solución general de la homogénea una solución particular de la completa
P(D)y = g(x).
Veamos ahora algunos de los recursos utilizados para obtener tales soluciones particulares, en los casos
más frecuentes en la práctica, que son
1º) Segundo miembro exponencial: g(x) = aeαx
2º) Segundo miembro trigonométrico: g(x) = acosαx + bsenαx
3º) Segundo miembro polinómico: g(x) = chxh + ⋅⋅⋅ + c1x + c0
4º) Segundo miembro: suma de los tipos anteriores.
1º) Si g(x) = aeαx, entonces:
a) Si P(a) ∫ 0, yp = a eαx
.
P )
(
k
b) Si a es raíz de multiplicidad k de P(x) = 0, yp = ax
(k
eαx.
P ( )
Ejemplo. Resolver la ecuación diferencial: (D3 - 2D2 - 5D + 6)y = e4x.
Solución. Empecemos resolviendo la ecuación homogénea,
(D3 - 2D2 - 5D + 6)y = 0.
La solución de dicha ecuación es:
y = C1ex + C2e3x + C3e-2x.
Como P(4) = 18 ∫ 0,
y p = 1 e 4x
18
es una solución particular de la ecuación completa, por tanto la solución general de la ecuación completa
es:
y = C1ex + C2e3x + C3e-2x + 1 e4x.

18
2º) Si g(x) = acosαx + bsenαx, entonces:
a) si P(ai) ∫ 0, yp = Acosαx + Bsenαx.
b) Si ai es raíz de multiplicidad k de P(x) = 0, yp = Axkcosαx + Bxksenαx.
Sustituyendo en la ecuación P(D)y = g(x), obtenemos A y B.

Ejemplo. Resolver la ecuación diferencial: (D² + 3D - 4)y = sen2x.
Solución. La solución de la ecuación homogénea es
y = C1ex + C2e-4x.
Como P(2i) ∫ 0
yp = Acos2x + Bsen2x,
obteniendo que B = − 4 y A = − 3 , y por tanto la solución general es:

50 50
y = C1ex + C2e-4x - 1 (3cos2x + 4sen2x).

50
3º) Si g(x) = chxh + ⋅⋅⋅ + c1x + c0, entonces:
Si ak es el primer coeficiente (menor k) de la ecuación característica distinto de cero, entonces una

solución particular es: yp = (bhxh + ⋅⋅⋅ + b1x + b0)xk.
Ejemplo. Resolver la ecuación diferencial: (2D² + 2D + 3)y = x² + 2x - 1.
Solución. La solución de la ecuación homogénea es
5 5
y = e − 2 C 1 cos x + C 2 sen
x
x.
2 2
Como a0 = 3 ∫ 0, yp = (b2x² + b1x + b0)x0; obteniendo que b2 = 1 , b1 = 2 , y b0 = − 25 , y por tanto la

3 9 27
solución general es
5 5 2
y = e − 2 C 1 cos x + C 2 sen x + x + 2x − 25.
x
2 2 3 9 27
4º) Si g(x) es una suma ∑gi de funciones de los tipos anteriores, bastará hallar las soluciones
particulares yi correspondientes y sumarlas; esta suma ∑yi será la solución particular deseada debido a la
linealidad del operador P(D).
Método del anulador. Sea la ecuación diferencial lineal de coeficientes constantes P(D)y = g(x). Si
g(x) es anulada por un operador con coeficientes constantes Pg(D), es decir Pg(D)g(x) = 0, entonces,
multiplicando la ecuación P(D)y = g(x) por Pg(D), obtenemos Pg(D)P(D)y = 0. Esta, es una ecuación
diferencial lineal homogénea con coeficientes constantes que es satisfecha por todas las soluciones
particulares de la ecuación original. El problema se reduce entonces a determinar, una función particular
yp de la solución general de Pg(D)P(D)y = 0 que satisface P(D)yp = g(x).
Ejemplo. Resolver (D2 - 4)y = xex.
Solución. (D - 1)2 anula a xex, entonces, (D - 1)2(D2 - 4)y = 0 y la solución general de esta ecuación
homogénea es y = c1e2x + c2e-2x + c3ex + c4xex. La solución que estamos buscando pertenece a ese haz y
verifica (D2 - 4)y = xex, es decir
(D2 - 4)(c1e2x + c2e-2x + c3ex + c4xex) = xex ⇒ (c3 + 2c4)ex + c4xex - 4(c3ex + c4xex) = xex ⇒
-3c4 = 1 ⇒ c4 = − 13 , -3c3 + 2c4 = 0 ⇒ c3 = − 29 .

1. (D² + D + 1)y = e3x + 6ex - 3e-2x + 5.
2. (D² - 1)y = ex.
3. (D - 2)²y = e2x.
4. (D4 - 1)y = sen2x.
5. (D3 + 1)y = cosx.
6. (D² + 4)y = sen2x.
7. (D² + 5)y = cos 5 x.
8. (D3 + D2 + D + 1)y = ex + e-x + senx.
9. (D² - 1)y = x².
10. D4(D2 - 1)y = x².
11. (D² + 2)y = x3 + x2 + e-2x + cos3x.
12. (D² - 2D - 1)y = excosx.
13. (D² + 2D + 4)y = exsen2x.
14. (D4 + 2D3 - 3D2)y = x² + 3e2x + 4senx.
15. (D3 - 4D2 + 3D)y = x².
16. (D3 - 2D + 4)y = x4 + 3x2 - 5x + 2.
17. 17. (D² + 4)y = cos2x + cos4x.
18. (D3 + D2 + D + 1)y = sen2x + cos3x.
19. (D4 + 10D2 + 9)y = cos(2x + 3).
20. (D3 - 5D2 + 8D - 4)y = e2x + 2ex + 3e-x.

Método de reducción a una ecuación lineal de primer orden
El operado P(D) de coeficientes constantes verifica las propiedades:
ASOCIATIVA. P1(D)[P2(D)y] = [P1(D)P2(D)]y.
CONMUTATIVA. P1(D)P2(D)y = P2(D)P1(D)y.
RESOLUCIÓN GENERAL DE P(D)y = g(x).
1º) Resolvemos P(r) = 0, obteniendo r1, r2, ..., rn.
2º) Por tanto (D - r1)(D - r2)...(D - rn)y = g(x); llamando u1 = (D - r2)...(D - rn)y, obtenemos:
(D - r1)u1 = g(x),
que es una ecuación lineal de primer orden, cuya solución es:
u 1 = e r 1 x [¶ e −r 1 x g(x)dx + C 1 ] = g 1 (x) .
Tenemos ahora que (D - r2)...(D - rn)y = g1(x); llamando u2 = (D - r3)...(D - rn)y, obtenemos:
(D - r2)u2 = g1(x),
que es una ecuación lineal de primer orden, cuya solución es:
u 2 = e r 2 x ¶ e[ −r 2 x g 1 (x)dx + C 2 ] = g 2 (x) .
Y así hasta obtener "y".

2x
Ejemplo. Resolver la ecuación diferencial: (D - 2)²y = e 2 .
x
Solución.
1º) Al resolver P(r) = 0, obtenemos r1 = 2 y r2 = 2.

2x
2º) Como (D - 2)(D - 2)y = e 2 , llamamos u1 = (D - 2)y, y resolvemos:
x
2x
(D - 2)u1 = e 2 ,
x
cuya solución es:
2x
u 1 = e 2x ¶ e −2x e 2 dx = e 2x − x1 + C 1 .
x
Tenemos ahora que (D - 2)y = e 2x − x1 + C 1 , cuya solución es:
y = e 2x ¶ e −2x e 2x − 1x + C 1 dx = e2x[-Lx + C1x + C2].

Ejemplo. Resolver la ecuación diferencial: (D - 1)(D - 2)y = ex.
Solución.
1º) Al resolver P(r) = 0, obtenemos r1 = 1 y r2 = 2.
2º) Como (D - 1)(D - 2)y = ex, llamamos u1 = (D - 2)y, y resolvemos:
(D - 1)u1 = ex,
cuya solución es:
u 1 = e x ¶ e −x e x dx = e x (x + C 1 ).
Tenemos ahora que (D - 2)y = e x (x + C 1 ), cuya solución es:
y = e 2x ¶ e −2x e x (x + C 1 )dx = e 2x [−(x + C 1 )e −x − e −x + C 2 ].
APLICACIÓN A ALGUNAS ECUACIONES DE COEFICIENTES VARIABLES. Aun cuando el

éxito del método de reducción radica principalmente en las ecuaciones de coeficientes constantes, por ser
precisamente en ellas donde los operadores P(D) cumplen la propiedad conmutativa y asociativa, pueden
en ocasiones aplicarse con éxito a ecuaciones de coeficientes variables especialmente cuando se conoce
una descomposición en factores lineales del operador del primer miembro. Claro es que en tales casos hay
que tener cuidado de no asociar ni permutar tales operadores.
Para centrarnos, consideremos la ecuación diferencial lineal de segundo orden
a2(x)y" + a1(x)y' + a0(x)y = g(x),
y supongamos que se puede separar el miembro de la izquierda en dos operadores lineales P1(D) y P2(D)
de modo que
P1(D)[P2(D)y] = g(x),
entonces, haciendo P2(D)y = u(x), tenemos la edo lineal de orden uno P1(D)u = g(x). Calculado "u", sólo
nos queda resolver la edo lineal de orden uno P2(D)y = u(x), para obtener "y".
Ejemplo. Resolver la ecuación diferencial: (D² - 3x D + 32 )y = 2x - 1.

x
Solución. La ecuación propuesta es equivalente a
D(D - 3x )y = 2x - 1.
Haciendo (D - 3x )y = u1 se tiene Du1 = 2x - 1, por tanto
u1 = x² - x + K.
Ahora bien (D - 3x )y = x² - x + K, que es una ecuación diferencial lineal de primer orden cuya solución
es
y = C1x + C2x3 + x2(1 + xLx).

1. (D² + 5D + 6)y = e-2x(sec²x)(1 + 2tgx).
2. (D² + 1)y = xe3x.
3. (D² + 4)y = 4sec²2x.
4. (D² + 2)y = ex + 2.
5. (D² - 1)y = exsenx.
6. (D² - 1)y = -2senx + 4xcosx.
7. (D² - 3D + 2)y = sen(e-x).
8. (D² - 1)y = (1 + e-x)-2.
9. (D² + 4)y = x²sen2x.

x
10. [xD² + (1 - x)D - 2(1 + x)]y = e-x(1 - 6x) (En la solución está ¶ ex dx).
11. [(x + 1)D² - (3x + 4)D + 3]y = (3x + 2)e3x.

y
12. x²y" - 4xy' + (6 + 9x²)y = 0. La descomposición es: (D 2 + 9 ) = 0.
x2
13. xy" + 2y' + 4xy = 4 (Hacer el cambio xy = u).

Ecuaciones de Cauchy y Legendre
Definición. Se llama ecuación lineal de Cauchy, a la ecuación diferencial:
(anxnDn + ⋅⋅⋅ + a1xD + a0)y = g(x)
o la más general (ecuación de Legendre)
(an(αx + β)nDn + ⋅⋅⋅ + a1(αx + β)D + a0)y = g(x)
reducible a la anterior tomando αx + β como nueva variable independiente, por lo que sólo integraremos
la primera.
Se reconoce inmediatamente este tipo observando si las potencias de "x" disminuyen como los órdenes
de derivación, aun cuando no sean iguales la potencia y el orden en cada término, pues siempre puede
multiplicarse o dividirse por la potencia de x conveniente.
Resolución. La ecuación de Cauchy se reduce a una ecuación con coeficientes constantes mediante el
cambio de variable independiente x = et.
Ejemplo. Resolver la ecuación diferencial: (x3D3 + 3x2D2 - 2xD + 2)y = 0.
Solución. La transformación x = et, reduce la ecuación a
(Dt3 - 3Dt + 2)y = 0,
cuya solución es:
y = C1et + C2tet + C3e-2t.
Como t = Lx, la solución completa de la ecuación dada es
C3
y = C1x + C2xLx + .
x2
1. (x3D3 + 2xD - 2)y = x².
2. (x²D² - xD + 4)y = cos(Lx) + xsen(Lx).
3. [(x + 2)²D² - (x + 2)D + 1]y = 3x + 4.
4. [(3x + 2)²D² + 3(3x + 2)D - 36]y = 3x² + 4x + 1.
5. x3y"' + xy' - y = 3x4.
6. (x3D3 + 2x2D2)y = x + sen(Lx).
7. (2x + 1)²y" - 2(2x + 1)y' - 12y = 6x.

Ecuaciones cuyo orden puede rebajarse
Si pocos eran los tipos de ecuaciones diferenciales de primer orden integrables por cuadraturas, menos
serán aún los de orden n en general.
No obstante, existen casos sencillos en los que puede rebajarse el orden de una ecuación, es decir,
reducirse su integración a la de otra de orden menos elevado, en particular los casos en que una ecuación
de segundo orden se reduce a una de primero. Consideremos los más interesantes, que son:
1º) ECUACIONES EN LAS QUE FALTA LA "y".
f(x, y', y",..., y(n) = 0.
Resolución. Basta tomar como nueva función incógnita la derivada y' = p para que la ecuación quede
reducida a la de orden n-1
f(x, p, p',..., p(n-1) = 0.
Si sabemos integrar esta ecuación obteniendo
p = φ(x, C1,.., Cn-1),
una nueva integración dará "y" con una nueva constante aditiva. Si es más fácil obtener
x = γ(p, C1,..., Cn-1),
e integrar dy = pdx = pdγ, tendremos la solución general en forma paramétricas.
Ejemplo. Resolver la ecuación diferencial: 2y" - (y')² + 4 = 0.
Solución. La sustitución y' = p reduce la ecuación a
2p' - p² + 4 = 0,
que es una ecuación en variables separables,

2dp
= dx .
p2 − 4
Integrando tenemos,
2(1 + C 1 e 2x )
p= ,
1 − C 1 e 2x
y por una nueva integración, obtenemos
y = 2x - 2L(1 - C1e2x) + C2.

2º) ECUACIONES EN LAS QUE FALTA "x".
f(y, y', y",..., y(n) = 0.
Resolución. Tomaremos como nueva función y' = p y como nueva variable y. Se tendrá:
2
dy’ dp dy dp dy” d2p dp
y” = = = $ p y”’ = $p= 2 + p
dx dy dx dy dy dy dy
Se ve que podemos expresar las derivadas de y mediante las de p con órdenes de derivación rebajados
en una unidad, con lo que la ecuación se transformará en otra del tipo
F(y ,p, p',..., p(n-1) = 0
Integrada ésta, es decir hallada
dy
p = φ(y, C1,..., Cn-1) o sea dx = ,
#(y, C 1 , ..., C n−1 )
se obtiene x = γ(y, C1,..., Cn) por una integración.
d&
Si es más fácil obtener y = ψ(p, C1,..., Cn-1) integraremos dx = p , para hallar x, expresando así la
solución general parametricamente.
Ejemplo. Resolver la ecuación diferencial: y" = (y')3 + y'.
dp dp
Solución. La sustitución y' = p, y" = p reduce la ecuación a: = p2 + 1
dy dy
dp dy
Entonces, = dy, arctg(p) = y + K 1 y p = = tg(y + K 1 ).
p2 + 1 dx
Ahora bien, ctg(y + K1)dy = dx, Lsen(y + K1) = x + K2, y = arcsen(C2ex) + C1.
3º) ECUACIONES EN LAS QUE FALTAN LA y Y LA x: Si se presentan ambas circunstancias

simultáneamente, el problema se simplifica notablemente en especial en las ecuaciones de segundo orden,
que toman entonces la forma siguiente
y" = f(y').
Resolución. Haciendo el cambio y' = p, tenemos:
dp dp dp
= f(p) e dx = ex=¶ + C1
dx f(p) f(p)
pdp pdp
dy = pdx = ey=¶ + C 2,
f(p) f(p)
obteniendo así explícitamente las ecuaciones paramétricas de la solución general en función de la

pendiente p.
Ejemplo. Resolver la ecuación diferencial: y" = (y')3 + y'.
Solución. En este caso tenemos que f(p) = p3 + p = p(p² + 1). Por tanto:
dp L(p 2 + 1)
x=¶ + C = Lp + + C1
p(p 2 + 1) 1
2
dp
y=¶ + C 2 = arctg(p) + C 2
p2 +1
4º) ECUACIONES DE LA FORMA y(n = f(y(n-2). Concretándonos al caso de ecuaciones de segundo

orden, son aquellas que carecen de y' y de x
y" = f(y).
Resolución. Se expresa la integral directamente mediante el siguiente sencillo artificio: multiplicar

ambos miembros por
dy = y'dx
y"y'dx = f(y)dy
e integrando
y’ 2 dy
= ¶ f(y)dy + C 1 e = 2(¶ f(y)dy + C 1 ) .
2 dx
Ecuación diferencial de primer orden de variables separadas. Una nueva integración nos dará
dy
x=¶ + C 2.
2(¶ f(y)dy + C 1 )
Ejemplo. Resolver la ecuación diferencial: y" = y.
Solución.
dy
x=¶ + C 2 = L K 1 y + K 21 y 2 + 1 + C 2.
2(¶ ydy + C 1 )
5º) ECUACIONES HOMOGÉNEAS EN y, y',..., y(n. Entre las ecuaciones cuyo orden puede rebajarse
figuran diversos tipos de ecuaciones homogéneas; el más importante es aquél cuya homogeneidad se
refiere a la función "y" y a sus derivadas; es decir, ecuaciones del tipo:
f(x, y, y',.., y(n) = 0 tal que f(x, λy, λy',.., λy(n) = λkf(x, y, y',.., y(n)
a "k" se le llama grado de homogeneidad (que supondremos > 0). Por tanto la ecuación puede escribirse
y’ y” y (n
y k f x, 1, y , y , ..., y =0
que se satisface para las soluciones de

y’ y” y (n
f x, 1, y , y , ..., y =0
y’
Resolución. La forma de esta ecuación sugiere el cambio y = u (u nueva función). Efectuado dicho
cambio, la ecuación anterior se transforma en otra de orden n-1 en "u"
g(x, u, u',...,u(n-1) = 0.
Integrando esta ecuación obtendremos u = φ(x, C1,.., Cn-1) y sustituyendo en la ecuación de transformación
y’
y = u se obtendrá "y" por una nueva integración
y = C n e ¶ udx
Nota. Toda ecuación lineal homogénea de segundo orden se transforma en otra de Riccati tomando
como nueva función "u" incógnita la derivada logarítmica de la función buscada.
1. y" + (y')2 + 1 = 0.
2. (1 + x2)y" + 2xy' = 2x-3.
3. xy" - y' = - 2x - Lx.
4. y"' + y" = x2.
5. yy" + (y')3 = 0.
6. yy" + (y')2 = 2.
7. yy" = (y')2(1 - y'cosy + yy'seny).
p’
8. (2x3 - 1)y"' - 6x2y" + 6xy' = 0 (y' = p, p = u y u = 1x + 1 es la solución).
v(x )
9. yy" - (y')2 = y2Ly.
10. (x + 2y)y" + 2(y')2 + 2y' = 2 ((y2 + xy)" = 2).

SISTEMAS DE ECUACIONES DIFERENCIALES LINEALES
Resolución con la regla de Cramer
Consideremos un sistema de ecuaciones lineales de coeficientes constantes con tantas ecuaciones como
incógnitas, como por ejemplo:
P11(D)x + P12(D)y + P13(D)z = g1(t)

P21(D)x + P22(D)y + P23(D)z = g2(t)
P31(D)x + P32(D)y + P33(D)z = g3(t)
en las que x = x(t), y = y(t) y z = z(t).
Dicho sistema puede ser resuelto por varios caminos distintos. Nosotros daremos su solución por
medio de las siguientes fórmulas (análogas a las fórmulas de Cramer)
P 11 (D ) P 12 (D ) P 13 (D ) g 1 (t ) P 12 (D ) P 13 (D )
P 21 (D ) P 22 (D ) P 23 (D ) x = g 2 (t ) P 22 (D ) P 23 (D )
P 31 (D ) P 32 (D ) P 33 (D ) g 3 (t ) P 32 (D ) P 33 (D )
P 11 (D ) P 12 (D ) P 13 (D ) P 11 (D ) g 1 (t ) P 13 (D )
P 21 (D ) P 22 (D ) P 23 (D ) y = P 21 (D ) g 2 (t ) P 23 (D )
P 31 (D ) P 32 (D ) P 33 (D ) P 31 (D ) g 3 (t ) P 33 (D )
P 11 (D ) P 12 (D ) P 13 (D ) P 11 (D ) P 12 (D ) g 1 (t )
P 21 (D ) P 22 (D ) P 23 (D ) z = P 21 (D ) P 22 (D ) g 2 (t )
P 31 (D ) P 32 (D ) P 33 (D ) P 31 (D ) P 32 (D ) g 3 (t )
El número de constantes arbitrarias independientes que aparecen en la solución general del sistema
P11(D)x + P12(D)y + P13(D)z = g1(t)

P21(D)x + P22(D)y + P23(D)z = g2(t)
P31(D)x + P32(D)y + P33(D)z = g3(t)
es igual al grado de D en el determinante
P 11 (D ) P 12 (D ) P 13 (D )
P 21 (D ) P 22 (D ) P 23 (D )
P 31 (D ) P 32 (D ) P 33 (D )
Ejemplo. Resolver el sistema

2(D - 2)x + (D - 1)y = et
(D + 3)x + y=0
Solución.
2(D − 2 ) (D − 1 ) e t (D − 1 )
x=
(D + 3 ) 1 0 1
2(D − 2 ) (D − 1 ) 2(D − 2 ) e t
y=
(D + 3 ) 1 (D + 3 ) 0
o sea
(D² + 1)x = -et y (D² + 1)y = 4et
cuyas soluciones son:

t
x = C1cost + C2sent - e e y = C3cost + C4sent + 2et
2
pero como el grado de D en
2(D − 2 ) (D − 1 )
(D + 3 ) 1
es dos, "x" e "y" deben de depender de dos constantes; entonces sustituyendo "x" e "y" en
(D + 3)x + y = 0,
se tiene
(C2 + 3C1 + C3)cost + (3C2 - C1 + C4)sent = 0
para todo valor de t. Luego
C3 = -(3C1 + C2) y C4 = C1 - 3C2

Resolver los siguientes sistemas de ecuaciones diferenciales lineales:
1. (D - 1)x + Dy = 2t + 1
(2D + 1)x + 2Dy = t
2. (D + 2)x + 3y = 0
3x + (D + 2)y = 2e2t
3. (D - 3)x + 2(D + 2)y = 2sent

2(D + 1)x + (D - 1)y = cost
4. (D² - 2)x - 3y = e2t

(D² + 2)y + x = 0
5. (D + 1)x + (D - 1)y = et
(D² + D + 1)x - (D² - D + 1)y = t²
6. Dx + (D + 1)y = 1
(D + 2)x - (D - 1)z = 1
(D + 1)y + (D + 2)z = 0
7. (D + 1)²x + 2Dy + 3Dz = 1

Dx + z = 0
x - Dy - Dz = 0
8. (D - 1)x + (D + 2)y = 1 + et
(D + 2)y + (D + 1)z = 2 + et
(D - 1)x + (D + 1)z = 3 + et
ENM Matemáticas II Estadística 1
TEMA 5
INTRODUCCIÓN
Población y muestra
Definición.- Se llama población al conjunto que es objeto de la investigación estadística.
Los elementos de la población reciben el nombre de individuos o unidades estadísticas.
Una población puede ser finita o infinita (más de 100.000 individuos).
Definición.- Se llama muestra a cualquier subconjunto de la población. Es imprescindible que la

muestra sea representativa para poder obtener conclusiones acerca de la población.
Caracteres de una población: Variables y atributos
Definición.- Se llaman caracteres de los elementos de una población, a las cualidades que son objeto
del estudio estadístico. Ejemplos: El sexo, el estado civil, el número de hijos, el peso, etc.
Definición.- Se llaman modalidades a los diferentes valores del carácter. Ejemplos:
Caracteres Modalidades
Sexo: Varón, hembra.
Estado civil: Soltero, casado, viudo, separado...
Número de hijos: 0, 1, 2, ...
Peso: .... 45,3 kg, ... 57 kg,...
Los caracteres se dividen en cualitativos o atributos y cuantitativos o variables.
Caracteres cualitativos o atributos. Un carácter se dice cualitativo si sus diversas modalidades no

son medibles. Ejemplos: El sexo, el estado civil, etc.
Notación.- Los caracteres cualitativos se representan por las primeras letras mayúsculas del alfabeto
(A, B, C, ...); las distintas modalidades se representan con la correspondiente letra minúscula afectada por
un subíndice (ai, bi, ci, ....).
Caracteres cuantitativos o variables. Un carácter se dice cuantitativo si sus diversas modalidades son
medibles. Ejemplos: El número de hijos, el peso, etc.
Notación.- Los caracteres cuantitativos se representan por las últimas letras mayúsculas del alfabeto
(..., X, Y, Z), los distintos valores que toman se representan con la correspondiente letra minúscula
afectada por un subíndice de orden (xi, yi, zi, ....).
Definición.- Se denomina variable estadística al conjunto de valores numéricos que puede tomar un
carácter cuantitativo.
Las variables estadísticas pueden ser discretas o continuas.
Variable discreta. Una variable es discreta si toma un número finito de valores o infinito numerable.
Ejemplos:
El número de hijos.
El número de piezas defectuosas de un lote de 1.000.
El número de obreros de una obra en construcción.
Variable continua. Una variable estadística se dice que es continua, si puede tomar, al menos
teóricamente, todos los valores posibles dentro de un cierto intervalo de R. Ejemplos:
El peso.
El diámetro de una pieza.
La temperatura de un cuerpo.
La velocidad de un automóvil.
Resumiendo
 Atributos (Modalidades no medibles)


Caracteres   Discretas
 Variables (Modalidades medibles)  Continuas
 
FRECUENCIAS, TABLAS Y GRÁFICOS
Frecuencia absoluta y relativa
Definición.- Sea X una variable estadística que toma los valores x1, x2, ...., xn, ....,. Se llama frecuencia
absoluta de xi, y la representaremos por ni, al número de veces que se ha presentado xi.
Definición.- Se llama frecuencia relativa de xi, y se representa por fi, al cociente entre la frecuencia
n
absoluta ni y el número total de observaciones N. Es decir: f i = i .
N
Observación.- Para el caso de caracteres cualitativos, las definiciones de frecuencia absoluta y relativa
son análogas.
De las definiciones se deduce: n i = N y f i =1.

i i
Definición.- Se llama frecuencia absoluta acumulada de xi a
Ni = n1 + ⋅⋅⋅ + ni.
Definición.- Se llama frecuencia relativa acumulada de xi a
Fi = f1 + ⋅⋅⋅ + fi.
Definición.- Se llama distribución de frecuencias a una tabla que contiene cada una de las modalidades
del carácter a estudio con su frecuencia absoluta.
Ejemplo: Las puntuaciones obtenidas en Matemáticas por los 50 alumnos de una clase son:
X ni
0 3
1 4
2 6
3 6
4 5
5 7
6 4
7 5
8 4
9 3
10 3
N= 50
Cuando la variable es de tipo continuo, o cuando el número de valores distintos que toma la variable es
muy grande (mayor de 30), conviene efectuar agrupaciones de dichos valores en intervalos de clase, que
vienen definidos por un límite inferior (Li-1) y un límite superior (Li), siendo la diferencia entre el límite
superior e inferior la amplitud (ci) de cada clase.
Así, por ejemplo, considerando la edad de los 1.000 habitantes de un pueblo, al ser muy grande el
número de valores distintos que toma la variable (edad), se pueden agrupar en intervalos de clase de
amplitud 5, resultando
X ni
[0,5) 75
[5,10) 93
[10,15) 105
[15,20) 86
[20,25) 75
[25,30) 62
[30,35) 45
[35,40) 64
[40,45) 73
[45,50) 48
[50,55) 94
[55,60) 32
[60,65) 56
[65,70) 40
[70,75) 28
[70,80] 24
N= 1.000
Los intervalos pueden elegirse de distinta amplitud. Si los 500 alumnos de un centro calificados de 0 a
10 los queremos expresar con arreglo a suspensos, aprobados, notables y sobresalientes, formaríamos la
tabla
X ni
[0,5) 150
[5,7) 175
[7,9) 125
[9,10] 50
N= 500
L + L i−1
Definición.- Se llama marca de clase al punto medio de cada intervalo de clase: x i = i . La
2
marca de clase se toma como valor representativo del intervalo de clase y juega el papel de xi en una
distribución de variable discreta.
X xi ni
[0,5) 2,5 150
[5,7) 6 175
[7,9) 8 125
[9,10] 8,5 50
N= 500
Representaciones gráficas
Diagrama de Barras: Se obtiene construyendo barras rectangulares de altura igual o proporcional a la

frecuencia de cada modalidad.
El diagrama de barras se puede utilizar para caracteres cualitativos y cuantitativos.
Ejemplo. Los alumnos matriculados en la Facultad de Ciencias de una Universidad por Secciones es:
Sección Número matriculados

Químicas 1.500
Matemáticas 750
Físicas 1.000
Biológicas 500
Geológicas 250
4.000
El diagrama de barras correspondiente es
1600
1400
1200
1000
800
600
400
200
Q M F B G
Un caso particular de los diagramas de barras son los gráficos de Pareto. La única diferencia con los
diagramas de barras es que estas se ordenan de izquierda a derecha de mayor a menor frecuencia.
1600
1400
1200
1000
800
600
400
200
Q F M B G
Gráfico de Sectores: Se obtiene dividiendo un círculo (o semicírculo) en sectores circulares cuyas

áreas sean proporcionales a las frecuencias absolutas de cada modalidad. Se puede utilizar para caracteres
cualitativos y cuantitativos.
Considerando el ejemplo anterior y teniendo en cuenta que el círculo queda dividido en 360º, se
averigua con una sencilla regla de tres los grados correspondientes a cada sector (360º⋅fi), obteniendo:
M
G
B
F
Histogramas. Estas representaciones gráficas sólo son válidas para el caso de variables cuantitativas
continuas. Son representaciones gráficas por áreas. Sobre el eje de abscisas se marcan los extremos de los
intervalos de clases de la variable continua y se levantan rectángulos, de base los intervalos y de altura tal,
que el área del rectángulo sea igual o proporcional a la respectiva frecuencia absoluta o relativa, según sea
el histograma de frecuencias absolutas o de frecuencias relativas.
Ejemplo. Los salarios anuales en miles de euros de las 60 personas que trabajan en la empresa MNE,
son:
Salarios ni
[0,10) 13
[10,20) 15
[20,30) 20
[30,40) 8
[40,50] 4
El histograma de frecuencias es:

Histograma
22
20
18
16
14
12
10
0
10 20 30 40 50
Polígono de Frecuencias. Se obtiene uniendo los puntos medios de los lados superiores de los
rectángulos levantados en el histograma de frecuencias; la resultante es una línea quebrada (ver figura).
1. En las pruebas de selectividad, los alumnos de un centro obtuvieron las siguientes puntuaciones:
Puntuaciones Nº alumnos
0 3
1 7
2 10
3 15
4 23
5 18
6 15
7 9
8 5
Se pide:
a) Completar la tabla con las columnas de la frecuencia relativa, frecuencia acumulada absoluta y
frecuencia acumulada relativa.
b) Dibujar el diagrama de barras.
2. Las temperaturas en grados registradas en España durante el verano por 60 estaciones meteorológicas
han sido las siguientes:
Temperaturas Nº Estaciones
[12,15) 5
[15,18) 6
[18,21) 8
[21,24) 12
[24,27) 18
[27,30) 7
[30,33] 4
Se pide:
a) Completar la tabla con las columnas de la marca de clase, frecuencia relativa, frecuencia
acumulada absoluta y frecuencia acumulada relativa.
b) Dibujar el histograma de frecuencias y polígono de frecuencias.
MEDIDAS DE TENDENCIA CENTRAL
Moda
Definición.- Se llama moda de una distribución de frecuencias al valor de la variable de mayor

frecuencia. Se representa por Mo.
En el caso de variable discreta, la moda es el valor de la variable correspondiente a la máxima

frecuencia (pueden existir varias modas).
En el caso de variable continua, en vez de moda se tiene clase modal. La clase modal es el intervalo
nj
afectado del máximo cociente c j .
Mediana
Definición.- Se llama mediana al valor de la variable que divide a la muestra (o población) en dos
partes con el mismo número de elementos, suponiendo los datos ordenados de menor a mayor. Se
representa por Me.
Cálculo caso variable discreta. 1º) Formamos la columna Ni:
xi ni Ni
x1 n1 N1
⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅ ⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅ ⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅
xj-1 nj-1 Nj-1
xj nj Nj
xj+1 nj+1 Nj+1
⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅ ⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅ ⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅
xm nm Nm
2º) Calculamos N .
2
3º) En la columna de las Ni buscamos N , pudiendo presentarse dos casos:
2
 N < N <N uM =x
 j−1 2 j e j
 x j−1 + x j
 N j−1 = N < N j u M e =
 2 2
Ejemplo. Calcular la mediana en la siguiente distribución:
xi ni Ni
0 14 14
1 10 24
2 15 39
3 26 65
4 20 85
5 15 100
Hallamos: N = 100 = 50; N j−1 < N < N j ; 39 < 50 < 65; luego: Me = xj = 3
2 2 2
Ejemplo. Calcular la mediana de la siguiente distribución:
xi ni Ni
10 5 5
11 18 23
12 17 40
13 12 52
14 15 67
15 13 80
Hallamos: N = 80 = 40; N j−1 = N < N j ; 40 = 40 < 52; luego: M e = 12 + 13 = 12, 5

2 2 2 2
Cálculo caso variable continua. 1º) Formamos la columna Ni:
Intervalos ni Ni
[L0, L1) n1 N1
⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅ ⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅ ⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅
[Lj-2, Lj-1) nj-1 Nj-1
[Lj-1, Lj) nj Nj
[Lj, Lj+1) nj+1 Nj+1
⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅ ⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅ ⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅
[Lm-1, Lm] nm Nm
2º) Calculamos N .
2
3º) En la columna de las Ni buscamos N , entonces:
2
N −N
j−1
Si N j−1 [ N < N j ⇒ M e = L j−1 + 2 n j $ cj
2
Ejemplo. Calcular la mediana de la siguiente distribución:
Intervalos ni Ni
[0,1) 10 10
[1,2) 12 22
[2,3) 12 34
[3,4) 10 44
[4,5] 7 51
Como: N = 51 = 25, 5; N j−1 [ N < N j ; 22 [ 25, 5 < 34, entonces:

2 2 2
N −N
j−1 25, 5 − 22
M e = L j−1 + 2 n j $ cj = 2 + $ 1 = 2, 29
12
Cuartiles, deciles y percentiles
Los cuartiles, deciles y percentiles, al igual que la mediana, son medidas de posición y en conjunto se las
suele denominar cuantiles.
Cuartiles. Si ordenamos la muestra (o población) de menor a mayor, y dividimos la muestra en 4

partes con el mismo número de elementos, tenemos los cuartiles. Habrá un total de 3 cuartiles.
Su cálculo se efectúa siguiendo el mismo procedimiento que con la mediana, tomando en este caso kN
4
con k = 1, 2, 3.
Deciles. Si ordenamos la muestra (o población) de menor a mayor, y dividimos la muestra en 10 partes

con el mismo número de elementos, tenemos los deciles. Habrá un total de 9 deciles.
10
con k = 1, 2, ... 9.
Percentiles. Si ordenamos la muestra (o población) de menor a mayor, y dividimos la muestra en 100

partes con el mismo número de elementos, tenemos los percentiles. Habrá un total de 99 percentiles.
100
con k = 1, 2, ..., 99.
Media aritmética
Definición.- Sea la variable discreta X, que toma los valores x1, x2, ..., xm con frecuencias n1, n2, ..., nm
(de un total de N observaciones), se llama media aritmética a:
m
x n + $ $ $ +x n x ini m
x = 1 n11 + $ $ $ +nmm m = i=1 = xifi
N i=1
La media aritmética es un valor que representa a un conjunto de valores.
Ejemplo. Las calificaciones de 476 alumnos de un Colegio, vienen dadas en la tabla adjunta. Calcular
la nota media.
xi ni
0 15
1 28
2 36
3 63
4 90
5 84
6 51
7 27
8 34
9 30
10 18
N = 476
x = 0 $ 15 + 1 $ 28 + $ $ $ +10 $ 18 = 2.286 = 4, 8
476 476
Cuando los datos están agrupados en intervalos de clases, siendo la variable de tipo continuo, las clases
se representan por su marca de clase xi, definiéndose la media aritmética de forma análoga al caso de
variable discreta.
Ejemplo. Dada la distribución de frecuencias adjunta, calcular la media aritmética.
Intervalos xi ni
[0,10) 5 5
[10,20) 15 7
[20,30) 25 3
[30,40] 35 12
N= 27
x = 5 $ 5 + 15 $ 7 + 25 $ 3 + 35 $ 12 = 625 = 23, 15
27 27
Propiedades de la media aritmética
1. Si y = ax + b, entonces: y = ax + b.
2. La media de la diferencia de una variable a su media es cero.
Media aritmética ponderada
Definición.- Sea la variable discreta X, que toma los valores x1, x2, ..., xm con coeficientes de
ponderación o pesos w1, w2, ..., wm, se llama media aritmética ponderada a:
x 1 w 1 + $ $ $ +x m w m
xp = w 1 + $ $ $ +w m
Ejemplo. En la E.N.M. la nota de conocimiento Nc, de cada asignatura se obtiene de la forma:

x 1 c 1 + ... + x m c m
Nc = c 1 + ... + c m
donde xi es la nota obtenida en la evaluación i-ésima y ci es el coeficiente correspondiente.
1. Consultados 350 matrimonios sobre la edad de la esposa, se ha confeccionado la siguiente tabla

Edad esposa Nº matrimonios
[15,20) 23
[20,25) 28
[25,30) 76
[30,35) 54
[35,40) 60
[40,50) 42
[50,60) 36
[60,70] 31
Calcular: Media, percentil 50 y clase modal.
2. Cierto profesor de Matemáticas de una Universidad, a la hora de la puntuación final, calificaba a sus
alumnos siguiendo el criterio: Suspensos: 40%; Aprobados: 30%; Notables: 15%; Sobresalientes:
10%; Matrículas: 5%. Si las notas obtenidas por sus alumnos vienen dadas en la tabla adjunta
Notas Nº alumnos
[0,1) 36
[1,2) 74
[2,3) 56
[3,4) 81
[4,5) 94
[5,6) 70
[6,7) 41
[7,8) 28
[8,9) 16
[9,10] 4
Calcular los intervalos de: Suspenso, Aprobado, Notable, Sobresaliente y Matrícula.

MEDIDAS DE DISPERSIÓN, ASIMETRÍA Y APUNTAMIENTO
Introducción
Para completar la información que pueda deducirse de la media aritmética y para evitar falsas
interpretaciones, es necesario acompañar este promedio con un coeficiente que nos mida el grado de
dispersión de la distribución de la variable.
Varianza y desviación típica
Definición.- Sea la variable discreta X, que toma los valores x1, x2, ..., xm con frecuencias n1, n2, ..., nm
(de un total de N observaciones), se llama varianza de X a:
m m
n i (x i − x) 2 n i x 2i
s 2x = = − x2
i=1 i=1
N N
En caso de una distribución continua, xi representa la marca de clase.
Nota: También se suele representar por σx2.
Definición.- Se llama desviación típica a la raíz cuadrada de la varianza. Se designa por sx o por σx.
Su fórmula es:
m m
n i (x i − x) 2 n i x 2i
sx = = −x
i=1 i=1 2
N N
Ejemplo. Las calificaciones obtenidas por dos alumnos de 2º de Bachillerato en las evaluaciones de
matemáticas han sido:
alumno A: 1-3-5-7-9
alumno B: 2-3-4-8-8
¿qué alumno posee más dispersión en las calificaciones?
Alumno A: x = 1 + 3 + 5 + 7 + 9 = 5
5
(1 − 5 ) 2 + (3 − 5 ) 2 + (5 − 5 ) 2 + (7 − 5 ) 2 + (9 − 5 ) 2
s 2x = = 8 e s x = 8 l 2, 83
5
Alumno B: x = 2 + 3 + 4 + 2 $ 8 = 5
5
(2 − 5 ) 2 + (3 − 5 ) 2 + (4 − 5 ) 2 + 2(8 − 5 ) 2
s 2x = = 6, 4 e s x = 6, 4 l 2, 53
5
Al ser mayor la desviación típica de las calificaciones del alumno A que las del B, existe mayor
dispersión en éste que en aquél; o lo que es lo mismo, las notas de B son más homogéneas que las de A.
Propiedad de la varianza. Si y = ax + b, entonces: sy2 = a2sx2.

Otras medidas de dispersión
Definición.- Se llama recorrido de X a la diferencia entre los valores máximo y mínimo de la variable.
Se designa por R.
Para comparar las dispersiones de dos o más distribuciones en las que las variables de las distribuciones
vienen expresadas en unidades distintas, no debe utilizarse la desviación típica para medir la dispersión de
ambas distribuciones, sino una medida de dispersión en números abstractos que se denomina coeficiente
de variación de Pearson.
Definición.- Se llama coeficiente de variación de X a:

sx
CV = $ 100
x
Este coeficiente no se puede utilizar cuando x = 0.
Ejemplo. Los vecinos de una finca urbana se han tallado y pesado, obteniendo los siguientes resultados:
Talla Peso
x = 1, 68 m. y = 68, 5 kg.
s x = 0, 5 m. s y = 6, 5 kg.
¿dónde existe mayor dispersión?
0, 5
CV(tallas) = $ 100 = 29, 76
1, 68
6, 5
CV(pesos) = $ 100 = 9, 49
68, 5
existe mayor dispersión en las tallas que en los pesos o, lo que es lo mismo, los pesos están más
concentrados que las tallas o que la variabilidad en la talla es mayor que en el peso.
También es útil aplicar el coeficiente de variación CV cuando las medias de dos distribuciones se
diferencian mucho, aunque estén medidas en la misma clase de unidades.
Ejemplo. Se ha aplicado un mismo test a dos grupos de alumnos A y B. Los resultados obtenidos han
sido:
 x = 38  y = 53
Grupo A  Grupo B 
 sx = 7  sy = 9
¿qué grupo tiene mayor dispersión?
Aparentemente diríamos que el grupo B tiene mayor dispersión en los resultados que el grupo A, ¿es
cierto? Hallamos los coeficientes de variación de Pearson para los dos obteniendo:
CV(grupo A) = 7 $ 100 = 18, 42

38
CV(grupo B) = 9 $ 100 = 16, 98
53
La apreciación primera no es cierta, habiendo mayor dispersión en los resultados del grupo A que en
los del grupo B.
m
ni xi − x
Definición.- Se llama desviación media de X a: DM x = i=1
.
N
Momentos
Definición.- Se llama momento de orden r œ N respecto al origen a:

m
n i x ri
r = i=1
N
Casos particulares:
α0 = 1, α1 = x
Definición.- Se llama momento de orden r œ N respecto a la media o momento central de orden r a:

m
n i (x i − x) r
r =
i=1
N
Casos particulares:
µ0 = 1, µ1 = 0, µ2 = s2
Proposición.- µ2 = s2 = α2 - α12
Medidas de asimetría
Simetría y asimetría. Una distribución de frecuencias es simétrica cuando lo es su representación

gráfica o, lo que es lo mismo, cuando son iguales las frecuencias correspondientes a valores de la variable
equidistantes de un valor central.
En toda distribución simétrica unimodal, se verifica tanto en el caso discreto como en el caso continuo
que:
x = Mo = Me
Cuando esto no ocurre, la distribución es asimétrica. Hay dos clases de asimetría.
a) Se dice que la distribución es asimétrica a la derecha o positiva, cuando las frecuencias descienden
más lentamente por la derecha que por la izquierda o, lo que es lo mismo, en la representación gráfica la
rama de la derecha es más larga que la de la izquierda respecto de la moda.
Se verifica que x > M o
b) Se dice que la distribución es asimétrica a la izquierda o negativa, cuando las frecuencias descienden
más lentamente por la izquierda que por la derecha o, lo que es lo mismo, en la representación gráfica la
rama de la izquierda es más larga que la de la derecha respecto de la moda.
Se verifica que x < M o
Coeficiente de asimetría. Se designa por γ1 y se define como:

3
1 =
s3
 1 > 0 hay asimetría a la derecha o positiva.

Si  1 = 0 hay simetría.
 < 0 hay asimetría a la izquieda o negativa.
 1
Apuntamiento o curtosis
Coeficiente de apuntamiento o curtosis. Se designa por γ2 y se define como:

4
2 = −3
s4
Las medidas de apuntamiento o curtosis se refieren a la frecuencia de los valores centrales. El grado de
apuntamiento lo es con respecto a la distribución normal (que se verá posteriormente), cuya gráfica recibe
el nombre de campana de Gauss y es de la forma:
La comparación hay que hacerla con una distribución normal que tenga la misma media y desviación
típica que la dada.
 2 > 0 la distribución es más apuntada que la normal y se denomina leptocúrtica.


Si  2 = 0 la distribución es igual de apuntada que la normal y se denomina mesocúrtica.
 < 0 la distribución es menos apuntada que la normal y se denomina platicúrtica.
 2
leptocúrtica mesocúrtica platicúrtica

Señalaremos finalmente, que, en general, es escasa la significación práctica de este coeficiente de
apuntamiento o curtosis.
1. La tabla adjunta nos da el peso de 90 personas
Intervalos Nº personas
[40,50) 7
[50,60) 12
[60,65) 18
[65,70) 22
[70,75) 13
[75,80) 10
[80,90) 5
[90,100] 3
Calcular: La desviación típica, la desviación media, el recorrido y el coeficiente de asimetría.
2. Las calificaciones obtenidas en Matemáticas por dos grupos de alumnos, ha dado como resultado
Grupo 1: x = 5, 5; s x = 0, 7
Grupo 2: y = 6, 3; s y = 0, 5
¿qué grupo tiene mayor variabilidad?
3. Dada la siguiente distribución de frecuencias
x i ni
1 3
2 10
3 4
4 2
5 1
Calcular: Los coeficientes de asimetría y el apuntamiento.

DISTRIBUCIONES BIDIMENSIONALES
Distribución de frecuencia bidimensional
Definición.- Se llama distribución conjunta de frecuencias de dos variables X e Y a una tabla en

donde se representan los valores observados de cada variable y las frecuencias absolutas de cada par.
X/Y y1 y2 . . . yj . . . ym ni*
x1 n11 n12 . . . n1j . . . n1m n1*
x2 n21 n22 . . . n2j . . . n2m n2*
...............................
xi ni1 ni2 . . . nij . . . nim ni*
...............................
xr nr1 nr2 . . . nrj . . . nrm nr*
n*j n*1 n*2 . . . n*j . . . n*m N
Ejemplo. Se consideran 30 alumnos de una clase y se les pesa y se les pregunta la edad, obteniéndose
la siguiente distribución de frecuencia:
Edad
X/Y 9 10 11 12 ni*
22 1 1
P
27 2 1 1 4
e
32 1 3 4 2 10
s
37 2 3 5 10
o
42 1 4 5
n*j 4 6 9 11 30
En cada casilla aparece la frecuencia absoluta nij correspondiente al par (xi, yj). Por ejemplo, n32 = 3
representa que con 32 kg y 10 años hay 3 alumnos. Es evidente que Snij = N es el número de pares
estudiados. Si denotamos por fij = nij/N la frecuencia relativa del par (xi, yj), tenemos que Sfij = 1.
Definición.- Se llama distribución marginal de una variable a la que se obtiene al estudiar esa
variable con independencia de las demás. Por ejemplo la distribución marginal de X es:
X ni*
22 1
27 4
32 10
37 10
42 5
30
Definición.- Se llama distribución condicionada de Y por X = xi a la distribución de frecuencias que

se obtiene considerando únicamente las frecuencias de Y correspondientes a X = xi. Por ejemplo la
distribución de frecuencia de Y condicionada por x3 = 32 es:
Y 9 10 11 12
1 3 4 2 10
f(x i , y j )
Se verifica que f(yj/xi) = si f(xi) > 0.
f(x i )
X
Definición.- Se llama vector de medias de la variable bidimensional (X, Y) a: .
Y
Definición.- Recibe el nombre de covarianza de la variable bidimensional (X, Y) a:

expresión matricial
i,j n ij (x i − x )(yj − y )
s xy = 1 (x − x )(n )(y − y )
= N i ij j
N
Definición.- Se llama matriz de covarianzas a la matriz:
s 2x s xy
s xy s 2y
La matriz de covarianzas es simétrica y semidefinida positiva.
Ejercicio. Calcular las medias, desviaciones típicas y covarianza de las distribuciones de X e Y, en la

tabla del ejemplo anterior.
Coeficiente de correlación
Definición.- Se llama coeficiente de correlación de X e Y a:

s xy
r = sxsy
"r" es una medida de la relación entre las variables y -1 § r § 1.
Interpretación del coeficiente de correlación.
 r ¬ !1, la correlación entre las variables es muy grande.

Si 
 r ¬ 0, apenas existe correlación entre las variables.
1. Dada la siguiente distribución bidimensional

xi yi
100 12
120 10
125 6
130 3
150 2
Calcular r.
2. La calificación obtenida por 10 alumnos al aplicarles dos test, ha sido la siguiente:

Alumno Test 1 Test 2
A1 2 5
A2 7 8
A3 8 10
A4 9 12
A5 10 12
A6 12 14
A7 14 15
A8 10 16
A9 16 18
A10 12 20
Calcular r.
3. Dada la distribución bidimensional siguiente

X/Y 1 2 3 4 5 6
[35,40) 1 1 1
[40,45) 2 2 2 1 1
[45,50) 1 2 5 4 1
[50,55) 3 6 4
[55,60) 1 3 4 6
Calcular r.
PROBABILIDAD
Espacio muestral y sucesos
Definición.- Decimos que un fenómeno es aleatorio cuando al repetirlo en las mismas condiciones no
podemos predecir su resultado.
Ejemplos. Lanzar una moneda al aire y anotar el resultado.

La extracción de una carta de una baraja.
Lanzar un dado al aire y anotar el resultado.
Definición.- Se llama espacio muestral al conjunto de todos los resultados posibles de un experimento
aleatorio. Lo denotamos por E.
Ejemplos. El espacio muestral asociado al experimento aleatorio del lanzamiento de un dado y anotar
la cara superior es:
E = {1, 2, 3, 4, 5, 6}
El espacio muestral asociado al experimento aleatorio del lanzamiento de dos monedas y anotar las
caras superiores es:
E = {(c, c), (c, +), (+, c), (+, +)}
Los espacios muestrales pueden ser de dos tipos:

1. Espacios discretos. Son aquellos que contienen un número finito o infinito numerable de elementos.
2. Espacios continuos. Son aquellos que tienen la potencia del continuo.
Definición.- Se llama suceso a todo subconjunto de E.
Los sucesos definidos por los conjuntos « y E se llaman suceso imposible y seguro respectivamente.
Los sucesos formados por un sólo elemento de E se llaman sucesos elementales.
Ejemplos. En el espacio muestral E = {1, 2, 3, 4, 5, 6}, son ejemplos de sucesos:

Salir impar: I = {1, 3, 5}. Salir par: P = {2, 4, 6}. Salir múltiplo de 3: A = {3, 6}.
En el espacio muestral E = {(c, c), (c, +), (+, c), (+, +)}, son ejemplos de sucesos:
Salir al menos una cara: A = {(c, c), (c, +), (+, c)}. Salir dos caras: B = {(c, c)} (suceso elemental).
Definición.- Se llama espacio de sucesos, al conjunto formado por todos los sucesos del espacio
muestral E. Se representará por P(E).
Ejemplos. Si E = {c, +}, el espacio de sucesos es P(E) = {«, E, {c}, {+}}.
Definición.- Dado un conjunto A, se llama cardinal de A y se representa por Card(A), al número de

elementos que tiene el conjunto A.
Proposición.- Si Card(E) = n, entonces: card(P(E)) = 2n.

1. Se lanza una moneda tres veces. Escribir el espacio muestral relativo a este experimento aleatorio y
el suceso A consistente en que el número de caras es mayor que el número de cruces.
2. Una caja contiene cuatro bolas blancas y tres negras. Se extrae dos bolas de la caja. Describir el
espacio muestral:
a) Cuando las bolas del mismo color se distinguen porque están numeradas.
b) Cuando las bolas del mismo color no se distinguen porque no van numeradas.
3. Hallar el espacio muestral que resulta de lanzar dos monedas y escribir el espacio de sucesos.
4. ¿Cuántos elementos tiene el espacio de sucesos P(E) correspondiente al experimento de lanzar un

dado?
Operaciones con los sucesos
Denotaremos por A a un conjunto de sucesos aleatorios asociados a E. A Œ P(E) y sean A, B œ A.
Definición.- Se dice que A está contenido en B, y se escribe A Õ B, cuando siempre que ocurra A
ocurre B.
Definición.- Se dice que A y B son iguales si A Õ B y B Õ A.
Definición.- Se llama unión de A y B, al suceso:
A»B = {x ∈ E | x ∈ A o x ∈ B}.
Definición.- Se llama intersección de A y B, al suceso:
A…B = {x ∈ E | x ∈ A y x ∈ B}
Definición.- Se llama suceso contrario de A, al suceso:
A = {x ∈ E | x ∉ A}
El « y E son sucesos contrarios.
Definición.- Se dice que A y B son sucesos incompatibles, si A…Β = «.
Los sucesos A y A son incompatibles.
Definición.- Se llama suceso diferencia de A y B, al suceso:
A - B = {x ∈ E | x ∈ A y x ∉ B}
Definición.- Los sucesos A1, A2, ...., An œ A son mutuamente excluyentes si:
Ai…Aj = « si i ≠ j.
s-álgebra de los sucesos A
Definición.- Decimos que A Œ P(E) es una s-álgebra si verifica:
1. E œ A.
∞
2. Si A1, A2, ...An,... œ A fl 4 A i œ A.
i=1
3. Si A œ A fl A œ A.
Definición.- Se llama espacio probabilizable, al par (E (espacio muestral), A (s-álgebra)).
Propiedades de (A, », …, ):
ÁLGEBRA DE BOOLE
OPERACIONES DEFINIDAS EN A
A, B, C ∈ A
Unión Intersección
Asociativa (A»B)»C = A»(B»C) (A…B)…C = A…(B…C)
Conmutativa A»B = B»A A…B = B…A
Idempotente A»A = A A…A = A
A»(B…A) = A
Simplificativa
A…(B»A) = A
A»(B…C) = (A»B)…(A»C)
Distributiva
A…(B»C) = (A…B)»(A…C)
Elementos neutros A…E = A, A»« = A
Complementación A»A = E; A…A = «
Además de las propiedades anteriores, son muy utilizadas las siguientes, que son conocidas con el
nombre de leyes de De Morgan:
a) A 4 B = A…B
b) A 3 B = A»B
Definición.- Se dice que A1, A2, ...., An œ A es un sistema exhaustivo de sucesos si:
A1»A2» ... »An = E
Definición.- Se dice que A1, A2, ...., An œ A es un sistema completo de sucesos si:
a) ∀i, Ai ≠ «.
b) A1»A2» ... »An = E.
c) Ai…Aj = « si i ≠ j.
Frecuencias
Sea A œ A, es decir, un subconjunto del espacio muestral E relativo a un experimento aleatorio. Si se

realiza N veces dicho experimento y el suceso A aparece nA veces, se dice que:
La frecuencia absoluta del suceso A es nA.
nA
La frecuencia relativa del suceso A es f(A) =
N.
Propiedades de las frecuencias relativas
1. 0 § f(A) § 1.
2. Si A y B son incompatibles: f(A»B) = f(A) + f(B).
3. f(E) = 1.
Definición axiomática de probabilidad (Kolmogorov)
Sea (E, A) un espacio probabilizable.
Definición.- Se llama probabilidad a toda aplicación P: A → R verificando los axiomas:
Ax. 1º: P(A) ¥ 0 " A œ A.

∞ ∞
Ax. 2º: Si A1, A2, ..., An,... œ A y Ai…Aj = « si i ≠ j, entonces: P 4
i=1
Ai = P(A i ).
i=1
Ax. 3º: P(E) = 1.
Definición.- Se llama espacio de probabilidad o probabilístico a la terna (E, A, P).
Teoremas que se deducen de la definición axiomática de probabilidad
1. P(«) = 0.
n n
2. Si A1, A2, ..., An œ A y Ai…Aj = « si i ≠ j, entonces: P 4
i=1
Ai = P(A i ).
i=1
3. P(A) + P(A) = 1 " A œ A.
4. P(A»B) = P(A) + P(B) - P(A…B) " A, B œ A.
5. P(A»B»C) = P(A) + P(B) + P(C) - P(A…B) - P(A…C) - P(B…C) + P(A…B…C) " A, B, C œ A.
6. Si A, B œ A y A ⊂ B, entonces: P(A) ≤ P(B).
7. P(A) § 1 " A œ A.
Definición clásica de probabilidad
Hay fenómenos aleatorios, como el lanzamiento de dos dados, de monedas, etc., en que por razones de
simetría y regularidad se puede suponer que todos los sucesos elementales tienen igual probabilidad de
presentarse. En estos casos es útil la definición de probabilidad de Laplace:
Definición.- La probabilidad de un suceso A, en el supuesto de que todos los sucesos elementales sean
igual de probables, es:
P(A) = número de casos favorables al suceso A

número de casos posibles
Según esta definición, la probabilidad del suceso imposible es 0, y la del suceso seguro es 1. Los
demás sucesos tienen una probabilidad que varía entre 0 y 1.
Para contar el número de casos posibles y favorables necesitamos recordar la combinatoria.
Combinatoria
Fórmulas de las VARIACIONES sin repetición y con repetición:
V nm = m! VR nm = m n
(m − n)!
Fórmulas de las PERMUTACIONES sin repetición y con repetición:
P n = n! PR m
,,...,
= m! donde + + $ $ $ + = m
!!...!
Fórmulas de las COMBINACIONES sin repetición y con repetición:
C nm = m m!
n = n!(m − n)! CR nm = m + nn − 1
Definición de Von Mises
Como no se puede aplicar siempre la regla de Laplace, Von Mises dio una definición empírica a partir
de la frecuencia relativa y apoyándose en la ley de estabilidad de las frecuencias.
P(A) = lim
nd∞
f(A)
Axiomática de Von Mises:

Ax. 1º: P(A) ¥ 0 " A œ A.
Ax. 2º: Si A1, A2 œ A y A1…A2 = «, entonces: P(A1»A2) = P(A1) + P(A2).
Ax. 3º: P(E) = 1.
La única diferencia con la axiomática de Kolmogorov, está en el axioma 2, que Von Mises da para dos
sucesos.
1. Determinar la probabilidad de cada uno de los siguientes sucesos:

a) La obtención de 6 puntos en una sola tirada con dos dados.
b) La aparición de dos reyes al extraer dos cartas en una baraja de 40 cartas.
c) La aparición de al menos una cara en cuatro lanzamientos de una moneda.
2. De una caja de 5 bolas blancas, 5 rojas y 4 azules, se extraen dos al azar. Hallar la probabilidad de
que las bolas extraídas sean:
a) dos blancas; b) una blanca y una roja; c) ninguna blanca.
3. Hallar la probabilidad de los siguientes sucesos:

a) Obtener 8 puntos en una sola tirada de dos dados.
b) Obtener en una sola tirada con dos dados una suma de 7 u 11.
c) Obtener al menos una cara en tres lanzamientos con una moneda.
4. De una baraja de 40 cartas se eligen 5 al azar. ¿Cuál es la probabilidad de que sean del mismo palo?
5. En una urna hay 5 bolas numeradas del 1 al 5. ¿Cuál es la probabilidad de que al extraerlas una a
una salgan en orden correlativo 1, 2, 3, 4, 5?
6. En una urna hay seis bolas blancas, cinco amarillas, siete azules, cinco rojas y nueve verdes. Se
extrae una bola al azar. Hallar la probabilidad de que sea azul, roja o amarilla.
7. En una ciudad hay tres periódicos A, B, y C. Se sabe que:
El periódico A lo leen el 20% de los habitantes. El periódico B lo leen el 10% de los habitantes. El
periódico C lo leen el 5% de los habitantes.
Además, A y B lo leen el 4%, A y C el 3%, B y C el 2% y finalmente los tres los leen el 1%.
Elegido un habitante de dicha ciudad al azar, hallar la probabilidad de que no lea ninguno de los
tres periódicos.
8. Un colegio tiene 500 estudiantes, y se sabe que: 300 leen inglés, 200 leen francés, 50 leen alemán,
20 leen francés y alemán, 30 leen inglés y francés, 15 inglés y alemán, 10 leen los tres idiomas.
Si se escoge al azar un estudiante de este colegio, ¿cuál es la probabilidad de que el estudiante:
a) Lea dos y solamente dos idiomas?
b) Lea cuando menos un idioma?
Probabilidad condicionada. Independencia
Definición.- Dado un espacio de probabilidad (E, A, P) y un suceso A ∈ A con P(A) > 0, se llama
probabilidad condicionada del suceso B dado A a:
P(A 3 B)
P(B/A) =
P(A)
Análogamente, suponiendo P(B) > 0, la probabilidad condicionada de A respecto del suceso B es:
P(A 3 B)
P(A/B) = P(B)
De las dos relaciones anteriores se obtiene:

P(A…B) = P(A)P(B/A)
P(A…B) = P(B)P(A/B)
n
Teorema (del producto).- Si A1, A2, ...An œ A y P 3
i=1
Ai > 0, entonces:
n
P 3
i=1
Ai = P(A1)P(A2/A1)......P(An/A1…...…An-1)
Teorema de la probabilidad total y fórmula de Bayes
Teorema.- Sea A1, A2, ..., An,... œ A un sistema completo de sucesos con P(Ai) conocidas y P(Ai) > 0
∀i œ N. Si B œ A y conocemos P(B/Ai) ∀i œ N, entonces:
∞
P(B) = P(A i )P(B/A i )
i=1
Fórmula de Bayes. Sea A1, A2, ..., An,... œ A un sistema completo de sucesos con P(Ai) conocidas y
P(Ai) > 0 ∀i œ N, B œ A tal que P(B) > 0 y conocemos P(B/Ai) ∀i œ N, entonces:
P(A j )P(B/A j )
P(A j /B) = ∞ "jœN
P(A i )P(B/A i )
i=1
Nota.- Teorema y fórmula son ciertos en el caso de una familia finita de sucesos.
Sucesos independientes
Definición.- Sean A y B ∈ A. Se dice que A y B son independiente si P(A…B) = P(A)P(B).
Teorema. Si A y B son independientes, entonces: P(A/B) = P(A) si P(B) > 0, P(B/A) = P(B) si P(A) > 0.
Definición.- Una familia H Õ A no vacía de sucesos, se dice que está formada por sucesos
completamente independientes, si para toda subfamilia finita A1, A2, ..., Ak, œ H se verifica que:
P(A1…A2…...…Ak) = P(A1)P(A2)...P(Ak)
Experimentos compuestos
Definición.- Dados (E1, A1, P1) y (E2, A2, P2) dos espacios probabilísticos, se denomina experimento
compuesto a (E, A, P) donde:
E = E1µE2.
A = A1µA2.
P(Ai, Bj) = P1(Ai)P2(Bj) experimentos independientes.
P(Ai, Bj) = P1(Ai)P2(Bj/Ai) experimentos dependientes.
1. Las 40 cartas de una baraja española se reparten en partes iguales entre cuatro personas A, B, C y D.
Hallar la probabilidad de que B tenga dos reyes, si se sabe que A no tiene reyes.
2. Se tienen nueve tarjetas, y cada una lleva escrito un dígito del 1 al 9. Se eligen al azar dos tarjetas y
la suma de los dígitos escritos en ellas da par ¿Cuál es la probabilidad de que las tarjetas elegidas
lleven escritos números impares?
3. Se lanzan dos dados. Si la suma de los puntos de las caras superiores es 5, hallar la probabilidad de
que en alguno de los dados salga 2.
4. Una caja contiene cuatro bolas blancas y dos negras. Se saca una bola y a continuación (sin
devolver la primera a la caja) se extrae otra.
Considerados los sucesos A: La primera bola extraída es blanca. B: La segunda bola extraída es
blanca.
a) Hallar P(A) y P(B/A).
b) ¿Son A y B independientes?
c) ¿Cuál es la probabilidad de que las dos bolas extraídas sean blancas?
5. Se sacan sucesivamente tres cartas de una baraja de 40. ¿Cuál es la probabilidad de que las tres
cartas sean del mismo palo?
6. Una urna contiene ocho bolas rojas y cuatro blancas. Se sacan tres bolas de la urna, una tras otra.
Hallar la probabilidad de que las dos primeras sean rojas y la tercera, blanca.
7. En un taller el 25% de los trabajadores son mecánicos, el 15% son electricistas y el 10% tienen las
dos especialidades. Se selecciona un trabajador del taller al azar.
a) ¿Cuál es la probabilidad de que el trabajador seleccionado sea mecánico o electricista?
b) Si se sabe que el trabajador seleccionado es mecánico, ¿cuál es la probabilidad de que sea
electricista?
8. De una baraja de 40 cartas se sacan sucesivamente dos al azar. Hallar la probabilidad de que la
primera sea caballo y la segunda rey.
9. ¿Cuál es la probabilidad de torpedear un barco sabiendo que sólo pueden lanzarse tres torpedos y
que la probabilidad de hacer blanco con un torpedo es 0,2?
10. En la ejecutiva de un partido político el 70% son partidarios de una línea moderada y el resto, de
una línea radical. El 60% de los moderados y el 10% de los radicales tienen más de 40 años.
Elegido un miembro de la ejecutiva al azar, resulta que tenía más de 40 años. ¿Cuál es la
probabilidad de que sea un radical?
11. En una clase, el 20% de los chicos y el 5% de las chicas juegan al tenis. El 60% de los alumnos de
la clase son chicos. Se eligió al azar un estudiante de la clase y resultó ser de los que jugaban al
tenis. ¿Cuál es la probabilidad de que el estudiante elegido sea chico?
12. Una caja contiene tres monedas, la primera normal, la segunda tiene cara por los dos lados y la
tercera está trucada de forma que la probabilidad de salir cara es 1 . Se elige una moneda al azar y
3
se tira; hallar la probabilidad de que se obtenga cara.
13. Elegido un individuo al azar y observado por rayos X, se diagnosticó que estaba tuberculoso. La
probabilidad de que en la población de la que se eligió el individuo uno de ellos sea tuberculoso es
de 0,01. La probabilidad de que un aparato de rayos X detecte que un individuo es tuberculoso
siéndolo es 0,97 y no siéndolo es de 0,001. ¿Qué podemos decir acerca del diagnóstico?
VARIABLES ALEATORIAS
Variable aleatoria discreta y continua
Sea (E, A, P) un espacio probabilístico.
Definición.- Se llama variable aleatoria (v.a.) a una aplicación X: E → R verificando que " x œ R el
conjunto {w ∈ E | X(w) ≤ x} ∈ A.
Notación.- Notaremos por [X ≤ x] al conjunto {w ∈ E | X(w) ≤ x}.
Una v.a. X es discreta, si el conjunto de valores que toma X es finito o infinito numerable.
Una v.a. X es continua si toma todos los valores de un intervalo.
Ejemplo. Si lanzamos dos monedas al aire el espacio E es:
E = {(c, c), (c, +), (+, c), (+, +)}
y una v.a. puede ser X = número de caras, por tanto:

X(c, c) = 2, X(c, +) = X(+, c) = 1, X(+, +) = 0
Ejemplo. Se selecciona al azar un individuo de una ciudad; el espacio E está formado por todos los
habitantes de esa ciudad. La aplicación X, que a cada habitante le asocia su estatura, es una v.a. continua.
Función de masa y de densidad
Definición.- Sea X una v.a. discreta, se llama función de masa o de cuantía de X a:
f(x) = P(X = x) = p(x).

f verifica que:
1. f(x) ¥ 0 " x œ R.
2. x f(x) = 1.
Ejemplo. Consideremos el lanzamiento de dos monedas y la v.a. X = número de caras, la función de
masa se obtiene en la tabla siguiente:
xi 0 1 2
f 1 2 1
4 4 4
Definición.- Sea X una v.a. continua, se llama función de densidad de X a una función f: R Ø R que
verifica:
1. f(x) ¥ 0 " x œ R.
+∞
2. ¶ −∞ f(x)dx = 1.
b
La función de densidad nos permite calcular probabilidades de la forma: P(a < X [ b) = ¶ a f(x)dx .
Por tanto, la interpretación geométrica de P(a < X ≤ b) es el área comprendida entre f, el eje OX y las
rectas x = a y x = b.
y = f(x)
a b
Ejercicio. Una v.a. X tiene la siguiente función de densidad:
 0 si x < 0

f(x) =  2x si 0 [ x [ 1
 0 si x > 1

comprobar que
+∞
¶ −∞ f(x)dx = 1 y f(x) m 0
Función de distribución
Definición.- Sea X una v.a., se llama función de distribución de X, a la función F: R Ø R definida

por:
F(x) = P(X § x)
Si X es una v.a. discreta:

F(x i ) = P(X [ x i ) = f(x), con x § xi.
x
Si X es una v.a. continua:

xi
F(x i ) = P(X [ x i ) = ¶ −∞ f(x)dx.
Propiedades de la función de distribución
1. P(a < X ≤ b) = F(b) - F(a).

2. F es continua por la derecha " x œ R.
3. Si x1 < x2 ⇒ F(x1) ≤ F(x2) (monótona creciente).
4. lim
xd+∞
F(x) = 1.
5. lim
xd−∞
F(x) = 0.
6. Si la función de densidad f, es continua en "x" se verifica que: f(x) = F '(x).
Ejemplo. Sea la v.a. discreta X = suma de puntos obtenidos en el lanzamiento de dos dados. La función
de distribución F(x) toma los siguientes valores:
xi 2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 5 4 3 2 1
f 36 36 36 36 36 36 36 36
36 36 36
1 3 6 10 15 21 26 30 33 35 36
F(xi) 36 36 36 36 36 36 36 36 36 36 36
Ejemplo. Sea la v.a. continua X, con función de densidad
 0 si x < 0

f(x) =  2x si 0 [ x [ 1 .
 0 si x > 1

La función de distribución F(x) es:
 0 si x < 0

F(x) =  x 2 si 0 [ x [ 1
 1 si x > 1

Transformación de variables aleatorias
Explicaremos la transformación de variables por medio del siguiente ejemplo:
Ejemplo.- Sea X una v.a. continua con funciones de densidad y distribución f y F conocidas. Obtener
las funciones de densidad y distribución de Y = 2X + 3.
Sean G y g las funciones de distribución y densidad de Y.
y−3 y−3
G(y) = P(Y § y) = P(2X + 3 § y) = P X [ =F .
2 2
y−3 y−3
g(y) = G '(y) = 1 F ∏ = 1f .
2 2 2 2
Variables aleatorias n-dimensionales.
Definición.- Sean las v.a. discretas X1, X2,..., Xn, llamaremos distribución de probabilidad conjunta
de X = (X1, X2, ..., Xn) a cualquier función f: Rn Ø R que verifique
1. f(x1, x2, ..., xn) ¥ 0, " (x1, x2, ..., xn) œ Rn.
2. i i ... i f(x i , x i , ...x i ) = 1.
1 2 n
1 2 n
3. P(X = (x1, x2, ..., xn)) = f(x1, x2, ..., xn).
Definición.- Sean las v.a. continuas X1, X2, ..., Xn, llamaremos función de densidad de la variable
n-dimensional X = (X1, X2, ..., Xn) a cualquier función f: Rn Ø R que verifique
1. f(x1, x2, ..., xn) ¥ 0, " (x1, x2, ..., xn) œ Rn.
+∞ +∞
2. ¶ −∞ ... ¶ −∞ f(x , x , ..., x )dx dx ...dx = 1.
1 2 n 1 2 n
3. P(X œ A) = ¶¢¶A f(x , x , ..., x )dx dx ...dx

1 2 n 1 2 n " región A Õ Rn.
Definición.- Se llama función de distribución conjunta de la variable aleatoria X = (X1, X2, ..., Xn) a
la función F: Rn Ø R definida por:
F(x1, x2, ..., xn) = P(X1 § x1, ...., Xn § xn)
Definición.- Las distribuciones marginales de las v.a. Xi están dadas por:

Para el caso discreto : fi(xi) = S f(x1,..., xi,..., xn) variando (x1,..., xi-1, xi+1..., xn).
+∞ +∞
Para el caso continuo: fi(xi) = ¶ −∞ ... ¶ −∞ f(x1,..., xi,..., xn)dx1...dxi-1dxi+1...dxn.
Definición.- Se llama distribución de probabilidad condicionada de Xi por Xj = xj a:
f(x 1 , ...x n )
f(x i /x j ) = si fj(xj) > 0.
f j (x j )
Definición.- Se dice que las v.a. X1, X2, ..., Xn, son independientes si:
f(x1, x2, ..., xn) = f1(x1)..... fn(xn)
1. Se lanza un dado 3 veces. Se pide hallar la ley de probabilidad y la función de distribución del
número de apariciones de 5.
2. Una urna contiene 10 bolas de las que 8 son blancas. Se sacan al azar dos bolas. Sea X el número
de bolas blancas obtenidas. Calcular la función de densidad y la función de distribución de la
variable aleatoria X.
3. Una v.a. X tiene la siguiente función de densidad

 0 para x < 1
 1
f(x) =  4 (x − 1 ) para 1 [ x [ 3
3

 0 para x > 3
Se pide: a) Comprobar que f(x) es función de densidad. b) Obtener la función de distribución F(x).
4. Dada Y = X en donde X tiene por función de densidad

 1 si 0 < x [ 2
f(x) =  2 ,
 0 en otro caso
2
obtener P 0 < Y < .
2
CARACTERÍSTICAS DE LAS DISTRIBUCIONES DE

PROBABILIDAD
Esperanza matemática
Definición.- Sea X una v.a., g una función real de variable real continua, y f la distribución de
probabilidad de X. Se llama esperanza matemática de g(X), a: m = E[g(X)].
a) Si X es una v.a. discreta: = E[g(X)] = g(x)f(x).
x
+∞
b) Si X es una v.a. continua: = E[g(X)] = ¶ −∞ g(x)f(x)dx.
Si se considera g(X) = X se obtiene la esperanza matemática de la v.a. X.
Ejemplo. Sea la v.a. discreta X = suma de puntos obtenidos en el lanzamiento de dos dados, hallar la
esperanza matemática.
xi 2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 5 4 3 2 1
f 36 36 36 36 36 36 36 36 36 36 36
= E(X) = xf(x) = 2 $ 1 + 3 $ 2 + ... + 12 $ 1 = 252 = 7

x 36 36 36 26
Ejemplo. Dada una v.a. continua X, cuya función de densidad viene dada por:
 0 si x < 1

f(x) =  x − 12 si 1 [ x [ 2

 0 si x > 2
Calcular la esperanza matemática.
+∞ 3 2 2
= 19
2
= E(X) = ¶ −∞ xf(x)dx = ¶ 1 x x − 1 dx = x − x
2 3 4 1 12
Propiedades de la esperanza
1. E[aX + b] = aE[X] + b, " a, b œ R.

2. E[g1(X) ≤ g2(X)] = E[g1(X)] ≤ E[g2(X)].
3. Si X1, X2, ..., Xn, son v.a. independientes, se verifica que: E[X1ÿX2ÿÿÿXn] = E[X1]ÿE[X2]ÿÿÿE[Xn].
Varianza y desviación típica
Definición.- Se llama varianza de la v.a. X a: s2 = E[X - m]2.

a) Si X es una v.a. discreta: 2 = (x − ) f(x) .
2
x
+∞
b) Si X es una v.a. continua: 2 = ¶ −∞ (x − ) 2 f(x)dx.
Se define la desviación típica de la v.a. X como la raíz cuadrada de la varianza.

Propiedades de la varianza
1. s2 = E[X2] - m2.
2. s2aX+b = a2 s2X, " a, b œ R.
3. Si X e Y son v.a. independientes, entonces: s2aX+bY = a2 s2X + b2 s2Y, " a, b œ R.
Momentos
Definición.- Se define el momento de orden r œ N respecto al origen de una v.a. X como:
αr = E[Xr].
a) Si X es una v.a. discreta: r = x r f(x).
x
+∞
b) Si X es una v.a. continua: r = ¶ −∞ x r f(x)dx.
Definición.- Se define el momento de orden r œ N respecto a la media de una v.a. X como:

µr = E[X - m]r.
a) Si X es una v.a. discreta: r = (x − ) r f(x).
x
+∞
b) Si X es una v.a. continua: r = ¶ −∞ (x − ) r f(x)dx.
Ejercicio. Escriba el alumno los casos de r = 0, r = 1 y r = 2 para αr y µr.
Ejercicio. Obtenga el alumno la relación: µ2 = α2 - α12.
Función característica
Definición.- Sea X una v.a. con distribución de probabilidad dada por f, se llama función característica
de X a:
j(t) = E[eitX]
a) Si X es una v.a. discreta: $(t) = e tix f(x).

x
+∞
b) Si X es una v.a. continua: $(t ) = ¶ −∞ e tix f(x)dx.
Propiedades de la función característica
1. La función característica existe siempre.

2. j(0) = 1.
3. |j(t)| § 1.
4. $(t) = $(−t).
5. Si Y = a + bX, entonces: jY(t) = eitajX(bt), " a, b œ R.
6. Si X e Y son v.a. independientes, jX+Y(t) = jX(t)ÿjY(t).
d k $(0)
7. = ikk.
dt k
Función generatriz
Definición.- Sea X una v.a. con distribución de probabilidad dada por f, se llama función generatriz
de X a:
g(t) = E[etX]
a) Si X es una v.a. discreta: g(t) = e tx f(x).

x
+∞
b) Si X es una v.a. continua: g(t ) = ¶ −∞ e tx f(x)dx .
Propiedades de la función generatriz
1. Sean X e Y v.a. si gX(t) = gY(t) " t œ R, entonces X e Y tienen la misma distribución de probabilidad.
2. Si Y = X + a, entonces: gY(t) = etagX(t), " a œ R..
3. Si Y = aX, entonces: gY(t) = gX(at), " a œ R.
4. Si X e Y son v.a. independientes, gX+Y(t) = gX(t)ÿgY(t).
d k g(0)
5. = k
dt k
Ejercicios
1. Dada una v.a. X, cuya ley de probabilidad es:

X 2 4 6 8 10 12
f 0,05 0,25 0,15 0,3 0,15 0,1
Se pide: Esperanza matemática, varianza y desviación típica.
2. Una v.a. X tiene una función de distribución dada por

 0 para x < 0

F(x) =  x 3 para 0 [ x [ 1
 1 para x > 1

Se pide: Media, varianza y desviación típica.
3. Encontrar los cuatro primeros momentos respecto al origen a partir de la función generatriz de la
v.a. discreta X, que toma los valores
X 0 1
f 0,5 0,5
4. Sea la v.a. continua X, cuya función de densidad viene dada por

 0 si x < 0

f(x) =  1 si 0 [ x [ 1
 0 si x > 1

Calcular: La función generatriz y la función característica.

5. Se considera una v.a. discreta X, que toma los valores 1, 2, 3, ..., 8 y su ley de probabilidad es
f(x) = P(X = x) = kx.
Se pide: Calcular k, F(x), P(X = 2), P(X ≤ 5) y P(2 < X ≤ 5).
6. Se considera una moneda trucada, para la que P(cara) = 1/3 y P(cruz) = 2/3. Se lanza la moneda tres
veces y sea X la v.a. que representa las veces que sale cara. Hallar la media y desviación típica.
7. La vida en horas de un tipo de lámparas de radio es una v.a. X, cuya función de densidad es:
 0 para x < 100
f(x) =  k
 x 2 para x m 100
Determinar:
a. La probabilidad de que de 4 lámparas ninguna tenga que ser sustituida en un aparato de radio
durante las primeras 300 horas de uso.
b. La probabilidad de que las 4 lámparas tengan que cambiarse durante las 300 primeras horas.
DISTRIBUCIONES DE PROBABILIDAD DE VARIABLE DISCRETA
Distribución binomial
Función de masa. Supongamos un experimento aleatorio E repetido n veces consecutivas, observando

si se presenta o no un suceso A. Las n veces se realiza el experimento aleatorio en igualdad de condiciones.
Sea P(A) = p en cada una de las n veces que repetimos el experimento aleatorio. A su vez llamamos A
al suceso contrario de A y denotamos por q = P(A) = 1 - p.
Los resultados obtenidos cada vez que repetimos el experimento aleatorio son independientes unos de
otros; si registramos los resultados de dichas observaciones escribiendo A cada vez que se presente el
suceso A y escribiendo A cada vez que se presenta el suceso contrario de A, tendremos una lista de n
observaciones cuyo resultado puede ser el siguiente:
AAAAA...AAA
Supongamos que el número de A es r y, por lo tanto el de A será n-r. Como se trata de sucesos
independientes, la probabilidad de los resultados obtenidos anteriormente es
ppqpq...qqp = prqn-r
pero ¿de cuántas formas diferentes se pueden elegir entre el total de n lugares, r destinados al suceso A?
La respuesta es; el número de permutaciones con repetición de n elementos, siendo r iguales entre si y por
otro lado n-r también iguales entre sí, es decir:
PR r,n−r = n! = nr
n
r!(n − r )!
Por lo tanto, la probabilidad de que el suceso A se presente r veces al repetir el experimento aleatorio
E, n veces es
n p r q n−r
r
y una distribución de este tipo recibe el nombre de Binomial. Si consideramos la v.a. X = número de
veces que se presenta el suceso A, su función de masa es:
f(r) = P(X = r) = nr p r q n−r
La distribución binomial se denota por X œ B(n, p).
Ejemplo. La probabilidad de que un alumno de Bioestadística apruebe un examen es 0,25. Calcular

para un grupo de 4 estudiantes:
1. Probabilidad de que los 4 alumnos aprueben el examen.
2. Probabilidad de que uno y sólo uno lo apruebe.
3. Probabilidad de que al menos 2 alumnos aprueben el examen.
4. Probabilidad de que a lo sumo 3 alumnos aprueben.
Se trata de una distribución binomial B(4; 0,25), luego

1. P(X = 4) = 4 0, 25 4 = 1
4 256
2. P(X = 1) = 4 0, 25 $ 0, 75 3 = 108
1 256
3. P(X ≥ 2) = 1 - [P(X = 0) + P(X = 1)] = 67
256
4. P(X ≤ 3) = 1 - P(X = 4) = 255
256
Propiedades de la distribución binomial
1. Función característica: j(t) = (pÿeit + q)n.

2. Función generatriz: g(t) = (pÿet + q)n
3. Esperanza matemática: m = E[X] = np.
4. Varianza: s2 = npq.
5. Si X1 œ B(n1; p), ..., Xk œ B(nk; p) son independientes, entonces: X = X1 +...+ Xk œ B(n1 +...+ nk, p).
Distribución hipergeométrica
Función de masa.- Supongamos que disponemos de N datos, de los cuales k son considerados éxitos y
N-k como fracaso. De entre estos N datos, se seleccionan n de ellos sin reemplazamiento. Se define la v.a.
X = número de éxitos entre los n seleccionados, su función de masa es:
k N−k
x n−x
f(x ) = P(X = x) =
N
n
La distribución hipergeométrica se denota por X œ h(N, n, k).
Propiedades de la distribución hipergeométrica
1. Esperanza matemática: m = E[X] = k n.

N
2. Varianza: s2 = N − n n k 1 − k .
N−1 N N
Distribución geométrica
Función de masa.- Consideremos un experimento aleatorio y un suceso A del que conocemos la

probabilidad P(A) = p, y supongamos que se realizan pruebas independientes hasta que se obtenga el
suceso A por primera vez. Sea la v.a. X = número de pruebas nesesarias para que aparezca el suceso A
por primera vez, su función de masa es:
f(x) = P(X = x) = (1 - p)x-1p

Propiedades de la distribución geométrica

p $ et
1. Función generatriz: g(t) =
1 − q $ et
2. Esperanza matemática: m = E[X] = 1p .
q
3. Varianza: s2 = 2 .
p
Distribución binomial negativa
Función de masa.- Consideremos un experimento aleatorio y un suceso A del que conocemos la

probabilidad P(A) = p, y supongamos que se realizan pruebas independientes hasta que se obtenga el
suceso A por n-ésina vez. Sea la v.a. X = número fallos antes del éxito n-ésimo, su función de masa es:
n+x−1
f(x) = P(X = x) = (1 - p)xpn
x
Propiedades de la distribución binomial negativa

n
p
1. Función generatriz: g(t) =
1 − q $ et
nq
2. Esperanza matemática: m = E[X] = p .
nq
p
Distribución de Poisson
Función de masa.- Una v.a. discreta X con valores 0, 1, 2, ..., sigue una distribución de Poisson de
parámetro l, si su función de masa es:
r
f(r) = P(X = r ) = e − r = 0, 1, 2, ...., n, .....
r!
Se denota por X œ P(λ).
Propiedades de la distribución de Poisson
1. Función generatriz: g(t) = e (e −1 )

t
2. Esperanza matemática: m = E[X] = l.

3. Varianza: s2 = l.
4. Si X1 œ P(l1), ..., Xk œ P(lk) son independientes, entonces: X = X1 +...+ Xk œ P(l1 +...+ lk).
Distribución de Poisson como aproximación de la distribución binomial
Cuando en una distribución binomial B(n; p), n → ∞ y p → 0, la distribución de Poisson se puede

obtener como límite de la distribución binomial, lo que significa, en la práctica, que se pueden aproximar
las probabilidades binomiales mediante la distribución de Poisson cuando n es grande y p pequeña.
En general, cuando n ≥ 50 y p < 0,1 o np < 5 la distribución Binomial se aproxima mucho a la de

Poisson, con λ = np.
Ejercicio. Comprobar que haciendo λ = np.
lim P(X = r) = lim n p r q n−r = r e −

nd∞ nd∞ r r!
Ejemplo. La probabilidad de reacción negativa ante un fármaco de un individuo internado en un

Hospital es 0,05. Calcular la probabilidad de que en un total de 100 individuos:
1. Presenten reacción 3 individuos.
2. Presenten reacción 0 individuos.
3. Presenten reacción más de 2 individuos.
Se trata de una B(n; p) = B(100; 0,05). Como n ≥ 50 y p < 0,1, la podemos aproximar mediante una
P(λ), siendo λ = np = 100⋅0,05 = 5, por tanto
3
1. P(X = 3) = 5 e −5 = 0, 14
3!
0
2. P(X = 0) = 5 e −5 = 0, 00674
0!
3. P(X > 2) = 1 - [P(X = 0) + P(X = 1) + P(X = 2)] = 0,875
1. Tres personas lanzan al aire dos monedas cada una. Sea la v.a. X, el número de personas que
obtienen dos caras. Determinar:
a. La función de densidad.
b. La media y varianza, comprobándolo con el auxilio de la tabla de probabilidad.
2. Se lanzan 5 dados. Se pide:

a. Probabilidad de obtener 0, 1, 2, 3, 4, 5 ases.
b. Probabilidad de obtener, por los menos, 1 as.
c. Probabilidad de obtener a los sumo 3 ases.
d. Si lanzamos los 5 dados 1.000 veces, ¿qué número de veces aparecerán 0 ases, 1 as, 2, 3, 4, ó 5
ases?
3. Una v.a. X es B(n, p) y tiene la siguiente función generatriz
4
g(t ) = 2 e t + 3
5 5
Se pide:
a. Calcular la función de probabilidad.
b. Probabilidad de que X ≥ 1.
c. Esperanza matemática y desviación típica.
4. Una máquina automática, dedicada a la fabricación de comprimidos laxantes, produce defectuosos

a razón de 1%.
a. Si los comprimidos se colocan en tubos de a 25, ¿cuál es la probabilidad de que un tubo tenga 0
defectuosos?
b. Si los tubos se colocan en cajas de a 10, ¿cuál es la probabilidad de que una caja contenga los 10
tubos con ningún comprimido defectuoso?
5. Sabiendo que el número medio de enfermos recibidos cada 10 minutos en un Centro Sanitario entre
las 10h y 15h, es 1,8. Calcular la probabilidad de que entre las 12h 40m y las 12h 50m haya:
a. Ningún enfermo.
b. Un enfermo.
c. Dos enfermos.
d. Al menos dos enfermos.
e. Más de dos enfermos.
6. La probabilidad de que un enfermo reaccione desfavorablemente después de aplicarle un calmante

es 0,01. Se le aplica a 200 personas. Determinar:
a. Ley de probabilidad.
b. Media y desviación típica.
c. Probabilidad de que a lo sumo dos enfermos reaccionen desfavorablemente.
7. Un libro de 1.000 páginas contiene 1.500 erratas distribuidas aleatoriamente. Abierto el libro por
una página cualquiera se observa el número de erratas encontradas llamándole X.
Se pide:
a. Ley de probabilidad de X.
b. Esperanza matemática y desviación típica.
c. P(X > 2).
d. P(X ≤ 3).
8. La Compañía de Seguros de Vida ARSA después de costosos estudios y por dilatada experiencia ha
determinado que 1 de cada 5.000 personas fallecen anualmente por accidente laboral. La Compañía
ARSA tiene hechos 50.000 seguros de vida de este tipo en toda la nación teniendo que abonar a los
afectados por cada póliza 5.000 €.
Se pide:
¿Cuál es la probabilidad de que la compañía ARSA tenga que pagar en un año por lo menos 60.000
euros por conceptos de primas a los familiares de los asegurados?
DISTRIBUCIONES DE PROBABILIDAD DE VARIABLE CONTINUA
Distribución uniforme
Definición.- Se dice que una v.a. X tiene distribución uniforme en [a, b] y se denota por X œ U[a, b]
si su función de densidad es:
 1 si x c [a, b]
f(x) =  b − a
 0 si x " [a, b]
Propiedades de la distribución uniforme
1. Función generatriz: g(t) = e − e si t ! 0; g(0) = 1.

tb ta
t(b − a)
2. Esperanza matemática: m = E[X] = a + b .
2
(b − a ) 2
3. Varianza: s2 = .
12
Distribución gamma
Definición.- Se llama función gamma a la función de R+ en R definida por:

∞
(p) = ¶ 0 x p−1 e −x dx
Propiedades: a) G(p) = (p - 1)G(p - 1), b) G(1) = 1, c) 1 = .

2
Definición.- Se dice que una v.a. X tiene distribución gamma de parámetros p > 0 y a > 0, y se denota
por X œ g(p, a), si su función de densidad es:
 a p x p−1 e −ax
 si x > 0
f(x) =  (p)
 0 en otro caso
Propiedades de la distribución gamma

−p
1. Función generatriz: g(t) = 1 − at .
p
2. Esperanza matemática: m = E[X] = a .
p
a
4. Si X1 œ g(p1; a), ..., Xk œ g(pk; a) son independientes, entonces: X = X1 +...+ Xk œ g(p1 +...+ pk, a).
Distribución exponencial
Definición.- Se dice que una v.a. X tiene distribución exponencial de parámetro a > 0, y se denota
por X œ E(a), si su función de densidad es:
 ae −ax si x > 0
f(x) = 
 0 en otro caso
E(a) = g(1, a).
Propiedades de la distribución exponencial

−1
1. Función generatriz: g(t) = 1 − at .
2. Esperanza matemática: m = E[X] = 1a .
a
4. Si X1 œ E(a), ..., Xk œ E(a) son independientes, entonces: X = X1 +...+ Xk œ g(k, a)
Distribución normal
La distribución normal fue utilizada por primera vez en 1.753 por De Moivre, pero no tuvo continuidad
hasta el siglo XIX en que Gauss y Laplace la volvieron a actualizar, es por ello por lo que se conoce
también la distribución normal con el nombre de distribución de Gauss-Laplace.
Se creyó que en la práctica la mayor parte de las distribuciones eran de este tipo y se le puso el nombre
de distribución normal, llamándole a las restantes distribuciones anormales.
Definición.- Una v.a. X, tiene distribución normal de parámetros µ y σ y se denota por X œ N(µ, σ),
si su función de densidad es:
x− 2
f(x) = 1 e − 12
2
Propiedades de la distribución normal

(t ) 2
1. Función generatriz: g(t) = e t+ 2 .
2. Esperanza matemática: m.
3. Varianza: s2
4. Si X1 œ N(m1, s1), ..., Xn œ N(mn, sn) son indep., fl X = X1 +...+ Xn œ N(m1 +...+ mn, 21 + ... + 2n ).
X 1 + ... + X n
5. Si X1 œ N(m, s), ..., Xn œ N(m, s) son indep., fl X = n œ N , .
n
Representación de la función de densidad (Campana de Gauss)
1. Campo de existencia: Todo R.

2
2. Puntos de corte con los ejes: Para x = 0 ⇒ y = 1 e − 22
2
3. Simetrías: La curva es simétrica respecto de la recta x = µ.
4. Máximos, mínimos y puntos de inflexión: Máximo en , 1 .

2
5. Puntos de inflexión en ! , 1
2e
6. Asíntotas: El eje OX es una asíntota horizontal.
7. Crecimiento y decrecimiento: Crece en (-∞, µ), y decrece en (µ, +∞).
8. Trazado de la gráfica de f(x):
µ−σ µ µ+σ
Tablas
Tabla de la función de distribución de una variable Z Œ N(0, 1). La tabla que vamos a ver, al final
del tema, nos da el valor de F(z) con z ¥ 0 (área encerrada por f, el eje OX, la recta x = z y -¶).
z x2
F(z) = P(Z [ z) = 1 ¶ −∞ e − 2 dx
2
−∞ 0 z +∞
Conocidos los valores de esta tabla es inmediato conocer cualquier probabilidad en una distribución
normal.
Tipificación
Si queremos calcular una probabilidad en una distribución N(µ, σ), como las probabilidades
correspondientes a N(0, 1) están tabuladas, pasamos de la N(µ, σ) a la N(0, 1), efectuando el cambio de
variable
X−
Z= .
A este cambio de variable se le llama tipificación.
Otro uso de la tipificación de una variables es el siguiente: Si dos grupos de alumnos son calificados
por distintos profesores, pueden compararse sus calificaciones si tipificamos ambas calificaciones.
Análoga a la aplicación anterior es la siguiente: Si se sabe que un hombre mide 1,73 m y pesa 80 kg.,
¿se puede decir si es más alto que gordo? Si se tipifican las dos series de tallas y pesos de que forman
parte estos datos y resulta que la talla corresponde a 0,91 y el peso a 1,2 podemos decir que es más grueso
que alto.
Ejercicio. Compruebe el alumno que:

1. El 68,2% de las observaciones en una N(µ, σ) se encuentran en el intervalo [µ - σ, µ + σ].
2. El 95,4% de las observaciones en una N(µ, σ) se encuentran en el intervalo [µ - 2σ, µ + 2σ].
3. El 99,7% de las observaciones en una N(µ, σ) se encuentran en el intervalo [µ - 3σ, µ + 3σ].
Aproximación de una ley binomial mediante la ley normal
Teorema de De Moivre.- Si X œ B(n, p), la variable

X − np
Z= d N(0, 1) para n d ∞
npq
La aproximación es buena cuando n es un valor muy grande y p un valor ni próximo a 0 ni próximo a 1,

se suele tomar para
n > 30 y 0,1 < p < 0,9
Cuanto mayor sea n y p más próximo a 0,5 tanto mejor es la aproximación. En la práctica, la
aproximación es muy buena si tanto np como nq son mayores que 5.
Distribución c2 de Pearson
Ejercicio.- Si X œ N(0, 1), entonces: X2 œ ( 12 , 12 ).
Definición.- Dadas las variables X1, X2, ..., Xn œ N(0, 1) e independientes, se llama variable c2 de
Pearson con n grados de libertad a la definida por
c2 = X12 +...+ Xn2
Por tanto c2 = n , 1 y su función de densidad es la función g haciendo p = n y a = 1 .

2 2 2 2
Propiedades de la distribución c2
1. Esperanza matemática: m = E[X] = n.

2. Varianza: s2 = 2n.
3. Si X1, ..., Xk son v.a. independientes con distribución % 2n 1 , ..., % 2n k , entonces: X = X1 +...+ Xk œ c2 con
n1 +...+ nk grados de libertad.
Distribución t de Student
Definición.- Dadas las variables X, X1, X2, ..., Xn œ N(0, s) e independientes, se llama variable t de
Student a la definida por:
T= X
n
1
n i=1
X 2i
−(n+1 )/2
((n + 1 )/2 ) 2
Se denota por T œ tn. Su función de densidad es: f(t) = 1 + tn .
n (1/2 )
Propiedades de la t de Student
1. Es simétrica respecto del origen.

2. Esperanza matemática: m = 0.
3. Su función de densidad es independiente de s, lo que será de gran importancia en las aplicaciones.
4. tn Ø N(0, 1) cuando n Ø ∞ (n > 30).
Distribución F de Snedecor
Definición.- Dadas las variables X1, X2, ..., Xm, Y1, Y2, ..., Yn œ N(0, 1) e independientes, se llama
variable F de Snedecor con (m, n) grados de libertad a la variable aleatoria definida por:
m
1
m X 2i
F=
i=1
n
1
n
i=1
Y 2i
 ((m + n )/2 ) m m2 m2 −1 − m+n

 n x 1+xm
n
2
si x > 0
Se denota por F œ Fm,n. Densidad: f(x) =  m/2 n/2
( ) ( )
 0 si x [ 0

Propiedades de la F de Snedecor
1. Si X œ Fm,n, entonces: 1/X œ Fn,m (útil en el manejo de tablas).

2. F1,n y tn2 son v.a. con la misma distribución de probabilidad.
3. Si Fm,n,a es el valor tal que P[F > Fm,n,a] = a entonces: F m,n,1− = 1 (útil en el manejo de tablas).
F n,m,
1. La media de las calificaciones obtenidas en un test de aptitud por los alumnos de un centro fue 400
y desviación típica 100. Si las calificaciones siguen una distribución normal, calcular:
a. ¿Que % de alumnos obtuvieron calificación superior a 500 puntos?
b. ¿Que % de alumnos obtuvieron calificación superior a 300 puntos?
c. ¿Que % de alumnos obtuvieron calificación comprendida entre 300 y 500 puntos?
d. ¿Cuál es la probabilidad de que elegido un alumno al azar, su calificación difiera de la media en
menos de 150 puntos?
2. Las puntuaciones obtenidas por los 300 niños de un Colegio al aplicarles un test de aptitud
numérica, sigue una distribución normal de media 24 y desviación típica 4. Calcular:
a. El cuartil inferior y el cuartil superior.
b. ¿Cuál es la probabilidad de obtener puntuación igual o inferior a 16?
c. ¿Cuántos niños de dicho Colegio tienen igual o mayor puntuación que 26?
3. Se sabe que la concentración media de NH3 en sangre venosa de individuos normales de una
población normal es de 110 microgramos por mililitro y que la concentración de NH3 del 99% de
los individuos se encuentra comprendida entre 85 y 135 microgramos por mililitro. Se pide:
Calcular los límites del intervalo (centrado en µ) que contiene al 70% de los valores de dicha
población normal.
4. El peso de los quesos fabricados por una Industria del ramo, se distribuye normalmente. Se han
fabricado 4.000 piezas en un mes, de las cuales 800 pesaron menos de 1 kg. y 1.000 pesaron más de
2 kg. Determinar la media y la desviación típica de la distribución normal.
5. Al finalizar las Pruebas de Selectividad para ingreso en la Universidad, de 250 alumnos

presentados en Medicina, 200 han obtenido puntuaciones inferiores a 6. La distribución de los
examinados es normal y presenta una desviación típica de 2,5. Calcular:
Si se consideran suspensos los que han obtenido menos de 5, ¿cuántos suspensos ha habido?
6. En el ingreso a una Escuela Universitaria se aplica una batería de test, siendo su distribución
normal de media 35,5 y desviación típica 8. El Gabinete Psicotécnico de la Escuela Universitaria
decide que el 12 % superior sea orientado hacia otras Carreras de rango superior y el 35% inferior
lo sea hacia otras Carreras de rango inferior. Los alumnos presentados han sido 1.000. Se pide:
a. ¿Cuál será la puntuación que decide las situaciones de los alumnos presentados?
b. ¿Cuántos alumnos ingresarán en dicha Escuela Universitaria?
7. Consideremos una población formada por los alumnos de primero de una Escuela Universitaria de
Ingeniería. Por estudios realizados se ha llegado a la conclusión de que la probabilidad de aprobar
Álgebra es 0,4. El número de alumnos presentados es 900 y designamos por X el número de
alumnos aprobados.
a. Probabilidad de que el número de alumnos esté comprendido entre 340 y 370.
b. Determinar un intervalo [a, b], simétrico respecto a la media, tal que P(a < X < b) = 0,95.
TABLA DE LA DISTRIBUCIÓN NORMAL N(0, 1)

z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0 0,5 0,504 0,508 0,512 0,516 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,591 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,648 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,67 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,695 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,719 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,758 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,791 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,834 0,8365 0,8389
1 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,877 0,879 0,881 0,883
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,898 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,937 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,975 0,9756 0,9761 0,9767
2 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,983 0,9834 0,9838 0,9842 0,9846 0,985 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,989
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,992 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,994 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,996 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,997 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,998 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,999 0,999
3,1 0,999 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
DISTRIBUCIÓN EN EL MUESTREO
Introducción
Las características de una población no son calculadas ordinariamente a base de la observación de

todos los elementos que la componen, sino que se utiliza una muestra suficientemente representativa. Las
características o parámetros de la población, fijos, pero desconocidos, se estiman, entonces, a base de las
observaciones muestrales (estadísticos), evitándose de esta forma las dificultades que entraña la
observación exhaustiva de todos los elementos de la población.
Descripción. Dada una población cualquiera, consideremos todas las muestras de tamaño n que
pueden extraerse aleatoriamente con reemplazamiento (muestreo aleatorio simple). Para cada muestra,
podemos calcular un estadístico (tal como la media, la varianza, la proporción, la mediana, etc.) que varía
de muestra a muestra. De esta manera obtenemos una distribución del estadístico que se llama su
distribución de muestreo.
Si hallamos la media en la totalidad de muestras extraídas de la población, obtendremos distintos

valores; estos valores forman una distribución que recibe el nombre de distribución de muestreo de la
media. Análogamente, podríamos tener distribución de muestreo de la varianza, de las proporciones, etc.
Consideremos el conjunto de todas las muestras posibles de tamaño n de una población de media µ y
desviación típica por σ.
Distribución de la media en el muestreo
Las medias, x 1 , x 2 , x 3 , ..., de las distintas muestras, constituyen una v.a. que representamos por X .
Propiedades de X
2
1. E[X] = m. 2 [X] = n .
2. Si la población es N(m, s) con s conocida X c N , .
n
X−
3. Si la población es N(m, s) con s desconocida c t n−1 (S desviación típica de la muestra).
S/ n − 1
Distribución de la varianza en el muestreo
Las varianzas, s12, s22, s32, ..., de las distintas muestras, constituyen una v.a. que representamos por S2.
Propiedades de S2
1. E[S2] = n − 1 2
n .
2
2. Si la población en N(m, s), entonces: nS2 c % 2n−1 .

Distribución de la diferencia de medias
Supongamos que hemos obtenido una muestra de n elementos de una población N(m1, s1) y otra
muestra de m elementos de una población N(m2, s2).
Si las varianzas son conocidas:

21 22
X1 − X2 c N 1 − 2, n + m
Si las varianzas son desconocidas e iguales:
mn
m + n X1 − X2
c t n+m−2
nS 21 + mS 22
m+n−2
Teorema central del límite
Teorema (De Lévy-Lindeberg).- Sea {Xn} una sucesión de v.a. independientes e idénticamente
n
distribuidas y sea S n = X i . Si Xn tienen media y varianza finitas, entonces:
i=1
S n − E[S n ]
d N(0, 1)
[S n ]
X 1 + ... + X n
Por tanto: {Sn} Ø N(nm, s n ) y n d N , .
n
Teorema de Tchebycheff
Desigualdad de Tchebycheff.- Sea una v.a. X de media µ y desviación típica σ. Se verifica ∀ k > 0:
P( X − < k ) m 1 − 12
k
Si aplicamos la acotación de Tchebycheff al caso en el que la v.a. X es igual a X , tenemos:
P( x − x < k x ) = P x − < k m 1 − 12
n k
2
Tamaño de la muestra. Si ponemos k = , = 12 = 2 tiende a cero cuando n → ∞, luego fijados
n k n
ε y δ positivos arbitrariamente pequeños se puede, tomando n suficientemente grande, lograr que
P( x − m ) [ ó P( x − < ) m 1 −
expresión que se conoce como ley débil de los grandes números.
Ejemplo. Sea una distribución de m desconocida y s2 = 1. ¿Qué tamaño habrá de tener la muestra para
que la probabilidad de que la media diste menos de 0,4 de la media poblacional sea al menos de 0,99?
2
Se tiene: s2 = 1; δ = 0,4; ε = 1 - 0,99 = 0,01, luego n m 2 = 1 = 625.
0, 01 $ 0, 4 2
Teorema de Bernoulli
n
Si aplicamos la acotación de Tchebycheff al caso en el que la v.a. X = A (frecuencia relativa del
N
pq
suceso A), y teniendo en cuenta que m = E[X] = p = P(A) y = , se verifica que:
N
nA pq pq
h[ 1 2
N −p m hk N
P [
2N 4N
Dado un número δ > 0, la probabilidad de que el error absoluto que cometemos al tomar como
probabilidad de un suceso su frecuencia relativa, sea mayor que d, tiende a 0 cuando N tiende a ∞.
Por tanto, hay una probabilidad tan próxima a 1 como queramos de que tomando N fijo, pero
suficientemente grande sea
nA
N −p <
Ejemplo. Supongamos el lanzamiento de una moneda; la probabilidad de obtener cara es p = 0,5.

Tomando δ = 0,05 y ε = 0,01, resulta
pq 0, 5 $ 0, 5
Nm = = 10.000
2 0, 05 2 $ 0, 01
esto significa que para N ¥ 10.000, el teorema de Bernoulli afirma que
nA
P − 1 < 0, 05 m 0, 99
10001 2
1. Se tiene una población P formada por tres elementos P = {4, 6, 8}, cuya ley de probabilidad es
X 4 6 8
f 0,4 0,2 0,4
Se extraen muestras de tamaño 2. Se pide:

a. Escribir todas las muestras de tamaño 2 calculando su media.
b. Media de la población.
c. Media de la distribución muestral de las medias.
d. Varianza de la población.
e. Varianza de la distribución muestral de las medias.
2. En la fabricación de termómetros se utilizan 10 máquinas iguales que trabajan independientemente.

La probabilidad de que una máquina produzca uno defectuoso es del 5%. Utilizando la desigualdad
de Tchebycheff estimar la probabilidad de que la diferencia entre el número de termómetros
defectuosos X y su esperanza matemática resulte:
a) Menos de 2.
b) No menos de 2.
3. Se considera una población N(µ, 2). ¿Qué tamaño habrá de tener una muestra para que la
probabilidad de que la media se diferencie en menos de 0,5 de la media poblacional µ sea al menos
de 0,95?
4. La probabilidad de que un producto esté fuera de uso al año de su fabricación es p = 0,2. De un lote
de 100 productos:
a. ¿Cuál es la probabilidad de que la desviación entre las frecuencias relativas de las apariciones
respecto a la probabilidad media p sea inferior a 0,05?
b. ¿Entre qué límites se encuentra el número de piezas que cumplen estos requisitos?
5. Determinar el número de ensayos que deben realizarse para que la desviación de la frecuencia
relativa de aparición del suceso A respecto a su probabilidad no supere en valor absoluto a 0,02 con
probabilidad 0,99.
INTERVALOS DE CONFIANZA
Introducción
Hasta ahora hemos considerado tan sólo la estimación llamada puntual o por punto, según la cual la
estimación de los parámetros o características poblacionales se resuelve mediante un punto o valor único.
La estimación es, de esta forma, concreta; pero, en cambio, no permite tener una mayor o menor
confianza en ella, es decir, no da una medida de la confianza que puede depositarse en el resultado que se
obtiene de la inferencia.
Para resolver esta cuestión se utiliza la llamada estimación por intervalo, que no es sino obtener un
intervalo tal, que haya una determinada probabilidad de que dicho intervalo, llamado intervalo de
confianza, contenga entre sus límites al verdadero valor del parámetro poblacional.
Llamando θ al parámetro poblacional en cuestión, θ*, su estadístico y 1 - α (0 < α < 1), la probabilidad
de que θ quede contenido dentro del intervalo de confianza, el problema se plantea en términos de
encontrar una amplitud 2d del intervalo de confianza, tal que
P[θ* - d < θ < θ* + d] = 1 - α
Los límites θ* - d y θ* + d reciben el nombre de límites de confianza, α, el de nivel de significación

o riesgo de error, y 1 - α el de coeficiente de confianza. Como nivel de significación acostumbra a
tomarse bien α = 0,01 o bien α = 0,05, esto es, el 1% o el 5%, con lo cual los niveles de confianza serán
del 99% o del 95%.
Intervalo de confianza de la media
Población normal de varianza conocida. Como X c N , , entonces el intervalo es:

n
x − z 2 , x + z 2
n n
X−
Población normal de varianza desconocida. c t n−1 , entonces el intervalo es:
S/ n − 1
x − t 2 s ,x + t s
n−1 2
n−1
Población cualquiera de varianza conocida. Por el teorema central del límite, sabemos que:
X d N , cuando nd ∞ (para n > 30), entonces el intervalo es:

n
x − z 2 , x + z 2
n n
Si la varianza poblacional es desconocida y n > 30, se usa este intervalo tomando s º s.

Cuando n § 30, debemos usar
x − t 2 s ,x + t s
n−1 2
n−1
Intervalo de confianza de la varianza
2
Población N(m, s). Como ns2 c % 2n−1 , el intervalo viene dado por:

ns 2 , ns 2
% 2 % 21−
2 2
Intervalo de confianza de la diferencia de medias
Poblaciones normales de varianza conocida.
21 22 21 22
x 1 − x 2 − z 2 n 1 + n 2 , x 1 − x 2 + z 2 n1 + n2
Poblaciones normales de varianza desconocidas pero iguales.
n1 + n2 n 1 s 21 + n 2 s 22 n1 + n2 n 1 s 21 + n 2 s 22
x 1 − x 2 − t 2 , x 1 − x 2 + t 2
n1n2 n1 + n2 − 2 n1n2 n1 + n2 − 2
Intervalo de confianza de las proporciones
Cuando n > 30.
p&q& & p&q&

p & − z 2 n , p + z 2 n
Diferencia de proporciones (n > 30).
p &1 q &1 p &2 q &2 & p &1 q &1 p &2 q &2

p &1 − p &2 − z 2 n 1 + n 2 , p 1 − p 2 + z 2
&
n1 + n2
Tamaño de muestra
Calcularemos el tamaño de la muestra para el intervalo que estima la media poblacional, puesto que el
método es siempre el mismo.
x − z 2 , x + z 2
n n
En la amplitud del intervalo de confianza correspondiente a un coeficiente de confianza 1 - α; influyen

z 2 y n, ya que suponemos conocido σ. Es indudable que interesa que el intervalo de confianza sea de la
menor amplitud posible, y al mismo tiempo que 1 - α sea lo mayor posible. Si aumentamos 1 - α aumenta
z 2 y, por tanto, la amplitud del intervalo. Fijemos un cierto valor para 1 - α que sea aceptable al fin
práctico que perseguimos, entonces tomando n convenientemente, podemos reducir la amplitud del
intervalo de confianza. No hay que olvidar que aumentar el tamaño de la muestra eleva el coste de la
experiencia.
Si queremos que nuestro intervalo tenga una amplitud menor o igual que h, se ha de verificar que:
2
[ h e n m 2z 2

2z
2
n h
Ejemplo. Para una población con varianza 100, determinar el mínimo número de individuos de una
muestra para que la amplitud del intervalo sea menor o igual que 0.5, tomando como coeficiente de
confianza 95 %.
2
2 $ 1, 96 $ 10
n= = 6.146, 56
0, 5
CONTRASTES DE HIPÓTESIS
En la práctica nos vemos obligados a tomar decisiones relativas a una población sobre la base de
información proveniente de muestras. Tales decisiones se llaman decisiones estadísticas. Por ejemplo,
podemos querer decidir, basados en datos muestrales, si un método pedagógico es mejor que otro, o si una
moneda está trucada o no.
Hipótesis estadísticas
Al intentar alcanzar una decisión, es útil hacer hipótesis sobre la población implicada. Tales hipótesis,
que pueden ser o no ciertas, se llaman hipótesis estadísticas. Son en general, enunciados acerca de las
distribuciones de probabilidad de las poblaciones.
Hipótesis nula. En muchos casos formulamos una hipótesis estadística con el único propósito de
rechazarla o invalidarla. Así, si queremos decidir si una moneda está trucada, formulamos la hipótesis de
que la moneda es buena. Análogamente si deseamos decidir si un procedimiento es mejor que otro,
formulamos la hipótesis de que no hay diferencia entre ellos. Tales hipótesis se suelen llamar hipótesis
nula y se denota por H0.
Hipótesis alternativa. Toda hipótesis que difiera de una dada se llamará hipótesis alternativa. Por
ejemplo, si una hipótesis es p = 0.5, hipótesis alternativas podrían ser p = 0.7, p ≠ 0.5 p > 0.5 o p < 0.5.
Una hipótesis alternativa a la hipótesis nula se denotará por H1.
Contraste de hipótesis
Si suponemos que una hipótesis particular es cierta pero vemos que los resultados hallados en una
muestra aleatoria difieren notablemente de los esperados bajo tal hipótesis (o sea, esperados sobre la base
del puro azar), entonces diremos que las diferencias observadas son significativas y nos veríamos
inclinados a rechazar la hipótesis (o al menos a no aceptarla ante la evidencia obtenida). Así si en 20
tiradas de una moneda salen 16 caras, estaríamos inclinados a rechazar la hipótesis de que la moneda es
buena, aunque cabe la posibilidad de equivocarnos.
Los procedimientos que nos capacitan para determinar si las muestras observadas difieren
significativamente de los resultados esperados, y por tanto nos ayudan a decidir si aceptamos o
rechazamos la hipótesis, se llaman contrastes (o tests) de hipótesis.
Errores de tipo I y de tipo II
Si rechazamos una hipótesis cuando debiera ser aceptada, diremos que cometemos un error de tipo I.
Por otra parte, si aceptamos una hipótesis que debiera ser rechazada, diremos que se ha cometido un error
de tipo II. En ambos casos se ha producido un juicio erróneo.
V F
H0 A R
H0 R (I) A (II)
Para que las reglas de decisión (o contrastes de hipótesis) sean buenas, deben diseñarse de modo que
minimicen los errores de la decisión. Y no es una cuestión sencilla, porque para cualquier tamaño de la
muestra, un intento de disminuir un tipo de error suele ir acompañado de un crecimiento del otro tipo. En
la práctica, un tipo de error puede ser más grave que el otro, y debe alcanzarse un compromiso que
disminuya el error más grave. La única forma de disminuir ambos a la vez es aumentar el tamaño de la
muestra, lo que no siempre es posible.
Nivel de significación
Al contrastar una cierta hipótesis, la máxima probabilidad con la que estamos dispuestos a correr el
riesgo de cometer un error del tipo I se llama nivel de significación (α) del contraste.
α = P(Rechazar H0 / H0 es verdadera)
Se especifica antes de tomar la muestra, de manera que los resultados no influyan en nuestra elección.
En la práctica, es frecuente tomar α = 5% o α = 1%. Si, por ejemplo, se escoge α = 5% al diseñar una
regla de decisión, entonces hay 5 oportunidades de 100 de rechazar la hipótesis cuando debería haberse
aceptado; es decir, tenemos un 95% de confianza de que hemos adoptado la decisión correcta. En tal caso
decimos que la hipótesis ha sido rechazada al nivel de significación 5%, lo cual quiere decir que la
hipótesis tiene una probabilidad de 0.05 de ser falsa.
Contraste paramétrico
Supongamos que la distribución de muestreo de un estadístico S sigue una distribución normal de

media µs y desviación típica σs. Así pues, la distribución de la variable tipificada z = (S - µs)/σs, es N(0, 1).
1−α 1−α 1−α

α/2 α
α/2 α
-z α zα 0 zα -z α 0
0
2 2
fig. 1 fig. 2 fig. 3
Como se ve en la figura, podemos tener 1-α de confianza de que si la hipótesis es verdadera, entonces el
valor de z para un estadístico muestral S verificará que |z| ≤ z 2 en la figura 1, z ≤ zα en la figura 2 y z ≥ - zα
en la figura 3. Sin embargo, si al escoger una sola muestra al azar hallamos que el valor de z de su
estadístico está fuera de ese rango, debemos concluir que el suceso podría ocurrir con una probabilidad de
sólo α si la hipótesis fuera cierta. Diremos entonces que z difiere de forma significativa de lo que sería de
esperar bajo la hipótesis, y nos veríamos empujados a rechazar la hipótesis.
A cualquiera de los conjuntos {z / |z| > z 2 }, {z / z > zα} y {z / z < -zα} se llama región crítica; y a
cualquiera de los conjuntos {z / |z| ≤ z 2 }, {z / z ≤ zα} y {z / z ≥ -zα} se llama región de aceptación.
CONTRASTES ESPECIALES. Para grandes muestras (n > 30) las distribuciones de muestreo de
muchos estadísticos son distribuciones normales o casi normales, y los contrastes anteriores pueden
aplicarse a los z correspondientes.
Contraste de la media
H0 : µ = µ0
H1 : µ ≠ µ0
x − 0
En este caso S = X, µs = x = µ0 y σs = x = y la región de aceptación: [ z 2
n
n
Si H0 : µ = µ0
H1 : µ < µ0
x − 0
la región de aceptación: m −z
n
Si H0 : µ = µ0
H1 : µ > µ0
x − 0
la región de aceptación: [ z
n
Contraste de la proporción
H0 : p = p 0
H1 : p ≠ p 0
nA
n
En este caso S = nA , µs = p = p0 y σs =
pq n − p0 [ z
n y la región de aceptación: pq 2
n
Si H0 : p = p 0
H1 : p < p 0
nA
− p0
la región de aceptación: n m −z
pq
n
Si H0 : p = p 0
H1 : p > p 0
nA
− p0
la región de aceptación: n [ z.
pq
n
Ejemplo. De una población N(µ, 0,09) se obtiene una muestra de tamaño n = 100 de mediax = 1, 70.
Se desea contrastar la hipótesis
H0: µ = 1,68
frente a la hipótesis H1: µ ≠ 1,68
a un nivel de significación del 0,05.
Solución. Primero calculamos z 2 : P(-z 2 ≤ Ζ ≤ z 2 ) = 1 - α; si α = 0,05 ⇒ z 2 = 1,96

Segundo aplicamos el criterio dado en el contraste de hipótesis
1, 70 − 1, 68
= 2, 2 > z 2 = 1, 96
0, 09
100
Por tanto se rechaza la hipótesis H0 de que µ = 1,68.
Ejemplo. Se desea contrastar la hipótesis
H0: µ = 150
frente a la hipótesis H1: µ > 150
Para ello, se toma una muestra de la población N(µ, 15) de tamaño 36 y cuyo valor medio x = 155
Realizarlo para a) α = 0,05 y b) α = 0,01.
Solución. Primero calculamos zα: P(Ζ ≤ zα) = 1 - α; si α = 0,05 ⇒ zα = 1,65 y si α = 0,05 ⇒ zα = 2,5
155 − 150 = 2 > z = 1, 65 y 155 − 150 = 2 < z = 2, 5

15 15
36 36
Por tanto, para α = 0,05, se rechaza la hipótesis H0 de que µ = 150 y para α = 0,01, se acepta la hipótesis
H0 de que µ = 150
Ejemplo. Contrastar la hipótesis

H0: p = 0,7
frente a la hipótesis H1: p < 0,7
n
mediante una muestra de tamaño 60 y de frecuencia relativa o proporción nA = 0, 65.
Solución. Primero calculamos zα: P(Ζ ≥ -zα) = 1 - α; si α = 0,05 ⇒ zα = 1,65

0, 65 − 0, 7
− 0, 85 m −z = −1, 65
0, 7 $ 0, 3
60
Por tanto, para α = 0,05, se acepta la hipótesis H0 de que p = 0,7.

1. Una empresa se dedica a la fabricación de bombillas eléctricas siguiendo la duración media una
distribución N(µ; 100). Elegida una muestra aleatoria de 64 bombillas se comprobó que su duración
media era de 1.470 horas. Se pide contrastar y decidir entre las dos hipótesis
H0: µ = 1.500
H1: µ ≠ 1.500
con un nivel de significación a) del 5% y b) del 1%.
2. Se desea determinar la proporción de familias que poseen frigoríficos. Para ello, se considera una
muestra de tamaño 400 y se observa el número de los que lo poseen, resultando 215. ¿Tiene más
del 50% de la población frigorífico?
3. a) Determinar el número de ensayos que deben realizarse para que la desviación de la frecuencia
relativa de aparición del suceso A respecto a su probabilidad no supere en valor absoluto a 0,02 con
probabilidad 0,98.
b) Para determinar si un pescado es o no apto para el consumo por su contenido en Hg (mercurio),
se realizan 35 valoraciones obteniendo una media de 0.44 ppm (partes por millón) de Hg, y una
desviación típica de 0.08 ppm. Calcular los límites de confianza para la media, a un nivel de
significación α = 0.1.
c) Hemos lanzado un dado 100 veces y hemos obtenido 20 veces el número 6. ¿Está trucado el
dado?
4. a) Se desea saber cuál debe ser el tamaño muestral mínimo de una muestra para poder realizar la
estimación de la tasa media de glucosa plasmática de una determinada población, con un nivel de
confianza 95% y pretendiendo una precisión de 2,5 mg. Nota: En una muestra previa de tamaño 40
se obtuvo una desviación típica de 10 mg.
b) Leemos en una revista médica que la cuarta parte de los cancerosos de cierto tumor de estómago
presentan vómitos, con una precisión o tolerancia del 10% y con una confianza del 99%. ¿Con
cuántos pacientes se ha realizado el estudio?
c) Tras repetidas experiencias se admite que el método A) para curar una cierta enfermedad da un
20% de éxitos. Se ensaya un nuevo método B) en una muestra aleatoria de 50 individuos de los
cuales se curan 16. ¿Se puede decir que este resultado es significativo?.

Matemáticas ENM

Cargado por

Copyright:

Formatos disponibles

Matemáticas ENM

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Matemáticas ENM

Cargado por

Copyright:

Formatos disponibles

ENM Matemáticas I Álgebra lineal 1

Ejemplos. Son ejemplos típicos de espacios vectoriales los siguientes:

3. El conjunto C de los números complejos es un espacio vectorial sobre R si se considera en él la

Ejercicio. Hacer la demostración (por reducción al absurdo).

Definición. Sea V un espacio vectorial sobre un cuerpo K, y sea U ⊂ V y U ≠ «; se dice que U es un

Observación. Para cualquier espacio vectorial V, son subespacios vectoriales de V; O = {o} y V.

Si U es un subespacio de V con U ≠ V y U ≠ O, decimos que U es un subespacio propio de V.

Teorema. Sea V un espacio vectorial sobre un cuerpo K, y sea U ⊂ V y U ≠ «. U es un subespacio

Teorema. Sea V un espacio vectorial sobre un cuerpo K, y sea U ⊂ V y U ≠ «. U es un subespacio

Ejemplos. Son subespacios vectoriales los siguientes:

a) π(1, 1, 1, 1) = (π, π, π, π) y π ∉ Z ⇒ S no es subespacio vectorial.

b) (0, 0, 0, 0) ∉ T ⇒ T no es subespacio vectorial.

c) (0, 1, 1, 1), (1, 0 , 0, 0) ∈ R, y (0, 1, 1, 1) + (1, 0 , 0, 0) = (1, 1, 1, 1) ∉ R ⇒ R no es subespacio

d) (0, 1, -1, 0), (0, 1, 1, 0) ∈ A, y (0, 1, -1, 0) + (0, 1, 1, 0) = (0, 2, 0, 0) ∉ A ⇒ A no es subespacio

e) (0, 1, 1, 1), (1, 0 , 0, 0) ∈ B, y (0, 1, 1, 1) + (1, 0 , 0, 0) = (1, 1, 1, 1) ∉ B ⇒ B no es subespacio

Intersección y suma de subespacios

Ejercicio. Hacer la demostración.

Observación. En general, la unión conjuntista de dos subespacios de un espacio vectorial no es un

Teorema. La suma de dos subespacios es, a su vez, un nuevo subespacio.

Ejercicio. Hacer la demostración.

Definición. La definición de suma se extiende, de un modo natural, al caso de varios subespacios de la

También sucede que la suma de varios subespacios es un subespacio.

Definición. Dos subespacios U1 y U2, de un espacio vectorial V, se dicen suplementarios si son

U1 y U2 son subespacios suplementarios de V ⇔ U1 + U2 = V y U1…U2 = O.

Si U1 y U2 son suplementarios, escribiremos: U1 ⊕ U2 = V.

Subespacio engendrado por un conjunto de vectores

Definición. Sea S un subconjunto no vacío (finito o infinito) de un espacio vectorial V. Un elemento u

Teorema. Sea V un espacio vectorial sobre el cuerpo K, y S un subconjunto no vacío de V. El

Ejercicio. Hacer la demostración.

Definición. Dado subconjunto S no vacío de un espacio vectorial V sobre un cuerpo K, se llama

Ejemplo. En el espacio vectorial V = F(R, R) de la funciones de R en R, las funciones f0(x) = 1, f1(x) = x

λ1u1 + λ2u2 + ... + λnun = o, implica que λ1 = λ2 = ... = λn = 0.

Si bien la dependencia y la independencia son propiedades de los conjuntos de elementos, podemos

Ejercicio. Hacer la demostración.

Solución. f1(x) = sen x es independiente, ya que λ1sen x = 0 ∀ x ∈ R ⇒ λ1 = 0.

Supongamos ahora que f1(x), ..., fn-1(x) son independientes, y consideremos

λ1f1(x) + ... + λn-1fn-1(x) + λnfn(x) = 0 ∀ x ∈ R. ⇒

Ejercicio. Hacer la demostración.

Observación. Puede generalizarse el concepto de base y definir bases infinitas. Un ejemplo de la

Dimensiones de los subespacios y rango

dim(U1) + dim(U2) = dim(U1 + U2) + dim(U1 ∩ U2)

Ejercicio. Hacer la demostración.

x = x1e1 + x2e2 + ... + xnen, x = x'1e'1 + x'2e'2 + ... + x'ne'n,

sustituyendo en x = x'1e'1 + x'2e'2 + ... + x'ne'n, e igualando coordenadas se tiene:

x1 = x'1a11 + x'2a12 + ... + x'na1n

Cuando veamos matrices, estas ecuaciones las escribiremos en notación matricial.

f(λu + µv) = λf(u) + µf(v).

Definición. Sea f: V → W aplicación lineal.

1. La aplicación f: K2 → K3, definida mediante f(x, y) = (x - 2y, 3x, -x + y) es lineal.

2. Si V = D(R, R) es el espacio vectorial de la funciones reales definidas en R que son derivables y W

3. Si V = J(I, R) es el espacio vectorial de las funciones reales integrables en I = [a, b] Õ R y W = R,

4. (Homomorfismo nulo). Dados dos espacios vectoriales cualesquiera V y W, la aplicación nula, es

5. (Automorfismo identidad). La aplicación idéntica, de un espacio vectorial en sí mismo, es

Propiedades de las aplicaciones lineales

Núcleo e Imagen de una aplicación lineal

Imagen recíproca de un vector. Sea f: V → W una aplicación lineal, y w ∈ W; si w ∉ Im(f) ⇒ f -1(w)

Aplicaciones lineales entre espacios vectoriales de dimensión finita

Dimensiones del núcleo y la imagen de una aplicación lineal

Rango de una aplicación lineal

Determinación y existencia de aplicaciones lineales