Matemáticas ENM
Matemáticas ENM
Matemáticas ENM
TEMA 1
ESPACIOS VECTORIALES
Espacio vectorial
Definición. Se dice que un conjunto V tiene estructura de espacio vectorial sobre el cuerpo K si:
1º. En V hay definida una operación interna (suma +: V×V → V) que confiere a V estructura de
grupo abeliano; es decir; en V y para la suma (+) se verifica:
1. Asociativa: (u + v) + w = u + (v + w), ∀ u, v, w ∈ V,
2. Neutro: ∃ o ∈ V (vector cero) tal que o + u = u + o, ∀ u ∈ V,
3. Simétrico: ∀ u ∈ V, ∃ -u (opuesto de u) tal que u + (-u) = (-u) + u = o,
4. Conmutativa: u + v = v + u, ∀ u, v ∈ V.
2º. En V hay definida una operación externa (producto ⋅: K×V → V), cuyo dominio de operadores es
el cuerpo K, tal que se cumplen los siguientes axiomas:
5. λ(u + v) = λu + λv, ∀ u, v ∈ V, ∀ λ ∈ K,
6. (λ + µ)u = λu + µu, ∀ u ∈ V, ∀ λ, µ ∈ K,
7. λ(µu) = (λ⋅µ)u, ∀ u ∈ V, ∀ λ, µ ∈ K,
8. 1u = u, ∀ u ∈ V, siendo 1 la unidad de K.
Notación. A los elementos del espacio vectorial V, los llamaremos vectores y se designaran por u, v,
w,....; y a los elementos del cuerpo K los llamaremos escalares y se designarán por λ, µ, ν, ... Cuando el
cuerpo K de escalares sea Q, R o C, se dirá que se dispone, respectivamente, de un espacio vectorial
racional, real o complejo.
Notación. El vector cero, neutro de V para la suma, lo representaremos por o, y el elemento nulo del
cuerpo K lo representaremos por 0.
Notación. Tanto para la suma de V como la de K se utiliza el mismo signo "+"; para el producto de K
y para la operación externa no se utiliza signo de operación.
1. Todo cuerpo K es un espacio vectorial sobre sí mismo, ya que para la suma es grupo abeliano y,
considerando como operación externa el producto de elementos del cuerpo, se satisfacen los
restantes axiomas de un espacio vectorial.
2. Sea C[a, b] = {f: [a, b] → R / f continua en [a, b]}. C[a, b] con las operaciones de suma de
funciones y el producto de una función por un número real, es un espacio vectorial real.
4. El conjunto K[x], de las funciones polinómicas con una variable y con coeficientes pertenecientes a
un cuerpo K, con las definiciones habituales de suma de funciones polinómicas y producto de un
escalar por una función polinómica, es un espacio vectorial sobre el cuerpo K.
5. El conjunto Kn = {(x1, x2, ..., xn) | xi ∈ K}, en el que se han definido las operaciones: suma,
(x1, x2, ..., xn) + (y1, y2, ..., yn) = (x1 + y1, x2 + y2, ..., xn + yn);
producto por un elmento de K,
λ(x1, x2, ..., xn) = (λx1, λx2, ..., λxn)
es un espacio vectorial sobre K.
Nota. El alumno puede comprobar, haciendo uso de la definición de espacio vectorial, que estos
ejemplos son espacios vectoriales.
Teorema.
a) En un espacio vectorial sobre un cuerpo K, el neutro (el vector cero) es único.
b) Todo elemento tiene exactamente un simétrico (opuesto).
Propiedades. En un espacio vectorial V sobre un cuerpo K, para cualesquiera que sean los vectores u
y v y los escalares λ y µ, se verifican las siguientes propiedades:
1. 0u = o;
2. λo = o;
3. λu = o ⇒ (λ = 0 ó u = o);
4. -(λu) = (-λ)u = λ(-u);
5. [λu = µu y u ≠ o] ⇒ λ = µ;
6. [λu = λv y λ ≠ 0] ⇒ u = v.
Ejercicio. En R2 se definen las operaciones: (x1, x2) + (y1, y2) = (x1 + y1, x2 + y2) y
a) λ(x1, x2) = (λx1, x2) b) λ(x1, x2) = (λx1, 0)
c) λ(x1, x2) = (λx2, λx1) c) λ(x1, x2) = (λx12, λx2)
¿Es (R2, +, ⋅R) un espacio vectorial real?
Solución
a) (λ + µ)(x1, x2) = ((λ + µ)x1, x2) = (λx1 + µx1, x2) ≠ (λx1, x2) + (µx1, x2) = λ(x1, x2) + µ(x1, x2); por
tanto (R2, +, ⋅R) no es espacio vectorial real.
b) 1(x1, x2) = (x1, 0) ≠ (x1, x2) si x2 ≠ 0; por tanto (R2, +, ⋅R) no es espacio vectorial real.
c) 1(x1, x2) = (x2, x1) ≠ (x1, x2) si x1 ≠ x2; por tanto (R2, +, ⋅R) no es espacio vectorial real.
d) 1(x1, x2) = (x12, x2) ≠ (x1, x2) si x12 ≠ x1; por tanto (R2, +, ⋅R) no es espacio vectorial real.
ENM Matemáticas I Álgebra lineal 3
Subespacios vectoriales
Nota. El alumno deberá comprobar, haciendo uso de los teoremas, que dichos ejemplos son
subespacios vectoriales.
Ejercicio. En el espacio vectorial real R4, indicar cuáles de los siguientes subconjuntos son
subespacios vectoriales.
a) S = {(x1, x2, x3, x4) | x1 ∈ Z} b) T = {(x1, x2, x3, x4) | x2 - x3 - x4 = 1}
c) R = {(x1, x2, x3, x4) | x1⋅x2⋅x3 = 0} d) A = {(x1, x2, x3, x4) | |x2| = |x3|}
e) B = {(x1, x2, x3, x4) | x1⋅x2 = 0 ó x2⋅x3 = 0}
Solución.
Teorema. Dados un espacio vectorial V, sobre el cuerpo K, y dos subespacios suyos U1 y U2, el
conjunto U1…U2 es también un subespacio vectorial de V; en general si {Ui | i ∈ I} es una familia de
subespacios vectoriales de V, su intersección, 3 U i (abreviadamente …Ui), es también un subespacio
icI
vectorial de V.
Observación. Como el vector nulo de V pertenece a todos sus subespacios, no hay subespacios de
intersección vacía. Cuando se diga que dos subespacios U1 y U2 son disjuntos, se debe entender que no
tienen más elemento en común que el vector cero, es decir, U1…U2 = {o} = O.
Ejemplo. Sea V = F(R, R), el espacio vectorial real de todas las funciones reales definidas en R, con
las definiciones usuales de suma de funciones y producto de un número real por una función;
consideremos los subespacios: U1, de las funciones polinómicas, y U2 de las funciones pares; la
intersección de U1 y U2 es, evidentemente, el conjunto de las funciones polinómicas que tienen nulos
todos los coeficientes de las potencias impares de la variable; pues bien, este subconjunto de V es también
un subespacio vectorial suyo.
Definición. Dados un espacio vectorial V, sobre un cuerpo K, y dos subespacios suyos U1 y U2, se
llama suma de dichos subespacios, y se representa por U1 + U2, al conjunto de todos los vectores de V
que pueden expresarse como suma de un vector de U1 y otro U2; es decir
U1 + U2 = {u = u1 + u2 | u1 ∈ U1, u2 ∈ U2}
Ejemplo. En el espacio vectorial V = F(R, R) de las funciones reales definidas en toda la recta real,
considérense los subespacios U1 de las funciones que se anulan en los puntos 0 y 1 y U2 de las funciones
que se anulan en los puntos 0 y -1. El subespacio U1 + U2 es, ahora el formado por las funciones que se
anulan en el punto cero; en efecto, la suma de una función de U1 y otra de U2, como ambas se anulan en
cero, también se anula en 0; y, recíprocamente, si f ∈ V es tal que f(0) = 0, como siempre se cumple que f
= ( 12 f + g) + ( 12 f - g), tomando como g una de las infinitas funciones, de R en R, tal que g(0) = 0, g(1) = - 12
f(1) y g(-1) = 12 f(-1), como entonces 12 f + g ∈ U1 y 12 f - g ∈ U2, resulta ya evidente que f ∈ U1 + U2.
en donde u1, u2, ..., un ∈ S y λ1, λ2, ..., λn ∈ K, se llama combinación lineal de los elementos de S.
L(S) = 〈S〉 = {λ1u1 + λ2u2 + ... + λnun | u1, u2, ..., un ∈ S y λ1, λ2, ..., λn ∈ K},
es un subespacio vectorial de V.
También suele decirse que S es un conjunto generador del subespacio L(S). Si L(S) = V, se dice que
V es un espacio vectorial generado por S, y si S es finito, se dice que V es de tipo finito.
Independencia lineal
Definición. Sea S un subconjunto no vacío de un espacio vectorial V, sobre un cuerpo K, se dice que S
es dependiente si existe un conjunto finito de elementos de S, u1, u2, ..., un y un conjunto de escalares λ1,
λ2, ..., λn, no todos nulos y tales que
λ1u1 + λ2u2 + ... + λnun = o
El conjunto S se llama independiente si no es dependiente. En tal caso, cualesquiera que sean los
elementos distintos u1, u2, ..., un ∈ S y los escalares λ1, λ2, ..., λn, tales que
Teorema. S = {u1, u2, ..., un} ⊂ V es dependientes ⇔ uno de los vectores de S es combinación lineal
de todos los demás.
ENM Matemáticas I Álgebra lineal 6
Ejercicio. Probar que en el espacio vectorial de las funciones reales de variable real, la sucesión de
funciones fn(x) = sen nx es un conjunto de vectores independientes.
1f1
n + ... + n−1 f n−1 n + n f n n = 0 e 1 f 1 n + ... + n−1 f n−1 n = 0 e 1 = ... = n−1 = 0
⇒ λnfn(x) = 0 ∀ x ∈ R. ⇒ λn = 0 y por tanto f1(x), ..., fn(x) son independientes.
Teorema. Sea S = {u1, u2, ..., uk} un subconjunto independiente de un espacio vectorial V sobre un
cuerpo K. Entonces todo conjunto de k + 1 elementos de L(S) es dependiente.
Bases y dimensión
Definición. Sea V un espacio vectorial sobre un cuerpo K y sea B = {e1, e2, ..., en} ⊂ V; se dice que B
es una base de V si:
1. B es independiente.
2. B genera V; es decir L(B) = V.
Teorema. B = {e1, e2, ..., en} es una base de V ⇔ todo vector v ∈ V se puede expresar de forma única
como combinación lineal de los vectores de B.
Definición. Sea B = (e1, e2, ..., en) una base ordenada de V y sea v ∈ V; se llaman coordenadas de v en
la base B a los únicos escalares λ1, λ2,..., λn tales que v = λ1e1 + ... + λnen. A los vectores λ1e1, λ2e2,..., λnen
se le llaman componentes de v en la base B.
Teorema. Todo espacio vectorial V ≠ O de tipo finito posee, al menos, una base.
Teorema. En un espacio vectorial V de tipo finito, todas las bases tienen igual número de vectores.
De estos dos teoremas se deduce que todo espacio vectorial V ≠ O de tipo finito posee al menos una
base y que todas las bases de V tienen igual número de vectores, por tanto estamos en condiciones de
establecer la siguiente definición:
Definición. Sea V un espacio vectorial sobre el cuerpo K, V ≠ O y de tipo finito. Se llama dimensión
de V y se representa por dim(V), al número de vectores de cualquiera de sus bases.
ENM Matemáticas I Álgebra lineal 7
El espacio vectorial O es de tipo finito, pero no tiene ninguna base; por tanto, la precedente definición
no es válida para este espacio. Se conviene en decir que el espacio vectorial O tiene dimensión cero.
Base canónica de Kn. Los vectores e1 = (1, 0, ..., 0), e2 = (0, 1, ..., 0), ..., en = (0, 0, ..., 1), constituyen
una base de Kn, ya que el conjunto formado por {e1, e2, ..., en}, es:
Conjunto de generadores de Kn, pues, ∀ k = (k1, k2, ..., kn) ∈ Kn; k = k1e1 + k2e2 + ... + knen.
Conjunto independiente de Kn, ya que λ1e1 + λ2e2 + ... + λnen = o ⇔ (λ1, λ2, ..., λn) = (0, 0, ..., 0).
A esta base de Kn, se la llama base canónica de dicho espacio vectorial; como esta base consta de n
vectores, ⇒ Kn es de tipo finito y dim(Kn) = n.
Propiedades
Sin entrar en demostraciones, daremos algunas propiedades relativas a bases y dimensiones de los
espacios vectoriales de tipo finito, que nos ayudaran a completar la visión que hasta el momento tenemos
de ellas.
1. Si V es un espacio vectorial de tipo finito y {v1, v2, ..., vp} es un conjunto independiente de vectores
de V, siempre es posible encontrar unos vectores vp+1,..., vn de V tales que, siendo n ≥ p, el conjunto
{v1, v2, ..., vn} sea una base de V.
2. Si un espacio vectorial V tiene dimensión n, todo conjunto de más de n vectores de V es
dependiente.
3. Si un espacio vectorial V es de dimensión n, todo conjunto generador de V tiene, al menos, n
vectores.
4. Si U es un subespacio propio del espacio vectorial de tipo finito V, entonces se verifica que
dim(U) < dim(V)
5. Si V es un espacio vectorial de dimensión n, un conjunto de n vectores B = {e1, e2, ..., en} de V es
base si, y sólo si, se cumple una cualquiera de estas condiciones: a) B es independiente; b) B es un
conjunto generador de V.
6. Si {e1, e2, ..., en} es una base de un espacio vectorial V y {v1, v2, ..., vr} es un conjunto
independiente, de vectores de V, se puede asegurar que hay n - r vectores de la base que añadidos a
los v1, v2, ..., vr constituyen una nueva base.
Definición. Se llama rango de un conjunto de vectores {v1, v2, ..., vm} de un espacio vectorial V, y se
representa por rang{v1, v2, ..., vm}, al mayor número de vectores independientes del conjunto, es decir, el
rango de {v1, v2, ..., vm} es la dimensión del subespacio vectorial que engendra dicho conjunto, o sea:
rang{v1, v2, ..., vm} = dim(L{v1, v2, ..., vm}).
ENM Matemáticas I Álgebra lineal 8
De acuerdo con esta definición, un conjunto de m vectores será independiente si, y sólo si, su rango es
igual a m, número de vectores del conjunto. Un conjunto de n vectores de un espacio de dimensión n será
una base sii su rango es igual a n.
Teorema. Sean U1 y U2 dos subespacios de tipo finito de un espacio vectorial V, se verifica que:
Teorema. Si una base {e1, ..., en}, de un espacio vectorial V, se divide en dos conjuntos {e1, e2, ..., ep}
y {ep+1, ep+2, ..., en}, los subespacios U1 = L{e1, e2, ..., ep} y U2 = L{ep+1, ep+2, ..., en} son suplementarios.
Cambios de base
Sean B = {e1, e2, ..., en} y B' = {e'1, e'2, ..., e'n} dos bases de V, entonces, un vector x ∈ V puede
expresarse en una u otra base de la siguiente manera:
Aplicaciones lineales
Definición. Dados dos espacios vectoriales V y W, ambos sobre el mismo cuerpo K, una aplicación f:
V → W se dice que es una aplicación lineal u homomorfismo entre espacios vectoriales si, para
cualesquiera que sean los vectores u, v ∈ V y para todo escalar λ ∈ K, se verifica:
f(u + v) = f(u) + f(v),
f(λu) = λf(u).
Es trivial comprobar que, de acuerdo con esta definición, f es aplicación lineal si, y sólo si, para
cualesquiera que sean los vectores u, v ∈ V y los escalares λ, µ ∈ K, es:
Ejemplos:
vectoriales.
6. (Homotecias). Dado un espacio vectorial V, para cualquiera que sea el escalar k del cuerpo base K
del espacio vectorial, la aplicación fk: V → V, que a cada vector v ∈ V le hace corresponder fk(v) =
kv, recibe el nombre de homotecia de razón k; toda homotecia es, evidentemente, una aplicación
lineal de un espacio vectorial en sí mismo. Si k = 0, la homotecia correspondiente es el
endomorfismo nulo; si k = 1, la correspondiente homotecia es el automorfismo identidad. Si k ≠ 0,
la homotecia fk es, evidentemente, una aplicación biyectiva y, por tanto, se trata de una
automorfismo.
ENM Matemáticas I Álgebra lineal 10
Propiedades. Sea f: V → W, una aplicación lineal entre espacios vectoriales; se verifica que:
1. f(o) = o y f(-v) = - f(v), ∀ v ∈ V.
2. Si U es subespacio de V, entonces f(U) es subespacio de W.
3. Si U es subespacio de W, entonces f -1(U) es subespacio de V.
4. Si {v1, ..., vn} ⊂ V es dependiente, ⇒ {f(v1), f(v2), ..., f(vn)} ⊂ W también lo es.
5. Si {v1, ..., vn} ⊂ V es conjunto generador de un subespacio U de V, ⇒ {f(v1), f(v2), ..., f(vn)} es
conjunto generador del subespacio f(U) de W.
Definición. Sea f: V → W una aplicación lineal entre espacios vectoriales; se llama imagen de la
aplicación lineal f y se representará por Im(f), al subespacio vectorial f(V).
Definición. Sea f: V → W una aplicación lineal entre espacios vectoriales; se llama núcleo de la
aplicación lineal f y se representará por Ker(f), al subespacio vectorial f -1({o}).
Teorema. Sea f: V → W una aplicación lineal entre espacios vectoriales sobre el mismo cuerpo K; f es
inyectiva ⇔ Ker(f) = {o}.
Teorema. Sea f: V → W una aplicación lineal entre espacios vectoriales sobre el mismo cuerpo K; f es
inyectiva ⇔ ∀ v1, v2, ..., vn ∈ V independientes, ⇒ f(v1), f(v2), ..., f(vn) ∈ W son independientes.
Teorema. Sea V un espacio vectorial sobre el cuerpo K, con dim(V) = n, ⇒ ∃ f: V → Kn tal que f es
un isomorfismo (V ≈ Kn).
Este teorema nos dice que el comportamiento de los espacios vectoriales de dimensión finita es el
mismo que el de los espacios Kn, para n ≥ 1.
Teorema. Sea V un espacio vectorial de tipo finito y f: V → W una aplicación lineal entre espacios
vectoriales, ⇒ Im(f) = f(V) es un espacio vectorial de tipo finito.
Teorema. Sea V un espacio vectorial de tipo finito y f: V → W una aplicación lineal entre espacios
vectoriales; f es inyectiva ⇔ dim(V) = dim(Im(f)).
ENM Matemáticas I Álgebra lineal 11
Teorema. Sea V un espacio vectorial de tipo finito y f: V → W una aplicación lineal entre espacios
vectoriales; se verifica que:
dim(V) = dim(Ker(f)) + dim(Im(f))
Definición. Sea V un espacio vectorial de tipo finito y f: V → W una aplicación lineal entre espacios
vectoriales, se llama rango de f, y se representa por rang(f) a la dimensión del espacio vectorial imagen,
es decir:
rang(f) = dim(Im(f))
por tanto, si {e1, ..., en} es una base de V, como {f(e1), ..., f(en)} es un conjunto de generadores de Im(f), se
tiene que
rang(f) = rang{f(e1), ..., f(en)}.
Teorema. Sean V y W dos espacios vectoriales sobre el cuerpo K, si dim(V) = n y B = {e1, ..., en} es
una base de V y si C = {w1, w2, ..., wn} ⊂ W, ⇒ existe una única aplicación lineal f: V → W tal que f(ei) =
wi, ∀ i = 1, 2, ..., n. Si, además, C es un conjunto independiente de W, entonces la aplicación lineal es
inyectiva.
Sea f: V → W una aplicación lineal entre espacios vectoriales de tipo finito sobre el mismo cuerpo K,
y sea B = {e1, ..., en} una base de V y C = {w1, w2, ..., wm} una base de W. Sabemos que f queda
determinada si conocemos f(e1), f(e2), ..., f(en), entonces si:
f(e1) = a11w1 + a21w2 + ... + am1wm
f(e2) = a12w1 + a22w2 + ... + am2wm
⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅
f(en) = a1nw1 + a2nw2 + ... + amnwm
Se puede entonces afirmar que, para unas bases dadas de V y W, toda aplicación lineal f: V → W
queda determinada, de forma única, por m × n escalares; las relaciones anteriores reciben el nombre de
ecuaciones coordenadas de la aplicación f en las bases B = {e1, ..., en} y C = {w1, ..., wm} de V y W,
respectivamente. Cuando veamos matrices, escribiremos estas ecuaciones en notación matrical.
ENM Matemáticas I Álgebra lineal 12
Ejercicios propuestos
1. Sea V el espacio vectorial real de las funciones reales de una variable real, con las operaciones
usuales. Si Φ: R3 → V es la aplicación que a cada terna (a, b, c) ∈ R3 le asocia la función:
x → asen2x + bcos2x +c
a) Pruébese que Φ es lineal.
b) Hállense el núcleo y la imagen de Φ, analizando si Φ es inyectiva.
c) Localícese Φ-1(U), donde U es el subespacio de V que forman las funciones constantes.
2. Sea S = {x1, x2, ..., xn} un conjunto de vectores de un espacio vectorial; considérese el nuevo
conjunto T = {y1, x2, ..., xn}, donde y1 = x1 + a2x2 + ... + anxn, para cualesquiera escalares a2, ..., an.
Pruébese que T es independiente si, y sólo si, lo es S.
Ker(g ) f ) = f −1 (Kerg 3 Im f )
ENM Matemáticas I Álgebra lineal 13
MATRICES
Primeras definiciones
a 11 a 12 $$$ a 1n
a 21 a 22 $$$ a 2n
$$$ $$$ $$$ $$$
a m1 a m2 $$$ a mn
1[i[m
(a ij )
1[j[n
En general cuando hablemos de una matriz A de orden m×n escribiremos A = (aij) entendiendose que
los índices varían de la forma: 1 ≤ i ≤ m y 1 ≤ j ≤ n.
Definición. Cuando en una matriz el número de filas sea igual al número de columnas (m = n),
diremos que es una matriz cuadrada de orden "n" y representaremos por Mn(K) al conjunto de todas las
matrices cuadradas de orden "n".
Definición. Sean A = (aij), B = (bij) ∈ Mm×n(K), decimos que A es igual a B, si, y sólo si:
aij = bij ∀ i, j
Definición. Sea A = (aij) ∈ Mn(K), se llama diagonal principal al conjunto {a11, a22, ..., ann}.
Definición. Sea A = (aij) ∈ Mn(K), se llama diagonal secundaria al conjunto {aij / i + j = n + 1}.
Definición. Sea A = (aij) ∈ Mn(K), se dice que A es una matriz triangular superior cuando son nulos
todos sus elementos situados por debajo de la diagonal principal; es decir cuando aij = 0 si i > j.
Se dice que A es una matriz triangular inferior cuando son nulos todos sus elementos situados por
encima de la diagonal principal; es decir cuando aij = 0 si i < j.
Definición. Sea A = (aij) ∈ Mn(K), se dice que A es una matriz diagonal cuando todos los elementos
no situados en la diagonal principal son cero; es decir A = (aijδij).
Definición. Sea A = (aij) ∈ Mn(K), se dice que A es una matriz escalar cuando todos los elementos no
situados en la diagonal principal son cero y los elementos de la diagonal principal son todos iguales; es
decir A = (aδij). Cuando a = 1, se dice que A es una matriz unidad y se representará por In.
ENM Matemáticas I Álgebra lineal 14
Definición. Sea A = (aij) ∈ Mm×n(K), se dice que A es la matriz nula cuando todos los elementos son
cero; es decir A = (0).
Definición. Si A es una matriz que sólo posee una fila recibirá el nombre de matriz fila. Si A es una
matriz que sólo posee una columna recibirá el nombre de matriz columna.
×n
Espacio vectorial de la matrices de orden m×
Definición. Sean A = (aij) y B = (bij) ∈ Mm×n(K), se llama matriz suma de A y B y se representa por
A + B, a la matriz que resulta de sumar los elementos de las matrices A y B que ocupan el mismo lugar,
es decir; A + B = (aij + bij) ∈ Mm×n(K).
Definición. Sea A = (aij) ∈ Mm×n(K) y sea λ∈K, se llama matriz producto de λ por A y se representa
por λA, a la matriz que resulta de multiplicar todos los elementos de la matriz A por el escalar λ, es
decir; λA = (λaij) ∈ Mm×n(K).
Producto de matrices
Definición. Sea A = (aij) ∈ Mm×p(K), y B = (bjk) ∈ Mp×n(K). Se llama matriz producto de A por B y se
representa por AB a la matriz (cik) ∈ Mm×n(K) donde cik = ai1b1k + ai2b2k + ... + ainbnk.
2. Observación: Cuando las matrices A y B son cuadradas de orden "n", tienen sentido los productos
AB y BA y ambos son matrices cuadradas de orden "n", pero en general AB ≠ BA. Lo que se
resume diciendo que el producto de matrices no verifica la propiedad conmutativa.
ENM Matemáticas I Álgebra lineal 15
Siempre que se puedan efectuar las operaciones que se indican a continuación, se verifican las
siguientes propiedades:
1. Asociativa: (AB)C = A(BC).
2. Distributiva: (A + B)C = AC + BC y C(A + B) = CA + CB.
3. El producto de dos matrices no nulas puede ser una matriz nula; como por ejemplo:
0 0 1 0 1 0 0 0
=
0 1 0 0 0 0 0 0
Definición. Sea A ∈ Mn(K), decimos que A es una matriz regular si ∃ A-1 ∈ Mn(K), llamada inversa
de A, tal que:
AA-1 = A-1 A = In
Las matrices cuadradas no regulares se llaman matrices singulares; ellas son, pues, matrices no
inversibles.
Propiedades
1. Sean A y B ∈ Mn(K), si A y B son matrices regulares, entonces AB es una matriz regular y se
verifica que (AB)-1 = B-1A-1.
2. Si A es una matriz regular, si, y sólo si, es simplificable para el producto.
Las ecuaciones de una aplicación lineal, vistas anteriormente, se pueden ahora escribir en notación
matricial de la forma:
y1 a 11 a 12 $$$ a 1n x1
y2 a 21 a 22 $$$ a 2n x2
= ,
$$$ $$$ $$$ $$$ $$$ $$$
ym a m1 a m2 $$$ a mn xn
Las ecuaciones del cambio de base, vistas anteriormente, se pueden ahora escribir en notación matricial
de la forma:
x1 a 11 a 12 $$$ a 1n x ,1
x2 a 21 a 22 $$$ a 2n x ,2
= ,
$$$ $$$ $$$ $$$ $$$ $$$
xn a n1 a n2 $$$ a nn x ,n
Equivalencia de matrices
Definición. Sean A = (aij), B = (bij) ∈ Mm×n(K), se dice que A y B son matrices equivalentes si existen
dos matrices, P ∈ GLn(K) y Q ∈ GLm(K), tales que B = Q-1AP.
Sea f: V → W una aplicación lineal, del e.v. V de dimensión n en el e.v. W de dimensión m, ambos
sobre el mismo cuerpo K. Sea BV = {v1, v2, ..., vn} una base de V y BW = {w1, w2, ..., wm} una base de W;
sabemos que respecto de estas bases hay una, y sólo una, matriz A = (aij) ∈ Mm×n(K) asociada a la
aplicación lineal f, que permite escribir la ecuación de f, en dichas bases de la forma Y = AX.
Supóngase que en V tomamos otra base B'V = {v'1, v'2, ..., v'n}, y que en W también se elige una nueva
base B'W = {w'1, w'2, ..., w'm}; respecto de estas bases, la aplicación f tiene asociada una nueva matriz
B = (bij) ∈ Mm×n(K), la cual proporciona la ecuación de f, en las nuevas bases, es decir, Y' = BX'. Sabemos
que a los cambios de base en V y W están determinados, por dos matrices P ∈ GLn(K) y Q ∈ GLm(K),
que son las que permiten expresar los cambios de coordenadas de la siguiente forma:
X = PX' e Y = QY'
En estas condiciones, como Y = AX, será QY' = A(PX') y, por tanto, Y' = (Q-1AP)X' de donde se
deduce que B = Q-1AP, es decir, A y B son equivalentes.
ENM Matemáticas I Álgebra lineal 17
Semejanza de matrices
La semejanza de matrices puede ser considerada como un caso particular de la equivalencia. Así como
la equivalencia se definía entre matrices rectangulares cualesquiera, pero ambas de igual tamaño, la
semejanza sólo se define entre matrices cuadradas del mismo tamaño.
Definición. Sean A = (aij), B = (bij) ∈ Mn(K), se dice que A y B son matrices semejantes si existe una
matriz, P ∈ GLn(K), tal que B = P-1AP.
X = PX' e Y = PY'
PY' = A(PX')
y, por tanto,
Y' = (P-1AP)X'
de donde se deduce que B = P-1AP, es decir, A y B son semejantes y es P la matriz que transforma A en B.
Propiedades
Trasposición de matrices
Definición. Sea A = (aij) ∈ Mm×n(K), se llama traspuesta de A, y se representa por At, a la matriz que
se obtiene de cambiar filas por columnas, es decir At = (aji) ∈ Mn×m(K).
Propiedades
1. (At)t = A.
2. (A + B)t = At + Bt.
3. (kA)t = kAt .
4. (AB)t = BtAt .
5. Si A es una matriz regular, ⇒ (A-1)t = (At )-1.
6. Si dos matrices son equivalentes, también lo son sus traspuestas.
7. Si dos matrices cuadradas son semejantes, también lo son sus traspuestas.
Ejercicios
2. Demostrar que toda matriz cuadrada, puede descomponerse en suma de una matriz simétrica y otra
antisimétrica.
Congruencia de matrices
Definición. Sean A = (aij), B = (bij) ∈ Mn(K), se dice que A y B son matrices congruentes si existe
una matriz, P ∈ GLn(K), tal que B = PtAP.
Si A = (aij) ∈ Mn(K) es una matriz simétrica, también son simétricas todas las matrices congruentes con
ella; es decir, si A = At, entonces B = PtAP también satisface que Bt = B, ya que
Definición. Sea Α = (aij) ∈ Mm×n(K); se llama rango de una matriz A, al rango de filas o al rango de
columnas de la misma, ya que ambos son iguales, y se representa por rang A.
Consecuencia inmediata de esta definición es que el rango de una matriz es el mismo que el de su
matriz traspuesta, es decir, que:
rang A = rang At
Teorema.- Una matriz cuadrada de tamaño n es regular si, y sólo si, su rango es n.
Consecuencia.- Una matriz cuadrada es regular si, y sólo si, sus vectores columna son independientes;
igualmente ocurre con su vectores fila.
Es evidente que si, en un conjunto de vectores {v1, v2, ..., vp} de un espacio vectorial, se realiza
cualquiera de las manipulaciones siguientes:
1. permutar entre sí los vectores del conjunto,
2. sustituir el vector vi por el vi + λvj (λ escalar),
3. multiplicar vi por λ ≠ 0,
se obtiene un nuevo conjunto equivalente al dado, es decir, un conjunto con igual rango.
Las anteriores manipulaciones, aplicadas al conjunto de vectores fila o al conjunto de vectores columna
de una matriz, reciben el nombre de operaciones elementales para la matriz dada.
Por consiguiente, al aplicar a una matriz operaciones elementales, se obtiene una nueva matriz de igual
rango que la dada. Este hecho se puede utilizar, entre otras cosas, para localizar el rango de una matriz y
para hallar la matriz inversa de una matriz regular.
ENM Matemáticas I Álgebra lineal 20
1 −3 2 1 5
−1 5 1 2 −3
A=
2 2 −3 4 −6
−4 6 2 −3 −2
se puede proceder, aplicando operaciones elementales a sus filas, del siguiente modo:
En A, se sustituyen: F2 por F2 + F1; F3 por F3 - 2F1; y F4 por F4 + 4F1, obteniendo la matriz equivalente a
la matriz dada A:
1 −3 2 1 5
0 2 3 3 2
0 8 −7 2 −16
0 −6 10 1 18
En la matriz así obtenida se sustituyen: F3 por F3 - 4F2; F4 por F4 + 3F2, obteniendo la matriz equivalente
a la matriz dada A:
1 −3 2 1 5
0 2 3 3 2
0 0 −19 −10 −24
0 0 19 10 24
En la matriz así obtenida, se sustituye la F4 por F4 + F3, obteniendo la matriz equivalente a la matriz
dada A:
1 −3 2 1 5
0 2 3 3 2
0 0 −19 −10 −24
0 0 0 0 0
y como quiera que el rango de esta última es tres, resulta que el rang A = 3.
ENM Matemáticas I Álgebra lineal 21
2 −1 −3 5
3 2 −1 1
A=
−2 2 4 −3
1 4 1 −2
2 −1 −3 5 1 0 0 0
3 2 −1 1 0 1 0 0
−2 2 4 −3 0 0 1 0
1 4 1 −2 0 0 0 1
si, en las filas de esta matriz, se realizan las operaciones elementales consistentes en sustituir: F2 por 2F2 -
3F1; F3 por F3 + F2; y F4 por 2F4 - F1, se llega a:
2 −1 −3 5 1 0 0 0
0 7 7 −13 −3 2 0 0
0 1 1 2 1 0 1 0
0 9 5 −9 −1 0 0 2
si, en las filas de esta matriz, se realizan las operaciones elementales consistentes en sustituir: F2 por F2 -
7F3; y F4 por F4 - 9F3, se llega a:
2 −1 −3 5 1 0 0 0
0 0 0 −27 −10 2 −7 0
0 1 1 2 1 0 1 0
0 0 −4 −27 −10 0 −9 2
si, en las filas de esta matriz, se realizan las operaciones elementales consistentes en permutar F2 con F3 y
después F4 con F3, se llega a:
2 −1 −3 5 1 0 0 0
0 1 1 2 1 0 1 0
0 0 −4 −27 −10 0 −9 2
0 0 0 −27 −10 2 −7 0
si, en las filas de esta matriz, se realizan las operaciones elementales consistentes sustituir: F1 por F1 + F2;
F2 por 4F2 + F3; y F3 por F3 - F4, se llega a:
2 0 −2 7 2 0 1 0
0 4 0 −19 −6 0 −5 2
0 0 −4 0 0 −2 −2 2
0 0 0 −27 −10 2 −7 0
ENM Matemáticas I Álgebra lineal 22
si, en las filas de esta matriz, se realizan las operaciones elementales consistentes en sustituir: F1 por 2F1 -
F3: y F2 por 27F2 - 19F4, se llega a:
4 0 0 14 4 2 4 −2
0 108 0 0 28 −38 −2 54
0 0 4 0 0 2 2 −2
0 0 0 −27 −10 2 −7 0
si, en las filas de esta matriz, se realiza la operación elemental consistente en sustituir: F1 por 27F1 + 14F4, se
llega a:
54 0 0 0 −16 41 5 −27
0 108 0 0 28 −38 −2 54
0 0 4 0 0 2 2 −2
0 0 0 −27 −10 2 −7 0
si, en las filas de esta matriz, se realizan las operaciones elementales consistentes en multiplicar la F1 por
1/54, multiplicar la F2 por 1/108, multiplicar la F3 por 1/4 y multiplicar la F4 por -1/27, se llega finalmente
a:
− 8 41 5 −1
1 0 0 0 27 54 54 2
7 − 19 − 1 1
0 1 0 0 27 54 54 2
0 0 1 0 0 1 1 −1
2 2 2
0 0 0 1 10 − 2 7 0
27 27 27
por tanto, la matriz inversa de la matriz dada A es la constituida por las cuatro últimas columnas de esta
última matriz.
ENM Matemáticas I Álgebra lineal 23
Ejercicios propuestos
2. Si es A ∈ Mp(R) la matriz:
0 1 0 ... 0 0
0 0 1 ... 0 0
0 0 0 ... 0 0
.. .. ... ... .. ..
0 0 0 ... 0 1
0 0 0 ... 0 0
2 n
Calcúlese I + A + A + ... + A + ...
1! 2! n!
3. Se llama traza de una matriz A ∈ Mn(R) a la suma de los elementos de la diagonal principal.
Pruébese que:
a) Si A, B ∈ Mn(R), se verifica que:
traza(λA) = λ⋅traza(A), ∀ λ ∈ K.
traza(A + B) = traza(A) + traza(B),
traza(A⋅B) = traza(B⋅A).
b) Si A, B ∈ Mn(R) son matrices semejantes, entonces tienen sus trazas iguales.
4. Si A y B son dos matrices simétricas del mismo tamaño, pruébese que AB es simétrica si, y sólo si,
A y B conmutan.
DETERMINANTES
Permutaciones
Definición. Se llama permutación para un conjunto finito A = {1, 2, ..., p} a toda aplicación biyectiva
σ: A → A. Si σ es la permutación de A que transforma 1 en h, 2 en k, ..., p en 1, se la representará
escribiendo:
1 2 $$$ p
= ,
h k $$$ 1
en donde, debajo de cada elemento i de A se escribe su imagen σ(i). En ocasiones, para abreviar la
notación, a la imagen σ(i) se la denotará por σi. Dado un conjunto de p elementos, el número de
permutaciones que se pueden establecer en él es, evidentemente p!.
Definición. Se llaman transposiciones para un conjunto finito A = {1, 2, ..., p} a las permutaciones
que sólo cambian un par de elementos entre sí. La permutación τ: A → A es, pues, una transposición si
existen i, j ∈ {1, 2,..., p} tales que τ(i) = j, τ(j) = i y, ∀ h ≠ i, j, τ(h) = h; es decir es de la forma:
Definición. Una permutación σ: A → A del conjunto de p elementos A = {1, 2, ..., p}, proporciona,
para los elementos de A, la nueva ordenación σ(1), σ(2), ..., σ(p). Se dice que los elementos σ(i) y σ(j)
forman una inversión si, en la nueva ordenación, tienen distinta posición relativa que la que tenían
inicialmente; es decir, suponiendo que i < j, formarán inversión si σ(j) ocupa un lugar anterior, en la
nueva ordenación, que σ(i). Se representará por I(σ) al número total de inversiones que presenten entre sí
los elementos de la permutación σ(1), σ(2), ..., σ(p); se dice que σ es de clase par si I(σ) es par, y que es
de clase impar cuando I(σ) sea impar.
Definición. Se llama signatura de una permutación σ: A → A, al número real ε(σ) = (-1)I(σ), donde
I(σ) es el número de inversiones de σ; la signatura de σ es, pues, igual a 1 si σ es de clase par, e igual a -1
si σ es de clase impar.
det(A) = ( )a 1,(1 ) a 2,(2 ) , ..., a n,(n ) = ( )a (1 ),1 a (2 ),2 , ..., a (n ),n ,
cS(n ) cS(n )
donde la suma se extiende a las n! permutaciones de {1, 2, ..., n} y ε(ν) y ε(σ) denotan las signaturas de
las permutaciones ν y σ, respectivamente.
Por tanto podemos decir que, det(A) es la suma de todos los productos de la forma:
a 11 a 12 $$$ a 1n
a 21 a 22 $$$ a 2n
A= = (a ij ) c M n (K ) ,
$$$$ $$$$ $$$ $$$$$
a n1 a n2 $$$ a nn
a 11 a 12 $$$ a 1n
a 21 a 22 $$$ a 2n
det(A) = ,
$$$$ $$$$ $$$ $$$$$
a n1 a n2 $$$ a nn
a 11 a 12
A=
a 21 a 22
ENM Matemáticas I Álgebra lineal 26
el cual constará de 2! = 2 sumandos, como las permutaciones de {1, 2} son (1, 2), de clase par y (2,1), de
clase impar, se obtendrá:
det(A) = a11a22 - a12a21.
Para la matriz
a 11 a 12 a 13
A= a 21 a 22 a 23
a 31 a 32 a 33
det(A) será la suma algebraica de 3! = 6 sumandos. Como las permutaciones de {1, 2, 3} son (1,2,3), de
clase par; (1,3,2) de clase impar; (2,1,3), de clase impar; (2,3,1), de clase par; (3,1,2), de clase par, y
(3,2,1), de clase impar, será:
(los tres sumandos positivos se obtienen de la diagonal principal y sus paralelas; los tres sumandos
negativos, de la diagonal secundaria y sus paralelas: regla de Sarrus).
det(I) = 1
Ejercicios. Demuéstrese que el determinante de una matriz triangular es el producto de los elementos
de su diagonal principal.
Sea A = (aij) ∈ Mn(K), designando, por Aj al vector columna que ocupa el lugar j de la matriz A,
escribiremos:
det(A) = det(A1, A2, ..., An)
1. det(A) = det(At). (Todo lo que se diga para columnas, se verifica pues para filas)
2. det(A1, A2, ..., Ai, ..., Aj, ..., An) = - det(A1, A2, ..., Aj, ..., Ai, ..., An).
3. det(A1, A2, ..., Ai + Bi, ..., An) = det(A1, A2, ..., Ai , ..., An) + det(A1, A2, ..., Bi, ..., An).
4. det(A1, A2, ...,λAi, ..., An) = λdet(A1, A2, ..., Ai, ..., An).
5. det(A1, A2, ..., Ai, ..., An) = 0 ⇔ A1, A2, ..., Ai, ..., An son dependientes.
6. det(A1, A2, ..., Ai, ..., An) = det(A1, ..., Ai + λ1A1 + ... + λi-1Ai-1 + λi+1 Ai+1 + ... + λnAn, ..., An).
Consecuencia 1ª. El determinante de una matriz antisimétrica, de orden "n", cuando "n" es impar es
nulo (si la característica del cuerpo es distinta de dos).
En efecto, si A es una matriz antisimétrica, se verifica que At = - A; ⇒ como det(A) = det(At), se tiene
que det(A) = det(At) = det(-A) = (-1)ndet(A) = - det(A) (por n impar) ⇒ 2det(A) = 0, y como la
característica del cuerpo K no es dos, se tiene que det(A) = 0.
ENM Matemáticas I Álgebra lineal 27
Consecuencia 2ª. (Determinante de Vandermonde) Se llaman con este nombre a los determinantes de la
forma:
1 1 1 $$$ 1
x1 x2 x3 $$$ xn
D n = x 21 x 22 x 23 $$$ x 2n
$$$$ $$$$ $$$$ $$$ $$$$
x n−1
1 x n−1
2 x n−1
3 $$$ x n−1
n
Para resolver este determinante, procederemos de la siguiente forma: Fk - xnFk-1, con k = n, ..., 2, y
aplicando la propiedad d) obtenemos:
1 1 1 $$$ 1 1 1 1 $$$ 1
x1 x2 x3 $$$ xn x1 x2 x3 $$$ x n−1
D n = x 21 x 22 x 23 $$$ x 2n = (x n − x 1 ) $ $(x n − x n−1 ) x 21 x 22 x 23 $$$ x 2n−1
$$$$ $$$$ $$$$ $$$ $$$$ $$$$ $$$$ $$$$ $$$ $$$$
x n−1
1 x n−1
2 x n−1
3 $$$ x n−1
n x n−2
1 x n−2
2 x n−2
3 $$$ x n−2
n−1
de donde se desprende que un determinante de Vandermonde sólo puede ser nulo en el caso de tener dos
de sus columnas iguales.
Descripción del método. Supóngase que queremos determinar el valor del determinante de una matriz
A = (aij) ∈ Mn(K); entonces, se puede proceder de la siguiente forma:
1. Si ai1 = 0 ∀ i = 1, 2, ..., n ⇒ det(A) = 0. Si ∃ ai1 ≠ 0 con i ∈ {1, 2, ..., n}, e i ≠ 1 intercambiamos
entre si la primera fila con la fila "i", obteniendo una matriz A(1) = (aij(1)) tal que
det(A(1)) = - det(A).
En la matriz A(1) así obtenida, hacemos: Fk - (ak1(1)/a11(1))F1 ∀ k = 2, ..., n; con ello se obtiene otra
matriz A(2) = (aij(2)) tal que a11(2) ≠ 0 ai1(2) = 0 ∀ i = 2, ..., n, y det(A(2)) = det(A(1)).
2. Si ai2(2) = 0 ∀ i = 2, ..., n ⇒ det(A(2)) = 0 (ya que las dos primeras columnas serian proporcionales).
Si ∃ ai2(2) ≠ 0 con i ∈ {2, ..., n}, e i ≠ 2 intercambiamos entre si la segunda fila con la fila "i",
obteniendo una matriz A(3) = (aij(3)) tal que
det(A(3)) = - det(A(2)).
En la matriz A(3) así obtenida, hacemos: Fk - (ak2(3)/a22(3))F2 ∀ k = 3, ..., n; con ello se obtiene otra
matriz A(4) = (aij(4)) tal que a22(4) ≠ 0 ai2(4) = 0 ∀ i = 3, ..., n, y det(A(4)) = det(A(3)).
3. Siguiendo este proceso se llega a una matriz triangular superior cuyo determinante es el producto
de los elementos de su diagonal principal.
Evidentemente, el proceso que se acaba de describir admite multitud de variantes. Obsérvese, a este
respecto, que la elección de unas u otras líneas, para, mediante los pasos sucesivos, conseguir matrices
que cada vez tengan mayor número de elementos nulos, es totalmente arbitrario; no se han de elegir
forzosamente las 1ª, 2ª, ..., nª columnas, sino que se tomarán aquellas para las que, en cada caso concreto,
ENM Matemáticas I Álgebra lineal 28
se espere que el proceso vaya a resultar lo mas breve posible. Nótese también que, para conseguir que se
transforme en cero un elemento aij, i > j, a la fila del lugar "i" se le ha restado la de lugar "j" multiplicada
por aij/ajj; en muchas ocasiones, sin embargo, es preferible operar de este modo: multiplicar la fila de lugar
"i" por ajj, con lo que el determinante queda multiplicado por dicho elemento, y a continuación restarle la
fila de lugar j multiplicada por aij. Estas y otras modificaciones, utilizadas con acierto, pueden reducir el
proceso de cálculo que se acaba de describir.
Definición. Sea A = (aij) ∈ Mn(K), se llama menor del elemento aij de la matriz A, al determinante de
la submatriz cuadrada de A; que resulta de eliminar la fila i y la columna j de la matriz A, es decir:
a 11 ... a 1(j−1 ) a 1(j+1 ) ... a 1n
........ ... ............ ............. ... .........
a (i−1 )1 ... a (i−1 )(j−1 ) a (i−1 )(j+1 ) ... a (i−1 )1
ij =
a (i+1 )1 ... a (i+1 )(j−1 ) a (i+1 )(j+1 ) ... a (i+1 )1
........ ... ............. ............. ... .........
a n1 ... a n(j−1 ) a n(j+1 ) ... a nn
Definición. Sea A = (aij) ∈ Mn(K), se llama cofactor del elemento aij de la matriz A, al menor del
elemento aij multiplicado por (-1)i+j, es decir:
Aij = (-1)i+jαij
det(A ) = a 1i A 1i + a 2i A 2i + $ $ $ + a ni A ni = a i1 A i1 + a i2 A i2 + $ $ $ + a in A in,
Propiedad. Sea A = (aij) ∈ Mn(K). La suma de los productos de los elementos de una línea (fila o
columna) por los cofactores de una paralela es cero; es decir:
a 1i A 1j + a 2i A 2j + $ $ $ + a ni A nj = 0, si i ! j,
a i1 A j1 + a i2 A j2 + $ $ $ + a in A jn = 0, si i ! j.
(A ij ) c M n (K )
det(A)⋅det(A-1) = 1;
Teorema. Sea A ∈ Mm×n(K). Si A tiene un menor de orden p, no nulo, entonces las p columnas (filas)
que determinan tal menor son independientes.
Teorema. El rango de una matriz A ∈ Mm×n(K) es el mayor de los órdenes de sus menores no nulos.
Cálculo práctico del rango de una matriz recurriendo a sus menores. Sea A ∈ Mm×n(K). Veamos
como se determina el rango de A.
2. Para determinar si tiene rango mayor o igual que 2, se busca un menor de orden 2 distinto de cero.
Si todos los menores de orden 2 son cero, entonces el rango de la matriz A es 1. Si existe un menor
de orden 2 distinto de cero, el rango de la matriz A es mayor o igual que 2.
3. Para determinar si tiene rango mayor o igual que 3, partiendo del menor de orden 2 distinto de cero,
se estudian todos los posibles menores de orden 3 que lo contengan. Si todos ellos son nulos, el
rango de A es 2. Si, por el contrario, alguno de ellos es distinto de cero, el rango de A es mayor o
igual que 3.
Ejercicios propuestos
1. Sea una matriz regular A ∈ Mn(K) tal que sus elementos son números enteros. Pruébese que A-1
tiene todos sus elementos enteros si, y sólo si, det(A) = ± 1.
2. Sea A = (aij) ∈ Mn(K) una matriz que tiene nulos más de n2 - n de sus elementos; pruébese que
det(A) = 0.
5. Calcúlese el determinante:
12 22 32 $$$ n2
22 32 42 $$$ (n + 1 ) 2
32 42 52 $$$ (n + 2 ) 2
$$$ $$$ $$$ $$$ $$$
n n+1 n + 2) (2n − 1 ) 2
2 ( 2 2
) ( $$$
6. Calcúlese el determinante:
1 1 1 $$$ 1
1 1+a 1 $$$ 1
1 1 1+a $$$ 1
$$$ $$$ $$$ $$$ $$$
1 1 1 $$$ 1+a
ENM Matemáticas I Álgebra lineal 31
σ(f o A) = {λ ∈ K | λ es autovalor de f o de A}
Observación. No todos los endomorfismos o matrices poseen autovalores, como pone de manifiesto el
siguiente ejemplo:
Sea f: R2 → R2, definido por f(x, y) = (y, -x). La ecuación f(x, y) = λ(x, y), ⇒ x = - λy, e y = λx, de las
cuales se deduce que para que λ sea autovalor de f ha de satisfacerse que λ2 = -1, ecuación que no tiene
solución en el cuerpo R y, por tanto, f no tiene ningún autovalor.
Propiedades.
1. Sea λ ∈ σ(f o de A) ⇒ Vλ = {x ∈ V | f(x) = λx} o Vλ = {X ∈ Mn×1(K) | AX = λX} es un subespacio
vectorial de V o de Mn×1(K), y se denomina subespacio propio correspondiente a λ (en Vλ están los
vectores propios asociados a λ y el vector nulo).
2. Sean λ1 y λ2 ∈ σ(f o de A), con λ1 ≠ λ2 ⇒ V 1 3 V 2 = O.
3. Sean λ1, λ2, ..., λr ∈ σ(f o de A), con λi ≠ λj si i ≠ j, y sean xi o Xi ∈ V i − o , ∀ i = 1, 2, ..., r ⇒
{x1, x2, ..., xr} o {X1, X2, ..., Xr} es un conjunto de vectores independientes.
Sean V un espacio vectorial de dimensión finita, n, sobre un cuerpo K, B = {e1, e2, ..., en} una base de V,
y A = (aij) ∈ Mn(K) la matriz asociada a f en la base B o una matriz de orden n cualquiera.
Los autovectores correspondientes al autovalor λ son, pues, aquellos vectores no nulos tales que la
matriz columna de sus coordenadas X ∈ Mn×1(K), verifican:
(A - λI)X = O,
es decir, constituyen una solución no nula del conjunto homogéneo de ecuaciones lineales:
(a 11 − )x 1 + a 12 x 2 + $ $ $ + a 1n x n = 0
a 21 x 1 + (a 22 − )x 2 + $ $ $ + a 2n x n = 0
$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$
a n1 x 1 + a n2 x 2 + $ $ $ + (a nn − )x n = 0
Para que exista solución no nula, ha de verificarse que |A - λI| = 0.
ENM Matemáticas I Álgebra lineal 32
o lo que es lo mismo
a 11 − a 12 $ $ $ a 1n
a 21 a 22 − $ $ $ a 2n
=0
$$$$$$$ $$$$$$$ $$$ $$$$$$
a n1 a n2 $ $ $ a nn −
Las soluciones de la ecuación característica son los autovalores del endomorfismo f o de la matriz A;
es decir, el espectro de f o de A es el conjunto de las soluciones de esta ecuación.
p(λ) = |A - λI|.
donde:
a0 =|A|
n
ak = (-1)k[suma de los menores diagonales de orden n - k de la matriz A]
k
an = (-1)n.
Teorema. Sea p(λ) = |A - λI|, el polinomio característico del endomorfismo f o de la matriz A, y sea
q(λ) = |A' - λI|, el polinomio característico del endomorfismo f, donde A' es la matriz asociada a f en una
base B' = {e1', e2', ..., en'} de V o A' es una matriz semejante a A. Pues bien, se verifica que: p(λ) = q(λ).
Este resultado, permite decir que el polinomio característico del endomorfismo f depende única y
exclusivamente de f.
Nota. No obstante, conviene destacar que en general, del sólo hecho de tener dos matrices los mismos
autovalores y éstos de igual orden, no se infiere que dichas matrices sean semejantes.
1 0 1 1
A= y B=
0 1 0 1
tienen ambas por ecuación característica a (λ - 1)2 = 0, esto es, tienen un sólo autovalor, λ = 1, de orden
dos. Sin embargo, no son semejantes, pues, de serlo, existiría una matriz regular de tamaño dos:
a b
P= ,
c d
ENM Matemáticas I Álgebra lineal 33
a a+b a b
PB = y AP = ,
c c+d c d
luego, para que fuesen iguales, habría de ser a = 0 y c = 0, con lo cual P no sería regular.
donde λ1, λ2, ..., λr son todos los autovalores de f o de A, que son, respectivamente de órdenes α1, α2, ...,
αr. En este supuesto, de ser K algebraicamente cerrado, f o A, tienen al menos un autovalor y como
máximo tiene n; si cada autovalor se cuenta tantas veces como indica su orden de multiplicidad, se puede
afirmar que f o A tienen exactamente n autovalores.
La dimensión del subespacio Vλ, esto es, el número máximo de vectores propios correspondientes a λ
que son independientes, será pues:
Invarianza, por semejanza, de las dimensiones de los subespacios propios. Si A y A' son matrices
semejantes, para cualquiera que sea su autovalor λ, los subespacios propios de una y otra matriz, que
serán distintos subespacios, son las expresiones en coordenadas, en distintas bases de Mn×1(K), del
subespacio propio del endomorfismo asociado a ambas matrices (en las referidas bases) correspondientes
al autovalor λ; como la dimensión de un subespacio no varía por el hecho de expresar éste en una u otra
base, los subespacios propios de A y A', correspondientes a λ, tienen igual dimensión, la del subespacio
propio, correspondiente a λ, del susodicho endomorfismo.
ENM Matemáticas I Álgebra lineal 34
1 ≤ d ≤ α.
Definición. Sea A ∈ Mn(K); decimos que A es diagonalizable (por semejanza), sí, y sólo sí, existe D
= (dijδij) ∈ Mn(K), y una matriz regular P ∈ GLn(K), tal que D = P-1AP.
Teorema. Una matriz D ∈ Mn(K) es diagonal ⇔ admite por vectores propios a las n matrices, de
Mn×1(K):
1 0 0
0 1 0
E1 = , E2 = , ..., E n =
$$ $$ $$
0 0 1
ENM Matemáticas I Álgebra lineal 35
Teorema. A ∈ Mn(K) es diagonalizable (por semejanza) si, y sólo si, admite n vectores propios
independientes. Es decir: una matriz A ∈ Mn(K) es diagonalizable (por semejanza) si, y sólo si, se
verifican las dos condiciones siguientes:
1. La matriz A admite, si se cuenta cada uno un número de veces igual a su orden de multiplicidad,
exactamente n autovalores (pertenecientes a K). Cuando el cuerpo K es algebraicamente cerrado, y
en particular si es K = C, esta condición se satisface para toda matriz A ∈ Mn(K).
2. La multiplicidad de cada uno de los autovalores de A es igual a la dimensión del subespacio propio.
Consecuencia. Si una matriz A ∈ Mn(K) admite n autovalores distintos, entonces es diagonalizable (por
semejanza).
1 0 0 0
1 −4 −1 6
A= c M 4 (C )
−1 3 2 −4
0 −2 0 3
1− 0 0 0
1 −4 − −1 6
= 0,
−1 3 2 − −4
0 −2 0 3−
obteniendo: (λ - 1)(λ3 - λ2 + λ - 1) = 0.
2º) Calculamos los autovalores, es decir, las raíces de la ecuación característica; obteniendo:
λ1 = λ2 = 1, λ3 = i, λ4 = -i.
3º) Calculamos los subespacios propios de A, correspondientes a todos sus autovalores, es decir,
1 0
0 1
V1 = { X ∈ M4×1(C) / (A - 1I)X = O} = < , > ⇒ dimV1 = 2.
1 1
0 1
0
3−i
V3 = { X ∈ M4×1(C) / (A - iI)X = O} = < > ⇒ dimV3 = 1.
−1 + i
2
ENM Matemáticas I Álgebra lineal 36
0
3+i
V4 = { X ∈ M4×1(C) / (A + iI)X = O} = < > ⇒ dimV4 = 1.
−1 − i
2
Como la matriz A posee 4 autovalores, si cada uno se cuenta tantas veces como indica su orden de
multiplicidad, y el orden de cada autovalor de A es igual a la dimensión del subespacio propio asociado,
entonces A es diagonalizable por semejanza (en C); es decir, se verifica que D = P-1AP, siendo
1 0 0 0 1 0 0 0
0 1 0 0 0 1 3−i 3+i
D= , yP=
0 0 i 0 1 1 −1 + i −1 − i
0 0 0 −i 0 1 2 2
Teorema. Sea A una matriz simétrica, y sean λ1, y λ2 dos autovalores de A con λ1 ≠ λ2, entonces si X1
es un vector propio correspondiente a λ1 y X2 es un vector propio correspondiente a λ2, se verifica que
X2t⋅X1 = 0.
Teorema. Todos los autovalores de una matriz real y simétrica son números reales.
Teorema. Si A es una matriz real simétrica de orden n; entonces, A tiene un vector propio real.
Ejercicios propuestos
2. Estúdiese, según los valores reales de α, la diagonalizabilidad (por semejanza) de las matrices:
1 −2 −2 − 1 + −
A= 0 1 y B= 2 + − − 1
0 0 1 0 −1 0
Para los valores de α que las hacen diagonalizables, hállense sus formas diagonales D y una matriz
regular P tal que D = P-1AP y D = P-1BP, respectivamente.
3. De un f œ End(R3) se sabe que son vectores propios (1, 0, 0), (1, 1, 0), (0, 1, 0) y (0 ,0, 1).
Sabiendo, además que hay vectores de R3 que no son vectores propios, hállense todos los vectores
propios de f.
5. Sea f: R4 → R4 el endomorfismo definido por f(x, y, z, t) = (x, 2x, x, x + ay). Hállese a ∈ R para
que f sea diagonalizable, localizando, cuando lo sea, una base de R4 en la que f tenga su matriz
asociada diagonal.
6. Si f es un endomorfismo nilpotente, esto es, tal que f k = O, para cierto k ∈ N, pruébese que f
admite a cero como su único autovalor.
7. Sea A ∈ Mn(K) una matriz idempotente, esto es, tal que A2 = A, de rango r.
a) Pruébese que sus únicos autovalores son 0 y 1.
b)Pruébese que el subespacio propio Vλ = 0 tiene dimensión n - r y que Vλ = 1 tiene dimensión r;
dedúzcase de ello que A es diagonalizable y hállese su forma diagonal.
2 1 a
8. Dada la matriz A = 1 2 1 . Se pide:
1 1 1
a) Estudiar para que valores de "a", es diagonalizable la matriz A.
b) Hallar una matriz C tal que C-1AC sea una matriz diagonal y calcular dicha matriz diagonal.
c) Hallar para algún valor de "a", una matriz ortogonal P ∈ M3(R) tal que PtAP sea una matriz
diagonal.
ENM Matemáticas I Álgebra lineal 38
Definición. Sea V un espacio vectorial real, se llama producto interior sobre V a toda aplicación
〈 , 〉 : V2 → R
(x, y) → 〈x, y〉
que verifica los axiomas:
1. 〈x, y〉 = 〈y, x〉, ∀ x, y ∈ V, (conmutatividad, o simetría)
2. 〈x, y + z〉 = 〈x, y〉 + 〈x, z〉, ∀ x, y, z ∈ V, (distributiva o linealidad)
3. 〈λx, y〉 = λ〈x, y〉, ∀ x, y ∈ V y ∀ λ ∈ R, (asociatividad, u homogeneidad)
4. 〈x, x〉 ≥ 0, ∀ x ∈ V, 〈x, x〉 = 0 ⇔ x = o. (positividad)
Definición. Se llama espacio real euclídeo al par (V, 〈 , 〉) donde V es un espacio vectorial real y 〈 , 〉
es un producto interior sobre V.
En un espacio vectorial complejo, un producto interior 〈x, y〉 es un número complejo que satisface los
mismos axiomas que los del producto interior real, excepto el de la simetría que se reemplaza por
…x, y = …y, x (simetría hermitiana).
Un espacio vectorial complejo, con un producto interior se llama espacio euclídeo complejo (a veces
se le llama espacio unitario).
Aunque nos interesan principalmente los espacios euclídeos reales, los teoremas son válidos para
espacios euclídeos complejos. Cuando decimos espacio euclídeo, sin más, entenderemos que puede ser
real o complejo.
Propiedades. De los axiomas del producto interior se deducen las siguientes propiedades:
1. 〈y + z, x〉 = 〈y, x〉 + 〈z, x〉, ∀ x, y, z ∈ V.
2. 〈x, λy〉 = 〈x, y〉, ∀ x, y ∈ V y ∀ λ ∈ K (R o C).
3. 〈x, o〉 = 0.
4. Si 〈x, y〉 = 0 ∀ y ∈ V, ⇒ x = o.
Norma
Definición. Sea V un espacio vectorial real (o complejo), se llama norma en V a toda aplicación:
|| ||: V → R
Definición. Se llama espacio vectorial normado al par (V, || ||), donde V es un espacio vectorial real
(o complejo) y || || es una norma en V.
æx æ = …x, x
es una norma en V.
Definición. En un espacio euclídeo real V, el ángulo formado por dos vectores no nulos x e y se
define como el número θ del intervalo 0 ≤ θ ≤ π que satisface la ecuación:
…x, y
cos() =
æx æ $ æy æ
Métrica
Definición. Al par (A, d), donde A es un conjunto cualquiera y d es una métrica, se le llama espacio
métrico.
ENM Matemáticas I Álgebra lineal 40
Teorema (Métrica subordinada a una norma). Sea V un espacio vectorial normado, la aplicación:
d: V × V → R
(x, y) → d(x, y) = ||x - y||.
es una métrica en V.
Ortogonalidad
〈x, y〉 = 0
Teorema (de Pitágoras). En un espacio vectorial euclídeo, x ⊥ y ⇔ ||x + y||2 = ||x||2 + ||y||2.
Definición. Sea {v1, v2, ...., vk} ⊂ V (espacio vectorial euclídeo), decimos que:
{v1, v2, ...., vk} es ortogonal ⇔ 〈vi, vj〉 = 0, si i ≠ j. {v1, v2, ...., vk} es ortonormal ⇔ 〈vi, vj〉 = δij
Teorema. Sea {v1, v2, ...., vk} ⊂ V (espacio vectorial euclídeo) con vi ≠ o ∀ i = 1, 2, ..., k, un conjunto
ortogonal ⇒ {v1, v2, ...., vk} es un conjunto de vectores independientes.
Teorema. (Proceso de ortonormalización de Gram-Schmidt). Sea {v1, v2, ...., vk} ⊂ V (espacio
vectorial euclídeo) un conjunto vectores independientes ⇒ ∃ {w1, w2, ...., wk} ⊂ V conjunto ortonormal
tal que: 〈{v1, v2, ...., vk}〉 = 〈{w1, w2, ...., wk}〉
v1
Demostración. El vector w 1 = es unitario, y es tal que 〈{v1}〉 = 〈{w1}〉. Sea ahora el vector
æv 1 æ
v'2 = v2 - 〈v2, w1〉w1, que es no nulo y ortogonal a w1, ya que 〈v'2, w1〉 = 〈v2, w1〉 - 〈v2, w1〉 = 0;
v’ 2
entonces el vector w 2 = es unitario, y es tal que 〈{v1, v2}〉 = 〈{w1, w2}〉. Sea ahora el vector
æv’ 2 æ
〈v'3, w1〉 = 〈v3, w1〉 - 〈v3, w1〉 = 0 y 〈v'3, w2〉 = 〈v3, w2〉 - 〈v3, w2〉 = 0
ENM Matemáticas I Álgebra lineal 41
v’ 3
entonces el vector w 3 = es unitario, y el tal que 〈{v1, v2, v3}〉 = 〈{w1, w2, w3}〉. Siguiendo este
æv’ 3 æ
proceso, se llega a definir un vector
r−1
v'r = vr - 〈vr, wi〉wi
i=1
que es no nulo, pues vr no depende de {w1, w2, ..., wr-1}, y es ortogonal a w1, w2, ..., wr-1, ya que, para i = 1,
2, ..., r - 1, se verifica que
Definición. Sea Vn un espacio vectorial euclídeo de dimensión n, se dice que {v1, v2,...., vn} ⊂ Vn es
una base ortonormal si: 〈vi, vj〉 = δij
Teorema. Sea Vn un espacio vectorial euclídeo de dimensión n ≥ 1, entonces, existe al menos una base
ortonormal de Vn.
Teorema. Sea Vn un espacio vectorial euclídeo de dimensión finita n. Dado un conjunto ortonormal
{v1, v2, ...., vp} ⊂ Vn con p < n, existen vp+1, vp+2, ...., vn tales que {v1, v2, ...., vn} es una base ortonormal de
Vn.
Localización de una base ortonormal. Sabiendo que, en un espacio vectorial euclídeo Vn existen
bases ortonormales, se plantea el problema de cómo, a partir de una base dada, se puede encontrar una
base ortonormal. Este problema lo resuelve perfectamente el "proceso de ortonormalización de
Gram-Schmidt".
En efecto: si {v1, v2, ...., vn} es una base de Vn como se trata de un conjunto independiente, dicho
proceso de ortonormalización proporciona un conjunto ortonormal de n vectores de Vn que es
forzosamente, una base del espacio.
Sea Vn un espacio vectorial euclídeo de dimensión n, en el que por consiguiente, dados dos vectores
cualesquiera x e y, existe su producto interior 〈x, y〉; la cuestión que ahora se aborda es la de encontrar la
manera de expresar el número real 〈x, y〉 en función de las coordenadas de x e y respecto de una
determinada base.
Sea pues {e1, e2, ...., en} una base de Vn, respecto de la cual siempre es posible expresar, de modo
único, x = x1e1 + ... + xnen e y = y1e1 + ... + ynen, donde (x1, x2, ..., xn) e (y1, y2, ..., yn) ∈ Kn son,
ENM Matemáticas I Álgebra lineal 42
respectivamente, las coordenadas de los vectores x e y de Vn; por consiguiente, de acuerdo con la
axiomática del producto interior, se tiene que
1 2 n
〈x, y〉 = 〈 x1e1 + ... + xnen, y1e1 + ... + ynen〉 = x1y 〈e1, e1〉 + x1y 〈e1, e2〉 + ... + xny 〈en, en〉
de donde se deduce que, en un espacio vectorial euclídeo, el producto interior de dos vectores
cualesquiera queda perfectamente determinado en el momento que se conozcan los productos interiores
de los vectores de una base; es decir, el producto interior está totalmente definido por los números 〈ei, ej〉,
para i, j = 1, 2, ..., n. Llamando entonces gij = 〈ei, ej〉, se obtiene:
1
g 11 g 12 ... g 1n y
2
g 21 g 22 ... g 2n y
〈x, y〉 = x 1 x 2 ... x n = XtGY
.... .... ... .... ...
n
g n1 g n2 ... g nn y
A G se le llamará matriz métrica del producto interior respecto de la base B = {e1, e2, ...., en}.
Variación de la matriz métrica o coordenada con los cambios de base. Si en el espacio vectorial
euclídeo Vn se cambia la base B = {e1, e2, ...., en} por la nueva base B' = {e'1, e'2, ...., e'n}, las coordenadas
de los vectores cambiarán y, por tanto, la expresión en función de las coordenadas del producto interior
〈x, y〉 será distinta; de manera que la matriz métrica G' del producto interior respecto de la nueva base
será distinta de la matriz G en la base primitiva. Se trata de localizar la relación que guardan entre sí las
matrices G y G' siendo conocido claro está, el cambio de base.
Sea, pues, la expresión de los vectores e'i = q1ie1 + q2ie2 + ... + qnien en función de la base antigua;
entonces, como G = (ghk) y G' = (g'ij), donde ghk = 〈eh, ek〉 y g'ij = 〈e'i, e'j〉, tenemos que
G' = (g'ij) = (〈e'i, e'j〉) = (〈q1ie1 + q2ie2 + ... + qnien, q1je1 + q2je2 + ... + qnjen〉) =
Teorema. La matriz métrica del producto interior de un espacio vectorial euclídeo Vn respecto de
cualquier base, es una matriz regular.
Expresión del producto interior en una base ortonormal. Si B = {e1, e2, ...., en} es una base
ortonormal de un espacio vectorial euclídeo de dimensión n, se verifica que
Sea {e1, e2, ...., en} una base ortogonormal de V (espacio vectorial euclídeo). Entonces:
n
x = …x, e i e i .
i=1
Sea {e1, e2, ...., en} una base ortonormal de V (espacio vectorial euclídeo). ∀ x e y ∈ V, tenemos:
n n
…x, y = …x, e i …y, e i = x i y i (Fórmula de Parseval).
i=1 i=1
n
En particular, si x = y, tenemos æx æ 2 = …x, e i 2 .
i=1
ENM Matemáticas I Álgebra lineal 43
Coordenadas covariantes y contravariantes de un vector. Sea B = {e1, e2, ...., en} una base
cualquiera de un espacio euclídeo Vn de dimensión n; el conjunto de coordenadas, respecto de dicha base,
de un vector cualquiera x de Vn es la n-upla de números reales (x1, x2, ..., xn) ∈ Kn que verifica:
x = x1e1 + ... + xnen
Considérese ahora la nueva n-upla (x1, x2, ..., xn) ∈ Rn, definida mediante:
Las dos n-uplas (x1, x2, ..., xn) y (x1, x2, ..., xn) están relacionadas entre sí, de forma tal que puede
obtenerse la una en función de la otra;
xi = 〈x, ei〉 = 〈 x1e1 + ... + xnen, ei〉 = x1〈e1, ei〉 + x2〈 e2, ei〉 + ... + xn〈en, ei〉
x1 x1 x1 x1
x2 x2 x2 x2
=G$ y = G −1 .
... ... ... ...
xn xn xn xn
Por consiguiente, cualquier vector x del espacio vectorial euclídeo Vn queda determinado respecto de la
base {e1, e2, ...., en} o bien por la n-upla (x1, x2, ..., xn) o bien por la (x1, x2, ..., xn); como, por otra parte,
ocurre que esta última n-upla es de gran utilidad, se le da también el nombre de conjunto de coordenadas
de x. Para distinguir estas nuevas coordenadas de las únicas que hasta ahora se conocían, se les dan los
calificativos de contravariantes y covariantes:
(x1, x2, ..., xn) = conjunto de coordenadas contravariantes o paralelas del vector x.
(x1, x2, ..., xn) = conjunto de coordenadas covariantes o perpendiculares del vector x.
Este hecho viene a confirmar que la utilización de bases ortonormales simplifica de modo notable todo
tipo de expresiones relativas al producto interior.
ENM Matemáticas I Álgebra lineal 44
Introducción
x = s + s⊥, donde s ∈ S y s⊥ ∈ S⊥
Definición. Sea S un subespacio de dimensión finita de un espacio euclídeo V, y sea {e1, ..., en} una
base ortonormal para S. Si x ∈ V, el elemento s definido por
n
s = …x, e i e i
i=1
Definición. Sea S un subespacio de dimensión finita de un espacio euclídeo V, y sea {e1, ..., en} una
base ortonormal para S. Si x ∈ V, y s es la proyección de x sobre el subespacio S, se llama distancia de x
a S a: d(x, S) = ||x - s||.
MATRICES ORTOGONALES
Definición y caracterización
Definición. Se dice que A ∈ Mn(R) es ortogonal si, y sólo si, AtA = I (⇔ At = A-1). I ∈ Mn(R).
Teorema. Sea A = (aij) ∈ Mn(R). A es ortogonal si, y sólo si, sus vectores fila o bien sus vectores
columna, forman una base ortonormal del espacio vectorial euclídeo Rn.
x1 a 11 a 12 ... a 1n x’ 1
x2 a 21 a 22 ... a 2n x’ 2
= ,
... .... .... ... .... ...
xn a n1 a n2 ... a nn x’ n
siendo (x1, x2, ..., xn) las coordenadas del vector x en la base B, (x'1, x'2, ..., x' n) las coordenadas de x en la
base B' y la matriz A = (aij) (matriz de cambio) es la que permite relacionar los vectores de las bases entre
sí: e'i = a1ie1 + a2ie2 + ... + anien. Cuando Vn es un espacio vectorial euclídeo, las cosas ocurren como en el
caso general; ahora bien, las bases que son de mayor utilidad y, por tanto, las realmente aconsejables en
espacios vectoriales euclídeos son las ortonormales, y por ello merece la pena analizar las peculiaridades
que se presentan cuando tanto la primera base como la segunda son ortonormales. Poner de manifiesto
que un cambio de coordenadas se realiza partiendo de una base B ortonormal y llegando a otra base B'
también ortonormal, se reduce a expresar que ha de verificarse, para cualesquiera i, j = 1, 2, ..., n, que
es decir, se ha de satisfacer
δij = 〈e'i, e'j〉 = 〈a1ie1 + a2ie2 + ... + anien, a1je1 + a2je2 + ... + anjen〉 = a1ia1j + a2ia2j + ... + anianj
que, según la caracterización de las matrices ortogonales, es lo mismo que decir que la matriz A del
cambio es ortogonal; por tanto, un cambio de coordenadas que pase de una base ortonormal a otra
también ortonormal está caracterizado por tener ortogonal su matriz de cambio de base.
Teorema (Espectral). Sea f: Rn → Rn una aplicación lineal simétrica de matriz asociada A. Entonces
existe una base ortonormal de Rn constituida por los vectores propios de f.
Si A ∈ Mn(R) y simétrica ⇒ ∃ P, matriz ortogonal, tal que D = P-1AP = PtAP es diagonal real.
ENM Matemáticas I Álgebra lineal 46
Ejercicios propuestos
(x | y) = 〈f(x), f(y)〉
3. Pruébese que, en un espacio vectorial euclídeo V, si x, y son dos vectores tales que ||x|| = ||y||,
entonces x + y y x - y son dos vectores ortogonales.
4. Demostrar que, en un espacio vectorial euclídeo de dimensión finita V, para cualesquiera que sean
los subespacios U y V, se verifica que:
5. Sea V el espacio vectorial de las funciones reales continuas definidas en el intervalo [0, 1];
considérese en V el producto interior definido, ∀ f, g ∈ V, mediante
1
〈f, g〉 = ¶ 0 f(x )g(x )dx.
6. Sea V un espacio vectorial euclídeo tridimensional; si B = {e1, e2, e3} es una base de V tal que 〈e1,
e1〉 = 1, 〈e2, e2〉 = 1, 〈e3, e3〉 = 2, 〈e1, e2〉 = 0, y el vector 2e2 - e3 es ortogonal a los vectores e1 y e3,
se pide:
a) La matriz métrica del producto interior respecto de la base B.
b) Una base ortonormal de V.
7. En el espacio vectorial euclídeo R3, se considera una base B = {e1, e2, e3} tal que:
8. Sea el espacio vectorial euclídeo (V, 〈 , 〉), donde V es el espacio vectorial de los polinomios sobre
R de grado menor o igual que dos, y 〈 , 〉 es el producto interior definido como:
…p, q = ¶ 0 p(x)q(x)dx
1
Se pide:
a) Demostrar que 〈 , 〉, es un producto interior.
b) Hallar una base del subespacio W, ortogonal al polinomio p(x) ∈ V, cuyas coordenadas covariantes
en la base {1, x, x2} son (1, 1, 1).
c) Hallar una base ortonormal de V.
9. Sea (V, 〈 , 〉) un espacio vectorial euclídeo, donde V = {f: [0, 1] → R / f continua en [0, 1]} y 〈 , 〉
es el producto interior:
1
…f, g = ¶ 0 f(x)g(x)dx
Hallar:
a) d(x3, x2 + 1)
b) ||senx||
c) Proyección de senx sobre cosx.
d) Ángulo que forman x2 y x3.
10. Sea (V, 〈 , 〉) un espacio vectorial euclídeo, donde V es el espacio vectorial de los polinomios sobre
R de grado menor o igual que tres, y 〈 , 〉 es el producto interior:
1
…p, q = ¶ −1 p(x)q(x)dx
Se pide:
a) Hallar la matriz métrica G respecto de la base {1, x, x2, x3}.
b) Hallar una base del subespacio W, ortogonal al subespacio generado por el polinomio p(x) ∈ V,
cuyas coordenadas covariantes en la base {1, x, x2, x3} son (1, 0, 1, 0).
c) Hallar una base ortonormal de V.
d) Hallar la mínima distancia del polinomio 1 + x + x2 al subespacio W.
ENM Matemáticas I Sucesiones y series 1
TEMA 2
SUCESIONES DE NÚMEROS REALES
Primeras definiciones
Definición. Se llama sucesión de números reales, a toda función real a(x) en la que el dominio de
definición de la función "a" son los números naturales.
Para representar las sucesiones se suele emplear la notación an = a(n). Los diversos valores que toma la
función se llaman términos de la sucesión; así se dice que a1 es el primer término, a2 es el segundo
término etc. Al término an (n-ésimo) se le llama término general de la sucesión.
Para representar gráficamente una sucesión, marcamos los términos a1, a2, a3,..., sobre una recta. Este
tipo de diagrama indica hacia donde va la sucesión. Así, en las sucesiones de los ejemplos tenemos que la
sucesión {an} va hacia 0, la sucesión {bn} va hacia +∞ y la sucesión {cn} va dando saltos entre -1 y 1.
1 1
27 8 1
{a n}
0 a3 a a
2 1
1 4 9
{bn } b1 b2
0 b3
-1 0 +1
{c n }
c = c 3 = c1 c2 = c = c 6
5 4
Definiciones generales
Definición. Decimos que una sucesión {an} converge hacia "a ∈ R" si:
La La
n a − 1 si a m 1 e n a − 1 < e n a < + 1 e n > L(1 + ) e n o > E L(1 + )
n a − 1 = Si m 1 e n o m 1
1 − n a si a < 1 e La La
Si < 1 e 1 − < n a e n > L(1 − ) e n o > E L(1 − )
Definición. Decimos que una sucesión {bn} diverge hacia "+∞" ("-∞") si:
Simbólicamente se representa por lim b = +∞ ó {bn} → +∞. La sucesión {n2} diverge hacia +∞.
nd∞ n
n+3
K + K 2 − 4(1 − 3K )
n + 1 > Kn + 3K ⇒ n - Kn + 1 - 3K > 0 ⇒ no > E
2 2
2
Definición. Decimos que una sucesión {cn} es oscilante, si no es una sucesión convergente ni
divergente. La sucesión {(-1)n} es una sucesión oscilante.
Definición. Decimos que una sucesión {an} es monótona creciente si: an+1 ≥ an ∀ n ∈ N.
an+1 ≤ an ∀ n ∈ N.
Definición. Decimos que una sucesión {an} está acotada superiormente si:
∃ k ∈ R / an ≤ k ∀ n ∈ N
Definición. Decimos que una sucesión {an} está acotada inferiormente si:
∃ h ∈ R / h ≤ an ∀ n ∈ N
Definición. Decimos que una sucesión {an} está acotada, si está acotada superior e inferiormente, es
decir:
∃ k ∈ R+ / |an| ≤ k ∀ n ∈ N
Definición. Decimos que una sucesión {an} es una sucesión de Cauchy si:
Vistas estas definiciones sobre sucesiones, daremos una serie de teoremas sobre la convergencia de
sucesiones.
El empleo de este teorema suele ser útil en los problemas en los cuales la sucesión se define por
recurrencia.
a 1 = 2 , ..., a n+1 = 2a n .
Solución.- 1) Vamos a ver que la sucesión {an} está acotada superiormente por "2";
Por tanto an ≤ 2 ∀ n ∈ N
Por tanto, como la sucesión {an} está en las hipótesis del teorema, es convergente.
Teorema. Toda sucesión de Cauchy {an} de números reales converge a un número real; lo que también
se expresa diciendo que R es completo.
ENM Matemáticas I Sucesiones y series 4
Este teorema se emplea fundamentalmente para determinar el límite de una sucesión cuando el cálculo
directo de éste no es fácil pero, en cambio, se dispone de dos sucesiones mas sencillas que comprenden a
la dada y tienen límites iguales. Veámoslo con el siguiente ejemplo:
Solución.- Sabemos que ∀ n ∈ N sen 1n < 1n < tg 1n por tanto dividiendo por sen 1n se tiene:
1
1< n < 1
sen 1n cos 1n
lim b = lim
nd∞ n
c = 1 elim
nd∞ n
a =1
nd∞ n
Teorema. Sean {an} y {bn} dos sucesiones de números reales, tales que lim a = a ∈ R y lim
nd∞ n
b =b∈
nd∞ n
R. Se verifica que:
1. lim
nd∞
[a n + b n ] = a + b ∀ λ, µ ∈ R.
2. lim
nd∞
[ a n $ b n ] = a $ b.
4. Si an ≠ 0 ∀ n ∈ N, y lim a = a ! 0 e lim 1 = 1.
nd∞ n nd∞ a n a
an
5. Si bn ≠ 0 ∀ n ∈ N, lim b = 0 y lim
nd∞ n
a = a ! 0 e lim
nd∞ n
= +∞.
nd∞ bn
6. Si an > 0 ∀ n ∈ N, ⇒ lim
nd∞
L(a n ) = L lim a .
nd∞ n
Teorema.
1. Si {an} y {bn} tienden hacia infinito con el mismo signo, la suma {an + bn} tiende hacia infinito con
este signo. Si {an} tiende hacia infinito mientras que {bn} está acotada, {an + bn} tiende hacia
infinito.
En cambio, si {an} tiende hacia "+∞" mientras que {bn} lo hace hacia "-∞", no se puede decir nada
a priori sobre el comportamiento de {an + bn}.
2. La sucesión {|an ⋅ bn|} tiene por límite "+∞" cuando una de las dos sucesiones tiende hacia infinito y
el valor absoluto de la otra se mantiene superior a un número fijo.
Si {an} tiende hacia cero y {bn} tiende hacia infinito no se puede establecer ninguna conclusión
general sobre el límite de {an ⋅ bn}.
an
3. Si la sucesión {an} está acotada, y {bn ≠ 0} tiende a "∞", el cociente tiende hacia cero.
bn
an
Si {an} tiende hacia "∞" y {bn ≠ 0} está acotada, el cociente tiende hacia "+∞".
bn
an
Tampoco se puede establecer ninguna conclusión general sobre el límite del cociente cuando
bn
las dos sucesiones {an} y {bn} tienden simultáneamente hacia infinito o hacia cero.
Nota.- En resumen, los teoremas anteriores, satisfacen el enunciado general que el límite de la operación
es igual a la operación efectuada con los límites.
∞ - ∞, 0⋅∞, 0 , ∞ , ∞0, 00 y 1∞
0 ∞
En estos casos el límite de la operación correspondiente no depende solamente de los límites de las
sucesiones que intervienen en ella, como sucede en los demás, sino también de la ley con que dichas
sucesiones tienden a sus límites respectivos. Por esto es necesario realizar un estudio particular en cada
caso.
Criterio de Stolz.- Sean {an} y {bn} dos sucesiones de números reales tales que
a n − a n−1
lim = (donde λ ∈ R o λ = ∞)
nd∞ b n − b n−1
an
Si la sucesión {bn} es creciente y lim b = +∞, se tiene también que lim
nd∞ n
=
nd∞ bn
a 1 + a 2 + ... + a n
Ejemplo.- Si lim a = a, calcular lim
nd∞ n nd∞ n
Definición. Se dice que la sucesión {an} es un infinitésimo cuando "n" tiende a "∞" si:
lim a =0
nd∞ n
entonces, si λ = 0, diremos que {an} es un infinitésimo de orden superior a {bn}. Si λ = ∞, diremos que
{an} es un infinitésimo de orden inferior a {bn}. Por último, si λ ≠ 0 y λ ≠ ∞, diremos que {an} y {bn}
son infinitésimos del mismo orden, además si λ = 1 se dice que {an} y {bn} son infinitésimos
equivalentes. Si no existe λ, diremos que los infinitésimos {an} y {bn} no son comparables.
El concepto de orden de un infinitésimo (respecto de otro infinitésimo) que hasta ahora sólo tiene
carácter cualitativo se puede precisar cuantitativamente conviniendo en asignar el orden "1" al
infinitésimo 1n , al que llamaremos principal, y definiendo a continuación el orden "r" del infinitésimo
{an} mediante la condición
an
lim =
nd∞ 1 r
n
n+1 −1 n+1−n
n n
lim
nd∞
= lim
nd∞
=1
1 1
n n
Definición. Sea {an} un infinitésimo de orden "r" cuando n → ∞; se llama parte principal de {an} al
producto n1r . Dicho producto es evidentemente, un infinitésimo equivalente a {an}.
Una propiedad de los infinitésimos, muy interesante para el cálculo de límites, es: Si en la expresión
de una sucesión se sustituye un factor o divisor infinitésimo {an} por otro equivalente {bn}, el límite
de la sucesión no varía.
⊗} → 0
TABLA DE INFINITÉSIMOS EQUIVALENTES PARA {⊗
e⊗ - 1 ≈ ⊗ a⊗ - 1 ≈ ⊗La
(1 + ⊗)m - 1 ≈ m⊗ L(1 + ⊗) ≈ ⊗
sen⊗ ≈ ⊗ sh⊗ ≈ ⊗
tg⊗ ≈ ⊗ th⊗ ≈ ⊗
arcsen⊗ ≈ ⊗ argsh⊗ ≈ ⊗
arctg⊗ ≈ ⊗ argth⊗ ≈ ⊗
1 - cos ⊗ ≈ ⊗ /2 ch⊗ - 1 ≈ ⊗2/2
2
lim a =∞
nd∞ n
Como infinito principal A se toma "n". De la propia definición se deduce que an ≈ λAr. También se
puede sustituir un factor o un divisor infinito por otro equivalente sin que por ello varíe el límite.
1! l 11 e −1 2 1
Ln l 1 + 1 + $ $ $ + 1n
2
k+1
1 + 2 + ... + n k l n
k k
k+1
a k n k + ... + a 1 n + a 0 l a k n k
Nota.- Para finalizar diremos que los métodos más frecuentes para resolver, en gran número de casos,
la indeterminación y hallar el límite buscado son:
1. Simplificar la expresión.
2. Aplicar técnicas del cálculo de límites del Bachillerato.
3. Sustituir factores o divisores por otros, infinitésimos o infinitos, equivalentes.
4. Aplicar el criterio de Stolz.
5. Aplicar a toda la expresión dada o a ciertas partes de ella la fórmula de Taylor.
6. Acotar entre dos sucesiones que tengan el mismo límite.
L(n + p) n$Ln
Ejemplo.- Hallar: lim
nd∞ Ln
L(n + p) n$Ln
Solución.- Como lim = 1 ∞ e (por el número "e")
nd∞ Ln
L(n+p) L(n+p)−Ln
L(n + p) n$Ln p
limn$Ln$ Ln −1 limn$Ln$ limn$L 1+ n
lim =e nd∞
=e nd∞ Ln
=e nd∞
= ep
nd∞ Ln
(2n )!
Ejemplo.- Hallar: lim n
nd∞ n n n!
sen 3n L 1 + tg 2 5n
Ejemplo.- Hallar: lim
arctg 7n 1 − cos 3n
nd∞
n n 1 1
Solución.- Como lim
nd∞
1 + sen 1n = 1 ∞ e lim
nd∞
1 + sen 1n = e nd∞
limn$sen n
= e nd∞
limn$ n
=e
ENM Matemáticas I Sucesiones y series 9
Ejercicios propuestos
2. lim
nd∞
n n
b −1 (b > 0 y b ! 0 )
3. lim (n + n )L 1 + 1 (α > 0 y α ≠ 1)
nd∞
2n 2 + 1
(n + 1 ) $ $ $(2n )
5. lim n
nd∞ n!
n a1 + $ $ $ + n ak kn
6. lim
nd∞ k
7. lim
nd∞
n − n 2 L 1 + 1n
x1 > 1, x n+1 = 1
2 x 2n + 12
xn
Se pide:
a) Probar que {xn} es una sucesión convergente.
b) Calcular el límite de la sucesión {xn}.
12. Sea f: [0, +∞) → [0, 1) una función continua, y sea {xn} la sucesión definida por:
SERIES NUMÉRICAS
Primeras definiciones
Las sucesiones se introdujeron en el capítulo anterior con la intención especial de considerar en este
capítulo sus sumas
a1 + a2 + ⋅⋅⋅ + an + ⋅⋅⋅⋅
Estas sumas no se pueden hacer sin más, ya que hasta ahora la suma de infinitos números no ha sido
nunca definida. Lo que puede definirse son las sumas parciales
Sn = a1 + a2 + ⋅⋅⋅ + an
y se puede presumir que las sumas infinitas deban definirse en términos de estas sumas parciales.
Afortunadamente, el mecanismo para formular esta definición ha sido desarrollado ya en la lección
anterior. Si existe alguna esperanza de poder calcular la suma infinita a1 + a2 + ⋅⋅⋅ + an + ⋅⋅⋅⋅, las sumas
parciales Sn deben representar aproximaciones cada vez más cercanas a medida que "n" se va haciendo
grande. Esta última afirmación equivale a poco más que una definición grosera de límite: La suma infinita
a1 + a2 + ⋅⋅⋅ + an + ⋅⋅⋅⋅
debería ser
lim S
nd∞ n
Este modo de abordar el asunto dejará necesariamente sin definir la suma de muchas sucesiones,
puesto que la sucesión Sn puede fácilmente dejar de tener un límite.
Definición. Dada la sucesión {an} formemos la sucesión {Sn} definida como Sn = a1 + a2 + ⋅⋅⋅ + an: Se
denomina serie, y se representa por el símbolo
∞
a n o abreviadamente por ∑an,
n=1
Definición. Decimos que la serie ∑an es convergente si, y sólo si, existe S ∈ R tal que
lim S =S
nd∞ n
Definición. Decimos que la serie ∑an es divergente si, y sólo si, la sucesión {Sn} es divergente.
Definición. Decimos que la serie ∑an es oscilante si, y sólo si, la sucesión {Sn} es oscilante.
∞
Definición. Se llama resto de índice k a la expresión: R k = a n .
n=k+1
ENM Matemáticas I Sucesiones y series 11
Ejemplos de series
∞
1) Series geométricas: kr n con k ≠ 0
n=1
r(1 − r n ) 1 − rn
S n = k(r + r 2 + $ $ $ + r n ) = k e lim S = kr lim
1−r nd∞ n nd∞ 1 − r
+∞ si n par
b2) r < -1 ⇒ rn → ⇒ {Sn} oscila ⇔ ∑krn es oscilante.
−∞ si n impar
1 si n par
c2) r = -1 ⇒ rn → ⇒ {Sn} oscila ⇔ ∑krn es oscilante.
−1 si n impar
2) Series Telescópicas: Una serie ∑an decimos que es telescópica si: an = bn + 1 - bn.
En este caso
Sn = a1 + a2 + ⋅⋅⋅ + an = b2 - b1 + b3 - b2 + ⋅⋅⋅ + bn + 1 - bn = -b1 + bn + 1
Por tanto
lim S = −b 1 + lim
nd∞ n
b
nd∞ n+1
an = n + 1 = 1 − 1
(n + 2 )! (n + 1 )! (n + 2 )!
y por tanto la suma n-ésima es
S n = a 1 + a 2 + ... + a n = 1 − 1 + 1 − 1 + ... + 1 − 1 + 1 − 1 = 1 − 1
2! 3! 3! 4! n! (n + 1 )! (n + 1 )! (n + 2 )! 2! (n + 2 )!
∞
3) Series Aritmético-geométricas: n $ r n con |r| < 1
n=1
(1 − r )S n = r 1 − r − nr n+1
( n)
1−r
Por tanto
a n +
4) Series hipergeométricas: ∑an con an+1
n
= n + y α y γ no nulos simultáneamente. Entonces
a 2 1 +
a 1 = 1 + e 1a 2 + a 2 = 1a 1 + a 1
a 3 2 +
a 2 = 2 + e 2a 3 + a 3 = 2a 2 + a 2
⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅
a n+1 n +
a n = n + e na n+1 + a n+1 = na n + a n
a n (n + ) − a 1
Sn =
+−
Si existe el lim S diremos que la serie converge, y su suma será el valor de dicho límite.
nd∞ n
ENM Matemáticas I Sucesiones y series 13
Teóricamente el carácter de una serie ∑an se reduce al estudio del carácter de la sucesión {Sn} de sus
sumas parciales, pero en la práctica, importa poder decir si la serie es o no convergente a la vista de como
se comportan los términos an. Los siguientes teoremas tratan de cumplir este objetivo.
Teorema. (Criterio general de Cauchy) La condición necesaria y suficiente para que la serie ∑an sea
convergente es que
n+h
∀ ε > 0 ∃ n0 ∈ N / ∀ n ≥ n0 y ∀ h ∈N ⇒ ak <
k=n+1
Solución.- Como
lim n2 =1!0
nd∞ (n + 1)(n + 2)
Teorema. Si el resto de índice "k" tiende a cero cuando k → ∞, entonces la serie es convergente.
Teorema. El carácter de una serie no se altera cuando se suprimen los "k" primeros términos de la
misma.
Teorema. El carácter de una serie no se altera, cuando multiplicamos todos sus términos por una
constante no nula.
Teorema. El carácter de una serie convergente o divergente, no se altera, así como la suma de la
misma en el primer caso, si se sustituyen grupos de términos consecutivos por sus correspondientes
sumas.
En cambio, si la serie fuese oscilante, con la transformación anterior se puede obtener otra serie de
distinto carácter que la dada. Así, por ejemplo, de la serie ∑(-1)n, claramente oscilante, se deduce esta
otra:
- 1 + (1 - 1) + (1 - 1) + ⋅⋅⋅⋅
Definición. Dada la serie ∑an, decimos que es una serie de términos positivos si: an ≥ 0 ∀n ∈ N.
1.- Criterio de comparación: Sea ∑an y ∑bn dos series de términos positivos, ∑an de carácter
desconocido y ∑bn de carácter conocido. Entonces:
a) Si an ≤ bn ∀ n ∈ N, ⇒ si ∑bn converge ⇒ ∑an converge.
b) Si bn ≤ an ∀ n ∈ N, ⇒ si ∑bn diverge ⇒ ∑an diverge.
2.- Criterio de comparación por paso al límite: Sean ∑an y ∑bn dos series de términos positivos, ∑an
de carácter desconocido y ∑bn de carácter conocido. Entonces:
Nota.- Para poner en práctica los criterios anteriores debemos disponer de algunas series cuyo
comportamiento sea conocido, a las cuales podemos comparar la serie propuesta. Los patrones más
apropiados para este objeto son la serie geométrica ya estudiada y la serie de Riemann
∞
1p
n=1 n
4 ∞
Solución.- sen2 n [ 12 ≤n c N e como 12 es convergente, la serie dada converge.
n n n=1 n
∞
Solución.- 1 [ 1 e como 1 diverge, la serie dada diverge.
n n −2 n=1 n
3
1 < 2 + cos n
n n
∞
y como 1n , es una p-serie divergente, la serie dada diverge.
n=1
∞
Ejemplo.- Estudiar el carácter de la serie: 1 .
n=1 n+ n
1 [ 1
2n n + n
∞
y como 1 , es una serie divergente, la serie dada diverge.
n=1 2n
1 +n!n
∞ 2
n=0
1 + (n + 1 )
2
a n+1 (n + 1 )! 1 + (n + 1 )
2
lim = lim = lim = 0 < 1⇒ la serie dada converge.
nd∞ a n nd∞ 1 + n2 nd∞ (1 + n 2 )(n + 1 )
n!
ENM Matemáticas I Sucesiones y series 16
2 n+1
(n + 1)! 2 = 0 < 1 ⇒ la serie dada converge.
lim = lim
nd∞ n + 1
nd∞ 2n
n!
Solución.-
n
lim
nd∞
n a n = lim
nd∞
n cos a + bn = lim
nd∞
cos a + bn = cos a < 1
Solución.-
6.- Criterio de Raabe: A este criterio se recurre, principalmente cuando no decide el criterio del
cociente. Sea la serie ∑an con an ≥ 0 ∀ n ∈ N:
Solución.-
a n+1 n 1− k
lim = lim
nd∞ n + 1
=1
nd∞ a n n+1
⇒ aplicamos el criterio de Raabe
n 1− k n 2 (k + 1 ) + n
lim n 1− = lim =k+1
nd∞ n+1 n+1 nd∞ (n + 1 ) 2
Si k + 1 > 1 ⇔ k > 0 ⇒ la serie dada converge.
Si k + 1 < 1 ⇔ k < 0 ⇒ la serie dada diverge.
Si k + 1 = 1 ⇔ k = 0, no decide; pero la serie se transforma en 1n que es una serie divergente.
∞
2$3$$$ n+1( )
Ejemplo.- Estudiar el carácter de la serie:
n=1 4 $ 5 $ $ $(n + 3)
.
2 $ 3 $ $ $(n + 2 )
4 $ 5 $ $ $(n + 4) n+2 =1
lim
nd∞ 2 $ 3 $ $ $(n + 1 )
= lim
nd∞ n + 4
4 $ 5 $ $ $(n + 3)
7.- Criterio integral: Sea f: [1, +∞) → R una función positiva, decreciente y sea an = f(n) ∀ n ∈ N.
∞
Entonces, la serie an y la integral impropia
n=1
¶ 2∞ xLx
1 dx = lim [L Ln
nd∞
− L L2 ] = ∞
ENM Matemáticas I Sucesiones y series 18
Supongamos ahora una serie: a1 + a2 + ⋅⋅⋅ + an + ⋅⋅⋅, que contiene infinitos términos positivos y otros
infinitos negativos. Formemos la serie |a1| + |a2| + ⋅⋅⋅ + |an| + ⋅⋅⋅, a la que llamaremos serie de los valores
absolutos de la serie ∑an y que representaremos por ∑|an|.
Definición. La serie ∑an es absolutamente convergente, si la serie ∑|an| es convergente.
Se debe advertir que el teorema recíproco no es, por lo general, cierto. Si la serie ∑an es convergente,
no es forzoso que lo sea la serie ∑|an|. Cuando este caso se presenta, se dice que la serie ∑an es
condicionalmente convergente.
Series alternadas
Ofrecen interés especial aquellas series cuyos términos son alternativamente positivos y negativos. Por
ello se llaman alternadas. Si no son absolutamente convergentes, se puede aplicar el teorema siguiente:
Teorema. (Criterio de Leibnitz) Si los términos de una serie alternada ∑an verifican las condiciones:
a) |an+1| < |an| ∀n ∈ N
b) lim a =0
nd∞ n
(−1 ) n
∞
Ejemplo.- Estudiar el carácter de la serie: n .
n=1
∞
Solución.- Si consideramos la serie de valores absolutos, obtenemos 1n , que es una serie divergente;
n=1
∞ (−1 ) n
pero, esto no nos dice nada del carácter de la serie n .
n=1
a) |an+1| = 1 [ 1 = |a |
n+1 n n
(−1 ) n
b) lim
nd∞ n =0
∞ (−1 ) n
y por verificarse a) y b), la serie n , es convergente (condicionalmente convergente).
n=1
∞
Ejemplo.- Estudiar el carácter de la serie: (−1 ) n tg 1n .
n=1
Ejercicios propuestos
∞ 1 + 1 + $ $ $ + 1n
1. 2
n=2 n 3 Ln
∞
2. ( n a − 1 ) n (a > 0 )
n=1
∞ (n! ) 2 x 2n
3.
n=0 (2n )!
∞
4. 1
n=0 n!
∞
5. 1 ≤p c R
n=2 (Ln ) p
∞
6. 1
n=2 (Ln ) Ln
∞
1
7.
n=0 e n 2 +1
8. 2 − 1
∞ 2n
n=1 2n − 1
∞
9. ( n n − 1 )
n
n=1
∞
10. arcsen 1
n=1 n
∞
11. an a, b c N
n=0 n + bn
12. a) Estudiar el caracter de la serie según los distintos valores del parametro "a":
∞ n
a 2
n=1 n(1 + na )
SERIES DE FUNCIONES
Primeras definiciones
Sea {fn} una sucesión cuyos términos son funciones definidas en un cierto conjunto D ⊂ R.
Entonces tenemos un conjunto de valores límites en correspondencia con los valores x0 ∈ C, es decir
una función definida en el campo de convergencia de la sucesión {fn} y que se llama límite puntual de
ésta, representándose por
f = lim f
nd∞ n
f n (x ) = nx
n+1
En este caso D = R y
f(x) = lim f (x ) = lim nx = x; por tanto C = R
nd∞ n nd∞ n + 1
Gráficamente.-
y=x
Y
f3
ε
f2
f1
0
X
Ahora bien interesa estudiar en qué forma ciertas propiedades de las funciones {fn} se transmiten a la
función límite "f". Por ejemplo, si cada fn es continua en un punto x0 ∈ C ¿la función f también es
continua en el punto x0? La respuesta no es siempre afirmativa, como muestran las funciones
fn(x) = xn
definidas en el intervalo [0, 1], las cuales son continuas en todo punto de dicho intervalo, mientras que,
como
0 si 0 [ x < 1
f(x) = lim f (x ) = lim x n
=
1 si x = 1
nd∞ n nd∞
Gráficamente.-
Y
f1
·
fn
0 X
Gráficamente.-
Y
f(x) + ε
f(x)
f(x) - ε
0 a b X
f n (x ) = 2
2 + nx
Solución.-
1. lim f (x ) = f(x) = 0.
nd∞ n
Solución.-
1. lim f (x ) = f(x) = 0.
nd∞ n
ENM Matemáticas I Sucesiones y series 22
2. x − 0 < e n > 1 − 2 . Pero si n > 1 e n > 1 − 2; que no depende de "x", entonces existe
2 + nx x x
convergencia uniforme.
2 2
Ejemplo.- Estudiar la convergencia uniforme de la sucesión de funciones f n (x ) = n x2 2 en el
1+n x
intervalo [-1, 1].
1 si x ! 0
Solución.- lim
nd∞
f n (x ) = f(x) =
0 si x = 0
Como las fn son continuas en [-1, 1] ∀ n ∈ N, y la función f no es continua en [-1, 1], no existe
convergencia uniforme.
Series de funciones
Por tanto, si x ∈ (-1, 1), la serie converge, y si x ∈ (-∞, -1) ∪ (1, +∞), la serie diverge.
∞
Para x = 1, obtenemos 1 , que es una serie divergente.
n=0 2n + 1
n=0 2n + 1
Definición. Se dice que la serie ∑fn(x) es uniformemente convergente, a una función f en C cuando la
sucesión {Sn(x)} es uniformemente convergente a f en C.
ENM Matemáticas I Sucesiones y series 23
Teorema. (Criterio de Weierstrass) Si ∑an es una serie convergente de términos positivos y tal que
|fn(x)| ≤ an ∀ n ∈ N y ∀ x ∈ C,
Teorema. Una serie uniformemente convergente de funciones continuas define una función continua.
Teorema. Sea ∑fn una serie de funciones derivables y con derivada finita en (a, b) y supongamos que
para cada c ∈ (a, b) la serie numérica ∑fn(c) converge y que la serie de las derivadas ∑fn' converge
uniformemente en (a, b). Entonces la serie de las funciones ∑fn converge uniformemente en (a, b) a una
función derivable f y se verifica
∞
f ∏ (x ) = f n∏ (x )
n=1
∞
Teorema. Sea {fn} una sucesión de funciones continuas en [a, b] y supongamos que fn converge
n=1
uniformemente en [a, b]. Entonces se verifica que:
∞ ∞
¶ ab n=1 b
¶ a f n (x )dx
f n (x ) dx = n=1
Como consecuencia del teorema de Abel resulta que si la serie ∑anxn no converge para x = x1, tampoco
converge para cualquier "x" tal que |x| > |x1|, pues si fuese convergente en algún "c" tal que |c| > |x1|, por el
teorema de Abel también debería converger en el punto x1, contra lo que hemos supuesto.
CÁLCULO DEL RADIO DE CONVERGENCIA.- En los criterios del cociente y de la raíz, dados
en el capítulo anterior para estudiar el carácter de una serie numérica, se fundan los siguientes resultados
que permiten determinar en muchos casos el radio de convergencia de una serie de funciones.
ENM Matemáticas I Sucesiones y series 24
a n+1
1.- Dada la serie ∑anxn, si lim = ! 0 el radio de convergencia es R = 1 .
nd∞ an
Aplicando el criterio del cociente a la serie ∑|anxn| resulta que la serie dada será absolutamente
convergente para todo "x" tal que
En cambio, si λ|x| > 1, lo que ocurre cuando x > 1 , los términos |anxn| crecen con "n", luego no
tienden a cero; por tanto la serie dada no converge. Se deduce pues, que R = 1 es el radio de
convergencia. Si λ = 0, diremos que R es ∞.
2.- Si lim n
a n = el radio de convergencia de la serie ∑anxn es R = 1
nd∞
lim
nd∞
n
anxn = x
de modo que la serie será absolutamente convergente para todo "x" tal que λ|x| < 1 o sea |x| < 1 .
En cambio, si λ|x| > 1, lo que tiene lugar si |x| > 1 habrá una infinidad de términos |anxn| > 1, y en
consecuencia la serie no puede converger. Si λ = 0, diremos que R es ∞.
∞ n−1
Ejemplo.- ¿Para que valores de "x" converge la serie de funciones: x n ?
n=1 n3
Solución.-
lim
a n+1
= lim n3 n = 1 ⇒ el intervalo de convergencia es (-3, 3)
nd∞ an nd∞ (n + 1 )3 n+1 3
∞
Si x = 3 la serie se transforma en 1 que es divergente.
n=1 3n
(−1 ) n−1
∞
Si x = -3 la serie se transforma en que es convergente.
n=1 3n
Solución.-
lim n
a n = lim 1 =1
nd∞ nd∞ n
n3
entonces el intervalo de convergencia es (-1, 1).
(−1 ) n
∞
Para x = -1 la serie se transforma en que es una serie convergente.
n=1 n3
ENM Matemáticas I Sucesiones y series 25
∞
Para x = 1 la serie se transforma en 1 que es también convergente.
n=1 n3
∞
Como x n [ 1 ∀ x ∈ [-1, 1] y la serie 1 es convergente, ⇒ la serie dada converge
n3 n3 n=1 n3
uniformemente en todo el campo de convergencia.
∞
Ejemplo.- Hallar el campo de convergencia de la serie: (−1 )
n−1 xn
n=0 n
(−1 ) n 1
= lim n+1 =1eR= 1 =1
nd∞ n−1 1
(−1 ) n
∞
Para x = 1, obtenemos (−1 ) n−1 1n , que es una serie alternada, y aplicando el criterio de Leibnitz,
n=0
converge.
∞ (−1 ) n ∞
1 , que es una serie divergente.
Para x = -1, obtenemos (−1 ) n−1 n = −
n=0 n=0 n
Si las series ∑anxn y ∑bnxn son convergentes en (-R, R), se verifica que:
2. ∑canxn = c∑anxn ∀ c ≠ 0.
Teorema. Sea la serie ∑anxn convergente en (-R, R) (R > 0), y e ∈ (0, R), entonces la serie converge
absoluta y uniformemente en [-e, e].
Teorema. La función f(x) = ∑anxn definida por una serie de potencias es derivable en (-R, R), y la
función derivada
∞
f ∏ (x ) = na n x n−1
n=1
∑anxn y ∑nanxn-1
Desarrollar una función en serie de potencias de x es obtener una serie entera cuya suma en todos los
puntos de un determinado conjunto coincide con los valores que toma la función en dicho conjunto.
El desarrollo en serie de potencias de "x" de una función f(x), cuando existe, es único y adopta la
forma de serie de Mac-Laurin
∞
f (n (0 ) n
f(x ) = x
n=0 n!
f(x) = ∑anxn
válido para los puntos del intervalo de convergencia de la serie, aplicando reiteradamente el teorema
anterior encontramos que sus derivadas tienen el mismo intervalo de convergencia y se expresan de la
forma siguiente:
∞ ∞ ∞
f (1 (x ) = na n x n−1 , f (2 (x ) = n(n − 1 )a n x n−2 , ..., f (k (x ) = n! a x n−k
n=k (n − k )!
n
n=1 n=2
Entonces, si hacemos x = 0, resulta: f(0) = ao, f(1(0) = 1!a1, f(2(0) = 2!a2,... f(k(0) = k!ak,..., y teniendo
en cuenta el convenio de que f(0 = f, queda finalmente
f (k (0 )
ak = , k = 0, 1, 2,..
k!
lo que significa que todos los coeficientes del desarrollo f(x) = ∑anxn están determinados.
Observación. Para que una función f(x) pueda desarrollarse en serie de potencias ∑anxn se necesita que
f (n (0 )
sea indefinidamente derivable en el punto x = 0, y entonces a n = . Pero, además, es preciso que en
n!
los puntos donde la serie converge su suma coincida con f(x).
∞ n
1. e x = x , ≤x c R.
n=0 n!
∞
(−1 ) n x 2n+1
2. sen x = , ≤x c R.
n=0 (2n + 1 )!
∞
(−1 ) n x 2n
3. cos x = , ≤x c R.
n=0 (2n )!
∞
(−1 ) n−1 x n
4. L(1 + x ) = n , ≤x c (−1, 1 ].
n=1
∞
m n
5. (1 + x ) m = x , ≤x c (−1, 1 ).
n=0 n
∞
(−1 ) n−1 x 2n−1
6. arctan x = , ≤x c [−1, 1 ].
n=1 2n − 1
ENM Matemáticas I Sucesiones y series 27
Ejercicios propuestos
∞
(−1 ) n (x − 1 ) n
2.
n=1 2 n (3n − 1 )
∞
1
3.
n=1 n (1 + x2 )
n
∞
1−x n
4.
n=1
n2
1+x
∞ nx
e
5.
n=1 n 2 (nx + 1)
f n (x ) = 1 , n = 1, 2, 3,...
1 + x 2n
es uniformemente convergente.
1 (x + 2 ) ?
∞ n
12. ¿Para que valores de "x" converge la serie de funciones:
n=1 2n − 1 (x − 1 ) n
ENM Matemáticas I Sucesiones y series 28
SERIES DE FOURIER
Introducción
En todos estos fenómenos físicos las cantidades variables dependen periódicamente del tiempo. En
matemáticas se prescinde de la naturaleza física de la variable independiente que se designa usualmente
por "x" y se da la siguiente definición general de periodicidad:
Definición. Sea f(x) una función definida en un conjunto D ⊂ R. Se dice f(x) es periódica de período
"p" cuando se verifica que:
Si "p" es el menor número positivo que verifica esta condición, lo llamaremos período fundamental.
Si esta serie converge, su suma es una función periódica f(x) de período 2π, puesto que sennx y cosnx
son funciones periódicas de período 2π. Los números ao, an, bn (n = 1, 2,...) se llaman coeficientes de la
serie trigonométrica.
Supongamos que una función periódica f(x) de período 2π es tal que podemos representarla como una
serie trigonométrica que converja hacia la función dada en el intervalo (-π, π), es decir, que sea la suma de
esta serie:
a ∞
f(x) = o + (a n cos nx + b n sen nx ) (*)
2 n=1
1
a0 = ¶ − f(x)dx.
1
ak = ¶ − f(x) cos kxdx.
1
bk = ¶ − f(x) sen kxdx.
Los coeficientes así determinados, se llaman coeficientes de Fourier de la función f(x), y la serie
trigonométrica formada con tales coeficientes se llama serie de Fourier de la función f(x).
ENM Matemáticas I Sucesiones y series 29
Definición. Decimos que una función f(x) es monótona a tramos en el intervalo [a, b], si existe una
partición del intervalo {a = xo, x1,..., xn = b} tal que f(x) es monótona en (xi-1, xi) ∀ i = 1, 2,..., n.
Gráficamente.-
De la definición se deduce que si la función
Y y = f(x) f(x) es monótona a tramos y acotada en el
intervalo[a, b], entonces puede tener sólo puntos
de discontinuidad de primera especie (con salto
finito).
Ejemplo.- Sea una función periódica f(x) de período 2π definida del modo siguiente
f(x) = x -π < x ≤ π
Y
π
−3π −π π 3π
−4π −2π 0 2π 4π
X
−π
Solución.-
Es una función monótona a tramos y acotada por tanto admite desarrollo en serie de Fourier
1
ao = ¶ − xdx = 0; a k = 1 ¶ − x cos kxdx = 0; b k = 1 ¶ − x sen kxdx = (−1 ) k+1 2k
De este modo, obtenemos la serie
Ejemplo.- Sea una función periódica f(x) de período 2π definida del modo siguiente
−x si − [ x [ 0
f(x) =
x si 0 < x [
0 para k par
1 ¶ 0 (−x ) cos kxdx + ¶ x cos kxdx =
ak = − 0
− 4 para k impar
k 2
1 ¶ 0 (−x ) sen kxdx + ¶ x sen kxdx = 0
bk = − 0
Esta serie converge en todos los puntos y su suma es igual a la función dada.
ENM Matemáticas I Sucesiones y series 31
Ejemplo.- Sea una función periódica f(x) de período 2π definida del modo siguiente
−1 si − [ x < 0
f(x) =
1 si 0 [ x [
−3π −π π 3π
−4π −2π 0 2π 4π
X
−1
1
ao = ¶ − f(x)dx = 1 ¶ −0 (−1 )dx + ¶ 0 1dx =0
1
ak = ¶ −0 (−1 ) cos kxdx + ¶ 0 1 cos kxdx =0
0 para k par
1 ¶ 0 (−1 ) sen kxdx + ¶ x sen kxdx =
bk = − 0
4 para k impar
k
Esta igualdad es válida en todos los puntos, excepto los de discontinuidad, en los que la suma vale
cero.
De esta propiedad se deduce que, al calcular los coeficientes de Fourier, podemos sustituir el intervalo
de integración (-π, π) por otro intervalo (λ, λ + 2π), es decir podemos poner:
1
ao = ¶ +2 f(x)dx, 1
ak = ¶ +2 f(x) cos kxdx, 1
bk = ¶ +2 f(x) sen kxdx,
donde λ es un número arbitrario.
Esto se deduce del hecho que la función f(x) es, por hipótesis, periódica de período 2π; por
consiguiente, las funciones f(x)cosnx y f(x)sennx son también funciones periódicas de período 2π.
Mostremos con un ejemplo como en algunos casos la propiedad demostrada simplifica el proceso de
cálculo de los coeficientes.
Ejemplo.- Supongamos que se desea desarrollar en serie de Fourier la función f(x) de período 2π, que,
en el intervalo 0 ≤ x ≤ 2π, viene dada por:
f(x) = x
La gráfica de f(x) es
Y
x + 2 si − [ x < 0
f(x) =
x si 0 [ x [
Ahora bien, en el intervalo [0, 2π], esta función está definida de modo muy simple por una sola
fórmula f(x) = x. Por eso, para desarrollar esta función en serie de Fourier es más conveniente utilizar las
fórmulas
1
ao = ¶ +2 f(x)dx, 1
ak = ¶ +2 f(x) cos kxdx, 1
bk = ¶ +2 f(x) sen kxdx,
haciendo λ = 0.
1
ao = ¶ 02 xdx = 2, 1
ak = ¶ 02 x cos kxdx = 0, 1
bk = ¶ 02 x sen kxdx = − 2k ,
Por consiguiente
Esta serie representa la función dada en todos los puntos excepto en los de discontinuidad (es decir,
excepto en los puntos x = 2kπ k ∈ Z). En estos puntos la suma de la serie es igual a la mitad de la suma de
los límites de la función f(x) a la derecha y a la izquierda (es decir, en el caso dado, al número π).
ENM Matemáticas I Sucesiones y series 33
Sabemos que una función f(x) es par, cuando f(x) = f(-x) ∀ x ∈ Domf. Entonces si f(x) es una función
par se verifica que
¶ −aa f(x)dx = 0
Si f(x) se desarrolla en serie de Fourier y es una función impar, el producto de f(x)coskx es también
una función impar y f(x)senkx es una función par; por consiguiente,
1
a0 = ¶ − f(x)dx = 0; 1
ak = ¶ − f(x) cos kxdx = 0; 2
bk = ¶ 0 f(x) sen kxdx
es decir, la serie de Fourier de una función impar contiene solamente senos.
Si una función f(x) par se desarrolla en serie de Fourier, el producto de f(x)senkx es una función impar,
y f(x)coskx es una función par, por consiguiente,
2
a0 = ¶ 0 f(x)dx; 2
ak = ¶ 0 f(x) cos kxdx; 1
bk = ¶ − f(x) sen kxdx = 0
λ
Series de Fourier de funciones de periodo 2λ
Si f(x) es una función periódica de período 2λ. Su desarrollo en serie de Fourier es:
a ∞
f(x ) = o + a k cos k x + b k sen k x
2 k=1
donde
ao = 1
¶ − f(x)dx,
ak = 1
¶ − f(x) cos k xdx,
bk = 1
¶ − f(x) sen k xdx
Notemos que todos los teoremas formulados para las series de Fourier de las funciones periódicas de
período 2π, son válidos también para las series de Fourier de las funciones periódicas de cualquier otro
período 2λ. En particular, subsiste el criterio suficiente para el desarrollo de una función en serie de
Fourier, la observación sobre la posibilidad de calcular los coeficientes de la serie, integrando en un
intervalo arbitrario de longitud igual al período, así como la observación sobre la posibilidad de
simplificar el cálculo de los coeficientes de la serie, cuando la función sea par o impar.
ENM Matemáticas I Sucesiones y series 34
Supongamos que en un cierto intervalo [a, b] está definida una función monótona a tramos f(x).
Mostremos que podemos representar esta función f(x) en los puntos de continuidad por una serie de
Fourier. Para ello, consideremos una función arbitraria periódica monótona a tramos f1(x) de período 2µ >
b - a, que coincide con la función f(x) en el intervalo [a, b]. Desarrollemos f1(x) en serie de Fourier. La
suma de la serie en todos los puntos del intervalo [a, b] (excepto en los de discontinuidad) coincide con la
función f(x), lo que significa que hemos desarrollado f(x) en serie de Fourier en el intervalo [a, b].
Consideremos ahora el siguiente caso. Sea f(x) una función definida en el intervalo [0, λ].
Completando la definición de esta función de modo arbitrario en el intervalo (-λ, 0) (conservando la
monotonía a tramos), podemos desarrollar esta función en serie de Fourier. En particular, si completamos
la definición de la función dada, de modo que en el intervalo -λ < x < 0 se tenga que f(x) = f(-x),
obtenemos en definitiva una función par. (En este caso se dice que la función f(x) es prolongada de
manera par). Esta función se desarrollada en serie de Fourier, que contiene solamente cosenos. De este
modo la función f(x), definida en el intervalo [0, λ], la hemos desarrollado en serie de cosenos.
Si completamos la definición de la función f(x) para -λ < x < 0 de modo que f(x) = -f(-x), obtenemos
una función impar que se desarrolla en serie de senos. (La función f(x) es prolongada de manera impar).
De este modo, si en el intervalo [0, λ] está definida una cierta función monótona a tramos f(x), podemos
desarrollarla tanto en serie de Fourier de cosenos como en serie de Fourier de senos.
f(x) Si x c [0, ]
f 1 (x ) =
g(x) Si x c (−, 0 ) / f 1 es una función impar en (−, )
∞
e f 1 (x ) = b n sen n x = f(x) ≤x c (0, ), y donde λ en este caso es π.
n=1
f(x) Si x c [0, ]
f 1 (x ) =
g(x) Si x c (−, 0 )/ f 1 es una función par en (−, )
a0 ∞
e f 1 (x ) = + a n cos n x = f(x) ≤x c (0, ), y donde λ en este caso es π.
2 n=1
Ejercicios propuestos
TEMA 3
LIMITES Y CONTINUIDAD
Introducción
Vamos a estudiar las funciones f: G ⊂ Rn → Rm. Cuando m = 1 se llaman campos escalares y cuando
m > 1 se llaman campos vectoriales. Ejemplos de estas funciones son los siguientes:
Ejemplo. El volumen V de un paralelepípedo recto, cuyas aristas tienen longitudes x, y, z, viene dada
por la fórmula V = xyz. Aquí V: G ⊂ R3 → R es un campo escalar que depende tres variables.
Primeras definiciones
Definición. Sean x = (x1, ..., xn) e y = (y1, ..., yn) ∈ Rn. Se llama producto interior de x por y a:
Definición. Sea x = (x1, ..., xn) ∈ Rn. Se llama norma (euclídea) de x al número real:
æx æ = x$x = x 21 + ... + x 2n
Propiedades: ∀ x, y ∈ Rn y ∀ λ ∈ R, se verifica:
1. ||x|| ≥ 0; ||x|| = 0 ⇔ x = 0 = (0, ... ,0).
2. ||λx|| = |λ|⋅||x||.
3. ||x + y|| ≤ ||x|| + ||y||.
Definición. Sea G ⊂ Rn. Decimos que G es un conjunto abierto de Rn, si todos sus puntos son interiores.
Gc = Rn - G es un conjunto abierto de Rn
∃ δ > 0 / G ⊂ B(0, δ)
G = (A ∩ G) ∪ (B ∩ G) y (A ∩ G) ∩ (B ∩ G) = ∅
∀ δ > 0 / B*(x0, δ) ∩ G ≠ ∅
Límites
Definición. Se dice que la función f(x) tiene límite λ cuando x tiende hacia x0, si:
∀ ε > 0 ∃ δ > 0 / ∀ x ∈ G y 0 < ||x - x0|| < δ ⇒ ||f(x) - λ|| < ε ⇔ lim æf(x) − æ = 0.
æx−x 0 æd0
lim f(x) =
xdx0
lim (x + y) = 3
(x,y )d(2,1 )
lim
xdx 0
f(x) = , xdx
lim0 g(x) =
LÍMITE DIRIGIDO. Se llama así, al límite cuando el punto x tiende hacia x0 y x ∈ L ⊂ G, siendo x0
un punto de acumulación de L. Puede ocurrir que tomando distintos conjuntos L se encuentren límites
distintos. Naturalmente que si existe límite en x0, existe el límite dirigido (cualquiera que sea el L) y
coincide con aquél. Pero puede existir el segundo y no el primero.
Como casos particulares (f: G ⊂ R2 → R, x0 = (x0, y0)) de límites dirigidos, veremos los siguientes:
LÍMITES RADIALES. El conjunto L es la recta y - y0 = m(x - x0). Para que exista el límite, en estos
límites radiales el resultado no debe depender de m.
LÍMITES POR PARÁBOLAS. El conjunto L es y - y0 = m(x - x0)2 ó x - x0 = m(y - y0)2. Para que
exista el límite, en estos límites por parábolas el resultado no debe depender de m.
LÍMITES REITERADOS. Consiste en hacer tender primero x hacia x0 y después y hacia y0, o bien al
revés. En este caso (x, y) tiende hacia (x0, y0) siguiendo una quebrada de lados paralelos a los ejes. Para
que exista el límite, estos límites reiterados deben coincidir.
LÍMITES POR POLARES. Consiste en sustituir x por x0 + ρcosθ e y por y0 + ρsenθ y tomar límites
cuando ρ → 0. Para que exista el límite por polares, el resultado no debe depender de θ.
x 2 − y2
x 2 + y 2 si (x, y) ! (0, 0 )
f : (x, y ) c R d f(x, y) =
2
0 si (x, y) = (0, 0)
Solución.
xy xy 2 xy xy 3
f 1 (x, y ) = , f ( x, y ) = , f (x, y ) = , f 4 (x, y ) = 2
x 2 + y2 2 x 2 + y4 3 x 2 + y2 x + y6
definidas en G = R2 - {(0, 0)} tienen límite cuando (x, y) → (0, 0), y, en caso afirmativo, hallarlo.
2
Solución. En la primera función, los límites radiales (y = mx) valen: lim 2 mx 2 2 = m 2 ; y como
xd0 x + m x 1+m
dependen de m, no existe límite.
2 3
En la segunda función todos los límites radiales valen: lim 2 m x 4 4 = 0; sin embargo, el límite
xd0 x + m x
y2 y2 1
2
dirigido según la parábola x = y es: lim = , luego, tampoco tiene límite.
2 yd0 (y 2 ) + y 4 2
ENM Matemáticas I Funciones de varias variables 5
No se puede, por tanto, asegurar que una función de dos variables tenga límite en un punto ni aunque
sean iguales todos sus límites radiales. El límite debe ser igual, no sólo acercándose (x, y) hacia (x0, y0) en
cualquier dirección, sino de cualquier manera (ver la cuarta función).
La tercera función tiene límite y éste es cero, ya que aplicando la definición:
xy x $ y x $ y x $ y
−0 = [ = = x d 0 si (x, y) → (0, 0)
x 2 + y2 x +y
2 2 y 2 y
La cuarta función no tiene límite. Los límites reiterados, radiales, por parábolas y por polares, dan
y3 y3
todos cero; sin embargo, tomando el arco x = y3, el límite es: lim = 1.
yd0 (y ) + y
3 2 6 2
Continuidad
Definición. Sean f = (f1, ..., fm): G ⊂ Rn → Rm y x0 ∈ G. Se dice que f es continua en x0, si:
Definición. Se dice que la función f es continua en G, cuando es continua en todos sus puntos.
Definición. Sean G ⊂ Rn y f: G → Rm. Decimos que f está acotada en G, si f(G) está acotado.
Ejemplo. Suponiendo que fi(0, 0) = 0, en las cuatro funciones que figuran en el último ejemplo,
solamente la tercera es continua en el punto (0, 0).
xy
Ejemplo. La función f 1 (x, y ) = si (x, y) ≠ (0, 0) y f1(0, 0) = 0, no es continua en el punto (0, 0),
x 2 + y2
pues carece de límite en ese punto. Sin embargo, es continua respecto de cada una de las variables por
separado, como muestran las igualdades siguientes:
En cambio, es evidente que si una función es continua respecto de ambas variables lo es también
respecto de cada una por separado.
ENM Matemáticas I Funciones de varias variables 6
Ejercicios propuestos
1. Demostrar que
xy 2
lim , 2x 4
(x,y )d(0,0) x 2 + y2 x + y
no existe.
x2y x2
f(x, y) = , , (x + y ) sen 2 1 2 , si (x, y) ! (0, 0 ), f(0, 0 ) = (0, 0, 0 )
x 2 + y4 x 2 + y2 x +y
tiene límite en el origen según la dirección de cualquier recta que pase por él, pero no posee límite
en dicho punto.
tiene límite igual a 0 según todas las direcciones en el origen, pero carece de límite en dicho punto.
ENM Matemáticas I Funciones de varias variables 7
f(x 0 + tv ) − f(x 0 )
lim t
td0
si existe, se llama derivada según el vector v de la función f en el punto x0 y se designa por f '(x0; v) o por
Dvf(x0). Si ||v|| = 1, entonces f '(x0; v) se llama derivada direccional según el vector v de la función f en el
punto x0. Como v = ||v||⋅u (con ||u|| = 1) entonces f '(x0; v) = ||v||f '(x0; u) (esta igualdad expresa la relación
entre la derivada según un vector y la derivada direccional).
Definición. Sea ei = (0,..,1,..,0) el vector i-ésimo de la base canónica de Rn. La derivada f '(x0; ei) si
existe, se llama derivada parcial respecto de la i-ésima variable de la función f en el punto x0 y se
designa por Dif(x0).
Así, pues,
Las derivadas parciales de f(x) se obtienen sin más que suponer constantes las variables respecto de las
cuales no se deriva, todas las reglas para derivar funciones de una variable se pueden aplicar ahora.
Ejemplo. Si v = 0, f '(x0; 0) = 0.
Teorema. Si g(t) = f(x0 + tv) (v ≠ 0) y si una de las derivadas g'(t) o f '(x0 + tv; v) existe, entonces
también existe la otra y coinciden. Además g'(0) = f '(x0; v)
Teorema (valor medio para campos escalares). Supongamos que existe f '(x0 + tv; v) ∀ t ∈ [0, 1].
Entonces existe un c ∈ (0, 1) tal que: f(x0 + v) - f(x0) = f '(x0 + cv; v).
x3
x 2 + y 2 si (x, y) ! 0, 0
( )
f(x, y) =
0 si (x, y) = (0, 0)
Las derivadas parciales de f existen en todo punto (x, y) ≠ (0, 0), puesto que en el abierto R2 -
{(0, 0)} f es un cociente de funciones derivables respecto de x y de y (polinomios) con el denominador
distinto de cero. Aplicando la regla de derivación de un cociente y considerando y constante en el primer
caso y x constante en el segundo, se obtienen
ENM Matemáticas I Funciones de varias variables 8
x 2 (x 2 + 3y 2 ) 2x 3 y
D 1 f(x, y) = , D 2 f(x, y) = −
(x 2 + y 2 ) 2 (x 2 + y 2 ) 2
para cada (x, y) ≠ (0, 0). También existen las derivadas parciales de f en (0, 0), pues para t ≠ 0,
f(t, 0 ) − f(0, 0)
D 1 f(0, 0) =lim t =lim tt = 1
td0 td0
f(0, t ) − f(0, 0)
D 2 f(0, 0) =lim t =lim 0t = 0
td0 td0
Sean G un abierto de R2, (x0, y0) ∈ G y f: G → R. Veamos qué representan geométricamente las dos
derivadas parciales de la función f(x, y). Supongamos que la superficie ABCD sea la imagen geométrica
de la función z = f(x, y), definida en el conjunto rectangular OB'C'D' (G).
x = x0 + 0t
y = y0 + 1t
z = z0 + D2f(x0, y0)t
luego a = (0, 1, D2f(x0, y0)) es un vector director de esta tangente. Análogamente b = (1, 0, D1f(x0, y0)) es un
vector director de la tangente en M a la línea QMP. Por tanto, a×b = (D1f(x0, y0), D2f(x0, y0), -1), es un vector
asociado al plano que determinan esas dos tangentes, al que se llamara plano tangente en M(x0, y0, z0) a
ENM Matemáticas I Funciones de varias variables 9
la superficie representada por la ecuación z = f(x, y). De esto resulta que este plano tiene por ecuación
cartesiana:
z - z0 = D1f(x0, y0)(x - x0) + D2f(x0, y0)(y - y0)
Tenemos que:
f(x 0 + h ) − f(x 0 ) − K (h ) h 21 + h 22
lim = lim = lim h 21 + h 22 =0
hd0 æh æ (h 1 ,h 2 )d (0,0 )
h 21 + h 22 (h 1 ,h 2 )d (0,0 )
Teorema. Sean G un abierto de Rn, x0 ∈ G y f: G → R diferenciable en x0. Entonces existe f '(x0; v) para
todo v de Rn y Df(x0)(v) = f '(x0; v). Además f '(x0; v) = ∇f(x0)⋅v.
Observación. Como f '(x0; v) = ∇f(x0)⋅v = ||∇f(x0)||⋅⋅||v||⋅⋅cosθ; la derivada direccional, f '(x0; u), de f(x0),
es máxima en la dirección de ∇f(x0), y es igual a la proyección del gradiente sobre u.
es continua y diferenciable en el origen, pero D1f y D2f no son continuas en él; es decir, no es
continuamente diferenciable en el origen.
L(c) = {x ∈ G | f(x) = c}
f(x 0 + tv ) − f(x 0 )
lim t
td0
si existe, se llama derivada según el vector v de la función f en el punto x0 y se designa por f '(x0; v) o por
Dvf(x0). Si ||v|| = 1, entonces f '(x0; v) se llama derivada direccional según el vector v de la función f en el
punto x0. Si f = (f1, ..., fm); f '(x0; v) = (f1'(x0; v), ..., fm'(x0; v)).
Ejemplo. Si v = 0, f '(x0; 0) = 0.
Teorema. Sean G un abierto de Rn y x0 ∈ G. f = (f1, ..., fm): G → Rm es diferenciable en x0, si, y sólo si,
las fi son diferenciables en x0 ∀ i = 1, 2, ..., m. Además Df(x0)(h) = (Df1(x0)(h), ..., Dfm(x0)(h)).
D 1 f 1 (x 0 ) ... D n f 1 (x 0 ) v1
.............. ... .............. ...
D 1 f m (x 0 ) ... D n f m (x 0 ) vn
Teorema. (Regla de la cadena) Sea G un conjunto abto. de Rn, H un conjunto abierto de Rm, f: G → H
una función diferenciable en x0 ∈ G y g: H → Rp una función diferenciable en f(x0). Entonces gºf es
diferenciable en x0 y se verifica que D(gºf)(x0) = Dg(f(x0))ºDf(x0).
ENM Matemáticas I Funciones de varias variables 12
Ejemplo. Sean:
(x, y, z ) d (x 2 , ye z ) d (x 2 ye z , x 2 + ye z )
g)f
v u 2x 0 0
Dg(u, v) = , Df(x, y, z) =
1 1 0 e z ye z
ye z x 2 2x 0 0 2xye z e z x 2 ye z x 2
D(g ) f)(x, y, z) = $ =
1 1 0 e z ye z 2x ez ye z
Ejemplo. Sean G un conjunto abierto de R2, H un conjunto abierto de R2, X: G → H una función
diferenciable en (u, v) ∈ G y f: H → R una función diferenciable en (x1(u, v), x2(u, v)) ∈ H. Entonces
f(x1(u, v), x2(u, v)) = F(u, v) es diferenciable y se verifica que:
D1F(u, v) = f '(x)D1X(u, v)
D2F(u, v) = f '(x)D2X(u, v)
x3
x 2 + y 2 si (x, y) ! 0, 0
( )
f : (x, y ) c R d f(x, y) =
2
0 si (x, y) = (0, 0)
es diferenciable en la dirección de todo vector v = (v1, v2), ||v|| = 1 en (0, 0), pero no es diferenciable en
dicho punto.
f(0 + tv 1 , 0 + tv 2 ) − f(0, 0)
Solución. En efecto: D v f(0, 0) =lim t = v 31
td0
ENM Matemáticas I Funciones de varias variables 13
Una condición necesaria para la existencia de este límite es, que exista y sea el mismo, en el pto. (0, 0),
según todas las direcciones, cosa que no ocurre, pues en la dirección de la recta h = mk, es:
lim −hk 2 = −m
(h,k )d(0,0 )
(h 2 + k2 )
3
(1 + m 2 ) 3
Teorema (valor medio). Sean G un abierto de Rn, f: G → R y x, y ∈ G tales que el segmento L(x, y)
que une x e y está contenido en G. Existe entonces un punto c ∈ L(x, y) tal que
Definición. Sean G un abierto de Rn, f = (f1, ..., fm): G → Rm y x0 ∈ G, se dice que f es continuamente
diferenciable en el punto x0, si están definidas en una bola B(x0, δ) ⊂ G, y son continuas en x0, las
funciones: Difj: B(x0, δ) → R, i = 1, 2, ..., n, j = 1, 2, ..., m.
Ejemplo. La función
x3
x 2 + y 2 si (x, y) ! 0, 0
( )
f : (x, y ) c R d f(x, y) =
2
0 si (x, y) = (0, 0)
es diferenciable continuamente y por tanto diferenciable en R2 - {(0, 0)}, porque sus derivadas:
x 2 (x 2 + 3y 2 ) 2x 3 y
D 1 f(x, y) = , D 2 f(x, y) = −
(x 2 + y 2 ) 2 (x 2 + y 2 ) 2
Ejercicios propuestos
y y y
1. Si z = xne(ax+by)f( x ), donde f( x ) es una función arbitraria de x , demuéstrese que
2. Comprobar que la función f(x, y) = x 2 + y 2 , es continua en (0, 0), pero no es diferenciable en el.
no es continua ni posee (en general) derivadas direccionales en el origen, pero si posee derivadas
parciales en el.
6. Dada la función:
7. Dada la función:
f(x, y) = |x|seny
Se pide:
Conjunto ó conjuntos en los que:
a) f es continua. b) Existe el gradiente de f.
c) f es diferenciable continuamente. d) f es diferenciable.
ENM Matemáticas I Funciones de varias variables 15
xy si y ! 0
8. Dada la función: f : (x, y ) c R 2 d f(x, y) =
0 si y = 0
Comprobar si las siguientes afirmaciones son ciertas:
a) Es continuamente diferenciable en R² - OX.
b) No es continua ni admite derivadas parciales en los puntos de la forma (a, 0) si a ≠ 0.
c) Es continua en (0, 0) y admite derivadas parciales en él.
9. Dada la función:
x 3 − y2
x 2 + y 2 si (x, y) ! (0, 0 )
f : (x, y ) c R d f(x, y) =
2
0 si (x, y) = (0, 0)
a) Hallar el conjunto ó conjuntos en los que:
a1) f es continua.
a2) Existe el gradiente de f.
a3) f es diferenciable.
a4) f es continuamente diferenciable.
b) Calcular D1f y D2f.
c) Calcular Dvf(1, 1) usando la definición en la dirección del vector (3, 4). Comprobar que está bien
hallada usando que Dvf(1, 1) = ∇f(1, 1)⋅v.
y
10. Derivar la función f(x, y) = x2 + y2 + sen x en la dirección de la bisectriz del primer cuadrante.
11. Derivar la función f(x, y, z) = x2 + 3y2 + 8z2 + 2xyz en la dirección del vector (4, 7, 2).
12. Hallar la derivada de la función f(x, y) = 3x4 - xy + y3 en el punto (1, 2) según la dirección que
forma con el eje "OX" un ángulo de 60º.
f(x, y) = (x + y, x 1+ y )
16. Hallar la ecuación del plano tangente y la recta normal a la superficie definida por:
f(x, y) = x2 + y2
17. Aplicando la regla de la cadena, obtener la matriz jacobiana de la aplicación gºf en el punto (1, π)
siendo:
f(x, y) = xy
g(u) = (senu, 3u, eu)
18. Obtener, mediante la regla de la cadena, la matriz jacobiana de la aplicación gºf en (1, 1, 1), siendo:
f(x, y, z) = (ex+y, eyz)
g(u, v) = L(uv)
19. Dada f: R2 → R, función diferenciable en todo R2; estudiar la diferenciabilidad y calcular la matriz
jacobiana, así como la diferencial de la aplicación:
g(x, y) = ef(x, x + y)
Djf: G → R
Si para cada x ∈ G existe Di(Djf), esta derivada parcial se llama derivada parcial segunda respecto de
las variables xj, xi de la función f en el punto x y se representa por Dijf(x).
Si todas las derivadas parciales de orden p de f existen en cada punto de G y son continuas en G,
entonces se dice que f es una función de clase p en G y se escribe f ∈ Cp(G)
Ejemplo. La función:
es tal que
1 si x > 0
D 1 f : (x, y) c R 2 − x = 0 d D 1 f(x, y) =
−1 si x < 0
D12f(0, 3) = D1(D2f)(0, 3) = 0
Teorema. (Teorema de Schwarz) Sean G un abierto de R2 y f: G → R, supongamos que D1f, D2f, D12f
y D21f existen en B((x0, y0), δ) ⊂ G. Si D12f y D21f son continuas (x0, y0) se verifica que:
Nota. Existe una versión más fuerte de este teorema que dice que: si D1f, D2f, y D21f $ en B((x0, y0), δ)
⊂ G, y si D21f es continua (x0, y0) entonces existe D12f(x0, y0) y D12f(x0, y0) = D21f(x0, y0).
x 2 − y2
f(x, y) = xy , si (x, y) ≠ (0,0); y f(0, 0) = 0
x 2 + y2
Solución.
f(h, y) − f(0, y) h 2 − y2
D 1 f(0, y) = lim = lim hy = −y
hd0 h hd0 h(h 2 + y 2 )
D 1 f(0, k) − D 1 f(0, 0)
D 21 f(0, 0) = lim = lim −k = −1
kd0 k kd0 k
ENM Matemáticas I Funciones de varias variables 18
(siempre que existan todas las derivadas parciales de orden n en (x0, y0)).
Si f ∈ Cn(G),
Dnf(x0, y0)(h1, h2) = ( n0 ) h1nD1...1f (x0, y0) + ( n1 )h1n-1h2D1..12f (x0, y0) + ⋅⋅⋅ + ( nn )h2nD2...2f (x0, y0)
Teorema. (Fórmula de Taylor) Sean G un conjunto abierto de R2, (x0, y0) ∈ G, f: G → R, verificando
que f ∈ Cn+1(G). Entonces ∀ (h1, h2) tal que (x0 + h1, y0 + h2) ∈ B((x0, y0), δ) ⊂ G, ∃ θ ∈ (0, 1) tal que:
n
f(x 0 + h 1 , y 0 + h 2 ) − f(x 0 , y 0 ) = 1 D i f(x 0 , y 0 )(h 1 , h 2 ) + 1 D n+1 f(x + h , y + h )(h , h )
i=1 i! (n + 1 )! 0 1 0 2 1 2
f(tx) = tmf(x) ∀ x ∈ D,
en donde t ∈ R.
1. f ∈ C1(G).
D 1 f 1 (x 0 ) ... D n f 1 (x 0 )
2. .............. ... .............. ! 0 .
D 1 f n (x 0 ) ... D 1 f n (x 0 )
D 1 f 1 (x ) ... D n f 1 (x )
2º) ∀ x ∈ B(x0, r) ⇒ .............. ... .............. !0 .
D 1 f n (x ) ... D 1 f n (x )
El teorema de la función inversa es esencialmente local. Una función f puede verificar todas las
hipótesis del teorema en cualquier punto x0 ∈ Rn, lo que garantiza la existencia de una inversa local
diferente para cada x0 ∈ Rn y no ser inyectiva, con lo que no tendrá inversa global.
es evidentemente de clase C1 en R2 y
e x cos y −e x sen y
= e 2x > 0
e x sen y e x cos y
para todo (x, y) ∈ R2, luego f verifica las hipótesis del teorema de la función inversa en todo punto (x, y) ∈
R2. Por consiguiente, para cada (x, y) ∈ R2 existen una B((x, y), r) tal que la restricción de f a B((x, y), r)
tiene una inversa de clase C1. Con otras palabras, f tiene una inversa local de clase C1 en una bola de
centro cada punto. Sin embargo, f no tiene inversa global, pues f(x, y) = f(x, y + 2π) y, por tanto, f no es
inyectiva en R2.
ENM Matemáticas I Funciones de varias variables 20
Teorema. (Teorema de la función implícita) Sean G un conjunto abierto de Rn+m, (x0, y0) ∈ G, donde
x0 ∈ Rn e y0 ∈ Rm, y sea f = (f1, ..., fm): G → Rm verificando:
1. f ∈ C1(G).
1º) ∃ g = (g1, ..., gm) : B(x0, r)→ Rm, tal que g ∈ C1(B(x0, r)).
D 3 f 1 (1, 1, 1, 1) D 4 f 1 (1, 1, 1, 1) −2 −2
= = 12 ! 0
D 3 f 2 (1, 1, 1, 1) D 4 f 2 (1, 1, 1, 1) 3 −3
de clase C1(B((1, 1), r)) tal que f(x, y, g1(x, y), g2(x, y)) = (0, 0) ∀ (x, y) ∈ B((1, 1), r). En particular, se
tiene que g1(1, 1) = 1 y g2(1, 1) = 1.
Además:
−1
D 3 f 1 (1, 1, 1, 1) D 4 f 1 (1, 1, 1, 1) D 1 f 1 (1, 1, 1, 1) D 2 f 1 (1, 1, 1, 1) 0 1
Dg(1, 1) = − =
D 3 f 2 (1, 1, 1, 1) D 4 f 2 (1, 1, 1, 1) D 1 f 2 (1, 1, 1, 1) D 2 f 2 (1, 1, 1, 1) 1 0
ENM Matemáticas I Funciones de varias variables 21
El último teorema nos dice que si f tiene derivadas parciales en un punto x0 que es extremo relativo de
f, entonces x0 es un punto crítico de f. Sin embargo, una función puede tener puntos críticos que no sean
extremos relativos.
Teorema. Sean G un conjunto abierto de Rn, x0 ∈ G y f: G → R tal que f ∈ C2(G). Supongamos que x0
es un punto crítico de f y sea Hk = |Dijf(x0)|, con 1 ≤ i, j ≤ k. Entonces
1. Si es Hk > 0 para k = 1, 2, ..., n, entonces x0 es un punto mínimo relativo de f.
2. Si (-1)kHk > 0 para k = 1, 2, ... ,n, entonces x0 es un punto máximo relativo de f.
3. Si Hk ≥ 0 o (-1)kHk ≥ 0 ∀ k, con algún Hi = 0, entonces x0 puede ser extremo relativo de f o no. Hay
que hacer un estudio local.
4. En cualquier otro caso, x0 no es extremo relativo de f.
Ejemplo. Sea f: R2 → R la función definida por: f(x, y) = x2 + xy. Hallar sus extremos relativos.
D 11 f(0, 0) D 12 f(0, 0) 2 1
= <0
D 21 f(0, 0) D 22 f(0, 0) 1 0
f(x, y, z) = x2 + y2 + z2 - xy + x - 2z.
Hallar sus extremos relativos.
Sea G un abierto de Rn. El problema de determinar los extremos de una función f: G → R sobre un
conjunto M ⊂ G, se llama problema de extremos condicionados, aludiendo al hecho de que las variables
x1 ,..., xn están sometidas a la condición de que (x1 ,..., xn) ∈ M.
uH F (x 0 )u t > 0 x 0 es mínimo
Teorema. Si x0 ∈ M, es punto crítico de F y F ∈ C2(G), ⇒ si donde
uH F (x 0 )u < 0 x 0 es máximo
t
V = xyz
D1F = yz + λ(y + z) = 0
D2F = xz + λ(x + z) = 0
D3F = xy + λ(x + y) = 0
xy + yz + zx = a
resuelto el sistema, obtenemos x = y = z = a . Así, obtenemos el único sistema de valores x,y,z para los
3
cuales la función puede tener un máximo o un mínimo.
a a
0 12 12
HF(x0) = a
12 0 a
12
, Dg(x0) = 2 a
2 2 a
2 2 a
2 ⇒ u1 = (-1, 1, 0) y u2 = (-1, 0, 1)
a a
12 12 0
Ejercicios propuestos
f(x, y, z) = xy + yz + z2
ey - e-y - xy = 0
y - ex+y = 0
define implícitamente una solución de la forma y = f(x), en que conjunto ó conjuntos y para que
datos iniciales. Calcular además, f '(x) cuando sea posible.
xy - zLy + exz = 1
define en el punto (0, 1, 1) una solución de la forma: a) z = f(x, y), b) y = g(x, z) y, determinar en
caso afirmativo, el gradiente de la solución en un punto arbitrario "y", en particular, en el punto por
el que pasa dicha solución (dato inicial).
para un dato inicial (que se ha de hallar) y, en caso afirmativo, determinar la matriz jacobiana en un
punto arbitrario (x, y) ∈ R2 en el que esté definida. Obtener explícitamente f en este caso (es
posible por la naturaleza sencilla del sistema de ecuaciones).
7. Comprobar que se verifica el teorema de Schwarz para la función: f(x, y) = sen(xy + 1).
ENM Matemáticas I Funciones de varias variables 24
Obtener, para la misma función, el desarrollo en serie de Taylor de grado 2 en un punto arbitrario
(a, b) y el resto correspondiente.
especificando su naturaleza.
especificando su naturaleza.
f(x, y) = 6 - 4x - 3y
con la condición x2 + y2 = 1.
f(x, y, z) = x2 + y2 + z2
y el punto P(0, 1), hallar los puntos de la curva cuyas distancias a P sean máximas o mínimas.
15. Calcular los extremos relativos de la función f(x, y) = x2 + xy + y2 estando "x" e "y" ligados por la
relación x3y + y3x = a, en donde "a" es una constante.
18. Hallar los máximos y mínimos de la función f(x, y) = (x2 + y2)2 - 4x2.
ENM Matemáticas I Funciones de varias variables 25
19. Dada la esfera x2 + y2 + z2 = 3 encontrar en el primer octante un punto P en la superficie tal que el
plano tangente determine con los planos coordenados un tetraedro de volumen mínimo y hallar
éste.
define una función (z, y) = g(x) en una bola de centro el punto (1, 1, 1). Hallar Dg(1).
b) Probar que la función f: R2 → R2 definida por f(u, v) = (u2 - v2, 2uv) es localmente invertible de
clase uno en el punto (1, 1), y calcular la diferencial de la función inversa en el punto (0, 2).
21. Hallar, aplicando el método de los multiplicadores de Lagrange, el punto de la parábola y2 = 4x más
próximo o más alejado (si existe) del punto (1, 0).
22. Hallar los máximos y mínimos de la función: f(x, y) = x4 + y4 - 2x2 + 4xy - 2y2.
ENM Matemáticas I Trigonometría esférica 1
TEMA 4
TRIGONOMETRÍA ESFÉRICA
Conceptos preliminares
B
esfera A y B que no son extremos de un diámetro P'
pertenecen a una sola circunferencia máxima. El
O menor arco AB de esta circunferencia máxima es la mínima distancia (curva más
corta) que hay desde A a B.
P'
Ángulos esféricos. Se llama ángulo esférico, al ángulo P
formado en una esfera por dos arcos secantes de
circunferencias máximas. Los arcos de las circunferencias máximas son los
lados del ángulo esférico, y el punto de intersección de los arcos es el vértice.
La medida del ángulo esférico viene dada por el ángulo diedro formado por los
planos de las circunferencias máximas. O
P Triángulos esféricos. Se llama triángulo esférico, a A B
la región de la superficie de una esfera limitada por los
arcos de tres circunferencias máximas. Los arcos son los
C
a
lados del triángulo esférico, y los vértices de los tres P'
b
O ángulos esféricos son los vértices (ángulos) del
A c B triángulo esférico.
E = A + B + C - 180º
2
Área de un triángulo esférico. A = R E
180
C'
Triángulos Polares. Sean A, B, C los vértices de un triángulo
C
esférico. Trácense las tres circunferencias máximas cuyos polos
son los tres vértices dados. Denomínese A' la intersección de las a'
circunferencias máximas cuyos polos son B y C y que se b' a
encuentra, respecto de BC, al mismo lado que A; B' la intersección b
de las circunferencias máximas cuyos polos son C y A y que se
encuentra respecto de CA, al mismo lado que B; C' la intersección
de las circunferencias máximas cuyos polos son A y B y que se B
B
encuentra, respecto de AB, al mismo lado que C. El triángulo A c
A'B'C' es el triángulo polar de ABC. Sus lados se denominarán a',
A' c'
b', c'.
Aplicaciones. Para simplificar algunos cálculos, se acostumbra a considerar la Tierra como una esfera.
El eje de rotación de esta esfera interseca la superficie de ésta en dos polos norte y sur, Pn y Ps La
circunferencia máxima cuyos polos son Pn y Ps recibe el nombre de ecuador. Dado un punto cualquiera
A, de la superficie de la tierra, diferente de los polos, se llama meridiano de A a la semi-circunferencia
PnAPs. El primer meridiano o meridiano cero pasa por el observatorio astronómico de Greenwich,
Inglaterra.
Pn
La latitud (lat.) de A es la distancia angular desde el ecuador
hasta A. Se mide por el ángulo A'OA o por el arco AA' del
meridiano A. La latitud se denomina norte o sur según que el A G Primer
punto dado se encuentre en el hemisferio norte o en el hemisferio meridiano
sur. La diferencia de latitud entre dos puntos cuyas latitudes son L
L1 y L2 (L1 > L2), es L1 - L2 si ambos puntos se encuentran en el O O E
mismo hemisferio, y es L1 + L2 si se encuentran en hemisferios G'
diferentes. A' Lo
Ecuador
La longitud (long.) de A es el ángulo (no mayor que 180º)
entre el primer meridiano y el meridiano de A. Se mide por el Ps
arco G'A' determinado en el ecuador por los dos meridianos o
por el ángulo esférico G'PnA'. La longitud se denomina este u oeste según que el punto dado se encuentre
al este o al oeste del primer meridiano. La diferencia de longitud entre dos puntos cuyas longitudes
respectivas son λ1 y λ2 (λ1 > λ2) es λ1 - λ2 si ambos puntos se encuentran hacia un mismo lado del primer
meridiano y es menor que λ1 + λ2 y es 360º - (λ1 + λ2) si se encuentran en lados diferentes.
ENM Matemáticas I Trigonometría esférica 3
Los meridianos que pasan por dos puntos de la superficie de la Tierra y los arcos menores de
circunferencia máxima que unen dichos puntos determinan dos triángulos esféricos APnB y APsB. Las
distancias a lo largo de un arco de circunferencia máxima se expresan, generalmente, en millas náuticas.
Por definición
Se llama triángulo esférico rectángulo a un triángulo esférico tal que uno de sus ángulos sea recto.
Cualquier triángulo rectángulo ABC, donde el ángulo recto siempre se encuentra en C, se resuelve de la
siguiente forma (reglas de Neper):
a
c
C
A b
obtenemos el triángulo:
co-B
a
co-c
co-A b
y aplicamos la siguiente regla: Escójase una cualquiera de las cinco partes y denomínesela parte media;
llámense partes adyacentes a los elementos que se encuentran a ambos lados de la parte media, y llámense
partes opuestas a los elementos restantes. Entonces, las reglas de Neper son:
1. El seno de cualquier parte media es igual al producto de las tangentes de las partes adyacentes.
2. El seno de cualquier parte media es igual al producto de los cosenos de las partes opuestas.
Leyes de los cuadrantes para triángulos rectángulos. En todo triángulo esférico rectángulo deben
verificarse siempre las leyes siguientes:
1. El lado "a" y el ángulo "A" (lo mismo que el lado "b" y el ángulo "B") pertenecen al mismo
cuadrante.
2. Si c < 90º, entonces los lados "a" y "b" (lo mismo que los ángulos "A" y "B") pertenecen al mismo
cuadrante; si c > 90º, entonces los lados "a" y "b" (lo mismo que los ángulos "A" y "B") pertenecen
a cuadrantes diferentes.
Ejemplo.- Resolver el triángulo esférico rectángulo ABC, dados a = 46º 12,3' y c = 75º 48,6'.
Solución.- sen(co-B) = tan(co-c)⋅tan a ⇒ cos B = cot c⋅tan a = 0,2637 ⇒ B = 74º 42' 32"
sen a = cos(co-c)⋅cos(co-A) ⇒ sen A = cosec c⋅sen a = 0,7445 ⇒ A = 48º 7' 9"
sen(co-c) = cos a⋅cos b ⇒ cos b = cs c⋅sec a = 0,3542 ⇒ b = 69º 15' 19"
ENM Matemáticas I Trigonometría esférica 5
Ejemplo.- Resolver el triángulo esférico rectángulo ABC, dados a = 109º 15,8' y B = 38º 45,4'.
Solución.-
sen(co-A) = cos(co-B)⋅cos a ⇒ cos A = sen B⋅cos a = -0,20652 ⇒ A = 101º 55' 8"
Ejemplo.- El rumbo inicial de un derrotero a lo largo de una circunferencia máxima, a partir de Nueva
York (lat. 40º 42' N, long. 74º 1' O) es 30º 10'. Localizar el punto M del recorrido más cercano al polo
norte, y calcular (en millas náuticas) las distancias, en las circunferencias máximas, desde M hasta el polo
y hasta Nueva York.
P
Solución.- La distancia mínima entre el recorrido y el polo norte n
'
m
10
P se mide a lo largo del meridiano que es perpendicular a la ruta. En 30
º
p M
el triángulo esférico NPM, M = 90º, m = NP = 90º - 40º 42' = 49º 18' N
y N = 30º 10'; P, n y p son las partes buscadas.
40º 42'
O E
sen n = cos(co-m)⋅cos(co-N) = sen m⋅sen N = 0,3809 ⇒
Ejemplo.- El rumbo inicial de un derrotero a lo largo de una circunferencia máxima, a partir de San
Francisco (lat. 37º 48,5' N, long. 122º 24' O) es 220º 30'. Localizar el punto M donde el recorrido corta el
ecuador, y calcular la distancia, en la circunferencia máxima, desde M hasta San Francisco.
Entonces R.S. = 180º + 98º 13,2' = 278º 13,2', R.LL. = 270º - 42º 29,2' = 227º 30,8', y la distancia es t =
99º 4,5' = 5944,5 millas.
ENM Matemáticas I Trigonometría esférica 7
Para resolver un triángulo esférico oblicuángulo, necesitamos conocer tres de sus elementos. En este
caso, calcularemos los restantes elementos con el uso de las fórmulas:
Ley de cosenos para lados. cos a = cos b⋅cos c + sen b⋅sen c⋅cos A.
Ley de cosenos para ángulos. cos A = -cos B⋅cos C + sen B⋅sen C⋅cos a.
sen(s − b ) $ sen(s − c )
Fórmulas para el ángulo mitad. tan A = donde s = a + b + c.
2 sen s $ sen(s − a ) 2
cos(S − B ) $ cos(S − C )
Fórmulas para el semi-lado. cot a = donde S = A + B + C .
2 − cos S $ cos(S − A ) 2
Analogías de Gauss.
Analogías de Neper.
Ejemplo.- Resolver el triángulo esférico ABC, dados a = 121º 15,4', b = 104º 54,7', c = 65º 42,5'.
cos a = cos b⋅cos c + sen b⋅sen c⋅cos A ⇒ cos A = cos a − cos b $ cos c = -0,4689 ⇒ A = 117º 57' 51".
sen b $ sen c
Análogamente:
Ejemplo.- Resolver el triángulo esférico ABC, dados A = 117º 22,8', B = 72º 38,6', C = 58º 21,2'
cos A = -cos B⋅cos C + sen B⋅sen C⋅cos a ⇒ cos a = cos A + cos B $ cos C = -0,3733 ⇒ a = 111º 55,4'
sen B $ sen C
Análogamente:
Ejemplo.- Resolver el triángulo esférico ABC, dados a = 106º 25,3', c = 42º 16,7', B = 114º 53,2'
cos b = cos a⋅cos c + sen a⋅sen c⋅cos B = -0,4807 ⇒ b = 118º 43' 57"
Ejemplo.- Resolver el triángulo esférico ABC, dados A = 48º 44,6', B = 60º 42,6', c = 76º 22,4'
cos C = -cos A⋅cos B + sen A⋅sen B⋅cos c = -0,1681 ⇒ C = 99º 40' 48"
Ejemplo.- Resolver el triángulo esférico ABC, dados a = 80º 26,2', c = 115º 30,6', A = 72º 24,4'
sen a
C = 60 44’28”
sen A sen C o
cos b = cos a⋅cos c + sen a⋅sen c⋅cos B = 0,2305 ⇒ b = 76º 40' 8"
ENM Matemáticas I Trigonometría esférica 9
Ejemplo.- Resolver el triángulo esférico ABC, dados A = 35º 52,5', a = 40º 38,6', B = 56º 10,7'
Entonces a = 90º - 37º 47,5' = 52º 12,5', b = 90º - 21º 18,3' = 68º 41,7' y C = 157º 52,3' - 122º 25,7' =
35º 26,6'.
C
Por la ley de cosenos para lados, tenemos que:
Ejemplo.- Un barco navega a lo largo de una circunferencia máxima desde Dutch Harbor (lat. 53º 53'
N, long. 166º 35' O) hasta Melbourne (lat. 37º 50' S, long. 144º 59' E). a) Encontrar la distancia, el rumbo
de salida y el rumbo de llegada. b) Localizar el punto donde el recorrido corta al ecuador. Encontrar el
rumbo y la distancia desde este punto a Dutch Harbor. c) Localizar el punto del recorrido cuya longitud es
180º. Encontrar el rumbo y la distancia desde este punto a Dutch Harbor.
La distancia buscada es 100º 45,4' = 6045,4 millas. El rumbo de salida es 360º - A = 216º 58,6' y el
rumbo de llegada es 180º + B = 206º 40,4'.
ecuador
triángulo rectángulo AGD de la figura (b), en el que G = 90º d = 53º 53' y A =
180º - 143º 1,4' = 36º 58,6'. A
g
d
Aplicando las reglas de Neper (para triángulos rectángulos), obtenemos:
D a G
tan a = sen d⋅tan A = 0,6082 ⇒ a = 31º 18,5'
B fig. b
cos D = cos d⋅sen A = 0,3545 ⇒ D = 69º 14,1'
La longitud de D es 166º 35' + 31º 18,5' = 197º 53,5' O = 162º 6,5' E. El rumbo de llegada a D es de
270º - D = 200º 45,9'. La distancia de D a Dutch Harbor es g = 59º 45,7' = 3585,7 millas.
c) Llamemos M al punto del recorrido cuya longitud es 180º y consideremos el triángulo esférico AMC
de la figura (c) en el que C = 180º - 166º 35' = 13º 25', m = 90º - 53º 53' = 36º 7' y A = 143º 1,4'
Ejemplo.- Un buque parte de Nueva York (lat. 40º 48,6' N, long. 73º 57,5' O) para efectuar una
travesía a lo largo de una circunferencia máxima. El rumbo de salida es 36º. (a) Encontrar la latitud y la
longitud de su posición B cuando ha recorrido 500 millas. (b) Localizar el punto de la travesía que se
encuentra más hacia el norte.
C
Solución.- a) En la figura (a), A es Nueva York ⇒
Ejercicios propuestos
Resolver cada uno de los siguientes triángulos esféricos rectángulos ABC, en los que C = 90º.
11. Un barco parte de Nueva York (lat 40º 42' N, long. 74º 1' O) con un rumbo inicial hacia el este a lo
largo de una circunferencia máxima. Encontrar su rumbo y posición cuando ha recorrido 525 millas
náuticas.
12. El rumbo inicial a lo largo de una circunferencia máxima, a partir de Yokohama (lat. 35º 37' N, long.
139º 39' E) es 40º 40'. Localizar el punto del recorrido más cercano al polo norte.
13. Un barco que parte de A (lat. 36º 50' N, long. 76º 20' O) y que navega a lo largo de una
circunferencia máxima corta el ecuador en un punto cuya longitud es 50º O. Encontrar el rumbo
inicial y la distancia recorrida.
TEMA 1
CURVAS
Definición de curva
Definición (de curva simple).- Sea C ⊂ Rn (n = 2 o 3) un conjunto conexo. Decimos que C es una
curva simple o curva de Jordan si ∀ P ∈ C, ∃ BP ⊂ Rn tal que BP…C = a(I), donde I = (a, b) ⊂ R y a es
un homeomorfismo entre (a, b) y BP…C. Al par (I, a) se le llama carta o representación paramétrica de
C en el entorno a(I) del punto P. A una colección de cartas que recubre la curva C se le llama atlas. Las
curvas simples se clasifican en elementales y cerradas:
Definición.- Sean P, Q dos puntos de una curva C = a(I), se llama arco de curva (o camino) g de
extremos P y Q a la porción de curva C que une P y Q. g = a([c, d]) con [c, d] Õ I.
Definición (de curva general).- Decimos que C ⊂ Rn es una curva general no cerrada si C = a((a, b)),
donde a homeomorfismo local de (a, b) en C; y decimos que C es una curva general cerrada si C =
a([a, b]), donde a es un homeomorfismo local de [a, b] en C y a(a) = a(b).
Definición.- Se llaman ecuaciones paramétricas de una curva C a: x1 = α1(t), ..., xn = αn(t) en donde t
∈ (a, b) si no es cerrada o bien t ∈ [a, b] con a(a) = a(b) si es cerrada. Ejemplo: La hélice circular definida
por a(t) = (aÿcost, aÿsent, bÿt) a > 0, b > 0 y t œ R.
Curvas regulares
Definición.- Un punto P = a(t0) de una curva diferenciable C = a(I) se llama singular para la
parametrización dada si a'(t0) = 0 y regular si a'(t0) ≠ 0. Una parametrización de clase q ≥ 1 se dice
regular si no tiene ningún punto singular. Una curva C es regular si posee una parametrización regular.
Definición.- Dada una representación regular (I, a) de C, se llama cambio admisible de parámetro a
un homeomorfismo g de otro intervalo J ⊂ R en I de clase q ≥ 1, tal que g'(u) ≠ 0 para todo u ∈ J.
Definición.- Una curva simple (I, a) es regular a trozos si existe una partición {t0,..., tm} de I tal que
la curva es regular en cada subintervalo abierto (ti-1, ti) con i = 1, ..., m.
Curvas rectificables
Sea γ = a([c, d]) ⊂ C un arco de curva. La partición σ = {c = t0,..., tm = d} determina una línea poligonal
m
inscrita en γ cuya longitud es: L( ) = æ(t i ) − (t i−1 )æ.
i=1
Definición.- Se dice que γ es un arco de curva rectificable si el conjunto {L(σ) / σ ∈ P[c, d]} está
acotado. Su supremo se denomina longitud de γ y se representa por L(c, d). Una curva C es rectificable si
los son todos sus arcos.
Definición.- Sea C = a(I) una curva rectificable. Se llama abscisa curvilínea de origen t0 ∈ I relativa a
a a la función s: I → J ⊂ R definida por: s(t) = L(t0, t) si t ≥ t0 y s(t) = -L(t0, t) si t ≤ t0.
Teorema.- Si la curva regular C = a(I) es de clase uno en I, "s" es de clase uno en I y s'(t) = ||a'(t)||.
Como consecuencia la longitud de arco de una curva regular de clase uno desde el punto t0 al punto t
t
viene dada por: s(t) = ¶ t0 æ ∏ (u )ædu.
Sea C una curva dada por una parametrización natural (el parámetro es la longitud de arco) x(s) o una
parametrización regular a(t) y sea P = x(s0) = a(t0) un punto fijo de C.
∏ (t 0 )
Proposición.- Se verifica que: t = .
æ ∏ (t 0 )æ
Propiedades.-
1. El vector K(s) no depende de la orientación de la curva.
2. K(s) ⊥ t.
æ ∏ (t 0 ) % ∏∏ (t 0 ) æ
Teorema.- Si la curva viene dada por a(t), la curvatura en el punto P es: χ(t0) = .
æ ∏ (t 0 )æ 3
Definición.- Un punto cuya curvatura es cero se llama punto de inflexión o singular de orden uno.
x ∏∏ (s 0 )
Definición.- Si ||x"(s0)|| ≠ 0 se llama vector normal principal en el punto P al vector: n = .
æx ∏∏ (s 0 )æ
Proposición.- El vector (a'(t0) × a"(t0)) × a'(t0) tiene la misma dirección y sentido que n.
n
ec
P
or
Plano osculador
t
Definición.- Se llama triedro de Frenet o triedro móvil a C en P a: {t, n, b}.
C
[x ∏ (s 0 ), x ∏∏ (s 0 ), x ∏∏∏ (s 0 )]
Teorema.- La torsión en el punto P viene dada por: !(s 0 ) = .
%(s 0 ) 2
[ ∏ (t 0 ), ∏∏ (t 0 ), ∏∏∏ (t 0 )]
Teorema.- Si C viene dada por a(t) la torsión en P vale: !(t 0 ) = .
æ ∏ (t 0 ) % ∏∏ (t 0 )æ 2
Teorema.- Si C es una curva de clase tres sin puntos de inflexión, entonces C es plana si y sólo si su
torsión es idénticamente nula.
t ∏ (s ) 0 %(s ) 0 t(s )
Definición.- Se llaman fórmulas de Frenet a: n ∏ (s ) = −%(s ) 0 !(s ) n(s ) .
b ∏ (s ) 0 −!(s ) 0 b(s )
Ejemplo tipo
Ejercicio.- Dada la curva C = a(I), con a(t) = (1, t2, t3) e I = (0, ∞), calcular todo en P(1, 1, 1).
Solución: a'(t) = (0, 2t, 3t2) ⇒ a'(1) = (0, 2, 3), a''(t) = (0, 2, 6t) ⇒ a''(1) = (0, 2, 6), a'''(t) = (0, 0, 6).
t t 3
Parametrización natural: s(t ) = ¶ 0 æ ∏ (u )ædu = ¶ 0 0 2 + (2u ) + (3u 2 ) du = 1 (9t 2 + 4 ) 2 − 8 ⇒
2 2
27
3
2
(27s + 8 ) − 4 (27s + 8 ) − 4
2 2
(27s + 8 ) − 4
2 3
3 3
et= e x(s) = 1, , ;
3 9 27
por tanto, haremos todos los cálculos con a(t), ya que x(s) tiene derivadas más largas.
3 3
La longitud del arco entre los puntos t0 = 1 y t0 = 2 es: s(2) - s(1) = 1 (9 $ 2 2 + 4 ) 2 − (9 $ 1 2 + 4 ) 2 .
27
Rectas y planos en P:
n
ec
P
or
Plano osculador
æ ∏ (1 ) % ∏∏ (1 )æ æ(6, 0, 0 )æ 6 6 .
Curvatura en (1, 1, 1): %(1 ) = 3 = = =
æ ∏ (1 )æ æ(0, 2, 3 )æ 3 ( 13 ) 3 13 13
13 13
Radio de curvatura en (1, 1, 1): R = 1% = .
6
13 13 1 (0, −3, 2 ) = 1, − 11 , 16 .
Centro de curvatura en (1, 1, 1): (1, 1, 1 ) +
6 13 2 3
0 2 3
0 2 6
[ ∏ (1 ), ∏∏ (1 ), ∏∏∏ (1 )]0 0 6
Torsión en (1, 1, 1): !(1 ) = = = 0 = 0.
æ ∏ (1 ) % ∏∏ (1 )æ 2 æ(6, 0, 0 )æ 2 36
EL CONCEPTO DE SUPERFICIE
Definición.- Sea Ω Õ R2, se dice que Ω es una región elemental de R2, si es un subconjunto abierto y
acotado limitado por una curva simple cerrada.
Definición.- Se llama superficie elemental de R3 a la imagen S de una región elemental Ω por medio
de un homeomorfismo r (S = r(Ω)). Al par (Ω, r = (r1, r2, r2)) se le llama carta o representación
paramétrica de S y a x = r1(u, v), y = r2(u, v) y z = r3(u, v) ecuaciones paramétricas de S. Si Ω está
contenida en uno de los planos coordenados, (Ω, r) se llama carta de Monge o representación explícita
de S.
Definición.- Se llaman líneas coordenadas de S, a las curvas: x = r(u, v0), x = r(u0, v). Si P = r(u0, v0),
a (u0, v0) se le llaman coordenadas curvilíneas de P.
Definición.- Si una superficie simple S es un conjunto cerrado (S' Õ S), entonces se denomina
superficie simple completa. Si además S es acotada, se denomina superficie simple compacta. Estas
últimas superficies también se llaman cerradas (en sentido geométrico).
Definición.- Una superficie general es la imagen de una superficie simple por medio de un
homeomorfismo local.
Definición.- Un punto P de una superficie S es un punto simple si ∃ BP, tal que S…BP es una superficie
elemental, en caso contrario se dice que P es un punto múltiple (P es doble si S…BP son dos superficies
elementales, P es triple si S…BP son tres superficies elementales etc...)..
Sea P = r(u0, v0) = (x0, y0, z0) un punto regular de una superficie regular S.
N(u 0 , v 0 )
Notación.- N(u 0 , v 0 ) = r u (u 0 , v 0 ) % r v (u 0 , v 0 ); n(u 0 , v 0 ) = .
æN(u 0 , v 0 )æ
Observación.- Una curva C contenida en S es la imagen por medio de r de una curva g contenida en
W, de ecuaciones u = α1(t) y v = α2(t). Por tanto, w = a1'ru+ a2'rv.
Definición.- Se llama plano tangente a S en el punto P al plano: [ru, rv, PX] = 0 (donde X = (x, y, z)).
1ª Forma fundamental
Sea el arco de curva de clase uno ([a, b], a) en la región Ω, de ecuaciones u = α1(t) y v = α2(t). Su
imagen por medio de r es un arco de curva ([a, b], r±a), contenido en S. Su longitud viene dada por:
b
L = ¶a Ir((t)) ( ∏ (t )) dt
Cálculo del ángulo que forman en un punto P dos curvas a y b contenidas en la superficie. Sean
dos vectores tangentes en P a las curvas a y b respectivamente. Si q es el ángulo que forman, se tiene:
h$k Eh 1 k 1 + F(h 1 k 2 + h 2 k 1 ) + Gh 2 k 2
cos( ) = =
æh æ $ æk æ Eh 21 + 2Fh 1 h 2 + Gh 22 Ek 21 + 2Fk 1 k 12 + Gk 22
En particular, si h y k son los vectores tangentes a las curvas r = r(u, v0) y r = r(u0, v) en el punto, el
ángulo que forman viene dado por:
ru $ rv F
cos( ) = =
ær u æ $ ær v æ EG
ENM Matemáticas II Curvas y Superficies 9
2ª Forma fundamental
Teorema.- IIP es invariante respecto a cualquier otra representación regular que conserve la orientación
del espacio.
Sea C una curva contenida en una superficie S. Supongamos que K es el vector curvatura a C en P y n
es el vector normal unitario a S en P.
Definición.- Se llama vector curvatura normal de C en P, y se representa por Kn, al vector proyección
de K sobre la recta normal a S en P.
Kn = (Kÿn)n
II P (u ∏ (t), v ∏ (t ))
Proposición.- Si la curva C viene dada por a(t) = r(u(t), v(t)) con t œ I, entonces, % n = .
I P (u ∏ (t), v ∏ (t ))
Teorema (de Meusnier).- Todas las curvas sobre la superficie que tienen la misma recta tangente en un
punto, tienen la misma curvatura normal en él.
Definición.- Se llaman direcciones principales aquellas en las que la curvatura normal alcanza sus
valores extremos. A las curvaturas normales correspondientes se le denominan curvaturas principales.
A las curvaturas principales las representaremos por c1 y c2.
k 2 −hk h 2
E F G = 0.
L M N
ENM Matemáticas II Curvas y Superficies 10
k 2 −k 1
E F G =0
L M N
Esta ecuación determina dos valores k1 y k2, salvo en los puntos en los que E = F = G , llamados
L M N
puntos umbílicos. Análogo para k = 1.
Proposición.- En cada punto no umbílico de la superficie las dos direcciones principales (1, k1) y (1, k2)
((h1, 1) y (h2, 1)) son ortogonales.
II P (1, k 1 ) II (1, k 2 ) II (h , 1 ) II (h , 1 )
%1 = , %2 = P o, % 1 = P 1 , %2 = P 2 .
(
I P 1, k 1 ) (
IP 1, k 2 ) (
IP h 1 , 1 ) I p (h 2 , 1 )
% t = % 1 % 2 = LN − M2
2
EG − F
Si designamos por v el vector unitario en la dirección de Kg, tal que t, v y n formen una terna positiva,
resulta que
Kg = (Kÿv)v
Líneas de curvatura
Definición.- Una curva regular C sobre una superficie S se dice que es una línea de curvatura si la
recta tangente en cada uno de sus puntos coincide con una dirección principal.
Definición.- Dados dos puntos P y Q de una superficie S, se llama distancia intrínseca entre P y Q al
ínfimo de las longitudes de los arcos de curva contenidos en S que unen P y Q. Cuando existe tal arco se
denomina arco mínimo. Los arcos mínimos se caracterizan porque su curvatura geodésica es cero.
ENM Matemáticas II Curvas y Superficies 11
Definición.- Una curva sobre una superficie se llama línea geodésica si su curvatura geodésica en cada
punto es cero. Los arcos de línea geodésica son arcos mínimos.
Definición.- Una dirección en un punto se llama asintótica si la curvatura normal del punto es cero en
esa dirección.
Definición.- Una curva sobre una superficie se llama línea asintótica si su curvatura normal en cada
punto es cero.
Ejemplo tipo
Ejercicio.- Dada la superficie r(u, v) = (u, v, u2 + v2) , hallar todo en el punto P, de coordenadas
curvilíneas (1, 1).
N(u, v) = (1, 0, 2u) µ (0, 1, 2v) = (-2u, -2v, 1) fl N(1, 1) = (-2, -2, 1).
N(1, 1)
n(1, 1) = = (−0.667, −0.667, 0.333 ) .
æN(1, 1) æ
Clasificación de P:
k 2 −k 1
Si h = 1, fl E F G = 0, e k 1 = −1 y k 2 = 1
L M N
ENM Matemáticas II Curvas y Superficies 13
% t = % 1 % 2 = LN − M2 = 0.049
2
EG − F
y la curvatura media es:
% 1 + % 2 EN + GL − 2FM
%m = = = 0.371
2 2(EG − F 2 )
Curvatura geodésica:
∏ (1)
Por tanto, el vector tangente unitario t en el punto t0 = 1 es: t = = (0.236, 0.236, 0.943)
æ ∏ (1) æ
æ ∏ (1) % ∏∏ (1 æ)
%= = 0.074, fl K = cÿm = (-0.049, -0.049, 0.025)
æ ∏ (1) æ 3
cg = [K, n, t] = 0.
IP(t) = 2 + 16t2
2
L = ¶0 IP (t ) dt = 6.17
ENM Matemáticas II Integrales de campo 1
TEMA II
INTEGRALES CURVILÍNEAS
Integrales curvilíneas
De ahora en adelante G ⊂ Rn (en este curso n = 2 o 3) es un conjunto abierto y conexo por arcos
regulares a trozos, y C = x([a, b]) ⊂ G es un arco de curva.
Si existe el límite de esta suma cuando máx||(x(tk) - x(tk-1)|| → 0, tal límite se llama integral curvilínea
de f a lo largo de C y se denota por
¶C f⋅dx
Dicho límite existe, por ejemplo, si C es rectificable y f es continua en C. El valor de la integral
curvilínea depende en general del campo f, la curva C y los puntos de la curva x(a) y x(b).
Si en ¶ C f⋅dx hacemos el producto escalar f⋅dx, la integral curvilínea también puede venir escrita como:
¶ f 1 dx 1 + ... + f n dx n
Como calcular ¶ C f⋅dx: Si C = x([a, b]) es un arco regular a trozos entonces:
dx
b b a
¶C f $ dx = ¶ a f(x(t )) $x t )dt= ¶ a f 1 (x(t ))x ∏1 (t )dt + ... + ¶ b f n (x(t ))x ∏n (t )dt
∏(
siempre que existan cada una de las integrales del último miembro.
Propiedades
¶C (f + g ) $ dx = ¶C f $ dx + ¶C g $ dx.
2. Caminos equivalentes. Si x y x' describen la misma curva C y f es integrable respecto a C = x(I)
entonces f es integrable respecto a C = x'(J)
3. Unión de caminos. Sean las curvas: C = x([a, b]), C1 = x([a, c]) y C2 = x([c, b]) (c ∈ (a, b)). Siempre
que existan dos de las tres integrales siguientes, existe la tercera y se verifica:
¶C f $ dx = ¶C 1
f $ dx + ¶C 2 f $ dx.
ENM Matemáticas II Integrales de campo 2
Ejemplo.- Calcúlese
¶C (x 2
+ y)dx + xydy
desde el punto A al punto D, a lo largo del camino ABCD, compuesto por los segmentos AB, BC, CD,
donde A(0, 0), B(2, 2), C(2, 6) y D(3, 9).
Solución.- Las ecuaciones paramétricas de las diferentes partes del camino son:
AB: x = t, y = t; dy = dx = dt; t ∈ [0, 2]
BC: x = 2, y = t; dx = 0, dy = dt; t ∈ [2, 6]
CD: x = t, y = 3t; dx = dt, dy = 3dt; t ∈ [2, 3]
I = ¶ C [(x 2 + y )dx + xydy ] = I1 + I2 + I3
donde
2
I 1 = ¶AB (x 2 + y )dx + xydy = ¶ 0 [(t 2 + t )dt + t 2 dt ] = 22
3
6
I 2 = ¶BC (x 2 + y )dx + xydy = ¶ 2 2tdt = 32
I = I1 + I2 + I3 = 661
6
Físicamente, si una partícula se mueve a lo largo de una curva C = x([a, b]) regular a trozos, bajo la
acción de una fuerza f, el trabajo realizado por f es:
w = ¶ C f⋅dx
ENM Matemáticas II Integrales de campo 3
Definición. Sean G ⊂ Rn, C = x([a, b]) ⊂ G una curva regular, y g: G → R una función acotada en G (g
es un campo escalar). Se define la integral curvilínea de g con respecto a la longitud de arco a lo largo de
la curva C como:
ds
b
¶C gds = ¶ a g(x(t )) æx ∏(
t )ædt (si existe)
donde:
æx ∏ (t )æ = [x ∏1 (t )] 2 + ... + [x ∏n (t )] 2
Físicamente, ¶ C gds puede representar la masa de un alambre C de densidad variable g(x, y, z).
Ejemplo.- Calcular
¶C (x 1
4
+ x24)ds
donde C es la circunferencia x12 + x22 = a2.
Solución.- La curva viene dada por: x1 = a⋅cost, x2 = a⋅sent, y t ∈ [0, 2π]. En este caso
æx ∏ (t )æ = [x ∏1 (t )] 2 + [x ∏2 (t )] 2 = a 2 (sen 2 t + cos 2 t ) = a
Por tanto,
Teoremas
Teorema (Segundo teorema fundamental del cálculo para integrales de línea).- Sea F: G → R una
función (campo escalar) de clase uno en G. ∀ p1, p2 ∈ G y para toda curva regular a trozos C = x([a, b])
⊂ G que una p1 con p2, se tiene:
¶C →
= F $ dx = F(p 2 ) − F(p 1 )
Teorema (Primer teorema fundamental del cálculo para integrales de línea).- Si f: G → Rn es una
función (campo vectorial) continua en G y su integral curvilínea es independiente del camino en G,
→
entonces existe una función escalar F: G → R tal que = F(x) = f(x) ∀ x ∈ G. F(x) = ¶ C f $ dx en donde C
es una curva regular a trozos contenida en G que une los puntos a (fijo) y x ∈ G.
Nota. Este teorema también se verifica si G es abierto y simplemente conexo (en R2 no tiene agujeros).
x 1
F(x) = ¶ x 0 f $ dx = ¶ 0 f(x 0 + t(x − x 0 )) $ (x − x 0 )dt
Hay tres métodos de calcular una integral que satisface esta condición: 1º) hallar la función F y calcular
F(B) - F(A), 2º) buscar el camino de integración más fácil (generalmente por paralelas a los ejes de
coordenadas), e integrar a lo largo de él, o 3º) aplicar la definición de integral curvilínea.
Segundo método: elegimos el camino entre A y B formado por los segmentos AC y CB, dados por:
Sobre AC, x = t, y = 2; ⇒ dx = dt, dy = 0, t ∈ [1, 3]
Sobre CB, x = 3, y = t; ⇒ dx = 0, dy = dt, t ∈ [2, 4]
Entonces
Ejemplo.- Calcúlese
−y
¶C , x $ (dx, dy )
x2 + y2 x 2 + y 2
siendo C la circunferencia x2 + y2 = 1.
Solución.- Observa que:
−x 2 − y 2 + y2y y2 − x 2
D2f1 = = = D1f2
(x 2 + y 2 ) 2 (x 2 + y 2 ) 2
sin embargo,
−y
, 2 x 2 (dx, dy ) = ¶ 0 −sent (−sent ) + cos t cos t dt = 2 ! 0
2
¶C x2 +y x +y
2 1 1
¿Cuál es la explicación?
ENM Matemáticas II Integrales de campo 6
Ejercicios propuestos
1. Si O, A, B son los puntos (0, 0), (a, 0), (a, 2a), respectivamente, calcúlese la integral curvilínea
¶OB (3xy 2
+ y3, x3 + 3xy2)(dx, dy)
cuando el camino de integración es:
a) el segmento OB,
b) el segmento OA y después AB,
c) el arco de parábola y2 = 4ax comprendido entre O y B.
2. Calcúlese
¶C (-y , x )(dx, dy)
2 2
3. Calcúlese
y
¶C , x (dx, dy )
x2 + y2 x 2 + y 2
siendo C la parte del eje "x" comprendida entre +∞ y el punto (a, 0), más el arco x2 + y2 = a2 sobre
el primero, segundo y tercer cuadrantes, desde (a, 0) hasta (0, -a), más la parte del eje "y"
comprendida entre (0, -a) y +∞.
es independiente del camino de integración en G = {(x, y) ∈ R2 / x > 0 e y > 0}. Hállese su valor
entre los puntos (1, 1) y (2, 3).
y
+ sen 2 y, x 2 + arctgx + xsen2y (dx, dy ) = 2 1 +
(1,2 )
¶ (0,0 ) 2xy +
1 + x2 4
ENM Matemáticas II Integrales de campo 7
7. Hállese el valor de
¶C (y , xy, zx)(dx, dy, dz)
2
INTEGRALES MÚLTIPLES
Definición. Se llama rectángulo cerrado de Rn (n = 2 ο 3) a: R = [a1, b1] × [a2, b2] ×...× [an, bn]. Se
llama rectángulo abierto a R = (a1, b1) ×...× (an, bn). Al área o volumen de R lo representaremos por |R|.
Definición. Sea D ⊂ Rn (n = 2 ο 3), D tiene medida nula, si ∀ ε > 0 existen {R1, R2, ....} rectángulos
∞ ∞
(abiertos o cerrados) de Rn tales que: D _ 4 R i y R i < . Ejemplos: Son conjuntos de medida nula:
i=1 i=1
una curva simple en R2 o R3, Una superficie simple en R3 etc.
se dice que f es integrable en D y al valor de dicho límite se llama integral múltiple de la función f en el
conjunto D, y se denota por ¶ D f(x)d D o simplemente por ¶ D f. Cuando n = 2 o n = 3 escribimos:
Volumen de un cilindro. Sea z = f(x, y), una función continua y positiva en D ⊂ R2 recinto de
integración cerrado. Vamos a ver como se calcula el volumen de forma cilíndrica, de generatrices
paralelas a "OZ", cerrado en la parte inferior por D, y en la superior, por una superficie D' ((x, y, f(x, y))
(véase figura).
Descompongamos D en m recintos de integración Di,
Z
mediante líneas paralelas a los ejes coordenados. Entonces,
D'
el valor aproximado del elemento de volumen de la figura es
f(ci)|Di| (área de la base |Di| por altura f(ci)), donde ci ∈ Di.
Cuanto más pequeña sea el área |Di| mejor será la
O ∆yi Y aproximación de este volumen. Por tanto el volumen total
será:
∆x i
|D i | Di D m
X
V = lim f(c i ) D i
máx D i d0 i=1
Propiedades de la integral
1. Linealidad. Si f y g son integrables en D, también lo es αf + βg ∀ α, β ∈ R, y se verifica:
¶D (αf + βg) = α¶D f + β¶D g.
2. Propiedad aditiva del conjunto de integración. Si f es integrable en D y éste puede
descomponerse en dos recintos de integración D1 y D2 sin puntos interiores comunes, entonces f es
integrable en cada uno de ellos, y se verifica
¶D f = ¶D f + ¶D f.
1 2
Teorema (Fubini caso particular).- Sea D ⊂ R2 un recinto de integración cerrado y conexo tal que las
rectas paralela al eje "OY" que cortan a D determinan un único segmento de extremos (x, α(x)) y (x, β(x))
o un punto (véase fig.). Sean "a" y "b" (a < b) los valores extremos de "x" en D. Si f es continua en D,
entonces se verifica que:
(x)
Y ¶¶ D f(x, y)dxdy = ¶ ab ¶ (x) f(x, y)dy dx
(x)
¶¶ D f(x, y)dxdy = ¶ cd ¶ (x) f(x, y)dx dy
Podemos integrar en cualquier orden; el valor de la integral es independiente del orden de integración,
pero los límites de integración han de depender de éste.
El proceso seguido para calcular una integral doble consta de los siguientes pasos:
a) Una idea gráfica del conjunto D.
b) Decidir el orden de integración.
c) Determinación de los límites.
d) Integración.
ENM Matemáticas II Integrales de campo 10
Ejercicio. Calcúlese
¶¶ D 2xydxdy
sobre el conjunto D limitado por y2 = x, x2 = y, x = 1 , para el cual x ≤ 1 .
2 2
Solución.
Las parábolas y2 = x, x2 = y se cortan en (0, 0) y en el punto C(1, 1). El recinto de integración es OBA,
donde B es el punto ( 12 , 14 ), y A es el punto 12 , 12 . Comencemos a integrar, primero con respecto a "y".
Tenemos que determinar los límites para "y" como funciones de "x". El campo de variación de "x" es de 0
a 12 . Si mantenemos "x" constante en este campo, por ejemplo, en E, entonces "y" varía de F a G; esto es,
desde y = x2 en F, hasta y = x G. De ahí,
1 1 1
¶¶ D 2xydxdy = ¶ 02 dx ¶ x x 2xydy = ¶ 02 x[y 2 ] x 2 dx = ¶ 02 x[x − x 4 ]dx = 5
x
Y
2
128
C(1,1)
A
0,7 Sabemos que se llega al mismo resultado integrando primero con respecto
G
a "x". Esto implicaría mantener "y" constante para hallar los límites de "x" en
H función de "y", haciendo variar a "y" de 0 a 1 .
B(1/2,1/4) 2
F 1
1 1
y 2
0 E 1/2 1
X
¶¶ D 2xydxdy = ¶ 0
4
dy ¶ y2 2xydx + ¶ 1 dy ¶ y22 2xydx
4
El alumno observará en la figura que no son válidos los mismos límites de "x" en todo el campo de
variación de "y". Tenemos que descomponer el campo de "y" desde 0 a 1 y desde 1 a 1 .
4 4 2
ENM Matemáticas II Integrales de campo 11
Z
Sea D ⊂ R3 un recinto de integración cerrado y conexo tal que
D las rectas paralelas al eje "OZ" que cortan a D determinan un único
·µ (x, y) segmento de extremos (x, y, δ(x, y)), (x, y, µ(x, y)) o un punto.
Supongamos que cualquier paralela al eje OY que corta a la
·δ(x, y)
proyección de D sobre el plano XY determina un segmento de
0 extremos (x, α(x), 0) y (x, β(x),0 ) o un punto (véase fig.). Sean "a"
a Y y "b" (a < b) los valores extremos de "x" en D. Si f es continua en
α (x)
x · (x, y) ·β (x) D, entonces se verifica:
b
( ) ( )
X ¶¶¶ D f(x, y, z)dxdydz = ¶ ab(¶ (xx) (¶ (x,yx,y) f(x, y, z)dz)dy)dx
El proceso seguido para calcular una integral triple consta de los siguientes pasos:
a) Una idea gráfica del conjunto D.
b) Decidir el orden de integración.
c) Determinación de los límites.
d) Integración.
Ejemplo.- Calcúlese la integral ¶¶¶ D (x + y + z + 1)-3dxdydz, tomada sobre el volumen D encerrado por
los planos x = 0, y = 0, z = 0, x + y + z = 1.
(x + y + z + 1)-3dz = 1 L2 − 5 .
1 1−x 1−x−y
¶¶¶ D (x + y + z + 1) -3
dxdydz = ¶ 0 dx¶ 0 dy¶ 0
2 8
ENM Matemáticas II Integrales de campo 12
Ejemplo.- Calcúlese
¶¶ D L(x 2
+ y2)dxdy,
siendo D el conjunto limitado por x2 + y2 = a2, x2 + y2 = b2, cuando a > b, x ≥ 0 e y ≥ 0.
Solución.- Hacemos el cambio: T(ρ, θ) = (ρcosθ, ρsenθ) (cambio a coordenadas polares),
cos −sen
JT = =
Y sen cos
a
D El conjunto D', viene dado por: ρ = a, ρ = b y θ ∈ [0, 2 ]. Por tanto,
b
a
Q I = ¶¶ D L(x2 + y2)dxdy = ¶¶ D ∏ L(ρ2)ρdρdθ = ¶ 02 dθ¶ b 2ρLρdρ.
P
Integrando en el segundo miembro con respecto a ρ por partes, hallamos
θ
0 b a X I = ¶ 02 [ρ2Lρ - 1 ρ2] ab dθ = 1 π[a2La - b2Lb - 1 (a² - b²)]
2 2 2
ENM Matemáticas II Integrales de campo 13
Teorema (de Green). Sea G ⊂ R2 un conjunto abierto y f = (f1, f2): G → R2 tal que f ∈ C1(G). Sea C ⊂
G una curva simple cerrada regular a trozos, tal que la unión de C con su interior esté contenido en el
conjunto G. Sea D dicha unión. Entonces se verifica que
¶¶ D ydxdy = 0
y el resto de la integral da:
2a a 2 −(x−a ) 2 2a
¶¶ D 6xdxdy = ¶ 0 6x ¶ − a 2 −(x−a ) 2
dy = 12 ¶ 0 x a 2 − (x − a ) 2 dx =
Ejercicios propuestos
2. Calcúlese la integral
¶¶ D x ydxdy,
2
3. Calcúlese
¶¶ D cos[π(x + y)]dxdy,
donde D es el recinto de integración limitado por los ejes y la línea x + y = 1. Hállese también la
integral cuando D es el recinto de integración limitado por los ejes y las líneas x + y = 1, x + y = 2.
4. Calcúlese
¶¶ D x ydxdy,
2
9. Calcúlese directamente
¶C [(x 3
+ y2)dx + (x2 + y3)dy],
donde C es la frontera del pentágono de vértices (0, 0), (1, 0), (2, 1), (1, 2), (0, 1). Compruébese el
resultado mediante el teorema de Green.
ENM Matemáticas II Integrales de campo 15
12. Calcúlese
¶¶¶ D xy dxdydz
2
13. Calcular
¶¶¶ D (2x + 3y + 4z) dxdydz,
2
2 y2 2
donde el recinto de integración D es el elipsoide x 2 + 2 + z 2 = 1.
a b c
14. Un orificio cilíndrico de diámetro "a" se perfora en una esfera sólida de radio "a", de manera que el
centro de la esfera quede sobre la superficie del cilindro. Hállese el volumen del material quitado
de la esfera.
2 y2
15. Demuéstrese que el volumen encerrado entre el paraboloide 2z = xp + q , el cilindro x2 + y2 = a2 y
a 4 (p + q )
el plano z = 0 es .
8pq
16. Un agujero cilíndrico de radio "b" se perfora simétricamente a través de una esfera de radio "a", de
manera el eje del cilindro pase por el centro de la esfera. Hállese el volumen del material sacado de
la esfera.
17. Los ejes de tres cilindros de revolución, todos de radio "a", se cortan en ángulos rectos.
Demuéstrese que el conjunto interior a los tres cilindros tiene un volumen 8a3(2 - 2 ).
ENM Matemáticas II Integrales de campo 16
INTEGRALES DE SUPERFICIE
A = ¶¶
||D 1 r % D 2 r||dudv = ¶¶
EG − F 2 dudv
Si la superficie esta dada en forma explícita por z = f(x, y) con (x, y) ∈ Ω, siendo f ∈ C1(Ω). Podemos
pensar en esta forma, como un caso particular de la forma paramétrica, dada por r(x, y) = (x, y, f(x, y)).
Aplicando los resultados anteriores tenemos:
A = ¶¶
1 + (D 1 f ) 2 + (D 2 f ) 2 dxdy
Si la superficie S esta dada implícitamente por F(x, y, z) = 0 y es posible definir z como función de x e
y (es decir z = f(x, y) con (x, y) ∈ Ω), entonces, por el teorema de la función implícita, en los puntos
D F D F
donde D3F ≠ 0, D 1 f = − 1 y D 2 f = − 2 , y sustituyendo en la expresión anterior, tenemos:
D3F D3F
(D 1 F ) 2 + (D 2 F ) 2 + (D 3 F ) 2
A = ¶¶
dxdy
D3F
Solución.- La esfera en el octante positivo está dada por z = a 2 − x 2 − y 2 , donde (x, y) ∈ Ω limitado
por el círculo x2 + y2 = a2, x ≥ 0 e y ≥ 0. Como z = a 2 − x 2 − y 2 , al derivar parcialmente tendremos
x y
Z D1z = − , D2z = − ,y
a 2 − x 2 − y2 a 2 − x 2 − y2
1 + (D 1 z ) + (D 2 z ) =
2 2 a2 = a
0 a2 − x 2 − y2 a2 − x 2 − y2
Ω Y
por tanto: A = ¶¶
a dxdy = a ¶¶
1 dxdy
x² + y² = a² z = 0 a 2 − x 2 − y2 a 2 − x 2 − y2
X
Para calcular esta integral, pasamos a coordenadas polares. Entonces
2
d = a .
a
¶¶
dd = a ¶ 02 d ¶ 0
a2 − 2 a2 − 2 2
∏
ENM Matemáticas II Integrales de campo 17
Integral de superficie
Sea una superficie elemental S = r(Ω) tal que r ∈ C1(Ω). En los puntos regulares (D1r × D2r ∫ 0)
podemos definir dos vectores unitarios y normales a la superficie S:
D1r % D2r
n1 = y n2 = -n1.
æD 1 r % D 2 r æ
Definición.- Sean f = (f1, f2, f3): S → R3 y n uno de los vectores anteriores. Se llama integral de
superficie de f respecto a la cara de S determinada por n a la integral:
F dS
¶¶ S f $ n dS = ¶¶
f(r ) $ n æD 1 r % D 2 r ædudv = ! ¶¶
f(r ) $ (D 1 r % D 2 r )dudv
siempre que exista la integral doble del segundo miembro ("+" si se usa n1 y "-" si se usa n2).
Interpretación física: ¶¶ S f $ ndS es el flujo del campo vectorial f a través de la superficie S en la
dirección y sentido de n.
¶¶ S 1 1 1
x , y , z $ nds
2 y2 2
sobre el exterior de la superficie S: x 2 + 2 + z 2 = 1.
a b c
Solución.- Las ecuaciones del elipsoide son: r(u, v) = (a⋅senu⋅cosv, b⋅senu⋅senv, c⋅cosu)
¶¶
bc + ac + ab senududv = ¶ 2 dv ¶ bc + ac + ab senudu = 4 bc + ac + ab
a b c 0 0 a b c a b c
¶¶ S (x 2 + y2 − 3z 2 )dS = ¶¶
((2senu $ cos v ) 2 + (2senu $ senv ) 2 − 3(2 cos u ) 2 )æD 1 r % D 2 r ædudv =
Operadores vectoriales
→
Sea f = (f1, f2, f3) un campo vectorial, F un campo escalar y sea el operador (nabla) = = (D1, D2, D3).
→
Se llama gradiente de F al campo vectorial: gradF = (D1F, D2F, D3F) = = F.
→
Se llama divergencia de f al campo escalar: divf = D1f1 + D2f2 + D3f3 = = ⋅f.
→
Se llama rotacional de f al campo vectorial: rotf = (D2f3 - D3f2, D3f1 - D1f3, D1f2 - D2f1) = = ×f.
ENM Matemáticas II Integrales de campo 18
El teorema de Gauss
Teorema (de Gauss). Sea S una superficie simple cerrada regular y D el volumen encerrado por dicha
superficie. Sea G un abierto que contiene a S y D, y f = (f1, f2, f3) ∈ C1(G), entonces
¶¶¶ D divfdxdydz = ¶¶ S f $ ndS
donde n es el vector normal saliente.
El teorema de Gauss es de gran importancia práctica, ya que nos permite sustituir integrales de
superficie por integrales triples, lo cual introduce a veces una simplificación considerable.
Ejemplo.- Calcúlese
¶¶ S (x , y , z )⋅⋅ndS,
3 3 3
El teorema de Stokes
Teorema (de Stokes). Sea Ω ⊂ R2 una región plana limitada por una curva simple cerrada regular a
trozos γ = a(I), y sea S = r(Ω) una superficie regular de clase q ¥ 2 cuyo borde es C = r(a(I)) = x(I). Sea
G un abierto que contiene a S y C y f = (f1, f2, f3) ∈ C1(G), entonces
¶C f⋅dx = ¶¶ S (rotf⋅n)dS
en donde n determina la orientación de S, y en C se considera el sentido inducido por dicha orientación
(Si el avance del sacacorchos coincide con n, entonces el sentido de giro determina el sentido de C).
Ejercicios propuestos
2. Una esfera de radio "a" se corta por un cilindro circular de diámetro "a", estando el centro de la
esfera sobre una generatriz del cilindro. Demuéstrese que el área de la parte de esfera cortada por el
cilindro es 2(π - 2)a2.
3. Una superficie cerrada está engendrada por la rotación de la cardioide ρ = a(1 + cosφ) alrededor de
la línea inicial φ = 0. Tomando el eje "z" como línea inicial y el origen como polo, demuéstrese que
2
la superficie total es 32a .
5
5. Calcúlese
¶¶ S (zx, yz, z )⋅ndS
2
7. Calcúlese
¶¶ S (x 4
+ y4 + z4)dS,
donde S es la superficie de la esfera x2 + y2 + z2 = a2.
ENM Matemáticas II Integrales de campo 20
8. Calcúlese
¶¶ S 1 dS,
p
x 2 y2 z 2
siendo S la superficie del elipsoide de ecuación 2 + 2 + 2 = 1y p es la distancia desde el origen
a b c
al plano tangente al elipsoide en el punto donde está situado dS.
2 y2 2
siendo S la superficie del elipsoide x 2 + 2 + z 2 = 1.
a b c
13. Un orificio cuadrado de lado 2 2 pulg. se perfora simétricamente en una esfera de radio 2.
Demuéstrese que el área de la superficie que se ha quitado es 16π( 2 - 1) pulg².
TEMA 3
FUNCIONES DE VARIABLE COMPLEJA
Definición.- Un número complejo z es un par ordenado de números reales z = (a, b). El primero "a", se
llama parte real de z (a = Re(z)) y el segundo, "b", se llama parte imaginaria de z (b = Im(z)). Al
conjunto de los números complejos lo representamos por Â. (El par (a, b) también se llama afijo de z).
Dos complejos z = (a, b) y z' = (c, d) son iguales si, y sólo si, a = c y b = d.
Operaciones.- z + z' = (a + c, b + d), z⋅z' = (ac - bd, ad + bc). (Â, +, ⋅) es un cuerpo conmutativo.
Representación.- El número complejo z = (a, b) se representa como el vector de coordenadas (a, b).
Definición.- El número complejo (0, 1) se representa por "i" y se llama la unidad imaginaria.
Teorema.- i2 = -1.
Teorema.- Todo número complejo z = (a, b) se puede escribir de la forma (binómica) z = a + b⋅i.
Propiedades.-
a) |z| ≥ 0; |z| = 0 ⇔ z = 0. b z
b) |z⋅z'| = |z|⋅|z'|
θ
c) |z/z'| = |z|/|z'| si z' ≠ 0.
a
d) |z + z'| ≤ |z| + |z'|
Definición.- Dados z y z' ∈ Â, se llama distancia de z a z' al número: d(z, z') = |z - z'|.
Definición.- Se llama bola abierta de centro z0 ∈ Â y radio r a: B(z0, r) = {z ∈ Â / |z - z0| < r}.
Definición.- Sea z = (a, b) ≠ 0. Se llama argumento principal de z (arg(z) = θ) al único número real
θ ∈ [0, 2π) que verifica: a = |z|cosθ, b = |z|senθ.
ENM Matemáticas II Variable compleja 2
Definición.- Si en la forma binómica de un número complejo, sustituimos "a" por |z|cosθ y "b" por
|z|senθ, se obtiene la forma trigonométrica de z: z = |z|(cosθ + i ÿsenθ).
n z = zk = n
z + k2 .
ø n
Definición.- Sea z ≠ 0 un número complejo. Si w es un número complejo tal que ew = z, entonces w se
llama logaritmo de z. El valor particular de w dado por w = ln|z| + i⋅arg(z) se denomina logaritmo
principal de z, y se representa por w = ln(z).
Propiedades.- z w 1 +w 2 = z w 1 z w 2 , (z $ z ∏ ) w = z w $ z ∏w .
−iz −iz
Definición.- cos z = e + e , senz = e − e .
iz iz
2 2i
ENM Matemáticas II Variable compleja 3
Definición.- Una función compleja de variable real es una aplicación z: M ⊂ R → Â. A partir de z(t)
se definen las funciones parte real x(t) = Rez(t) y parte imaginaria y(t) = Imz(t) de M en R. Es decir:
Las definiciones de límites, continuidad y derivabilidad (z'(t) = x'(t) + i⋅y'(t)) para funciones complejas
de una variable real son análogas a las de las funciones reales de variable real.
La clase de funciones complejas de variable real más importantes son las curvas.
Ejemplo.- La ecuación de la circunferencia de centro 0 y radio 2: z(t) = 2cost + i⋅2sent, con t ∈ [0, 2π].
Observación: La función ez no es inyectiva, ex + iÿy = ex + iÿ(y + 2p). Para que sea inyectiva, debemos
limitarnos al conjunto: W = {(x, y) œ  / a < y < a + 2p}; fl f(W) =  - [{ex+iÿa / x œ R} » {(0, 0)}].
2i 2
Las definiciones de límites y continuidad para funciones complejas de una variable compleja son
análogas a las de las funciones reales de variable real.
ENM Matemáticas II Variable compleja 4
Funciones holomorfas
f(z) − f(z 0 )
lim
zdz 0 z − z0
Al valor de este límite se le llama derivada de f en z0 y se representa por f '(z0). Se dice que f es
holomorfa en z0 si existe r > 0 tal que f es derivable en B(z0, r). f se dice que es holomorfa en A, si es
derivable en todos los puntos de A.
Son funciones holomorfas en A (abierto en el que está definida f): La función polinómica, la función
racional, la función exponencial, la función logarítmica, etc..
Por tanto, la diferenciabilidad de u(x, y) y v(x, y) en (x0, y0) no basta para que f sea derivable en z0,
además es necesario que se cumplan las ecuaciones de Cauchy - Riemann.
Øu(0, 0) Øv(0, 0)
=0! =1
Øx Øy
y por tanto no se verifican las condiciones de Cauchy-Riemann.
Teorema.- f es derivable en z0 = (x0, y0) ∈ A ⊂ Â ⇔ u(x, y) y v(x, y) son diferenciables y verifican las
condiciones de Cauchy - Riemann en (x0, y0) ∈ A ⊂ R2.
Nota.- Una condición suficiente para que las funciones u, v: A ⊂ R2 → R sean diferenciables en A
(abierto), es que u, v ∈ C1(A).
Integración compleja
La integral definida en el campo complejo es una integral de línea. Por lo tanto, interviene un camino
de integración o arco de curva γ y una función compleja f definida en un subconjunto A de  que
contenga a γ. Supondremos los caminos de integración z(t) = x(t) + i⋅y(t) t ∈ [a, b] regulares a trozos. Se
define la integral de f respecto de γ por:
dz
b
¶ f(z)dz = ¶ a f(z(t)) z (t)dt
∏
siempre que dicha integral exista, para lo cual es suficiente con que f(z(t)) sea continua en [a, b] salvo a lo
más en un conjunto de medida nula (Teorema de Lebesgue).
Ejemplo.- Calcular ¶ 1z dz siendo la curva γ dada por z(t) = 1 + t⋅i, con t œ [0, 2].
dz
Teorema.- Sea A un abierto conexo por arcos regulares a trozos de  y f: A →  continua. Entonces:
[Existe un primitiva F de f en A] ‹ [La integral de f respecto a cualquier camino γ que una dos puntos
de A es independiente de γ] ‹ [La integral de f a lo largo de cualquier camino cerrado es nula]
Si f es holomorfa en un conjunto abierto y estrellado, estas tres condiciones no sólo son equivalentes
sino que se satisfacen siempre.
ENM Matemáticas II Variable compleja 6
Teorema de Cauchy
¶ f(z )dz = 0
En dicha región (la limitada por γ) la integral entre dos puntos z1 y z2 es independiente del camino que
los une. Tales integrales se pueden calcular por la diferencia F(z2) - F(z1) siendo F'(z) = f(z) en la región.
¶ 1
f(z )dz = ¶ 2 f(z )dz A
Ejemplo (importante).- Calcular ¶ 1 dz siendo γ una curva simple cerrada que encierra una
(z − z 0 ) n
región en cuyo interior esta z0.
Solución.- Como z0 está en el interior de la región, ∃ B(z0, r) contenida en la región; sea Γ la curva que
limita a B(z0, r), entonces por el teorema anterior: ¶ 1 dz = ¶ 1 dz.
(z − z 0 ) n (z − z 0 ) n
1 2 i $ r $ e i i 0 si n ! 1
¶ (z − z 0 ) n dz = ¶ 0
r n $ e in
d = n−1
r
¶ 02 e i(1−n) d = 2i si n = 1
Sea A un abierto de  y f: A →  holomorfa en A. Sea γ una curva simple cerrada tal que tanto γ como
la región encerrada por γ están contenidas en A. Entonces si z0 es un punto interior a dicha región, se
verifica que:
f(z )
f (n (z 0 ) = n! ¶ dz " n = 0, 1, 2,....
2i (z − z 0 ) n+1
donde γ se recorre en sentido positivo.
Así, si una función de variable compleja tiene primera derivada, tiene todas las derivadas de orden
superior también, cosa que no es cierta para funciones de variable real.
ENM Matemáticas II Variable compleja 7
Series
Teorema (Serie de Taylor).- Sea f holomorfa en un conjunto abierto A ⊂ Â y sea z0 ∈ A. Entonces, ∀
B(z0, r) ⊂ A, se verifica que:
∞ (n (
f z0 ) (
f(z ) = z − z 0 ) , ∀ z ∈ B(z0, r)
n
n=0 n!
g(z )
Caracterización de los polos.- f posee un polo de orden n en z0 si: f(z) = , con g(z0) ≠ 0, g
(z − z 0 ) n
holomorfa en B(z0, r), y n ∈ N. Si n = 1, 2,... etc. el polo se dice simple, doble,.... etc.
a −n a −(n−1) a −1
f(z ) = n + + ... + + a 0 + a 1 (z − z 0 ) + a 2 (z − z 0 ) + ...
2
(z − z 0 ) (z − z 0 ) n−1
(z − z 0 ) 1
g (k (z 0 )
Los coeficientes de esta serie se obtienen con la fórmula: a −n+k = .
k!
Esta serie se llama serie de Laurent para f. La parte a0 + a1(z - z0) + a2(z - z0)2 + ... se llama parte
analítica o regular, en tanto que el resto, que consiste en los inversos de las potencias de z - z0 se llama
parte principal o singular.
Residuos
a −1 = zdz
lim0 1 d n−1 [(z − z ) n f(z )]
(n − 1 )! dz n−1 0
Ejemplos
1º.- Sea f(x, y) = xy + (y - x)i. Estudiar si f es derivable y holomorfa en (1, 1) y (2, 2).
Øu(2, 2) Øv(2, 2)
=2!1= ,
Øx Øy
f no es derivable en (2, 2).
2º.- Sea f(z) = z3. Estudiar si f es derivable y holomorfa en Â.
Øu = 3x 2 − 3y 2 , Øu = −6xy, Øv = 6xy, Øv = 3x 2 − 3y 2 ,
Øx Øy Øx Øy
las derivadas parciales de u y v existen y son continuas en R2, entonces, u y v son diferenciables en R2 y
como siempre se verifican las condiciones de Cauchy-Riemann, la función f es holomorfa en todo Â.
2 2
Solución.- a1) Aplicando la definición: ¶ 1z dz = ¶ 0 1 (−sent + i $ cos t)dt = ¶ 0 idt = 2i.
cos t + i $ sent
f(z )
a3) Aplicando la fórmula integral de Cauchy: f(z) = 1; f(0 ) = 1 ¶ dz = 1 e ¶ 1z dz = 2i.
2i z−0
2 2 −4sent + i(cos t + 1)
b1) ¶ 1z dz = ¶ 0 1 (−sent + i $ cos t)dt = ¶ 0 dt = 0.
4 + cos t + i $ sent 17 + 8 cos t
z
4º.- Hallar la serie de Laurent de la función f(z) = ez en torno a la singularidad.
TEMA IV
Definición. Se llama ecuación diferencial ordinaria de primer orden (abreviadamente edo) a toda
relación de la forma:
f(x, y, y') = 0
que ligue una variable independiente "x" con una función "y" de ella y la primera derivada.
Cuando la ecuación diferencial se presenta con la y' despejada, es decir y' = f(x, y) se dice que está en
forma normal.
Definición. Se llama solución general de la ecuación y' = f(x, y) en el dominio D (conjunto abierto y
conexo) a una función y = g(x, C), dependiendo de una constante arbitraria C, tal que:
A la función y = g(x, C0) verificando la edo y' = f (x, y) y la condición inicial (de pasar por (xo, yo)), la
llamaremos solución particular o integral particular de la edo y' = f(x, y).
Observaciones: Una ecuación diferencial puede no tener solución ((y')2 + x2 + 1 = 0 no posee solución
(una suma de cuadrados nunca es negativa)), no tener solución que satisfaga una condición inicial dada
((y')2 - xy' + y + 1 = 0 no tiene solución pasando por (0, 0), ya que esto exigiría que (y')2 = -1 cuando x = 0),
o puede tener más de una solución que satisfaga una condición inicial dada (y' = 3y2/3 tiene dos soluciones
distintas pasando por (0, 0); y1 = 0 e y2 = x3).
También, incluso cuando existe solución, puede que no sea posible determinarla explícitamente.
Comúnmente se dice que la ecuación diferencial ha sido resuelta o integrada cuando se llega a una
fórmula implícita del tipo F(x, y, C) = 0 en la que no aparecen derivadas de la función incógnita.
Pero ¿que condiciones debe cumplir la edo y' = f(x, y) para que exista solución?, caso de existir, ¿es
única?. Las respuestas a las preguntas planteadas, nos las da el siguiente teorema.
Teorema. (Existencia y unicidad para la edo y' = f(x, y)). Si f(x, y) y D2f(x, y) son funciones continuas
en un dominio D (conjunto abierto y conexo) por cada punto (x0, y0) ∈ D ∃ δ > 0 y una única función g(x)
tales que:
g'(x) = f(x, g(x)), ∀ x ∈ [x0 - δ, x0 + δ] y g(x0) = y0.
ENM Matemáticas II Ecuaciones diferenciales 2
y = cex
La solución particular de y' = y que pasa por el punto (0, 2) (condición inicial), se obtiene sustituyendo
el punto en la solución general; obtenemos C = 2, y por tanto la solución particular es: y = 2ex.
y = (x + c)3
D2f(x, y) = 2y -1/3 no está definida en puntos de la forma (x0, 0). El teorema no es aplicable en cualquier
dominio que contenga puntos del eje OX. No hay unicidad en el cero: por ese punto pasan dos soluciones
y1 = 0 e y2 = x3. La solución y1 = 0 es una solución singular (no viene dada para ningún valor de C en la
solución general).
xy' + y = 0.
Ejercicios propuestos
Escribir la ecuación diferencial de cada una de las curvas definidas mediante las condiciones dadas.
1. En cada punto (x, y) la pendiente de la tangente es igual al cuadrado de la abscisa del punto.
2. El eje "y" divide en dos partes iguales al segmento que une P(x, y) con el punto de intersección de
la normal en P, con el eje de las "x".
3. El área limitada por el arco de curva, el eje "x" y dos ordenadas, una fija y otra variable, es igual al
doble de la longitud del arco entre las ordenadas.
Definición. Dada la edo y' = f(x, y) diremos que es una edo en variables separadas, si dicha ecuación
se puede poner de la forma:
Q(y)dy = P(x)dx
Resolución. El coeficiente de "dx" es sólo función de "x", el de "dy" es sólo función de "y". La
solución general viene dada por:
¶ Q(y)dy = ¶ P(x)dx + C
Ejemplo. Resolver la ecuación diferencial
x3dx + (y + 1)²dy = 0.
Solución. Las variables están separadas. Integrando, pues, término a término, tenemos
y−3 4
y dy = x dx
por tanto, integrando se tiene
y - 3Ly = 4Lx + C
Definición. Una función f(x, y) es homogénea de grado k si f(tx, ty) = tkf(x, y) ∀ (x, y) ∈ Domf.
Definición. Una edo P(x, y)dx + Q(x, y)dy = 0 se llama homogénea (de grado k) si P(x, y) y Q(x, y)
son funciones homogéneas de grado k, o también aquéllas en las que y' = una función homogénea de
grado cero de "x" e "y" (y' = f(y/x)).
Resolución. Para resolver una edo homogénea, se efectúa el cambio y = u⋅x, que transforma la edo
homogénea en una edo en variables separables. Una vez integrada, deshacemos el cambio.
Solución. Esta ecuación diferencial es homogénea (de grado 3). Mediante el cambio
dx = 3u 2 du,
x 1 − 2u 3
por tanto, integrando obtenemos
Lx = K - 1 L(1 - 2u3),
2
y deshaciendo el cambio tenemos
2y 3
x2 1 − = C o bien x3 - 2y3 = Cx.
x3
dy ax + by + c
=f
dx dx + ey + g
Resolución.
ax + by + c = 0 y dx + ey + g = 0
se cortan en el punto (α, β), este caso se reduce al anterior efectuando el cambio x = X + α, y = Y + β.
Pues entonces la edo se transforma en la edo homogénea
dY = f aX + bY
dX dX + eY
dY = d + ef rY + c
dx Y+g
que es una ecuación diferencial en variables separables, integrando y deshaciendo el cambio, obtenemos
x + 3y + 2L(2 - x - y) = C
ENM Matemáticas II Ecuaciones diferenciales 5
2x - 5y + 3 = 0
2x + 4y - 6 = 0
que es una edo homogénea de grado 1. Empleando la transformación Y = u⋅X (dY = u⋅dX + X⋅du), se
obtiene
(2 - 7u - 4u²)dX - X(2 + 4u)du =0
y, finalmente,
dX = 2 + 4u du
X 2 − 7u − 4u 2
que integrando y deshaciendo los cambios da:
Ejercicios propuestos
1. 4ydx + xdy = 0.
2. (1 + 2y)dx + (4 - x²)dy = 0.
3. y²dx - x²dy = 0.
y y y
4. (xsen x - ycos x )dx + xcos x dy = 0.
5. (x² + y²)dx - x x 2 + y 2 dy = 0.
Definición. Una edo P(x, y)dx + Q(x, y)dy = 0, es exacta si existe U(x, y) tal que dU = Pdx + Qdy.
Si P y Q son de clase uno en un conjunto abierto y estrellado de R2, existe U si, y sólo si, D2P = D1Q.
Resolución. La solución es U(x, y) = C. Como dU = Pdx + Qdy ⇒ D1U = P ⇒ U = ÛP(x, y)dx + h(y).
Como D2U = Q entonces:
h'(y) = Q(x, y) - D2ÛP(x, y)dx
Solución. En este ejemplo P y Q son de clase uno en R2 que es un conjunto abierto y estrellado. Como
D2P = D1Q = 3, entonces la ecuación diferencial es exacta, y, por tanto, la solución es U(x, y) = C.
4
Cálculo de U(x, y): D1U = 2x3 + 3y ⇒ U = x + 3xy + h(y),
2
y2
D2U = Q = 3x + y - 1 = 3x + h'(y) ⇒ h'(y) = y - 1 ⇒ h(y) = −y+c
2
Definición. Si la edo P(x, y)dx + Q(x, y)dy = 0 no es diferencial exacta. Se llama factor integrante de
dicha edo, a una función µ(x, y) tal que la ecuación que resulta de multiplicar por µ
µPdx + µQdy = 0,
es una edo exacta. Supuesta la existencia de µ(x, y), su cálculo se efectúa de la siguiente forma:
La integración de esta ecuación es más complicada que la integración directa de Pdx + Qdy = 0, pero
como no se trata aquí de hallar todos los factores integrantes sino que con uno nos basta, no es difícil, en
los casos corrientes, hallar condiciones simplificadoras. Por ejemplo, la ecuación
P(x, y)dx + Q(x, y)dy = 0
admite un factor integrante que sólo depende de "x" o sólo de "y" si:
D2P − D1Q
= #(x), entonces, (x) = e ¶ #(x)dx es un factor integrante de P(x, y)dx + Q(x, y)dy = 0.
Q
D2P − D1Q
P = #(y ), entonces, (y) = e −¶ #(y)dy es un factor integrante de P(x, y)dx + Q(x, y)dy = 0.
ENM Matemáticas II Ecuaciones diferenciales 7
D2P − D1Q 1
= x
Q
4 x 2 y2 x 3
Resolviendo obtenemos: U(x, y) = x + + = C.
4 2 3
Ejercicios propuestos
5. (x + ycosx)dx + senxdy = 0.
6. (x x 2 + y 2 - y)dx + (y x 2 + y 2 - x)dy = 0.
8. (1 + y²)dx = (x + x²)dy.
e ¶ f(x )dx y = ¶ e ¶ f(x)dx g(x )dx + K w y = e −¶ f(x )dx ¶ e ¶ f(x)dx g(x )dx + K
Ejemplo. Resolver la ecuación diferencial: y' + 2xy = 4x.
Expresión muy cómoda de la solución general, y que puede escribirse por tanto, sin efectuar ninguna
integración cuando se conocen dos integrales particulares y1, y2.
1 .
Resolución. Dicha ecuación se transforma en una edo lineal mediante el cambio u = n−1
y
u' - 6xu = 3x
cuya solución viene dada por
2
por tanto
y −3 = − 1 + Ke 3x
2
2
ENM Matemáticas II Ecuaciones diferenciales 9
Aplicaciones
Ejemplo. (Desintegración radioactiva). Sabiendo que todas las sustancias tienen la propiedad común
de que la velocidad de descomposición en cada instante es proporcional a la cantidad de sustancia
existente en aquel instante. Calcular la cantidad de sustancia en función del tiempo.
Solución. y' = -ky donde k es una constante positiva (llamada constante de desintegración) cuyo valor
depende de cada elemento. y(t) = y(0)e-kt.
Solución. Por la segunda ley de Newton: mg - kv = ma, por tanto v ∏ + mk v = g. Resolviendo la ecuación
diferencial lineal, y teniendo en cuenta que v = 0 cuando t = 0, obtenemos:
mg mg
1 − e− m d
kt
v= k k si t d +∞
Ejemplo. (Disoluciones). Un depósito contiene 100 litros de una disolución salina cuya concentración
es 2,5 g de sal por litro. Una disolución conteniendo 2 g de sal por litro entra en el depósito a razón de 5
litros por minuto y la mezcla (que se hace uniforme por el movimiento) sale a la misma velocidad.
Encontrar la cantidad de sal que hay en cada instante en el depósito.
Solución. La variación del número de gramos de sal que hay en el depósito respecto del tiempo es
igual a la sal que entra menos la que sale: y' = 10 - 201 y ⇒ y' + 201 y = 10. Como en t = 0 y = 250;
y = 200 + 50e − 20
t
L di + R $ i = V(t)
dt
donde L es la inductancia de la bobina y R es el valor de la resistencia.
Solución. i(t ) = e − L t
R
¶ VL(t) e R
L t
dt + i(0 )
ENM Matemáticas II Ecuaciones diferenciales 10
Resolución. En general esta edo no se puede integrar; pero si se conoce una integral particular de ella
y1, la integración es posible. Basta, en efecto, hacer
∏
y = y 1 + 1u , y ∏ = y ∏1 − u2
u
y queda, teniendo en cuenta que y1 es solución de la ecuación de Riccati
y = y 1 + 1u
Ejercicios propuestos
1. y' + y = 2 + 2x.
2. y' - y = xy².
3. di - 6i = 10sen2t.
dt
6. yy' - xy² + x = 0.
8. En cada punto (x, y) de una curva el segmento que la tangente intercepta en el eje "y" es igual a
2xy². Hallar la curva.
9. Hallar la familia de curvas para las que la longitud de la parte de la tangente entre el punto de
contacto (x, y) y el eje "y" es igual al segmento interceptado en "y" por la tangente.
10. Hallar la ecuación de la curva para la que la normal en un punto cualquiera (x, y) pasa por el origen.
ENM Matemáticas II Ecuaciones diferenciales 11
y' = f1(x, y), y' = f2(x, y), ....., y' = fn(x, y).
Si es posible resolver estas ecuaciones, y' = fi(x, y), y designamos por φi(x, y, C) = 0 su solución, la
solución general está formada por el conjunto:
{φi(x, y, C) = 0 / i = 1, 2, ...., n}
y - C = 0, y - x - C = 0, 2y - x² - C = 0, y - Ce2x = 0.
{y - C = 0, y - x - C = 0, 2y - x² - C = 0, y - Ce2x = 0}
y = f(x, p)
φ(x, p, C) = 0,
esta ecuación, unida a y = f(x, p), define parametricamente la solución general buscada en función del
parámetro p.
φ(y, p, C) = 0,
que junto con x = f(y, p) define la solución general en función del parámetro p.
x = C2
p
y = 2C
p +C
2
ENM Matemáticas II Ecuaciones diferenciales 13
y = xf(y') + g(y')
Resolución. La ecuación diferencial de Lagrange es una ecuación resoluble en "y", por tanto, haciendo
y' = p, tenemos y = xf(p) + g(p), y derivando respecto de "x" da, supuestas f y g derivables
dx − f (p) x = g (p)
∏ ∏
dp
p = f(p) + [xf ∏ (p) + g ∏ (p) ] $ , o bien
dx dp p − f(p) p − f(p)
que es lineal tomando "p" como variable y "x" como función, y cuya solución es
f ∏ (p) f ∏ (p)
¶ ¶
¶ pg−(p)
∏ −
x = e p − f(p) p − f(p) dp + K
dp dp
e
f(p)
que da "x" en función del parámetro "p", pendiente de la curva integral. La ordenada "y" se obtendrá
análogamente en función de "p" sustituyendo simplemente la expresión obtenida en
y = xf(p) + g(p)
x = e ¶ −dp ¶ −2pe ¶ dp dp + C
por tanto la solución general en forma paramétrica es:
x = 2(1 - p) + Ce-p
y = 2 - p² + C(1 + p)e-p
1º) Para las ecuaciones de la forma y = xy' + g(y') llamadas de Clairaut, en que f(p) = p, que
resolveremos en el párrafo siguiente.
2º) Para las soluciones lineales de la ecuación dada (supuesto f(p) no idéntico a p) de la forma
y = pix + g(pi)
Se comprueba fácilmente que estas rectas, si existen, satisfacen la ecuación y = xf(y') + g(y'). Ahora
bien, puede ocurrir que g(pi) ∉ R, en cuyo caso no existe tal recta, y si existe puede ocurrir que pertenezca
o no a la solución general. En este último caso se llama una solución singular de la ecuación.
ENM Matemáticas II Ecuaciones diferenciales 14
y = xy' + g(y')
y = xC + g(C)
La solución general de toda ecuación de Clairaut es, pues, un haz de rectas que se obtiene sustituyendo
y' por una constante C. Si este haz tiene una curva envolvente ésta será una solución singular de la
ecuación, puesto que en cada uno de sus puntos será tangente a una recta involuta y tendrá en él los
mismos valores x, y, y' que los de dicha recta, verificando, por tanto la ecuación de Clairaut. Esta
envolvente se halla, por eliminación de C entre la ecuación del haz y su derivada respecto de C
y = xC + g(C)
0 = x + g'(C)
Solución. Como esta ecuación es de Clairaut, su solución general viene dada por:
y = xC - 2C²
Cálculo de la envolvente:
0 = x - 4C
Definición. Se llaman trayectorias de un haz de curvas F(x, y, C) = 0, a las curvas que cortan a las del
haz según un ángulo constante.
Y ∏ − y∏
Sea w dicho ángulo, entonces, tgw = (tangente del ángulo que forman dos rectas conocidas
1 + Y ∏ y∏
sus pendientes); despejando y', obtenemos:
Y ∏ − (!tgw)
y∏ =
1 + (!Y ∏ $ tgw )
Por tanto, si f(x, y, y') = 0 es la ecuación diferencial del haz dado, la de sus trayectorias será:
Y ∏ − (!tgw)
f x, Y, =0
1 + (!Y ∏ $ tgw )
El problema se simplifica si w = 90º pues la relación entre y' e Y' es simplemente y ∏ = − 1∏ . Por tanto,
Y
se hallará la ecuación diferencial de las trayectorias ortogonales de un haz F(x, y, C) = 0 hallando la
ecuación diferencial f(x, y, y') = 0 del haz y cambiando en ella y' por − 1∏ ; es decir,
y
f(x, y, − 1∏ ) = 0
y
xy' + y = 0,
-x 1∏ + y = 0,
y
Integrando, las trayectorias ortogonales son las curvas (hipérbolas) correspondientes a la familia
y² - x² = C.
ENM Matemáticas II Ecuaciones diferenciales 16
Ejercicios propuestos
Hallar las trayectorias ortogonales de cada una de las siguientes familias de curvas.
1. x + 2y = C.
2. x² + 2y² = C.
3. y² = 2x²(1 - Cx).
6. x(y')² - 2yy' + 4x = 0.
7. y²(y')² + 3y'x - y = 0.
8. y = 2y' + 1 + y’ 2 .
9. y = -xy' + x4y'.
10. Hallar una curva tal que la tangente en cualquiera de sus puntos P sea la bisectriz del ángulo
determinado por la ordenada que pasa por P y la recta que une P con el origen.
11. Hallar la curva para la que cada una de sus tangentes forme con los ejes coordenados un triángulo
de área constante a².
12. Hallar la curva para la que el producto de las distancias de los puntos (a, 0) y (-a, 0) a las tangentes
es igual a k.
13. Hallar la curva para la que la proyección sobre el eje "y" de la perpendicular desde el origen a
cualquiera de sus tangentes es igual a k.
ENM Matemáticas II Ecuaciones diferenciales 17
Introducción
que ligue una variable independiente "x" con una función "y" de ella y las n primeras derivadas.
Ejemplo. La ecuación
(y")² + (y')3 + 3y = x²
Definición. Al haz de curvas F(x, y, C1, C2,..., Cn) = 0 verificando la edo f(x, y, y', y" ,...,y(n) = 0 se le
llama solución general. Si y(x) es una curva del haz la llamaremos solución particular de la edo.
Ejemplo. Dada la ecuación diferencial y" - 5y' + 6y = 12, tenemos que la solución general es
y = C1e2x + C2e3x + 2,
y = C1e2x + 2
y = e2x + e3x + 2,
Cuando una curva y = g(x) verifica la ecuación diferencial y no forma parte de la solución general, se
llama solución singular.
ENM Matemáticas II Ecuaciones diferenciales 18
Introducción
Definición. Se llama ecuación diferencial lineal de orden n, a toda ecuación diferencial que es de
primer grado respecto de la función incógnita "y" y sus n primeras derivadas. Es decir
dny d n−1 y dy
a n (x) n + a n−1 (x) n−1 + $ $ $ + a 1 (x) + a 0 (x)y = g(x).
dx dx dx
Las funciones a0(x),..., an(x) (que supondremos continuas en un cierto intervalo I Õ R (acotado o no
acotado)) se llaman coeficientes de la ecuación. El coeficiente an(x) desempeña un papel especial, puesto
que determina el orden de la ecuación. Los puntos en los que an(x) = 0 se llaman puntos singulares de la
ecuación. La presencia de puntos singulares introduce, algunas veces, complicaciones que requieren un
estudio especial. Para evitarlas supongamos que la función an(x) nunca es cero en I. Entonces podemos
dividir ambos miembros de la ecuación por an(x) y escribir la ecuación diferencial con primer coeficiente
igual a 1. Por tanto, supondremos que la ecuación diferencial tiene la forma:
dny d n−1 y dy
+ a n−1 (x) + $ $ $ + a 1 (x) + a 0 (x)y = g(x).
dx n dx n−1 dx
Si el término independiente g(x) es nulo, la ecuación resultante
dny d n−1 y dy
n + a n−1 (x) n−1 + $ $ $ + a 1 (x) + a 0 (x)y = 0,
dx dx dx
se llama homogénea o incompleta, mientras que la ecuación
dny d n−1 y dy
n + a n−1 (x) n−1 + $ $ $ + a 1 (x) + a 0 (x)y = g(x),
dx dx dx
con g(x) ≠ 0 se llamará no homogénea o completa.
El estudio de las ecuaciones lineales puede simplificarse mediante el uso de operadores. Sea C(I) el
espacio vectorial de las funciones reales continuas en I, y sea Cn(I) es subespacio de C(I) de todas las
funciones de clase n en I. Sean a0(x),..., an-1(x) ∈ C(I); definamos el operador P(D): Cn(I) → C(I) de la
forma:
Teorema. Si y1,..., yn, son n soluciones independientes de la ecuación diferencial homogénea P(D)y = 0
en I, entonces la solución general de la ecuación homogénea es:
Teorema. Si y1,..., yn, son n soluciones independientes de la ecuación diferencial homogénea P(D)y = 0
e yp es una solución particular de la ecuación no homogénea P(D)y = g(x), donde g ∈ C(I), entonces la
solución general de la ecuación no homogénea es:
Por tanto, derivando n-1 veces, α1y1 + ⋅⋅⋅ + αnyn = 0, se tiene el sistema homogéneo
1 y1 +$$$+ n yn =0
1 y ∏1 +$$$+ n y ∏n =0
........... .......... ........... .....
1 y (n−1
(n−1
1 +$$$+ n yn =0
Para que dicho sistema posea sólo la solución trivial α1 = ⋅⋅⋅ = αn = 0, ha de verificarse (por el teorema
de Rouche-Froebenius), que sea distinto de cero el determinante (W) wronskiano
y1 ......... yn
y∏ ......... y ∏n
W(x) = 1
....... ......... .......
y (n−1
1 ........ y (n−1
n
Por tanto, la condición necesaria y suficiente para que "n" soluciones particulares y1,..., yn de una
ecuación lineal homogénea sean independientes es que el determinante wronskiano de ellas no se anule en
ningún punto.
ENM Matemáticas II Ecuaciones diferenciales 20
Sean y1,..., yn, n soluciones independientes de la ecuación diferencial lineal homogénea de orden n
P(D)y = 0 en un intervalo I. Entonces una solución particular yp de la ecuación P(D)y = g(x) viene dada
por:
yp = C1(x)y1 + ⋅⋅⋅ + Cn(x)yn
donde C1(x), ..., Cn(x) se determinan de la siguiente forma: Se resuelve (por Cramer) el sistema
obteniendo:
g(x)
Ci' = (−1 )
W w(y 1 , ..., y i−1 , y i+1 , ..., y n )
n+i
= fi(x) i = 1,.., n
y = K 1 y1 + K 2 y2 + $ $ $ + K n yn + yp
Ejercicio. Hallar, aplicando el método de variación de las constantes, la solución general de la edo
Supongamos constantes los coeficientes ao, ..., an-1 de P(D)y = 0. Para resolver dicha ecuación, haremos
lo siguiente:
2º) a) CASO DE RAÍCES SIMPLES. Si P(r) tiene n raíces distintas r1,...,rn , la solución general es:
y = C 1 e r 1 x + $ $ $ + C n e r nx
r² + 2r - 15 = 0.
Las raíces características son r = 3 y r = -5, por tanto la solución general de la ecuación dada es:
y = C1e3x + C2e-5x.
b) CASO DE RAÍCES MÚLTIPLES. Supongamos que r1 tiene multiplicidad k y el resto rk+1,... rn son
simples, en este caso la solución general es:
Las raíces características son r = 1 triple, por tanto la solución general de la ecuación dada es:
eαx(Acosβx + Bsenβx),
donde A = C1 + C2 y B = i(C1 - C2). Obsérvese que para tener soluciones en el campo real hemos de
atribuir a C1 y C2 valores conjugados, con lo que A y B serán constantes arbitrarias reales.
Solución. Las raíces de la ecuación característica, r² - 2r + 10 = 0, son: r = 1 ± 3i, por tanto la solución
general de la ecuación dada es:
y = ex(C1cos3x + C2sen3x)
Ejercicios propuestos
1. (D3 + D2 - 2D)y = 0.
2. (D² + 6D + 9)y = 0.
4. (D² + 4D + 13)y = 0.
5. (D² + 25)y = 0.
6. (D3 - D2 + 9D - 9)y = 0.
7. (D4 + 4D2)y = 0.
Como hemos dicho anteriormente, para formar la solución general de la ecuación completa bastará
añadir a la solución general de la homogénea una solución particular de la completa
P(D)y = g(x).
Veamos ahora algunos de los recursos utilizados para obtener tales soluciones particulares, en los casos
más frecuentes en la práctica, que son
a) Si P(a) ∫ 0, yp = a eαx
.
P )
(
k
b) Si a es raíz de multiplicidad k de P(x) = 0, yp = ax
(k
eαx.
P ( )
Como P(4) = 18 ∫ 0,
y p = 1 e 4x
18
es una solución particular de la ecuación completa, por tanto la solución general de la ecuación completa
es:
y = C1ex + C2e-4x.
Como P(2i) ∫ 0
yp = Acos2x + Bsen2x,
5 5
y = e − 2 C 1 cos x + C 2 sen
x
x.
2 2
2 2 3 9 27
4º) Si g(x) es una suma ∑gi de funciones de los tipos anteriores, bastará hallar las soluciones
particulares yi correspondientes y sumarlas; esta suma ∑yi será la solución particular deseada debido a la
linealidad del operador P(D).
Método del anulador. Sea la ecuación diferencial lineal de coeficientes constantes P(D)y = g(x). Si
g(x) es anulada por un operador con coeficientes constantes Pg(D), es decir Pg(D)g(x) = 0, entonces,
multiplicando la ecuación P(D)y = g(x) por Pg(D), obtenemos Pg(D)P(D)y = 0. Esta, es una ecuación
diferencial lineal homogénea con coeficientes constantes que es satisfecha por todas las soluciones
particulares de la ecuación original. El problema se reduce entonces a determinar, una función particular
yp de la solución general de Pg(D)P(D)y = 0 que satisface P(D)yp = g(x).
Solución. (D - 1)2 anula a xex, entonces, (D - 1)2(D2 - 4)y = 0 y la solución general de esta ecuación
homogénea es y = c1e2x + c2e-2x + c3ex + c4xex. La solución que estamos buscando pertenece a ese haz y
verifica (D2 - 4)y = xex, es decir
(D2 - 4)(c1e2x + c2e-2x + c3ex + c4xex) = xex ⇒ (c3 + 2c4)ex + c4xex - 4(c3ex + c4xex) = xex ⇒
Ejercicios propuestos
3. (D - 2)²y = e2x.
2º) Por tanto (D - r1)(D - r2)...(D - rn)y = g(x); llamando u1 = (D - r2)...(D - rn)y, obtenemos:
(D - r1)u1 = g(x),
u 1 = e r 1 x [¶ e −r 1 x g(x)dx + C 1 ] = g 1 (x) .
Tenemos ahora que (D - r2)...(D - rn)y = g1(x); llamando u2 = (D - r3)...(D - rn)y, obtenemos:
(D - r2)u2 = g1(x),
u 2 = e r 2 x ¶ e[ −r 2 x g 1 (x)dx + C 2 ] = g 2 (x) .
Solución.
Solución.
(D - 1)u1 = ex,
cuya solución es:
u 1 = e x ¶ e −x e x dx = e x (x + C 1 ).
y supongamos que se puede separar el miembro de la izquierda en dos operadores lineales P1(D) y P2(D)
de modo que
P1(D)[P2(D)y] = g(x),
entonces, haciendo P2(D)y = u(x), tenemos la edo lineal de orden uno P1(D)u = g(x). Calculado "u", sólo
nos queda resolver la edo lineal de orden uno P2(D)y = u(x), para obtener "y".
D(D - 3x )y = 2x - 1.
u1 = x² - x + K.
Ahora bien (D - 3x )y = x² - x + K, que es una ecuación diferencial lineal de primer orden cuya solución
es
Ejercicios propuestos
4. (D² + 2)y = ex + 2.
reducible a la anterior tomando αx + β como nueva variable independiente, por lo que sólo integraremos
la primera.
Se reconoce inmediatamente este tipo observando si las potencias de "x" disminuyen como los órdenes
de derivación, aun cuando no sean iguales la potencia y el orden en cada término, pues siempre puede
multiplicarse o dividirse por la potencia de x conveniente.
Resolución. La ecuación de Cauchy se reduce a una ecuación con coeficientes constantes mediante el
cambio de variable independiente x = et.
C3
y = C1x + C2xLx + .
x2
Ejercicios propuestos
Si pocos eran los tipos de ecuaciones diferenciales de primer orden integrables por cuadraturas, menos
serán aún los de orden n en general.
No obstante, existen casos sencillos en los que puede rebajarse el orden de una ecuación, es decir,
reducirse su integración a la de otra de orden menos elevado, en particular los casos en que una ecuación
de segundo orden se reduce a una de primero. Consideremos los más interesantes, que son:
Resolución. Basta tomar como nueva función incógnita la derivada y' = p para que la ecuación quede
reducida a la de orden n-1
una nueva integración dará "y" con una nueva constante aditiva. Si es más fácil obtener
2p' - p² + 4 = 0,
Integrando tenemos,
2(1 + C 1 e 2x )
p= ,
1 − C 1 e 2x
y por una nueva integración, obtenemos
Resolución. Tomaremos como nueva función y' = p y como nueva variable y. Se tendrá:
2
dy’ dp dy dp dy” d2p dp
y” = = = $ p y”’ = $p= 2 + p
dx dy dx dy dy dy dy
Se ve que podemos expresar las derivadas de y mediante las de p con órdenes de derivación rebajados
en una unidad, con lo que la ecuación se transformará en otra del tipo
dy
p = φ(y, C1,..., Cn-1) o sea dx = ,
#(y, C 1 , ..., C n−1 )
d&
Si es más fácil obtener y = ψ(p, C1,..., Cn-1) integraremos dx = p , para hallar x, expresando así la
solución general parametricamente.
dp dp
Solución. La sustitución y' = p, y" = p reduce la ecuación a: = p2 + 1
dy dy
dp dy
Entonces, = dy, arctg(p) = y + K 1 y p = = tg(y + K 1 ).
p2 + 1 dx
Ahora bien, ctg(y + K1)dy = dx, Lsen(y + K1) = x + K2, y = arcsen(C2ex) + C1.
y" = f(y').
dp dp dp
= f(p) e dx = ex=¶ + C1
dx f(p) f(p)
pdp pdp
dy = pdx = ey=¶ + C 2,
f(p) f(p)
Solución. En este caso tenemos que f(p) = p3 + p = p(p² + 1). Por tanto:
dp L(p 2 + 1)
x=¶ + C = Lp + + C1
p(p 2 + 1) 1
2
dp
y=¶ + C 2 = arctg(p) + C 2
p2 +1
y" = f(y).
dy = y'dx
y"y'dx = f(y)dy
e integrando
y’ 2 dy
= ¶ f(y)dy + C 1 e = 2(¶ f(y)dy + C 1 ) .
2 dx
Ecuación diferencial de primer orden de variables separadas. Una nueva integración nos dará
dy
x=¶ + C 2.
2(¶ f(y)dy + C 1 )
Solución.
dy
x=¶ + C 2 = L K 1 y + K 21 y 2 + 1 + C 2.
2(¶ ydy + C 1 )
5º) ECUACIONES HOMOGÉNEAS EN y, y',..., y(n. Entre las ecuaciones cuyo orden puede rebajarse
figuran diversos tipos de ecuaciones homogéneas; el más importante es aquél cuya homogeneidad se
refiere a la función "y" y a sus derivadas; es decir, ecuaciones del tipo:
f(x, y, y',.., y(n) = 0 tal que f(x, λy, λy',.., λy(n) = λkf(x, y, y',.., y(n)
a "k" se le llama grado de homogeneidad (que supondremos > 0). Por tanto la ecuación puede escribirse
y’ y” y (n
y k f x, 1, y , y , ..., y =0
y’
Resolución. La forma de esta ecuación sugiere el cambio y = u (u nueva función). Efectuado dicho
cambio, la ecuación anterior se transforma en otra de orden n-1 en "u"
g(x, u, u',...,u(n-1) = 0.
Integrando esta ecuación obtendremos u = φ(x, C1,.., Cn-1) y sustituyendo en la ecuación de transformación
y’
y = u se obtendrá "y" por una nueva integración
y = C n e ¶ udx
Nota. Toda ecuación lineal homogénea de segundo orden se transforma en otra de Riccati tomando
como nueva función "u" incógnita la derivada logarítmica de la función buscada.
Ejercicios propuestos
1. y" + (y')2 + 1 = 0.
5. yy" + (y')3 = 0.
6. yy" + (y')2 = 2.
p’
8. (2x3 - 1)y"' - 6x2y" + 6xy' = 0 (y' = p, p = u y u = 1x + 1 es la solución).
v(x )
Consideremos un sistema de ecuaciones lineales de coeficientes constantes con tantas ecuaciones como
incógnitas, como por ejemplo:
Dicho sistema puede ser resuelto por varios caminos distintos. Nosotros daremos su solución por
medio de las siguientes fórmulas (análogas a las fórmulas de Cramer)
P 11 (D ) P 12 (D ) P 13 (D ) g 1 (t ) P 12 (D ) P 13 (D )
P 21 (D ) P 22 (D ) P 23 (D ) x = g 2 (t ) P 22 (D ) P 23 (D )
P 31 (D ) P 32 (D ) P 33 (D ) g 3 (t ) P 32 (D ) P 33 (D )
P 11 (D ) P 12 (D ) P 13 (D ) P 11 (D ) g 1 (t ) P 13 (D )
P 21 (D ) P 22 (D ) P 23 (D ) y = P 21 (D ) g 2 (t ) P 23 (D )
P 31 (D ) P 32 (D ) P 33 (D ) P 31 (D ) g 3 (t ) P 33 (D )
P 11 (D ) P 12 (D ) P 13 (D ) P 11 (D ) P 12 (D ) g 1 (t )
P 21 (D ) P 22 (D ) P 23 (D ) z = P 21 (D ) P 22 (D ) g 2 (t )
P 31 (D ) P 32 (D ) P 33 (D ) P 31 (D ) P 32 (D ) g 3 (t )
El número de constantes arbitrarias independientes que aparecen en la solución general del sistema
P 11 (D ) P 12 (D ) P 13 (D )
P 21 (D ) P 22 (D ) P 23 (D )
P 31 (D ) P 32 (D ) P 33 (D )
ENM Matemáticas II Ecuaciones diferenciales 35
Solución.
2(D − 2 ) (D − 1 ) e t (D − 1 )
x=
(D + 3 ) 1 0 1
2(D − 2 ) (D − 1 ) 2(D − 2 ) e t
y=
(D + 3 ) 1 (D + 3 ) 0
o sea
2(D − 2 ) (D − 1 )
(D + 3 ) 1
es dos, "x" e "y" deben de depender de dos constantes; entonces sustituyendo "x" e "y" en
(D + 3)x + y = 0,
se tiene
(C2 + 3C1 + C3)cost + (3C2 - C1 + C4)sent = 0
Ejercicios propuestos
1. (D - 1)x + Dy = 2t + 1
(2D + 1)x + 2Dy = t
2. (D + 2)x + 3y = 0
3x + (D + 2)y = 2e2t
5. (D + 1)x + (D - 1)y = et
(D² + D + 1)x - (D² - D + 1)y = t²
6. Dx + (D + 1)y = 1
(D + 2)x - (D - 1)z = 1
(D + 1)y + (D + 2)z = 0
8. (D - 1)x + (D + 2)y = 1 + et
(D + 2)y + (D + 1)z = 2 + et
(D - 1)x + (D + 1)z = 3 + et
ENM Matemáticas II Estadística 1
TEMA 5
INTRODUCCIÓN
Población y muestra
Definición.- Se llaman caracteres de los elementos de una población, a las cualidades que son objeto
del estudio estadístico. Ejemplos: El sexo, el estado civil, el número de hijos, el peso, etc.
Caracteres Modalidades
Sexo: Varón, hembra.
Estado civil: Soltero, casado, viudo, separado...
Número de hijos: 0, 1, 2, ...
Peso: .... 45,3 kg, ... 57 kg,...
Notación.- Los caracteres cualitativos se representan por las primeras letras mayúsculas del alfabeto
(A, B, C, ...); las distintas modalidades se representan con la correspondiente letra minúscula afectada por
un subíndice (ai, bi, ci, ....).
Caracteres cuantitativos o variables. Un carácter se dice cuantitativo si sus diversas modalidades son
medibles. Ejemplos: El número de hijos, el peso, etc.
Notación.- Los caracteres cuantitativos se representan por las últimas letras mayúsculas del alfabeto
(..., X, Y, Z), los distintos valores que toman se representan con la correspondiente letra minúscula
afectada por un subíndice de orden (xi, yi, zi, ....).
Definición.- Se denomina variable estadística al conjunto de valores numéricos que puede tomar un
carácter cuantitativo.
ENM Matemáticas II Estadística 2
Variable discreta. Una variable es discreta si toma un número finito de valores o infinito numerable.
Ejemplos:
El número de hijos.
El número de piezas defectuosas de un lote de 1.000.
El número de obreros de una obra en construcción.
Variable continua. Una variable estadística se dice que es continua, si puede tomar, al menos
teóricamente, todos los valores posibles dentro de un cierto intervalo de R. Ejemplos:
El peso.
El diámetro de una pieza.
La temperatura de un cuerpo.
La velocidad de un automóvil.
Resumiendo
Definición.- Sea X una variable estadística que toma los valores x1, x2, ...., xn, ....,. Se llama frecuencia
absoluta de xi, y la representaremos por ni, al número de veces que se ha presentado xi.
Definición.- Se llama frecuencia relativa de xi, y se representa por fi, al cociente entre la frecuencia
n
absoluta ni y el número total de observaciones N. Es decir: f i = i .
N
Observación.- Para el caso de caracteres cualitativos, las definiciones de frecuencia absoluta y relativa
son análogas.
Ni = n1 + ⋅⋅⋅ + ni.
Fi = f1 + ⋅⋅⋅ + fi.
Definición.- Se llama distribución de frecuencias a una tabla que contiene cada una de las modalidades
del carácter a estudio con su frecuencia absoluta.
Ejemplo: Las puntuaciones obtenidas en Matemáticas por los 50 alumnos de una clase son:
X ni
0 3
1 4
2 6
3 6
4 5
5 7
6 4
7 5
8 4
9 3
10 3
N= 50
ENM Matemáticas II Estadística 4
Cuando la variable es de tipo continuo, o cuando el número de valores distintos que toma la variable es
muy grande (mayor de 30), conviene efectuar agrupaciones de dichos valores en intervalos de clase, que
vienen definidos por un límite inferior (Li-1) y un límite superior (Li), siendo la diferencia entre el límite
superior e inferior la amplitud (ci) de cada clase.
Así, por ejemplo, considerando la edad de los 1.000 habitantes de un pueblo, al ser muy grande el
número de valores distintos que toma la variable (edad), se pueden agrupar en intervalos de clase de
amplitud 5, resultando
X ni
[0,5) 75
[5,10) 93
[10,15) 105
[15,20) 86
[20,25) 75
[25,30) 62
[30,35) 45
[35,40) 64
[40,45) 73
[45,50) 48
[50,55) 94
[55,60) 32
[60,65) 56
[65,70) 40
[70,75) 28
[70,80] 24
N= 1.000
Los intervalos pueden elegirse de distinta amplitud. Si los 500 alumnos de un centro calificados de 0 a
10 los queremos expresar con arreglo a suspensos, aprobados, notables y sobresalientes, formaríamos la
tabla
X ni
[0,5) 150
[5,7) 175
[7,9) 125
[9,10] 50
N= 500
L + L i−1
Definición.- Se llama marca de clase al punto medio de cada intervalo de clase: x i = i . La
2
marca de clase se toma como valor representativo del intervalo de clase y juega el papel de xi en una
distribución de variable discreta.
X xi ni
[0,5) 2,5 150
[5,7) 6 175
[7,9) 8 125
[9,10] 8,5 50
N= 500
ENM Matemáticas II Estadística 5
Representaciones gráficas
Ejemplo. Los alumnos matriculados en la Facultad de Ciencias de una Universidad por Secciones es:
1600
1400
1200
1000
800
600
400
200
Q M F B G
Un caso particular de los diagramas de barras son los gráficos de Pareto. La única diferencia con los
diagramas de barras es que estas se ordenan de izquierda a derecha de mayor a menor frecuencia.
1600
1400
1200
1000
800
600
400
200
Q F M B G
ENM Matemáticas II Estadística 6
Considerando el ejemplo anterior y teniendo en cuenta que el círculo queda dividido en 360º, se
averigua con una sencilla regla de tres los grados correspondientes a cada sector (360º⋅fi), obteniendo:
M
G
B
F
Histogramas. Estas representaciones gráficas sólo son válidas para el caso de variables cuantitativas
continuas. Son representaciones gráficas por áreas. Sobre el eje de abscisas se marcan los extremos de los
intervalos de clases de la variable continua y se levantan rectángulos, de base los intervalos y de altura tal,
que el área del rectángulo sea igual o proporcional a la respectiva frecuencia absoluta o relativa, según sea
el histograma de frecuencias absolutas o de frecuencias relativas.
Ejemplo. Los salarios anuales en miles de euros de las 60 personas que trabajan en la empresa MNE,
son:
Salarios ni
[0,10) 13
[10,20) 15
[20,30) 20
[30,40) 8
[40,50] 4
20
18
16
14
12
10
0
10 20 30 40 50
Polígono de Frecuencias. Se obtiene uniendo los puntos medios de los lados superiores de los
rectángulos levantados en el histograma de frecuencias; la resultante es una línea quebrada (ver figura).
ENM Matemáticas II Estadística 7
Ejercicios propuestos
1. En las pruebas de selectividad, los alumnos de un centro obtuvieron las siguientes puntuaciones:
Puntuaciones Nº alumnos
0 3
1 7
2 10
3 15
4 23
5 18
6 15
7 9
8 5
Se pide:
a) Completar la tabla con las columnas de la frecuencia relativa, frecuencia acumulada absoluta y
frecuencia acumulada relativa.
b) Dibujar el diagrama de barras.
2. Las temperaturas en grados registradas en España durante el verano por 60 estaciones meteorológicas
han sido las siguientes:
Temperaturas Nº Estaciones
[12,15) 5
[15,18) 6
[18,21) 8
[21,24) 12
[24,27) 18
[27,30) 7
[30,33] 4
Se pide:
a) Completar la tabla con las columnas de la marca de clase, frecuencia relativa, frecuencia
acumulada absoluta y frecuencia acumulada relativa.
b) Dibujar el histograma de frecuencias y polígono de frecuencias.
ENM Matemáticas II Estadística 8
Moda
En el caso de variable continua, en vez de moda se tiene clase modal. La clase modal es el intervalo
nj
afectado del máximo cociente c j .
Mediana
Definición.- Se llama mediana al valor de la variable que divide a la muestra (o población) en dos
partes con el mismo número de elementos, suponiendo los datos ordenados de menor a mayor. Se
representa por Me.
xi ni Ni
x1 n1 N1
⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅ ⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅ ⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅
xj-1 nj-1 Nj-1
xj nj Nj
xj+1 nj+1 Nj+1
⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅ ⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅ ⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅
xm nm Nm
2º) Calculamos N .
2
3º) En la columna de las Ni buscamos N , pudiendo presentarse dos casos:
2
N < N <N uM =x
j−1 2 j e j
x j−1 + x j
N j−1 = N < N j u M e =
2 2
xi ni Ni
0 14 14
1 10 24
2 15 39
3 26 65
4 20 85
5 15 100
Hallamos: N = 100 = 50; N j−1 < N < N j ; 39 < 50 < 65; luego: Me = xj = 3
2 2 2
ENM Matemáticas II Estadística 9
xi ni Ni
10 5 5
11 18 23
12 17 40
13 12 52
14 15 67
15 13 80
Intervalos ni Ni
[L0, L1) n1 N1
⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅ ⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅ ⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅
[Lj-2, Lj-1) nj-1 Nj-1
[Lj-1, Lj) nj Nj
[Lj, Lj+1) nj+1 Nj+1
⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅ ⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅ ⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅
[Lm-1, Lm] nm Nm
2º) Calculamos N .
2
3º) En la columna de las Ni buscamos N , entonces:
2
N −N
j−1
Si N j−1 [ N < N j ⇒ M e = L j−1 + 2 n j $ cj
2
Intervalos ni Ni
[0,1) 10 10
[1,2) 12 22
[2,3) 12 34
[3,4) 10 44
[4,5] 7 51
Los cuartiles, deciles y percentiles, al igual que la mediana, son medidas de posición y en conjunto se las
suele denominar cuantiles.
Su cálculo se efectúa siguiendo el mismo procedimiento que con la mediana, tomando en este caso kN
4
con k = 1, 2, 3.
Su cálculo se efectúa siguiendo el mismo procedimiento que con la mediana, tomando en este caso kN
10
con k = 1, 2, ... 9.
Su cálculo se efectúa siguiendo el mismo procedimiento que con la mediana, tomando en este caso kN
100
con k = 1, 2, ..., 99.
ENM Matemáticas II Estadística 11
Media aritmética
Definición.- Sea la variable discreta X, que toma los valores x1, x2, ..., xm con frecuencias n1, n2, ..., nm
(de un total de N observaciones), se llama media aritmética a:
m
x n + $ $ $ +x n x ini m
x = 1 n11 + $ $ $ +nmm m = i=1 = xifi
N i=1
Ejemplo. Las calificaciones de 476 alumnos de un Colegio, vienen dadas en la tabla adjunta. Calcular
la nota media.
xi ni
0 15
1 28
2 36
3 63
4 90
5 84
6 51
7 27
8 34
9 30
10 18
N = 476
x = 0 $ 15 + 1 $ 28 + $ $ $ +10 $ 18 = 2.286 = 4, 8
476 476
Cuando los datos están agrupados en intervalos de clases, siendo la variable de tipo continuo, las clases
se representan por su marca de clase xi, definiéndose la media aritmética de forma análoga al caso de
variable discreta.
Intervalos xi ni
[0,10) 5 5
[10,20) 15 7
[20,30) 25 3
[30,40] 35 12
N= 27
x = 5 $ 5 + 15 $ 7 + 25 $ 3 + 35 $ 12 = 625 = 23, 15
27 27
1. Si y = ax + b, entonces: y = ax + b.
2. La media de la diferencia de una variable a su media es cero.
ENM Matemáticas II Estadística 12
Definición.- Sea la variable discreta X, que toma los valores x1, x2, ..., xm con coeficientes de
ponderación o pesos w1, w2, ..., wm, se llama media aritmética ponderada a:
x 1 w 1 + $ $ $ +x m w m
xp = w 1 + $ $ $ +w m
Ejercicios propuestos
2. Cierto profesor de Matemáticas de una Universidad, a la hora de la puntuación final, calificaba a sus
alumnos siguiendo el criterio: Suspensos: 40%; Aprobados: 30%; Notables: 15%; Sobresalientes:
10%; Matrículas: 5%. Si las notas obtenidas por sus alumnos vienen dadas en la tabla adjunta
Notas Nº alumnos
[0,1) 36
[1,2) 74
[2,3) 56
[3,4) 81
[4,5) 94
[5,6) 70
[6,7) 41
[7,8) 28
[8,9) 16
[9,10] 4
Introducción
Para completar la información que pueda deducirse de la media aritmética y para evitar falsas
interpretaciones, es necesario acompañar este promedio con un coeficiente que nos mida el grado de
dispersión de la distribución de la variable.
Definición.- Sea la variable discreta X, que toma los valores x1, x2, ..., xm con frecuencias n1, n2, ..., nm
(de un total de N observaciones), se llama varianza de X a:
m m
n i (x i − x) 2 n i x 2i
s 2x = = − x2
i=1 i=1
N N
Definición.- Se llama desviación típica a la raíz cuadrada de la varianza. Se designa por sx o por σx.
Su fórmula es:
m m
n i (x i − x) 2 n i x 2i
sx = = −x
i=1 i=1 2
N N
Ejemplo. Las calificaciones obtenidas por dos alumnos de 2º de Bachillerato en las evaluaciones de
matemáticas han sido:
alumno A: 1-3-5-7-9
alumno B: 2-3-4-8-8
Alumno A: x = 1 + 3 + 5 + 7 + 9 = 5
5
(1 − 5 ) 2 + (3 − 5 ) 2 + (5 − 5 ) 2 + (7 − 5 ) 2 + (9 − 5 ) 2
s 2x = = 8 e s x = 8 l 2, 83
5
Alumno B: x = 2 + 3 + 4 + 2 $ 8 = 5
5
(2 − 5 ) 2 + (3 − 5 ) 2 + (4 − 5 ) 2 + 2(8 − 5 ) 2
s 2x = = 6, 4 e s x = 6, 4 l 2, 53
5
Al ser mayor la desviación típica de las calificaciones del alumno A que las del B, existe mayor
dispersión en éste que en aquél; o lo que es lo mismo, las notas de B son más homogéneas que las de A.
Definición.- Se llama recorrido de X a la diferencia entre los valores máximo y mínimo de la variable.
Se designa por R.
Para comparar las dispersiones de dos o más distribuciones en las que las variables de las distribuciones
vienen expresadas en unidades distintas, no debe utilizarse la desviación típica para medir la dispersión de
ambas distribuciones, sino una medida de dispersión en números abstractos que se denomina coeficiente
de variación de Pearson.
Ejemplo. Los vecinos de una finca urbana se han tallado y pesado, obteniendo los siguientes resultados:
Talla Peso
x = 1, 68 m. y = 68, 5 kg.
s x = 0, 5 m. s y = 6, 5 kg.
¿dónde existe mayor dispersión?
0, 5
CV(tallas) = $ 100 = 29, 76
1, 68
6, 5
CV(pesos) = $ 100 = 9, 49
68, 5
existe mayor dispersión en las tallas que en los pesos o, lo que es lo mismo, los pesos están más
concentrados que las tallas o que la variabilidad en la talla es mayor que en el peso.
También es útil aplicar el coeficiente de variación CV cuando las medias de dos distribuciones se
diferencian mucho, aunque estén medidas en la misma clase de unidades.
Ejemplo. Se ha aplicado un mismo test a dos grupos de alumnos A y B. Los resultados obtenidos han
sido:
x = 38 y = 53
Grupo A Grupo B
sx = 7 sy = 9
¿qué grupo tiene mayor dispersión?
Aparentemente diríamos que el grupo B tiene mayor dispersión en los resultados que el grupo A, ¿es
cierto? Hallamos los coeficientes de variación de Pearson para los dos obteniendo:
La apreciación primera no es cierta, habiendo mayor dispersión en los resultados del grupo A que en
los del grupo B.
m
ni xi − x
Definición.- Se llama desviación media de X a: DM x = i=1
.
N
ENM Matemáticas II Estadística 15
Momentos
Casos particulares:
α0 = 1, α1 = x
Casos particulares:
µ0 = 1, µ1 = 0, µ2 = s2
Proposición.- µ2 = s2 = α2 - α12
Medidas de asimetría
En toda distribución simétrica unimodal, se verifica tanto en el caso discreto como en el caso continuo
que:
x = Mo = Me
a) Se dice que la distribución es asimétrica a la derecha o positiva, cuando las frecuencias descienden
más lentamente por la derecha que por la izquierda o, lo que es lo mismo, en la representación gráfica la
rama de la derecha es más larga que la de la izquierda respecto de la moda.
ENM Matemáticas II Estadística 16
b) Se dice que la distribución es asimétrica a la izquierda o negativa, cuando las frecuencias descienden
más lentamente por la izquierda que por la derecha o, lo que es lo mismo, en la representación gráfica la
rama de la izquierda es más larga que la de la derecha respecto de la moda.
Apuntamiento o curtosis
Las medidas de apuntamiento o curtosis se refieren a la frecuencia de los valores centrales. El grado de
apuntamiento lo es con respecto a la distribución normal (que se verá posteriormente), cuya gráfica recibe
el nombre de campana de Gauss y es de la forma:
La comparación hay que hacerla con una distribución normal que tenga la misma media y desviación
típica que la dada.
Ejercicios propuestos
Intervalos Nº personas
[40,50) 7
[50,60) 12
[60,65) 18
[65,70) 22
[70,75) 13
[75,80) 10
[80,90) 5
[90,100] 3
2. Las calificaciones obtenidas en Matemáticas por dos grupos de alumnos, ha dado como resultado
Grupo 1: x = 5, 5; s x = 0, 7
Grupo 2: y = 6, 3; s y = 0, 5
¿qué grupo tiene mayor variabilidad?
x i ni
1 3
2 10
3 4
4 2
5 1
DISTRIBUCIONES BIDIMENSIONALES
X/Y y1 y2 . . . yj . . . ym ni*
x1 n11 n12 . . . n1j . . . n1m n1*
x2 n21 n22 . . . n2j . . . n2m n2*
...............................
xi ni1 ni2 . . . nij . . . nim ni*
...............................
xr nr1 nr2 . . . nrj . . . nrm nr*
n*j n*1 n*2 . . . n*j . . . n*m N
Ejemplo. Se consideran 30 alumnos de una clase y se les pesa y se les pregunta la edad, obteniéndose
la siguiente distribución de frecuencia:
Edad
X/Y 9 10 11 12 ni*
22 1 1
P
27 2 1 1 4
e
32 1 3 4 2 10
s
37 2 3 5 10
o
42 1 4 5
n*j 4 6 9 11 30
En cada casilla aparece la frecuencia absoluta nij correspondiente al par (xi, yj). Por ejemplo, n32 = 3
representa que con 32 kg y 10 años hay 3 alumnos. Es evidente que Snij = N es el número de pares
estudiados. Si denotamos por fij = nij/N la frecuencia relativa del par (xi, yj), tenemos que Sfij = 1.
Definición.- Se llama distribución marginal de una variable a la que se obtiene al estudiar esa
variable con independencia de las demás. Por ejemplo la distribución marginal de X es:
X ni*
22 1
27 4
32 10
37 10
42 5
30
f(x i , y j )
Se verifica que f(yj/xi) = si f(xi) > 0.
f(x i )
ENM Matemáticas II Estadística 20
X
Definición.- Se llama vector de medias de la variable bidimensional (X, Y) a: .
Y
s 2x s xy
s xy s 2y
Coeficiente de correlación
Ejercicios propuestos
Calcular r.
ENM Matemáticas II Estadística 22
PROBABILIDAD
Definición.- Decimos que un fenómeno es aleatorio cuando al repetirlo en las mismas condiciones no
podemos predecir su resultado.
Definición.- Se llama espacio muestral al conjunto de todos los resultados posibles de un experimento
aleatorio. Lo denotamos por E.
Ejemplos. El espacio muestral asociado al experimento aleatorio del lanzamiento de un dado y anotar
la cara superior es:
E = {1, 2, 3, 4, 5, 6}
El espacio muestral asociado al experimento aleatorio del lanzamiento de dos monedas y anotar las
caras superiores es:
E = {(c, c), (c, +), (+, c), (+, +)}
Los sucesos definidos por los conjuntos « y E se llaman suceso imposible y seguro respectivamente.
Los sucesos formados por un sólo elemento de E se llaman sucesos elementales.
Definición.- Se llama espacio de sucesos, al conjunto formado por todos los sucesos del espacio
muestral E. Se representará por P(E).
Ejercicios propuestos
1. Se lanza una moneda tres veces. Escribir el espacio muestral relativo a este experimento aleatorio y
el suceso A consistente en que el número de caras es mayor que el número de cruces.
2. Una caja contiene cuatro bolas blancas y tres negras. Se extrae dos bolas de la caja. Describir el
espacio muestral:
a) Cuando las bolas del mismo color se distinguen porque están numeradas.
b) Cuando las bolas del mismo color no se distinguen porque no van numeradas.
3. Hallar el espacio muestral que resulta de lanzar dos monedas y escribir el espacio de sucesos.
Definición.- Se dice que A está contenido en B, y se escribe A Õ B, cuando siempre que ocurra A
ocurre B.
A»B = {x ∈ E | x ∈ A o x ∈ B}.
A…B = {x ∈ E | x ∈ A y x ∈ B}
A = {x ∈ E | x ∉ A}
El « y E son sucesos contrarios.
A - B = {x ∈ E | x ∈ A y x ∉ B}
Definición.- Los sucesos A1, A2, ...., An œ A son mutuamente excluyentes si:
Ai…Aj = « si i ≠ j.
ENM Matemáticas II Estadística 24
1. E œ A.
∞
2. Si A1, A2, ...An,... œ A fl 4 A i œ A.
i=1
3. Si A œ A fl A œ A.
Propiedades de (A, », …, ):
ÁLGEBRA DE BOOLE
OPERACIONES DEFINIDAS EN A
A, B, C ∈ A
Unión Intersección
Asociativa (A»B)»C = A»(B»C) (A…B)…C = A…(B…C)
Conmutativa A»B = B»A A…B = B…A
Idempotente A»A = A A…A = A
A»(B…A) = A
Simplificativa
A…(B»A) = A
A»(B…C) = (A»B)…(A»C)
Distributiva
A…(B»C) = (A…B)»(A…C)
Elementos neutros A…E = A, A»« = A
Complementación A»A = E; A…A = «
Además de las propiedades anteriores, son muy utilizadas las siguientes, que son conocidas con el
nombre de leyes de De Morgan:
a) A 4 B = A…B
b) A 3 B = A»B
Definición.- Se dice que A1, A2, ...., An œ A es un sistema exhaustivo de sucesos si:
Definición.- Se dice que A1, A2, ...., An œ A es un sistema completo de sucesos si:
a) ∀i, Ai ≠ «.
b) A1»A2» ... »An = E.
c) Ai…Aj = « si i ≠ j.
ENM Matemáticas II Estadística 25
Frecuencias
1. P(«) = 0.
n n
2. Si A1, A2, ..., An œ A y Ai…Aj = « si i ≠ j, entonces: P 4
i=1
Ai = P(A i ).
i=1
7. P(A) § 1 " A œ A.
ENM Matemáticas II Estadística 26
Hay fenómenos aleatorios, como el lanzamiento de dos dados, de monedas, etc., en que por razones de
simetría y regularidad se puede suponer que todos los sucesos elementales tienen igual probabilidad de
presentarse. En estos casos es útil la definición de probabilidad de Laplace:
Definición.- La probabilidad de un suceso A, en el supuesto de que todos los sucesos elementales sean
igual de probables, es:
Según esta definición, la probabilidad del suceso imposible es 0, y la del suceso seguro es 1. Los
demás sucesos tienen una probabilidad que varía entre 0 y 1.
Combinatoria
V nm = m! VR nm = m n
(m − n)!
P n = n! PR m
,,...,
= m! donde + + $ $ $ + = m
!!...!
C nm = m m!
n = n!(m − n)! CR nm = m + nn − 1
Como no se puede aplicar siempre la regla de Laplace, Von Mises dio una definición empírica a partir
de la frecuencia relativa y apoyándose en la ley de estabilidad de las frecuencias.
P(A) = lim
nd∞
f(A)
La única diferencia con la axiomática de Kolmogorov, está en el axioma 2, que Von Mises da para dos
sucesos.
ENM Matemáticas II Estadística 27
Ejercicios propuestos
2. De una caja de 5 bolas blancas, 5 rojas y 4 azules, se extraen dos al azar. Hallar la probabilidad de
que las bolas extraídas sean:
4. De una baraja de 40 cartas se eligen 5 al azar. ¿Cuál es la probabilidad de que sean del mismo palo?
5. En una urna hay 5 bolas numeradas del 1 al 5. ¿Cuál es la probabilidad de que al extraerlas una a
una salgan en orden correlativo 1, 2, 3, 4, 5?
6. En una urna hay seis bolas blancas, cinco amarillas, siete azules, cinco rojas y nueve verdes. Se
extrae una bola al azar. Hallar la probabilidad de que sea azul, roja o amarilla.
El periódico A lo leen el 20% de los habitantes. El periódico B lo leen el 10% de los habitantes. El
periódico C lo leen el 5% de los habitantes.
Además, A y B lo leen el 4%, A y C el 3%, B y C el 2% y finalmente los tres los leen el 1%.
Elegido un habitante de dicha ciudad al azar, hallar la probabilidad de que no lea ninguno de los
tres periódicos.
8. Un colegio tiene 500 estudiantes, y se sabe que: 300 leen inglés, 200 leen francés, 50 leen alemán,
20 leen francés y alemán, 30 leen inglés y francés, 15 inglés y alemán, 10 leen los tres idiomas.
Si se escoge al azar un estudiante de este colegio, ¿cuál es la probabilidad de que el estudiante:
a) Lea dos y solamente dos idiomas?
b) Lea cuando menos un idioma?
ENM Matemáticas II Estadística 28
Definición.- Dado un espacio de probabilidad (E, A, P) y un suceso A ∈ A con P(A) > 0, se llama
probabilidad condicionada del suceso B dado A a:
P(A 3 B)
P(B/A) =
P(A)
Análogamente, suponiendo P(B) > 0, la probabilidad condicionada de A respecto del suceso B es:
P(A 3 B)
P(A/B) = P(B)
Teorema.- Sea A1, A2, ..., An,... œ A un sistema completo de sucesos con P(Ai) conocidas y P(Ai) > 0
∀i œ N. Si B œ A y conocemos P(B/Ai) ∀i œ N, entonces:
∞
P(B) = P(A i )P(B/A i )
i=1
Fórmula de Bayes. Sea A1, A2, ..., An,... œ A un sistema completo de sucesos con P(Ai) conocidas y
P(Ai) > 0 ∀i œ N, B œ A tal que P(B) > 0 y conocemos P(B/Ai) ∀i œ N, entonces:
P(A j )P(B/A j )
P(A j /B) = ∞ "jœN
P(A i )P(B/A i )
i=1
Nota.- Teorema y fórmula son ciertos en el caso de una familia finita de sucesos.
Sucesos independientes
Teorema. Si A y B son independientes, entonces: P(A/B) = P(A) si P(B) > 0, P(B/A) = P(B) si P(A) > 0.
Definición.- Una familia H Õ A no vacía de sucesos, se dice que está formada por sucesos
completamente independientes, si para toda subfamilia finita A1, A2, ..., Ak, œ H se verifica que:
P(A1…A2…...…Ak) = P(A1)P(A2)...P(Ak)
ENM Matemáticas II Estadística 29
Experimentos compuestos
Definición.- Dados (E1, A1, P1) y (E2, A2, P2) dos espacios probabilísticos, se denomina experimento
compuesto a (E, A, P) donde:
E = E1µE2.
A = A1µA2.
P(Ai, Bj) = P1(Ai)P2(Bj) experimentos independientes.
P(Ai, Bj) = P1(Ai)P2(Bj/Ai) experimentos dependientes.
Ejercicios propuestos
1. Las 40 cartas de una baraja española se reparten en partes iguales entre cuatro personas A, B, C y D.
Hallar la probabilidad de que B tenga dos reyes, si se sabe que A no tiene reyes.
2. Se tienen nueve tarjetas, y cada una lleva escrito un dígito del 1 al 9. Se eligen al azar dos tarjetas y
la suma de los dígitos escritos en ellas da par ¿Cuál es la probabilidad de que las tarjetas elegidas
lleven escritos números impares?
3. Se lanzan dos dados. Si la suma de los puntos de las caras superiores es 5, hallar la probabilidad de
que en alguno de los dados salga 2.
4. Una caja contiene cuatro bolas blancas y dos negras. Se saca una bola y a continuación (sin
devolver la primera a la caja) se extrae otra.
Considerados los sucesos A: La primera bola extraída es blanca. B: La segunda bola extraída es
blanca.
a) Hallar P(A) y P(B/A).
b) ¿Son A y B independientes?
c) ¿Cuál es la probabilidad de que las dos bolas extraídas sean blancas?
5. Se sacan sucesivamente tres cartas de una baraja de 40. ¿Cuál es la probabilidad de que las tres
cartas sean del mismo palo?
6. Una urna contiene ocho bolas rojas y cuatro blancas. Se sacan tres bolas de la urna, una tras otra.
Hallar la probabilidad de que las dos primeras sean rojas y la tercera, blanca.
7. En un taller el 25% de los trabajadores son mecánicos, el 15% son electricistas y el 10% tienen las
dos especialidades. Se selecciona un trabajador del taller al azar.
a) ¿Cuál es la probabilidad de que el trabajador seleccionado sea mecánico o electricista?
b) Si se sabe que el trabajador seleccionado es mecánico, ¿cuál es la probabilidad de que sea
electricista?
8. De una baraja de 40 cartas se sacan sucesivamente dos al azar. Hallar la probabilidad de que la
primera sea caballo y la segunda rey.
ENM Matemáticas II Estadística 30
9. ¿Cuál es la probabilidad de torpedear un barco sabiendo que sólo pueden lanzarse tres torpedos y
que la probabilidad de hacer blanco con un torpedo es 0,2?
10. En la ejecutiva de un partido político el 70% son partidarios de una línea moderada y el resto, de
una línea radical. El 60% de los moderados y el 10% de los radicales tienen más de 40 años.
Elegido un miembro de la ejecutiva al azar, resulta que tenía más de 40 años. ¿Cuál es la
probabilidad de que sea un radical?
11. En una clase, el 20% de los chicos y el 5% de las chicas juegan al tenis. El 60% de los alumnos de
la clase son chicos. Se eligió al azar un estudiante de la clase y resultó ser de los que jugaban al
tenis. ¿Cuál es la probabilidad de que el estudiante elegido sea chico?
12. Una caja contiene tres monedas, la primera normal, la segunda tiene cara por los dos lados y la
tercera está trucada de forma que la probabilidad de salir cara es 1 . Se elige una moneda al azar y
3
se tira; hallar la probabilidad de que se obtenga cara.
13. Elegido un individuo al azar y observado por rayos X, se diagnosticó que estaba tuberculoso. La
probabilidad de que en la población de la que se eligió el individuo uno de ellos sea tuberculoso es
de 0,01. La probabilidad de que un aparato de rayos X detecte que un individuo es tuberculoso
siéndolo es 0,97 y no siéndolo es de 0,001. ¿Qué podemos decir acerca del diagnóstico?
ENM Matemáticas II Estadística 31
VARIABLES ALEATORIAS
Definición.- Se llama variable aleatoria (v.a.) a una aplicación X: E → R verificando que " x œ R el
conjunto {w ∈ E | X(w) ≤ x} ∈ A.
Una v.a. X es discreta, si el conjunto de valores que toma X es finito o infinito numerable.
Una v.a. X es continua si toma todos los valores de un intervalo.
Ejemplo. Se selecciona al azar un individuo de una ciudad; el espacio E está formado por todos los
habitantes de esa ciudad. La aplicación X, que a cada habitante le asocia su estatura, es una v.a. continua.
xi 0 1 2
f 1 2 1
4 4 4
Definición.- Sea X una v.a. continua, se llama función de densidad de X a una función f: R Ø R que
verifica:
1. f(x) ¥ 0 " x œ R.
+∞
2. ¶ −∞ f(x)dx = 1.
b
La función de densidad nos permite calcular probabilidades de la forma: P(a < X [ b) = ¶ a f(x)dx .
ENM Matemáticas II Estadística 32
Por tanto, la interpretación geométrica de P(a < X ≤ b) es el área comprendida entre f, el eje OX y las
rectas x = a y x = b.
y = f(x)
a b
0 si x < 0
f(x) = 2x si 0 [ x [ 1
0 si x > 1
comprobar que
+∞
¶ −∞ f(x)dx = 1 y f(x) m 0
Función de distribución
Ejemplo. Sea la v.a. discreta X = suma de puntos obtenidos en el lanzamiento de dos dados. La función
de distribución F(x) toma los siguientes valores:
xi 2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 5 4 3 2 1
f 36 36 36 36 36 36 36 36
36 36 36
1 3 6 10 15 21 26 30 33 35 36
F(xi) 36 36 36 36 36 36 36 36 36 36 36
0 si x < 0
f(x) = 2x si 0 [ x [ 1 .
0 si x > 1
La función de distribución F(x) es:
0 si x < 0
F(x) = x 2 si 0 [ x [ 1
1 si x > 1
Ejemplo.- Sea X una v.a. continua con funciones de densidad y distribución f y F conocidas. Obtener
las funciones de densidad y distribución de Y = 2X + 3.
y−3 y−3
G(y) = P(Y § y) = P(2X + 3 § y) = P X [ =F .
2 2
y−3 y−3
g(y) = G '(y) = 1 F ∏ = 1f .
2 2 2 2
Definición.- Sean las v.a. discretas X1, X2,..., Xn, llamaremos distribución de probabilidad conjunta
de X = (X1, X2, ..., Xn) a cualquier función f: Rn Ø R que verifique
1. f(x1, x2, ..., xn) ¥ 0, " (x1, x2, ..., xn) œ Rn.
2. i i ... i f(x i , x i , ...x i ) = 1.
1 2 n
1 2 n
Definición.- Sean las v.a. continuas X1, X2, ..., Xn, llamaremos función de densidad de la variable
n-dimensional X = (X1, X2, ..., Xn) a cualquier función f: Rn Ø R que verifique
1. f(x1, x2, ..., xn) ¥ 0, " (x1, x2, ..., xn) œ Rn.
+∞ +∞
2. ¶ −∞ ... ¶ −∞ f(x , x , ..., x )dx dx ...dx = 1.
1 2 n 1 2 n
Definición.- Se llama función de distribución conjunta de la variable aleatoria X = (X1, X2, ..., Xn) a
la función F: Rn Ø R definida por:
f(x 1 , ...x n )
f(x i /x j ) = si fj(xj) > 0.
f j (x j )
Definición.- Se dice que las v.a. X1, X2, ..., Xn, son independientes si:
Ejercicios propuestos
1. Se lanza un dado 3 veces. Se pide hallar la ley de probabilidad y la función de distribución del
número de apariciones de 5.
2. Una urna contiene 10 bolas de las que 8 son blancas. Se sacan al azar dos bolas. Sea X el número
de bolas blancas obtenidas. Calcular la función de densidad y la función de distribución de la
variable aleatoria X.
0 para x > 3
Se pide: a) Comprobar que f(x) es función de densidad. b) Obtener la función de distribución F(x).
Esperanza matemática
Definición.- Sea X una v.a., g una función real de variable real continua, y f la distribución de
probabilidad de X. Se llama esperanza matemática de g(X), a: m = E[g(X)].
a) Si X es una v.a. discreta: = E[g(X)] = g(x)f(x).
x
+∞
b) Si X es una v.a. continua: = E[g(X)] = ¶ −∞ g(x)f(x)dx.
Ejemplo. Sea la v.a. discreta X = suma de puntos obtenidos en el lanzamiento de dos dados, hallar la
esperanza matemática.
xi 2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 5 4 3 2 1
f 36 36 36 36 36 36 36 36 36 36 36
Ejemplo. Dada una v.a. continua X, cuya función de densidad viene dada por:
0 si x < 1
f(x) = x − 12 si 1 [ x [ 2
0 si x > 2
+∞ 3 2 2
= 19
2
= E(X) = ¶ −∞ xf(x)dx = ¶ 1 x x − 1 dx = x − x
2 3 4 1 12
Propiedades de la esperanza
Propiedades de la varianza
1. s2 = E[X2] - m2.
2. s2aX+b = a2 s2X, " a, b œ R.
3. Si X e Y son v.a. independientes, entonces: s2aX+bY = a2 s2X + b2 s2Y, " a, b œ R.
Momentos
αr = E[Xr].
a) Si X es una v.a. discreta: r = x r f(x).
x
+∞
b) Si X es una v.a. continua: r = ¶ −∞ x r f(x)dx.
Función característica
Definición.- Sea X una v.a. con distribución de probabilidad dada por f, se llama función característica
de X a:
j(t) = E[eitX]
Función generatriz
Definición.- Sea X una v.a. con distribución de probabilidad dada por f, se llama función generatriz
de X a:
g(t) = E[etX]
1. Sean X e Y v.a. si gX(t) = gY(t) " t œ R, entonces X e Y tienen la misma distribución de probabilidad.
2. Si Y = X + a, entonces: gY(t) = etagX(t), " a œ R..
3. Si Y = aX, entonces: gY(t) = gX(at), " a œ R.
4. Si X e Y son v.a. independientes, gX+Y(t) = gX(t)ÿgY(t).
d k g(0)
5. = k
dt k
Ejercicios
3. Encontrar los cuatro primeros momentos respecto al origen a partir de la función generatriz de la
v.a. discreta X, que toma los valores
X 0 1
f 0,5 0,5
5. Se considera una v.a. discreta X, que toma los valores 1, 2, 3, ..., 8 y su ley de probabilidad es
f(x) = P(X = x) = kx.
Se pide: Calcular k, F(x), P(X = 2), P(X ≤ 5) y P(2 < X ≤ 5).
6. Se considera una moneda trucada, para la que P(cara) = 1/3 y P(cruz) = 2/3. Se lanza la moneda tres
veces y sea X la v.a. que representa las veces que sale cara. Hallar la media y desviación típica.
7. La vida en horas de un tipo de lámparas de radio es una v.a. X, cuya función de densidad es:
0 para x < 100
f(x) = k
x 2 para x m 100
Determinar:
a. La probabilidad de que de 4 lámparas ninguna tenga que ser sustituida en un aparato de radio
durante las primeras 300 horas de uso.
b. La probabilidad de que las 4 lámparas tengan que cambiarse durante las 300 primeras horas.
ENM Matemáticas II Estadística 39
Distribución binomial
Sea P(A) = p en cada una de las n veces que repetimos el experimento aleatorio. A su vez llamamos A
al suceso contrario de A y denotamos por q = P(A) = 1 - p.
Los resultados obtenidos cada vez que repetimos el experimento aleatorio son independientes unos de
otros; si registramos los resultados de dichas observaciones escribiendo A cada vez que se presente el
suceso A y escribiendo A cada vez que se presenta el suceso contrario de A, tendremos una lista de n
observaciones cuyo resultado puede ser el siguiente:
AAAAA...AAA
Supongamos que el número de A es r y, por lo tanto el de A será n-r. Como se trata de sucesos
independientes, la probabilidad de los resultados obtenidos anteriormente es
ppqpq...qqp = prqn-r
pero ¿de cuántas formas diferentes se pueden elegir entre el total de n lugares, r destinados al suceso A?
La respuesta es; el número de permutaciones con repetición de n elementos, siendo r iguales entre si y por
otro lado n-r también iguales entre sí, es decir:
PR r,n−r = n! = nr
n
r!(n − r )!
Por lo tanto, la probabilidad de que el suceso A se presente r veces al repetir el experimento aleatorio
E, n veces es
n p r q n−r
r
y una distribución de este tipo recibe el nombre de Binomial. Si consideramos la v.a. X = número de
veces que se presenta el suceso A, su función de masa es:
f(r) = P(X = r) = nr p r q n−r
1. P(X = 4) = 4 0, 25 4 = 1
4 256
2. P(X = 1) = 4 0, 25 $ 0, 75 3 = 108
1 256
3. P(X ≥ 2) = 1 - [P(X = 0) + P(X = 1)] = 67
256
4. P(X ≤ 3) = 1 - P(X = 4) = 255
256
Distribución hipergeométrica
Función de masa.- Supongamos que disponemos de N datos, de los cuales k son considerados éxitos y
N-k como fracaso. De entre estos N datos, se seleccionan n de ellos sin reemplazamiento. Se define la v.a.
X = número de éxitos entre los n seleccionados, su función de masa es:
k N−k
x n−x
f(x ) = P(X = x) =
N
n
Distribución geométrica
n+x−1
f(x) = P(X = x) = (1 - p)xpn
x
Distribución de Poisson
Función de masa.- Una v.a. discreta X con valores 0, 1, 2, ..., sigue una distribución de Poisson de
parámetro l, si su función de masa es:
r
f(r) = P(X = r ) = e − r = 0, 1, 2, ...., n, .....
r!
Se trata de una B(n; p) = B(100; 0,05). Como n ≥ 50 y p < 0,1, la podemos aproximar mediante una
P(λ), siendo λ = np = 100⋅0,05 = 5, por tanto
3
1. P(X = 3) = 5 e −5 = 0, 14
3!
0
2. P(X = 0) = 5 e −5 = 0, 00674
0!
3. P(X > 2) = 1 - [P(X = 0) + P(X = 1) + P(X = 2)] = 0,875
Ejercicios propuestos
1. Tres personas lanzan al aire dos monedas cada una. Sea la v.a. X, el número de personas que
obtienen dos caras. Determinar:
a. La función de densidad.
b. La media y varianza, comprobándolo con el auxilio de la tabla de probabilidad.
4
g(t ) = 2 e t + 3
5 5
ENM Matemáticas II Estadística 43
Se pide:
a. Calcular la función de probabilidad.
b. Probabilidad de que X ≥ 1.
c. Esperanza matemática y desviación típica.
5. Sabiendo que el número medio de enfermos recibidos cada 10 minutos en un Centro Sanitario entre
las 10h y 15h, es 1,8. Calcular la probabilidad de que entre las 12h 40m y las 12h 50m haya:
a. Ningún enfermo.
b. Un enfermo.
c. Dos enfermos.
d. Al menos dos enfermos.
e. Más de dos enfermos.
7. Un libro de 1.000 páginas contiene 1.500 erratas distribuidas aleatoriamente. Abierto el libro por
una página cualquiera se observa el número de erratas encontradas llamándole X.
Se pide:
a. Ley de probabilidad de X.
b. Esperanza matemática y desviación típica.
c. P(X > 2).
d. P(X ≤ 3).
8. La Compañía de Seguros de Vida ARSA después de costosos estudios y por dilatada experiencia ha
determinado que 1 de cada 5.000 personas fallecen anualmente por accidente laboral. La Compañía
ARSA tiene hechos 50.000 seguros de vida de este tipo en toda la nación teniendo que abonar a los
afectados por cada póliza 5.000 €.
Se pide:
¿Cuál es la probabilidad de que la compañía ARSA tenga que pagar en un año por lo menos 60.000
euros por conceptos de primas a los familiares de los asegurados?
ENM Matemáticas II Estadística 44
Distribución uniforme
Definición.- Se dice que una v.a. X tiene distribución uniforme en [a, b] y se denota por X œ U[a, b]
si su función de densidad es:
1 si x c [a, b]
f(x) = b − a
0 si x " [a, b]
t(b − a)
2. Esperanza matemática: m = E[X] = a + b .
2
(b − a ) 2
3. Varianza: s2 = .
12
Distribución gamma
Definición.- Se dice que una v.a. X tiene distribución gamma de parámetros p > 0 y a > 0, y se denota
por X œ g(p, a), si su función de densidad es:
a p x p−1 e −ax
si x > 0
f(x) = (p)
0 en otro caso
Distribución exponencial
Definición.- Se dice que una v.a. X tiene distribución exponencial de parámetro a > 0, y se denota
por X œ E(a), si su función de densidad es:
ae −ax si x > 0
f(x) =
0 en otro caso
3. Varianza: s2 = 12 .
a
Distribución normal
La distribución normal fue utilizada por primera vez en 1.753 por De Moivre, pero no tuvo continuidad
hasta el siglo XIX en que Gauss y Laplace la volvieron a actualizar, es por ello por lo que se conoce
también la distribución normal con el nombre de distribución de Gauss-Laplace.
Se creyó que en la práctica la mayor parte de las distribuciones eran de este tipo y se le puso el nombre
de distribución normal, llamándole a las restantes distribuciones anormales.
Definición.- Una v.a. X, tiene distribución normal de parámetros µ y σ y se denota por X œ N(µ, σ),
si su función de densidad es:
x− 2
f(x) = 1 e − 12
2
X 1 + ... + X n
5. Si X1 œ N(m, s), ..., Xn œ N(m, s) son indep., fl X = n œ N , .
n
ENM Matemáticas II Estadística 46
5. Puntos de inflexión en ! , 1
2e
6. Asíntotas: El eje OX es una asíntota horizontal.
7. Crecimiento y decrecimiento: Crece en (-∞, µ), y decrece en (µ, +∞).
8. Trazado de la gráfica de f(x):
µ−σ µ µ+σ
Tablas
Tabla de la función de distribución de una variable Z Œ N(0, 1). La tabla que vamos a ver, al final
del tema, nos da el valor de F(z) con z ¥ 0 (área encerrada por f, el eje OX, la recta x = z y -¶).
z x2
F(z) = P(Z [ z) = 1 ¶ −∞ e − 2 dx
2
−∞ 0 z +∞
Conocidos los valores de esta tabla es inmediato conocer cualquier probabilidad en una distribución
normal.
ENM Matemáticas II Estadística 47
Tipificación
Si queremos calcular una probabilidad en una distribución N(µ, σ), como las probabilidades
correspondientes a N(0, 1) están tabuladas, pasamos de la N(µ, σ) a la N(0, 1), efectuando el cambio de
variable
X−
Z= .
Otro uso de la tipificación de una variables es el siguiente: Si dos grupos de alumnos son calificados
por distintos profesores, pueden compararse sus calificaciones si tipificamos ambas calificaciones.
Análoga a la aplicación anterior es la siguiente: Si se sabe que un hombre mide 1,73 m y pesa 80 kg.,
¿se puede decir si es más alto que gordo? Si se tipifican las dos series de tallas y pesos de que forman
parte estos datos y resulta que la talla corresponde a 0,91 y el peso a 1,2 podemos decir que es más grueso
que alto.
Cuanto mayor sea n y p más próximo a 0,5 tanto mejor es la aproximación. En la práctica, la
aproximación es muy buena si tanto np como nq son mayores que 5.
Distribución c2 de Pearson
Definición.- Dadas las variables X1, X2, ..., Xn œ N(0, 1) e independientes, se llama variable c2 de
Pearson con n grados de libertad a la definida por
Propiedades de la distribución c2
Distribución t de Student
Definición.- Dadas las variables X, X1, X2, ..., Xn œ N(0, s) e independientes, se llama variable t de
Student a la definida por:
T= X
n
1
n i=1
X 2i
−(n+1 )/2
((n + 1 )/2 ) 2
Se denota por T œ tn. Su función de densidad es: f(t) = 1 + tn .
n (1/2 )
Propiedades de la t de Student
Distribución F de Snedecor
Definición.- Dadas las variables X1, X2, ..., Xm, Y1, Y2, ..., Yn œ N(0, 1) e independientes, se llama
variable F de Snedecor con (m, n) grados de libertad a la variable aleatoria definida por:
m
1
m X 2i
F=
i=1
n
1
n
i=1
Y 2i
Propiedades de la F de Snedecor
Ejercicios propuestos
1. La media de las calificaciones obtenidas en un test de aptitud por los alumnos de un centro fue 400
y desviación típica 100. Si las calificaciones siguen una distribución normal, calcular:
a. ¿Que % de alumnos obtuvieron calificación superior a 500 puntos?
b. ¿Que % de alumnos obtuvieron calificación superior a 300 puntos?
c. ¿Que % de alumnos obtuvieron calificación comprendida entre 300 y 500 puntos?
d. ¿Cuál es la probabilidad de que elegido un alumno al azar, su calificación difiera de la media en
menos de 150 puntos?
2. Las puntuaciones obtenidas por los 300 niños de un Colegio al aplicarles un test de aptitud
numérica, sigue una distribución normal de media 24 y desviación típica 4. Calcular:
a. El cuartil inferior y el cuartil superior.
b. ¿Cuál es la probabilidad de obtener puntuación igual o inferior a 16?
c. ¿Cuántos niños de dicho Colegio tienen igual o mayor puntuación que 26?
3. Se sabe que la concentración media de NH3 en sangre venosa de individuos normales de una
población normal es de 110 microgramos por mililitro y que la concentración de NH3 del 99% de
los individuos se encuentra comprendida entre 85 y 135 microgramos por mililitro. Se pide:
Calcular los límites del intervalo (centrado en µ) que contiene al 70% de los valores de dicha
población normal.
4. El peso de los quesos fabricados por una Industria del ramo, se distribuye normalmente. Se han
fabricado 4.000 piezas en un mes, de las cuales 800 pesaron menos de 1 kg. y 1.000 pesaron más de
2 kg. Determinar la media y la desviación típica de la distribución normal.
Si se consideran suspensos los que han obtenido menos de 5, ¿cuántos suspensos ha habido?
6. En el ingreso a una Escuela Universitaria se aplica una batería de test, siendo su distribución
normal de media 35,5 y desviación típica 8. El Gabinete Psicotécnico de la Escuela Universitaria
decide que el 12 % superior sea orientado hacia otras Carreras de rango superior y el 35% inferior
lo sea hacia otras Carreras de rango inferior. Los alumnos presentados han sido 1.000. Se pide:
a. ¿Cuál será la puntuación que decide las situaciones de los alumnos presentados?
b. ¿Cuántos alumnos ingresarán en dicha Escuela Universitaria?
7. Consideremos una población formada por los alumnos de primero de una Escuela Universitaria de
Ingeniería. Por estudios realizados se ha llegado a la conclusión de que la probabilidad de aprobar
Álgebra es 0,4. El número de alumnos presentados es 900 y designamos por X el número de
alumnos aprobados.
a. Probabilidad de que el número de alumnos esté comprendido entre 340 y 370.
b. Determinar un intervalo [a, b], simétrico respecto a la media, tal que P(a < X < b) = 0,95.
ENM Matemáticas II Estadística 50
DISTRIBUCIÓN EN EL MUESTREO
Introducción
Descripción. Dada una población cualquiera, consideremos todas las muestras de tamaño n que
pueden extraerse aleatoriamente con reemplazamiento (muestreo aleatorio simple). Para cada muestra,
podemos calcular un estadístico (tal como la media, la varianza, la proporción, la mediana, etc.) que varía
de muestra a muestra. De esta manera obtenemos una distribución del estadístico que se llama su
distribución de muestreo.
Consideremos el conjunto de todas las muestras posibles de tamaño n de una población de media µ y
desviación típica por σ.
Las medias, x 1 , x 2 , x 3 , ..., de las distintas muestras, constituyen una v.a. que representamos por X .
Propiedades de X
2
1. E[X] = m. 2 [X] = n .
2. Si la población es N(m, s) con s conocida X c N , .
n
X−
3. Si la población es N(m, s) con s desconocida c t n−1 (S desviación típica de la muestra).
S/ n − 1
Las varianzas, s12, s22, s32, ..., de las distintas muestras, constituyen una v.a. que representamos por S2.
Propiedades de S2
1. E[S2] = n − 1 2
n .
2
2. Si la población en N(m, s), entonces: nS2 c % 2n−1 .
ENM Matemáticas II Estadística 52
Supongamos que hemos obtenido una muestra de n elementos de una población N(m1, s1) y otra
muestra de m elementos de una población N(m2, s2).
mn
m + n X1 − X2
c t n+m−2
nS 21 + mS 22
m+n−2
Teorema (De Lévy-Lindeberg).- Sea {Xn} una sucesión de v.a. independientes e idénticamente
n
distribuidas y sea S n = X i . Si Xn tienen media y varianza finitas, entonces:
i=1
S n − E[S n ]
d N(0, 1)
[S n ]
X 1 + ... + X n
Por tanto: {Sn} Ø N(nm, s n ) y n d N , .
n
Teorema de Tchebycheff
Desigualdad de Tchebycheff.- Sea una v.a. X de media µ y desviación típica σ. Se verifica ∀ k > 0:
P( X − < k ) m 1 − 12
k
P( x − x < k x ) = P x − < k m 1 − 12
n k
2
Tamaño de la muestra. Si ponemos k = , = 12 = 2 tiende a cero cuando n → ∞, luego fijados
n k n
ε y δ positivos arbitrariamente pequeños se puede, tomando n suficientemente grande, lograr que
P( x − m ) [ ó P( x − < ) m 1 −
Ejemplo. Sea una distribución de m desconocida y s2 = 1. ¿Qué tamaño habrá de tener la muestra para
que la probabilidad de que la media diste menos de 0,4 de la media poblacional sea al menos de 0,99?
2
Se tiene: s2 = 1; δ = 0,4; ε = 1 - 0,99 = 0,01, luego n m 2 = 1 = 625.
0, 01 $ 0, 4 2
ENM Matemáticas II Estadística 53
Teorema de Bernoulli
n
Si aplicamos la acotación de Tchebycheff al caso en el que la v.a. X = A (frecuencia relativa del
N
pq
suceso A), y teniendo en cuenta que m = E[X] = p = P(A) y = , se verifica que:
N
nA pq pq
h[ 1 2
N −p m hk N
P [
2N 4N
Dado un número δ > 0, la probabilidad de que el error absoluto que cometemos al tomar como
probabilidad de un suceso su frecuencia relativa, sea mayor que d, tiende a 0 cuando N tiende a ∞.
Por tanto, hay una probabilidad tan próxima a 1 como queramos de que tomando N fijo, pero
suficientemente grande sea
nA
N −p <
Ejercicios propuestos
1. Se tiene una población P formada por tres elementos P = {4, 6, 8}, cuya ley de probabilidad es
X 4 6 8
f 0,4 0,2 0,4
3. Se considera una población N(µ, 2). ¿Qué tamaño habrá de tener una muestra para que la
probabilidad de que la media se diferencie en menos de 0,5 de la media poblacional µ sea al menos
de 0,95?
4. La probabilidad de que un producto esté fuera de uso al año de su fabricación es p = 0,2. De un lote
de 100 productos:
a. ¿Cuál es la probabilidad de que la desviación entre las frecuencias relativas de las apariciones
respecto a la probabilidad media p sea inferior a 0,05?
b. ¿Entre qué límites se encuentra el número de piezas que cumplen estos requisitos?
5. Determinar el número de ensayos que deben realizarse para que la desviación de la frecuencia
relativa de aparición del suceso A respecto a su probabilidad no supere en valor absoluto a 0,02 con
probabilidad 0,99.
ENM Matemáticas II Estadística 55
INTERVALOS DE CONFIANZA
Introducción
Hasta ahora hemos considerado tan sólo la estimación llamada puntual o por punto, según la cual la
estimación de los parámetros o características poblacionales se resuelve mediante un punto o valor único.
La estimación es, de esta forma, concreta; pero, en cambio, no permite tener una mayor o menor
confianza en ella, es decir, no da una medida de la confianza que puede depositarse en el resultado que se
obtiene de la inferencia.
Para resolver esta cuestión se utiliza la llamada estimación por intervalo, que no es sino obtener un
intervalo tal, que haya una determinada probabilidad de que dicho intervalo, llamado intervalo de
confianza, contenga entre sus límites al verdadero valor del parámetro poblacional.
Llamando θ al parámetro poblacional en cuestión, θ*, su estadístico y 1 - α (0 < α < 1), la probabilidad
de que θ quede contenido dentro del intervalo de confianza, el problema se plantea en términos de
encontrar una amplitud 2d del intervalo de confianza, tal que
x − z 2 , x + z 2
n n
X−
Población normal de varianza desconocida. c t n−1 , entonces el intervalo es:
S/ n − 1
x − t 2 s ,x + t s
n−1 2
n−1
Población cualquiera de varianza conocida. Por el teorema central del límite, sabemos que:
x − z 2 , x + z 2
n n
x − t 2 s ,x + t s
n−1 2
n−1
2
Población N(m, s). Como ns2 c % 2n−1 , el intervalo viene dado por:
ns 2 , ns 2
% 2 % 21−
2 2
21 22 21 22
x 1 − x 2 − z 2 n 1 + n 2 , x 1 − x 2 + z 2 n1 + n2
n1 + n2 n 1 s 21 + n 2 s 22 n1 + n2 n 1 s 21 + n 2 s 22
x 1 − x 2 − t 2 , x 1 − x 2 + t 2
n1n2 n1 + n2 − 2 n1n2 n1 + n2 − 2
Tamaño de muestra
Calcularemos el tamaño de la muestra para el intervalo que estima la media poblacional, puesto que el
método es siempre el mismo.
x − z 2 , x + z 2
n n
z 2 y, por tanto, la amplitud del intervalo. Fijemos un cierto valor para 1 - α que sea aceptable al fin
práctico que perseguimos, entonces tomando n convenientemente, podemos reducir la amplitud del
intervalo de confianza. No hay que olvidar que aumentar el tamaño de la muestra eleva el coste de la
experiencia.
Si queremos que nuestro intervalo tenga una amplitud menor o igual que h, se ha de verificar que:
2
[ h e n m 2z 2
2z
2
n h
Ejemplo. Para una población con varianza 100, determinar el mínimo número de individuos de una
muestra para que la amplitud del intervalo sea menor o igual que 0.5, tomando como coeficiente de
confianza 95 %.
2
2 $ 1, 96 $ 10
n= = 6.146, 56
0, 5
ENM Matemáticas II Estadística 58
CONTRASTES DE HIPÓTESIS
En la práctica nos vemos obligados a tomar decisiones relativas a una población sobre la base de
información proveniente de muestras. Tales decisiones se llaman decisiones estadísticas. Por ejemplo,
podemos querer decidir, basados en datos muestrales, si un método pedagógico es mejor que otro, o si una
moneda está trucada o no.
Hipótesis estadísticas
Al intentar alcanzar una decisión, es útil hacer hipótesis sobre la población implicada. Tales hipótesis,
que pueden ser o no ciertas, se llaman hipótesis estadísticas. Son en general, enunciados acerca de las
distribuciones de probabilidad de las poblaciones.
Hipótesis nula. En muchos casos formulamos una hipótesis estadística con el único propósito de
rechazarla o invalidarla. Así, si queremos decidir si una moneda está trucada, formulamos la hipótesis de
que la moneda es buena. Análogamente si deseamos decidir si un procedimiento es mejor que otro,
formulamos la hipótesis de que no hay diferencia entre ellos. Tales hipótesis se suelen llamar hipótesis
nula y se denota por H0.
Hipótesis alternativa. Toda hipótesis que difiera de una dada se llamará hipótesis alternativa. Por
ejemplo, si una hipótesis es p = 0.5, hipótesis alternativas podrían ser p = 0.7, p ≠ 0.5 p > 0.5 o p < 0.5.
Una hipótesis alternativa a la hipótesis nula se denotará por H1.
Contraste de hipótesis
Si suponemos que una hipótesis particular es cierta pero vemos que los resultados hallados en una
muestra aleatoria difieren notablemente de los esperados bajo tal hipótesis (o sea, esperados sobre la base
del puro azar), entonces diremos que las diferencias observadas son significativas y nos veríamos
inclinados a rechazar la hipótesis (o al menos a no aceptarla ante la evidencia obtenida). Así si en 20
tiradas de una moneda salen 16 caras, estaríamos inclinados a rechazar la hipótesis de que la moneda es
buena, aunque cabe la posibilidad de equivocarnos.
Los procedimientos que nos capacitan para determinar si las muestras observadas difieren
significativamente de los resultados esperados, y por tanto nos ayudan a decidir si aceptamos o
rechazamos la hipótesis, se llaman contrastes (o tests) de hipótesis.
Si rechazamos una hipótesis cuando debiera ser aceptada, diremos que cometemos un error de tipo I.
Por otra parte, si aceptamos una hipótesis que debiera ser rechazada, diremos que se ha cometido un error
de tipo II. En ambos casos se ha producido un juicio erróneo.
V F
H0 A R
H0 R (I) A (II)
ENM Matemáticas II Estadística 59
Para que las reglas de decisión (o contrastes de hipótesis) sean buenas, deben diseñarse de modo que
minimicen los errores de la decisión. Y no es una cuestión sencilla, porque para cualquier tamaño de la
muestra, un intento de disminuir un tipo de error suele ir acompañado de un crecimiento del otro tipo. En
la práctica, un tipo de error puede ser más grave que el otro, y debe alcanzarse un compromiso que
disminuya el error más grave. La única forma de disminuir ambos a la vez es aumentar el tamaño de la
muestra, lo que no siempre es posible.
Nivel de significación
Al contrastar una cierta hipótesis, la máxima probabilidad con la que estamos dispuestos a correr el
riesgo de cometer un error del tipo I se llama nivel de significación (α) del contraste.
α = P(Rechazar H0 / H0 es verdadera)
Se especifica antes de tomar la muestra, de manera que los resultados no influyan en nuestra elección.
En la práctica, es frecuente tomar α = 5% o α = 1%. Si, por ejemplo, se escoge α = 5% al diseñar una
regla de decisión, entonces hay 5 oportunidades de 100 de rechazar la hipótesis cuando debería haberse
aceptado; es decir, tenemos un 95% de confianza de que hemos adoptado la decisión correcta. En tal caso
decimos que la hipótesis ha sido rechazada al nivel de significación 5%, lo cual quiere decir que la
hipótesis tiene una probabilidad de 0.05 de ser falsa.
Contraste paramétrico
Como se ve en la figura, podemos tener 1-α de confianza de que si la hipótesis es verdadera, entonces el
valor de z para un estadístico muestral S verificará que |z| ≤ z 2 en la figura 1, z ≤ zα en la figura 2 y z ≥ - zα
en la figura 3. Sin embargo, si al escoger una sola muestra al azar hallamos que el valor de z de su
estadístico está fuera de ese rango, debemos concluir que el suceso podría ocurrir con una probabilidad de
sólo α si la hipótesis fuera cierta. Diremos entonces que z difiere de forma significativa de lo que sería de
esperar bajo la hipótesis, y nos veríamos empujados a rechazar la hipótesis.
A cualquiera de los conjuntos {z / |z| > z 2 }, {z / z > zα} y {z / z < -zα} se llama región crítica; y a
cualquiera de los conjuntos {z / |z| ≤ z 2 }, {z / z ≤ zα} y {z / z ≥ -zα} se llama región de aceptación.
CONTRASTES ESPECIALES. Para grandes muestras (n > 30) las distribuciones de muestreo de
muchos estadísticos son distribuciones normales o casi normales, y los contrastes anteriores pueden
aplicarse a los z correspondientes.
ENM Matemáticas II Estadística 60
Contraste de la media
H0 : µ = µ0
H1 : µ ≠ µ0
x − 0
En este caso S = X, µs = x = µ0 y σs = x = y la región de aceptación: [ z 2
n
n
Si H0 : µ = µ0
H1 : µ < µ0
x − 0
la región de aceptación: m −z
n
Si H0 : µ = µ0
H1 : µ > µ0
x − 0
la región de aceptación: [ z
n
Contraste de la proporción
H0 : p = p 0
H1 : p ≠ p 0
nA
n
En este caso S = nA , µs = p = p0 y σs =
pq n − p0 [ z
n y la región de aceptación: pq 2
n
Si H0 : p = p 0
H1 : p < p 0
nA
− p0
la región de aceptación: n m −z
pq
n
Si H0 : p = p 0
H1 : p > p 0
nA
− p0
la región de aceptación: n [ z.
pq
n
Ejemplo. De una población N(µ, 0,09) se obtiene una muestra de tamaño n = 100 de mediax = 1, 70.
Se desea contrastar la hipótesis
H0: µ = 1,68
frente a la hipótesis H1: µ ≠ 1,68
a un nivel de significación del 0,05.
1, 70 − 1, 68
= 2, 2 > z 2 = 1, 96
0, 09
100
H0: µ = 150
frente a la hipótesis H1: µ > 150
Para ello, se toma una muestra de la población N(µ, 15) de tamaño 36 y cuyo valor medio x = 155
Realizarlo para a) α = 0,05 y b) α = 0,01.
Solución. Primero calculamos zα: P(Ζ ≤ zα) = 1 - α; si α = 0,05 ⇒ zα = 1,65 y si α = 0,05 ⇒ zα = 2,5
Por tanto, para α = 0,05, se rechaza la hipótesis H0 de que µ = 150 y para α = 0,01, se acepta la hipótesis
H0 de que µ = 150
Ejercicios propuestos
1. Una empresa se dedica a la fabricación de bombillas eléctricas siguiendo la duración media una
distribución N(µ; 100). Elegida una muestra aleatoria de 64 bombillas se comprobó que su duración
media era de 1.470 horas. Se pide contrastar y decidir entre las dos hipótesis
H0: µ = 1.500
H1: µ ≠ 1.500
con un nivel de significación a) del 5% y b) del 1%.
2. Se desea determinar la proporción de familias que poseen frigoríficos. Para ello, se considera una
muestra de tamaño 400 y se observa el número de los que lo poseen, resultando 215. ¿Tiene más
del 50% de la población frigorífico?
3. a) Determinar el número de ensayos que deben realizarse para que la desviación de la frecuencia
relativa de aparición del suceso A respecto a su probabilidad no supere en valor absoluto a 0,02 con
probabilidad 0,98.
b) Para determinar si un pescado es o no apto para el consumo por su contenido en Hg (mercurio),
se realizan 35 valoraciones obteniendo una media de 0.44 ppm (partes por millón) de Hg, y una
desviación típica de 0.08 ppm. Calcular los límites de confianza para la media, a un nivel de
significación α = 0.1.
c) Hemos lanzado un dado 100 veces y hemos obtenido 20 veces el número 6. ¿Está trucado el
dado?
4. a) Se desea saber cuál debe ser el tamaño muestral mínimo de una muestra para poder realizar la
estimación de la tasa media de glucosa plasmática de una determinada población, con un nivel de
confianza 95% y pretendiendo una precisión de 2,5 mg. Nota: En una muestra previa de tamaño 40
se obtuvo una desviación típica de 10 mg.
b) Leemos en una revista médica que la cuarta parte de los cancerosos de cierto tumor de estómago
presentan vómitos, con una precisión o tolerancia del 10% y con una confianza del 99%. ¿Con
cuántos pacientes se ha realizado el estudio?
c) Tras repetidas experiencias se admite que el método A) para curar una cierta enfermedad da un
20% de éxitos. Se ensaya un nuevo método B) en una muestra aleatoria de 50 individuos de los
cuales se curan 16. ¿Se puede decir que este resultado es significativo?.