Estimación Puntual y Por Intervalo
Estimación Puntual y Por Intervalo
Estimación Puntual y Por Intervalo
ESTIMACIÓN DE PARÁMETROS
En el tema anterior se señaló que una muestra aleatoria de la distribución de una población
es útil para realizar inferencias acerca de la población.
Tal como muestra la siguiente figura, dos problemas importantes en la inferencia
estadística son la estimación de parámetros y las pruebas de hipótesis.
Estimación
Puntual
Inferencia
Estadística
Pruebas de
Hipótesis
1. El problema de la estimación
a) Se tiene una característica de interés representada por una variable aleatoria X, cuya
distribución (función de densidad de probabilidad si la variable aleatoria es continua
o función de distribución de probabilidad si la variable aleatoria es discreta), 𝑓𝑋(𝑥),
representa la población de la característica de interés.
Por ejemplo,
1
Estimación de parámetros
Rubén Medinaceli Ortiz
σ2
𝑋 (𝐶𝑎𝑟𝑎𝑐𝑡𝑒𝑟í𝑠𝑡𝑖𝑐𝑎 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟é𝑠)
µ
Por ejemplo,
𝒇𝑿(𝒙)
σ2
2
Estimación de parámetros
Rubén Medinaceli Ortiz
Por ejemplo,
Se tiene la siguiente población:
𝒇𝑿(𝒙)
Distribución normal
σ2
3
Estimación de parámetros
Rubén Medinaceli Ortiz
2. Estimación puntual
2.1. Definición
Por ejemplo,
Es un estimador de la media µ; y,
4
Estimación de parámetros
Rubén Medinaceli Ortiz
Momentos poblacionales
𝜇𝑟 = 𝐸[𝑋𝑟]
Nótese que,
𝜇1 = 𝐸[𝑋] = 𝜇
𝜇2 = 𝐸[𝑋2]
Recordando que,
𝑉𝑎𝑟[𝑋] = 𝐸[𝑋2] − 𝜇2
Momentos muestrales
Nótese que,
5
Estimación de parámetros
Rubén Medinaceli Ortiz
𝜇𝑟 = 𝑀𝑟; 𝑟 = 1, 2, 3, ⋯
2.2.2. Ejercicio 1
Problema:
Sea 𝑋1,𝑋2, 𝑋3,⋯ , 𝑋𝑛 una muestra aleatoria de una población que sigue una distribución
normal con media µ y varianza σ2.
𝒇𝑿(𝒙)
Distribución normal
σ2
Solución:
Sistema de ecuaciones:
𝜇1 = 𝑀1
𝜇2 = 𝑀2
Estimador de µ
𝜇1 = 𝑀1
Donde,
6
Estimación de parámetros
Rubén Medinaceli Ortiz
𝜇1 = 𝐸[𝑋] = 𝜇
Por tanto,
Estimador de σ2
𝑉𝑎𝑟[𝑋] = 𝜎2 = 𝜇2 − 𝜇12
𝜇2 = 𝑀2
Esto es,
Por tanto,
Finalmente,
2.2.3. Ejercicio 2
Problema:
Sea 𝑋1,𝑋2, 𝑋3,⋯ , 𝑋𝑛 una muestra aleatoria de una población que sigue una distribución de
Poisson.
7
Estimación de parámetros
Rubén Medinaceli Ortiz
𝑓𝑋(𝑥)
Distribución de Poisson
●
●
●
●
𝐸[𝑋] = 𝜇 = 𝜆
𝐸[𝑋] = 𝜇 = 𝜆 𝑉𝑎𝑟[𝑋]
= 𝜎𝑋2 =
Parámetro: λ
Solución:
𝜇1 = 𝑀1
Donde:
𝜇1 = 𝐸[𝑋] = 𝜆
Por tanto,
̂=𝑿
8
Estimación de parámetros
Rubén Medinaceli Ortiz
2.2.4. Ejercicio 3
Problema:
Sea 𝑋1,𝑋2, 𝑋3,⋯ , 𝑋𝑛 una muestra aleatoria de una población que sigue una distribución
exponencial
𝑓𝑋(𝑥)
Distribución exponencial
1
𝐸[𝑋] = 𝜇 = 𝜆
𝑋1,𝑋2, 𝑋3,⋯ , 𝑋𝑛 (𝑀𝑢𝑒𝑠𝑡𝑟𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑡𝑎𝑚𝑎ñ𝑜 𝑛)
𝑓𝑋(𝑥) = 𝜆𝑒−𝜆𝑥; 𝑥 ≥ 0
Parámetro: λ
Solución:
𝜇1 = 𝑀1
Donde:
9
Estimación de parámetros
Rubén Medinaceli Ortiz
Por tanto,
De donde,
Ahora bien, si se extrae n bolas de billar una tras otra y con reemplazo, la distribución de la
variable aleatoria X definida como el número de bolas negras en la selección efectuada, es
binomial; esto es,
Como muestra, se selecciona tres bolas de billar al azar y con reemplazo y con el resultado
que se obtenga, intentar estimar el parámetro desconocido .
Los posibles resultados y sus probabilidades para cada uno de los dos valores de se
muestran en la siguiente tabla:
X 0 1 2 3
p = 3/4 1/ 64 9/64 27/64 27/64
p = 1/4 27/64 27/64 9/64 1/64
Nótese que si en la muestra (selección de tres bolas de billar una tras otra y con reemplazo)
se obtiene cero (0) o una (1) bola de billar negra, el valor más probable de es ; vale
decir, que en la bolsa hay tres veces más bolas blancas que negras. En cambio, si se obtiene
dos (2) o tres (3) bolas blancas en la muestra, el valor más probable de ; vale decir
que en la bolsa hay tres veces más bolas negras que blancas.
10
Estimación de parámetros
Rubén Medinaceli Ortiz
Y seleccionar como valor estimado aquel valor de 𝑝 que maximice 𝑓𝑋(𝑥). Esto es equivalente
a derivar 𝑓𝑋(𝑥) con respecto a , igualar la derivada a cero (0) y resolver la ecuación
resultante para 𝑝.
Este ejemplo exhibe la base (fundamento) del método de máxima verosimilitud (máxima
probabilidad) para encontrar estimadores, y establece la metodología a seguir.
Para definir los estimadores de máxima verosimilitud, es importante definir primero la función
de verosimilitud.
Sea,
la función de verosimilitud de las variables aleatorias 𝑋1, 𝑋2,⋯ , 𝑋𝑛. Si 𝜃̂ es el valor de que
maximiza 𝐿(𝜃); luego, 𝜽̂ es el estimador de máxima verosimilitud de .
Los casos más importantes que se consideran son aquellos en los que 𝑋1,𝑋2,⋯ , 𝑋𝑛 es una
muestra aleatoria de una población 𝑓𝑋(𝑥; 𝜃), y en consecuencia, la función de verosimilitud
viene dada por,
11
Estimación de parámetros
Rubén Medinaceli Ortiz
También es útil tomar en cuenta que tanto 𝐿(𝜃) como 𝐿𝑛 𝐿(𝜃) tienen su máximo para el
mismo valor de . A veces es más fácil encontrar el máximo del logaritmo natural de la
función de verosimilitud.
2.2.8. Ejercicio 4
Problema:
Sea 𝑋1,𝑋2, ⋯ , 𝑋𝑛 una muestra aleatoria de una población que tiene una distribución de
Bernoulli.
𝑓𝑋 (𝑥)
0 1 𝑋
𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛
𝑓𝑋(𝑥; 𝜃) = 𝑝𝑥𝑞1−𝑥;𝑥 = 0, 1; 𝑞 = 1 − 𝑝
Parámetro:
Solución:
Si se denomina a ∑ 𝑥𝑖
12
Estimación de parámetros
Rubén Medinaceli Ortiz
𝑦𝑞 − 𝑛𝑝 + 𝑦𝑝 = 0
2.2.9. Ejercicio 5
Problema:
Sea 𝑋1,𝑋2, ⋯ , 𝑋𝑛 una muestra aleatoria de una población que tiene una distribución normal
con media µ y varianza σ2.
𝒇𝑿(𝒙)
Distribución normal
σ2 (α)
13
Estimación de parámetros
Rubén Medinaceli Ortiz
Parámetros: α y σ2 (α)
Solución:
14
Estimación de parámetros
Rubén Medinaceli Ortiz
2.2.10. Ejercicio 6
Problema:
Sea 𝑋1,𝑋2, 𝑋3,⋯ , 𝑋𝑛 una muestra aleatoria de una población que sigue una distribución de
Poisson.
𝑓𝑋(𝑥)
●
Distribución de Poisson
●
●
●
●
𝐸[𝑋] = 𝜇 = 𝜆
𝑋1,𝑋2, 𝑋3,⋯ , 𝑋𝑛 (𝑀𝑢𝑒𝑠𝑡𝑟𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑡𝑎𝑚𝑎ñ𝑜 𝑛)
𝐸[𝑋] = 𝜇 = 𝜆 𝑉𝑎𝑟[𝑋]
= 𝜎𝑋2 =
Parámetro: λ
Solución:
15
Estimación de parámetros
Rubén Medinaceli Ortiz
2.2.11. Ejercicio 7
Problema:
Sea 𝑋1,𝑋2, 𝑋3,⋯ , 𝑋𝑛 una muestra aleatoria de una población que sigue una distribución
exponencial
𝑓𝑋(𝑥)
Distribución exponencial
1
𝐸[𝑋] = 𝜇 = 𝜆
𝑋1,𝑋2, 𝑋3,⋯ , 𝑋𝑛 (𝑀𝑢𝑒𝑠𝑡𝑟𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑡𝑎𝑚𝑎ñ𝑜 𝑛)
𝑓𝑋(𝑥) = 𝜆𝑒−𝜆𝑥; 𝑥 ≥ 0
16
Estimación de parámetros
Rubén Medinaceli Ortiz
Parámetro: λ
Solución:
17
Estimación de parámetros
Rubén Medinaceli Ortiz
Se han presentado básicamente dos métodos para obtener estimadores puntuales, tal como
se ha dicho, hay más métodos. Estos métodos obedecen a bases más o menos intuitivas.
La pregunta que ahora surge es: ¿son algunos estimadres mejores, en algún sentido, que
otros?
A continuación se menciona unas cuantas propiedades (de las muchas que existen) que los
estimadores pueden o no tener y que pueden ayudar a decidir si un estimador es mejor que
otro.
𝐸[(𝑇 − 𝜏(𝜃))2]
Se define como el error cuadrático medio del estimador = 𝑡(𝑋1, 𝑋2,⋯ , 𝑋𝑛); el mismo que
se denotará por 𝑀𝑆𝐸𝑡(𝜃).
El error cuadrático medio es una medida útil de la bondad de un estimador 𝑡(𝑋1, 2,⋯ , 𝑋𝑛)
de 𝜏(𝜃), es una medida de la dispersión de los valores de T respecto de
𝜏(𝜃).
Para dos estimadores cualesquiera 𝑇1 = 𝑡1(𝑋1,𝑋2, ⋯ , 𝑋𝑛) y 𝑇2 = 𝑡2(𝑋1,𝑋2, ⋯ , 𝑋𝑛) de 𝜏(𝜃), sus
respectivos errores cuadráticos medios 𝑀𝑆𝐸𝑡1(𝜃) y 𝑀𝑆𝐸𝑡2(𝜃) como funciones de ,
probablemente se crucen tal como se muestra en la siguiente figura; para algunos valores
de , 𝑡1 tiene el menor MSE, y para otros valores de , 𝑡2 tiene el MSE más pequeño; por
tanto, no se tiene base para preferir uno de los estimadores sobre el otro.
𝑀𝑆𝐸𝑡1(𝜃)
18
Estimación de parámetros
Rubén Medinaceli Ortiz
𝑀𝑆𝐸𝑡2(𝜃)
Una razón para no poder encontrar un estimador con un error cuadrático medio
uniformemente más pequeño es que la clase de todos los posibles estimadores es muy
grande. Para evitar esto, se podría restringir la totalidad de los estimadores considerando
solamente aquellos estimadores que satisfacen alguna otra propiedad; tal propiedad es la
denominada estimador insesgado.
El problema de encontrar un estimador insesgado que tenga el error cuadrático medio más
pequeño y uniforme se verá más adelante.
En general,
El término 𝜏(𝜃) − 𝐸[𝑇] recibe el nombre de sesgo del estimador 𝑇 que puede ser positivo,
negativo o igual a cero.
19
Estimación de parámetros
Rubén Medinaceli Ortiz
Luego,
Considere que 𝑋1, 𝑋2,⋯ , 𝑋𝑛 (𝑛 > 2) es una muestra aleatoria de una población que sigue
µuna distribución normal con media µ y varianza σ2.
Se desea estimar µ
𝑇1 = 𝑋1
20
Estimación de parámetros
Rubén Medinaceli Ortiz
Nótese que los tres estimadores son insesgados; en promedio, son iguales al parámetro que
se desea estimar.
Sin embargo, surge la siguiente pregunta: ¿no existirá un otro estimador insesgado de
µ que tenga una menor varianza que 𝑻𝟑?
𝜃 = 𝜇 𝜏(𝜃)
=𝜇
𝜏′(𝜃) = 1
21
Estimación de parámetros
Rubén Medinaceli Ortiz
Por tanto,
Por tanto,
Recordando que,
22
Estimación de parámetros
Rubén Medinaceli Ortiz
Como las estimaciones puntuales rara vez serán iguales a los parámetros que se supone
estiman, es deseable que una estimación puntual esté acompañada por alguna medida del
posible error de estimación.
Por ejemplo, una estimación puntual podría estar acompañada de algún intervalo alrededor
de ella junto con alguna medida de la seguridad de que el valor verdadero del parámetro se
encuentra dentro de dicho intervalo.
Vale decir, en lugar de inferir que el valor verdadero de un parámetro es un punto, se busca
inferir que el valor verdadero de un parámetro está contenido en algún intervalo.
Consecuentemente, se está hablando de la denominada estimación de intervalo.
Sean 𝑇1 = 𝑡1(𝑋1,𝑋2, ⋯ , 𝑋𝑛) y 𝑇2 = 𝑡2(𝑋1, 𝑋2,⋯ , 𝑋𝑛) dos estadísticos tales que 𝑇1 < 𝑇2, para los
cuales,
Luego,
El intervalo aleatorio (𝑇1,𝑇2) recibe el nombre de intervalo de confiabilidad del 100(1 − 𝛼) por
ciento de 𝜏(𝜃); (1 − 𝛼) recibe el nombre de nivel de confiabilidad; 𝑇1 y 𝑇2 reciben el nombre
de límite inferior y límite superior, respectivamente, del intervalo de confiabilidad de
23
Estimación de parámetros
Rubén Medinaceli Ortiz
Nivel de confiabilidad
1-α
α = Nivel de desconfianza
𝑇1 𝑇2
Intervalo de confiabilidad
Es importante señalar que los resultados que se obtienen a continuación son válidos
principalmente para poblaciones que siguen una distribución normal; aunque, en atención
al teorema del límite central, estos resultados pueden ser igualmente válidos para
poblaciones no normales, cuando el tamaño de la muestra aleatoria es grande.
Sea 𝑋1,𝑋2, ⋯ , 𝑋𝑛 una muestra aleatoria de tamaño n de una población que sigue una
distribución normal con media µ y varianza σ2. Esto es:
𝒇𝑿(𝒙)
Distribución normal
σ2
24
Estimación de parámetros
Rubén Medinaceli Ortiz
Recuerde que,
𝑋 ~𝑁(𝜇; 𝜎2)
Nivel de σ2 = 1
Confiabilidad (1 –
α) α/2 α/2
𝑍~𝑁(0; 1)
−𝑧0 µ = 0 𝑧0
En la figura superior se puede observar que:
𝑃[−𝑧0 ≤ 𝑍 ≤ 𝑧0] = 1 − 𝛼
Sin embargo,
Por tanto,
25
Estimación de parámetros
Rubén Medinaceli Ortiz
Multiplicando cada término de esta desigualdad por , restando luego 𝑋 de cada término y
𝜎 𝜎
𝑃 [ 𝑥 − 𝑧0 ≤ 𝜇 ≤ 𝑥 − 𝑧0 ] =1−𝛼
√𝑛 √𝑛
El término representa cuánto difiere la media de la muestra (𝑋) del valor real de la
media (𝜇). Por tanto, esta expresión se puede utilizar para saber cuán grande debe ser la
muestra para asegurar que el error al estimar será menor a una cantidad especificada (𝑒);
esto es:
Con frecuencia se desea estimar la media (𝜇) de una población cuando se desconoce su
varianza (𝜎2) y es imposible obtener una muestra de tamaño 𝑛 ≥ 30. En este caso,
corresponde recurrir al siguiente estadístico deducido en el tema anterior:
𝑋−𝜇
𝑇 = 𝑆 ~ 𝑡𝑛−1
√𝑛
𝒇𝑻(𝒕)
Nivel de
Confiabilidad
(1 – α)
α/2 α/2
𝑇~𝑡𝑛−1
−𝑡0 µ=0 𝑡0
26
Estimación de parámetros
Rubén Medinaceli Ortiz
𝑃[−𝑡0 ≤ 𝑇 ≤ 𝑡0] = 1 − 𝛼
Sin embargo,
Por tanto,
Multiplicando cada término de esta desigualdad por , restando luego 𝑋 de cada término y
multiplicando por -1, se obtiene:
3.2.2. Ejercicio 8
Problema:
Una máquina produce piezas metálicas cilíndricas. Se toma una muestra de 10 piezas de la
producción del día y se procede a medir los diámetros. La siguiente tabla registra los valores
obtenidos:
La especificación técnica señala que para aceptar la producción de un día, la media de los
diámetros de las piezas producidas debe ser igual a 1,00 cm.
27
Estimación de parámetros
Rubén Medinaceli Ortiz
Solución:
𝒇𝑿(𝒙)
En este caso, para obtener un intervalo de confiabilidad del 95% para µ, se recurrirá a la
siguiente expresión:
𝑛
1 1,01 + 0,97 + ⋯ + 1,04
𝑥 = ∑ 𝑥𝑖 = = 1,01 𝑐𝑚
𝑛 10
𝑖=1
𝑛
1 (1,01 − 1,01)2 + (0,97 − 1,01)2 + ⋯ + (1,04 − 1,01)2
𝑠 = √ ∑(𝑥𝑖 − 𝑥)2 = √ = 0,026
𝑛−1 9
𝑖=1
𝒇𝑻(𝒕)
Nivel de
Confiabilidad
28
Estimación de parámetros
Rubén Medinaceli Ortiz
(1 – α)
α/2 0,95 α / 2 = 0,025
𝑇~𝑡𝑛−1~𝑡9
−𝑡0 µ=0 𝑡0 = 2,262 (𝑑𝑒 𝑡𝑎𝑏𝑙𝑎𝑠)
Por tanto,
Finalmente,
𝑷[𝟎, 𝟗𝟗 ≤ 𝝁 ≤ 𝟏, 𝟎𝟑] = 𝟎, 𝟗𝟓
En este caso, la especificación técnica (µ = 1,00 cm) está dentro del intervalo de
confiabilidad. Consecuentemente, la producción del día debe ser aceptada.
Se requiere un estadístico que incluya a σ2. Recuerde que el tema anterior se obtuvo el
siguiente estadístico:
Nótese que la variable aleatoria U que sigue una distribución chi-cuadrada con n – 1 grados
de libertad incluye al parámetro de interés (𝜎2) y a su estimador puntual (𝑆2). Por tanto, 𝑈
es el estadístico requerido.
29
Estimación de parámetros
Rubén Medinaceli Ortiz
𝑓𝑈 (𝑢)
Nivel de
Confiabilidad
𝑃[𝑈𝑖𝑛𝑓 ≤ 𝑈 ≤ 𝑈𝑠𝑢𝑝] = 1 − 𝛼
Sin embargo,
Por tanto,
Dividiendo cada término de la desigualdad por (n – 1)S2 e invirtiendo luego cada término
(con lo cual se cambia el sentido de las desigualdades), se tiene:
(𝑛 − 1)𝑠 2 2
(𝑛 − 1)𝑠 2
𝑃[ ≤𝜎 ≤ ] =1−𝛼
𝑈𝑠𝑢𝑝 𝑈𝑖𝑛𝑓
3.2.4. Ejercicio 9
Problema:
Se ha procedido a medir estaturas (en metros) de algunos jóvenes que han cumplido 16
años en el mes de junio de este año, en la ciudad de Oruro. Los resultados de la medición
se muestran en la siguiente tabla:
30
Estimación de parámetros
Rubén Medinaceli Ortiz
Muestra N° 1 2 3 4 5 6 7 8 9 10 11
Estatura (m) 1,65 1,66 1,67 1,64 1,66 1,65 1,63 1,68 1,64 1,62 1,68
Obtener un intervalo de confiabilidad del 98% para la varianza de las estaturas de jóvenes
de 16 años en la ciudad de Oruro. Asumir una distribución normal para la población de
estaturas.
Solución:
𝒇𝑿(𝒙)
31
Estimación de parámetros
Rubén Medinaceli Ortiz
𝑓𝑈 (𝑢)
Nivel de
Confiabilidad
En muchas ocasiones se hace necesario comparar dos poblaciones 𝑓𝑋(𝑥) y 𝑓𝑌(𝑦) ya sea
en términos de sus medias 𝜇𝑋 y 𝜇𝑌; y/o sus varianzas 𝜎𝑋2 y 𝜎𝑌2.
𝜇𝑋 = 𝜇𝑌 → 𝜇𝑋 − 𝜇𝑌 = 0
𝜇𝑋 < 𝜇𝑌 → 𝜇𝑋 − 𝜇𝑌 < 0
𝜇𝑋 > 𝜇𝑌 → 𝜇𝑋 − 𝜇𝑌 > 0
32
Estimación de parámetros
Rubén Medinaceli Ortiz
𝒇𝑿(𝒙) 𝒇𝒀(𝒚)
σX2
σY
2
µX
µY
𝑋1,𝑋2, ⋯ , 𝑋𝑛
𝑌1, 𝑌2, ⋯ , 𝑌𝑚
Caso A
Estandarizando − 𝑌 se obtiene,
33
Estimación de parámetros
Rubén Medinaceli Ortiz
𝒇𝒁(𝒛)
Nivel de σ2 = 1
Confiabilidad
(1 – α)
α/2 α/2
𝑍~𝑁(0; 1)
−𝑧0 µ=0 𝑧0
𝑃[−𝑧0 ≤ 𝑍 ≤ 𝑧0] = 1 − 𝛼
Sin embargo,
Por tanto,
𝜎𝑋2 𝜎𝑌2
√ +
Multiplicando cada término de la desigualdad por 𝑛 𝑚 , restando luego 𝑋 − 𝑌 de cada
término y multiplicando la desigualdad por -1, se tiene,
34
Estimación de parámetros
Rubén Medinaceli Ortiz
En la práctica, como n ≥ 30 y m ≥ 30, para aplicar esta expresión se sustituye 𝜎𝑋2 𝑦 𝜎𝑌2 por
𝑠𝑋2 𝑦 𝑠𝑌2 respectivamente.
Caso B
Las varianzas poblacionales σX2 y σY2 son desconocidas pero iguales σX2
= σY2 = σ2 (n ˂ 30 y/o m ˂ 30)
Estandarizando − 𝑌 se obtiene,
Por tanto,
Recordando que,
35
Estimación de parámetros
Rubén Medinaceli Ortiz
Donde,
𝑍 ~ 𝑁(0; 1)
𝑊 ~ 𝑋𝑟2
𝒇𝑻(𝒕)
Nivel de
Confiabilidad
(1 – α)
α/2 α/2
𝑇~ 𝑡𝑛+𝑚−2
−𝑡0 µ=0 𝑡0
𝑃[−𝑡0 ≤ 𝑇 ≤ 𝑡0] = 1 − 𝛼
Sin embargo,
Por tanto,
36
Estimación de parámetros
Rubén Medinaceli Ortiz
Caso C
Las varianzas poblacionales σX2 y σY2 son desconocidas y diferentes σX2 ≠ σY2
(n ˂ 30 y/o m ˂ 30)
Donde,
(𝑠𝑛 𝑋2 + 𝑠𝑚𝑌2)2
𝑝= 𝑠𝑋2 )2 (𝑠 𝑚𝑌2) 2
(𝑛
𝑛−1+𝑚−1
𝒇𝑻(𝒕)
37
Estimación de parámetros
Rubén Medinaceli Ortiz
Nivel de
Confiabilidad
(1 – α)
α/2 α/2
𝑇~ 𝑡𝑝
−𝑡0 µ=0 𝑡0
Sin embargo,
Por tanto,
En este caso, las poblaciones no son independientes, mucho menos las muestras de las
mismas, tampoco las varianzas de las poblaciones son necesariamente iguales. Esto ocurre
38
Estimación de parámetros
Rubén Medinaceli Ortiz
si las observaciones en las dos muestras ocurren en pares, de modo que las observaciones
están relacionadas.
Por ejemplo, si se efectúa una prueba de una nueva dieta utilizando 15 personas, los valores
de peso antes y después de la dieta formarán las dos muestras.
Las observaciones en las dos muestras realizadas en la misma persona están relacionadas
y, por consiguiente, forman un par.
Para determinar si la dieta es efectiva, se deben considerar las diferencias 𝑑1, 𝑑2,⋯ , 𝑑𝑛 de
observaciones en pares.
σX2
σY
2
µX
µY
𝑋1,𝑋2, ⋯ , 𝑋𝑛
𝑌1, 𝑌2, ⋯ , 𝑌𝑛
Muestra aleatoria: 𝐷1 = 𝑋1 − 𝑌1,𝐷2 = 𝑋2 − 𝑌2,⋯ , 𝐷𝑛 = 𝑋𝑛 − 𝑌𝑛
Se asume que 𝐷1,𝐷2,⋯ , 𝐷𝑛 es una muestra aleatoria de una población 𝑓𝐷(𝑑) que sigue una
distribución normal con media 𝜇𝐷 = 𝜇𝑋 − 𝜇𝑌 y varianza 𝜎𝐷2.
39
Estimación de parámetros
Rubén Medinaceli Ortiz
Es más,
Estandarizando 𝐷 se tiene,
Consecuentemente,
𝒇𝑻(𝒕)
Nivel de
Confiabilidad
(1 – α)
α/2 α/2
𝑇~ 𝑡𝑝
−𝑡0 µ=0 𝑡0
𝑃[−𝑡0 ≤ 𝑇 ≤ 𝑡0] = 1 − 𝛼
40
Estimación de parámetros
Rubén Medinaceli Ortiz
Sin embargo,
Por tanto,
𝑠𝑑 𝑠𝑑
𝑃 [𝑑 − 𝑡0 ≤ 𝜇𝐷 ≤ 𝑑 − 𝑡0 ] =1−𝛼
√𝑛 √𝑛
41
Estimación de parámetros
Rubén Medinaceli Ortiz
𝒇𝑿(𝒙) 𝒇𝒀(𝒚)
σX2
σY
2
µX
µY
𝑋1,𝑋2, ⋯ , 𝑋𝑛
𝑌1, 𝑌2, ⋯ , 𝑌𝑚
Recordando que,
Cuando,
42
Estimación de parámetros
Rubén Medinaceli Ortiz
Nivel de
Confiabilidad
α/2 1–α α/2
𝐹𝑖𝑛𝑓
𝐹𝑠𝑢𝑝 𝐹 ~ 𝐹𝑚−1;𝑛−1
En la figura superior se puede observar que,
Por tanto,
3.2.8. Ejercicio 10
Problema:
43
Estimación de parámetros
Rubén Medinaceli Ortiz
Se han registrado los tiempos de duración de dos marcas de focos eléctricos: A y B. Una
muestra aleatoria de 40 focos de la marca A mostró una duración promedio igual a 418 horas
de uso continuo y una desviación estándar igual a 26 horas. A su vez, una muestra aleatoria
de 50 focos de la marca B tuvo una duración promedio de 402 horas de funcionamiento
continuo con una desviación estándar igual a 22 horas. Con un nivel de confiabilidad del
95% señalar si, en promedio, las vidas útiles de los focos eléctricos de ambas marcas son
iguales.
Solución:
𝒇𝑿(𝒙) 𝒇𝒀(𝒚)
σX2
σY
2
=
=
µX Vida útil focos marca A en horas
µY Vida útil focos marca B en horas
44
Estimación de parámetros
Rubén Medinaceli Ortiz
Como n > 30 y m > 30 es posible asumir que las varianzas de las muestras son iguales a
las varianzas poblacionales (Caso A). Por tanto, se puede utilizar la siguiente expresión
para obtener un intervalo de confiabilidad para la diferencia de medias.
𝒇𝒁(𝒛)
Nivel de σ2 = 1
Confiabilidad
(1 – α)
α/2 0,95 α / 2 = 0,025
𝑍~𝑁(0; 1)
−𝑧0 µ=0 𝑧0 = 1,96
𝑷[𝟓, 𝟗 ≤ 𝝁𝑿 − 𝝁𝒀 ≤ 𝟐𝟔, 𝟏] = 𝟎, 𝟗𝟓
Con un nivel de confiabilidad del 95% se puede afirmar que (no estando el cero (0) en el
intervalo de confiabilidad) las vidas útiles medias de los focos de las marcas A y B no son
iguales; al contrario, los focos de la marca A tienen mayor vida útil media que los focos de
la marca B.
3.2.9. Ejercicio 11
45
Estimación de parámetros
Rubén Medinaceli Ortiz
Problema:
Para averiguar si un nuevo suero detendrá o no la leucemia, se selecciona nueve (9) ratones
que han alcanzado un estado avanzado de la enfermedad. Cinco ratones reciben el
tratamiento y cuatro no lo reciben. Los tiempos de sobrevivencia, en años, desde que se
inició el experimento, son los siguientes:
Solución:
𝒇𝑿(𝒙) 𝒇𝒀(𝒚)
σX2
σY
2
=
= µX Tiempo de
supervivencia µY
Tiempo de supervivencia
con tratamiento
(años) sin
tratamiento (años)
𝑋1,𝑋2, ⋯ , 𝑋5 (muestra aleatoria) 𝑌1, 𝑌2, ⋯ , 𝑌4 (muestra aleatoria) 𝑥1
= 2,1; 𝑥2 = 5,3; ⋯ ; 𝑥5 = 0,9(realización) 𝑦1 = 1,9;𝑦2 = 0,5;⋯;𝑦4 = 3,1 (realización)
𝑛=5
𝑚=4
46
Estimación de parámetros
Rubén Medinaceli Ortiz
Las muestras son muy pequeñas; por tanto, las varianzas poblacionales 𝜎𝑋2 𝑦 𝜎𝑌2 son
desconocidas. Corresponde averiguar si son iguales; para ello es necesario encontrar un
intervalo de confiabilidad para el cociente de las varianzas poblacionales
𝑓𝐹(.)
Nivel de
Confiabilidad
α/2 1–α α / 2 = 0,05
0,90
1 1
= = = 0,11 𝐹
𝐹𝑖𝑛𝑓
𝐹𝑛−1,𝑚−1 9,12 𝑠𝑢𝑝 =
6,59 𝐹 ~ 𝐹𝑚−1;𝑛−1
Reemplazando valores se tiene,
Finalmente,
Siendo el uno (1) un valor posible para , es factible asumir que las varianzas poblacionales
son iguales. Por tanto, la expresión a utilizarse para obtener un intervalo de confiabilidad
para la diferencia de medias es (Caso B):
47
Estimación de parámetros
Rubén Medinaceli Ortiz
𝒇𝑻(𝒕)
Nivel de
Confiabilidad
(1 – α)
α/2 0,90 α / 2 = 0,05
𝑇~ 𝑡𝑛+𝑚−2~𝑡5+4−2~𝑡7
−𝑡0 µ=0 𝑡0 = 1,895
Por tanto,
Finalmente,
𝑷[−𝟏,𝟑𝟒 ≤ 𝝁𝑿 − 𝝁𝒀 ≤ 𝟐, 𝟗𝟐] = 𝟎, 𝟗𝟎
Con un nivel de confiabilidad del 90% es posible afirmar que estando el cero (0) comprendido
en el intervalo de confiabilidad, las medias poblacionales pueden ser consideradas iguales
y concluir que el nuevo suero no es efectivo.
3.2.10. Ejercicio 12
Problema:
48
Estimación de parámetros
Rubén Medinaceli Ortiz
X = Resistencia (temperatura 250 270 260 265 255 250 260 270
ambiente) (kg/cm2)
Y = Resistencia (a 50°C) (kg/cm2) 255 260 255 265 250 240 245 265
Con un nivel de confiabilidad del 95%, averiguar si la afirmación del investigador es real.
Solución:
Las mediciones de la resistencia a la tracción efectuadas en cada una de las ocho muestras
inicialmente a temperatura ambiente y luego a 50°C de temperatura forman pares.
Para determinar si la afirmación del investigador es real, se deben considerar las diferencias
𝑑1,𝑑2, ⋯ , 𝑑𝑛 de las observaciones en pares.
σX2
σY
2
µX Resistencia a temperatura
ambiente µY Resistencia a 50°C
𝑋1,𝑋2, ⋯ , 𝑋8 𝑌1,𝑌2, ⋯ , 𝑌8
Muestra aleatoria: 𝐷1 = 𝑋1 − 𝑌1,𝐷2 = 𝑋2 − 𝑌2,⋯ , 𝐷8 = 𝑋8 − 𝑌8
xi = Resistencia (temperatura ambiente) 250 270 260 265 255 250 260 270
(kg/cm2)
yi = Resistencia (a 50°C) (kg/cm2) 255 260 255 265 250 240 245 265
di = xi – yi -5 10 5 0 5 10 15 5
49
Estimación de parámetros
Rubén Medinaceli Ortiz
𝑠𝑑 𝑠
𝑃 [𝑑 − 𝑡0 ≤ 𝜇𝐷 ≤ 𝑑 − 𝑡0 𝑑] = 1−𝛼
√𝑛 √𝑛
𝒇𝑻(𝒕)
Nivel de
Confiabilidad
(1 – α)
α/2 0,95 α / 2 = 0,025
𝑇~ 𝑡𝑛−1 ~ 𝑡7
−𝑡0 µ=0 𝑡0 = 2,365
Finalmente,
Con un nivel de confiabilidad del 95% se puede afirmar que no estando el cero (0)
comprendido en el intervalo de confiabilidad, las medias poblacionales no son iguales; al
contrario, 𝜇𝑋 es mayor a 𝜇𝑌. Por tanto, el investigador tiene razón.
50