Estimación Puntual y Por Intervalo Revisado 2022
Estimación Puntual y Por Intervalo Revisado 2022
Estimación Puntual y Por Intervalo Revisado 2022
ESTIMACIÓN DE PARÁMETROS
Tal como muestra la siguiente figura, dos caminos importantes en la inferencia estadística
son la estimación de parámetros y las pruebas de hipótesis.
Estimación
Puntual
Inferencia
Estadística
Pruebas de
Hipótesis
Por ejemplo,
1
Estimación de parámetros Rubén Medinaceli Ortiz
𝝈𝟐
𝑋 (𝐶𝑎𝑟𝑎𝑐𝑡𝑒𝑟í𝑠𝑡𝑖𝑐𝑎 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟é𝑠)
𝝁
Por ejemplo,
𝒇𝑿 (𝒙)
𝝈𝟐
𝑋
𝝁
2
Estimación de parámetros Rubén Medinaceli Ortiz
𝑇1 < 𝑇2
Por ejemplo,
Se tiene la siguiente población:
𝒇𝑿 (𝒙)
Distribución normal
𝝈𝟐
𝑋
𝝁
3
Estimación de parámetros Rubén Medinaceli Ortiz
𝑛
1
𝑇 = 𝑡(𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) = 𝑆2 = ∑(𝑋𝑖 − 𝑋̅)2
𝑛−1
𝑖=1
𝑆
𝑇1 = 𝑡1 (𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) = 𝑋̅ − 2
√𝑛
𝑆
𝑇2 = 𝑡2 (𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) = 𝑋̅ + 2
√𝑛
𝑆 𝑆
𝑃 [𝑋̅ − 2 ≤ 𝜇 ≤ 𝑋̅ + 2 ]=1−𝛼
√𝑛 √𝑛
2. Estimación puntual
2.1. Definición
Por ejemplo,
𝑛
1
𝑋̅ = ∑ 𝑋𝑖
𝑛
𝑖=1
Es un estimador de la media µ; y,
𝑛
1
𝑥̅ = ∑ 𝑥𝑖
𝑛
𝑖=1
4
Estimación de parámetros Rubén Medinaceli Ortiz
• Definir criterios para encontrar el mejor estimador entre los muchos estimadores
posibles.
Momentos poblacionales
𝜇𝑟 = 𝐸[𝑋𝑟 ]
Nótese que,
𝜇1 = 𝐸[𝑋] = 𝜇
𝜇2 = 𝐸[𝑋2 ]
Recordando que,
𝑉𝑎𝑟[𝑋] = 𝐸[𝑋2 ] − 𝜇2
𝑉𝑎𝑟[𝑋] = 𝜇2 − 𝜇12
Momentos muestrales
5
Estimación de parámetros Rubén Medinaceli Ortiz
Nótese que,
𝑛
1
𝑀1 = ∑ 𝑋𝑖 = 𝑋̅
𝑛
𝑖=1
𝜇𝑟 = 𝑀𝑟 ; 𝑟 = 1, 2, 3, ⋯
2.2.2. Ejercicio 1
Problema:
Sea 𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋𝑛 una muestra aleatoria de una población que sigue una distribución
normal con media 𝝁 y varianza 𝝈𝟐 .
𝒇𝑿 (𝒙)
Distribución normal
𝝈𝟐
𝑋
𝝁
Solución:
Sistema de ecuaciones:
𝜇1 = 𝑀1
6
Estimación de parámetros Rubén Medinaceli Ortiz
𝜇2 = 𝑀2
Estimador de µ
𝜇1 = 𝑀1
Donde,
𝜇1 = 𝐸[𝑋] = 𝜇
𝑛
1
𝑀1 = ∑ 𝑋𝑖
𝑛
𝑖=1
Por tanto,
𝒏
𝟏
̅
̂ = ∑ 𝑿𝒊 = 𝑿
𝝁
𝒏
𝒊=𝟏
Estimador de σ2
𝑉𝑎𝑟[𝑋] = 𝜎 2 = 𝜇2 − 𝜇12
𝜇2 = 𝑀2
Esto es,
𝑛
1
𝜇2 = ∑ 𝑋𝑖2
𝑛
𝑖=1
Por tanto,
𝑛
1
𝜎̂ 2 = ∑ 𝑋𝑖2 − 𝜇12
𝑛
𝑖=1
Finalmente,
𝒏
𝟏
̂𝟐
𝝈 ̅𝟐
= ∑ 𝑿𝟐𝒊 − 𝑿
𝒏
𝒊=𝟏
7
Estimación de parámetros Rubén Medinaceli Ortiz
2.2.3. Ejercicio 2
Problema:
Sea 𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋𝑛 una muestra aleatoria de una población que sigue una distribución
de Poisson.
𝑓𝑋 (𝑥)
Distribución de Poisson
●
●
●
●
𝑒 −𝜆 𝜆𝑥
𝑓𝑋 (𝑥) = ; 𝑥 = 0, 1, 2, 3, ⋯
𝑥!
𝐸[𝑋] = 𝜇 = 𝜆
𝑉𝑎𝑟[𝑋] = 𝜎𝑋2 = 𝜆
Parámetro: λ
Solución:
𝜇1 = 𝑀1
Donde:
𝜇1 = 𝐸[𝑋] = 𝜆
𝑛
1
𝑀1 = ∑ 𝑋𝑖 = 𝑋̅
𝑛
𝑖=1
Por tanto,
8
Estimación de parámetros Rubén Medinaceli Ortiz
𝝀̂ = 𝑿
̅
2.2.4. Ejercicio 3
Problema:
Sea 𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋𝑛 una muestra aleatoria de una población que sigue una distribución
exponencial
𝑓𝑋 (𝑥)
Distribución exponencial
𝑓𝑋 (𝑥) = 𝜆𝑒 −𝜆𝑥 ; 𝑥 ≥ 0
1
𝐸[𝑋] = 𝜇 =
𝜆
1
𝑉𝑎𝑟[𝑋] = 𝜎𝑋2 =
𝜆2
Parámetro: λ
Solución:
𝜇1 = 𝑀1
Donde:
1
𝜇1 = 𝐸[𝑋] =
𝜆
9
Estimación de parámetros Rubén Medinaceli Ortiz
𝑛
1
𝑀1 = ∑ 𝑋𝑖 = 𝑋̅
𝑛
𝑖=1
Por tanto,
1̂
= 𝑋̅
𝜆
De donde,
𝟏
𝝀̂ = ̅
𝑿
Ahora bien, si se extrae n bolas de billar una tras otra y con reemplazo, la distribución de la
variable aleatoria X definida como el número de bolas negras en la selección efectuada, es
binomial; esto es,
𝑛
𝑓𝑋 (𝑥) = ( ) 𝑝 𝑥 𝑞 𝑛−𝑥 ; 𝑥 = 0, 1, 2, ⋯ , 𝑛
𝑥
1 3
Donde, 𝑞 = 1 − 𝑝 𝑦 𝑝 es la probabilidad de seleccionar una bola negra. Aquí, 𝑝 = ó 𝑝 =
4 4
Como muestra aleatoria, se selecciona tres bolas de billar al azar y con reemplazo y con el
resultado que se obtenga, intentar estimar el parámetro desconocido 𝑝.
Los posibles resultados y sus probabilidades para cada uno de los dos valores de 𝑝 se
muestran en la siguiente tabla:
X 0 1 2 3
p = 3/4 1/ 64 9/64 27/64 27/64
p = 1/4 27/64 27/64 9/64 1/64
Nótese que si en la muestra (selección de tres bolas de billar una tras otra y con reemplazo)
1
se obtiene cero (0) o una (1) bola de billar negra, el valor más probable de 𝑝 es ; vale
4
decir, que en la bolsa hay tres veces más bolas blancas que negras. En cambio, si se
10
Estimación de parámetros Rubén Medinaceli Ortiz
3
obtiene dos (2) o tres (3) bolas blancas en la muestra, el valor más probable de 𝑝 es ; vale
4
decir que en la bolsa hay tres veces más bolas negras que blancas.
25 6
𝑓𝑋 (𝑥) = ( ) 𝑝 (1 − 𝑝)16 ; 0 ≤ 𝑝 ≤ 1
6
Y seleccionar como valor estimado aquel valor de 𝑝 que maximice 𝑓𝑋 (𝑥). Esto es
equivalente a derivar 𝑓𝑋 (𝑥) con respecto a 𝑝, igualar la derivada a cero (0) y resolver la
ecuación resultante para 𝑝.
Este ejemplo exhibe la base (fundamento) del método de máxima verosimilitud (máxima
probabilidad) para encontrar estimadores, y establece la metodología a seguir.
Sea,
𝐿(𝜃) = 𝐿(𝜃; 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 )
La función de verosimilitud de una población 𝑓𝑋 (𝑥) de la cual se tiene una muestra aleatoria
de tamaño 𝑛, 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛
11
Estimación de parámetros Rubén Medinaceli Ortiz
𝑑𝐿(𝜃)
=0
𝑑𝜃
También es útil recordar que tanto 𝐿(𝜃) como 𝐿𝑛 𝐿(𝜃) tienen su máximo para el mismo valor
de 𝜃.
A veces es más fácil encontrar el valor de 𝜃 que maximiza el logaritmo natural de la función
de verosimilitud.
2.2.8. Ejercicio 4
Problema:
Sea 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 una muestra aleatoria de una población que tiene una distribución de
Bernoulli.
𝑓𝑋 (𝑥)
0 1 𝑋
𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛
𝑓𝑋 (𝑥) = 𝑝 𝑥 𝑞1−𝑥 ; 𝑥 = 0, 1; 𝑞 = 1 − 𝑝
Parámetro: 𝑝
Solución:
12
Estimación de parámetros Rubén Medinaceli Ortiz
Si se denomina 𝑦 a ∑ 𝑥𝑖
𝐿(𝜃; 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) = 𝑝 𝑦 𝑞 𝑛−𝑦
𝐿∗ = 𝐿𝑛 𝐿(𝜃; 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) = 𝑦 𝐿𝑛 𝑝 + (𝑛 − 𝑦) 𝐿𝑛 𝑞
𝜕𝐿∗ 1 1
= 𝑦 − (𝑛 − 𝑦) = 0
𝜕𝑝 𝑝 𝑞
𝑦 𝑛 𝑦
− + =0
𝑝 𝑞 𝑞
𝑦𝑞 − 𝑛𝑝 + 𝑦𝑝
=0
𝑝𝑞
𝑦𝑞 − 𝑛𝑝 + 𝑦𝑝 = 0
𝑦(𝑞 + 𝑝) − 𝑛𝑝 = 0
𝑦 ∑ 𝑥𝑖
𝑝= =
𝑛 𝑛
2.2.9. Ejercicio 5
Problema:
Sea 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 una muestra aleatoria de una población que tiene una distribución normal
con media 𝜇 y varianza 𝜎 2 .
13
Estimación de parámetros Rubén Medinaceli Ortiz
𝒇𝑿 (𝒙)
Distribución normal
𝝈𝟐 (𝛼)
𝑋
𝝁
1 1 2 1 1 2
𝑓𝑋 (𝑥) = 𝑒 − 2𝛼(𝑥−𝜇) = 𝑒 − 2𝛼(𝑥−𝜇) ; −∞ ≤ 𝑥 ≤ ∞
√2𝜋𝜎 √2𝜋𝛼
Parámetros: 𝝁 y σ2 (α)
Solución:
𝑛 𝑛
1 1
− 2𝛼 (𝑥−𝜇)2 1 2 − 1 ∑(𝑥𝑖 −𝜇)2
𝐿(𝜃; 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) = ∏ 𝑒 = ( ) 𝑒 2𝛼
√2𝜋𝛼 2𝜋𝛼
𝑖=1
𝑛 𝑛 1
𝐿∗ = 𝐿𝑛 𝐿(𝜃; 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) = − 𝐿𝑛 2𝜋 − 𝐿𝑛 𝛼 − ∑(𝑥𝑖 − 𝜇)2
2 2 2𝛼
𝜕𝐿∗ 1
= −2 ∑(𝑥𝑖 − 𝜇)(−1) = 0
𝜕𝜇 2𝛼
∑ 𝑥𝑖 − 𝑛𝜇 = 0
𝑛
1
𝜇 = ∑ 𝑥𝑖
𝑛
𝑖=1
14
Estimación de parámetros Rubén Medinaceli Ortiz
𝜕𝐿∗ 𝑛 1 𝛼 −2
=− + ∑(𝑥𝑖 − 𝜇)2 =0
𝜕𝛼 2𝛼 2
𝑛 ∑(𝑥𝑖 − 𝜇)2
− + =0
2𝛼 2𝛼 2
∑(𝑥𝑖 − 𝑋̅)2
𝛼= ; 𝑋̅ 𝑒𝑠 𝑒𝑙 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟 𝑑𝑒 𝑚á𝑥𝑖𝑚𝑎 𝑣𝑒𝑟𝑜𝑠𝑖𝑚𝑖𝑙𝑖𝑡𝑢𝑑 𝑑𝑒 𝜇
𝑛
2.2.10. Ejercicio 6
Problema:
Sea 𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋𝑛 una muestra aleatoria de una población que sigue una distribución
de Poisson.
𝑓𝑋 (𝑥)
Distribución de Poisson
●
●
●
●
𝑒 −𝜆 𝜆𝑥
𝑓𝑋 (𝑥) = ; 𝑥 = 0, 1, 2, 3, ⋯
𝑥!
𝐸[𝑋] = 𝜇 = 𝜆
𝑉𝑎𝑟[𝑋] = 𝜎𝑋2 = 𝜆
15
Estimación de parámetros Rubén Medinaceli Ortiz
Parámetro: λ
Solución:
𝜆∑ 𝑥𝑖 𝑒 −𝑛𝜆
𝐿(𝜃; 𝑋, 𝑋2 , ⋯ , 𝑋𝑛 ) =
𝑥1 ! 𝑥2 ! ⋯ 𝑥𝑛 !
𝐿∗ = 𝐿𝑛 𝐿(𝜃; 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) = ∑ 𝑥𝑖 𝐿𝑛 𝜆 − 𝑛 𝜆 − ∑ 𝐿𝑛 𝑥𝑖 !
𝜕𝐿∗ 1
= ∑ 𝑥𝑖 − 𝑛 = 0
𝜕𝜆 𝜆
𝑛
1
𝜆 = ∑ 𝑥𝑖 = 𝑋̅
𝑛
𝑖=1
2.2.11. Ejercicio 7
Problema:
Sea 𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋𝑛 una muestra aleatoria de una población que sigue una distribución
exponencial.
16
Estimación de parámetros Rubén Medinaceli Ortiz
𝑓𝑋 (𝑥)
Distribución exponencial
𝑓𝑋 (𝑥) = 𝜆𝑒 −𝜆𝑥 ; 𝑥 ≥ 0
1
𝐸[𝑋] = 𝜇 =
𝜆
1
𝑉𝑎𝑟[𝑋] = 𝜎𝑋2 =
𝜆2
Parámetro: λ
Solución:
𝐿∗ = 𝐿𝑛 𝐿(𝜃; 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) = 𝑛 𝐿𝑛 𝜆 − 𝜆 ∑ 𝑥𝑖
𝜕𝐿∗ 1
= 𝑛 − ∑ 𝑥𝑖 = 0
𝜕𝜆 𝜆
1 1
= ∑ 𝑥𝑖
𝜆 𝑛
1
𝜆=
1
∑ 𝑥𝑖
𝑛
17
Estimación de parámetros Rubén Medinaceli Ortiz
𝟏 𝟏
𝝀̂ = =̅
𝟏 𝒏 𝑿
∑ 𝑿
𝒏 𝒊=𝟏 𝒊
Como,
𝜏(𝜃) = √𝜃
𝑛
1
𝜎̂ = √ ∑(𝑋𝑖 − 𝑋̅)2
𝑛
𝑖=1
1
𝜆̂ = ̅
𝑋
La media de una variable aleatoria que sigue una distribución exponencial viene dada por,
1
𝐸[𝑋] = 𝜇 =
𝜆
Por tanto,
1
𝜏(𝜃) =
𝜆
18
Estimación de parámetros Rubén Medinaceli Ortiz
1̂
= 𝑋̅
𝜆
̂
1
= 𝑋̅ 2
𝜆2
Se han presentado básicamente dos métodos para obtener estimadores puntuales, tal
como se ha dicho, hay más métodos. Estos métodos obedecen a bases más o menos
intuitivas. La pregunta que ahora surge es: ¿son algunos estimadores mejores, en algún
sentido, que otros?
Luego,
El error cuadrático medio del estimador 𝑇 = 𝑡(𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ), denotado por 𝐸𝐶𝑀, se define
como,
Nótese que,
19
Estimación de parámetros Rubén Medinaceli Ortiz
menor 𝐸𝐶𝑀, y para otros valores de 𝜃, 𝑇2 tiene el 𝐸𝐶𝑀 más pequeño; consecuentemente,
sería inconsistente recurrir al 𝐸𝐶𝑀 para preferir uno de los estimadores sobre el otro.
𝐸𝐶𝑀1
𝐸𝐶𝑀2
𝐸[𝑇] = 𝐸[𝑡(𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 )] = 𝜃
Sea 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 una muestra aleatoria de una población 𝑓𝑋 (𝑥) que tiene parámetros
desconocidos
Luego,
Por tanto, buscar un estimador con el menor error cuadrático medio entre los estimadores
insesgados es equivalente a buscar el estimador con la menor varianza entre los
estimadores insesgados.
20
Estimación de parámetros Rubén Medinaceli Ortiz
2.3.3.1. Ejercicio
Problema:
Considere que 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 (𝑛 > 2) es una muestra aleatoria de una población que sigue
una distribución normal con media 𝜇 y varianza 𝜎 2 .
Se desea estimar 𝜇
𝑇1 = 𝑋1
𝑋1 + 𝑋𝑛
𝑇2 =
2
∑𝑛𝑖=1 𝑋𝑖
𝑇3 = = 𝑋̅
𝑛
Solución:
𝑋1 + 𝑋𝑛 1 1 1
𝐸[𝑇2 ] = 𝐸 [ ] = 𝐸[𝑋1 + 𝑋2 ] = {𝐸[𝑋1 ] + 𝐸[𝑋2 ]} = {𝜇 + 𝜇} = 𝜇
2 2 2 2
𝑛
1 1 1
𝐸[𝑇3 ] = 𝐸[𝑋̅] = 𝐸 [ ∑ 𝑋𝑖 ] = 𝐸[𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛 ] = {𝐸[𝑋1 ] + 𝐸[𝑋2 ] + ⋯ + 𝐸[𝑋𝑛 ]}
𝑛 𝑛 𝑛
𝑖=1
1
𝐸[𝑇3 ] = {𝜇 + 𝜇 + ⋯ + 𝜇} = 𝜇
𝑛
Nótese que los tres estimadores son insesgados; vale decir, en promedio son iguales al
parámetro que se desea estimar.
𝑋1 + 𝑋𝑛 1 1 1 𝜎2
𝑉𝑎𝑟[𝑇2 ] = 𝑉𝑎𝑟 [ ] = 𝑉𝑎𝑟[𝑋1 + 𝑋2 ] = {𝑉𝑎𝑟[𝑋1 ] + 𝑉𝑎𝑟[𝑋2 ]} = {𝜎 2 + 𝜎 2 } =
2 4 4 4 2
21
Estimación de parámetros Rubén Medinaceli Ortiz
𝑛
1 1
𝑉𝑎𝑟[𝑇3 ] = 𝑉𝑎𝑟[𝑋̅] = 𝑉𝑎𝑟 [ ∑ 𝑋𝑖 ] = 2 𝑉𝑎𝑟[𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛 ]
𝑛 𝑛
𝑖=1
1 1 2 2 + ⋯ + 𝜎2} =
1 2 =
𝜎2
𝑉𝑎𝑟[𝑇3 ] = {𝑉𝑎𝑟[𝑋1 ] + 𝑉𝑎𝑟[𝑋2 ] + ⋯ + 𝑉𝑎𝑟[𝑋𝑛 ]} = {𝜎 + 𝜎 𝑛𝜎
𝑛2 𝑛2 𝑛2 𝑛
Si 𝑛 > 2;
𝑻𝟑 es el estimador insesgado que tiene la menor varianza; por tanto, entre los tres
estimadores propuestos, es el mejor estimador de 𝝁.
[𝜏′(𝜃)]
𝑉𝑎𝑟[𝑇] ≥ 2
𝜕
𝑛𝐸 [{ 𝑙𝑛𝑓𝑋 (𝑥)} ]
𝜕𝜃
2.3.4. Ejercicio
Problema:
Solución:
𝜃=𝜇
𝜏(𝜃) = 𝜇
𝜏 ′ (𝜃) = 1
22
Estimación de parámetros Rubén Medinaceli Ortiz
1 1 𝑥−𝜇 2
− 2( 𝜎 )
𝑓𝑋 (𝑥) = 𝑒
√2𝜋𝜎
1 𝑥−𝜇 2
𝐿𝑛 𝑓𝑋 (𝑥) = −𝐿𝑛 (√2𝜋𝜎) − ( )
2 𝜎
𝜕 𝑥−𝜇 1
𝐿𝑛 𝑓𝑋 (𝑥; 𝜃) = ( )
𝜕𝜇 𝜎 𝜎
2
𝜕 1 𝑥−𝜇 2 1 𝑥−𝜇 2
𝑛𝐸 [( 𝐿𝑛 𝑓𝑋 (𝑥; 𝜃)) ] = 𝑛𝐸 [{ ( )} ] = 𝑛 2 𝐸 [( ) ]
𝜕𝜇 𝜎 𝜎 𝜎 𝜎
𝑥−𝜇
𝑍= ~𝑁(0,1)
𝜎
𝑥−𝜇
𝐸[𝑍] = 𝐸 [ ]=0
𝜎
𝑥−𝜇 2
𝑉𝑎𝑟[𝑍] = 𝐸[(𝑍 − 𝜇𝑍 )2 ] = 𝐸[(𝑍 − 0)2 ] = 𝐸[𝑍 2 ] = 𝐸 [( ) ]=1
𝜎
Por tanto,
2
𝜕 𝑛
𝑛𝐸 [( 𝐿𝑛 𝑓𝑋 (𝑥; 𝜃)) ] = 2
𝜕𝜇 𝜎
Por tanto,
[𝜏′(𝜃)] 1 𝜎2
2 = 𝑛 =
𝜕 𝑛
𝑛𝐸 [{ 𝑙𝑛𝑓𝑋 (𝑥; 𝜃)} ] 𝜎 2
𝜕𝜃
𝜎2
𝑉𝑎𝑟[𝑇3 ] ≥
𝑛
Recordando que,
𝜎2
𝑉𝑎𝑟[𝑇3 ] =
𝑛
23
Estimación de parámetros Rubén Medinaceli Ortiz
𝒏
𝟏
̅=
𝑻𝟑 = 𝑿 ∑ 𝑿𝒊
𝒏
𝒊=𝟏
En otras palabras,
𝒏
𝟏
̅=
𝑻𝟑 = 𝑿 ∑ 𝑿𝒊
𝒏
𝒊=𝟏
Es el mejor estimador de 𝜇.
Como las estimaciones puntuales rara vez serán iguales a los parámetros que se supone
estiman, es deseable que una estimación puntual esté acompañada por alguna medida del
posible error de estimación.
Por ejemplo, una estimación puntual podría estar acompañada de algún intervalo alrededor
de ella junto con alguna medida de la seguridad de que el valor verdadero del parámetro
se encuentra dentro de dicho intervalo.
Vale decir, en lugar de inferir que el valor verdadero de un parámetro es un punto, se busca
inferir la probabilidad que el valor verdadero de un parámetro esté contenido en algún
intervalo. Consecuentemente, se está hablando de la denominada estimación de
intervalo.
Donde:
24
Estimación de parámetros Rubén Medinaceli Ortiz
𝛼 = Nivel de desconfianza
Vale decir,
1−𝛼+𝛼 =1
Nivel de confiabilidad
1-α
𝛼 𝛼
2 2
𝑇1 𝑇2 Estadístico
𝜃
Intervalo de confiabilidad
Es importante señalar que los resultados que se obtienen a continuación son válidos
principalmente para poblaciones que siguen una distribución normal; aunque, en atención
al teorema del límite central, estos resultados pueden ser igualmente válidos para
poblaciones no normales, cuando el tamaño de la muestra aleatoria es grande.
Sea 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 una muestra aleatoria de tamaño n de una población que sigue una
distribución normal con media µ y varianza σ2. Esto es:
25
Estimación de parámetros Rubén Medinaceli Ortiz
𝒇𝑿 (𝒙)
Distribución normal
σ2
𝑋
µ
Es la media de la muestra; y,
𝑛
1
𝑆2 = ∑(𝑋𝑖 − 𝑋̅)2
𝑛−1
𝑖=1
Es la varianza de la muestra.
𝜎2
𝑋̅ ~𝑁(𝜇; )
𝑛
𝑋̅ − 𝜇
𝑍= 𝜎 ~ 𝑁(0; 1)
√𝑛
26
Estimación de parámetros Rubén Medinaceli Ortiz
𝒇𝒁 (𝒛)
Nivel de σ2 = 1
Confiabilidad
(1 – α)
α/2 α/2
𝑍~𝑁(0; 1)
−𝑧0 µ=0 𝑧0
𝑃[−𝑧0 ≤ 𝑍 ≤ 𝑧0 ] = 1 − 𝛼
Sin embargo,
𝑋̅ − 𝜇
𝑍= 𝜎
√𝑛
Por tanto,
𝑋̅ − 𝜇
𝑃 [−𝑧0 ≤ 𝜎 ≤ 𝑧0 ] = 1 − 𝛼
√𝑛
𝜎
Multiplicando cada término de esta desigualdad por se tiene que,
√𝑛
𝜎 𝜎
𝑃 [−𝑧0 ≤ 𝑋̅ − 𝜇 ≤ 𝑧0 ]=1−𝛼
√𝑛 √𝑛
𝜎 𝜎
𝑃 [−𝑋̅ − 𝑧0 ≤ −𝜇 ≤ −𝑋̅ + 𝑧0 ]=1−𝛼
√𝑛 √𝑛
𝜎 𝜎
𝑃 [𝑋̅ + 𝑧0 ≥ 𝜇 ≥ 𝑋̅ − 𝑧0 ]= 1−𝛼
√𝑛 √𝑛
27
Estimación de parámetros Rubén Medinaceli Ortiz
𝜎 𝜎
𝑃 [𝑥̅ − 𝑧0 ≤ 𝜇 ≤ 𝑥̅ + 𝑧0 ]=1−𝛼
√𝑛 √𝑛
𝑧0 𝜎 2
𝑛=( )
𝑒
Con frecuencia se desea estimar la media (𝜇) de una población cuando se desconoce su
varianza (𝜎 2 ) y es imposible obtener una muestra de tamaño 𝑛 ≥ 30.
Recuerde que,
𝑍
𝑇= ~ 𝑡𝑛
√𝑈
𝑛
Donde,
𝑍 ~ 𝑁(0,1)
𝑈 ~ 𝑿𝟐𝒏
𝑋̅ − 𝜇
𝑍= 𝜎 ~ 𝑁(0,1)
√𝑛
Y además que,
(𝑛 − 1)𝑆 2
𝑈= ~ 𝑿𝟐𝒏−𝟏
𝜎2
Por tanto,
𝑋̅ − 𝜇
𝜎
𝑇= √𝑛 ~ 𝑡𝑛−1
(𝑛 − 1)𝑆 2
√ 𝜎2
𝑛−1
En otras palabras,
28
Estimación de parámetros Rubén Medinaceli Ortiz
𝑋̅ − 𝜇
𝑇= ~ 𝑡𝑛−1
𝑆
√𝑛
𝒇𝑻 (𝒕)
Nivel de
Confiabilidad
(1 – α)
α/2 α/2
𝑇~𝑡𝑛−1
−𝑡0 µ=0 𝑡0
𝑃[−𝑡0 ≤ 𝑇 ≤ 𝑡0 ] = 1 − 𝛼
Sin embargo,
𝑋̅ − 𝜇
𝑇=
𝑆
√𝑛
Por tanto,
𝑋̅ − 𝜇
𝑃 [−𝑡0 ≤ ≤ 𝑡0 ] = 1 − 𝛼
𝑆
√𝑛
𝑆
Multiplicando cada término de esta desigualdad por , restando luego 𝑋̅ de cada término,
√𝑛
multiplicando toda la desigualdad por -1 y ordenando la desigualdad, se obtiene:
𝑆 𝑆
𝑃 [𝑋̅ − 𝑡0 ≤ 𝜇 ≤ 𝑋̅ + 𝑡0 ]=1−𝛼
√𝑛 √𝑛
𝑠 𝑠
𝑃 [𝑥̅ − 𝑡0 ≤ 𝜇 ≤ 𝑥̅ + 𝑡0 ]=1−𝛼
√𝑛 √𝑛
29
Estimación de parámetros Rubén Medinaceli Ortiz
Esta expresión puede utilizarse para obtener un intervalo de confiabilidad para la media 𝜇
de una población normal cuando 𝑛 < 30.
3.2.2. Ejercicio 8
Problema:
Una máquina produce piezas metálicas cilíndricas. Se toma una muestra de 10 piezas de
la producción del día y se procede a medir los diámetros. La siguiente tabla registra los
valores obtenidos:
La especificación técnica señala que para aceptar la producción de un día, la media de los
diámetros de las piezas producidas debe ser igual a 1,00 cm.
Solución:
𝒇𝑿 (𝒙)
En este caso, para obtener un intervalo de confiabilidad del 95% para µ, se recurrirá a la
siguiente expresión:
𝑠 𝑠
𝑃 [𝑥̅ − 𝑡0 ≤ 𝜇 ≤ 𝑥̅ + 𝑡0 ]=1−𝛼
√𝑛 √𝑛
𝑛
1 1,01 + 0,97 + ⋯ + 1,04
𝑥̅ = ∑ 𝑥𝑖 = = 1,01 𝑐𝑚
𝑛 10
𝑖=1
30
Estimación de parámetros Rubén Medinaceli Ortiz
𝑛
1 (1,01 − 1,01)2 + (0,97 − 1,01)2 + ⋯ + (1,04 − 1,01)2
𝑠=√ ∑(𝑥𝑖 − 𝑥̅ )2 = √ = 0,026
𝑛−1 9
𝑖=1
𝒇𝑻 (𝒕)
Nivel de
Confiabilidad
(1 – α)
α/2 0,95 α / 2 = 0,025
𝑇~𝑡𝑛−1 ~𝑡9
−𝑡0 µ=0 𝑡0 = 2,262 (𝑑𝑒 𝑡𝑎𝑏𝑙𝑎𝑠)
𝑠 2,262(0,026)
𝑡0 = = 0,02
√𝑛 √10
Por tanto,
Finalmente,
𝑷[𝟎, 𝟗𝟗 ≤ 𝝁 ≤ 𝟏, 𝟎𝟑] = 𝟎, 𝟗𝟓
En este caso, la especificación técnica (µ = 1,00 cm) está dentro del intervalo de
confiabilidad. Consecuentemente, la producción del día debe ser aceptada.
Se requiere un estadístico que incluya a σ2. Recuerde que el tema anterior se obtuvo el
siguiente estadístico:
(𝑛 − 1)𝑆 2 2
𝑈= ~ 𝑋𝑛−1
𝜎2
31
Estimación de parámetros Rubén Medinaceli Ortiz
Nótese que la variable aleatoria U que sigue una distribución chi-cuadrada con n – 1 grados
de libertad incluye al parámetro de interés (𝜎 2 ) y a su estimador puntual (𝑆 2 ). Por tanto,
𝑈 es el estadístico requerido.
𝑓𝑈 (𝑢)
Nivel de
Confiabilidad
2
𝑈𝑖𝑛𝑓 𝑈𝑠𝑢𝑝 𝑈 ~ 𝑋𝑛−1
𝑃[𝑈𝑖𝑛𝑓 ≤ 𝑈 ≤ 𝑈𝑠𝑢𝑝 ] = 1 − 𝛼
Sin embargo,
(𝑛 − 1)𝑆 2
𝑈=
𝜎2
Por tanto,
(𝑛 − 1)𝑆 2
𝑃 [𝑈𝑖𝑛𝑓 ≤ ≤ 𝑈𝑠𝑢𝑝 ] = 1−𝛼
𝜎2
Dividiendo cada término de la desigualdad por (n – 1)S2 e invirtiendo luego cada término
(con lo cual se cambia el sentido de las desigualdades), se tiene:
(𝑛 − 1)𝑆 2 (𝑛 − 1)𝑆 2
𝑃[ ≤ 𝜎2 ≤ ]= 1−𝛼
𝑈𝑠𝑢𝑝 𝑈𝑖𝑛𝑓
(𝑛 − 1)𝑠2 2
(𝑛 − 1)𝑠2
𝑃[ ≤𝜎 ≤ ]=1−𝛼
𝑈𝑠𝑢𝑝 𝑈𝑖𝑛𝑓
32
Estimación de parámetros Rubén Medinaceli Ortiz
3.2.4. Ejercicio 9
Problema:
Se ha procedido a medir estaturas (en metros) de algunos jóvenes que han cumplido 16
años en el mes de junio de este año, en la ciudad de Oruro. Los resultados de la medición
se muestran en la siguiente tabla:
Muestra N° 1 2 3 4 5 6 7 8 9 10 11
Estatura (m) 1,65 1,66 1,67 1,64 1,66 1,65 1,63 1,68 1,64 1,62 1,68
Obtener un intervalo de confiabilidad del 98% para la varianza de las estaturas de jóvenes
de 16 años en la ciudad de Oruro. Asumir una distribución normal para la población de
estaturas.
Solución:
𝒇𝑿 (𝒙)
(𝑛 − 1)𝑠2 (𝑛 − 1)𝑠2
𝑃[ ≤ 𝜎2 ≤ ]=1−𝛼
𝑈𝑠𝑢𝑝 𝑈𝑖𝑛𝑓
𝑛
1 1,65 + 1,66 + ⋯ + 1,68
𝑥̅ = ∑ 𝑥𝑖 = = 1,65 𝑚
𝑛 11
𝑖=1
𝑛
1 (1,65 − 1,65)2 + (1,66 − 1,65)2 + ⋯ + (1,68 − 1,65)2
𝑠2 = ∑(𝑥𝑖 − 𝑥̅ )2 = = 0,0004
𝑛−1 10
𝑖=1
33
Estimación de parámetros Rubén Medinaceli Ortiz
𝑓𝑈 (𝑢)
Nivel de
Confiabilidad
2
𝑈𝑖𝑛𝑓 = 2,56 𝑈𝑠𝑢𝑝 = 23,2 𝑈 ~ 𝑋𝑛−1
10(0,0004) 10(0,0004)
𝑃[ ≤ 𝜎2 ≤ ] = 0,98
23,2 2,56
En muchas ocasiones se hace necesario comparar dos poblaciones 𝑓𝑋 (𝑥) y 𝑓𝑌 (𝑦) ya sea
en términos de sus medias 𝜇𝑋 y 𝜇𝑌 ; y/o sus varianzas 𝜎𝑋2 y 𝜎𝑌2 .
𝜇𝑋 = 𝜇𝑌 → 𝜇𝑋 − 𝜇𝑌 = 0
𝜇𝑋 < 𝜇𝑌 → 𝜇𝑋 − 𝜇𝑌 < 0
𝜇𝑋 > 𝜇𝑌 → 𝜇𝑋 − 𝜇𝑌 > 0
34
Estimación de parámetros Rubén Medinaceli Ortiz
𝒇𝑿 (𝒙) 𝒇𝒀 (𝒚)
σX2 σY2
𝑋 𝑌
µX µY
𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 𝑌1 , 𝑌2 , ⋯ , 𝑌𝑚
1 1 𝑚
𝑋̅ = ∑𝑛𝑖=1 𝑋𝑖 𝑌̅ = ∑ 𝑌
𝑛 𝑚 𝑖=1 𝑖
1 1
𝑆𝑋2 = ∑𝑛 (𝑋 − 𝑋̅)2 𝑆𝑌2 = ∑𝑚 (𝑌 − 𝑌̅)2
𝑛−1 𝑖=1 𝑖 𝑚−1 𝑖=1 𝑖
2 2
𝜎 𝜎
𝑋̅ ~ 𝑁(𝜇𝑋 ; 𝑋 ) 𝑌̅ ~ 𝑁(𝜇𝑌 ; 𝑌 )
𝑛 𝑚
2
(𝑛−1)𝑆𝑋 2 (𝑚−1)𝑆𝑌2 2
𝑈= 2 ~ 𝑋𝑛−1 𝑉= ~ 𝑋𝑚−1
𝜎𝑋 𝜎𝑌2
Caso A
𝜎𝑋2 𝜎𝑌2
𝑋̅ − 𝑌̅ ~ 𝑁(𝜇𝑋 − 𝜇𝑌 ; + )
𝑛 𝑚
Estandarizando 𝑋̅ − 𝑌̅ se obtiene,
𝑋̅ − 𝑌̅ − (𝜇𝑋 − 𝜇𝑌 )
𝑍= ~ 𝑁(0; 1)
2 2
√𝜎𝑋 + 𝜎𝑌
𝑛 𝑚
35
Estimación de parámetros Rubén Medinaceli Ortiz
𝒇𝒁 (𝒛)
Nivel de σ2 = 1
Confiabilidad
(1 – α)
α/2 α/2
𝑍~𝑁(0; 1)
−𝑧0 µ=0 𝑧0
𝑃[−𝑧0 ≤ 𝑍 ≤ 𝑧0 ] = 1 − 𝛼
Sin embargo,
𝑋̅ − 𝑌̅ − (𝜇𝑋 − 𝜇𝑌 )
𝑍=
2 2
√𝜎𝑋 + 𝜎𝑌
𝑛 𝑚
Por tanto,
𝑋̅ − 𝑌̅ − (𝜇𝑋 − 𝜇𝑌 )
𝑃 −𝑧0 ≤ ≤ 𝑧0 = 1 − 𝛼
2 2
√𝜎𝑋 + 𝜎𝑌
[ 𝑛 𝑚 ]
2
𝜎𝑋 𝜎𝑌2
Multiplicando cada término de la desigualdad por √ + , restando luego 𝑋̅ − 𝑌̅ de cada
𝑛 𝑚
término y multiplicando la desigualdad por -1, se tiene,
En la práctica, como n ≥ 30 y m ≥ 30, para aplicar esta expresión se sustituye 𝜎𝑋2 𝑦 𝜎𝑌2 por
36
Estimación de parámetros Rubén Medinaceli Ortiz
Caso B
𝜎2 𝜎2
𝑋̅ − 𝑌̅ ~ 𝑁(𝜇𝑋 − 𝜇𝑌 ; + )
𝑛 𝑚
Estandarizando 𝑋̅ − 𝑌̅ se obtiene,
𝑋̅ − 𝑌̅ − (𝜇𝑋 − 𝜇𝑌 )
𝑍= ~ 𝑁(0; 1)
2 2
√𝜎 + 𝜎
𝑛 𝑚
(𝑛 − 1)𝑆𝑋2 2
𝑈= ~ 𝑋𝑛−1
𝜎2
(𝑚 − 1)𝑆𝑌2 2
𝑉= ~ 𝑋𝑚−1
𝜎2
Por tanto,
(𝑛 − 1)𝑆𝑋2 + (𝑚 − 1)𝑆𝑌2 2
𝑈+𝑉 = ~ 𝑋𝑛+𝑚−2
𝜎2
Recordando que,
𝑍
𝑇= ~ 𝑡𝑟
√𝑊
𝑟
Donde,
𝑍 ~ 𝑁(0; 1)
𝑊 ~ 𝑋𝑟2
37
Estimación de parámetros Rubén Medinaceli Ortiz
𝑋̅ − 𝑌̅ − (𝜇𝑋 − 𝜇𝑌 )
2 2
√𝜎 + 𝜎
𝑛 𝑚
𝑇= ~ 𝑡𝑛+𝑚−2
(𝑛 − 1)𝑆𝑋2 + (𝑚 − 1)𝑆𝑌2
√ 𝜎2
𝑛+𝑚−2
𝑋̅ − 𝑌̅ − (𝜇𝑋 − 𝜇𝑌 )
𝑇= ~ 𝑡𝑛+𝑚−2
(𝑛 − 1)𝑆𝑋2 + (𝑚 − 1)𝑆𝑌2
√(1 + 1 ) [ ]
𝑛 𝑚 𝑛+𝑚−2
𝒇𝑻 (𝒕)
Nivel de
Confiabilidad
(1 – α)
α/2 α/2
𝑇~ 𝑡𝑛+𝑚−2
−𝑡0 µ=0 𝑡0
𝑃[−𝑡0 ≤ 𝑇 ≤ 𝑡0 ] = 1 − 𝛼
Sin embargo,
𝑋̅ − 𝑌̅ − (𝜇𝑋 − 𝜇𝑌 )
𝑇=
(𝑛 − 1)𝑆𝑋2 + (𝑚 − 1)𝑆𝑌2
√(1 + 1 ) [ ]
𝑛 𝑚 𝑛+𝑚−2
Por tanto,
𝑋̅ − 𝑌̅ − (𝜇𝑋 − 𝜇𝑌 )
𝑃 −𝑡0 ≤ ≤ 𝑡0 = 1 − 𝛼
(𝑛 − 1)𝑆𝑋2
+ (𝑚 − 1)𝑆𝑌2
√(1 + 1 ) [ ]
𝑛 𝑚 𝑛+𝑚−2
[ ]
38
Estimación de parámetros Rubén Medinaceli Ortiz
1 1 (𝑛 − 1)𝑆𝑋2 + (𝑚 − 1)𝑆𝑌2
̅ ̅
𝑃 [𝑋 − 𝑌 − 𝑡𝑜 √( + ) [ ] ≤ 𝜇𝑋 − 𝜇𝑌
𝑛 𝑚 𝑛+𝑚−2
1 1 (𝑛 − 1)𝑆𝑋2 + (𝑚 − 1)𝑆𝑌2
≤ 𝑋̅ − 𝑌̅ + 𝑡𝑜 √( + ) [ ]] = 1 − 𝛼
𝑛 𝑚 𝑛+𝑚−2
Caso C
𝑋̅ − 𝑌̅ − (𝜇𝑋 − 𝜇𝑌 )
𝑇= ~ 𝑡𝑝
2 2
√𝑆𝑋 + 𝑆𝑌
𝑛 𝑚
Donde,
2
𝑠2 𝑠2
( 𝑋 + 𝑌)
𝑛 𝑚
𝑝= 2 2
𝑠2 𝑠2
( 𝑋) ( 𝑌)
𝑛 𝑚
+
𝑛−1 𝑚−1
𝒇𝑻 (𝒕)
Nivel de
Confiabilidad
(1 – α)
α/2 α/2
𝑇~ 𝑡𝑝
−𝑡0 µ=0 𝑡0
𝑃[−𝑡0 ≤ 𝑇 ≤ 𝑡0 ] = 1 − 𝛼
Sin embargo,
𝑋̅ − 𝑌̅ − (𝜇𝑋 − 𝜇𝑌 )
𝑇=
2 2
√𝑆𝑋 + 𝑆𝑌
𝑛 𝑚
Por tanto,
𝑋̅ − 𝑌̅ − (𝜇𝑋 − 𝜇𝑌 )
𝑃 −𝑡0 ≤ ≤ 𝑡0 = 1 − 𝛼
2 2
√𝑆𝑋 + 𝑆𝑌
[ 𝑛 𝑚 ]
En este sentido, se tiene una muestra aleatoria de tamaño 𝑛 de la primera población (esto
es, antes del proceso) y una muestra aleatoria también de tamaño 𝑛 de la segunda
población (esto es, después de proceso). Preferentemente y siempre que sea posible,
ambas muestras aleatorias son medidas sobre las mismas unidades de muestreo; vale
decir, se tienen muestras medidas en pares.
40
Estimación de parámetros Rubén Medinaceli Ortiz
Proceso
Antes Después
𝒇𝑿 (𝒙) 𝒇𝒀 (𝒚)
𝑋 𝑌
𝜇𝑋 𝜇𝑌
𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 𝑌1 , 𝑌2 , ⋯ , 𝑌𝑛
𝐷=𝑋−𝑌
Una población que sigue una distribución normal con media 𝜇𝐷 = 𝜇𝑋 − 𝜇𝑌 y varianza 𝜎𝐷2 .
41
Estimación de parámetros Rubén Medinaceli Ortiz
𝒇𝑫 (𝒅)
𝜎𝐷2
𝐷 =𝑋−𝑌
𝜇𝐷 = 𝜇𝑋 − 𝜇𝑦
Muestra aleatoria: 𝐷1 = 𝑋1 − 𝑌1 , 𝐷2 = 𝑋2 − 𝑌2 , ⋯ , 𝐷𝑛 = 𝑋𝑛 − 𝑌𝑛
Realización: 𝑑1 = 𝑥1 − 𝑦1 , 𝑑2 = 𝑥2 − 𝑦2 , ⋯ , 𝑑𝑛 = 𝑥𝑛 − 𝑦𝑛
̅ ; donde,
El mejor estimador (insesgado y de varianza mínima) de 𝜇𝐷 es 𝐷
𝑛
1
̅ = ∑ 𝐷𝑖
𝐷
𝑛
𝑖=1
Es más,
𝜎𝐷2
̅ ~ 𝑁(𝜇𝐷 ;
𝐷 )
𝑛
̅ se tiene,
Estandarizando 𝐷
̅ − 𝜇𝐷
𝐷
𝑍= 𝜎𝐷 ~ 𝑁(0,1)
√𝑛
(𝑛 − 1)𝜎𝐷2 2
𝑈= ~ 𝑋𝑛−1
𝑆𝐷2
Consecuentemente,
42
Estimación de parámetros Rubén Medinaceli Ortiz
̅ − 𝜇𝐷
𝐷
𝜎𝐷
√𝑛 ̅ − 𝜇𝐷
𝐷
𝑇= = ~ 𝑡𝑛−1
𝑆𝐷
(𝑛 − 1)𝜎𝐷2
√𝑛
√ 𝑆𝐷2
𝑛−1
𝒇𝑻 (𝒕)
Nivel de
Confiabilidad
(1 – α)
α/2 α/2
𝑇~ 𝑡𝑛−1
−𝑡0 µ=0 𝑡0
𝑃[−𝑡0 ≤ 𝑇 ≤ 𝑡0 ] = 1 − 𝛼
Sin embargo,
̅ − 𝜇𝐷
𝐷
𝑇=
𝑆𝐷
√𝑛
Por tanto,
̅ − 𝜇𝐷
𝐷
𝑃 [−𝑡0 ≤ ≤ 𝑡0 ] = 1 − 𝛼
𝑆𝐷
√𝑛
𝑆𝐷 𝑆𝐷2
̅ − 𝑡0
𝑃 [𝐷 ̅ − 𝑡0
≤ 𝜇𝐷 ≤ 𝐷 ]=1−𝛼
√𝑛 √𝑛
43
Estimación de parámetros Rubén Medinaceli Ortiz
𝑠𝑑 𝑠𝑑
𝑃 [𝑑̅ − 𝑡0 ≤ 𝜇𝐷 ≤ 𝑑̅ − 𝑡0 ]= 1−𝛼
√𝑛 √𝑛
2
𝜎𝑋
𝜎𝑋2 < 𝜎𝑌2 → <1
𝜎𝑌2
2
𝜎𝑋
𝜎𝑋2 > 𝜎𝑌2 → >1
𝜎𝑌2
𝒇𝑿 (𝒙) 𝒇𝒀 (𝒚)
𝑋 𝑌
𝜇𝑋 𝜇𝑌
𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 𝑌1 , 𝑌2 , ⋯ , 𝑌𝑛
1 1 𝑚
𝑋̅ = ∑𝑛𝑖=1 𝑋𝑖 𝑌̅ = ∑ 𝑌
𝑛 𝑚 𝑖=1 𝑖
1 1
𝑆𝑋2 = ∑𝑛 (𝑋 − 𝑋̅)2 𝑆𝑌2 = ∑𝑚 (𝑌 − 𝑌̅)2
𝑛−1 𝑖=1 𝑖 𝑚−1 𝑖=1 𝑖
2
(𝑛−1)𝑆𝑋 2 (𝑚−1)𝑆𝑌2 2
𝑈= 2 ~ 𝑋𝑛−1 𝑉= ~ 𝑋𝑚−1
𝜎𝑋 𝜎𝑌2
44
Estimación de parámetros Rubén Medinaceli Ortiz
Recordando que,
𝑈
𝐹= 𝑚 ~ 𝐹𝑚;𝑛
𝑉
𝑛
Cuando,
2 y 𝑉 ~ 𝑋2
𝑈 ~ 𝑋𝑚 𝑛
(𝑚 − 1)𝑆𝑌2
𝜎𝑌2
𝐹 = 𝑚 − 1 2 ~ 𝐹𝑚−1;𝑛−1
(𝑛 − 1)𝑆𝑋
𝜎𝑋2
𝑛−1
𝜎𝑋2 𝑆𝑌2
𝐹= ~ 𝐹𝑚−1;𝑛−1
𝜎𝑌2 𝑆𝑋2
Nivel de
Confiabilidad
α/2 1–α α/2
𝑃[𝐹𝑖𝑛𝑓 ≤ 𝐹 ≤ 𝐹𝑠𝑢𝑝 ] = 1 − 𝛼
Sin embargo,
𝜎𝑋2 𝑆𝑌2
𝐹=
𝜎𝑌2 𝑆𝑋2
45
Estimación de parámetros Rubén Medinaceli Ortiz
Por tanto,
𝜎𝑋2 𝑆𝑌2
𝑃 [𝐹𝑖𝑛𝑓 ≤ ≤ 𝐹𝑠𝑢𝑝 ] = 1 − 𝛼
𝜎𝑌2 𝑆𝑋2
3.2.8. Ejercicio 10
Problema:
Se han registrado los tiempos de duración de dos marcas de focos eléctricos: A y B. Una
muestra aleatoria de 40 focos de la marca A mostró una duración promedio igual a 418
horas de uso continuo y una desviación estándar igual a 26 horas. A su vez, una muestra
aleatoria de 50 focos de la marca B tuvo una duración promedio de 402 horas de
funcionamiento continuo con una desviación estándar igual a 22 horas. Con un nivel de
confiabilidad del 95% señalar si, en promedio, las vidas útiles de los focos eléctricos de
ambas marcas son iguales.
46
Estimación de parámetros Rubén Medinaceli Ortiz
Solución:
𝒇𝑿 (𝒙) 𝒇𝒀 (𝒚)
σX2 σY2
𝑋= 𝑌=
µX Vida útil focos marca A en horas µY Vida útil focos marca B en horas
Como n > 30 y m > 30 es posible asumir que las varianzas de las muestras son iguales a
las varianzas poblacionales (Caso A). Por tanto, se puede utilizar la siguiente expresión
para obtener un intervalo de confiabilidad para la diferencia de medias.
𝒇𝒁 (𝒛)
Nivel de σ2 = 1
Confiabilidad
(1 – α)
α/2 0,95 α / 2 = 0,025
𝑍~𝑁(0; 1)
−𝑧0 µ=0 𝑧0 = 1,96
47
Estimación de parámetros Rubén Medinaceli Ortiz
𝑷[𝟓, 𝟗 ≤ 𝝁𝑿 − 𝝁𝒀 ≤ 𝟐𝟔, 𝟏] = 𝟎, 𝟗𝟓
Con un nivel de confiabilidad del 95% se puede afirmar que (no estando el cero (0) en el
intervalo de confiabilidad obtenido) las vidas útiles medias de los focos de las marcas A y
B no son iguales; al contrario, los focos de la marca A tienen mayor vida útil media que los
focos de la marca B.
3.2.9. Ejercicio 11
Problema:
Tiempo de sobrevivencia con tratamiento (años) 2,1 5,3 1,4 4,6 0,9
Tiempo de sobrevivencia sin tratamiento (años) 1,9 0,5 2,8 3,1
Solución:
𝒇𝑿 (𝒙) 𝒇𝒀 (𝒚)
σX2 σY2
𝑋= 𝑌=
µX Tiempo de supervivencia µY Tiempo de supervivencia
con tratamiento (años) sin tratamiento (años)
48
Estimación de parámetros Rubén Medinaceli Ortiz
1
𝑥̅ = (2,1 + 5,3 + ⋯ + 0,9) = 2,86 𝑎ñ𝑜𝑠
5
1
𝑠𝑋2 = {(2,1 − 2,86)2 + (5,3 − 2,86)2 + ⋯ + (0,9 − 2,86)2 } = 3,88 𝑎ñ𝑜𝑠2
4
1
𝑦̅ = (1,9 + 0,5 + ⋯ + 3,1) = 2,07 𝑎ñ𝑜𝑠
4
1
𝑠𝑌2 = {(1,9 − 2,07)2 + (0,5 − 2,07)2 + ⋯ + (3,1 − 2,07)2 } = 1,36 𝑎ñ𝑜𝑠2
3
𝑛=5
𝑚=4
Las muestras son muy pequeñas; por tanto, las varianzas poblacionales 𝜎𝑋2 𝑦 𝜎𝑌2 son
desconocidas. Corresponde averiguar si son iguales; para ello es necesario encontrar un
2
𝜎𝑋
intervalo de confiabilidad para el cociente de las varianzas poblacionales
𝜎𝑌2
𝑓𝐹(.)
Nivel de
Confiabilidad
α/2 1–α α / 2 = 0,05
0,90
1 1
𝐹𝑖𝑛𝑓 = = = 0,11 𝐹𝑠𝑢𝑝 = 6,59 𝐹 ~ 𝐹𝑚−1;𝑛−1
𝐹𝑛−1,𝑚−1 9,12
Finalmente,
49
Estimación de parámetros Rubén Medinaceli Ortiz
𝝈𝟐𝑿
𝑷 [𝟎, 𝟑𝟏 ≤ ≤ 𝟏𝟖, 𝟖𝟎] = 𝟎, 𝟗𝟎
𝝈𝟐𝒀
2
𝜎𝑋
Siendo el uno (1) un valor posible para , es factible asumir que las varianzas
𝜎𝑌2
poblacionales son iguales. Por tanto, la expresión a utilizarse para obtener un intervalo de
confiabilidad para la diferencia de medias es (Caso B):
𝒇𝑻 (𝒕)
Nivel de
Confiabilidad
(1 – α)
α/2 0,90 α / 2 = 0,05
Por tanto,
Finalmente,
𝑷[−𝟏, 𝟑𝟒 ≤ 𝝁𝑿 − 𝝁𝒀 ≤ 𝟐, 𝟗𝟐] = 𝟎, 𝟗𝟎
Con un nivel de confiabilidad del 90% es posible afirmar que estando el cero (0)
comprendido en el intervalo de confiabilidad, las medias poblacionales pueden ser
consideradas iguales y concluir que el nuevo suero no es efectivo.
50
Estimación de parámetros Rubén Medinaceli Ortiz
3.2.10. Ejercicio 12
Problema:
X = Resistencia (temperatura ambiente) (kg/cm2) 250 270 260 265 255 250 260 270
Y = Resistencia (a 50°C) (kg/cm2) 255 260 255 265 250 240 245 265
Con un nivel de confiabilidad del 95%, averiguar si la afirmación del investigador es real.
Solución:
Las mediciones de la resistencia a la tracción efectuadas en cada una de las ocho muestras
inicialmente a temperatura ambiente y luego a 50°C de temperatura forman pares.
Para determinar si la afirmación del investigador es real, se deben considerar las diferencias
𝑑1 , 𝑑2 , ⋯ , 𝑑𝑛 de las observaciones en pares.
𝒇𝑿 (𝒙) 𝒇𝒀 (𝒚)
σX2 σY2
𝑋 𝑌
µX Resistencia a temperatura ambiente µY Resistencia a 50°C
𝑋1 , 𝑋2 , ⋯ , 𝑋8 𝑌1 , 𝑌2 , ⋯ , 𝑌8
Muestra aleatoria: 𝐷1 = 𝑋1 − 𝑌1 , 𝐷2 = 𝑋2 − 𝑌2 , ⋯ , 𝐷8 = 𝑋8 − 𝑌8
Realización: 𝑑1 = 𝑥1 − 𝑦1 , 𝑑2 = 𝑥2 − 𝑦2 , ⋯ , 𝑑8 = 𝑥8 − 𝑦8
51
Estimación de parámetros Rubén Medinaceli Ortiz
xi = Resistencia (temperatura ambiente) (kg/cm2) 250 270 260 265 255 250 260 270
yi = Resistencia (a 50°C) (kg/cm2) 255 260 255 265 250 240 245 265
di = xi – yi -5 10 5 0 5 10 15 5
1
𝑑̅ = (−5 + 10 + 5 + ⋯ + 5) = 5,625
8
1
𝑠𝑑2 = {(−5 − 5,625)2 + (10 − 5,625)2 + ⋯ + (5 − 5,625)2 } = 38,839
7
𝑠𝑑 𝑠𝑑
𝑃 [𝑑̅ − 𝑡0 ≤ 𝜇𝐷 ≤ 𝑑̅ − 𝑡0 ]= 1−𝛼
√𝑛 √𝑛
𝒇𝑻 (𝒕)
Nivel de
Confiabilidad
(1 – α)
α/2 0,95 α / 2 = 0,025
𝑇~ 𝑡𝑛−1 ~ 𝑡7
−𝑡0 µ=0 𝑡0 = 2,365
6,232 6,232
𝑃 [5,625 − 2,365 ≤ 𝜇𝐷 ≤ 5,625 + 2,365 ] = 0,95
√8 √8
Finalmente,
Con un nivel de confiabilidad del 95% se puede afirmar que no estando el cero (0)
comprendido en el intervalo de confiabilidad, las medias poblacionales no son iguales; al
contrario, 𝜇𝑋 es mayor a 𝜇𝑌 . Por tanto, el investigador tiene razón.
52
Estimación de parámetros Rubén Medinaceli Ortiz
Ejercicios propuestos
1. Sea 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 una muestra aleatoria de una población que sigue una distribución
uniforme en el intervalo (a, b). Encontrar los estimadores de a y b utilizando el
método de los momentos.
2. Sea 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 una muestra aleatoria de una población cuya función de densidad
de probabilidad viene dada por:
𝑓𝑋 (𝑥; 𝜃) = 𝜃𝑋𝜃−1 ; 0 ≤ 𝑥 ≤ 1
3. Un restaurant vegetariano afirma que una nueva dieta reducirá el peso de una
persona en 4,5 kg en promedio, en un periodo de dos semanas. Los pesos de siete
(7) damas fueron registrados antes y después de la dieta.
Peso antes de la dieta (kg) 58,5 60,3 61,7 69,0 64,0 62,6 56,7
Peso después de la dieta (kg) 60,0 54,9 58,1 62,1 58,5 59,9 54,4
Con un nivel de confiabilidad del 90% averiguar si la oferta del restaurant es real.
A 15 20 16 18 18 19 20 16 18 20 21 23
B 12 14 13 17 13 12 10 11 17 16
53