Estimación de Intervalos de Confiabilidad - Revisado

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 33

Estimación de parámetros Rubén Medinaceli Ortiz

ESTIMACIÓN DE INTERVALOS DE CONFIABILIDAD

Tal como muestra la siguiente figura, dos caminos importantes en la inferencia estadística
son la estimación de parámetros y las pruebas de hipótesis.

Estimación
Puntual

Estimación de Estimación por


Parámetros intervalos

Inferencia
Estadística

Pruebas de
Hipótesis

En este tema se analizará la estimación de parámetros como una herramienta de la


inferencia estadística.

1. El problema de la estimación de parámetros

a) Se tiene una característica de interés representada por una variable aleatoria X,


cuya distribución, 𝑓𝑋 (𝑥), representa la población de la característica de interés.

b) Se asume que se conoce la forma de la distribución de la población, 𝑓𝑋 (𝑥), (Normal,


exponencial, uniforme, Poisson, etc.); sin embargo, la distribución 𝑓𝑋 (𝑥) contiene un
conjunto 𝜃 de parámetros desconocidos.

Por ejemplo,

1
Estimación de parámetros Rubén Medinaceli Ortiz

𝒇𝑿 (𝒙) (𝑃𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑐𝑎𝑟𝑎𝑐𝑡𝑒𝑟í𝑠𝑡𝑖𝑐𝑎 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟é𝑠)

𝝈𝟐

𝑋 (𝐶𝑎𝑟𝑎𝑐𝑡𝑒𝑟í𝑠𝑡𝑖𝑐𝑎 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟é𝑠)
𝝁

La forma de la distribución de la población es conocida, en este caso es normal; vale decir,


la variable aleatoria 𝑿 sigue una distribución normal.

Sin embargo, contiene un conjunto 𝜽 = {𝝁; 𝝈𝟐 } de parámetros desconocidos. También


se utilizará el término 𝜃 para hacer referencia a alguno de los parámetros desconocidos de
la población.

c) Se asume que se tiene al menos una realización ( 𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑛 ) de una muestra


aleatoria de tamaño 𝑛, (𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋𝑛 ), de la población.

Por ejemplo,

𝒇𝑿 (𝒙)

𝝈𝟐

𝑋
𝝁

𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋𝑛 (𝑀𝑢𝑒𝑠𝑡𝑟𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑡𝑎𝑚𝑎ñ𝑜 𝑛)

𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑛 (𝑅𝑒𝑎𝑙𝑖𝑧𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎)

d) Tomando como base la muestra aleatoria de tamaño 𝑛 y su realización, se desea


estimar (asignar valores numéricos) cada uno de los parámetros que incluye el
conjunto de parámetros desconocidos, 𝜽.

2
Estimación de parámetros Rubén Medinaceli Ortiz

La estimación de los parámetros desconocidos de una población se puede efectuar de dos


maneras:

a) Una estimación puntual referida a definir un estadístico (un estadístico es una


variable aleatoria que es función solo de variables aleatorias observables o
medibles), por ejemplo, 𝑇 = 𝑡(𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ), que estime el valor real del parámetro
desconocido.

b) Una estimación por intervalos referida a definir dos estadísticos 𝑇1 =


𝑡1 (𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) y 𝑇2 = 𝑡2 (𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) tales que:

𝑇1 < 𝑇2

De tal forma que 𝑇1 = 𝑡1 (𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) y 𝑇2 = 𝑡2 (𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) definen un intervalo


que, con cierta probabilidad contiene al valor real del parámetro desconocido.
Por ejemplo,
Se tiene la siguiente población:
𝒇𝑿 (𝒙)

Distribución normal

𝝈𝟐

𝑋
𝝁

𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋𝑛 (𝑀𝑢𝑒𝑠𝑡𝑟𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑡𝑎𝑚𝑎ñ𝑜 𝑛)

𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑛 (𝑅𝑒𝑎𝑙𝑖𝑧𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎)

Forma de la distribución de la población, 𝑓𝑋 (𝑥): Normal (conocida)


Parámetros desconocidos: 𝜽 = {𝝁; 𝝈𝟐 }

Posible estimador puntual del parámetro 𝝁:


𝑛
1
𝑇 = 𝑡(𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) = 𝑋̅ = ∑ 𝑋𝑖
𝑛
𝑖=1

Posible estimador puntual del parámetro 𝝈𝟐 :


𝑛
1
𝑇 = 𝑡(𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) = 𝑆2 = ∑(𝑋𝑖 − 𝑋̅)2
𝑛−1
𝑖=1

3
Estimación de parámetros Rubén Medinaceli Ortiz

Posible estimador por intervalos del parámetro 𝝁:

𝑆
𝑇1 = 𝑡1 (𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) = 𝑋̅ − 2
√𝑛

𝑆
𝑇2 = 𝑡2 (𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) = 𝑋̅ + 2
√𝑛

𝑆 𝑆
𝑃 [𝑋̅ − 2 ≤ 𝜇 ≤ 𝑋̅ + 2 ]=1−𝛼
√𝑛 √𝑛

A continuación, se presentan algunos elementos relacionados con la estimación puntual;


posteriormente, se presentarán elementos relacionados con la estimación por intervalos.

2. Estimación de intervalos de confiabilidad

Como las estimaciones puntuales rara vez serán iguales a los parámetros que se supone
estiman, es deseable que una estimación puntual esté acompañada por alguna medida del
posible error de estimación.

Por ejemplo, una estimación puntual podría estar acompañada de algún intervalo alrededor
de ella junto con alguna medida de la seguridad de que el valor verdadero del parámetro
se encuentra dentro de dicho intervalo.

Vale decir, en lugar de inferir que el valor verdadero de un parámetro es un punto, se busca
inferir que el valor verdadero de un parámetro está contenido en algún intervalo.
Consecuentemente, se está hablando de la denominada estimación de intervalo.

Al igual que en la estimación puntual, el problema de la estimación de intervalo es doble.


Primero, se tiene el problema de encontrar estimadores de intervalo; y, segundo, está el
problema de determinar buenos u óptimos estimadores de intervalo.
,
3.1. Intervalo de confiabilidad

Sea 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 una muestra aleatoria de una población 𝑓𝑋 (𝑥).

Sean 𝑇1 = 𝑡1 (𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) y 𝑇2 = 𝑡2 (𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) dos estadísticos tales que 𝑇1 < 𝑇2 .

Un intervalo de confiabilidad para el parámetro 𝜃, viene dado por,

𝑃[𝑇1 < 𝜃 < 𝑇2 ] = 1 − 𝛼

Donde:

𝑇1 = Límite inferior del intervalo


𝑇2 = Límite superior del intervalo
𝜃 = Parámetro
1−𝛼 = Nivel de confiabilidad

4
Estimación de parámetros Rubén Medinaceli Ortiz

𝛼 = Nivel de desconfianza

El nivel de confiabilidad (1 − 𝛼) es el grado de seguridad, certidumbre, confianza que se


tiene acerca de una afirmación estadística. Se mide en términos de probabilidad.

El nivel de desconfianza (𝛼) es el grado de inseguridad, incertidumbre, desconfianza,


asociado a una afirmación estadística. También se mide en términos de probabilidad

Para una misma afirmación estadística, se tiene que,

𝑁𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 + 𝑁𝑖𝑣𝑒𝑙 𝑑𝑒 𝑑𝑒𝑠𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 = 1

Vale decir,

1−𝛼+𝛼 =1

Gráficamente se tiene que,

Nivel de confiabilidad
1-α
𝛼 𝛼
2 2

𝑇1 𝑇2 Estadístico
𝜃
Intervalo de confiabilidad

Límite inferior Límite superior

2.1. Intervalos de confiabilidad para los parámetros de


poblaciones normales

Tal como se ha dicho anteriormente, la distribución normal juega un rol predominante en la


estadística. El teorema del límite central y otras razones anotadas anteriormente indican
que gran parte de las poblaciones de la vida real son representadas con éxito por la
distribución normal.

Es importante señalar que los resultados que se obtienen a continuación son válidos
principalmente para poblaciones que siguen una distribución normal; aunque, en atención
al teorema del límite central, estos resultados pueden ser igualmente válidos para
poblaciones no normales, cuando el tamaño de la muestra aleatoria es grande.

5
Estimación de parámetros Rubén Medinaceli Ortiz

Sea 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 una muestra aleatoria de tamaño n de una población que sigue una
distribución normal con media µ y varianza σ2. Esto es:

𝒇𝑿 (𝒙)

Distribución normal

σ2

𝑋
µ

𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋𝑛 (Muestra aleatoria de tamaño n)


𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑛 (Realización de la muestra aleatoria)
𝑛
1
𝑋̅ = ∑ 𝑋𝑖
𝑛
𝑖=1

Es la media de la muestra; y,
𝑛
1
𝑆2 = ∑(𝑋𝑖 − 𝑋̅)2
𝑛−1
𝑖=1

Es la varianza de la muestra.

3.2.1. Intervalos de confiabilidad para la media µ

Tal como se ha visto anteriormente, el mejor estimador (insesgado y de varianza mínima)


de µ es 𝑋̅.

Recuerde que,

𝜎2
𝑋̅ ~𝑁(𝜇; )
𝑛

Estandarizando 𝑋̅ , se tiene que:

𝑋̅ − 𝜇
𝑍= 𝜎 ~ 𝑁(0; 1)
√𝑛

Se va a utilizar este estadístico en la obtención de un intervalo de confiabilidad para µ.

6
Estimación de parámetros Rubén Medinaceli Ortiz

𝒇𝒁 (𝒛)

Nivel de σ2 = 1
Confiabilidad
(1 – α)
α/2 α/2

𝑍~𝑁(0; 1)
−𝑧0 µ=0 𝑧0

En la figura superior se puede observar que:

𝑃[−𝑧0 ≤ 𝑍 ≤ 𝑧0 ] = 1 − 𝛼

Sin embargo,

𝑋̅ − 𝜇
𝑍= 𝜎
√𝑛

Por tanto,

𝑋̅ − 𝜇
𝑃 [−𝑧0 ≤ 𝜎 ≤ 𝑧0 ] = 1 − 𝛼
√𝑛
𝜎
Multiplicando cada término de esta desigualdad por se tiene que,
√𝑛

𝜎 𝜎
𝑃 [−𝑧0 ≤ 𝑋̅ − 𝜇 ≤ 𝑧0 ]=1−𝛼
√𝑛 √𝑛

restando luego 𝑋̅ de cada término se tiene,

𝜎 𝜎
𝑃 [−𝑋̅ − 𝑧0 ≤ −𝜇 ≤ −𝑋̅ + 𝑧0 ]=1−𝛼
√𝑛 √𝑛

Multiplicando toda la desigualdad por (−1), se tiene,

𝜎 𝜎
𝑃 [𝑋̅ + 𝑧0 ≥ 𝜇 ≥ 𝑋̅ − 𝑧0 ]= 1−𝛼
√𝑛 √𝑛

Finalmente, ordenando la desigualdad y reemplazando el estimador 𝑋̅ por el valor estimado


𝑥̅ , se tiene:

7
Estimación de parámetros Rubén Medinaceli Ortiz

𝜎 𝜎
𝑃 [𝑥̅ − 𝑧0 ≤ 𝜇 ≤ 𝑥̅ + 𝑧0 ]=1−𝛼
√𝑛 √𝑛

Esta expresión asume que se conoce 𝜎, que generalmente no es el caso. Se reemplazará


𝜎 por 𝑆 (desviación estándar de la muestra) siempre que 𝑛 ≥ 30.
𝜎
El término 𝑧0 representa cuánto difiere la media de la muestra (𝑋̅) del valor real de la
√𝑛
media (𝜇). Por tanto, esta expresión se puede utilizar para saber cuán grande debe ser la
muestra para asegurar que el error al estimar 𝜇 será menor a una cantidad especificada
(𝑒); esto es:

𝑧0 𝜎 2
𝑛=( )
𝑒

Con frecuencia se desea estimar la media (𝜇) de una población cuando se desconoce su
varianza (𝜎 2 ) y es imposible obtener una muestra de tamaño 𝑛 ≥ 30.

Recuerde que,

𝑍
𝑇= ~ 𝑡𝑛
√𝑈
𝑛

Donde,

𝑍 ~ 𝑁(0,1)
𝑈 ~ 𝑿𝟐𝒏

Recuerde también que,

𝑋̅ − 𝜇
𝑍= 𝜎 ~ 𝑁(0,1)
√𝑛

Y además que,

(𝑛 − 1)𝑆 2
𝑈= ~ 𝑿𝟐𝒏−𝟏
𝜎2

Por tanto,

𝑋̅ − 𝜇
𝜎
𝑇= √𝑛 ~ 𝑡𝑛−1
(𝑛 − 1)𝑆 2
√ 𝜎2
𝑛−1

En otras palabras,

8
Estimación de parámetros Rubén Medinaceli Ortiz

𝑋̅ − 𝜇
𝑇= ~ 𝑡𝑛−1
𝑆
√𝑛

Es posible utilizar este estadístico para obtener un intervalo de confiabilidad para 𝜇.

𝒇𝑻 (𝒕)

Nivel de
Confiabilidad
(1 – α)
α/2 α/2

𝑇~𝑡𝑛−1
−𝑡0 µ=0 𝑡0

En la figura superior se puede observar que,

𝑃[−𝑡0 ≤ 𝑇 ≤ 𝑡0 ] = 1 − 𝛼

Sin embargo,

𝑋̅ − 𝜇
𝑇=
𝑆
√𝑛

Por tanto,

𝑋̅ − 𝜇
𝑃 [−𝑡0 ≤ ≤ 𝑡0 ] = 1 − 𝛼
𝑆
√𝑛
𝑆
Multiplicando cada término de esta desigualdad por , restando luego 𝑋̅ de cada término,
√𝑛
multiplicando toda la desigualdad por -1 y ordenando la desigualdad, se obtiene:

𝑆 𝑆
𝑃 [𝑋̅ − 𝑡0 ≤ 𝜇 ≤ 𝑋̅ + 𝑡0 ]=1−𝛼
√𝑛 √𝑛

Finalmente, reemplazando el estimador 𝑋̅ por el valor estimado 𝑥̅ ; y el estimador 𝑆 por el


valor estimador 𝑠, se tiene:

𝑠 𝑠
𝑃 [𝑥̅ − 𝑡0 ≤ 𝜇 ≤ 𝑥̅ + 𝑡0 ]=1−𝛼
√𝑛 √𝑛

9
Estimación de parámetros Rubén Medinaceli Ortiz

Esta expresión puede utilizarse para obtener un intervalo de confiabilidad para la media 𝜇
de una población normal cuando 𝑛 < 30.

3.2.2. Ejercicio 8

Problema:

Una máquina produce piezas metálicas cilíndricas. Se toma una muestra de 10 piezas de
la producción del día y se procede a medir los diámetros. La siguiente tabla registra los
valores obtenidos:

Registro de diámetros (cm)


1,01 0,97 1,03 1,04 0,99
0,98 0,99 1,02 1,03 1,04

La especificación técnica señala que para aceptar la producción de un día, la media de los
diámetros de las piezas producidas debe ser igual a 1,00 cm.

Con un nivel de confiabilidad del 95% averiguar si la especificación técnica se cumple en


este caso.

Solución:

𝒇𝑿 (𝒙)

𝑋 = Diámetro de la pieza cilíndrica (cm)


µ = 1,00 cm (especificación técnica)

Muestra aleatoria: 𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋10


Realización: 𝑥1 = 1,01; 𝑥2 = 0,97, ⋯ , 𝑥10 = 1,04

En este caso, para obtener un intervalo de confiabilidad del 95% para µ, se recurrirá a la
siguiente expresión:

𝑠 𝑠
𝑃 [𝑥̅ − 𝑡0 ≤ 𝜇 ≤ 𝑥̅ + 𝑡0 ]=1−𝛼
√𝑛 √𝑛
𝑛
1 1,01 + 0,97 + ⋯ + 1,04
𝑥̅ = ∑ 𝑥𝑖 = = 1,01 𝑐𝑚
𝑛 10
𝑖=1

10
Estimación de parámetros Rubén Medinaceli Ortiz

𝑛
1 (1,01 − 1,01)2 + (0,97 − 1,01)2 + ⋯ + (1,04 − 1,01)2
𝑠=√ ∑(𝑥𝑖 − 𝑥̅ )2 = √ = 0,026
𝑛−1 9
𝑖=1

𝒇𝑻 (𝒕)

Nivel de
Confiabilidad
(1 – α)
α/2 0,95 α / 2 = 0,025

𝑇~𝑡𝑛−1 ~𝑡9
−𝑡0 µ=0 𝑡0 = 2,262 (𝑑𝑒 𝑡𝑎𝑏𝑙𝑎𝑠)

𝑠 2,262(0,026)
𝑡0 = = 0,02
√𝑛 √10

Por tanto,

𝑃[1,01 − 0,02 ≤ 𝜇 ≤ 1,01 + 0,02] = 0,95

Finalmente,

𝑷[𝟎, 𝟗𝟗 ≤ 𝝁 ≤ 𝟏, 𝟎𝟑] = 𝟎, 𝟗𝟓

De acuerdo a esta estimación, la media de los diámetros de las piezas cilíndricas


producidas en el día es algún valor entre 0,99 cm y 1,03 cm y la probabilidad que esto
ocurra es igual a 0,95.

En este caso, la especificación técnica (µ = 1,00 cm) está dentro del intervalo de
confiabilidad. Consecuentemente, la producción del día debe ser aceptada.

3.2.3. Intervalo de confiabilidad para la varianza σ2 de una población


normal

Se requiere un estadístico que incluya a σ2. Recuerde que el tema anterior se obtuvo el
siguiente estadístico:

(𝑛 − 1)𝑆 2 2
𝑈= ~ 𝑋𝑛−1
𝜎2

11
Estimación de parámetros Rubén Medinaceli Ortiz

Nótese que la variable aleatoria U que sigue una distribución chi-cuadrada con n – 1 grados
de libertad incluye al parámetro de interés (𝜎 2 ) y a su estimador puntual (𝑆 2 ). Por tanto,
𝑈 es el estadístico requerido.

𝑓𝑈 (𝑢)

Nivel de
Confiabilidad

α/2 1–α α/2

2
𝑈𝑖𝑛𝑓 𝑈𝑠𝑢𝑝 𝑈 ~ 𝑋𝑛−1

En la figura superior se puede ver que:

𝑃[𝑈𝑖𝑛𝑓 ≤ 𝑈 ≤ 𝑈𝑠𝑢𝑝 ] = 1 − 𝛼

Sin embargo,

(𝑛 − 1)𝑆 2
𝑈=
𝜎2

Por tanto,

(𝑛 − 1)𝑆 2
𝑃 [𝑈𝑖𝑛𝑓 ≤ ≤ 𝑈𝑠𝑢𝑝 ] = 1−𝛼
𝜎2

Dividiendo cada término de la desigualdad por (n – 1)S2 e invirtiendo luego cada término
(con lo cual se cambia el sentido de las desigualdades), se tiene:

(𝑛 − 1)𝑆 2 (𝑛 − 1)𝑆 2
𝑃[ ≤ 𝜎2 ≤ ]= 1−𝛼
𝑈𝑠𝑢𝑝 𝑈𝑖𝑛𝑓

Finalmente, reemplazando el estimador 𝑆 2 por el valor estimado 𝑠2 , se tiene:

(𝑛 − 1)𝑠2 (𝑛 − 1)𝑠2
𝑃[ ≤ 𝜎2 ≤ ]=1−𝛼
𝑈𝑠𝑢𝑝 𝑈𝑖𝑛𝑓

12
Estimación de parámetros Rubén Medinaceli Ortiz

3.2.4. Ejercicio 9

Problema:

Se ha procedido a medir estaturas (en metros) de algunos jóvenes que han cumplido 16
años en el mes de junio de este año, en la ciudad de Oruro. Los resultados de la medición
se muestran en la siguiente tabla:

Muestra N° 1 2 3 4 5 6 7 8 9 10 11
Estatura (m) 1,65 1,66 1,67 1,64 1,66 1,65 1,63 1,68 1,64 1,62 1,68

Obtener un intervalo de confiabilidad del 98% para la varianza de las estaturas de jóvenes
de 16 años en la ciudad de Oruro. Asumir una distribución normal para la población de
estaturas.

Solución:

𝒇𝑿 (𝒙)

𝑋 = Estatura jóvenes de 16 años en Oruro (m)


µ = ¿?

Muestra aleatoria: 𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋11


Realización: 𝑥1 = 1,65; 𝑥2 = 1,66, ⋯ , 𝑥11 = 1,68

Se utilizará la siguiente expresión para obtener el intervalo de confiabilidad solicitado:

(𝑛 − 1)𝑠2 (𝑛 − 1)𝑠2
𝑃[ ≤ 𝜎2 ≤ ]=1−𝛼
𝑈𝑠𝑢𝑝 𝑈𝑖𝑛𝑓
𝑛
1 1,65 + 1,66 + ⋯ + 1,68
𝑥̅ = ∑ 𝑥𝑖 = = 1,65 𝑚
𝑛 11
𝑖=1

𝑛
1 (1,65 − 1,65)2 + (1,66 − 1,65)2 + ⋯ + (1,68 − 1,65)2
𝑠2 = ∑(𝑥𝑖 − 𝑥̅ )2 = = 0,0004
𝑛−1 10
𝑖=1

13
Estimación de parámetros Rubén Medinaceli Ortiz

𝑓𝑈 (𝑢)

Nivel de
Confiabilidad

α/2 1–α α / 2 = 0,01


0,98

2
𝑈𝑖𝑛𝑓 = 2,56 𝑈𝑠𝑢𝑝 = 23,2 𝑈 ~ 𝑋𝑛−1

Reemplazando valores se tiene:

10(0,0004) 10(0,0004)
𝑃[ ≤ 𝜎2 ≤ ] = 0,98
23,2 2,56

Finalmente, se tiene que:

𝑃[0,0002 ≤ 𝜎 2 ≤ 0,0015] = 0,98

En palabras, la varianza de la estatura de jóvenes de 16 años en Oruro, es algún valor


entre 0,0002 y 0,0015; y la probabilidad que esto ocurra es igual a 0,98.

3.2.5. Intervalo de confiabilidad para la diferencia de medias,


(µX - µY)

En muchas ocasiones se hace necesario comparar dos poblaciones 𝑓𝑋 (𝑥) y 𝑓𝑌 (𝑦) ya sea
en términos de sus medias 𝜇𝑋 y 𝜇𝑌 ; y/o sus varianzas 𝜎𝑋2 y 𝜎𝑌2 .

Inicialmente, se tratará la comparación de medias y posteriormente la comparación de


varianzas.

La comparación de medias puede dar lugar a alguno de los siguientes resultados:

𝜇𝑋 = 𝜇𝑌 → 𝜇𝑋 − 𝜇𝑌 = 0

𝜇𝑋 < 𝜇𝑌 → 𝜇𝑋 − 𝜇𝑌 < 0

𝜇𝑋 > 𝜇𝑌 → 𝜇𝑋 − 𝜇𝑌 > 0

Consecuentemente, la obtención de intervalos de confiabilidad para la diferencia de medias


(𝜇𝑋 − 𝜇𝑌 ) permitirá conocer los resultados de una comparación de medias poblacionales.

La nomenclatura y la base estadística utilizadas son las que se muestran en la siguiente


figura:

14
Estimación de parámetros Rubén Medinaceli Ortiz

𝒇𝑿 (𝒙) 𝒇𝒀 (𝒚)

σX2 σY2

𝑋 𝑌
µX µY

𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 𝑌1 , 𝑌2 , ⋯ , 𝑌𝑚
1 1 𝑚
𝑋̅ = ∑𝑛𝑖=1 𝑋𝑖 𝑌̅ = ∑ 𝑌
𝑛 𝑚 𝑖=1 𝑖

1 1
𝑆𝑋2 = ∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)2 𝑆𝑌2 = ∑𝑚 ̅ 2
𝑖=1(𝑌𝑖 − 𝑌)
𝑛−1 𝑚−1

2 2
𝜎 𝜎
𝑋̅ ~ 𝑁(𝜇𝑋 ; 𝑋 ) 𝑌̅ ~ 𝑁(𝜇𝑌 ; 𝑌 )
𝑛 𝑚

2
(𝑛−1)𝑆𝑋 2 (𝑚−1)𝑆𝑌2 2
𝑈= 2 ~ 𝑋𝑛−1 𝑉= ~ 𝑋𝑚−1
𝜎𝑋 𝜎𝑌2

En función del tamaño de las muestras (n y m) y de la naturaleza de las varianzas


poblacionales (σX2 y σY2), es posible considerar tres (3) casos:

Caso A

Las varianzas poblacionales σX2 y σY2 son conocidas; vale decir, n ≥ 30 y


m ≥ 30

En este caso de tiene que,

𝜎𝑋2 𝜎𝑌2
𝑋̅ − 𝑌̅ ~ 𝑁(𝜇𝑋 − 𝜇𝑌 ; + )
𝑛 𝑚

Estandarizando 𝑋̅ − 𝑌̅ se obtiene,

𝑋̅ − 𝑌̅ − (𝜇𝑋 − 𝜇𝑌 )
𝑍= ~ 𝑁(0; 1)
2 2
√𝜎𝑋 + 𝜎𝑌
𝑛 𝑚

Se utiliza este estadístico para obtener el intervalo de confiabilidad correspondiente.

15
Estimación de parámetros Rubén Medinaceli Ortiz

𝒇𝒁 (𝒛)

Nivel de σ2 = 1
Confiabilidad
(1 – α)
α/2 α/2

𝑍~𝑁(0; 1)
−𝑧0 µ=0 𝑧0

En la figura superior se puede observar que,

𝑃[−𝑧0 ≤ 𝑍 ≤ 𝑧0 ] = 1 − 𝛼

Sin embargo,

𝑋̅ − 𝑌̅ − (𝜇𝑋 − 𝜇𝑌 )
𝑍=
2 2
√𝜎𝑋 + 𝜎𝑌
𝑛 𝑚

Por tanto,

𝑋̅ − 𝑌̅ − (𝜇𝑋 − 𝜇𝑌 )
𝑃 −𝑧0 ≤ ≤ 𝑧0 = 1 − 𝛼
2 2
√𝜎𝑋 + 𝜎𝑌
[ 𝑛 𝑚 ]

2
𝜎𝑋 𝜎𝑌2
Multiplicando cada término de la desigualdad por √ + , restando luego 𝑋̅ − 𝑌̅ de cada
𝑛 𝑚
término y multiplicando la desigualdad por -1, se tiene,

𝜎𝑋2 𝜎𝑌2 𝜎𝑋2 𝜎𝑌2


𝑃 [𝑋̅ − 𝑌̅ − 𝑧0 √ + ≤ 𝜇𝑋 − 𝜇𝑌 ≤ 𝑋̅ − 𝑌̅ + 𝑧0 √ + ] = 1 − 𝛼
𝑛 𝑚 𝑛 𝑚

Finalmente, sustituyendo los estimadores 𝑋̅ 𝑦 𝑌̅ por sus respectivos valores estimados 𝑥̅ y


𝑦̅, se tiene:

𝜎𝑋2 𝜎𝑌2 𝜎𝑋2 𝜎𝑌2


𝑃 [𝑥̅ − 𝑦̅ − 𝑧0 √ + ≤ 𝜇𝑋 − 𝜇𝑌 ≤ 𝑥̅ − 𝑦̅ + 𝑧0 √ + ] = 1 − 𝛼
𝑛 𝑚 𝑛 𝑚

En la práctica, como n ≥ 30 y m ≥ 30, para aplicar esta expresión se sustituye 𝜎𝑋2 𝑦 𝜎𝑌2 por
𝑠𝑋2 𝑦 𝑠𝑌2 respectivamente.

16
Estimación de parámetros Rubén Medinaceli Ortiz

Caso B

Las varianzas poblacionales σX2 y σY2 son desconocidas pero iguales


σX2 = σY2 = σ2 (n ˂ 30 y/o m ˂ 30)

En este caso de tiene que,

𝜎2 𝜎2
𝑋̅ − 𝑌̅ ~ 𝑁(𝜇𝑋 − 𝜇𝑌 ; + )
𝑛 𝑚

Estandarizando 𝑋̅ − 𝑌̅ se obtiene,

𝑋̅ − 𝑌̅ − (𝜇𝑋 − 𝜇𝑌 )
𝑍= ~ 𝑁(0; 1)
2 2
√𝜎 + 𝜎
𝑛 𝑚

Por otro lado,

(𝑛 − 1)𝑆𝑋2 2
𝑈= ~ 𝑋𝑛−1
𝜎2

(𝑚 − 1)𝑆𝑌2 2
𝑉= ~ 𝑋𝑚−1
𝜎2

Por tanto,

(𝑛 − 1)𝑆𝑋2 + (𝑚 − 1)𝑆𝑌2 2
𝑈+𝑉 = ~ 𝑋𝑛+𝑚−2
𝜎2

Recordando que,

𝑍
𝑇= ~ 𝑡𝑟
√𝑊
𝑟

Donde,

𝑍 ~ 𝑁(0; 1)
𝑊 ~ 𝑋𝑟2

En este caso, se tiene que,

17
Estimación de parámetros Rubén Medinaceli Ortiz

𝑋̅ − 𝑌̅ − (𝜇𝑋 − 𝜇𝑌 )
2 2
√𝜎 + 𝜎
𝑛 𝑚
𝑇= ~ 𝑡𝑛+𝑚−2
(𝑛 − 1)𝑆𝑋2 + (𝑚 − 1)𝑆𝑌2
√ 𝜎2
𝑛+𝑚−2

𝑋̅ − 𝑌̅ − (𝜇𝑋 − 𝜇𝑌 )
𝑇= ~ 𝑡𝑛+𝑚−2
(𝑛 − 1)𝑆𝑋2 + (𝑚 − 1)𝑆𝑌2
√(1 + 1 ) [ ]
𝑛 𝑚 𝑛+𝑚−2

Es el estadístico a utilizarse para obtener el intervalo de confiabilidad buscado.

𝒇𝑻 (𝒕)

Nivel de
Confiabilidad
(1 – α)
α/2 α/2

𝑇~ 𝑡𝑛+𝑚−2
−𝑡0 µ=0 𝑡0

En la figura superior se puede observar que,

𝑃[−𝑡0 ≤ 𝑇 ≤ 𝑡0 ] = 1 − 𝛼

Sin embargo,

𝑋̅ − 𝑌̅ − (𝜇𝑋 − 𝜇𝑌 )
𝑇=
(𝑛 − 1)𝑆𝑋2 + (𝑚 − 1)𝑆𝑌2
√(1 + 1 ) [ ]
𝑛 𝑚 𝑛+𝑚−2

Por tanto,

𝑋̅ − 𝑌̅ − (𝜇𝑋 − 𝜇𝑌 )
𝑃 −𝑡0 ≤ ≤ 𝑡0 = 1 − 𝛼
(𝑛 − 1)𝑆𝑋2
+ (𝑚 − 1)𝑆𝑌2
√(1 + 1 ) [ ]
𝑛 𝑚 𝑛+𝑚−2
[ ]

Después de realizar las operaciones algebraicas necesarias para tener el parámetro


𝜇𝑋 − 𝜇𝑌 en el término central de la desigualdad, se tiene:

18
Estimación de parámetros Rubén Medinaceli Ortiz

1 1 (𝑛 − 1)𝑆𝑋2 + (𝑚 − 1)𝑆𝑌2
̅ ̅
𝑃 [𝑋 − 𝑌 − 𝑡𝑜 √( + ) [ ] ≤ 𝜇𝑋 − 𝜇𝑌
𝑛 𝑚 𝑛+𝑚−2

1 1 (𝑛 − 1)𝑆𝑋2 + (𝑚 − 1)𝑆𝑌2
≤ 𝑋̅ − 𝑌̅ + 𝑡𝑜 √( + ) [ ]] = 1 − 𝛼
𝑛 𝑚 𝑛+𝑚−2

Finalmente, reemplazando los estimadores por los valores estimados, se tiene:

1 1 (𝑛 − 1)𝑠𝑋2 + (𝑚 − 1)𝑠𝑌2 1 1 (𝑛 − 1)𝑠𝑋2 + (𝑚 − 1)𝑠𝑌2


𝑃 [𝑥̅ − 𝑦̅ − 𝑡𝑜 √( + ) [ ] ≤ 𝜇𝑋 − 𝜇𝑌 ≤ 𝑥̅ − 𝑦̅ + 𝑡𝑜 √( + ) [ ]] = 1 − 𝛼
𝑛 𝑚 𝑛+𝑚−2 𝑛 𝑚 𝑛+𝑚−2

Caso C

Las varianzas poblacionales σX2 y σY2 son desconocidas y diferentes σX2 ≠ σY2
(n ˂ 30 y/o m ˂ 30)

El estadístico a utilizarse en este caso es,

𝑋̅ − 𝑌̅ − (𝜇𝑋 − 𝜇𝑌 )
𝑇= ~ 𝑡𝑝
2 2
√𝑆𝑋 + 𝑆𝑌
𝑛 𝑚

Donde,
2
𝑠2 𝑠2
( 𝑋 + 𝑌)
𝑛 𝑚
𝑝= 2 2
𝑠2 𝑠2
( 𝑋) ( 𝑌)
𝑛 𝑚
+
𝑛−1 𝑚−1

𝒇𝑻 (𝒕)

Nivel de
Confiabilidad
(1 – α)
α/2 α/2

𝑇~ 𝑡𝑝
−𝑡0 µ=0 𝑡0

19
Estimación de parámetros Rubén Medinaceli Ortiz

En el gráfico superior se puede observar que,


𝑃[−𝑡0 ≤ 𝑇 ≤ 𝑡0 ] = 1 − 𝛼

Sin embargo,

𝑋̅ − 𝑌̅ − (𝜇𝑋 − 𝜇𝑌 )
𝑇=
2 2
√𝑆𝑋 + 𝑆𝑌
𝑛 𝑚

Por tanto,

𝑋̅ − 𝑌̅ − (𝜇𝑋 − 𝜇𝑌 )
𝑃 −𝑡0 ≤ ≤ 𝑡0 = 1 − 𝛼
2 2
√𝑆𝑋 + 𝑆𝑌
[ 𝑛 𝑚 ]

Después de realizar las operaciones algebraicas necesarias para tener el parámetro


𝜇𝑋 − 𝜇𝑌 en el término central de la desigualdad, se tiene:

𝑆𝑋2 𝑆𝑌2 𝑆𝑋2 𝑆𝑌2


𝑃 [𝑋̅ − 𝑌̅ − 𝑡0 √ + ≤ 𝜇𝑋 − 𝜇𝑌 ≤ 𝑋̅ − 𝑌̅ + 𝑡0 √ + ] = 1 − 𝛼
𝑛 𝑚 𝑛 𝑚

Finalmente, sustituyendo los estimadores por los valores estimados, se tiene,

𝑠𝑋2 𝑠𝑌2 𝑠𝑋2 𝑠𝑌2


𝑃 [𝑥̅ − 𝑦̅ − 𝑡0 √ + ≤ 𝜇𝑋 − 𝜇𝑌 ≤ 𝑥̅ − 𝑦̅ + 𝑡0 √ + ] = 1 − 𝛼
𝑛 𝑚 𝑛 𝑚

3.2.6. Intervalo de confiabilidad para la diferencia de medias en el


caso de observaciones en pares

En este caso, las poblaciones no son independientes, mucho menos las muestras de las
mismas, tampoco las varianzas de las poblaciones son necesariamente iguales. Esto ocurre
si las observaciones en las dos muestras ocurren en pares, de modo que las observaciones
están relacionadas.

Por ejemplo, si se efectúa una prueba de una nueva dieta utilizando 15 personas, los
valores de peso antes y después de la dieta formarán las dos muestras.

Las observaciones en las dos muestras realizadas en la misma persona están relacionadas
y, por consiguiente, forman un par.

Para determinar si la dieta es efectiva, se deben considerar las diferencias 𝑑1 , 𝑑2 , ⋯ , 𝑑𝑛 de


observaciones en pares.

20
Estimación de parámetros Rubén Medinaceli Ortiz

Antes Proceso Después


𝒇𝑿 (𝒙) 𝒇𝒀 (𝒚)

σX2 σY2

𝑋 𝑌
µX µY

𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 𝑌1 , 𝑌2 , ⋯ , 𝑌𝑛

Muestra aleatoria: 𝐷1 = 𝑋1 − 𝑌1 , 𝐷2 = 𝑋2 − 𝑌2 , ⋯ , 𝐷𝑛 = 𝑋𝑛 − 𝑌𝑛

Realización: 𝑑1 = 𝑥1 − 𝑦1 , 𝑑2 = 𝑥2 − 𝑦2 , ⋯ , 𝑑𝑛 = 𝑥𝑛 − 𝑦𝑛

Se asume que 𝐷1 , 𝐷2 , ⋯ , 𝐷𝑛 es una muestra aleatoria de una población 𝑓𝐷 (𝑑) que sigue una
distribución normal con media 𝜇𝐷 = 𝜇𝑋 − 𝜇𝑌 y varianza 𝜎𝐷2 .

̅ ; donde,
El mejor estimador (insesgado y de varianza mínima) de 𝜇𝐷 es 𝐷
𝑛
1
̅=
𝐷 ∑ 𝐷𝑖
𝑛
𝑖=1

El estimador de 𝜎𝐷2 es 𝑆𝐷2 ; donde,


𝑛
1
𝑆𝐷2 = ̅ )2
∑(𝐷𝑖 − 𝐷
𝑛−1
𝑖=1

Es más,

𝜎𝐷2
̅ ~ 𝑁(𝜇𝐷 ;
𝐷 )
𝑛
̅ se tiene,
Estandarizando 𝐷

̅ − 𝜇𝐷
𝐷
𝑍= 𝜎𝐷 ~ 𝑁(0,1)
√𝑛

Por otro lado,

21
Estimación de parámetros Rubén Medinaceli Ortiz

(𝑛 − 1)𝜎𝐷2 2
𝑈= ~ 𝑋𝑛−1
𝑆𝐷2

Consecuentemente,

̅ − 𝜇𝐷
𝐷
𝜎𝐷
√𝑛 ̅ − 𝜇𝐷
𝐷
𝑇= = ~ 𝑡𝑛−1
𝑆𝐷
(𝑛 − 1)𝜎𝐷2
√𝑛
√ 𝑆𝐷2
𝑛−1

Se utilizará este estadístico para obtener el intervalo de confiabilidad deseado.

𝒇𝑻 (𝒕)

Nivel de
Confiabilidad
(1 – α)
α/2 α/2

𝑇~ 𝑡𝑝
−𝑡0 µ=0 𝑡0

En la figura superior se puede ver que,

𝑃[−𝑡0 ≤ 𝑇 ≤ 𝑡0 ] = 1 − 𝛼

Sin embargo,

̅ − 𝜇𝐷
𝐷
𝑇=
𝑆𝐷
√𝑛

Por tanto,

̅ − 𝜇𝐷
𝐷
𝑃 [−𝑡0 ≤ ≤ 𝑡0 ] = 1 − 𝛼
𝑆𝐷
√𝑛

Dejando el parámetro en el término central se tiene,

𝑆𝐷 𝑆𝐷2
̅ − 𝑡0
𝑃 [𝐷 ̅ − 𝑡0
≤ 𝜇𝐷 ≤ 𝐷 ]=1−𝛼
√𝑛 √𝑛

22
Estimación de parámetros Rubén Medinaceli Ortiz

Finalmente, reemplazando los estimadores por sus correspondientes valores estimados, se


tiene:

𝑠𝑑 𝑠𝑑
𝑃 [𝑑̅ − 𝑡0 ≤ 𝜇𝐷 ≤ 𝑑̅ − 𝑡0 ]= 1−𝛼
√𝑛 √𝑛

3.2.7. Intervalo de confiabilidad para el cociente de varianzas


(σX2/ σY2) ó (σY2/σX2)

La comparación de varianzas puede dar lugar a alguno de los siguientes resultados:


2
𝜎𝑋
𝜎𝑋2 = 𝜎𝑌2 → =1
𝜎𝑌2

2
𝜎𝑋
𝜎𝑋2 < 𝜎𝑌2 → <1
𝜎𝑌2

2
𝜎𝑋
𝜎𝑋2 > 𝜎𝑌2 → >1
𝜎𝑌2

Consecuentemente, la obtención de intervalos de confiabilidad para el cociente de


varianzas permitirá conocer los resultados de una comparación de medias poblacionales.

La nomenclatura y la base estadística utilizadas son las que se muestran en la siguiente


figura:

23
Estimación de parámetros Rubén Medinaceli Ortiz

𝒇𝑿 (𝒙) 𝒇𝒀 (𝒚)

σX2 σY2

𝑋 𝑌
µX µY

𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 𝑌1 , 𝑌2 , ⋯ , 𝑌𝑚
1 1 𝑚
𝑋̅ = ∑𝑛𝑖=1 𝑋𝑖 𝑌̅ = ∑ 𝑌
𝑛 𝑚 𝑖=1 𝑖

1 1
𝑆𝑋2 = ∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)2 𝑆𝑌2 = ∑𝑚 ̅ 2
𝑖=1(𝑌𝑖 − 𝑌)
𝑛−1 𝑚−1

2
(𝑛−1)𝑆𝑋 2 (𝑚−1)𝑆𝑌2 2
𝑈= 2 ~ 𝑋𝑛−1 𝑉= ~ 𝑋𝑚−1
𝜎𝑋 𝜎𝑌2

Recordando que,

𝑈
𝐹= 𝑚 ~ 𝐹𝑚;𝑛
𝑉
𝑛

Cuando,
2 y 𝑉 ~ 𝑋2
𝑈 ~ 𝑋𝑚 𝑛

En este caso se tiene,

(𝑚 − 1)𝑆𝑌2
𝜎𝑌2
𝐹 = 𝑚 − 1 2 ~ 𝐹𝑚−1;𝑛−1
(𝑛 − 1)𝑆𝑋
𝜎𝑋2
𝑛−1

𝜎𝑋2 𝑆𝑌2
𝐹= ~ 𝐹𝑚−1;𝑛−1
𝜎𝑌2 𝑆𝑋2

Este estadístico se utilizará para obtener el intervalo de confiabilidad buscado

24
Estimación de parámetros Rubén Medinaceli Ortiz

Nivel de
Confiabilidad
α/2 1–α α/2

𝐹𝑖𝑛𝑓 𝐹𝑠𝑢𝑝 𝐹 ~ 𝐹𝑚−1;𝑛−1

En la figura superior se puede observar que,

𝑃[𝐹𝑖𝑛𝑓 ≤ 𝐹 ≤ 𝐹𝑠𝑢𝑝 ] = 1 − 𝛼

Sin embargo,

𝜎𝑋2 𝑆𝑌2
𝐹=
𝜎𝑌2 𝑆𝑋2

Por tanto,

𝜎𝑋2 𝑆𝑌2
𝑃 [𝐹𝑖𝑛𝑓 ≤ ≤ 𝐹𝑠𝑢𝑝 ] = 1 − 𝛼
𝜎𝑌2 𝑆𝑋2

𝑆𝑋2 𝜎𝑋2 𝑆𝑋2


𝑃 [𝐹𝑖𝑛𝑓 ≤ ≤ 𝐹𝑠𝑢𝑝 ] =1−𝛼
𝑆𝑌2 𝜎𝑌2 𝑆𝑌2

Finalmente, sustituyendo los estimadores por los valores estimados se tiene,

𝑠𝑋2 𝜎𝑋2 𝑠𝑋2


𝑃 [𝐹𝑖𝑛𝑓 ≤ ≤ 𝐹𝑠𝑢𝑝 2 ] = 1 − 𝛼
𝑠𝑌2 𝜎𝑌2 𝑠𝑌

3.2.8. Ejercicio 10

Problema:

Se han registrado los tiempos de duración de dos marcas de focos eléctricos: A y B. Una
muestra aleatoria de 40 focos de la marca A mostró una duración promedio igual a 418
horas de uso continuo y una desviación estándar igual a 26 horas. A su vez, una muestra
aleatoria de 50 focos de la marca B tuvo una duración promedio de 402 horas de
funcionamiento continuo con una desviación estándar igual a 22 horas. Con un nivel de

25
Estimación de parámetros Rubén Medinaceli Ortiz

confiabilidad del 95% señalar si, en promedio, las vidas útiles de los focos eléctricos de
ambas marcas son iguales.

Solución:

𝒇𝑿 (𝒙) 𝒇𝒀 (𝒚)

σX2 σY2

𝑋= 𝑌=
µX Vida útil focos marca A en horas µY Vida útil focos marca B en horas

𝑋1 , 𝑋2 , ⋯ , 𝑋40 (muestra aleatoria) 𝑌1 , 𝑌2 , ⋯ , 𝑌50 (muestra aleatoria)


𝑥1 , 𝑥2 , ⋯ , 𝑥40 (realización) 𝑦1 , 𝑦2 , ⋯ , 𝑦50 (realización)

𝑥̅ = 418 ℎ𝑜𝑟𝑎𝑠 𝑦̅ = 402 ℎ𝑜𝑟𝑎𝑠


𝑠𝑋 = 26 ℎ𝑜𝑟𝑎𝑠 𝑠𝑌 = 22 ℎ𝑜𝑟𝑎𝑠
𝑛 = 40 𝑚 = 50

Como n > 30 y m > 30 es posible asumir que las varianzas de las muestras son iguales a
las varianzas poblacionales (Caso A). Por tanto, se puede utilizar la siguiente expresión
para obtener un intervalo de confiabilidad para la diferencia de medias.

𝜎𝑋2 𝜎𝑌2 𝜎𝑋2 𝜎𝑌2


𝑃 [𝑥̅ − 𝑦̅ − 𝑧0 √ + ≤ 𝜇𝑋 − 𝜇𝑌 ≤ 𝑥̅ − 𝑦̅ + 𝑧0 √ + ] = 1 − 𝛼
𝑛 𝑚 𝑛 𝑚

Se asume que 𝜎𝑋2 = 262 y que 𝜎𝑌2 = 222

Por otro lado,

26
Estimación de parámetros Rubén Medinaceli Ortiz

𝒇𝒁 (𝒛)

Nivel de σ2 = 1
Confiabilidad
(1 – α)
α/2 0,95 α / 2 = 0,025

𝑍~𝑁(0; 1)
−𝑧0 µ=0 𝑧0 = 1,96

Reemplazando valores se tiene:

262 222 262 222


𝑃 [(418 − 402) − 1,96√ + ≤ 𝜇𝑋 − 𝜇𝑌 ≤ (418 − 402) − 1,96√ + ] = 0,95
40 50 40 50

𝑃[16 − 10,1 ≤ 𝜇𝑋 − 𝜇𝑌 ≤ 16 + 10,1] = 0,95

Finalmente, se tiene que,

𝑷[𝟓, 𝟗 ≤ 𝝁𝑿 − 𝝁𝒀 ≤ 𝟐𝟔, 𝟏] = 𝟎, 𝟗𝟓

Con un nivel de confiabilidad del 95% se puede afirmar que (no estando el cero (0) en el
intervalo de confiabilidad) las vidas útiles medias de los focos de las marcas A y B no son
iguales; al contrario, los focos de la marca A tienen mayor vida útil media que los focos de
la marca B.

3.2.9. Ejercicio 11

Problema:

Para averiguar si un nuevo suero detendrá o no la leucemia, se selecciona nueve (9)


ratones que han alcanzado un estado avanzado de la enfermedad. Cinco ratones reciben
el tratamiento y cuatro no lo reciben. Los tiempos de sobrevivencia, en años, desde que se
inició el experimento, son los siguientes:

Tiempo de sobrevivencia con tratamiento (años) 2,1 5,3 1,4 4,6 0,9
Tiempo de sobrevivencia sin tratamiento (años) 1,9 0,5 2,8 3,1

Con un nivel de confiabilidad del 90% averiguar si el nuevo suero es efectivo.

27
Estimación de parámetros Rubén Medinaceli Ortiz

Solución:

𝒇𝑿 (𝒙) 𝒇𝒀 (𝒚)

σX2 σY2

𝑋= 𝑌=
µX Tiempo de supervivencia µY Tiempo de supervivencia
con tratamiento (años) sin tratamiento (años)

𝑋1 , 𝑋2 , ⋯ , 𝑋5 (muestra aleatoria) 𝑌1 , 𝑌2 , ⋯ , 𝑌4 (muestra aleatoria)


𝑥1 = 2,1; 𝑥2 = 5,3; ⋯ ; 𝑥5 = 0,9(realización) 𝑦1 = 1,9; 𝑦2 = 0,5; ⋯ ; 𝑦4 = 3,1 (realización)

1
𝑥̅ = (2,1 + 5,3 + ⋯ + 0,9) = 2,86 𝑎ñ𝑜𝑠
5
1
𝑠𝑋2 = {(2,1 − 2,86)2 + (5,3 − 2,86)2 + ⋯ + (0,9 − 2,86)2 } = 3,88 𝑎ñ𝑜𝑠2
4
1
𝑦̅ = (1,9 + 0,5 + ⋯ + 3,1) = 2,07 𝑎ñ𝑜𝑠
4
1
𝑠𝑌2 = {(1,9 − 2,07)2 + (0,5 − 2,07)2 + ⋯ + (3,1 − 2,07)2 } = 1,36 𝑎ñ𝑜𝑠2
3

𝑛=5

𝑚=4

Las muestras son muy pequeñas; por tanto, las varianzas poblacionales 𝜎𝑋2 𝑦 𝜎𝑌2 son
desconocidas. Corresponde averiguar si son iguales; para ello es necesario encontrar un
2
𝜎𝑋
intervalo de confiabilidad para el cociente de las varianzas poblacionales
𝜎𝑌2

Para el efecto se utilizará la siguiente expresión:

𝑠𝑋2 𝜎𝑋2 𝑠𝑋2


𝑃 [𝐹𝑖𝑛𝑓 ≤ ≤ 𝐹𝑠𝑢𝑝 ]= 1−𝛼
𝑠𝑌2 𝜎𝑌2 𝑠𝑌2

28
Estimación de parámetros Rubén Medinaceli Ortiz

𝑓𝐹(.)

Nivel de
Confiabilidad
α/2 1–α α / 2 = 0,05
0,90

1 1
𝐹𝑖𝑛𝑓 = = = 0,11 𝐹𝑠𝑢𝑝 = 6,59 𝐹 ~ 𝐹𝑚−1;𝑛−1
𝐹𝑛−1,𝑚−1 9,12

Reemplazando valores se tiene,

3,88 𝜎𝑋2 3,88


𝑃 [0,11 ≤ 2 ≤ 6,59 ] = 0,90
1,36 𝜎𝑌 1,36

Finalmente,

𝝈𝟐𝑿
𝑷 [𝟎, 𝟑𝟏 ≤ ≤ 𝟏𝟖, 𝟖𝟎] = 𝟎, 𝟗𝟎
𝝈𝟐𝒀
2
𝜎𝑋
Siendo el uno (1) un valor posible para , es factible asumir que las varianzas
𝜎𝑌2
poblacionales son iguales. Por tanto, la expresión a utilizarse para obtener un intervalo de
confiabilidad para la diferencia de medias es (Caso B):

1 1 (𝑛 − 1)𝑠𝑋2 + (𝑚 − 1)𝑠𝑌2 1 1 (𝑛 − 1)𝑠𝑋2 + (𝑚 − 1)𝑠𝑌2


𝑃 [𝑥̅ − 𝑦̅ − 𝑡𝑜 √( + ) [ ] ≤ 𝜇𝑋 − 𝜇𝑌 ≤ 𝑥̅ − 𝑦̅ + 𝑡𝑜 √( + ) [ ]] = 1 − 𝛼
𝑛 𝑚 𝑛+𝑚−2 𝑛 𝑚 𝑛+𝑚−2

𝒇𝑻 (𝒕)

Nivel de
Confiabilidad
(1 – α)
α/2 0,90 α / 2 = 0,05

𝑇~ 𝑡𝑛+𝑚−2 ~𝑡5+4−2 ~𝑡7


−𝑡0 µ=0 𝑡0 = 1,895

29
Estimación de parámetros Rubén Medinaceli Ortiz

Reemplazando valores se tiene:

𝑋̅ − 𝑌̅ = 2,86 − 2,07 = 0,79

1 1 (𝑛 − 1)𝑠𝑋2 + (𝑚 − 1)𝑠𝑌2 1 1 4(3,88) + 3(1,36)


𝑡𝑜 √( + ) [ ] = 1,895√( + ) ( ) = 2,13
𝑛 𝑚 𝑛+𝑚−2 5 4 7

Por tanto,

𝑃[0,79 − 2,13 ≤ 𝜇𝑋 − 𝜇𝑌 ≤ 0,79 + 2,13] = 0,90

Finalmente,

𝑷[−𝟏, 𝟑𝟒 ≤ 𝝁𝑿 − 𝝁𝒀 ≤ 𝟐, 𝟗𝟐] = 𝟎, 𝟗𝟎

Con un nivel de confiabilidad del 90% es posible afirmar que estando el cero (0)
comprendido en el intervalo de confiabilidad, las medias poblacionales pueden ser
consideradas iguales y concluir que el nuevo suero no es efectivo.

3.2.10. Ejercicio 12

Problema:

Un investigador afirma que la resistencia a la tracción de cierto material refractario


disminuye con el incremento de la temperatura. La siguiente tabla muestra los resultados
de un experimento en el que se mide la resistencia a la compresión de ocho (8) muestras
del material refractario, primero a temperatura ambiente y posteriormente luego de calentar
las muestras a una temperatura de 50°C.

X = Resistencia (temperatura ambiente) (kg/cm2) 250 270 260 265 255 250 260 270
Y = Resistencia (a 50°C) (kg/cm2) 255 260 255 265 250 240 245 265

Con un nivel de confiabilidad del 95%, averiguar si la afirmación del investigador es real.

Solución:

Las mediciones de la resistencia a la tracción efectuadas en cada una de las ocho muestras
inicialmente a temperatura ambiente y luego a 50°C de temperatura forman pares.

Para determinar si la afirmación del investigador es real, se deben considerar las diferencias
𝑑1 , 𝑑2 , ⋯ , 𝑑𝑛 de las observaciones en pares.

30
Estimación de parámetros Rubén Medinaceli Ortiz

Antes Proceso Después


𝒇𝑿 (𝒙) 𝒇𝒀 (𝒚)

σX2 σY2

𝑋 𝑌
µX Resistencia a temperatura ambiente µY Resistencia a 50°C

𝑋1 , 𝑋2 , ⋯ , 𝑋8 𝑌1 , 𝑌2 , ⋯ , 𝑌8

Muestra aleatoria: 𝐷1 = 𝑋1 − 𝑌1 , 𝐷2 = 𝑋2 − 𝑌2 , ⋯ , 𝐷8 = 𝑋8 − 𝑌8

Realización: 𝑑1 = 𝑥1 − 𝑦1 , 𝑑2 = 𝑥2 − 𝑦2 , ⋯ , 𝑑8 = 𝑥8 − 𝑦8

xi = Resistencia (temperatura ambiente) (kg/cm2) 250 270 260 265 255 250 260 270
yi = Resistencia (a 50°C) (kg/cm2) 255 260 255 265 250 240 245 265
di = xi – yi -5 10 5 0 5 10 15 5

1
𝑑̅ = (−5 + 10 + 5 + ⋯ + 5) = 5,625
8
1
𝑠𝑑2 = {(−5 − 5,625)2 + (10 − 5,625)2 + ⋯ + (5 − 5,625)2 } = 38,839
7

𝑠𝑑 = +√𝑠𝑑2 = +√38,839 = 6,232

Se utiliza la siguiente expresión en la obtención del intervalo de confiabilidad para 𝜇𝐷

𝑠𝑑 𝑠𝑑
𝑃 [𝑑̅ − 𝑡0 ≤ 𝜇𝐷 ≤ 𝑑̅ − 𝑡0 ]= 1−𝛼
√𝑛 √𝑛

31
Estimación de parámetros Rubén Medinaceli Ortiz

𝒇𝑻 (𝒕)

Nivel de
Confiabilidad
(1 – α)
α/2 0,95 α / 2 = 0,025

𝑇~ 𝑡𝑛−1 ~ 𝑡7
−𝑡0 µ=0 𝑡0 = 2,365

Reemplazando valores, se tiene:

6,232 6,232
𝑃 [5,625 − 2,365 ≤ 𝜇𝐷 ≤ 5,625 + 2,365 ] = 0,95
√8 √8

𝑃[5,625 − 5,211 ≤ 𝜇𝐷 ≤ 5,625 + 5,211] = 0,95

Finalmente,

𝑷[𝟎, 𝟒𝟏𝟒 ≤ 𝝁𝑫 ≤ 𝟏𝟎, 𝟖𝟑𝟔] = 𝟎, 𝟗𝟓

Con un nivel de confiabilidad del 95% se puede afirmar que no estando el cero (0)
comprendido en el intervalo de confiabilidad, las medias poblacionales no son iguales; al
contrario, 𝜇𝑋 es mayor a 𝜇𝑌 . Por tanto, el investigador tiene razón.

Ejercicios propuestos
1. Sea 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 una muestra aleatoria de una población que sigue una distribución
uniforme en el intervalo (a, b). Encontrar los estimadores de a y b utilizando el
método de los momentos.
2. Sea 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 una muestra aleatoria de una población cuya función de densidad
de probabilidad viene dada por:

𝑓𝑋 (𝑥; 𝜃) = 𝜃𝑋𝜃−1 ; 0 ≤ 𝑥 ≤ 1

Encontrar el estimador de máxima verosimilitud de 𝜃.

3. Un restaurant vegetariano afirma que una nueva dieta reducirá el peso de una
persona en 4,5 kg en promedio, en un periodo de dos semanas. Los pesos de siete
(7) damas fueron registrados antes y después de la dieta.

Peso antes de la dieta (kg) 58,5 60,3 61,7 69,0 64,0 62,6 56,7
Peso después de la dieta (kg) 60,0 54,9 58,1 62,1 58,5 59,9 54,4

Con un nivel de confiabilidad del 90% averiguar si la oferta del restaurant es real.

32
Estimación de parámetros Rubén Medinaceli Ortiz

4. Los siguientes datos expresados en días representan el tiempo de recuperación de


pacientes tratados al azar, con uno de los dos medicamentos (A y B) disponibles
para atacar infecciones graves en el estómago.

A 15 20 16 18 18 19 20 16 18 20 21 23
B 12 14 13 17 13 12 10 11 17 16

Con un nivel de confiabilidad del 95% averiguar si los dos medicamentos, en


promedio, garantizan en promedio el mismo tiempo de recuperación.

33

También podría gustarte