Estimación Puntual y Por Intervalo Revisado 2022

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 53

Estimación de parámetros Rubén Medinaceli Ortiz

ESTIMACIÓN DE PARÁMETROS

Tal como muestra la siguiente figura, dos caminos importantes en la inferencia estadística
son la estimación de parámetros y las pruebas de hipótesis.

Estimación
Puntual

Estimación de Estimación por


Parámetros intervalos

Inferencia
Estadística

Pruebas de
Hipótesis

En este tema se analizará la estimación de parámetros como una herramienta de la


inferencia estadística.

1. El problema de la estimación de parámetros

a) Se tiene una característica de interés representada por una variable aleatoria X,


cuya distribución, 𝑓𝑋 (𝑥), representa la población de la característica de interés.

b) Se asume que se conoce la forma de la distribución de la población, 𝑓𝑋 (𝑥), (Normal,


exponencial, uniforme, Poisson, etc.); sin embargo, la distribución 𝑓𝑋 (𝑥) contiene un
conjunto 𝜃 de parámetros desconocidos.

Por ejemplo,

1
Estimación de parámetros Rubén Medinaceli Ortiz

𝒇𝑿 (𝒙) (𝑃𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑐𝑎𝑟𝑎𝑐𝑡𝑒𝑟í𝑠𝑡𝑖𝑐𝑎 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟é𝑠)

𝝈𝟐

𝑋 (𝐶𝑎𝑟𝑎𝑐𝑡𝑒𝑟í𝑠𝑡𝑖𝑐𝑎 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟é𝑠)
𝝁

La forma de la distribución de la población es conocida, en este caso es normal; vale decir,


la variable aleatoria 𝑿 sigue una distribución normal.

Sin embargo, contiene un conjunto 𝜽 = {𝝁; 𝝈𝟐 } de parámetros desconocidos. También


se utilizará el término 𝜃 para hacer referencia a alguno de los parámetros desconocidos de
la población.

c) Se asume que se tiene al menos una realización ( 𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑛 ) de una muestra


aleatoria de tamaño 𝑛, (𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋𝑛 ), de la población.

Por ejemplo,

𝒇𝑿 (𝒙)

𝝈𝟐

𝑋
𝝁

𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋𝑛 (𝑀𝑢𝑒𝑠𝑡𝑟𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑡𝑎𝑚𝑎ñ𝑜 𝑛)

𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑛 (𝑅𝑒𝑎𝑙𝑖𝑧𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎)

d) Tomando como base la muestra aleatoria de tamaño 𝑛 y su realización, se desea


estimar (asignar valores numéricos) cada uno de los parámetros que incluye el
conjunto de parámetros desconocidos, 𝜽.

2
Estimación de parámetros Rubén Medinaceli Ortiz

La estimación de los parámetros desconocidos de una población se puede efectuar de dos


maneras:

a) Una estimación puntual referida a definir un estadístico (recuerde que un


estadístico es una variable aleatoria que es función solo de variables aleatorias
observables o medibles), por ejemplo, 𝑇 = 𝑡(𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ), que estime el valor real
del parámetro desconocido.

b) Una estimación por intervalos referida a definir dos estadísticos 𝑇1 =


𝑡1 (𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) y 𝑇2 = 𝑡2 (𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) tales que:

𝑇1 < 𝑇2

De tal forma que 𝑇1 = 𝑡1 (𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) y 𝑇2 = 𝑡2 (𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) definen un intervalo


que, con cierta probabilidad contiene al valor real del parámetro desconocido.

Por ejemplo,
Se tiene la siguiente población:
𝒇𝑿 (𝒙)

Distribución normal

𝝈𝟐

𝑋
𝝁

𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋𝑛 (𝑀𝑢𝑒𝑠𝑡𝑟𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑡𝑎𝑚𝑎ñ𝑜 𝑛)

𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑛 (𝑅𝑒𝑎𝑙𝑖𝑧𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎)

Forma de la distribución de la población, 𝑓𝑋 (𝑥): Normal (conocida)

Parámetros desconocidos: 𝜽 = {𝝁; 𝝈𝟐 }

Posible estimador puntual del parámetro 𝝁:


𝑛
1
𝑇 = 𝑡(𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) = 𝑋̅ = ∑ 𝑋𝑖
𝑛
𝑖=1

Posible estimador puntual del parámetro 𝝈𝟐 :

3
Estimación de parámetros Rubén Medinaceli Ortiz

𝑛
1
𝑇 = 𝑡(𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) = 𝑆2 = ∑(𝑋𝑖 − 𝑋̅)2
𝑛−1
𝑖=1

Posible estimador por intervalos del parámetro 𝝁:

𝑆
𝑇1 = 𝑡1 (𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) = 𝑋̅ − 2
√𝑛

𝑆
𝑇2 = 𝑡2 (𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) = 𝑋̅ + 2
√𝑛

𝑆 𝑆
𝑃 [𝑋̅ − 2 ≤ 𝜇 ≤ 𝑋̅ + 2 ]=1−𝛼
√𝑛 √𝑛

A continuación, se presentan elementos relacionados con la estimación puntual;


posteriormente, se presentarán aspectos relacionados con la estimación por intervalos.

2. Estimación puntual

2.1. Definición

Cualquier estadístico (variable aleatoria función solo de variables aleatorias observables o


medibles) cuyos valores son utilizados para estimar, por ejemplo, el parámetro 𝜇, se define
como un estimador del parámetro 𝜇.

Se adopta la siguiente convención: el estadístico (variable aleatoria) que es utilizado para


estimar un parámetro recibe el nombre de estimador del parámetro; y, el valor que toma
el estadístico recibe el nombre de estimación o valor estimado del parámetro. De esta
manera, la palabra estimador está referida a la función de variables aleatorias observables
y la palabra estimación está referida a un valor de dicha función.

Por ejemplo,
𝑛
1
𝑋̅ = ∑ 𝑋𝑖
𝑛
𝑖=1

Es un estimador de la media µ; y,
𝑛
1
𝑥̅ = ∑ 𝑥𝑖
𝑛
𝑖=1

Es una estimación o valor estimado de µ

La estimación puntual admite dos problemas:

• Obtener estadísticos que puedan utilizarse como estimadores de los parámetros


de una población

4
Estimación de parámetros Rubén Medinaceli Ortiz

• Definir criterios para encontrar el mejor estimador entre los muchos estimadores
posibles.

2.2. Métodos para encontrar estimadores puntuales

Se tiene una variedad de métodos para encontrar estimadores puntuales de parámetros.


En esta oportunidad se presenta dos de estos métodos, probablemente los más
importantes:

• El método de los momentos

• El método de máxima verosimilitud

2.2.1. El método de los momentos

Momentos poblacionales

Si X es una variable aleatoria (característica de interés en el muestreo y la estimación de


parámetros), el r-avo momento de X, denotado por 𝜇𝑟 , se define como:

𝜇𝑟 = 𝐸[𝑋𝑟 ]

Nótese que,

𝜇1 = 𝐸[𝑋] = 𝜇

En palabras, el primer momento de una variable aleatoria X es su media.

Nótese además que,

𝜇2 = 𝐸[𝑋2 ]

Recordando que,

𝑉𝑎𝑟[𝑋] = 𝐸[𝑋2 ] − 𝜇2

𝑉𝑎𝑟[𝑋] = 𝜇2 − 𝜇12

En palabras, la varianza de una variable aleatoria X es igual a su segundo momento menos


su primer momento al cuadrado.

Momentos muestrales

Si 𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋𝑛 es una muestra aleatoria de tamaño n, el r-avo momento muestral,


denotado por 𝑀𝑟 , se define como:
𝑛
1
𝑀𝑟 = ∑ 𝑋𝑖𝑟
𝑛
𝑖=1

5
Estimación de parámetros Rubén Medinaceli Ortiz

Nótese que,
𝑛
1
𝑀1 = ∑ 𝑋𝑖 = 𝑋̅
𝑛
𝑖=1

En palabras, el primer momento muestral es la media de la muestra.

Nótese además que,


𝑛
1
𝑀2 = ∑ 𝑋𝑖2
𝑛
𝑖=1

El método de los momentos consiste en resolver el siguiente sistema de ecuaciones:

𝜇𝑟 = 𝑀𝑟 ; 𝑟 = 1, 2, 3, ⋯

2.2.2. Ejercicio 1

Problema:

Sea 𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋𝑛 una muestra aleatoria de una población que sigue una distribución
normal con media 𝝁 y varianza 𝝈𝟐 .

𝒇𝑿 (𝒙)

Distribución normal

𝝈𝟐

𝑋
𝝁

𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋𝑛 (𝑀𝑢𝑒𝑠𝑡𝑟𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑡𝑎𝑚𝑎ñ𝑜 𝑛)

Encontrar los estimadores de 𝝁 𝑦 𝝈𝟐 , utilizando el método de los momentos.

Solución:

Sistema de ecuaciones:

𝜇1 = 𝑀1

6
Estimación de parámetros Rubén Medinaceli Ortiz

𝜇2 = 𝑀2

Estimador de µ

𝜇1 = 𝑀1

Donde,

𝜇1 = 𝐸[𝑋] = 𝜇
𝑛
1
𝑀1 = ∑ 𝑋𝑖
𝑛
𝑖=1

Por tanto,
𝒏
𝟏
̅
̂ = ∑ 𝑿𝒊 = 𝑿
𝝁
𝒏
𝒊=𝟏

Estimador de σ2

𝑉𝑎𝑟[𝑋] = 𝜎 2 = 𝜇2 − 𝜇12

𝜇2 = 𝑀2

Esto es,
𝑛
1
𝜇2 = ∑ 𝑋𝑖2
𝑛
𝑖=1

Por tanto,
𝑛
1
𝜎̂ 2 = ∑ 𝑋𝑖2 − 𝜇12
𝑛
𝑖=1

Finalmente,
𝒏
𝟏
̂𝟐
𝝈 ̅𝟐
= ∑ 𝑿𝟐𝒊 − 𝑿
𝒏
𝒊=𝟏

7
Estimación de parámetros Rubén Medinaceli Ortiz

2.2.3. Ejercicio 2

Problema:

Sea 𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋𝑛 una muestra aleatoria de una población que sigue una distribución
de Poisson.

𝑓𝑋 (𝑥)

Distribución de Poisson


𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋𝑛 (𝑀𝑢𝑒𝑠𝑡𝑟𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑡𝑎𝑚𝑎ñ𝑜 𝑛)

𝑒 −𝜆 𝜆𝑥
𝑓𝑋 (𝑥) = ; 𝑥 = 0, 1, 2, 3, ⋯
𝑥!

𝐸[𝑋] = 𝜇 = 𝜆

𝑉𝑎𝑟[𝑋] = 𝜎𝑋2 = 𝜆

Parámetro: λ

Encontrar un estimador de 𝜆, utilizando el método de los momentos

Solución:

La distribución de Poisson tiene un solo parámetro, por tanto:

𝜇1 = 𝑀1

Donde:

𝜇1 = 𝐸[𝑋] = 𝜆
𝑛
1
𝑀1 = ∑ 𝑋𝑖 = 𝑋̅
𝑛
𝑖=1

Por tanto,

8
Estimación de parámetros Rubén Medinaceli Ortiz

𝝀̂ = 𝑿
̅

2.2.4. Ejercicio 3

Problema:

Sea 𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋𝑛 una muestra aleatoria de una población que sigue una distribución
exponencial

𝑓𝑋 (𝑥)

Distribución exponencial

𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋𝑛 (𝑀𝑢𝑒𝑠𝑡𝑟𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑡𝑎𝑚𝑎ñ𝑜 𝑛)

𝑓𝑋 (𝑥) = 𝜆𝑒 −𝜆𝑥 ; 𝑥 ≥ 0

1
𝐸[𝑋] = 𝜇 =
𝜆
1
𝑉𝑎𝑟[𝑋] = 𝜎𝑋2 =
𝜆2

Parámetro: λ

Encontrar un estimador de 𝜆 , utilizando el método de los momentos

Solución:

La distribución exponencial tiene un solo parámetro, por tanto:

𝜇1 = 𝑀1

Donde:

1
𝜇1 = 𝐸[𝑋] =
𝜆

9
Estimación de parámetros Rubén Medinaceli Ortiz

𝑛
1
𝑀1 = ∑ 𝑋𝑖 = 𝑋̅
𝑛
𝑖=1

Por tanto,


= 𝑋̅
𝜆

De donde,

𝟏
𝝀̂ = ̅
𝑿

2.2.5. Método de máxima verosimilitud

Para introducir el método de máxima verosimilitud, considere el siguiente problema sencillo


de estimación. Suponga que una bolsa contiene cierto número de bolas de billar blancas y
cierto número de bolas negras, y se sabe que la razón de estos números es igual a 3 a 1
pero no se sabe si las bolas negras o las bolas blancas son las más numerosas. Esto es,
1 3
la probabilidad de seleccionar una bola de billar negra es ó .
4 4

Ahora bien, si se extrae n bolas de billar una tras otra y con reemplazo, la distribución de la
variable aleatoria X definida como el número de bolas negras en la selección efectuada, es
binomial; esto es,

𝑛
𝑓𝑋 (𝑥) = ( ) 𝑝 𝑥 𝑞 𝑛−𝑥 ; 𝑥 = 0, 1, 2, ⋯ , 𝑛
𝑥
1 3
Donde, 𝑞 = 1 − 𝑝 𝑦 𝑝 es la probabilidad de seleccionar una bola negra. Aquí, 𝑝 = ó 𝑝 =
4 4

Como muestra aleatoria, se selecciona tres bolas de billar al azar y con reemplazo y con el
resultado que se obtenga, intentar estimar el parámetro desconocido 𝑝.

El problema de estimación es particularmente simple en este caso, ya que se tiene que


1 3
escoger solamente entre dos valores ó .
4 4

Los posibles resultados y sus probabilidades para cada uno de los dos valores de 𝑝 se
muestran en la siguiente tabla:

X 0 1 2 3
p = 3/4 1/ 64 9/64 27/64 27/64
p = 1/4 27/64 27/64 9/64 1/64

Nótese que si en la muestra (selección de tres bolas de billar una tras otra y con reemplazo)
1
se obtiene cero (0) o una (1) bola de billar negra, el valor más probable de 𝑝 es ; vale
4
decir, que en la bolsa hay tres veces más bolas blancas que negras. En cambio, si se

10
Estimación de parámetros Rubén Medinaceli Ortiz

3
obtiene dos (2) o tres (3) bolas blancas en la muestra, el valor más probable de 𝑝 es ; vale
4
decir que en la bolsa hay tres veces más bolas negras que blancas.

Un estimador de máxima verosimilitud elige para cada resultado de la muestra el valor de


𝑝 más probable.

En general, si se tuviera más valores alternativos para 𝑝, se procedería razonablemente de


la misma manera. Así, si se encuentra que 𝑿 = 𝟔 en una muestra de 25 selecciones
(𝒏 = 𝟐𝟓), se debe sustituir todos los valores posibles de 𝑝 en la siguiente expresión
(distribución binomial):

25 6
𝑓𝑋 (𝑥) = ( ) 𝑝 (1 − 𝑝)16 ; 0 ≤ 𝑝 ≤ 1
6

Y seleccionar como valor estimado aquel valor de 𝑝 que maximice 𝑓𝑋 (𝑥). Esto es
equivalente a derivar 𝑓𝑋 (𝑥) con respecto a 𝑝, igualar la derivada a cero (0) y resolver la
ecuación resultante para 𝑝.

Este ejemplo exhibe la base (fundamento) del método de máxima verosimilitud (máxima
probabilidad) para encontrar estimadores, y establece la metodología a seguir.

Para definir los estimadores de máxima verosimilitud, es importante definir primero la


función de verosimilitud.

2.2.6. Función de verosimilitud

Si 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 es una muestra aleatoria de una población, 𝑓𝑋 (𝑥) cuyo conjunto de


parámetros desconocidos es 𝜃; la función de verosimilitud de la población 𝑓𝑋 (𝑥), denotada
por 𝐿(𝜃; 𝑋1 , 𝑋2 , ⋯ 𝑋𝑛 ) se define como:

𝐿(𝜃; 𝑋1 , 𝑋2 , ⋯ 𝑋𝑛 ) = 𝑓𝑋1,𝑋2,⋯,𝑋𝑛 (𝑥1 , 𝑥2 , ⋯ , 𝑥𝑛 ) = 𝑓𝑋1 (𝑥1 )𝑓𝑋2 (𝑥2 ) ⋯ 𝑓𝑋𝑛 (𝑥𝑛 )

2.2.7. Estimador de máxima verosimilitud

Sea,

𝐿(𝜃) = 𝐿(𝜃; 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 )

La función de verosimilitud de una población 𝑓𝑋 (𝑥) de la cual se tiene una muestra aleatoria
de tamaño 𝑛, 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛

Si 𝜃̂ es el valor de 𝜃 que maximiza 𝐿(𝜃); luego, 𝜽


̂ es el estimador de máxima verosimilitud
del parámetro 𝜽.

Si 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 es una muestra aleatoria de una población 𝑓𝑋 (𝑥), y su función de


verosimilitud viene dada por,

𝐿(𝜃) = 𝑓𝑋1 (𝑥1 )𝑓𝑋2 (𝑥2 ) ⋯ 𝑓𝑋𝑛 (𝑥𝑛 ).

11
Estimación de parámetros Rubén Medinaceli Ortiz

El estimador de máxima verosimilitud 𝜃̂ del parámetro 𝜃, es la solución a la siguiente


ecuación,

𝑑𝐿(𝜃)
=0
𝑑𝜃

Se ha señalado que el estimador de máxima verosimilitud del parámetro 𝜃, es el valor de 𝜃


que maximiza 𝐿(𝜃). Por tanto, corresponde derivar 𝐿(𝜃) con respecto a 𝜃, igualar esta
derivada a cero (0) y resolver la ecuación para 𝜃.

También es útil recordar que tanto 𝐿(𝜃) como 𝐿𝑛 𝐿(𝜃) tienen su máximo para el mismo valor
de 𝜃.

A veces es más fácil encontrar el valor de 𝜃 que maximiza el logaritmo natural de la función
de verosimilitud.

2.2.8. Ejercicio 4

Problema:

Sea 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 una muestra aleatoria de una población que tiene una distribución de
Bernoulli.

𝑓𝑋 (𝑥)

0 1 𝑋

𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛

𝑓𝑋 (𝑥) = 𝑝 𝑥 𝑞1−𝑥 ; 𝑥 = 0, 1; 𝑞 = 1 − 𝑝

Parámetro: 𝑝

Encontrar el estimador de máxima verosimilitud de 𝑝

Solución:

La función de verosimilitud viene dada por:


𝑛

𝐿(𝜃; 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) = ∏ 𝑝 𝑥𝑖 𝑞1−𝑥𝑖 = 𝑝 ∑ 𝑥𝑖 𝑞 𝑛−∑ 𝑥𝑖


𝑖=1

12
Estimación de parámetros Rubén Medinaceli Ortiz

Si se denomina 𝑦 a ∑ 𝑥𝑖

𝐿(𝜃; 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) = 𝑝 𝑦 𝑞 𝑛−𝑦

𝐿∗ = 𝐿𝑛 𝐿(𝜃; 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) = 𝑦 𝐿𝑛 𝑝 + (𝑛 − 𝑦) 𝐿𝑛 𝑞

𝜕𝐿∗ 1 1
= 𝑦 − (𝑛 − 𝑦) = 0
𝜕𝑝 𝑝 𝑞
𝑦 𝑛 𝑦
− + =0
𝑝 𝑞 𝑞

𝑦𝑞 − 𝑛𝑝 + 𝑦𝑝
=0
𝑝𝑞

𝑦𝑞 − 𝑛𝑝 + 𝑦𝑝 = 0

𝑦(𝑞 + 𝑝) − 𝑛𝑝 = 0

𝑦 ∑ 𝑥𝑖
𝑝= =
𝑛 𝑛

Por tanto, el estimador de máxima verosimilitud de 𝑝 viene dado por:


𝒏
𝟏
̅
̂ = ∑ 𝑿𝒊 = 𝑿
𝒑
𝒏
𝒊=𝟏

2.2.9. Ejercicio 5

Problema:

Sea 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 una muestra aleatoria de una población que tiene una distribución normal
con media 𝜇 y varianza 𝜎 2 .

13
Estimación de parámetros Rubén Medinaceli Ortiz

𝒇𝑿 (𝒙)

Distribución normal

𝝈𝟐 (𝛼)

𝑋
𝝁

𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋𝑛 (𝑀𝑢𝑒𝑠𝑡𝑟𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑡𝑎𝑚𝑎ñ𝑜 𝑛)

1 1 2 1 1 2
𝑓𝑋 (𝑥) = 𝑒 − 2𝛼(𝑥−𝜇) = 𝑒 − 2𝛼(𝑥−𝜇) ; −∞ ≤ 𝑥 ≤ ∞
√2𝜋𝜎 √2𝜋𝛼

Solo por comodidad en la notación se utiliza 𝛼 = 𝜎 2

Parámetros: 𝝁 y σ2 (α)

Obtener los estimadores de máxima verosimilitud de 𝝁 y σ2 (α)

Solución:

La función de verosimilitud viene dada por:

𝑛 𝑛
1 1
− 2𝛼 (𝑥−𝜇)2 1 2 − 1 ∑(𝑥𝑖 −𝜇)2
𝐿(𝜃; 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) = ∏ 𝑒 = ( ) 𝑒 2𝛼
√2𝜋𝛼 2𝜋𝛼
𝑖=1

𝑛 𝑛 1
𝐿∗ = 𝐿𝑛 𝐿(𝜃; 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) = − 𝐿𝑛 2𝜋 − 𝐿𝑛 𝛼 − ∑(𝑥𝑖 − 𝜇)2
2 2 2𝛼

𝜕𝐿∗ 1
= −2 ∑(𝑥𝑖 − 𝜇)(−1) = 0
𝜕𝜇 2𝛼

∑ 𝑥𝑖 − 𝑛𝜇 = 0

𝑛
1
𝜇 = ∑ 𝑥𝑖
𝑛
𝑖=1

Por tanto, el estimador de máxima verosimilitud de 𝜇 viene dado por:


𝒏
𝟏
̅
̂ = ∑ 𝑿𝒊 = 𝑿
𝝁
𝒏
𝒊=𝟏

14
Estimación de parámetros Rubén Medinaceli Ortiz

𝜕𝐿∗ 𝑛 1 𝛼 −2
=− + ∑(𝑥𝑖 − 𝜇)2 =0
𝜕𝛼 2𝛼 2

𝑛 ∑(𝑥𝑖 − 𝜇)2
− + =0
2𝛼 2𝛼 2

−𝑛𝛼 + ∑(𝑥𝑖 − 𝜇)2


=0
2𝛼 2

∑(𝑥𝑖 − 𝑋̅)2
𝛼= ; 𝑋̅ 𝑒𝑠 𝑒𝑙 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟 𝑑𝑒 𝑚á𝑥𝑖𝑚𝑎 𝑣𝑒𝑟𝑜𝑠𝑖𝑚𝑖𝑙𝑖𝑡𝑢𝑑 𝑑𝑒 𝜇
𝑛

Por tanto, el estimador de máxima verosimilitud de σ2 viene dado por:


𝒏
𝟏
̂=
𝜶 ̂𝟐
𝝈 ̅ )𝟐
= ∑(𝑿𝒊 − 𝑿
𝒏
𝒊=𝟏

2.2.10. Ejercicio 6

Problema:

Sea 𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋𝑛 una muestra aleatoria de una población que sigue una distribución
de Poisson.

𝑓𝑋 (𝑥)

Distribución de Poisson


𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋𝑛 (𝑀𝑢𝑒𝑠𝑡𝑟𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑡𝑎𝑚𝑎ñ𝑜 𝑛)

𝑒 −𝜆 𝜆𝑥
𝑓𝑋 (𝑥) = ; 𝑥 = 0, 1, 2, 3, ⋯
𝑥!

𝐸[𝑋] = 𝜇 = 𝜆

𝑉𝑎𝑟[𝑋] = 𝜎𝑋2 = 𝜆

15
Estimación de parámetros Rubén Medinaceli Ortiz

Parámetro: λ

Encontrar el estimador de máxima verosimilitud del parámetro 𝜆.

Solución:

La función de verosimilitud viene dada por:


𝑛
𝑒 −𝜆 𝜆𝑥𝑖 𝜆𝑥1 𝑒 −𝜆 𝜆𝑥2 𝑒 −𝜆 𝜆𝑥𝑛 𝑒 −𝜆 𝜆𝑥1 +𝑥2+⋯+𝑥𝑛 𝑒 −𝑛𝜆
𝐿(𝜃; 𝑋, 𝑋2 , ⋯ , 𝑋𝑛 ) = ∏ = ⋯ =
𝑥𝑖 ! 𝑥1 ! 𝑥2 ! 𝑥𝑛 ! 𝑥1 ! 𝑥2 ! ⋯ 𝑥𝑛 !
𝑖=1

𝜆∑ 𝑥𝑖 𝑒 −𝑛𝜆
𝐿(𝜃; 𝑋, 𝑋2 , ⋯ , 𝑋𝑛 ) =
𝑥1 ! 𝑥2 ! ⋯ 𝑥𝑛 !

𝐿∗ = 𝐿𝑛 𝐿(𝜃; 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) = ∑ 𝑥𝑖 𝐿𝑛 𝜆 − 𝑛 𝜆 − ∑ 𝐿𝑛 𝑥𝑖 !

𝜕𝐿∗ 1
= ∑ 𝑥𝑖 − 𝑛 = 0
𝜕𝜆 𝜆
𝑛
1
𝜆 = ∑ 𝑥𝑖 = 𝑋̅
𝑛
𝑖=1

Por tanto, el estimador de máxima verosimilitud de 𝜆 es:


𝒏
𝟏
𝝀̂ = ∑ 𝑿𝒊 = 𝑿
̅
𝒏
𝒊=𝟏

2.2.11. Ejercicio 7

Problema:

Sea 𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋𝑛 una muestra aleatoria de una población que sigue una distribución
exponencial.

16
Estimación de parámetros Rubén Medinaceli Ortiz

𝑓𝑋 (𝑥)

Distribución exponencial

𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋𝑛 (𝑀𝑢𝑒𝑠𝑡𝑟𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑡𝑎𝑚𝑎ñ𝑜 𝑛)

𝑓𝑋 (𝑥) = 𝜆𝑒 −𝜆𝑥 ; 𝑥 ≥ 0

1
𝐸[𝑋] = 𝜇 =
𝜆
1
𝑉𝑎𝑟[𝑋] = 𝜎𝑋2 =
𝜆2

Parámetro: λ

Encontrar el estimador de máxima verosimilitud de 𝜆 .

Solución:

La función de verosimilitud viene dada por:


𝑛

𝐿(𝜃; 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) = ∏ 𝜆𝑒 −𝜆𝑥𝑖 = 𝜆𝑒 −𝜆𝑥1 𝜆𝑒 −𝜆𝑥2 ⋯ 𝜆𝑒 −𝜆𝑥𝑛 = 𝜆𝑛 𝑒 − ∑ 𝜆𝑥𝑖 = 𝜆𝑛 𝑒 −𝜆 ∑ 𝑥𝑖


𝑖=1

𝐿∗ = 𝐿𝑛 𝐿(𝜃; 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) = 𝑛 𝐿𝑛 𝜆 − 𝜆 ∑ 𝑥𝑖

𝜕𝐿∗ 1
= 𝑛 − ∑ 𝑥𝑖 = 0
𝜕𝜆 𝜆
1 1
= ∑ 𝑥𝑖
𝜆 𝑛
1
𝜆=
1
∑ 𝑥𝑖
𝑛

Por tanto, el estimador de máxima verosimilitud de λ viene dado por:

17
Estimación de parámetros Rubén Medinaceli Ortiz

𝟏 𝟏
𝝀̂ = =̅
𝟏 𝒏 𝑿
∑ 𝑿
𝒏 𝒊=𝟏 𝒊

2.2.12. Propiedad de invarianza de los estimadores de máxima


verosimilitud

Esta propiedad afirma que si 𝜃̂ es el estimador de máxima verosimilitud del parámetro 𝜃;


luego, 𝜏(𝜃̂ ) es un estimador de máxima verosimilitud de 𝜏(𝜃).

Por ejemplo, en el Ejercicio 5 se obtuvo el siguiente estimador de máxima verosimilitud para


la varianza (𝜎 2 ) de una población que sigue una distribución normal:
𝑛
1
𝜎̂ 2 = ∑(𝑋𝑖 − 𝑋̅)2
𝑛
𝑖=1

Ahora, se desea obtener el estimador de máxima verosimilitud de la desviación estándar


(𝜎)

Como,

𝜏(𝜃) = √𝜃

Según la propiedad de invarianza de los estimadores de máxima verosimilitud, el estimador


de máxima verosimilitud de la desviación estándar (𝜎) vendrá dado por:

𝑛
1
𝜎̂ = √ ∑(𝑋𝑖 − 𝑋̅)2
𝑛
𝑖=1

Como otro ejemplo, en el Ejercicio 7, se ha obtenido el estimador de máxima verosimilitud


del parámetro 𝜆 de una población que sigue una distribución exponencial,

1
𝜆̂ = ̅
𝑋

La media de una variable aleatoria que sigue una distribución exponencial viene dada por,

1
𝐸[𝑋] = 𝜇 =
𝜆

Por tanto,

1
𝜏(𝜃) =
𝜆

18
Estimación de parámetros Rubén Medinaceli Ortiz

Consecuentemente, según la propiedad de invarianza de los estimadores de máxima


verosimilitud, el estimador de máxima verosimilitud de la media de la distribución
exponencial, será igual a,


= 𝑋̅
𝜆

De igual manera, el estimador de máxima verosimilitud de la varianza de una población


exponencial vendrá dado por,

̂
1
= 𝑋̅ 2
𝜆2

2.3. Propiedades de los estimadores puntuales

Se han presentado básicamente dos métodos para obtener estimadores puntuales, tal
como se ha dicho, hay más métodos. Estos métodos obedecen a bases más o menos
intuitivas. La pregunta que ahora surge es: ¿son algunos estimadores mejores, en algún
sentido, que otros?

A continuación, se menciona algunas de las propiedades que los estimadores pueden o no


tener y que pueden ayudar a decidir si un estimador es mejor que otro.

2.3.1. Error cuadrático medio

Sea 𝑇 = 𝑡(𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) un estimador del parámetro 𝜃;

Luego,

El error cuadrático medio del estimador 𝑇 = 𝑡(𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ), denotado por 𝐸𝐶𝑀, se define
como,

𝐸𝐶𝑀 = 𝐸[(𝑇 − 𝜃)2 ]

Nótese que,

𝐸𝐶𝑀 = 𝐸[(𝑇 − 𝜃)2 ] = 𝑉𝑎𝑟[𝑇]

En palabras, el error cuadrático medio es una medida de la dispersión de los valores de


𝑇 = 𝑡(𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) respecto de 𝜃.

Si se utilizara el error cuadrático medio para comparar estimadores, obviamente se


preferiría aquel que tenga el error cuadrático medio más pequeño; sin embargo, en general,
el error cuadrático medio de un estimador depende del parámetro 𝜃.

Para dos estimadores cualesquiera 𝑇1 = 𝑡1 (𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) y 𝑇2 = 𝑡2 (𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) de 𝜃, sus


respectivos errores cuadráticos medios 𝐸𝐶𝑀1 y 𝐸𝐶𝑀2 como funciones de 𝜃, probablemente
se crucen tal como se muestra en la siguiente figura; para algunos valores de 𝜃, 𝑇1 tiene el

19
Estimación de parámetros Rubén Medinaceli Ortiz

menor 𝐸𝐶𝑀, y para otros valores de 𝜃, 𝑇2 tiene el 𝐸𝐶𝑀 más pequeño; consecuentemente,
sería inconsistente recurrir al 𝐸𝐶𝑀 para preferir uno de los estimadores sobre el otro.

𝐸𝐶𝑀1

𝐸𝐶𝑀2

2.3.2. Estimador insesgado

Un estimador 𝑇 = 𝑡(𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) se define como un estimador insesgado del parámetro


𝜽, si y solamente si,

𝐸[𝑇] = 𝐸[𝑡(𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 )] = 𝜃

En palabras, 𝑇 es un estimador insesgado de 𝜃 si la media, esperanza o valor esperado del


estimador (variable aleatoria) 𝑇 es igual al parámetro que se está estimando, 𝜃.

Si se restringe los posibles estimadores del parámetro 𝜃 solamente a los estimadores


insesgados de 𝜃, es posible esperar que se encontrará un estimador que tenga el error
cuadrático medio más pequeño y uniforme.

2.3.3. Estimadores insesgados de varianza mínima (EIVM)

Sea 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 una muestra aleatoria de una población 𝑓𝑋 (𝑥) que tiene parámetros
desconocidos

Luego,

𝑇 ∗ = 𝑡 ∗ (𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) es un estimador insesgado de varianza mínima de 𝜃 si y solamente


si,

a) 𝐸[𝑇 ∗ ] = 𝜃 (𝑇 ∗ es un estimador insesgado de 𝜃)

b) Si 𝑇 es cualquier otro estimador insesgado de 𝜃; luego,

𝑉𝑎𝑟[𝑇 ∗ ] < 𝑉𝑎𝑟[𝑇]; ∀ 𝜃

Por tanto, buscar un estimador con el menor error cuadrático medio entre los estimadores
insesgados es equivalente a buscar el estimador con la menor varianza entre los
estimadores insesgados.

Consecuentemente, el mejor estimador de un parámetro 𝜃 es insesgado y de varianza


mínima.

20
Estimación de parámetros Rubén Medinaceli Ortiz

2.3.3.1. Ejercicio

Problema:

Considere que 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 (𝑛 > 2) es una muestra aleatoria de una población que sigue
una distribución normal con media 𝜇 y varianza 𝜎 2 .

Asuma que 𝜎 2 (la varianza de la población) es conocida.

Se desea estimar 𝜇

Se proponen los siguientes estimadores para estimar 𝜇:

𝑇1 = 𝑋1

𝑋1 + 𝑋𝑛
𝑇2 =
2

∑𝑛𝑖=1 𝑋𝑖
𝑇3 = = 𝑋̅
𝑛

Averiguar cuál de los estimadores propuestos es el mejor estimador de 𝜇.

Solución:

Inicialmente se averigua si estos estimadores son insesgados.

𝐸[𝑇1 ] = 𝐸[𝑋1 ] = 𝜇 (𝑝𝑜𝑟 𝑑𝑒𝑓𝑖𝑛𝑖𝑐𝑖ó𝑛 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎)

𝑋1 + 𝑋𝑛 1 1 1
𝐸[𝑇2 ] = 𝐸 [ ] = 𝐸[𝑋1 + 𝑋2 ] = {𝐸[𝑋1 ] + 𝐸[𝑋2 ]} = {𝜇 + 𝜇} = 𝜇
2 2 2 2
𝑛
1 1 1
𝐸[𝑇3 ] = 𝐸[𝑋̅] = 𝐸 [ ∑ 𝑋𝑖 ] = 𝐸[𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛 ] = {𝐸[𝑋1 ] + 𝐸[𝑋2 ] + ⋯ + 𝐸[𝑋𝑛 ]}
𝑛 𝑛 𝑛
𝑖=1
1
𝐸[𝑇3 ] = {𝜇 + 𝜇 + ⋯ + 𝜇} = 𝜇
𝑛

Nótese que los tres estimadores son insesgados; vale decir, en promedio son iguales al
parámetro que se desea estimar.

Las varianzas de cada uno de estos estimadores son:

𝑉𝑎𝑟[𝑇1 ] = 𝑉𝑎𝑟[𝑋1 ] = 𝜎 2 (𝑝𝑜𝑟 𝑑𝑒𝑓𝑖𝑛𝑖𝑐𝑖ó𝑛 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎)

𝑋1 + 𝑋𝑛 1 1 1 𝜎2
𝑉𝑎𝑟[𝑇2 ] = 𝑉𝑎𝑟 [ ] = 𝑉𝑎𝑟[𝑋1 + 𝑋2 ] = {𝑉𝑎𝑟[𝑋1 ] + 𝑉𝑎𝑟[𝑋2 ]} = {𝜎 2 + 𝜎 2 } =
2 4 4 4 2

21
Estimación de parámetros Rubén Medinaceli Ortiz

𝑛
1 1
𝑉𝑎𝑟[𝑇3 ] = 𝑉𝑎𝑟[𝑋̅] = 𝑉𝑎𝑟 [ ∑ 𝑋𝑖 ] = 2 𝑉𝑎𝑟[𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛 ]
𝑛 𝑛
𝑖=1

1 1 2 2 + ⋯ + 𝜎2} =
1 2 =
𝜎2
𝑉𝑎𝑟[𝑇3 ] = {𝑉𝑎𝑟[𝑋1 ] + 𝑉𝑎𝑟[𝑋2 ] + ⋯ + 𝑉𝑎𝑟[𝑋𝑛 ]} = {𝜎 + 𝜎 𝑛𝜎
𝑛2 𝑛2 𝑛2 𝑛

Si 𝑛 > 2;

𝑻𝟑 es el estimador insesgado que tiene la menor varianza; por tanto, entre los tres
estimadores propuestos, es el mejor estimador de 𝝁.

2.3.4. Desigualdad de Cramér – Rao

En el ejercicio anterior, surge la siguiente pregunta: ¿no existirá un otro estimador


insesgado de 𝝁 que tenga una menor varianza que 𝑻𝟑 ?

En general, para averiguar si un estimador 𝑇 tiene la menor varianza posible, se debe


averiguar si la siguiente desigualdad, denominada desigualdad de Cramér-Rao, se
cumple para el estimador 𝑇:

[𝜏′(𝜃)]
𝑉𝑎𝑟[𝑇] ≥ 2
𝜕
𝑛𝐸 [{ 𝑙𝑛𝑓𝑋 (𝑥)} ]
𝜕𝜃

Donde, 𝜏 ′ (𝜃) es la primera derivada de la función 𝜏 del parámetro 𝜃 repecto a 𝜃; y, 𝑓𝑋 (𝑥) es


la distribución de la población.

Si esta desigualdad se cumple, significará que el estimador 𝑇 es el estimador insesgado


de varianza mínima del parámetro 𝜽.

2.3.4. Ejercicio

Problema:

Averiguar si el estimador 𝑇3 , del ejercicio anterior, es el estimador insesgado de varianza


mínima de 𝝁.

Solución:

Evaluando la desigualdad de Cramér-Rao se tiene:

𝜃=𝜇

𝜏(𝜃) = 𝜇

𝜏 ′ (𝜃) = 1

22
Estimación de parámetros Rubén Medinaceli Ortiz

1 1 𝑥−𝜇 2
− 2( 𝜎 )
𝑓𝑋 (𝑥) = 𝑒
√2𝜋𝜎

1 𝑥−𝜇 2
𝐿𝑛 𝑓𝑋 (𝑥) = −𝐿𝑛 (√2𝜋𝜎) − ( )
2 𝜎
𝜕 𝑥−𝜇 1
𝐿𝑛 𝑓𝑋 (𝑥; 𝜃) = ( )
𝜕𝜇 𝜎 𝜎

2
𝜕 1 𝑥−𝜇 2 1 𝑥−𝜇 2
𝑛𝐸 [( 𝐿𝑛 𝑓𝑋 (𝑥; 𝜃)) ] = 𝑛𝐸 [{ ( )} ] = 𝑛 2 𝐸 [( ) ]
𝜕𝜇 𝜎 𝜎 𝜎 𝜎

Recordando que si,

𝑥−𝜇
𝑍= ~𝑁(0,1)
𝜎
𝑥−𝜇
𝐸[𝑍] = 𝐸 [ ]=0
𝜎
𝑥−𝜇 2
𝑉𝑎𝑟[𝑍] = 𝐸[(𝑍 − 𝜇𝑍 )2 ] = 𝐸[(𝑍 − 0)2 ] = 𝐸[𝑍 2 ] = 𝐸 [( ) ]=1
𝜎

Por tanto,

2
𝜕 𝑛
𝑛𝐸 [( 𝐿𝑛 𝑓𝑋 (𝑥; 𝜃)) ] = 2
𝜕𝜇 𝜎

Por tanto,

[𝜏′(𝜃)] 1 𝜎2
2 = 𝑛 =
𝜕 𝑛
𝑛𝐸 [{ 𝑙𝑛𝑓𝑋 (𝑥; 𝜃)} ] 𝜎 2
𝜕𝜃

Consecuentemente, en términos de la desigualdad de Cramér-Rao se tiene que,

𝜎2
𝑉𝑎𝑟[𝑇3 ] ≥
𝑛

Recordando que,

𝜎2
𝑉𝑎𝑟[𝑇3 ] =
𝑛

Es posible afirmar que,

23
Estimación de parámetros Rubén Medinaceli Ortiz

𝒏
𝟏
̅=
𝑻𝟑 = 𝑿 ∑ 𝑿𝒊
𝒏
𝒊=𝟏

Es un estimador insesgado y de varianza mínima de 𝜇

En otras palabras,
𝒏
𝟏
̅=
𝑻𝟑 = 𝑿 ∑ 𝑿𝒊
𝒏
𝒊=𝟏

Es el mejor estimador de 𝜇.

3. Estimación por intervalos

Como las estimaciones puntuales rara vez serán iguales a los parámetros que se supone
estiman, es deseable que una estimación puntual esté acompañada por alguna medida del
posible error de estimación.

Por ejemplo, una estimación puntual podría estar acompañada de algún intervalo alrededor
de ella junto con alguna medida de la seguridad de que el valor verdadero del parámetro
se encuentra dentro de dicho intervalo.

Vale decir, en lugar de inferir que el valor verdadero de un parámetro es un punto, se busca
inferir la probabilidad que el valor verdadero de un parámetro esté contenido en algún
intervalo. Consecuentemente, se está hablando de la denominada estimación de
intervalo.

Al igual que en la estimación puntual, el problema de la estimación de intervalo es doble.


Primero, se tiene el problema de encontrar estimadores de intervalo; y, segundo, está el
problema de determinar buenos u óptimos estimadores de intervalo.

3.1. Intervalo de confiabilidad

Sea 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 una muestra aleatoria de una población 𝑓𝑋 (𝑥).

Sean 𝑇1 = 𝑡1 (𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) y 𝑇2 = 𝑡2 (𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ) dos estadísticos tales que 𝑇1 < 𝑇2 .

Un intervalo de confiabilidad para el parámetro 𝜃, viene dado por,

𝑃[𝑇1 < 𝜃 < 𝑇2 ] = 1 − 𝛼

Donde:

𝑇1 = Límite inferior del intervalo


𝑇2 = Límite superior del intervalo
𝜃 = Parámetro
1−𝛼 = Nivel de confiabilidad

24
Estimación de parámetros Rubén Medinaceli Ortiz

𝛼 = Nivel de desconfianza

El nivel de confiabilidad (1 − 𝛼) es el grado de seguridad, certidumbre, confianza que se


tiene acerca de una afirmación estadística. Se mide en términos de probabilidad.

El nivel de desconfianza (𝛼) es el grado de inseguridad, incertidumbre, desconfianza,


asociado a una afirmación estadística. También se mide en términos de probabilidad

Para una misma afirmación estadística, se tiene que,

𝑁𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 + 𝑁𝑖𝑣𝑒𝑙 𝑑𝑒 𝑑𝑒𝑠𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 = 1

Vale decir,

1−𝛼+𝛼 =1

Gráficamente se tiene que,

Nivel de confiabilidad
1-α
𝛼 𝛼
2 2

𝑇1 𝑇2 Estadístico
𝜃
Intervalo de confiabilidad

Límite inferior Límite superior

3.1. Intervalos de confiabilidad para los parámetros de


poblaciones normales

Tal como se ha dicho anteriormente, la distribución normal juega un rol predominante en la


estadística. El teorema del límite central y otras razones anotadas anteriormente indican
que gran parte de las poblaciones de la vida real son representadas con éxito por la
distribución normal.

Es importante señalar que los resultados que se obtienen a continuación son válidos
principalmente para poblaciones que siguen una distribución normal; aunque, en atención
al teorema del límite central, estos resultados pueden ser igualmente válidos para
poblaciones no normales, cuando el tamaño de la muestra aleatoria es grande.

Sea 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 una muestra aleatoria de tamaño n de una población que sigue una
distribución normal con media µ y varianza σ2. Esto es:

25
Estimación de parámetros Rubén Medinaceli Ortiz

𝒇𝑿 (𝒙)

Distribución normal

σ2

𝑋
µ

𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋𝑛 (Muestra aleatoria de tamaño n)


𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑛 (Realización de la muestra aleatoria)
𝑛
1
𝑋̅ = ∑ 𝑋𝑖
𝑛
𝑖=1

Es la media de la muestra; y,
𝑛
1
𝑆2 = ∑(𝑋𝑖 − 𝑋̅)2
𝑛−1
𝑖=1

Es la varianza de la muestra.

3.2.1. Intervalos de confiabilidad para la media µ

Tal como se ha visto anteriormente, el mejor estimador (insesgado y de varianza mínima)


de µ es 𝑋̅.
Recuerde que,

𝜎2
𝑋̅ ~𝑁(𝜇; )
𝑛

Estandarizando 𝑋̅ , se tiene que:

𝑋̅ − 𝜇
𝑍= 𝜎 ~ 𝑁(0; 1)
√𝑛

Se va a utilizar este estadístico en la obtención de un intervalo de confiabilidad para µ.

26
Estimación de parámetros Rubén Medinaceli Ortiz

𝒇𝒁 (𝒛)

Nivel de σ2 = 1
Confiabilidad
(1 – α)
α/2 α/2

𝑍~𝑁(0; 1)
−𝑧0 µ=0 𝑧0

En la figura superior se puede observar que:

𝑃[−𝑧0 ≤ 𝑍 ≤ 𝑧0 ] = 1 − 𝛼

Sin embargo,

𝑋̅ − 𝜇
𝑍= 𝜎
√𝑛

Por tanto,

𝑋̅ − 𝜇
𝑃 [−𝑧0 ≤ 𝜎 ≤ 𝑧0 ] = 1 − 𝛼
√𝑛
𝜎
Multiplicando cada término de esta desigualdad por se tiene que,
√𝑛

𝜎 𝜎
𝑃 [−𝑧0 ≤ 𝑋̅ − 𝜇 ≤ 𝑧0 ]=1−𝛼
√𝑛 √𝑛

restando luego 𝑋̅ de cada término se tiene,

𝜎 𝜎
𝑃 [−𝑋̅ − 𝑧0 ≤ −𝜇 ≤ −𝑋̅ + 𝑧0 ]=1−𝛼
√𝑛 √𝑛

Multiplicando toda la desigualdad por (−1), se tiene,

𝜎 𝜎
𝑃 [𝑋̅ + 𝑧0 ≥ 𝜇 ≥ 𝑋̅ − 𝑧0 ]= 1−𝛼
√𝑛 √𝑛

Finalmente, ordenando la desigualdad y reemplazando el estimador 𝑋̅ por el valor estimado


𝑥̅ , se tiene:

27
Estimación de parámetros Rubén Medinaceli Ortiz

𝜎 𝜎
𝑃 [𝑥̅ − 𝑧0 ≤ 𝜇 ≤ 𝑥̅ + 𝑧0 ]=1−𝛼
√𝑛 √𝑛

Esta expresión asume que se conoce 𝜎, que generalmente no es el caso. Se reemplazará


𝜎 por 𝑆 (desviación estándar de la muestra) siempre que 𝑛 ≥ 30.
𝜎
El término 𝑧0 representa cuánto difiere la media de la muestra (𝑋̅) del valor real de la
√𝑛
media (𝜇). Por tanto, esta expresión se puede utilizar para saber cuán grande debe ser la
muestra para asegurar que el error al estimar 𝜇 será menor a una cantidad especificada
(𝑒); esto es:

𝑧0 𝜎 2
𝑛=( )
𝑒

Con frecuencia se desea estimar la media (𝜇) de una población cuando se desconoce su
varianza (𝜎 2 ) y es imposible obtener una muestra de tamaño 𝑛 ≥ 30.

Recuerde que,

𝑍
𝑇= ~ 𝑡𝑛
√𝑈
𝑛

Donde,

𝑍 ~ 𝑁(0,1)

𝑈 ~ 𝑿𝟐𝒏

Recuerde también que,

𝑋̅ − 𝜇
𝑍= 𝜎 ~ 𝑁(0,1)
√𝑛

Y además que,

(𝑛 − 1)𝑆 2
𝑈= ~ 𝑿𝟐𝒏−𝟏
𝜎2

Por tanto,

𝑋̅ − 𝜇
𝜎
𝑇= √𝑛 ~ 𝑡𝑛−1
(𝑛 − 1)𝑆 2
√ 𝜎2
𝑛−1

En otras palabras,

28
Estimación de parámetros Rubén Medinaceli Ortiz

𝑋̅ − 𝜇
𝑇= ~ 𝑡𝑛−1
𝑆
√𝑛

Es posible utilizar este estadístico para obtener un intervalo de confiabilidad para 𝜇.

𝒇𝑻 (𝒕)

Nivel de
Confiabilidad
(1 – α)
α/2 α/2

𝑇~𝑡𝑛−1
−𝑡0 µ=0 𝑡0

En la figura superior se puede observar que,

𝑃[−𝑡0 ≤ 𝑇 ≤ 𝑡0 ] = 1 − 𝛼

Sin embargo,

𝑋̅ − 𝜇
𝑇=
𝑆
√𝑛

Por tanto,

𝑋̅ − 𝜇
𝑃 [−𝑡0 ≤ ≤ 𝑡0 ] = 1 − 𝛼
𝑆
√𝑛
𝑆
Multiplicando cada término de esta desigualdad por , restando luego 𝑋̅ de cada término,
√𝑛
multiplicando toda la desigualdad por -1 y ordenando la desigualdad, se obtiene:

𝑆 𝑆
𝑃 [𝑋̅ − 𝑡0 ≤ 𝜇 ≤ 𝑋̅ + 𝑡0 ]=1−𝛼
√𝑛 √𝑛

Finalmente, reemplazando el estimador 𝑋̅ por el valor estimado 𝑥̅ ; y el estimador 𝑆 por el


valor estimador 𝑠, se tiene:

𝑠 𝑠
𝑃 [𝑥̅ − 𝑡0 ≤ 𝜇 ≤ 𝑥̅ + 𝑡0 ]=1−𝛼
√𝑛 √𝑛

29
Estimación de parámetros Rubén Medinaceli Ortiz

Esta expresión puede utilizarse para obtener un intervalo de confiabilidad para la media 𝜇
de una población normal cuando 𝑛 < 30.

3.2.2. Ejercicio 8

Problema:

Una máquina produce piezas metálicas cilíndricas. Se toma una muestra de 10 piezas de
la producción del día y se procede a medir los diámetros. La siguiente tabla registra los
valores obtenidos:

Registro de diámetros (cm)


1,01 0,97 1,03 1,04 0,99
0,98 0,99 1,02 1,03 1,04

La especificación técnica señala que para aceptar la producción de un día, la media de los
diámetros de las piezas producidas debe ser igual a 1,00 cm.

Con un nivel de confiabilidad del 95% averiguar si la especificación técnica se cumple en


este caso.

Solución:

𝒇𝑿 (𝒙)

𝑋 = Diámetro de la pieza cilíndrica (cm)


µ = 1,00 cm (especificación técnica)

Muestra aleatoria: 𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋10


Realización: 𝑥1 = 1,01; 𝑥2 = 0,97, ⋯ , 𝑥10 = 1,04

En este caso, para obtener un intervalo de confiabilidad del 95% para µ, se recurrirá a la
siguiente expresión:

𝑠 𝑠
𝑃 [𝑥̅ − 𝑡0 ≤ 𝜇 ≤ 𝑥̅ + 𝑡0 ]=1−𝛼
√𝑛 √𝑛
𝑛
1 1,01 + 0,97 + ⋯ + 1,04
𝑥̅ = ∑ 𝑥𝑖 = = 1,01 𝑐𝑚
𝑛 10
𝑖=1

30
Estimación de parámetros Rubén Medinaceli Ortiz

𝑛
1 (1,01 − 1,01)2 + (0,97 − 1,01)2 + ⋯ + (1,04 − 1,01)2
𝑠=√ ∑(𝑥𝑖 − 𝑥̅ )2 = √ = 0,026
𝑛−1 9
𝑖=1

𝒇𝑻 (𝒕)

Nivel de
Confiabilidad
(1 – α)
α/2 0,95 α / 2 = 0,025

𝑇~𝑡𝑛−1 ~𝑡9
−𝑡0 µ=0 𝑡0 = 2,262 (𝑑𝑒 𝑡𝑎𝑏𝑙𝑎𝑠)

𝑠 2,262(0,026)
𝑡0 = = 0,02
√𝑛 √10

Por tanto,

𝑃[1,01 − 0,02 ≤ 𝜇 ≤ 1,01 + 0,02] = 0,95

Finalmente,

𝑷[𝟎, 𝟗𝟗 ≤ 𝝁 ≤ 𝟏, 𝟎𝟑] = 𝟎, 𝟗𝟓

De acuerdo a esta estimación, la media de los diámetros de las piezas cilíndricas


producidas en el día es algún valor entre 0,99 cm y 1,03 cm y la probabilidad que esto
ocurra es igual a 0,95.

En este caso, la especificación técnica (µ = 1,00 cm) está dentro del intervalo de
confiabilidad. Consecuentemente, la producción del día debe ser aceptada.

3.2.3. Intervalo de confiabilidad para la varianza σ2 de una población


normal

Se requiere un estadístico que incluya a σ2. Recuerde que el tema anterior se obtuvo el
siguiente estadístico:

(𝑛 − 1)𝑆 2 2
𝑈= ~ 𝑋𝑛−1
𝜎2

31
Estimación de parámetros Rubén Medinaceli Ortiz

Nótese que la variable aleatoria U que sigue una distribución chi-cuadrada con n – 1 grados
de libertad incluye al parámetro de interés (𝜎 2 ) y a su estimador puntual (𝑆 2 ). Por tanto,
𝑈 es el estadístico requerido.

𝑓𝑈 (𝑢)

Nivel de
Confiabilidad

α/2 1–α α/2

2
𝑈𝑖𝑛𝑓 𝑈𝑠𝑢𝑝 𝑈 ~ 𝑋𝑛−1

En la figura superior se puede ver que:

𝑃[𝑈𝑖𝑛𝑓 ≤ 𝑈 ≤ 𝑈𝑠𝑢𝑝 ] = 1 − 𝛼
Sin embargo,

(𝑛 − 1)𝑆 2
𝑈=
𝜎2

Por tanto,

(𝑛 − 1)𝑆 2
𝑃 [𝑈𝑖𝑛𝑓 ≤ ≤ 𝑈𝑠𝑢𝑝 ] = 1−𝛼
𝜎2

Dividiendo cada término de la desigualdad por (n – 1)S2 e invirtiendo luego cada término
(con lo cual se cambia el sentido de las desigualdades), se tiene:

(𝑛 − 1)𝑆 2 (𝑛 − 1)𝑆 2
𝑃[ ≤ 𝜎2 ≤ ]= 1−𝛼
𝑈𝑠𝑢𝑝 𝑈𝑖𝑛𝑓

Finalmente, reemplazando el estimador 𝑆 2 por el valor estimado 𝑠2 , se tiene:

(𝑛 − 1)𝑠2 2
(𝑛 − 1)𝑠2
𝑃[ ≤𝜎 ≤ ]=1−𝛼
𝑈𝑠𝑢𝑝 𝑈𝑖𝑛𝑓

32
Estimación de parámetros Rubén Medinaceli Ortiz

3.2.4. Ejercicio 9

Problema:

Se ha procedido a medir estaturas (en metros) de algunos jóvenes que han cumplido 16
años en el mes de junio de este año, en la ciudad de Oruro. Los resultados de la medición
se muestran en la siguiente tabla:

Muestra N° 1 2 3 4 5 6 7 8 9 10 11
Estatura (m) 1,65 1,66 1,67 1,64 1,66 1,65 1,63 1,68 1,64 1,62 1,68

Obtener un intervalo de confiabilidad del 98% para la varianza de las estaturas de jóvenes
de 16 años en la ciudad de Oruro. Asumir una distribución normal para la población de
estaturas.

Solución:

𝒇𝑿 (𝒙)

𝑋 = Estatura jóvenes de 16 años en Oruro (m)


µ = ¿?

Muestra aleatoria: 𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋11


Realización: 𝑥1 = 1,65; 𝑥2 = 1,66, ⋯ , 𝑥11 = 1,68

Se utilizará la siguiente expresión para obtener el intervalo de confiabilidad solicitado:

(𝑛 − 1)𝑠2 (𝑛 − 1)𝑠2
𝑃[ ≤ 𝜎2 ≤ ]=1−𝛼
𝑈𝑠𝑢𝑝 𝑈𝑖𝑛𝑓
𝑛
1 1,65 + 1,66 + ⋯ + 1,68
𝑥̅ = ∑ 𝑥𝑖 = = 1,65 𝑚
𝑛 11
𝑖=1

𝑛
1 (1,65 − 1,65)2 + (1,66 − 1,65)2 + ⋯ + (1,68 − 1,65)2
𝑠2 = ∑(𝑥𝑖 − 𝑥̅ )2 = = 0,0004
𝑛−1 10
𝑖=1

33
Estimación de parámetros Rubén Medinaceli Ortiz

𝑓𝑈 (𝑢)

Nivel de
Confiabilidad

α/2 1–α α / 2 = 0,01


0,98

2
𝑈𝑖𝑛𝑓 = 2,56 𝑈𝑠𝑢𝑝 = 23,2 𝑈 ~ 𝑋𝑛−1

Reemplazando valores se tiene:

10(0,0004) 10(0,0004)
𝑃[ ≤ 𝜎2 ≤ ] = 0,98
23,2 2,56

Finalmente, se tiene que:

𝑃[0,0002 ≤ 𝜎 2 ≤ 0,0015] = 0,98

En palabras, la varianza de la estatura de jóvenes de 16 años en Oruro, es algún valor


entre 0,0002 y 0,0015; y la probabilidad que esto ocurra es igual a 0,98.

3.2.5. Intervalo de confiabilidad para la diferencia de medias,


(µX - µY)

En muchas ocasiones se hace necesario comparar dos poblaciones 𝑓𝑋 (𝑥) y 𝑓𝑌 (𝑦) ya sea
en términos de sus medias 𝜇𝑋 y 𝜇𝑌 ; y/o sus varianzas 𝜎𝑋2 y 𝜎𝑌2 .

Inicialmente, se tratará la comparación de medias y posteriormente la comparación de


varianzas.

La comparación de medias puede dar lugar a alguno de los siguientes resultados:

𝜇𝑋 = 𝜇𝑌 → 𝜇𝑋 − 𝜇𝑌 = 0

𝜇𝑋 < 𝜇𝑌 → 𝜇𝑋 − 𝜇𝑌 < 0

𝜇𝑋 > 𝜇𝑌 → 𝜇𝑋 − 𝜇𝑌 > 0

Consecuentemente, la obtención de intervalos de confiabilidad para la diferencia de medias


(𝜇𝑋 − 𝜇𝑌 ) permitirá conocer los resultados de una comparación de medias poblacionales.

La nomenclatura y la base estadística utilizadas son las que se muestran en la siguiente


figura:

34
Estimación de parámetros Rubén Medinaceli Ortiz

𝒇𝑿 (𝒙) 𝒇𝒀 (𝒚)

σX2 σY2

𝑋 𝑌
µX µY

𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 𝑌1 , 𝑌2 , ⋯ , 𝑌𝑚
1 1 𝑚
𝑋̅ = ∑𝑛𝑖=1 𝑋𝑖 𝑌̅ = ∑ 𝑌
𝑛 𝑚 𝑖=1 𝑖

1 1
𝑆𝑋2 = ∑𝑛 (𝑋 − 𝑋̅)2 𝑆𝑌2 = ∑𝑚 (𝑌 − 𝑌̅)2
𝑛−1 𝑖=1 𝑖 𝑚−1 𝑖=1 𝑖

2 2
𝜎 𝜎
𝑋̅ ~ 𝑁(𝜇𝑋 ; 𝑋 ) 𝑌̅ ~ 𝑁(𝜇𝑌 ; 𝑌 )
𝑛 𝑚

2
(𝑛−1)𝑆𝑋 2 (𝑚−1)𝑆𝑌2 2
𝑈= 2 ~ 𝑋𝑛−1 𝑉= ~ 𝑋𝑚−1
𝜎𝑋 𝜎𝑌2

En función del tamaño de las muestras (n y m) y de la relación entre las varianzas


poblacionales (σX2 y σY2), es posible considerar tres (3) casos:

Caso A

Varianzas poblacionales conocidas (n ≥ 30 y m ≥ 30, se asume que las


varianzas poblacionales son iguales a las varianzas muestrales)

En este caso de tiene que,

𝜎𝑋2 𝜎𝑌2
𝑋̅ − 𝑌̅ ~ 𝑁(𝜇𝑋 − 𝜇𝑌 ; + )
𝑛 𝑚

Estandarizando 𝑋̅ − 𝑌̅ se obtiene,

𝑋̅ − 𝑌̅ − (𝜇𝑋 − 𝜇𝑌 )
𝑍= ~ 𝑁(0; 1)
2 2
√𝜎𝑋 + 𝜎𝑌
𝑛 𝑚

Se utiliza este estadístico para obtener el intervalo de confiabilidad correspondiente.

35
Estimación de parámetros Rubén Medinaceli Ortiz

𝒇𝒁 (𝒛)

Nivel de σ2 = 1
Confiabilidad
(1 – α)
α/2 α/2

𝑍~𝑁(0; 1)
−𝑧0 µ=0 𝑧0

En la figura superior se puede observar que,

𝑃[−𝑧0 ≤ 𝑍 ≤ 𝑧0 ] = 1 − 𝛼

Sin embargo,

𝑋̅ − 𝑌̅ − (𝜇𝑋 − 𝜇𝑌 )
𝑍=
2 2
√𝜎𝑋 + 𝜎𝑌
𝑛 𝑚

Por tanto,

𝑋̅ − 𝑌̅ − (𝜇𝑋 − 𝜇𝑌 )
𝑃 −𝑧0 ≤ ≤ 𝑧0 = 1 − 𝛼
2 2
√𝜎𝑋 + 𝜎𝑌
[ 𝑛 𝑚 ]

2
𝜎𝑋 𝜎𝑌2
Multiplicando cada término de la desigualdad por √ + , restando luego 𝑋̅ − 𝑌̅ de cada
𝑛 𝑚
término y multiplicando la desigualdad por -1, se tiene,

𝜎𝑋2 𝜎𝑌2 𝜎𝑋2 𝜎𝑌2


𝑃 [𝑋̅ − 𝑌̅ − 𝑧0 √ + ≤ 𝜇𝑋 − 𝜇𝑌 ≤ 𝑋̅ − 𝑌̅ + 𝑧0 √ + ] = 1 − 𝛼
𝑛 𝑚 𝑛 𝑚

Finalmente, sustituyendo los estimadores 𝑋̅ 𝑦 𝑌̅ por sus respectivos valores estimados 𝑥̅ y


𝑦̅, se tiene:

𝜎𝑋2 𝜎𝑌2 𝜎𝑋2 𝜎𝑌2


𝑃 [𝑥̅ − 𝑦̅ − 𝑧0 √ + ≤ 𝜇𝑋 − 𝜇𝑌 ≤ 𝑥̅ − 𝑦̅ + 𝑧0 √ + ] = 1 − 𝛼
𝑛 𝑚 𝑛 𝑚

En la práctica, como n ≥ 30 y m ≥ 30, para aplicar esta expresión se sustituye 𝜎𝑋2 𝑦 𝜎𝑌2 por

36
Estimación de parámetros Rubén Medinaceli Ortiz

𝑠𝑋2 𝑦 𝑠𝑌2 respectivamente.

Caso B

Varianzas poblacionales desconocidas (n ˂ 30 y/o m ˂ 30); aunque iguales


σX2 = σY2 = σ2

En este caso de tiene que,

𝜎2 𝜎2
𝑋̅ − 𝑌̅ ~ 𝑁(𝜇𝑋 − 𝜇𝑌 ; + )
𝑛 𝑚

Estandarizando 𝑋̅ − 𝑌̅ se obtiene,

𝑋̅ − 𝑌̅ − (𝜇𝑋 − 𝜇𝑌 )
𝑍= ~ 𝑁(0; 1)
2 2
√𝜎 + 𝜎
𝑛 𝑚

Por otro lado,

(𝑛 − 1)𝑆𝑋2 2
𝑈= ~ 𝑋𝑛−1
𝜎2

(𝑚 − 1)𝑆𝑌2 2
𝑉= ~ 𝑋𝑚−1
𝜎2

Por tanto,

(𝑛 − 1)𝑆𝑋2 + (𝑚 − 1)𝑆𝑌2 2
𝑈+𝑉 = ~ 𝑋𝑛+𝑚−2
𝜎2

Recordando que,

𝑍
𝑇= ~ 𝑡𝑟
√𝑊
𝑟

Donde,

𝑍 ~ 𝑁(0; 1)

𝑊 ~ 𝑋𝑟2

En este caso, se tiene que,

37
Estimación de parámetros Rubén Medinaceli Ortiz

𝑋̅ − 𝑌̅ − (𝜇𝑋 − 𝜇𝑌 )
2 2
√𝜎 + 𝜎
𝑛 𝑚
𝑇= ~ 𝑡𝑛+𝑚−2
(𝑛 − 1)𝑆𝑋2 + (𝑚 − 1)𝑆𝑌2
√ 𝜎2
𝑛+𝑚−2

𝑋̅ − 𝑌̅ − (𝜇𝑋 − 𝜇𝑌 )
𝑇= ~ 𝑡𝑛+𝑚−2
(𝑛 − 1)𝑆𝑋2 + (𝑚 − 1)𝑆𝑌2
√(1 + 1 ) [ ]
𝑛 𝑚 𝑛+𝑚−2

Es el estadístico a utilizarse para obtener el intervalo de confiabilidad buscado.

𝒇𝑻 (𝒕)

Nivel de
Confiabilidad
(1 – α)
α/2 α/2

𝑇~ 𝑡𝑛+𝑚−2
−𝑡0 µ=0 𝑡0

En la figura superior se puede observar que,

𝑃[−𝑡0 ≤ 𝑇 ≤ 𝑡0 ] = 1 − 𝛼

Sin embargo,

𝑋̅ − 𝑌̅ − (𝜇𝑋 − 𝜇𝑌 )
𝑇=
(𝑛 − 1)𝑆𝑋2 + (𝑚 − 1)𝑆𝑌2
√(1 + 1 ) [ ]
𝑛 𝑚 𝑛+𝑚−2

Por tanto,

𝑋̅ − 𝑌̅ − (𝜇𝑋 − 𝜇𝑌 )
𝑃 −𝑡0 ≤ ≤ 𝑡0 = 1 − 𝛼
(𝑛 − 1)𝑆𝑋2
+ (𝑚 − 1)𝑆𝑌2
√(1 + 1 ) [ ]
𝑛 𝑚 𝑛+𝑚−2
[ ]

Después de realizar las operaciones algebraicas necesarias para tener el parámetro


𝜇𝑋 − 𝜇𝑌 en el término central de la desigualdad, se tiene:

38
Estimación de parámetros Rubén Medinaceli Ortiz

1 1 (𝑛 − 1)𝑆𝑋2 + (𝑚 − 1)𝑆𝑌2
̅ ̅
𝑃 [𝑋 − 𝑌 − 𝑡𝑜 √( + ) [ ] ≤ 𝜇𝑋 − 𝜇𝑌
𝑛 𝑚 𝑛+𝑚−2

1 1 (𝑛 − 1)𝑆𝑋2 + (𝑚 − 1)𝑆𝑌2
≤ 𝑋̅ − 𝑌̅ + 𝑡𝑜 √( + ) [ ]] = 1 − 𝛼
𝑛 𝑚 𝑛+𝑚−2

Finalmente, reemplazando los estimadores por los valores estimados, se tiene:

1 1 (𝑛 − 1)𝑠𝑋2 + (𝑚 − 1)𝑠𝑌2 1 1 (𝑛 − 1)𝑠𝑋2 + (𝑚 − 1)𝑠𝑌2


𝑃 [𝑥̅ − 𝑦̅ − 𝑡𝑜 √( + ) [ ] ≤ 𝜇𝑋 − 𝜇𝑌 ≤ 𝑥̅ − 𝑦̅ + 𝑡𝑜 √( + ) [ ]] = 1 − 𝛼
𝑛 𝑚 𝑛+𝑚−2 𝑛 𝑚 𝑛+𝑚−2

Caso C

Varianzas poblacionales desconocidas (n ˂ 30 y/o m ˂ 30) y diferentes, σX2 ≠ σY2

El estadístico a utilizarse es,

𝑋̅ − 𝑌̅ − (𝜇𝑋 − 𝜇𝑌 )
𝑇= ~ 𝑡𝑝
2 2
√𝑆𝑋 + 𝑆𝑌
𝑛 𝑚

Donde,
2
𝑠2 𝑠2
( 𝑋 + 𝑌)
𝑛 𝑚
𝑝= 2 2
𝑠2 𝑠2
( 𝑋) ( 𝑌)
𝑛 𝑚
+
𝑛−1 𝑚−1

(Tomar el entero más cercano)

𝒇𝑻 (𝒕)

Nivel de
Confiabilidad
(1 – α)
α/2 α/2

𝑇~ 𝑡𝑝
−𝑡0 µ=0 𝑡0

En el gráfico superior se puede observar que,


39
Estimación de parámetros Rubén Medinaceli Ortiz

𝑃[−𝑡0 ≤ 𝑇 ≤ 𝑡0 ] = 1 − 𝛼

Sin embargo,

𝑋̅ − 𝑌̅ − (𝜇𝑋 − 𝜇𝑌 )
𝑇=
2 2
√𝑆𝑋 + 𝑆𝑌
𝑛 𝑚

Por tanto,

𝑋̅ − 𝑌̅ − (𝜇𝑋 − 𝜇𝑌 )
𝑃 −𝑡0 ≤ ≤ 𝑡0 = 1 − 𝛼
2 2
√𝑆𝑋 + 𝑆𝑌
[ 𝑛 𝑚 ]

Después de realizar las operaciones algebraicas necesarias para tener el parámetro


𝜇𝑋 − 𝜇𝑌 en el término central de la desigualdad, se tiene:

𝑆𝑋2 𝑆𝑌2 𝑆𝑋2 𝑆𝑌2


𝑃 [𝑋̅ − 𝑌̅ − 𝑡0 √ + ≤ 𝜇𝑋 − 𝜇𝑌 ≤ 𝑋̅ − 𝑌̅ + 𝑡0 √ + ] = 1 − 𝛼
𝑛 𝑚 𝑛 𝑚

Finalmente, sustituyendo los estimadores por los valores estimados, se tiene,

𝑠𝑋2 𝑠𝑌2 𝑠𝑋2 𝑠𝑌2


𝑃 [𝑥̅ − 𝑦̅ − 𝑡0 √ + ≤ 𝜇𝑋 − 𝜇𝑌 ≤ 𝑥̅ − 𝑦̅ + 𝑡0 √ + ] = 1 − 𝛼
𝑛 𝑚 𝑛 𝑚

3.2.6. Intervalo de confiabilidad para la diferencia de medias en el


caso de observaciones muestrales en pares

En este caso, se tiene dos poblaciones; la segunda población es el resultado de afectar la


primera población con algún proceso (físico, químico, social u otro).

En este sentido, se tiene una muestra aleatoria de tamaño 𝑛 de la primera población (esto
es, antes del proceso) y una muestra aleatoria también de tamaño 𝑛 de la segunda
población (esto es, después de proceso). Preferentemente y siempre que sea posible,
ambas muestras aleatorias son medidas sobre las mismas unidades de muestreo; vale
decir, se tienen muestras medidas en pares.

40
Estimación de parámetros Rubén Medinaceli Ortiz

Proceso
Antes Después

𝒇𝑿 (𝒙) 𝒇𝒀 (𝒚)

𝑋 𝑌
𝜇𝑋 𝜇𝑌

𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 𝑌1 , 𝑌2 , ⋯ , 𝑌𝑛

Nótese que, en este caso, las poblaciones no son exactamente independientes.

Se asume la existencia de una nueva población, 𝑓𝐷 (𝑑), correspondiente a una variable


aleatoria 𝐷 igual a,

𝐷=𝑋−𝑌

Una población que sigue una distribución normal con media 𝜇𝐷 = 𝜇𝑋 − 𝜇𝑌 y varianza 𝜎𝐷2 .

41
Estimación de parámetros Rubén Medinaceli Ortiz

𝒇𝑫 (𝒅)

𝜎𝐷2

𝐷 =𝑋−𝑌
𝜇𝐷 = 𝜇𝑋 − 𝜇𝑦

Muestra aleatoria: 𝐷1 = 𝑋1 − 𝑌1 , 𝐷2 = 𝑋2 − 𝑌2 , ⋯ , 𝐷𝑛 = 𝑋𝑛 − 𝑌𝑛

Realización: 𝑑1 = 𝑥1 − 𝑦1 , 𝑑2 = 𝑥2 − 𝑦2 , ⋯ , 𝑑𝑛 = 𝑥𝑛 − 𝑦𝑛

̅ ; donde,
El mejor estimador (insesgado y de varianza mínima) de 𝜇𝐷 es 𝐷
𝑛
1
̅ = ∑ 𝐷𝑖
𝐷
𝑛
𝑖=1

El estimador de 𝜎𝐷2 es 𝑆𝐷2 ; donde,


𝑛
1
𝑆𝐷2 = ̅ )2
∑(𝐷𝑖 − 𝐷
𝑛−1
𝑖=1

Es más,

𝜎𝐷2
̅ ~ 𝑁(𝜇𝐷 ;
𝐷 )
𝑛
̅ se tiene,
Estandarizando 𝐷

̅ − 𝜇𝐷
𝐷
𝑍= 𝜎𝐷 ~ 𝑁(0,1)
√𝑛

Por otro lado,

(𝑛 − 1)𝜎𝐷2 2
𝑈= ~ 𝑋𝑛−1
𝑆𝐷2

Consecuentemente,

42
Estimación de parámetros Rubén Medinaceli Ortiz

̅ − 𝜇𝐷
𝐷
𝜎𝐷
√𝑛 ̅ − 𝜇𝐷
𝐷
𝑇= = ~ 𝑡𝑛−1
𝑆𝐷
(𝑛 − 1)𝜎𝐷2
√𝑛
√ 𝑆𝐷2
𝑛−1

Se utilizará este estadístico para obtener el intervalo de confiabilidad deseado.

𝒇𝑻 (𝒕)

Nivel de
Confiabilidad
(1 – α)
α/2 α/2

𝑇~ 𝑡𝑛−1
−𝑡0 µ=0 𝑡0

En la figura superior se puede ver que,

𝑃[−𝑡0 ≤ 𝑇 ≤ 𝑡0 ] = 1 − 𝛼

Sin embargo,

̅ − 𝜇𝐷
𝐷
𝑇=
𝑆𝐷
√𝑛

Por tanto,

̅ − 𝜇𝐷
𝐷
𝑃 [−𝑡0 ≤ ≤ 𝑡0 ] = 1 − 𝛼
𝑆𝐷
√𝑛

Dejando el parámetro en el término central se tiene,

𝑆𝐷 𝑆𝐷2
̅ − 𝑡0
𝑃 [𝐷 ̅ − 𝑡0
≤ 𝜇𝐷 ≤ 𝐷 ]=1−𝛼
√𝑛 √𝑛

Finalmente, reemplazando los estimadores por sus correspondientes valores estimados, se


tiene:

43
Estimación de parámetros Rubén Medinaceli Ortiz

𝑠𝑑 𝑠𝑑
𝑃 [𝑑̅ − 𝑡0 ≤ 𝜇𝐷 ≤ 𝑑̅ − 𝑡0 ]= 1−𝛼
√𝑛 √𝑛

3.2.7. Intervalo de confiabilidad para el cociente de varianzas


(σX2/ σY2) ó (σY2/σX2)

La comparación de varianzas puede dar lugar a alguno de los siguientes resultados:


2
𝜎𝑋
𝜎𝑋2 = 𝜎𝑌2 → =1
𝜎𝑌2

2
𝜎𝑋
𝜎𝑋2 < 𝜎𝑌2 → <1
𝜎𝑌2

2
𝜎𝑋
𝜎𝑋2 > 𝜎𝑌2 → >1
𝜎𝑌2

Consecuentemente, la obtención de intervalos de confiabilidad para el cociente de


varianzas permitirá conocer los resultados de una comparación de medias poblacionales.

La nomenclatura y la base estadística utilizadas son las que se muestran en la siguiente


figura:

𝒇𝑿 (𝒙) 𝒇𝒀 (𝒚)

𝑋 𝑌
𝜇𝑋 𝜇𝑌

𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 𝑌1 , 𝑌2 , ⋯ , 𝑌𝑛

1 1 𝑚
𝑋̅ = ∑𝑛𝑖=1 𝑋𝑖 𝑌̅ = ∑ 𝑌
𝑛 𝑚 𝑖=1 𝑖

1 1
𝑆𝑋2 = ∑𝑛 (𝑋 − 𝑋̅)2 𝑆𝑌2 = ∑𝑚 (𝑌 − 𝑌̅)2
𝑛−1 𝑖=1 𝑖 𝑚−1 𝑖=1 𝑖

2
(𝑛−1)𝑆𝑋 2 (𝑚−1)𝑆𝑌2 2
𝑈= 2 ~ 𝑋𝑛−1 𝑉= ~ 𝑋𝑚−1
𝜎𝑋 𝜎𝑌2

44
Estimación de parámetros Rubén Medinaceli Ortiz

Recordando que,

𝑈
𝐹= 𝑚 ~ 𝐹𝑚;𝑛
𝑉
𝑛

Cuando,
2 y 𝑉 ~ 𝑋2
𝑈 ~ 𝑋𝑚 𝑛

En este caso se tiene,

(𝑚 − 1)𝑆𝑌2
𝜎𝑌2
𝐹 = 𝑚 − 1 2 ~ 𝐹𝑚−1;𝑛−1
(𝑛 − 1)𝑆𝑋
𝜎𝑋2
𝑛−1

𝜎𝑋2 𝑆𝑌2
𝐹= ~ 𝐹𝑚−1;𝑛−1
𝜎𝑌2 𝑆𝑋2

Este estadístico se utilizará para obtener el intervalo de confiabilidad buscado

Nivel de
Confiabilidad
α/2 1–α α/2

𝐹𝑖𝑛𝑓 𝐹𝑠𝑢𝑝 𝐹 ~ 𝐹𝑚−1;𝑛−1

En la figura superior se puede observar que,

𝑃[𝐹𝑖𝑛𝑓 ≤ 𝐹 ≤ 𝐹𝑠𝑢𝑝 ] = 1 − 𝛼

Sin embargo,

𝜎𝑋2 𝑆𝑌2
𝐹=
𝜎𝑌2 𝑆𝑋2

45
Estimación de parámetros Rubén Medinaceli Ortiz

Por tanto,

𝜎𝑋2 𝑆𝑌2
𝑃 [𝐹𝑖𝑛𝑓 ≤ ≤ 𝐹𝑠𝑢𝑝 ] = 1 − 𝛼
𝜎𝑌2 𝑆𝑋2

𝑆𝑋2 𝜎𝑋2 𝑆𝑋2


𝑃 [𝐹𝑖𝑛𝑓 ≤ ≤ 𝐹𝑠𝑢𝑝 2 ] = 1 − 𝛼
𝑆𝑌2 𝜎𝑌2 𝑆𝑌

Finalmente, sustituyendo los estimadores por los valores estimados se tiene,

𝑠𝑋2 𝜎𝑋2 𝑠𝑋2


𝑃 [𝐹𝑖𝑛𝑓 ≤ ≤ 𝐹𝑠𝑢𝑝 2 ] = 1 − 𝛼
𝑠𝑌2 𝜎𝑌2 𝑠𝑌

3.2.8. Ejercicio 10

Problema:

Se han registrado los tiempos de duración de dos marcas de focos eléctricos: A y B. Una
muestra aleatoria de 40 focos de la marca A mostró una duración promedio igual a 418
horas de uso continuo y una desviación estándar igual a 26 horas. A su vez, una muestra
aleatoria de 50 focos de la marca B tuvo una duración promedio de 402 horas de
funcionamiento continuo con una desviación estándar igual a 22 horas. Con un nivel de
confiabilidad del 95% señalar si, en promedio, las vidas útiles de los focos eléctricos de
ambas marcas son iguales.

46
Estimación de parámetros Rubén Medinaceli Ortiz

Solución:

𝒇𝑿 (𝒙) 𝒇𝒀 (𝒚)

σX2 σY2

𝑋= 𝑌=
µX Vida útil focos marca A en horas µY Vida útil focos marca B en horas

𝑋1 , 𝑋2 , ⋯ , 𝑋40 (muestra aleatoria) 𝑌1 , 𝑌2 , ⋯ , 𝑌50 (muestra aleatoria)


𝑥1 , 𝑥2 , ⋯ , 𝑥40 (realización) 𝑦1 , 𝑦2 , ⋯ , 𝑦50 (realización)

𝑥̅ = 418 ℎ𝑜𝑟𝑎𝑠 𝑦̅ = 402 ℎ𝑜𝑟𝑎𝑠


𝑠𝑋 = 26 ℎ𝑜𝑟𝑎𝑠 𝑠𝑌 = 22 ℎ𝑜𝑟𝑎𝑠
𝑛 = 40 𝑚 = 50

Como n > 30 y m > 30 es posible asumir que las varianzas de las muestras son iguales a
las varianzas poblacionales (Caso A). Por tanto, se puede utilizar la siguiente expresión
para obtener un intervalo de confiabilidad para la diferencia de medias.

𝜎𝑋2 𝜎𝑌2 𝜎𝑋2 𝜎𝑌2


𝑃 [𝑥̅ − 𝑦̅ − 𝑧0 √ + ≤ 𝜇𝑋 − 𝜇𝑌 ≤ 𝑥̅ − 𝑦̅ + 𝑧0 √ + ] =1−𝛼
𝑛 𝑚 𝑛 𝑚

Se asume que 𝜎𝑋2 = 262 y que 𝜎𝑌2 = 222

Por otro lado,

𝒇𝒁 (𝒛)

Nivel de σ2 = 1
Confiabilidad
(1 – α)
α/2 0,95 α / 2 = 0,025

𝑍~𝑁(0; 1)
−𝑧0 µ=0 𝑧0 = 1,96

Reemplazando valores se tiene:

47
Estimación de parámetros Rubén Medinaceli Ortiz

262 222 262 222


𝑃 [(418 − 402) − 1,96√ + ≤ 𝜇𝑋 − 𝜇𝑌 ≤ (418 − 402) − 1,96√ + ] = 0,95
40 50 40 50

𝑃[16 − 10,1 ≤ 𝜇𝑋 − 𝜇𝑌 ≤ 16 + 10,1] = 0,95

Finalmente, se tiene que,

𝑷[𝟓, 𝟗 ≤ 𝝁𝑿 − 𝝁𝒀 ≤ 𝟐𝟔, 𝟏] = 𝟎, 𝟗𝟓

Con un nivel de confiabilidad del 95% se puede afirmar que (no estando el cero (0) en el
intervalo de confiabilidad obtenido) las vidas útiles medias de los focos de las marcas A y
B no son iguales; al contrario, los focos de la marca A tienen mayor vida útil media que los
focos de la marca B.

3.2.9. Ejercicio 11

Problema:

Para averiguar si un nuevo suero detendrá o no la leucemia, se selecciona nueve (9)


ratones que han alcanzado un estado avanzado de la enfermedad. Cinco ratones reciben
el tratamiento y cuatro no lo reciben. Los tiempos de sobrevivencia, en años, desde que se
inició el experimento, son los siguientes:

Tiempo de sobrevivencia con tratamiento (años) 2,1 5,3 1,4 4,6 0,9
Tiempo de sobrevivencia sin tratamiento (años) 1,9 0,5 2,8 3,1

Con un nivel de confiabilidad del 90% averiguar si el nuevo suero es efectivo.

Solución:

𝒇𝑿 (𝒙) 𝒇𝒀 (𝒚)

σX2 σY2

𝑋= 𝑌=
µX Tiempo de supervivencia µY Tiempo de supervivencia
con tratamiento (años) sin tratamiento (años)

𝑋1 , 𝑋2 , ⋯ , 𝑋5 (muestra aleatoria) 𝑌1 , 𝑌2 , ⋯ , 𝑌4 (muestra aleatoria)


𝑥1 = 2,1; 𝑥2 = 5,3; ⋯ ; 𝑥5 = 0,9(realización) 𝑦1 = 1,9; 𝑦2 = 0,5; ⋯ ; 𝑦4 = 3,1 (realización)

48
Estimación de parámetros Rubén Medinaceli Ortiz

1
𝑥̅ = (2,1 + 5,3 + ⋯ + 0,9) = 2,86 𝑎ñ𝑜𝑠
5
1
𝑠𝑋2 = {(2,1 − 2,86)2 + (5,3 − 2,86)2 + ⋯ + (0,9 − 2,86)2 } = 3,88 𝑎ñ𝑜𝑠2
4
1
𝑦̅ = (1,9 + 0,5 + ⋯ + 3,1) = 2,07 𝑎ñ𝑜𝑠
4
1
𝑠𝑌2 = {(1,9 − 2,07)2 + (0,5 − 2,07)2 + ⋯ + (3,1 − 2,07)2 } = 1,36 𝑎ñ𝑜𝑠2
3

𝑛=5

𝑚=4

Las muestras son muy pequeñas; por tanto, las varianzas poblacionales 𝜎𝑋2 𝑦 𝜎𝑌2 son
desconocidas. Corresponde averiguar si son iguales; para ello es necesario encontrar un
2
𝜎𝑋
intervalo de confiabilidad para el cociente de las varianzas poblacionales
𝜎𝑌2

Para el efecto se utilizará la siguiente expresión:

𝑠𝑋2 𝜎𝑋2 𝑠𝑋2


𝑃 [𝐹𝑖𝑛𝑓 ≤ ≤ 𝐹𝑠𝑢𝑝 2 ] = 1 − 𝛼
𝑠𝑌2 𝜎𝑌2 𝑠𝑌

𝑓𝐹(.)

Nivel de
Confiabilidad
α/2 1–α α / 2 = 0,05
0,90

1 1
𝐹𝑖𝑛𝑓 = = = 0,11 𝐹𝑠𝑢𝑝 = 6,59 𝐹 ~ 𝐹𝑚−1;𝑛−1
𝐹𝑛−1,𝑚−1 9,12

Reemplazando valores se tiene,

3,88 𝜎𝑋2 3,88


𝑃 [0,11 ≤ 2 ≤ 6,59 ] = 0,90
1,36 𝜎𝑌 1,36

Finalmente,

49
Estimación de parámetros Rubén Medinaceli Ortiz

𝝈𝟐𝑿
𝑷 [𝟎, 𝟑𝟏 ≤ ≤ 𝟏𝟖, 𝟖𝟎] = 𝟎, 𝟗𝟎
𝝈𝟐𝒀
2
𝜎𝑋
Siendo el uno (1) un valor posible para , es factible asumir que las varianzas
𝜎𝑌2
poblacionales son iguales. Por tanto, la expresión a utilizarse para obtener un intervalo de
confiabilidad para la diferencia de medias es (Caso B):

1 1 (𝑛 − 1)𝑠𝑋2 + (𝑚 − 1)𝑠𝑌2 1 1 (𝑛 − 1)𝑠𝑋2 + (𝑚 − 1)𝑠𝑌2


𝑃 [𝑥̅ − 𝑦̅ − 𝑡𝑜 √( + ) [ ] ≤ 𝜇𝑋 − 𝜇𝑌 ≤ 𝑥̅ − 𝑦̅ + 𝑡𝑜 √( + ) [ ]] = 1 − 𝛼
𝑛 𝑚 𝑛+𝑚−2 𝑛 𝑚 𝑛+𝑚−2

𝒇𝑻 (𝒕)

Nivel de
Confiabilidad
(1 – α)
α/2 0,90 α / 2 = 0,05

𝑇~ 𝑡𝑛+𝑚−2 ~𝑡5+4−2 ~𝑡7


−𝑡0 µ=0 𝑡0 = 1,895

Reemplazando valores se tiene:

𝑋̅ − 𝑌̅ = 2,86 − 2,07 = 0,79

1 1 (𝑛 − 1)𝑠𝑋2 + (𝑚 − 1)𝑠𝑌2 1 1 4(3,88) + 3(1,36)


𝑡𝑜 √( + ) [ ] = 1,895√( + ) ( ) = 2,13
𝑛 𝑚 𝑛+𝑚−2 5 4 7

Por tanto,

𝑃[0,79 − 2,13 ≤ 𝜇𝑋 − 𝜇𝑌 ≤ 0,79 + 2,13] = 0,90

Finalmente,

𝑷[−𝟏, 𝟑𝟒 ≤ 𝝁𝑿 − 𝝁𝒀 ≤ 𝟐, 𝟗𝟐] = 𝟎, 𝟗𝟎

Con un nivel de confiabilidad del 90% es posible afirmar que estando el cero (0)
comprendido en el intervalo de confiabilidad, las medias poblacionales pueden ser
consideradas iguales y concluir que el nuevo suero no es efectivo.

50
Estimación de parámetros Rubén Medinaceli Ortiz

3.2.10. Ejercicio 12

Problema:

Un investigador afirma que la resistencia a la tracción de cierto material refractario


disminuye con el incremento de la temperatura. La siguiente tabla muestra los resultados
de un experimento en el que se mide la resistencia a la compresión de ocho (8) muestras
del material refractario, primero a temperatura ambiente y posteriormente luego de calentar
las muestras a una temperatura de 50°C.

X = Resistencia (temperatura ambiente) (kg/cm2) 250 270 260 265 255 250 260 270
Y = Resistencia (a 50°C) (kg/cm2) 255 260 255 265 250 240 245 265

Con un nivel de confiabilidad del 95%, averiguar si la afirmación del investigador es real.

Solución:

Las mediciones de la resistencia a la tracción efectuadas en cada una de las ocho muestras
inicialmente a temperatura ambiente y luego a 50°C de temperatura forman pares.

Para determinar si la afirmación del investigador es real, se deben considerar las diferencias
𝑑1 , 𝑑2 , ⋯ , 𝑑𝑛 de las observaciones en pares.

Antes Calentamiento Después


a 50°

𝒇𝑿 (𝒙) 𝒇𝒀 (𝒚)

σX2 σY2

𝑋 𝑌
µX Resistencia a temperatura ambiente µY Resistencia a 50°C

𝑋1 , 𝑋2 , ⋯ , 𝑋8 𝑌1 , 𝑌2 , ⋯ , 𝑌8

Muestra aleatoria: 𝐷1 = 𝑋1 − 𝑌1 , 𝐷2 = 𝑋2 − 𝑌2 , ⋯ , 𝐷8 = 𝑋8 − 𝑌8

Realización: 𝑑1 = 𝑥1 − 𝑦1 , 𝑑2 = 𝑥2 − 𝑦2 , ⋯ , 𝑑8 = 𝑥8 − 𝑦8

51
Estimación de parámetros Rubén Medinaceli Ortiz

xi = Resistencia (temperatura ambiente) (kg/cm2) 250 270 260 265 255 250 260 270
yi = Resistencia (a 50°C) (kg/cm2) 255 260 255 265 250 240 245 265
di = xi – yi -5 10 5 0 5 10 15 5

1
𝑑̅ = (−5 + 10 + 5 + ⋯ + 5) = 5,625
8
1
𝑠𝑑2 = {(−5 − 5,625)2 + (10 − 5,625)2 + ⋯ + (5 − 5,625)2 } = 38,839
7

𝑠𝑑 = +√𝑠𝑑2 = +√38,839 = 6,232

Se utiliza la siguiente expresión en la obtención del intervalo de confiabilidad para 𝜇𝐷

𝑠𝑑 𝑠𝑑
𝑃 [𝑑̅ − 𝑡0 ≤ 𝜇𝐷 ≤ 𝑑̅ − 𝑡0 ]= 1−𝛼
√𝑛 √𝑛
𝒇𝑻 (𝒕)

Nivel de
Confiabilidad
(1 – α)
α/2 0,95 α / 2 = 0,025

𝑇~ 𝑡𝑛−1 ~ 𝑡7
−𝑡0 µ=0 𝑡0 = 2,365

Reemplazando valores, se tiene:

6,232 6,232
𝑃 [5,625 − 2,365 ≤ 𝜇𝐷 ≤ 5,625 + 2,365 ] = 0,95
√8 √8

𝑃[5,625 − 5,211 ≤ 𝜇𝐷 ≤ 5,625 + 5,211] = 0,95

Finalmente,

𝑷[𝟎, 𝟒𝟏𝟒 ≤ 𝝁𝑫 ≤ 𝟏𝟎, 𝟖𝟑𝟔] = 𝟎, 𝟗𝟓

Con un nivel de confiabilidad del 95% se puede afirmar que no estando el cero (0)
comprendido en el intervalo de confiabilidad, las medias poblacionales no son iguales; al
contrario, 𝜇𝑋 es mayor a 𝜇𝑌 . Por tanto, el investigador tiene razón.

52
Estimación de parámetros Rubén Medinaceli Ortiz

Ejercicios propuestos
1. Sea 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 una muestra aleatoria de una población que sigue una distribución
uniforme en el intervalo (a, b). Encontrar los estimadores de a y b utilizando el
método de los momentos.
2. Sea 𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 una muestra aleatoria de una población cuya función de densidad
de probabilidad viene dada por:

𝑓𝑋 (𝑥; 𝜃) = 𝜃𝑋𝜃−1 ; 0 ≤ 𝑥 ≤ 1

Encontrar el estimador de máxima verosimilitud de 𝜃.

3. Un restaurant vegetariano afirma que una nueva dieta reducirá el peso de una
persona en 4,5 kg en promedio, en un periodo de dos semanas. Los pesos de siete
(7) damas fueron registrados antes y después de la dieta.

Peso antes de la dieta (kg) 58,5 60,3 61,7 69,0 64,0 62,6 56,7
Peso después de la dieta (kg) 60,0 54,9 58,1 62,1 58,5 59,9 54,4

Con un nivel de confiabilidad del 90% averiguar si la oferta del restaurant es real.

4. Los siguientes datos expresados en días representan el tiempo de recuperación de


pacientes tratados al azar, con uno de los dos medicamentos (A y B) disponibles
para atacar infecciones graves en el estómago.

A 15 20 16 18 18 19 20 16 18 20 21 23
B 12 14 13 17 13 12 10 11 17 16

Con un nivel de confiabilidad del 95% averiguar si los dos medicamentos, en


promedio, garantizan en promedio el mismo tiempo de recuperación.

53

También podría gustarte