Estimación Puntual y Por Intervalo

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 50

Estimación de parámetros

Rubén Medinaceli Ortiz

ESTIMACIÓN DE PARÁMETROS

En el tema anterior se señaló que una muestra aleatoria de la distribución de una población
es útil para realizar inferencias acerca de la población.
Tal como muestra la siguiente figura, dos problemas importantes en la inferencia
estadística son la estimación de parámetros y las pruebas de hipótesis.

Estimación
Puntual

Estimación de Estimación por


Parámetros intervalos

Inferencia
Estadística

Pruebas de
Hipótesis

1. El problema de la estimación

a) Se tiene una característica de interés representada por una variable aleatoria X, cuya
distribución (función de densidad de probabilidad si la variable aleatoria es continua
o función de distribución de probabilidad si la variable aleatoria es discreta), 𝑓𝑋(𝑥),
representa la población de la característica de interés.

b) Se asume que se conoce la forma de la distribución (Normal, exponencial, uniforme,


Poisson, etc.); sin embargo, la distribución 𝑓𝑋(𝑥) contiene un conjunto de
parámetros desconocidos.

Por ejemplo,

1
Estimación de parámetros
Rubén Medinaceli Ortiz

𝒇𝑿(𝒙)(𝑃𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑐𝑎𝑟𝑎𝑐𝑡𝑒𝑟í𝑠𝑡𝑖𝑐𝑎 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟é𝑠)

σ2

𝑋 (𝐶𝑎𝑟𝑎𝑐𝑡𝑒𝑟í𝑠𝑡𝑖𝑐𝑎 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟é𝑠)
µ

La distribución de la población es conocida, es normal; vale decir, 𝑿(𝒙) es normal.


Sin embargo, contiene un conjunto θ = {µ, σ2} de parámetros desconocidos

c) Se asume que se tiene al menos una realización ( 𝑥1,𝑥2,𝑥3, ⋯ , 𝑥𝑛 ) de una muestra


aleatoria de tamaño (𝑋1, 𝑋2,𝑋3, ⋯ , 𝑋𝑛) de la población.

Por ejemplo,

𝒇𝑿(𝒙)

σ2

𝑋1,𝑋2, 𝑋3, ⋯ , 𝑋𝑛 (𝑀𝑢𝑒𝑠𝑡𝑟𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑡𝑎𝑚𝑎ñ𝑜 𝑛)

𝑥1,𝑥2, 𝑥3,⋯ , 𝑥𝑛 (𝑅𝑒𝑎𝑙𝑖𝑧𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎)

d) Tomando como base la muestra aleatoria de tamaño y su realización se desea


estimar el valor de cada uno de los parámetros que incluye el conjunto de parámetros
desconocidos θ o de una función cualquiera de θ; vale decir, 𝝉(𝜽).

La estimación deseada se puede efectuar de dos maneras:

2
Estimación de parámetros
Rubén Medinaceli Ortiz

a) Una estimación puntual referida a definir un estadístico (un estadístico es una


variable aleatoria que es función solo de variables aleatorias observables o
medibles), por ejemplo, 𝑡(𝑋1,𝑋2, ⋯ , 𝑋𝑛), que estime el parámetro desconocido 𝜃 o
𝜏(𝜃).

b) Una estimación por intervalos referida a definir dos estadísticos


𝑡1(𝑋1, 𝑋2,⋯ , 𝑋𝑛) y 𝑡2(𝑋1, 𝑋2,⋯ , 𝑋𝑛) tales que:

𝑡1(𝑋1, 𝑋2,⋯ , 𝑋𝑛) < 𝑡2(𝑋1,𝑋2, ⋯ , 𝑋𝑛)

De tal forma que 𝑡1(𝑋1,𝑋2,⋯ , 𝑋𝑛) y 𝑡2(𝑋1,𝑋2,⋯ , 𝑋𝑛) constituyan un intervalo y la


probabilidad de que este intervalo contenga al parámetro desconocido 𝜃 o 𝜏(𝜃)
puede ser determinada.

Por ejemplo,
Se tiene la siguiente población:

𝒇𝑿(𝒙)

Distribución normal

σ2

𝑋1,𝑋2, 𝑋3, ⋯ , 𝑋𝑛 (𝑀𝑢𝑒𝑠𝑡𝑟𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑡𝑎𝑚𝑎ñ𝑜 𝑛)

𝑥1,𝑥2, 𝑥3,⋯ , 𝑥𝑛 (𝑅𝑒𝑎𝑙𝑖𝑧𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎)

Distribución de la población: Normal (conocida)


Parámetros desconocidos: θ = {µ, σ2}

Posible estimador puntual del parámetro µ:

Posible estimador puntual del parámetro σ2:

3
Estimación de parámetros
Rubén Medinaceli Ortiz

Posible estimador por intervalos del parámetro µ:

A continuación se presentan algunos elementos relacionados con la estimación puntual;


posteriormente, se presentarán elementos relacionados con la estimación por intervalos.

2. Estimación puntual

2.1. Definición

Cualquier estadístico (función conocida de variables aleatorias observables o medibles que


también es una variable aleatoria) cuyos valores son utilizados para estimar 𝜏(𝜃), donde 𝜏(.
) es alguna función del parámetro , se define como un estimador de 𝜏(𝜃).

Se adopta la siguiente convención: el estadístico (o variable aleatoria) que es utilizado como


un estimador recibe el nombre de estimador; y, el valor que toma el estadístico recibe el
nombre de estimación o valor estimado. De esta manera, la palabra estimador está
referida a la función y la palabra estimación está referida a un valor de dicha función.

Por ejemplo,

Es un estimador de la media µ; y,

Es una estimación o valor estimado de µ

La estimación puntual admite dos problemas:

• Obtener estadísticos que puedan utilizarse como estimadores de ó 𝜏(𝜃).


• Definir criterios para encontrar el mejor estimador entre los muchos estimadores
posibles.

2.2. Métodos para encontrar estimadores

4
Estimación de parámetros
Rubén Medinaceli Ortiz

Se tiene una variedad de métodos para encontrar estimadores de parámetros. En esta


oportunidad se presenta dos de estos métodos, probablemente los más importantes:
• El método de los momentos
• El método de máxima verosimilitud

2.2.1. El método de los momentos

Momentos poblacionales

Si X es una variable aleatoria (característica de interés en el muestreo y la estimación de


parámetros), el r-avo momento de X, denotado por 𝜇𝑟, se define como:

𝜇𝑟 = 𝐸[𝑋𝑟]

Nótese que,

𝜇1 = 𝐸[𝑋] = 𝜇

En palabras, el primer momento de una variable aleatoria X es su media.

Nótese además que,

𝜇2 = 𝐸[𝑋2]

Recordando que,

𝑉𝑎𝑟[𝑋] = 𝐸[𝑋2] − 𝜇2

En palabras, la varianza de una variable aleatoria X es igual a su segundo momento menos el


primer momento al cuadrado.

Momentos muestrales

Si 𝑋1,𝑋2, 𝑋3, ⋯ , 𝑋𝑛 es una muestra aleatoria de tamaño n, el r-avo momento muestral,


denotado por 𝑀𝑟, se define como:

Nótese que,

5
Estimación de parámetros
Rubén Medinaceli Ortiz

En palabras, el primer momento muestral es la media de la muestra.

Nótese además que,

El método de los momentos consiste en resolver el siguiente sistema de ecuaciones:

𝜇𝑟 = 𝑀𝑟; 𝑟 = 1, 2, 3, ⋯

2.2.2. Ejercicio 1

Problema:

Sea 𝑋1,𝑋2, 𝑋3,⋯ , 𝑋𝑛 una muestra aleatoria de una población que sigue una distribución
normal con media µ y varianza σ2.

𝒇𝑿(𝒙)

Distribución normal

σ2

𝑋1,𝑋2, 𝑋3, ⋯ , 𝑋𝑛 (𝑀𝑢𝑒𝑠𝑡𝑟𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑡𝑎𝑚𝑎ñ𝑜 𝑛)

Encontrar los estimadores de µ y σ2, utilizando el método de los momentos.

Solución:

Sistema de ecuaciones:

𝜇1 = 𝑀1

𝜇2 = 𝑀2

Estimador de µ

𝜇1 = 𝑀1

Donde,

6
Estimación de parámetros
Rubén Medinaceli Ortiz

𝜇1 = 𝐸[𝑋] = 𝜇

Por tanto,

Estimador de σ2

𝑉𝑎𝑟[𝑋] = 𝜎2 = 𝜇2 − 𝜇12

𝜇2 = 𝑀2

Esto es,

Por tanto,

Finalmente,

2.2.3. Ejercicio 2

Problema:

Sea 𝑋1,𝑋2, 𝑋3,⋯ , 𝑋𝑛 una muestra aleatoria de una población que sigue una distribución de
Poisson.

7
Estimación de parámetros
Rubén Medinaceli Ortiz

𝑓𝑋(𝑥)

Distribución de Poisson



𝐸[𝑋] = 𝜇 = 𝜆

𝑋1,𝑋2, 𝑋3,⋯ , 𝑋𝑛 (𝑀𝑢𝑒𝑠𝑡𝑟𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑡𝑎𝑚𝑎ñ𝑜 𝑛)

𝐸[𝑋] = 𝜇 = 𝜆 𝑉𝑎𝑟[𝑋]
= 𝜎𝑋2 =

Parámetro: λ

Encontrar un estimador de , utilizando el método de los momentos

Solución:

La distribución de Poisson tiene un solo parámetro, por tanto:

𝜇1 = 𝑀1

Donde:

𝜇1 = 𝐸[𝑋] = 𝜆

Por tanto,

̂=𝑿

8
Estimación de parámetros
Rubén Medinaceli Ortiz

2.2.4. Ejercicio 3

Problema:

Sea 𝑋1,𝑋2, 𝑋3,⋯ , 𝑋𝑛 una muestra aleatoria de una población que sigue una distribución
exponencial

𝑓𝑋(𝑥)

Distribución exponencial

1
𝐸[𝑋] = 𝜇 = 𝜆
𝑋1,𝑋2, 𝑋3,⋯ , 𝑋𝑛 (𝑀𝑢𝑒𝑠𝑡𝑟𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑡𝑎𝑚𝑎ñ𝑜 𝑛)

𝑓𝑋(𝑥) = 𝜆𝑒−𝜆𝑥; 𝑥 ≥ 0

Parámetro: λ

Encontrar un estimador de 𝜆 , utilizando el método de los momentos

Solución:

La distribución exponencial tiene un solo parámetro, por tanto:

𝜇1 = 𝑀1

Donde:

9
Estimación de parámetros
Rubén Medinaceli Ortiz

Por tanto,

De donde,

2.2.5. Método de máxima verosimilitud

Para introducir el método de máxima verosimilitud, considere el siguiente problema sencillo


de estimación. Suponga que una bolsa contiene cierto número de bolas de billar blancas y
cierto número de bolas negras, y se sabe que la razón de estos números es igual a 3 a 1
pero no se sabe si las bolas negras o las bolas blancas son las más numerosas. Esto es, la
probabilidad de seleccionar una bola de billar negra es .

Ahora bien, si se extrae n bolas de billar una tras otra y con reemplazo, la distribución de la
variable aleatoria X definida como el número de bolas negras en la selección efectuada, es
binomial; esto es,

Donde, 𝑞 = 1 − 𝑝 𝑦 𝑝 es la probabilidad de seleccionar una bola negra. Aquí,

Como muestra, se selecciona tres bolas de billar al azar y con reemplazo y con el resultado
que se obtenga, intentar estimar el parámetro desconocido .

El problema de estimación es particularmente simple en este caso, ya que se tiene que


escoger solamente entre dos valores .

Los posibles resultados y sus probabilidades para cada uno de los dos valores de se
muestran en la siguiente tabla:

X 0 1 2 3
p = 3/4 1/ 64 9/64 27/64 27/64
p = 1/4 27/64 27/64 9/64 1/64

Nótese que si en la muestra (selección de tres bolas de billar una tras otra y con reemplazo)
se obtiene cero (0) o una (1) bola de billar negra, el valor más probable de es ; vale
decir, que en la bolsa hay tres veces más bolas blancas que negras. En cambio, si se obtiene
dos (2) o tres (3) bolas blancas en la muestra, el valor más probable de ; vale decir
que en la bolsa hay tres veces más bolas negras que blancas.

10
Estimación de parámetros
Rubén Medinaceli Ortiz

El estimador elige para cada resultado de la muestra el valor de más probable.

En general, si se tuviera más valores alternativos para , se procedería razonablemente de


la misma manera. Así, si se encuentra que X=6 en una muestra de 25 selecciones (n=25),
se debe sustituir todos los valores posibles de en la siguiente expresión (distribución
binomial):

Y seleccionar como valor estimado aquel valor de 𝑝 que maximice 𝑓𝑋(𝑥). Esto es equivalente
a derivar 𝑓𝑋(𝑥) con respecto a , igualar la derivada a cero (0) y resolver la ecuación
resultante para 𝑝.

Este ejemplo exhibe la base (fundamento) del método de máxima verosimilitud (máxima
probabilidad) para encontrar estimadores, y establece la metodología a seguir.

Para definir los estimadores de máxima verosimilitud, es importante definir primero la función
de verosimilitud.

2.2.6. Función de verosimilitud

La función de verosimilitud de n variables aleatorias 𝑋1, 𝑋2,⋯ , 𝑋𝑛 es igual a su función de


densidad de probabilidad conjunta 𝑓𝑋1,𝑋2,⋯,𝑋𝑛(𝑥1,𝑥2, ⋯ , 𝑥𝑛;𝜃) que es considerada ser una
función de . En particular, si 𝑋1,𝑋2, ⋯ , 𝑋𝑛 es una muestra aleatoria de una distribución 𝑓𝑋(𝑥;
𝜃), la función de verosimilitud es igual a 𝑓𝑋1(𝑥1; 𝜃)𝑓𝑋2(𝑥2;𝜃) ⋯ 𝑓𝑋𝑛(𝑥𝑛; 𝜃). La función de
verosimilitud de 𝑋1, 𝑋2,⋯ , 𝑋𝑛 se denotará por 𝐿(𝜃; 𝑥1,𝑥2, ⋯ 𝑥𝑛).

2.2.7. Estimador de máxima verosimilitud

Sea,

𝐿(𝜃) = 𝐿(𝜃; 𝑥1,𝑥2,⋯ , 𝑥𝑛)

la función de verosimilitud de las variables aleatorias 𝑋1, 𝑋2,⋯ , 𝑋𝑛. Si 𝜃̂ es el valor de que
maximiza 𝐿(𝜃); luego, 𝜽̂ es el estimador de máxima verosimilitud de .

Reemplazando en 𝜃̂ los valores de una realización 𝑥1,𝑥2,⋯ 𝑥𝑛 de las variables aleatorias


𝑋1,𝑋2, ⋯ , 𝑋𝑛 se obtiene una estimación (valor estimado) de .

Los casos más importantes que se consideran son aquellos en los que 𝑋1,𝑋2,⋯ , 𝑋𝑛 es una
muestra aleatoria de una población 𝑓𝑋(𝑥; 𝜃), y en consecuencia, la función de verosimilitud
viene dada por,

𝐿(𝜃) = 𝑓𝑋1(𝑥1;𝜃)𝑓𝑋2(𝑥2;𝜃) ⋯ 𝑓𝑋𝑛(𝑥𝑛; 𝜃).

11
Estimación de parámetros
Rubén Medinaceli Ortiz

Muchas funciones de verosimilitud satisfacen condiciones de regularidad, tal que el


estimador de máxima verosimilitud es la solución a la ecuación,

También es útil tomar en cuenta que tanto 𝐿(𝜃) como 𝐿𝑛 𝐿(𝜃) tienen su máximo para el
mismo valor de . A veces es más fácil encontrar el máximo del logaritmo natural de la
función de verosimilitud.

2.2.8. Ejercicio 4

Problema:

Sea 𝑋1,𝑋2, ⋯ , 𝑋𝑛 una muestra aleatoria de una población que tiene una distribución de
Bernoulli.

𝑓𝑋 (𝑥)

0 1 𝑋

𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛

𝑓𝑋(𝑥; 𝜃) = 𝑝𝑥𝑞1−𝑥;𝑥 = 0, 1; 𝑞 = 1 − 𝑝

Parámetro:

Encontrar el estimador de máxima verosimilitud de 𝑝

Solución:

La función de verosimilitud viene dada por:

Si se denomina a ∑ 𝑥𝑖

𝐿(𝜃; 𝑥1,𝑥2,⋯ , 𝑥𝑛) = 𝑝𝑦𝑞1−𝑦

12
Estimación de parámetros
Rubén Medinaceli Ortiz

𝐿∗ = 𝐿𝑛 𝐿(𝜃; 𝑥1,𝑥2,⋯ , 𝑥𝑛) = 𝑦 𝐿𝑛 𝑝 + (𝑛 − 𝑦) 𝐿𝑛 𝑞

𝑦𝑞 − 𝑛𝑝 + 𝑦𝑝 = 0

Por tanto, el estimador de máxima verosimilitud de viene dado por:

2.2.9. Ejercicio 5

Problema:

Sea 𝑋1,𝑋2, ⋯ , 𝑋𝑛 una muestra aleatoria de una población que tiene una distribución normal
con media µ y varianza σ2.

𝒇𝑿(𝒙)

Distribución normal

σ2 (α)

𝑋1,𝑋2, 𝑋3, ⋯ , 𝑋𝑛 (𝑀𝑢𝑒𝑠𝑡𝑟𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑡𝑎𝑚𝑎ñ𝑜 𝑛)

13
Estimación de parámetros
Rubén Medinaceli Ortiz

Nótese que por comodidad en la notación se ha recurrido a 𝛼 = 𝜎2

Parámetros: α y σ2 (α)

Obtener los estimadores de máxima verosimilitud de α y σ2 (α)

Solución:

La función de verosimilitud viene dada por:

Por tanto, el estimador de máxima verosimilitud de viene dado por:

Por tanto, el estimador de máxima verosimilitud de σ2 viene dado por:

14
Estimación de parámetros
Rubén Medinaceli Ortiz

2.2.10. Ejercicio 6

Problema:

Sea 𝑋1,𝑋2, 𝑋3,⋯ , 𝑋𝑛 una muestra aleatoria de una población que sigue una distribución de
Poisson.

𝑓𝑋(𝑥)


Distribución de Poisson



𝐸[𝑋] = 𝜇 = 𝜆
𝑋1,𝑋2, 𝑋3,⋯ , 𝑋𝑛 (𝑀𝑢𝑒𝑠𝑡𝑟𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑡𝑎𝑚𝑎ñ𝑜 𝑛)

𝐸[𝑋] = 𝜇 = 𝜆 𝑉𝑎𝑟[𝑋]
= 𝜎𝑋2 =

Parámetro: λ

Encontrar el estimador de máxima verosimilitud del parámetro .

Solución:

La función de verosimilitud viene dada por:

15
Estimación de parámetros
Rubén Medinaceli Ortiz

Por tanto, el estimador de máxima verosimilitud de 𝜆 es:

2.2.11. Ejercicio 7

Problema:

Sea 𝑋1,𝑋2, 𝑋3,⋯ , 𝑋𝑛 una muestra aleatoria de una población que sigue una distribución
exponencial

𝑓𝑋(𝑥)

Distribución exponencial

1
𝐸[𝑋] = 𝜇 = 𝜆
𝑋1,𝑋2, 𝑋3,⋯ , 𝑋𝑛 (𝑀𝑢𝑒𝑠𝑡𝑟𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑡𝑎𝑚𝑎ñ𝑜 𝑛)

𝑓𝑋(𝑥) = 𝜆𝑒−𝜆𝑥; 𝑥 ≥ 0

16
Estimación de parámetros
Rubén Medinaceli Ortiz

Parámetro: λ

Encontrar el estimador de máxima verosimilitud de .

Solución:

La función de verosimilitud viene dada por:

𝐿∗ = 𝐿𝑛 𝐿(𝜃; 𝑥1,𝑥2,⋯ , 𝑥𝑛) = 𝑛 𝐿𝑛 𝜆 − 𝜆 ∑ 𝑥𝑖

Por tanto, el estimador de máxima verosimilitud de λ viene dado por:

2.2.12. Propiedad de invarianza de los estimadores de máxima


verosimilitud

Esta propiedad afirma que si 𝜃̂ es el estimador de máxima verosimilitud del parámetro ;


luego, 𝜏(𝜃̂) es un estimador de máxima verosimilitud de 𝜏(𝜃).

Por ejemplo, en el Ejercicio 5 se obtuvo el siguiente estimador de máxima verosimilitud para


la varianza (𝜎2) de una población que sigue una distribución normal:

17
Estimación de parámetros
Rubén Medinaceli Ortiz

Por la propiedad de invarianza de los estimadores de máxima verosimilitud, el estimador de


máxima verosimilitud de la desviación estándar (𝜎) vendrá dado por:

2.3. Propiedades de los estimadores puntuales

Se han presentado básicamente dos métodos para obtener estimadores puntuales, tal como
se ha dicho, hay más métodos. Estos métodos obedecen a bases más o menos intuitivas.
La pregunta que ahora surge es: ¿son algunos estimadres mejores, en algún sentido, que
otros?

A continuación se menciona unas cuantas propiedades (de las muchas que existen) que los
estimadores pueden o no tener y que pueden ayudar a decidir si un estimador es mejor que
otro.

2.3.1. Error cuadrático medio

Sea 𝑇 = 𝑡(𝑋1, 𝑋2,⋯ , 𝑋𝑛) un estimador de 𝜏(𝜃); luego,

𝐸[(𝑇 − 𝜏(𝜃))2]

Se define como el error cuadrático medio del estimador = 𝑡(𝑋1, 𝑋2,⋯ , 𝑋𝑛); el mismo que
se denotará por 𝑀𝑆𝐸𝑡(𝜃).

El error cuadrático medio es una medida útil de la bondad de un estimador 𝑡(𝑋1, 2,⋯ , 𝑋𝑛)
de 𝜏(𝜃), es una medida de la dispersión de los valores de T respecto de
𝜏(𝜃).

Si se utilizara el error cuadrático medio para comparar estimadores, obviamente se preferiría


aquel que tenga el error cuadrático medio más pequeño; sin embargo, tales estimadores
rara vez existen. En general, el error cuadrático medio de un estimador depende de .

Para dos estimadores cualesquiera 𝑇1 = 𝑡1(𝑋1,𝑋2, ⋯ , 𝑋𝑛) y 𝑇2 = 𝑡2(𝑋1,𝑋2, ⋯ , 𝑋𝑛) de 𝜏(𝜃), sus
respectivos errores cuadráticos medios 𝑀𝑆𝐸𝑡1(𝜃) y 𝑀𝑆𝐸𝑡2(𝜃) como funciones de ,
probablemente se crucen tal como se muestra en la siguiente figura; para algunos valores
de , 𝑡1 tiene el menor MSE, y para otros valores de , 𝑡2 tiene el MSE más pequeño; por
tanto, no se tiene base para preferir uno de los estimadores sobre el otro.

𝑀𝑆𝐸𝑡1(𝜃)
18
Estimación de parámetros
Rubén Medinaceli Ortiz

𝑀𝑆𝐸𝑡2(𝜃)

Una razón para no poder encontrar un estimador con un error cuadrático medio
uniformemente más pequeño es que la clase de todos los posibles estimadores es muy
grande. Para evitar esto, se podría restringir la totalidad de los estimadores considerando
solamente aquellos estimadores que satisfacen alguna otra propiedad; tal propiedad es la
denominada estimador insesgado.

2.3.2. Estimador insesgado

Un estimador 𝑇 = 𝑡(𝑋1,𝑋2, ⋯ , 𝑋𝑛) se define como un estimador insesgado de 𝜏(𝜃) si y


solamente si,

𝐸[𝑇] = 𝐸[𝑡(𝑋1, 𝑋2,⋯ , 𝑋𝑛)] = 𝜏(𝜃)

En palabras, 𝑇 es un estimador insesgado de 𝜏(𝜃) si la media, esperanza o valor esperado


del estimador (variable aleatoria) es igual al parámetro que se está estimado, 𝜏(𝜃).

Si se restringe la totalidad de los estimadores en consideración a solamente los estimadores


insesgados, es posible esperar que se encontrará un estimador que tenga el error cuadrático
medio más pequeño y uniforme.

El problema de encontrar un estimador insesgado que tenga el error cuadrático medio más
pequeño y uniforme se verá más adelante.

En general,

𝑀𝑆𝐸 𝑡(𝜃) = 𝐸[(𝑇 − 𝜏(𝜃))2]

𝑀𝑆𝐸 𝑡(𝜃) = 𝐸[{(𝑇 − 𝐸[𝑇]) − (𝜏(𝜃) − 𝐸[𝑇])}2]


0
𝑀𝑆𝐸 𝑡(𝜃) = 𝐸[(𝑇 − 𝐸[𝑇])2] − 2(𝜏(𝜃) − 𝐸[𝑇])𝐸[(𝑇 − 𝐸[𝑇 )] + 𝐸[(𝜏(𝜃) − 𝐸[𝑇])2]

𝑀𝑆𝐸 𝑡(𝜃) = 𝐸[(𝑇 − 𝐸[𝑇])2] + 𝐸[(𝜏(𝜃) − 𝐸[𝑇])2]

= 𝑉𝑎𝑟[𝑇] + (𝜏(𝜃) − 𝐸[𝑇])2

Por tanto, si es un estimador insesgado de 𝜏(𝜃), el 𝑀𝑆𝐸 𝑡(𝜃) = 𝑉𝑎𝑟[𝑇].

El término 𝜏(𝜃) − 𝐸[𝑇] recibe el nombre de sesgo del estimador 𝑇 que puede ser positivo,
negativo o igual a cero.

19
Estimación de parámetros
Rubén Medinaceli Ortiz

2.3.3. Estimadores insesgados de varianza mínima (EIVM)

Sea 1,𝑋2, ⋯ , 𝑋𝑛 una muestra aleatoria de una población 𝑓𝑋(𝑥).


Sea 𝜃 el conjunto de parámetros de 𝑓𝑋(𝑥) Sea 𝜏(𝜃) una función
cualquiera de .

Luego,

𝑇∗ = 𝑡∗(𝑋1, 𝑋2,⋯ , 𝑋𝑛) es un estimador insesgado de varianza mínima de 𝜏(𝜃) si y


solamente si,

a) 𝐸[𝑇∗] = 𝜏(𝜃) (𝑇∗ es un estimador insesgado de 𝜏(𝜃))

b) Si es cualquier otro estimador insesgado de 𝜏(𝜃); luego,

𝑉𝑎𝑟[𝑇∗] < 𝑉𝑎𝑟[𝑇]; ∀ 𝜃


Por tanto, buscar un estimador con el menor error cuadrático medio entre los estimadores
insesgados es equivalente a buscar un estimador con la menor varianza entre los
estimadores insesgados.

Considere que 𝑋1, 𝑋2,⋯ , 𝑋𝑛 (𝑛 > 2) es una muestra aleatoria de una población que sigue
µuna distribución normal con media µ y varianza σ2.

Asuma que σ2 (la varianza de la población) es conocida.

Se desea estimar µ

Se proponen los siguientes estimadores para estimar µ:

𝑇1 = 𝑋1

(estimador de máxima verosimilitud de µ)

Inicialmente se averigua si estos estimadores son insesgados.

20
Estimación de parámetros
Rubén Medinaceli Ortiz

Nótese que los tres estimadores son insesgados; en promedio, son iguales al parámetro que
se desea estimar.

Las varianzas de cada uno de estos estimadores son:

Si 𝑛 > 2; 3 es el estimador insesgado que tiene la menor varianza.

Sin embargo, surge la siguiente pregunta: ¿no existirá un otro estimador insesgado de
µ que tenga una menor varianza que 𝑻𝟑?

Para contestar a esta pregunta se debe averiguar si la siguiente desigualdad, denominada


desigualdad de Cramér-Rao, se cumple:

Donde, 𝜏′(𝜃) es la primera derivada de la función del parámetro repecto a ; y, 𝑓𝑋(𝑥; 𝜃)


es la distribución de la población.

Si esta desigualdad se cumple, significará que el estimador es el estimador insesgado


de varianza mínima de 𝝉(𝜽).

Continuando con el ejemplo, se quiere averiguar si el estimador 𝑇3 es el estimador


insesgado de varianza mínima de µ.

Evaluando la desigualdad de Cramér-Rao se tiene:

𝜃 = 𝜇 𝜏(𝜃)
=𝜇

𝜏′(𝜃) = 1

21
Estimación de parámetros
Rubén Medinaceli Ortiz

Recordando que si,

Por tanto,

Por tanto,

En términos de la desigualdad de Cramér-Rao se tiene que,

Recordando que,

Es posible afirmar que,

22
Estimación de parámetros
Rubén Medinaceli Ortiz

3. Estimación por intervalos

Como las estimaciones puntuales rara vez serán iguales a los parámetros que se supone
estiman, es deseable que una estimación puntual esté acompañada por alguna medida del
posible error de estimación.

Por ejemplo, una estimación puntual podría estar acompañada de algún intervalo alrededor
de ella junto con alguna medida de la seguridad de que el valor verdadero del parámetro se
encuentra dentro de dicho intervalo.

Vale decir, en lugar de inferir que el valor verdadero de un parámetro es un punto, se busca
inferir que el valor verdadero de un parámetro está contenido en algún intervalo.
Consecuentemente, se está hablando de la denominada estimación de intervalo.

Al igual que en la estimación puntual, el problema de la estimación de intervalo es doble.


Primero, se tiene el problema de encontrar estimadores de intervalo; y, segundo, está el
problema de determinar buenos u óptimos estimadores de intervalo.
,
3.1. Intervalo de confiabilidad

Sea 𝑋1,𝑋2, ⋯ , 𝑋𝑛 una muestra aleatoria de una población 𝑓𝑋(𝑥; 𝜃).

Sean 𝑇1 = 𝑡1(𝑋1,𝑋2, ⋯ , 𝑋𝑛) y 𝑇2 = 𝑡2(𝑋1, 𝑋2,⋯ , 𝑋𝑛) dos estadísticos tales que 𝑇1 < 𝑇2, para los
cuales,

𝑃[𝑇1 < 𝜏(𝜃) < 𝑇2] = 1 − 𝛼

Donde, 𝜏(𝜃) es una función del parámetro ; y, (1 − 𝛼) no depende de .

Luego,

El intervalo aleatorio (𝑇1,𝑇2) recibe el nombre de intervalo de confiabilidad del 100(1 − 𝛼) por
ciento de 𝜏(𝜃); (1 − 𝛼) recibe el nombre de nivel de confiabilidad; 𝑇1 y 𝑇2 reciben el nombre
de límite inferior y límite superior, respectivamente, del intervalo de confiabilidad de

23
Estimación de parámetros
Rubén Medinaceli Ortiz

Nivel de confiabilidad
1-α
α = Nivel de desconfianza

𝑇1 𝑇2

Intervalo de confiabilidad

Límite inferior Límite superior

𝜏(𝜃); y recibe el nombre de nivel de desconfianza (o de significancia). Esto es,


3.2. Intervalos de confiabilidad para parámetros de poblaciones normales

Tal como se ha dicho anteriormente, la distribución normal juega un rol predominante en la


estadística. El teorema del límite central y otras razones también anotadas anteriormente
indican que gran parte de las poblaciones de la vida real son representadas con éxito por la
distribución normal.

Es importante señalar que los resultados que se obtienen a continuación son válidos
principalmente para poblaciones que siguen una distribución normal; aunque, en atención
al teorema del límite central, estos resultados pueden ser igualmente válidos para
poblaciones no normales, cuando el tamaño de la muestra aleatoria es grande.

Sea 𝑋1,𝑋2, ⋯ , 𝑋𝑛 una muestra aleatoria de tamaño n de una población que sigue una
distribución normal con media µ y varianza σ2. Esto es:

𝒇𝑿(𝒙)

Distribución normal

σ2

𝑋1,𝑋2, 𝑋3, ⋯ , 𝑋𝑛 (Muestra aleatoria de tamaño n)


𝑥1,𝑥2, 𝑥3,⋯ , 𝑥𝑛 (Realización de la muestra aleatoria)

24
Estimación de parámetros
Rubén Medinaceli Ortiz

3.2.1. Intervalos de confiabilidad para la media µ

Tal como se ha visto anteriormente, el mejor estimador (insesgado y de varianza mínima)


de µ es 𝑋.

Recuerde que,

𝑋 ~𝑁(𝜇; 𝜎2)

Estandarizando 𝑋 , se tiene que:

Se va a utilizar este estadístico en la obtención de un intervalo de confiabilidad para µ.


𝒇𝒁(𝒛)

Nivel de σ2 = 1
Confiabilidad (1 –
α) α/2 α/2

𝑍~𝑁(0; 1)
−𝑧0 µ = 0 𝑧0
En la figura superior se puede observar que:

𝑃[−𝑧0 ≤ 𝑍 ≤ 𝑧0] = 1 − 𝛼

Sin embargo,

Por tanto,

25
Estimación de parámetros
Rubén Medinaceli Ortiz

Multiplicando cada término de esta desigualdad por , restando luego 𝑋 de cada término y

multiplicando por -1, se obtiene:

Finalmente reemplazando el estimador 𝑋 por el valor estimado 𝑥, se tiene:

𝜎 𝜎
𝑃 [ 𝑥 − 𝑧0 ≤ 𝜇 ≤ 𝑥 − 𝑧0 ] =1−𝛼
√𝑛 √𝑛

Esta expresión asume que se conoce , que generalmente no es el caso. Se reemplazará


por 𝑆 (desviación estándar de la muestra) siempre que 𝑛 ≥ 30.

El término representa cuánto difiere la media de la muestra (𝑋) del valor real de la
media (𝜇). Por tanto, esta expresión se puede utilizar para saber cuán grande debe ser la
muestra para asegurar que el error al estimar será menor a una cantidad especificada (𝑒);
esto es:

Con frecuencia se desea estimar la media (𝜇) de una población cuando se desconoce su
varianza (𝜎2) y es imposible obtener una muestra de tamaño 𝑛 ≥ 30. En este caso,
corresponde recurrir al siguiente estadístico deducido en el tema anterior:

𝑋−𝜇
𝑇 = 𝑆 ~ 𝑡𝑛−1
√𝑛

𝒇𝑻(𝒕)

Nivel de
Confiabilidad
(1 – α)
α/2 α/2
𝑇~𝑡𝑛−1
−𝑡0 µ=0 𝑡0

26
Estimación de parámetros
Rubén Medinaceli Ortiz

En la figura superior se puede observar que,

𝑃[−𝑡0 ≤ 𝑇 ≤ 𝑡0] = 1 − 𝛼

Sin embargo,

Por tanto,

Multiplicando cada término de esta desigualdad por , restando luego 𝑋 de cada término y
multiplicando por -1, se obtiene:

Finalmente, reemplazando el estimador 𝑋 por el valor estimado 𝑥; y el estimador por el


valor estimador , se tiene:
𝑠 𝑠
𝑃 [ 𝑥 − 𝑡0 ≤ 𝜇 ≤ 𝑥 + 𝑡0 ] =1−𝛼
√𝑛 √𝑛

3.2.2. Ejercicio 8

Problema:

Una máquina produce piezas metálicas cilíndricas. Se toma una muestra de 10 piezas de la
producción del día y se procede a medir los diámetros. La siguiente tabla registra los valores
obtenidos:

Registro de diámetros (cm)


1,01 0,97 1,03 1,04 0,99
0,98 0,99 1,02 1,03 1,04

La especificación técnica señala que para aceptar la producción de un día, la media de los
diámetros de las piezas producidas debe ser igual a 1,00 cm.

27
Estimación de parámetros
Rubén Medinaceli Ortiz

Con un nivel de confiabilidad del 95% averiguar si la especificación técnica se cumple en


este caso.

Solución:

𝒇𝑿(𝒙)

= Diámetro de la pieza cilíndrica (cm)


µ = 1,00 cm (especificación técnica)

Muestra aleatoria: 𝑋1,𝑋2, 𝑋3, ⋯ , 𝑋10


Realización: 𝑥1 = 1,01; 𝑥2 = 0,97,⋯ , 𝑥10 = 1,04

En este caso, para obtener un intervalo de confiabilidad del 95% para µ, se recurrirá a la
siguiente expresión:

𝑛
1 1,01 + 0,97 + ⋯ + 1,04
𝑥 = ∑ 𝑥𝑖 = = 1,01 𝑐𝑚
𝑛 10
𝑖=1

𝑛
1 (1,01 − 1,01)2 + (0,97 − 1,01)2 + ⋯ + (1,04 − 1,01)2
𝑠 = √ ∑(𝑥𝑖 − 𝑥)2 = √ = 0,026
𝑛−1 9
𝑖=1

𝒇𝑻(𝒕)

Nivel de
Confiabilidad

28
Estimación de parámetros
Rubén Medinaceli Ortiz

(1 – α)
α/2 0,95 α / 2 = 0,025
𝑇~𝑡𝑛−1~𝑡9
−𝑡0 µ=0 𝑡0 = 2,262 (𝑑𝑒 𝑡𝑎𝑏𝑙𝑎𝑠)

Por tanto,

𝑃[1,01 − 0,02 ≤ 𝜇 ≤ 1,01 + 0,02] = 0,95

Finalmente,

𝑷[𝟎, 𝟗𝟗 ≤ 𝝁 ≤ 𝟏, 𝟎𝟑] = 𝟎, 𝟗𝟓

De acuerdo a esta estimación, la media de los diámetros de las piezas cilíndricas


producidas en el día es algún valor entre 0,99 cm y 1,03 cm y la probabilidad que esto
ocurra es igual a 0,95.

En este caso, la especificación técnica (µ = 1,00 cm) está dentro del intervalo de
confiabilidad. Consecuentemente, la producción del día debe ser aceptada.

3.2.3. Intervalo de confiabilidad para la varianza, σ2

Se requiere un estadístico que incluya a σ2. Recuerde que el tema anterior se obtuvo el
siguiente estadístico:

Nótese que la variable aleatoria U que sigue una distribución chi-cuadrada con n – 1 grados
de libertad incluye al parámetro de interés (𝜎2) y a su estimador puntual (𝑆2). Por tanto, 𝑈
es el estadístico requerido.

29
Estimación de parámetros
Rubén Medinaceli Ortiz

𝑓𝑈 (𝑢)

Nivel de
Confiabilidad

α/2 1–α α/2

𝑈𝑖𝑛𝑓 𝑈𝑠𝑢𝑝 𝑈 ~ 𝑋𝑛2−1

En la figura superior se puede ver que:

𝑃[𝑈𝑖𝑛𝑓 ≤ 𝑈 ≤ 𝑈𝑠𝑢𝑝] = 1 − 𝛼

Sin embargo,

Por tanto,

Dividiendo cada término de la desigualdad por (n – 1)S2 e invirtiendo luego cada término
(con lo cual se cambia el sentido de las desigualdades), se tiene:

Finalmente, reemplazando el estimador 𝑆2 por el valor estimado 𝑠2, se tiene:

(𝑛 − 1)𝑠 2 2
(𝑛 − 1)𝑠 2
𝑃[ ≤𝜎 ≤ ] =1−𝛼
𝑈𝑠𝑢𝑝 𝑈𝑖𝑛𝑓

3.2.4. Ejercicio 9

Problema:

Se ha procedido a medir estaturas (en metros) de algunos jóvenes que han cumplido 16
años en el mes de junio de este año, en la ciudad de Oruro. Los resultados de la medición
se muestran en la siguiente tabla:

30
Estimación de parámetros
Rubén Medinaceli Ortiz

Muestra N° 1 2 3 4 5 6 7 8 9 10 11
Estatura (m) 1,65 1,66 1,67 1,64 1,66 1,65 1,63 1,68 1,64 1,62 1,68

Obtener un intervalo de confiabilidad del 98% para la varianza de las estaturas de jóvenes
de 16 años en la ciudad de Oruro. Asumir una distribución normal para la población de
estaturas.

Solución:

𝒇𝑿(𝒙)

= Estatura jóvenes de 16 años en Oruro (m)


µ = ¿?

Muestra aleatoria: 𝑋1,𝑋2, 𝑋3, ⋯ , 𝑋11


Realización: 𝑥1 = 1,65; 𝑥2 = 1,66,⋯ , 𝑥11 = 1,68

Se utilizará la siguiente expresión para obtener el intervalo de confiabilidad solicitado:

31
Estimación de parámetros
Rubén Medinaceli Ortiz

𝑓𝑈 (𝑢)

Nivel de
Confiabilidad

α/2 1–α α / 2 = 0,01


0,98

𝑈𝑖𝑛𝑓 = 2,56 𝑈𝑠𝑢𝑝 = 23,2 𝑈 ~ 𝑋𝑛2−1

Reemplazando valores se tiene:

Finalmente, se tiene que:

En palabras, la varianza de la estatura de jóvenes de 16 años en Oruro, es algún valor


entre 0,0002 y 0,0015; y la probabilidad que esto ocurra es igual 0,98

3.2.5. Intervalo de confiabilidad para la diferencia de medias,


(µX - µY)

En muchas ocasiones se hace necesario comparar dos poblaciones 𝑓𝑋(𝑥) y 𝑓𝑌(𝑦) ya sea
en términos de sus medias 𝜇𝑋 y 𝜇𝑌; y/o sus varianzas 𝜎𝑋2 y 𝜎𝑌2.

Inicialmente, se tratará la comparación de medias y posteriormente la comparación de


varianzas.

La comparación de medias puede dar lugar a alguno de los siguientes resultados:

𝜇𝑋 = 𝜇𝑌 → 𝜇𝑋 − 𝜇𝑌 = 0

𝜇𝑋 < 𝜇𝑌 → 𝜇𝑋 − 𝜇𝑌 < 0

𝜇𝑋 > 𝜇𝑌 → 𝜇𝑋 − 𝜇𝑌 > 0

Consecuentemente, la obtención de intervalos de confiabilidad para la diferencia de medias


(𝜇𝑋 − 𝜇𝑌) permitirá conocer los resultados de una comparación de medias poblacionales.

La nomenclatura y la base estadística utilizadas son las que se muestran en la siguiente


figura:

32
Estimación de parámetros
Rubén Medinaceli Ortiz

𝒇𝑿(𝒙) 𝒇𝒀(𝒚)

σX2
σY
2

µX
µY

𝑋1,𝑋2, ⋯ , 𝑋𝑛
𝑌1, 𝑌2, ⋯ , 𝑌𝑚

En función del tamaño de las muestras (n y m) y de la naturaleza de las varianzas


poblacionales (σX2 y σY2), es posible considerar tres (3) casos:

Caso A

Las varianzas poblacionales σX2 y σY2 son conocidas; vale decir, n ≥ 30 y m


≥ 30

En este caso de tiene que,

Estandarizando − 𝑌 se obtiene,

33
Estimación de parámetros
Rubén Medinaceli Ortiz

Se utiliza este estadístico para obtener el intervalo de confiabilidad correspondiente.

𝒇𝒁(𝒛)

Nivel de σ2 = 1
Confiabilidad
(1 – α)
α/2 α/2
𝑍~𝑁(0; 1)
−𝑧0 µ=0 𝑧0

En la figura superior se puede observar que,

𝑃[−𝑧0 ≤ 𝑍 ≤ 𝑧0] = 1 − 𝛼

Sin embargo,

Por tanto,

𝜎𝑋2 𝜎𝑌2
√ +
Multiplicando cada término de la desigualdad por 𝑛 𝑚 , restando luego 𝑋 − 𝑌 de cada
término y multiplicando la desigualdad por -1, se tiene,

34
Estimación de parámetros
Rubén Medinaceli Ortiz

Finalmente, sustituyendo los estimadores 𝑋 𝑦 𝑌 por sus respectivos valores estimados 𝑥 y 𝑦,


se tiene:

𝜎𝑋2 𝜎𝑌2 𝜎𝑋2 𝜎𝑌2


𝑃 [ 𝑥 − 𝑦 − 𝑧0 √ + ≤ 𝜇𝑋 − 𝜇𝑌 ≤ 𝑥 − 𝑦 + 𝑧0 √ + ] = 1−𝛼
𝑛 𝑚 𝑛 𝑚

En la práctica, como n ≥ 30 y m ≥ 30, para aplicar esta expresión se sustituye 𝜎𝑋2 𝑦 𝜎𝑌2 por
𝑠𝑋2 𝑦 𝑠𝑌2 respectivamente.

Caso B

Las varianzas poblacionales σX2 y σY2 son desconocidas pero iguales σX2
= σY2 = σ2 (n ˂ 30 y/o m ˂ 30)

En este caso de tiene que,

Estandarizando − 𝑌 se obtiene,

Por otro lado,

Por tanto,

Recordando que,

35
Estimación de parámetros
Rubén Medinaceli Ortiz

Donde,

𝑍 ~ 𝑁(0; 1)
𝑊 ~ 𝑋𝑟2

En este caso, se tiene que,

Es el estadístico a utilizarse para obtener el intervalo de confiabilidad buscado.

𝒇𝑻(𝒕)

Nivel de
Confiabilidad
(1 – α)
α/2 α/2
𝑇~ 𝑡𝑛+𝑚−2
−𝑡0 µ=0 𝑡0

En la figura superior se puede observar que,

𝑃[−𝑡0 ≤ 𝑇 ≤ 𝑡0] = 1 − 𝛼

Sin embargo,

Por tanto,

36
Estimación de parámetros
Rubén Medinaceli Ortiz

Después de realizar las operaciones algebraicas necesarias para tener el parámetro 𝜇𝑋


− 𝜇𝑌 en el término central de la desigualdad, se tiene:

Finalmente, reemplazando los estimadores por los valores estimados, se tiene:

Caso C

Las varianzas poblacionales σX2 y σY2 son desconocidas y diferentes σX2 ≠ σY2
(n ˂ 30 y/o m ˂ 30)

El estadístico a utilizarse en este caso es,

Donde,

(𝑠𝑛 𝑋2 + 𝑠𝑚𝑌2)2

𝑝= 𝑠𝑋2 )2 (𝑠 𝑚𝑌2) 2
(𝑛
𝑛−1+𝑚−1

𝒇𝑻(𝒕)

37
Estimación de parámetros
Rubén Medinaceli Ortiz

Nivel de
Confiabilidad
(1 – α)
α/2 α/2
𝑇~ 𝑡𝑝
−𝑡0 µ=0 𝑡0

En el gráfico superior se puede observar que,


𝑃[−𝑡0 ≤ 𝑇 ≤ 𝑡0] = 1 − 𝛼

Sin embargo,

Por tanto,

Después de realizar las operaciones algebraicas necesarias para tener el parámetro


𝜇𝑋 − 𝜇𝑌 en el término central de la desigualdad, se tiene:

Finalmente, sustituyendo los estimadores por los valores estimados, se tiene,

𝑠𝑋2 𝑠𝑌2 𝑠𝑋2 𝑠𝑌2


𝑃 [ 𝑥 − 𝑦 − 𝑡0 √ + ≤ 𝜇𝑋 − 𝜇𝑌 ≤ 𝑥 − 𝑦 + 𝑡0 √ + ] = 1 − 𝛼
𝑛 𝑚 𝑛 𝑚

3.2.6. Intervalo de confiabilidad para la diferencia de medias en el caso


de observaciones en pares

En este caso, las poblaciones no son independientes, mucho menos las muestras de las
mismas, tampoco las varianzas de las poblaciones son necesariamente iguales. Esto ocurre

38
Estimación de parámetros
Rubén Medinaceli Ortiz

si las observaciones en las dos muestras ocurren en pares, de modo que las observaciones
están relacionadas.

Por ejemplo, si se efectúa una prueba de una nueva dieta utilizando 15 personas, los valores
de peso antes y después de la dieta formarán las dos muestras.

Las observaciones en las dos muestras realizadas en la misma persona están relacionadas
y, por consiguiente, forman un par.

Para determinar si la dieta es efectiva, se deben considerar las diferencias 𝑑1, 𝑑2,⋯ , 𝑑𝑛 de
observaciones en pares.

Antes Proceso Después


𝒇𝑿(𝒙) 𝒇𝒀(𝒚)

σX2
σY
2

µX
µY

𝑋1,𝑋2, ⋯ , 𝑋𝑛
𝑌1, 𝑌2, ⋯ , 𝑌𝑛
Muestra aleatoria: 𝐷1 = 𝑋1 − 𝑌1,𝐷2 = 𝑋2 − 𝑌2,⋯ , 𝐷𝑛 = 𝑋𝑛 − 𝑌𝑛

Realización: 𝑑1 = 𝑥1 − 𝑦1, 𝑑2 = 𝑥2 − 𝑦2, ⋯ , 𝑑𝑛 = 𝑥𝑛 − 𝑦𝑛

Se asume que 𝐷1,𝐷2,⋯ , 𝐷𝑛 es una muestra aleatoria de una población 𝑓𝐷(𝑑) que sigue una
distribución normal con media 𝜇𝐷 = 𝜇𝑋 − 𝜇𝑌 y varianza 𝜎𝐷2.

El mejor estimador (insesgado y de varianza mínima) de 𝜇𝐷 es 𝐷; donde,

El estimador de 𝜎𝐷2 es 𝑆𝐷2; donde,

39
Estimación de parámetros
Rubén Medinaceli Ortiz

Es más,

Estandarizando 𝐷 se tiene,

Por otro lado,

Consecuentemente,

Se utilizará este estadístico para obtener el intervalo de confiabilidad deseado.

𝒇𝑻(𝒕)

Nivel de
Confiabilidad
(1 – α)
α/2 α/2
𝑇~ 𝑡𝑝
−𝑡0 µ=0 𝑡0

En la figura superior se puede ver que,

𝑃[−𝑡0 ≤ 𝑇 ≤ 𝑡0] = 1 − 𝛼

40
Estimación de parámetros
Rubén Medinaceli Ortiz

Sin embargo,

Por tanto,

Dejando el parámetro en el término central se tiene,

Finalmente, reemplazando los estimadores por sus correspondientes valores estimados, se


tiene:

𝑠𝑑 𝑠𝑑
𝑃 [𝑑 − 𝑡0 ≤ 𝜇𝐷 ≤ 𝑑 − 𝑡0 ] =1−𝛼
√𝑛 √𝑛

3.2.7. Intervalo de confiabilidad para el cociente de varianzas


(σX2/ σY2) ó (σY2/σX2)

La comparación de varianzas puede dar lugar a alguno de los siguientes resultados:

Consecuentemente, la obtención de intervalos de confiabilidad para el cociente de varianzas


permitirá conocer los resultados de una comparación de medias poblacionales.

La nomenclatura y la base estadística utilizadas son las que se muestran en la siguiente


figura:

41
Estimación de parámetros
Rubén Medinaceli Ortiz

𝒇𝑿(𝒙) 𝒇𝒀(𝒚)

σX2
σY
2

µX
µY

𝑋1,𝑋2, ⋯ , 𝑋𝑛
𝑌1, 𝑌2, ⋯ , 𝑌𝑚

Recordando que,

Cuando,

En este caso se tiene,

Este estadístico se utilizará para obtener el intervalo de confiabilidad buscado

42
Estimación de parámetros
Rubén Medinaceli Ortiz

Nivel de
Confiabilidad
α/2 1–α α/2

𝐹𝑖𝑛𝑓
𝐹𝑠𝑢𝑝 𝐹 ~ 𝐹𝑚−1;𝑛−1
En la figura superior se puede observar que,

𝑃[𝐹𝑖𝑛𝑓 ≤ 𝐹 ≤ 𝐹𝑠𝑢𝑝] = 1 − 𝛼 Sin


embargo,

Por tanto,

Finalmente, sustituyendo los estimadores por los valores estimados se tiene,

𝑠𝑋2 𝜎𝑋2 𝑠𝑋2


𝑃 [ 𝐹𝑖𝑛𝑓 ≤ ≤ 𝐹𝑠𝑢𝑝 2 ] = 1 − 𝛼
𝑠𝑌2 𝜎𝑌2 𝑠𝑌

3.2.8. Ejercicio 10

Problema:

43
Estimación de parámetros
Rubén Medinaceli Ortiz

Se han registrado los tiempos de duración de dos marcas de focos eléctricos: A y B. Una
muestra aleatoria de 40 focos de la marca A mostró una duración promedio igual a 418 horas
de uso continuo y una desviación estándar igual a 26 horas. A su vez, una muestra aleatoria
de 50 focos de la marca B tuvo una duración promedio de 402 horas de funcionamiento
continuo con una desviación estándar igual a 22 horas. Con un nivel de confiabilidad del
95% señalar si, en promedio, las vidas útiles de los focos eléctricos de ambas marcas son
iguales.

Solución:

𝒇𝑿(𝒙) 𝒇𝒀(𝒚)

σX2
σY
2

=
=
µX Vida útil focos marca A en horas
µY Vida útil focos marca B en horas

𝑋1,𝑋2, ⋯ , 𝑋40 (muestra aleatoria) 𝑌1,𝑌2, ⋯ , 𝑌50 (muestra aleatoria)


𝑥1,𝑥2,⋯ , 𝑥40 (realización) 𝑦1, 𝑦2, ⋯ , 𝑦50 (realización)

𝑥 = 418 ℎ𝑜𝑟𝑎𝑠 𝑦 = 402 ℎ𝑜𝑟𝑎𝑠


𝑠𝑋 = 26 ℎ𝑜𝑟𝑎𝑠 𝑠𝑌 = 22 ℎ𝑜𝑟𝑎𝑠
𝑛 = 40 𝑚 = 50

44
Estimación de parámetros
Rubén Medinaceli Ortiz

Como n > 30 y m > 30 es posible asumir que las varianzas de las muestras son iguales a
las varianzas poblacionales (Caso A). Por tanto, se puede utilizar la siguiente expresión
para obtener un intervalo de confiabilidad para la diferencia de medias.

Se asume que 𝜎𝑋2 = 262 y que 𝜎𝑌2 = 222

Por otro lado,

𝒇𝒁(𝒛)

Nivel de σ2 = 1
Confiabilidad
(1 – α)
α/2 0,95 α / 2 = 0,025

𝑍~𝑁(0; 1)
−𝑧0 µ=0 𝑧0 = 1,96

Reemplazando valores se tiene:

Finalmente, se tiene que,

𝑷[𝟓, 𝟗 ≤ 𝝁𝑿 − 𝝁𝒀 ≤ 𝟐𝟔, 𝟏] = 𝟎, 𝟗𝟓

Con un nivel de confiabilidad del 95% se puede afirmar que (no estando el cero (0) en el
intervalo de confiabilidad) las vidas útiles medias de los focos de las marcas A y B no son
iguales; al contrario, los focos de la marca A tienen mayor vida útil media que los focos de
la marca B.

3.2.9. Ejercicio 11

45
Estimación de parámetros
Rubén Medinaceli Ortiz

Problema:

Para averiguar si un nuevo suero detendrá o no la leucemia, se selecciona nueve (9) ratones
que han alcanzado un estado avanzado de la enfermedad. Cinco ratones reciben el
tratamiento y cuatro no lo reciben. Los tiempos de sobrevivencia, en años, desde que se
inició el experimento, son los siguientes:

Tiempo de sobrevivencia con tratamiento 2,1 5,3 1,4 4,6 0,9


(años)
Tiempo de sobrevivencia sin tratamiento 1,9 0,5 2,8 3,1
(años)

Con un nivel de confiabilidad del 90% averiguar si el nuevo suero es efectivo.

Solución:

𝒇𝑿(𝒙) 𝒇𝒀(𝒚)

σX2
σY
2

=
= µX Tiempo de
supervivencia µY
Tiempo de supervivencia
con tratamiento
(años) sin
tratamiento (años)
𝑋1,𝑋2, ⋯ , 𝑋5 (muestra aleatoria) 𝑌1, 𝑌2, ⋯ , 𝑌4 (muestra aleatoria) 𝑥1
= 2,1; 𝑥2 = 5,3; ⋯ ; 𝑥5 = 0,9(realización) 𝑦1 = 1,9;𝑦2 = 0,5;⋯;𝑦4 = 3,1 (realización)

𝑛=5

𝑚=4
46
Estimación de parámetros
Rubén Medinaceli Ortiz

Las muestras son muy pequeñas; por tanto, las varianzas poblacionales 𝜎𝑋2 𝑦 𝜎𝑌2 son
desconocidas. Corresponde averiguar si son iguales; para ello es necesario encontrar un
intervalo de confiabilidad para el cociente de las varianzas poblacionales

Para el efecto se utilizará la siguiente expresión:

𝑓𝐹(.)

Nivel de
Confiabilidad
α/2 1–α α / 2 = 0,05
0,90

1 1
= = = 0,11 𝐹
𝐹𝑖𝑛𝑓
𝐹𝑛−1,𝑚−1 9,12 𝑠𝑢𝑝 =
6,59 𝐹 ~ 𝐹𝑚−1;𝑛−1
Reemplazando valores se tiene,

Finalmente,

Siendo el uno (1) un valor posible para , es factible asumir que las varianzas poblacionales
son iguales. Por tanto, la expresión a utilizarse para obtener un intervalo de confiabilidad
para la diferencia de medias es (Caso B):

1 1 (𝑛 − 1)𝑠𝑋2 + (𝑚 − 1)𝑠𝑌2 1 1 (𝑛 − 1)𝑠𝑋2 + (𝑚 − 1)𝑠𝑌2


[ 𝑥 − 𝑦 − 𝑡𝑜 √ ( + ) [ ] ≤ 𝜇𝑋 − 𝜇𝑌 ≤ 𝑥 − 𝑦 + 𝑡𝑜 √ ( + ) [ ]] = 1 − 𝛼
𝑛 𝑚 𝑛+𝑚−2 𝑛 𝑚 𝑛+𝑚−2

47
Estimación de parámetros
Rubén Medinaceli Ortiz

𝒇𝑻(𝒕)

Nivel de
Confiabilidad
(1 – α)
α/2 0,90 α / 2 = 0,05

𝑇~ 𝑡𝑛+𝑚−2~𝑡5+4−2~𝑡7
−𝑡0 µ=0 𝑡0 = 1,895

Reemplazando valores se tiene:

𝑋 − 𝑌 = 2,86 − 2,07 = 0,79

1 1 (𝑛 − 1)𝑠𝑋2 + (𝑚 − 1)𝑠𝑌2 1 1 4(3,88) + 3(1,36)


𝑡𝑜 √ ( + ) [ ] = 1,895√ ( + ) ( ) = 2,13
𝑛 𝑚 𝑛+𝑚−2 5 4 7

Por tanto,

𝑃[0,79 − 2,13 ≤ 𝜇𝑋 − 𝜇𝑌 ≤ 0,79 + 2,13] = 0,90

Finalmente,

𝑷[−𝟏,𝟑𝟒 ≤ 𝝁𝑿 − 𝝁𝒀 ≤ 𝟐, 𝟗𝟐] = 𝟎, 𝟗𝟎

Con un nivel de confiabilidad del 90% es posible afirmar que estando el cero (0) comprendido
en el intervalo de confiabilidad, las medias poblacionales pueden ser consideradas iguales
y concluir que el nuevo suero no es efectivo.

3.2.10. Ejercicio 12

Problema:

Un investigador afirma que la resistencia a la tracción de cierto material refractario disminuye


con el incremento de la temperatura. La siguiente tabla muestra los resultados de un
experimento en el que se mide la resistencia a la compresión de ocho (8) muestras del
material refractario, primero a temperatura ambiente y posteriormente luego de calentar las
muestras a una temperatura de 50°C.

48
Estimación de parámetros
Rubén Medinaceli Ortiz

X = Resistencia (temperatura 250 270 260 265 255 250 260 270
ambiente) (kg/cm2)
Y = Resistencia (a 50°C) (kg/cm2) 255 260 255 265 250 240 245 265

Con un nivel de confiabilidad del 95%, averiguar si la afirmación del investigador es real.

Solución:

Las mediciones de la resistencia a la tracción efectuadas en cada una de las ocho muestras
inicialmente a temperatura ambiente y luego a 50°C de temperatura forman pares.

Para determinar si la afirmación del investigador es real, se deben considerar las diferencias
𝑑1,𝑑2, ⋯ , 𝑑𝑛 de las observaciones en pares.

Antes Proceso Después


𝒇𝑿(𝒙) 𝒇𝒀(𝒚)

σX2
σY
2

µX Resistencia a temperatura
ambiente µY Resistencia a 50°C

𝑋1,𝑋2, ⋯ , 𝑋8 𝑌1,𝑌2, ⋯ , 𝑌8
Muestra aleatoria: 𝐷1 = 𝑋1 − 𝑌1,𝐷2 = 𝑋2 − 𝑌2,⋯ , 𝐷8 = 𝑋8 − 𝑌8

Realización: 𝑑1 = 𝑥1 − 𝑦1, 𝑑2 = 𝑥2 − 𝑦2, ⋯ , 𝑑8 = 𝑥8 − 𝑦8

xi = Resistencia (temperatura ambiente) 250 270 260 265 255 250 260 270
(kg/cm2)
yi = Resistencia (a 50°C) (kg/cm2) 255 260 255 265 250 240 245 265
di = xi – yi -5 10 5 0 5 10 15 5

49
Estimación de parámetros
Rubén Medinaceli Ortiz

Se utiliza la siguiente expresión en la obtención del intervalo de confiabilidad para 𝜇𝐷

𝑠𝑑 𝑠
𝑃 [𝑑 − 𝑡0 ≤ 𝜇𝐷 ≤ 𝑑 − 𝑡0 𝑑] = 1−𝛼
√𝑛 √𝑛

𝒇𝑻(𝒕)

Nivel de
Confiabilidad
(1 – α)
α/2 0,95 α / 2 = 0,025

𝑇~ 𝑡𝑛−1 ~ 𝑡7
−𝑡0 µ=0 𝑡0 = 2,365

Reemplazando valores, se tiene:

Finalmente,

𝑷[𝟎, 𝟒𝟏𝟒 ≤ 𝝁𝑫 ≤ 𝟏𝟎,𝟖𝟑𝟔] = 𝟎, 𝟗𝟓

Con un nivel de confiabilidad del 95% se puede afirmar que no estando el cero (0)
comprendido en el intervalo de confiabilidad, las medias poblacionales no son iguales; al
contrario, 𝜇𝑋 es mayor a 𝜇𝑌. Por tanto, el investigador tiene razón.

50

También podría gustarte