Tema 3.3 Estimación
Tema 3.3 Estimación
Tema 3.3 Estimación
Estimación
σ/√n
σ/√n
μ μ
Valores de las medias muestrales ( X )
Estimación de parámetros
poblacionales
Se denomina Estimación al conjunto de técnicas que
permiten dar un valor aproximado de un parámetro de
una población a partir de los datos proporcionados por
una muestra.
Esta tarea consiste en, partiendo de ciertos valores de la
muestra llamados estadígrafos o estadísticos, por
ejemplo la media aritmética muestral ( X ), inferir ciertos
otros valores de la población llamados parámetros (por
ejemplo la media aritmética poblacional µ).
Estimación Puntual
Concepto de Estimación puntual
La estimación puntual se realiza tomando en consideración el
valor del estadígrafo como valor del parámetro
correspondiente de la población.
Ejemplo:
Supongamos que estamos interesados en realizar un estudio
para describir las características del desarrollo físico en niñas
venezolanas entre 8 y 8.9 años de edad, por medio de la
observación de algunas dimensiones antropométricas, la talla
por ejemplo. Asumamos con bastante seguridad que la
variable X, talla, se distribuye en la población de acuerdo con
una ley de distribución normal cuyos parámetros µ y σ se
suponen desconocidos, lo expresado es común escribirlo en
la notación habitual estadística como sigue: X ~ N (µ, σ ).
Estimación Puntual
Supongamos para continuar que se ha tomado una muestra de tamaño
n = 90 (niñas) y queremos estimar la talla media y la desviación
estándar s. Denotemos por x1, x2,..., x90 los valores correspondientes
a la talla en centímetros de cada una de las 90 niñas de la muestra, de
estadística descriptiva conocemos que las fórmulas:
n
x x
n
xi
y 2
i
x i 1 s i 1
n n 1
se utilizan para calcular la media y la varianza muestral. Estos son
precisamente los estimadores de los parámetros y ya que tanto
como s se obtienen a través de funciones que dependen de las xi, es
decir, dependen de la talla de cada una de las 90 niñas seleccionadas
en la muestra. Si al realizar los cálculos apropiados se obtiene que
= 126.9 cm y s = 2.48 cm, entonces esas cifras son las
estimaciones
X de la media y la desviación estándar poblacionales, o
sea, de y .
Estimación Puntual
Debe notarse que la utilidad práctica del estadígrafo, radica
en que por medio de un proceder de cálculo se obtiene un
valor único. En este sentido, tanto la media como la
desviación estándar s constituyen valores puntuales.
Lo que tenemos son estimaciones puntuales.
Este hecho, unido a lo que conocemos acerca de la
incertidumbre que se produce en el proceso de selección
de muestras aleatorias, deja en dudas la utilidad de la
estimación puntual, ya que continuamos sin ninguna
información en relación con cuán cerca está el valor
encontrado del verdadero valor desconocido del parámetro
poblacional.
Es decir, sabemos que va a existir una diferencia entre la
cifra estimada y la verdadera, pero no conocemos todavía
si tal diferencia es admisible o no.
Estimación por intervalo de confianza
Una estimación por intervalos consta de dos valores numéricos que, definen
un intervalo que con un grado de confianza específico, se considera que
incluye el parámetro a estimar.
TABLA #1
131.5, 115.0, 125.5, 119.0, 123.0, 125.0, 124.5, 122.5, 118.0, 125.0
125.5, 119.0, 124.5, 118.0, 117.0, 128.0, 119.5, 124.5, 132.0, 122.5
120.5, 120.0, 126.0, 128.0, 120.5, 120.0, 119.0, 117.0, 129.5, 124.0
121.0, 119.0, 120.0, 128.0, 128.0, 118.5, 118.0, 124.0, 118.0, 118.5
131.0, 117.0, 118.0, 116.5, 121.0, 122.0, 124.0, 120.5, 114.5, 121.0
Intervalo de Confianza para con σ conocida
–1.96 no son más que los valores entre los que se acumula el 95 %
del área bajo la curva normal estándar; dicho de otra forma, fuera
Pr(122.05 – 1.96 · 5.53 /√50 < < 122.05 + 1.96 · 5.53 /√50 ) = 0.95
Pr(122.05 –1.96 · 0.782 < < 122.05 +1.96 · 0.782) = 0.95
Pr(120.52 < < 123.58) = 0.95
Intervalo de Confianza para
con σ conocida
Es importante en este momento dar una interpretación correcta a
este intervalo.
Hemos hallado un intervalo que podemos afirmar contiene a con
probabilidad 1−α= 0.95. La forma en que se ha construido el
intervalo de confianza garantiza que si se toman 100 muestras de
tamaño 50; 95 de ellas aproximadamente producirán intervalos que
contienen el valor real de mientras que alrededor de 5 producirán
intervalos que no lo contienen.
donde:
z: percentil de orden 1−α/2 de la distribución normal estándar.
z = 1.96 para el 95 % de confianza y z = 2.58 para el 99 % de
confianza.
x : valor observado de la media muestral, en una muestra de la
variable X
n: tamaño de muestra;
Los valores x ± z n son, respectivamente, los límites superior e
inferior de confianza del intervalo. El valor 1 − α se da de antemano;
por supuesto, 0<1−α <1 y α pequeño. Al percentil z de la
distribución normal estándar se le denomina coeficiente de
confianza.
Intervalo de Confianza para
con σ desconocida
Es el caso que más se encuentra en la práctica. Como en la
construcción del intervalo de confianza para µ siempre va a estar
implicado el valor de σ, será necesario estimar este último valor.
Como ya vimos n y s (desviación estándar de la
x i x
2
muestra)
i 1
s2
n 1
es la raíz cuadrada de la varianza s2 un estimador puntual de σ.
Sin embargo, tenemos que responder a una nueva interrogante,
¿seguirá siendo apropiado usar el percentil correspondiente a la
distribución normal estándar? Planteado en otra forma, vimos que
la interpretación de 1.96 dependía del conocimiento que teníamos
acerca del estadígrafo ( − µ ) / (σ/ ) = Z, ¿qué sucede
con esta expresión cuando se sustituye σ por su estimador s?
Se conoce que en este caso Z ya no tiene una distribución normal
n
con
x parámetros 0 y 1, sino que ( − µ ) / (s / ) tiene ahora la
distribución t de Student con n-1 grados de libertad.
x n
Intervalo de Confianza para
con σ desconocida
Gráfico de la distribución t-student
La distribución t-student representa un modelo de distribución o ley
de una variable aleatoria, cuyos valores se acerca a una distribución
normal cuando aumenta el número de observaciones (n>30).
El valor t de la distribución t-student depende de los grados de
libertad (gl) n − 1 y 1 − α/2. El valor de t se obtiene a partir de la
tabla de la distribución t-student.
Grados de Libertad:
Representan el número de
variables independientes
en la suma de cuadrados.
Intervalo de Confianza para
con σ desconocida
En la tabla de la distribución t se puede ver que cuando los grados
de libertad son mayores de 30, o lo que es lo mismo, para
muestras de tamaño n > 31 los percentiles de la distribución t y de
la N(0,1) son muy parecidos, entonces, es común considerar
intervalos de confianza diferentes en el caso de σ desconocida en
dependencia de si n > 30 ó n ≤ 30.
Primer caso (n > 30).
Sea X una variable aleatoria normal con parámetros desconocidos
σ. Si n es lo suficientemente grande, mayor que 30, el intervalo:
( x – z s/ n ; x + z s/ n )
donde s es el estimador de la desviación estándar poblacional, es
el intervalo de confianza para µ, con nivel de confiabilidad
(1 )·100 %.
Intervalo de Confianza para
con σ desconocida
Es decir que cuando tenemos una muestra de tamaño mayor que
30, lo único que debemos hacer es utilizar la estimación de σ para
construir el intervalo de confianza.
Calcular un intervalo de confianza del 95 % para la media de talla
de niñas de 7 años, a partir de los datos de la tabla 1, asumiendo
varianza desconocida. Suponga que el cálculo de la desviación
estándar muestral fue s = 4.383 cm.
Solución:
Debemos calcular un intervalo de la forma: ( x – z s/ n ; + z s/ n )
Conocemos que, x = 122.05cm y s = 4.383 cm, y además como el
nivel de confianza = 1 = 0.95, entonces z = 1.96.
Calculemos ahora el valor de z s/ n . Sustituyendo los valores
conocidos se tiene que:
Z s/ n = 1.96 · 4.383 / √ 200 = 1.215.
Ahora restando y sumando 1.215 al valor de x , obtenemos los
límites del intervalo de confianza. Estos son: (120.84, 123.27).
Intervalo de Confianza para
con σ desconocida
La afirmación que podemos hacer en este caso es la misma que
para σ conocida: para un nivel de confianza del 95 % la media
poblacional de la talla de niñas venezolanas de 7 años fluctúa,
aproximadamente, entre 120.8cm y 123.2cm.