Estimacion
Estimacion
Estimacion
n
• Desviación estándar muestral estima la
desviación estándar poblacional s
sˆ s i
( y y ) 2
n 1
• Proporción muestral ˆ estima la proporción
poblacional
Propiedades de buenos estimadores
• Insesgado: Distribuciones muestrales del estimador se
centra alrededor del valor del parámetro
• Ej. Estimador sesgado: rango muestral. No puede ser
más grande que el rango poblacional.
• Eficiente: El error estándar más pequeño posible,
comparado con otros estimadores
• Ej. Si la población es simétrica y con forma aprox.
normal, la media muestral es más eficiente que la
mediana muestral para estimar la media y mediana
poblacionales. (Puede verificar esto con el applet
“sampling distribution” en www.prenhall.com/agresti)
Intervalos de confianza
• Un intervalo de confianza (IC) es un intervalo de
números que se cree contienen el valor del parámetro.
• La probabilidad que el método produzca un intervalo
que contenga el parámetro se llama nivel de confianza.
Es común usar números cercanos a 1, tales como 0.95
ó 0.99.
• La mayoría de los ICs tiene la forma
estimación puntual ± margen de error
con el margen de error basado en la dispersión de la
distribución muestral del estimador puntual;
p.ej., margen de error 2(error estándar) para 95% confianza
IC para una propoción
(en una determinada categoría)
• Recuerda que la proporción muestral ˆ es una media
para variables binarias , donde y = 1 para una observ
en la categoría de interés, y = 0 de lo contrario
• Recuerda que la propoción poblacional es la media µ
de la distribución de probabilidad que tiene
P(1) and P(0) 1
• La desviación estándar de la dist. de probabilidad es
s (1 ) (e.g., 0.50 when 0.50)
• El error estándar de la proporción muestral es
s ˆ s / n (1 ) / n
• Recuerda que la distribución muestral de una proporción
muestral para muestras aleatorias grandes es
aproximadamente normal (por el TCL)
• Así, con probabilidad 0.95, proporción muestral ˆ cae a
1.96 errores estándar de la propoción poblacional
– 0.95 probabilidad que
ˆ falls between 1.96s ˆ and 1.96s ˆ
– Una vez que la muestra es selccionada, tenemos una
confianza del 95%
ˆ 1.96s ˆ to ˆ 1.96s ˆ contains
• Este es el IC de la proporción poblacional (casi)
Encontrar un IC en la práctica
• Complicación: El verdadero error estándar
s ˆ s / n (1 ) / n
depende del parámetro que desconocemos!
• En la práctica, estimamos
ˆ 1 ˆ
(1 )
s by se
ˆ n n
y entonces encontramos el IC del 95% CI utilizando la
fórmula
ˆ 1.96( se) to ˆ 1.96( se)
Ejemplo
¿Qué porcentaje de Americanos de 18-22 años reportan ser “very
happy”?
• Datos 2006 GSS: 35 de n = 164 dicen ser “very happy”
(otros reportan ser “pretty happy” o “not too happy”)
ˆ 35 /164 .213 (.31 for all ages),
se ˆ (1 ˆ ) / n 0.213(0.787) /164 0.032
• 95% CI is 0.213 ± 1.96(0.032), or 0.213 ± 0.063,
(p.ej., “margen de error” = 0.063)
lo que resulta en (0.15, 0.28).
• Tenemos una confianza del 95% que la proporción poblacional
de quienes son “very happy” está entre 0.15 y 0.28.
Ejercicio
Encuentra un IC del 99% con estos datos
• 0.99 probabilidad central, 0.01 en dos colas
• 0.005 en cada cola
• Valor-z es 2.58
• IC del 99% es 0.213 ± 2.58(0.032),
ó 0.213 ± 0.083, lo que resulta en (0.13, 0.30)
Posibles muestras ( yi y )2 ( yi y ) 2 ( yi m ) 2
(igualmente probables) n n 1 n
(0, 0) 0 0 1
(0, 2) 1 2 1
(2, 0) 1 2 1
(2, 2) 0 0 1