Material de Lectura de Teorìa de La Estimaciòn Estadìstica

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 16

TEORÌA DE LA ESTIMACIÒN

ESTADÌSTICA
Dr. Juan Pérez
Material de Lectura

Este material de lectura tiene la finalidad desarrollar la


clase de Teoría DE LA Estimación Estadística contiene
información básica y desarrollo de ejemplos particulares
por cada distribución. La misma debe ser complementada
con los textos disponibles en el programa de estudios de la
asignatura.

Facultad Politécnica
Facultad Politécnica UNA
Facultad Politécnica
Universidad Nacional de Asunción

Índice
TEORÍA DE ESTIMACIÓN ..................................................................................................... 3
INTRODUCCIÓN ....................................................................................................................... 3
ESTIMACIÓN PUNTUAL ............................................................................................................. 3
Propiedades de los estimadores puntuales ...................................................................... 5
ESTIMACIÓN POR INTERVALO ...................................................................................................... 6
Estimación por intervalo de la media a partir de muestras grandes ................................. 7
Estimación por intervalo de la proporción a partir de muestras grandes ........................ 12
BIBLIOGRAFÍA...................................................................................................................... 16

2
Teoría de Estimación
Introducción
Cuando queremos realizar una investigación cualquiera en una población
determinada, de la cual desconocemos sus parámetros, como la media de
ingreso por vivienda de la zona urbana, o la proporción de mujeres con empleo
fijo, y la posibilidad de estudiar a toda la población es muy costosa, requiere
mucho tiempo, mucha mano de obra y muchos otros inconvenientes, entonces
tomar una muestra aleatoria de la población es un buen recurso. De la muestra
calculamos una media que será una medida aproximada del verdadero valor
de la media poblacional, así como podemos calcular también una medida
aproximada de la proporción de mujeres mencionada. Cada una de estas
aproximaciones recibe el nombre de Estimación
La teoría de la inferencia estadística nos indica los procedimientos con los
cuales podemos trabajar con muestras y los datos así obtenidos generalizarlos
a toda la población. En esta temática, la teoría de la estimación nos proporciona
fórmulas y propiedades para calcular valores puntuales para el verdadero valor
del parámetro, así como establecer intervalos de valores posibles para estos
parámetros.

Estimación Puntual
Una estimación puntual de un parámetro poblacional desconocido (como puede
ser la media µ, la varianza σ2, la proporción P), es un número que se obtiene
de la muestra y que pretende estimar el verdadero valor de dichos parámetros.
No debemos esperar que un estadístico realice una estimación exacta del
parámetro poblacional, sino que en realidad esperamos que sea un valor que
no se aleje mucho. Siempre estaremos por lo tanto trabajando con un margen
de error, error que debemos controlar y recordar siempre, a la hora de sacar
conclusiones y tomar decisiones.
Ejemplo 1

La tabla 1 indica, entre otras cosas, el puntaje promedio en matemática de 20


alumnos de un colegio, seleccionados aleatoriamente y que pertenecen a
diferentes grados o cursos. Con esta información indiquemos:
a) Una estimación puntual del puntaje medio en matemática de todo el
colegio
b) Una estimación puntual de la desviación estándar del puntaje medio en
matemática de todo el colegio.
c) Una estimación puntual de la proporción de estudiantes que realizan
deporte. Utilice para ello la información adicional de la tabla
Facultad Politécnica
Universidad Nacional de Asunción

Puntaje Puntaje
Realizan Realizan
Alumno medio en Alumno medio en
deporte deporte
matemática matemática

1. 4,2 Si 11. 3,1 Si

2. 3,1 No 12. 3,8 Si

3. 2,1 No 13. 3,6 Si

4. 5,0 No 14. 2,5 No

5. 2,3 No 15. 4,2 No

6. 2,4 Si 16. 5,0 No

7. 2,4 No 17. 4,4 No

8. 3,1 Si 18. 1,8 No

9. 4,0 Si 19. 2,1 No

10. 3,2 No 20. 2,6 Si

Tabla 1: datos de la muestra de 20 estudiantes del colegio

Solución

n
xi
a) Para estimar la media de puntajes µ, usamos el estadístico X  i 1

n
, extraemos de la tabla los veinte puntajes y calculamos el promedio:
4,2  3,1  2,1  ......  1,8  2,1  2,6
x
20
x  3,245
Observemos que el valor puntual 3,245 es la media de los puntajes en
matemática de los veinte alumnos tomados en la muestra, este valor sin
embargo es una aproximación del promedio µ de todo el colegio. Por lo
tanto, es una estimación puntual del parámetro poblacional.
Destaquemos que con esto no decimos que el promedio de todo el
colegio es 3,245 , sino que esperamos que ese valor desconocido no se
aleje mucho de la media muestral.
b) El valor de la desviación estándar de los puntajes de toda la población,

 X 
n 2
 X
σ, lo vamos a estimar con el estadístico S  i 1 i

n 1
Con los datos de la tabla y con la media calculada en a), tenemos que

s
4,2  3,2452  3,1  3,2452  ......  2,1  3,2452  2,6  3,2452
20  1

s  0,98 , aproximadamente 1
Esperamos que la desviación estándar del puntaje medio de todos los
alumnos del colegio sea aproximadamente 1 punto.

4
Facultad Politécnica
Universidad Nacional de Asunción

c) Para estimar la proporción de estudiantes que realizan deporte, de todo


el colegio, utilizamos el estadístico
cantidad de estudiantes que realizan deporte
p
tamaño de la muestra
Contamos la cantidad de alumnos que fuman, información dada en la
tabla 1 y calculamos el valor de p
8
p  0,40
20
Este dato puntual nos indica que la proporción de alumnos fumadores
de todo el colegio es alrededor del 40%.
Medida de Estadístico para la estimación
Parámetro
Resumen puntual


n
xi
Media o Promedio µ X  i 1

 x 
n 2
2 x
Varianza σ 2
S  i 1 i

n 1

 x 
n 2
Desviación  x
σ S i 1 i
Estándar
n 1

número de éxitos
Proporción P p
n
Tabla 2: Estimadores puntuales

Propiedades de los estimadores puntuales


Veamos dos propiedades importantes de los estimadores puntuales:
a) Insesgo: Cuando el valor esperado del estadístico muestral es igual al
parámetro poblacional, decimos que ese estadístico es un estimador
insesgado del parámetro poblacional.
Esto nos indica que la media de todos los valores posibles del estadístico
debe ser igual al parámetro. Si los estimadores no cumplen con esta
condición, tenemos una gran probabilidad de equivocarnos a la hora de
emitir una conclusión (sobrestimaciones o subestimaciones de las
medidas de resumen)
Algunos estimadores insesgados son:
 La proporción muestral “p” como estimador de la proporción
poblacional “P”
 La media muestral X como estimador de la media poblacional µ

 La varianza muestral S 2 como estimador de la varianza
poblacional σ2
b) Eficiencia: Hablamos de eficiencia cuando tengamos dos o más
estimadores puntuales, siempre preferimos aquel que tenga menor

5
Facultad Politécnica
Universidad Nacional de Asunción

desviación estándar porque tiende a proporcionar estimaciones más


cercanos al parámetro.
Por ejemplo, si tomamos muestras aleatorias de una población y
calculamos la media muestral y la mediana, y luego sus respectivas
desviaciones estándar, veremos que la desviación estándar de las
medias muestrales es menor que la desviación estándar de las
medianas. Por lo tanto la media muestral es más eficiente que la
mediana.

Estimación por Intervalo


En la estimación puntual atribuimos al parámetro un único valor obtenido con
los datos muestrales, y este valor difícilmente coincidirá con el verdadero valor
del parámetro, por ello optamos por la estimación por intervalo.
La estimación por intervalo consiste en atribuir al parámetro desconocido un
rango de posibles valores (información obtenida de la muestra), donde se
espera esté contenido el verdadero valor del parámetro.
Supongamos que estimamos el gasto promedio en pasajes y otros gastos en
los que incurren los estudiantes de la Universidad Nacional de Asunción para
acudir a las clases de sus respectivas carreras. Para ello, se tomó una muestra
de 50 estudiantes y la estimación puntual fue de Gs.1.420 .000 .
Pero también imaginemos que existen estudiantes que podrían gastar más o
menos que este valor y para los cuales este valor puntual no es muy adecuado.
Es ahí donde evidenciamos la importancia de la estimación por intervalo,
daremos un rango de valores donde podría encontrarse el gasto mensual medio
de todos los estudiantes.
Para construir el intervalo de confianza (IC), como primer paso, seleccionamos
un nivel de confianza (NC), que es la probabilidad de que el intervalo contenga
al verdadero valor del parámetro. Imaginemos que este NC es del 95%.
Teniendo en cuenta el NC, como segundo paso, calculamos el error estándar
de la medición muestral y a partir de allí el error de la estimación; supongamos
que ese error, para nuestro ejemplo es de Gs. 420 .000 .
Finalmente, como tercer paso calculamos los límites del intervalo de
confianza:
 Límite inferior (LI) = estimación puntual – error de la estimación
Gs.1.420 .000 – Gs. 420 .000 = Gs.1.000 .000
 Límite superior (LS) = estimación puntual + error de la estimación
Gs.1.420 .000 + Gs. 420 .000 = Gs.1.840 .000
Esto significa que con una confianza del 95%, la media del gasto de cada
estudiante está comprendida entre Gs.1.000 .000 y Gs.1.840 .000

6
Facultad Politécnica
Universidad Nacional de Asunción

Figura 1: IC para el gasto medio


Gráfica 1: Límites del IC para el gasto medio

Estimación por intervalo de la media a partir de muestras


grandes
Para el cálculo de probabilidades en la distribución muestral de medias
x
utilizamos la fórmula z  , si de esta

n

fórmula despejamos el valor de µ, tenemos que:   x  z.
n

x difiere de µ en z. , por ello concluimos que el error de la estimación (E)
n

es: E  z.
n

Y como el cociente se conoce como error estándar de la media (EE),
n
tenemos que el error máximo de la estimación es: E  z.EE
De esta última fórmula notemos que para calcular debemos conocer el
tamaño “n” de la muestra, la desviación estándar σ de la población y el valor
de z.
Para calcular el valor de z establecemos un nivel de confianza y con ese dato
buscamos en la Tabla de la distribución z el valor correspondiente. Si σ es

desconocido, pero la muestra es grande (n>30), utilizaremos s en lugar de σ

Ejemplo 2

Se desea estimar la edad promedio de los empleados de una empresa


multinacional que cuenta con miles de empleados. Para la realización de la
investigación se tomó una muestra de 250 empleados y se encontró que la
edad promedio es de 30 años con una desviación estándar de 5,2 años.
a) ¿Cuál es el error estándar de la media?
b) Estima un intervalo de confianza del 95% para la edad promedio de la
población
Solución
El tamaño de la muestra es n  250
La estimación puntual de la media es x  30 años y la desviación estándar es

s  5,2 años.
 
a) El error estándar de la media muestral es EE  , utilizaremos s como
n
σ puesto que n>30

7
Facultad Politécnica
Universidad Nacional de Asunción

5,2
EE  , de donde obtenemos que EE  0,3289
250
b) Para estimar el intervalo de confianza necesitamos el valor de z que se
corresponda con el nivel de confianza

Gráfica 2: Límites del IC para la edad promedio

La región sombreada en la gráfica de la distribución normal indica el nivel de


confianza del intervalo que es de 95%=0,95.
Para determinar el valor de z debemos dividir entre dos este nivel de confianza
y tendremos que 0,95 ÷ 2 = 0,475.

Gráfica 3: Valor de Z para un área de 0 a z


Veamos una sección de la Tabla de la distribución Z, dentro de ellas buscamos
el valor de 0,475 que es el área que deseamos

Tabla 3: Valor de z para 0,475

8
Facultad Politécnica
Universidad Nacional de Asunción

Por lo tanto, notamos que el valor de z  1,96


Ahora podemos calcular el error máximo de la estimación:
E  z.EE  1,96 . 0,3289
E  0,6446
Y por lo tanto los límites del IC
LI  x  E LI  30  0,6446 LI  29,3554
LS  x  E LS  30  0,6446 LS  30,6446
Tenemos 95% de confianza de que la edad promedio de los empleados de la
empresa esté comprendida entre 29,3554 y 30,6446 años.
O lo que es lo mismo P(29,3354 < µ < 30,6446) = 0,95
Por lo tanto el intervalo de confianza para la media es igual a:
LI    LS
xE    xE
x  z.EE    x  z.EE
 
x  z.    x  z.
n n
Ejemplo 3

El dueño de un restaurante recién inaugurado, ha tenido problemas para


estimar la cantidad de comida que debe de hacerse cada día. Por eso decidió
determinar el número promedio de clientes a quienes atienden cada noche,
seleccionó una muestra de 49 noches, de las que lleva abriendo, y obtuvo por
resultado una media de 71. La desviación estándar de la población ha sido
establecida como 8,4.
a) ¿Cuál es el error estándar de la media?
b) Realiza una estimación por un intervalo que tenga una probabilidad de 90%
de incluir a la media de la población.
Solución
Tomamos los datos referentes al número medio de clientes atendidos y
obtenemos los siguientes resultados:
Tamaño de la muestra n  49
Media de la muestra x  71
Desviación estándar de la población   8,4
El problema nos pide que encontremos una estimación de intervalo con un nivel
de confianza del 90%. El tamaño de la muestra es mayor que 30, calculamos

el error estándar de la media con la ecuación E.E 
n
8,4
E.E  E.E  1,2
49
Como un nivel de confianza del 90% incluirá 45% del área que se encuentra a
ambos lados de la media de la distribución muestral, podemos buscar en la
Tabla de la Distribución Z el valor correspondiente a 0,45
Evidenciamos en la tabla que un área de 0,45 corresponde al promedio de los
valores de 1,64 y 1,65 , por lo tanto el valor que utilizaremos para determinar los
1,64  1,65
límites del intervalo es z   1,645
2

9
Facultad Politécnica
Universidad Nacional de Asunción

Ahora podemos calcular el error máximo de la estimación:


E  z.EE  1,645 . 1,2
E  1,974

Tabla 4: Valor de z para 0,45

Y, por lo tanto, los límites del IC


LI  x  E LI  71  1,974 LI  69,026
LS  x  E LS  71  1,974 LS  72,974
Tenemos 90% de confianza de que la cantidad promedio de clientes atendidos
por día está comprendida entre 69 y 73, aproximadamente.
O lo que es lo mismo P(69 < µ < 73) = 0,90

Gráfica 4: Límites del IC del 90% para el promedio de clientes


Ejemplo 4

El departamento de servicio social de una dependencia gubernamental local


está interesado en estimar el ingreso medio anual de 700 familias que viven en
una sección de 4 manzanas de una comunidad. Para ello, se toma una muestra

10
Facultad Politécnica
Universidad Nacional de Asunción

aleatoria de 50 familias y se encuentra que la media es 1.118.000 guaraníes


con una desviación estándar de 95.000 guaraníes.
Determina un intervalo de confianza del 99% para el ingreso medio anual
Solución
De la muestra aleatoria obtuvimos los siguientes resultados:
Tamaño de la muestra n  50

Media de la muestra x  1.118 .000



Desviación estándar de la población s  95 .000
Tamaño de la población N  700
No conocemos la desviación estándar de la población y por tanto utilizaremos

s  95 .000 como  para nuestros cálculos

 N n
Para estimar el error estándar utilizaremos la fórmula E.E  . , así:
n N 1

95.000 700  50
E.E  . E.E  12 .955 ,575
50 700  1
Luego consideramos el nivel de confianza del 99%, que incluirá 49,5% del área
que se encuentra a ambos lados de la media de la distribución de muestreo.
Observamos la tabla correspondiente a la distribución Z y buscamos el valor
correspondiente a 0,495
Notamos que para 0,4975 el valor de z corresponde al promedio de 2,57 y
2,58 , por lo tanto el valor que utilizaremos para determinar los límites del

2,57  2,58
intervalo es z   2,575
2
El error máximo de la estimación es:
E  z.EE  2,575  12.955,575
E  33 .361
Con ello calculamos los límites del IC
LI  x  E LI  1.118 .000  33 .361 LI  1.084 .639
LS  x  E LS  1.118 .000  33.361 LS  1.151 .361
Para un nivel de confianza del 99%, el ingreso promedio anual está
comprendido entre 1.084.639 y 1.151.361 guaraníes

11
Facultad Politécnica
Universidad Nacional de Asunción

Tabla 5: Valor de z para 0,495

En general, decimos que:

 N n  N n
x  z. .    x  z. .
n N 1 n N 1

Estimación por intervalo de la proporción a partir de muestras


grandes
Si el estadístico que deseamos estudiar es la proporción de éxitos en una
muestra de tamaño n sacada de una población binomial en la que p es la
proporción de éxitos en la mencionada muestra, entonces los límites de
confianza para p vienen dados por:
Límite del Intervalo  proporción muestral  error de estimación
Error de la estimación (E)
E  z.EE
Error estándar (EE)
p(1  p)
 EE  , si el muestreo es de una población infinita o finita con
n
reposición
p(1  p) N  n
 EE  . , si el muestreo es de una población finita y sin
n N 1
reposición.

12
Facultad Politécnica
Universidad Nacional de Asunción

Ejemplo 5
Un sondeo de 99 votantes elegidos al azar en un distrito del departamento
Central indica que el 55% de ellos estaban a favor de un cierto candidato. Halla
los límites de confianza para un nivel del 95%.
Solución
Indicamos los datos del problema; n  99 , p  0,55
Calculamos el error estándar de la proporción
p(1  p) 0,55.(1  0,55)
EE  EE  EE  0,05
n 99
Seguidamente consideramos el nivel de confianza del 95%, que incluirá 47,5%
del área que se encuentra a ambos lados de la proporción media de la
distribución de muestreo. Observamos la tabla correspondiente a la distribución
Z y buscamos el valor correspondiente a 0,475. Ya hicimos este cálculo en el
ejemplo 2 y vimos que z  1,96
Luego hallamos el error máximo de la estimación:
E  z.EE  1,96  0,05
E  0,098
Finalmente calculamos los límites del IC
LI  p  E LI  0,55  0,098 LI  0,452
LS  p  E LS  0,55  0,098 LS  0,648
Para un nivel de confianza del 95%, la proporción de votantes a favor de un
candidato está comprendida entre 0,452 y 0,648, o lo que es lo mismo entre
45,2% y 64,8%
En general:
LI  P  LS
pE  P pE
p  z.EE  P  p  z.EE
p(1  p) p(1  p)
p  z.  P  p  z.
n n
Ejemplo 6

El gerente de créditos de un banco local investigó aleatoriamente 150


préstamos concedidos por la entidad de las 3.000 realizadas en el último
semestre, y determinó que el 60% estaba en condiciones excelentes.
Construya un intervalo de confianza del 90% para la proporción de cuentas con
calificación excelente.
Solución
Extraemos los datos del problema; N  3.000 , n  150 , p  0,60
Con los datos hallamos el error estándar de la proporción
p(1  p) N  n 0,60.(1  0,60) 3000  150
EE  . EE  .
n N 1 150 3000  1
EE  0,039

13
Facultad Politécnica
Universidad Nacional de Asunción

Consideramos el nivel de confianza del 90%, que incluirá 45% del área que se
encuentra a ambos lados de la proporción media de la distribución de muestreo.
Observamos la tabla correspondiente a la distribución Z y buscamos el valor
correspondiente a 0,45. Ya hicimos este cálculo en el ejemplo 3) y vimos que
z  1,645

Hallamos el error máximo de la estimación:


E  z.EE  1,645  0,039
E  0,064

Y concluimos con los límites del IC


LI  p  E LI  0,60  0,064 LI  0,536
LS  p  E LS  0,60  0,064 LS  0,664
Para un nivel de confianza del 90%, la proporción de cuantas que tienen una
excelente calificación, está comprendida entre 0,536 y 0,664 , es decir entre
53,6% y 66,4%

En general:
LI  P  LS
pE  P pE
p  z.EE  P  p  z.EE

p(1  p) N  n p(1  p) N  n
p  z. .  P  p  z. .
n N 1 n N 1

14
Facultad Politécnica
Universidad Nacional de Asunción

15
Facultad Politécnica
Universidad Nacional de Asunción

Bibliografía

Canavos, G. C. (1988). Probabilidad y Estadistica. Aplicaciones y Métodos.


México: McGRAW-HILL/INTERAMERICANA DE MÉXICO, S.A DE C.V.
Kazmier, L. J. (1990). Estadistica Aplicada a Administracion y Economia.
Mexico: Grafica Futura 2000.
Triola, M. F. (2013). Estadística. México: Pearson Educación.
Yamane, T. (1974). Estadistica. Mexico: Harla, S.A. de C.V.

16

También podría gustarte