Capítulo 3 - Intervalo y Prueba de Hipotesis
Capítulo 3 - Intervalo y Prueba de Hipotesis
Capítulo 3 - Intervalo y Prueba de Hipotesis
83
Captulo 3
El objetivo es dar algunos mtodos que se usan para tomar decisiones sobre
poblaciones, a partir de los resultados de una muestra aleatoria escogida de esa
poblacin. Para llegar a tomar decisiones estadsticas se debe partir de afirmaciones
o conjeturas con respecto a la poblacin en el que estamos interesados. Tales
suposiciones, pueden ser verdaderas o no. Una conjetura hecha sobre una poblacin
o sobre sus parmetros deber ser sometida a comprobacin experimental con el
propsito de saber si los resultados de una muestra aleatoria extrada de esa
poblacin, contradicen o no tal conjetura.
X
Z
/ n
Por tanto, el intervalo de confianza del (1- ) x 100% para es dado por:
X Z /2 X Z /2
n n
En la figura 3.1, tenemos que los valores a X Z / 2 y b X Z / 2 son los
n n
lmites de confianza de , inferior y superior, respectivamente.
Z
- z1-/2 0 z1-/2
a X b X
intervalo de
Nn Nn
X - Z /2 X Z /2
n N 1 n N 1
Ejemplo 3.1. Una muestra aleatoria de 100 hogares de una ciudad indica que el
promedio de los ingresos mensuales es de $ 500. Encuentre un intervalo de confianza
del 95% para la media poblacional de los ingresos de todos los hogares de esa
ciudad. Suponga que = $100.
Solucin.
Sea X el ingreso familiar mensual de esa ciudad cuyo promedio se quiere estimar a
partir de una muestra aleatoria de tamao n =100. La estimacin puntual de es
X 500 . Para el nivel de confianza 1- =0.95, en la tabla normal estndar se
encuentra: z / 2 z 0.025 1.96 .
100
Entonces X z 0.025 500 1.96 500 19.6
n 100
Esto es, se tiene una confianza del 95% que el promedio del ingreso familiar
de esa ciudad, est en el intervalo [$480.4, $519.6].
A) Poblacin no normal
Si la poblacin no es normal pero el tamao de la muestra es suficientemente grande
(n 30), se utiliza la desviacin estndar S de la muestra, como estimacin puntual
de la desviacin estndar de la poblacin. Entonces, el intervalo de confianza del
(1- ) x 100% para es aproximadamente:
S S
X Z /2 X Z /2
n n
B) Poblacin normal
Si X y S son la media y la desviacin estndar respectivamente de una muestra
aleatoria de tamao n (n <30) escogida de una poblacin normal con varianza 2
desconocida, entonces, el intervalo de confianza del (1- ) x 100 para es:
S S
X t /2, n 1 X t /2, n 1
n n
Ejemplo 3.2. El peso neto de las latas de caf instantneo de un producto, debe tener
un peso neto de 280 gramos. Un inspector de la oficina de defensa al consumidor
tomo una muestra aleatoria de 5 latas de caf obteniendo los siguientes pesos netos
en gramos:
280, 290, 285, 275, 284
a) Indicar si es razonable que el inspector, usando un intervalo de confianza del
95% ordene que se multe al productor.
b) Con que grado de confianza se estima que el contenido promedio de caf tenga
los lmites de confianza 277.432 y 288.168?
Suponga una distribucin normal de los pesos netos.
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 86
Solucin.
a) Sea X el peso de los contenidos de caf por lata, cuyo promedio se quiere
estimar a partir de una muestra aleatoria de tamao n = 5. Se supone que la
distribucin de X es normal con desviacin estndar no conocida.
Luego tenemos:
S
X t /2, n 1 282.8 2.776 5.63/ 5 282.8 6.99
n
Como el intervalo cubre al valor de 280 gramos, entonces es posible que el inspector
no multe al productor.
b)
[277.432, 288.168] con confianza 1- . El lmite superior es:
Solucin. Tenemos
(X 1 X 2 ) Z /2 12 /n 1 22 /n 2 1 2 (X1 X 2 ) Z /2 12 /n 1 22 /n 2
Solucin.
La estimacin puntual de 1 2 es la diferencia de las medias muestrales:
X 1 X 2 = 1230 - 1190 = 40
12 22 (120) 2 (60) 2
El error estndar de X 1 X 2 es: X X 42.43
1 2
n1 n2 10 10
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 88
43.16 1 2 123.16
A) Poblaciones no normales.
( X 1 X 2 ) Z / 2 S12 / n1 S 22 / n2 1 2 ( X 1 X 2 ) Z / 2 S12 / n1 S 22 / n 2
B) Poblaciones normales.
B1) Varianzas supuestas iguales: 12 22 2
Si X 1 y X 2 son las medias que resultan de dos muestras aleatorias independientes de tamaos n1
y n2 seleccionadas respectivamente de dos poblaciones normales con varianzas 12 y 12
desconocidas e iguales, entonces, el intervalo de confianza del (1- ) x 100% de 1 2 es:
(n1 1) S12 ( n2 1) S 22
S c2
n1 n 2 2
Si X 1 y X 2 son las medias que resultan de dos muestras aleatorias independientes de tamaos n1
y n2 seleccionadas respectivamente de dos poblaciones normales con varianzas 12 y 22
desconocidas pero distintas, entonces, el intervalo de confianza del (1- ) x 100% de 1 2 es:
Solucin.
No se conoce la forma de la distribucin de los puntajes obtenidos en el curso de
Estadistica.
Como las muestras son grandes (n1 30 y n2 30), entonces los lmites de confianza
inferior y superior respectivamente de 1 2 son:
S12 S22 19 2 16 2
(X1 X 2 ) Z 0.005 6 (2.58) 6 9.27
n1 n 2 50 45
Por lo tanto, el intervalo de confianza aproximado del 99% para 1 2 es:
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 90
15.27 1 2 3.27
Dado que el valor de cero [-15.27, 9.27], se concluye que 1 2 y que no hay
diferencias significativas entre las medias de los rendimientos (puntajes) entre las
mujeres y hombres en el curso de Estadistica.
Ejemplo 3.6. Una compaa est tratando de decidir cul de los dos tipos de
neumticos A y B va a comprar. Como prueba, compra 8 neumticos de cada marca y
las pone a trabajar regularmente. El registro de duracin de cada tipo de neumtico,
proporciona las estadsticas siguientes:
Marca A: X 1 250 km S1 = 40 km
Marca B X 2 280 km S2 = 30 km
Solucin. Se supone que las poblaciones de los tiempos de duracin son normales
con varianzas desconocidas supuestamente iguales.
De los resultados muestrales, tenemos:
n1= 8 X 1 250 km S1 = 40 km
n2 = 8 X 2 280 km S2 = 30 km
67.92 1 2 7.92
Dado que el valor de cero [-67.92, 7.92], se concluye que 1 2 y que no hay
diferencias significativas entre las medias de los tiempos de duracin de las dos
marcas de neumticos. Por tanto, la compaa puede comprar cualquiera de las dos
marcas de neumticos.
Ejercicio. Se lleva a cabo un estudio para comparar el tiempo que tardan hombres y
mujeres para realizar determinada tarea. Las experiencias anteriores indican que la
distribucin de tiempos tanto para hombres como para mujeres es normal con
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 91
varianzas diferentes. Una muestra aleatoria de 9 hombres y 8 mujeres han dado los
siguientes tiempos en minutos:
Hombres: 12, 28, 10, 25, 24, 19, 22, 23, 17
Mujeres: 16, 20, 16, 20, 16, 17, 15, 21
Mediante un intervalo de confianza del 95% para la verdadera diferencia de los
promedios de hombres y mujeres, se puede concluir que los hombres emplean
mayor tiempo que las mujeres para hacer la tarea.
p (1 p ) p (1 p )
p Z / 2 p p Z / 2
n n
Ejemplo 3.7. Una encuestadora utiliza una muestra aleatoria de 600 electores que
acaban de votar y encontr que 240 votaron a favor del candidato A.
a) Estimar el porcentaje de electores a favor de A en toda la poblacin, utilizando
un intervalo de confianza del 95%.
b) Si con la misma muestra la proporcin a favor de B se estima en 38% con una
confianza del 98% que el error no es mayor a 4.62%, Se puede proclamar a A
como ganador?
Solucin.
a) La estimacin puntual de la proporcin p a favor de A en la poblacin, es la
proporcin a su favor en la muestra de n = 600 electores, es decir,
240 / 600 0.40
p
p (1 p ) (0.4)(0.6)
p Z / 2 0.40 (1.96) 0.4 0.0392
n 600
0.3608 p 0.4392
p (1 p )
e Z / 2 0.0462
n
Entonces,
p (1 p )
e Z / 2
n
( Z / 2 ) 2 p (1 p )
n
e2
( Z / 2 ) 2 p (1 p )N
n
( Z / 2 ) 2 p (1 p ) e 2 ( N 1)
Solucin.
Para 1- = 0.95 resulta Z / 2 Z 0.025 1.96 .
( Z / 2 ) 2 p (1 p )N (1.96) 2 (0.25)(30,000)
n 588.49 589
( Z / 2 ) 2 p (1 p ) e 2 ( N 1) (1.96) 2 (0.25) (0.04) 2 (30,000 1)
p 1 (1 p 1 ) p 2 (1 p 2 ) p 1 (1 p 1 ) p 2 (1 p 2 )
( p 1 p 2 ) Z / 2 p1 p 2 ( p 1 p 2 ) Z / 2
n1 n2 n1 n2
Solucin.
175 120
De los datos del problema se obtiene: p 1 0.7 p 2 0.6
250 200
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 94
p 1 (1 p 1 ) p 2 (1 p 2 ) (0.7)(0.3) (0.6)(0.4)
p1 p 2 0.045
n1 n2 250 200
Luego,
p 1 (1 p 1 ) p 2 (1 p 2 )
( p 1 p 2 ) Z 1 / 2 0.1 (1.96)(0.045) 0.1 0.0882
n1 n2
0.0118 p1 p 2 0.1882
Dado que el intervalo no contiene al valor cero, debemos concluir que las
proporciones de preferencias en la poblacin son diferentes, esto es, p1 p 2 y dado
que el intervalo contiene valores positivos, hay razones para concluir que p1 p 2 , es
decir que su nuevo producto de consumo popular prefieren ms los hombres que las
mujeres.
1) H0 : = 0 , y H1 : 0
2) H0 : 0 , y H1 : > 0
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 96
3) H0 : 0 , y H1 : < 0
Tabla 3.1.
H0 verdadera H0 falsa
Decisiones
contra y, con base en toda la informacin, decide dejarlo libre o condenarlo. El juez,
no sabr si hubo error en su decisin, slo lo podr saber la persona que ha sido
juzgada.
Si lo deja libre y el acusado es culpable se estar cometiendo un error tipo II, si por el
contrario, lo condena siendo inocente, tambin se estar cometiendo error tipo I;
hasta ah va nuestra decisin: aceptar o rechazar pero no sabemos exactamente el
error cometido, solo sabemos que se puede cometer. Un comentario adicional: para la
sociedad cul de las decisiones es la mejor? Qu opina usted?
Persona juzgada
Decisiones
H1 : 0 H1 : > 0 H1 : < 0
X 0
Como consecuencia segn sea el caso, la estadstica: Z se distribuye
/ n
exactamente o aproximadamente como una normal estndar N(0,1).
X 0
3. Estadstica de prueba: Z
/ n
R.C Z / Z Z
Z
0 z1-
Aceptar H0 Aceptar H1
X 0
5. Decisin conclusin: Si el valor de Z > Z , se rechazara H0 al nivel
/ n
de significancia . No se rechazara en caso contrario.
2. Nivel de significancia:
X 0
3. Estadstica de prueba: Z
/ n
Z
- z1- 0
Rechazar H0 Aceptar H1
Z
- z1-/2 0 z1-/2
Ejemplo 3.12. En un test de psicologa se sabe por experiencia pasadas que tiene una
puntuacin media de 78 puntos y una desviacin estndar de 6 puntos. Se seleccion
al azar un grupo de 16 estudiantes siendo su puntuacin de 80 puntos. Puede
afirmarse al nivel de significancia del 1% que la puntuacin de este grupo fue
superior? Suponga que la poblacin de los puntajes del test se distribuye como un
normal.
Solucin.
1. Hiptesis: H 0 : = 78
H 1 : > 78
X 0
Z ~ N(0, 1)
/ n
Z = Z 0.01 = 2.33
= 0.01
Z
0 2.33
Luego la regin critica en la variable Z es: R.C = { Z > 2.33 }
X 0 80 78
Z 1.33
/ n 6 / 16
Si una muestra aleatoria de 100 ingresos familiares de esa ciudad a dado una media
de S/ 1,440. cual es la decisin a tomar al nivel de significancia del 5%?.
Suponga que la distribucin de los ingresos tiene una desviacin estndar igual a 240
nuevos soles.
Solucin.
Sea X la variable aleatoria que representa los ingresos familiares mensuales de los
pobladores de Sullana.
X 0
Z
/ n
Z = Z 0.05 = -1.645
= 0.05
z 0.05 = -1.645 0 Z
Luego la regin critica en la variable de Z es : R.C Z - 1.645
5. Clculos: De la muestra n = 100, se obtiene X 1440 soles, entonces:
X 1440
X 0 1440 1500
Z 2.5
/ n 240/ 100
6.- Decisin.- Dado que Z = -2.5 R.C, debemos rechazar H 0 y concluir con no
abrir la sucursal en Sullana.
A) Poblacin no normal.
X 0
Z cuya distribucin es aproximadamente N (0,1).
S/ n
B) Poblacin normal.
X 0
T ~ t ( n 1)
S/ n
1) Prueba bilateral o de dos colas.
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 103
1. Hiptesis: H0 : = 0 contra H1 : 0
/2 /2
t
- t1-/2 0 t1-/2
t
0 t
Aceptar H0 Rechazar H0
t
- t 0
Rechazar H0 Aceptar H0
Ejemplo 3.14. Los siguientes nmeros son las notas promocionales de 15 estudiantes
de la asignatura de Estadstica aplicada a la educacin.
13 , 08, 10, 12, 15, 07, 16, 09, 14, 11, 08, 11, 17, 13, 11
Solucin.
Sea variable aleatoria X: notas promocionales obtenidas por los alumnos en la
asignatura de Estadstica aplicada. Se supone que la distribucin de X es normal con
media = 12 y varianza 2 desconocida.
1. Hiptesis: H 0: = 12
H 1: 12
X 12
T
S/ n
que se distribuye segn una
distribucin t- Student con 14 grados de libertad.
X 12 11 .6667 12
T 0.4280
S/ n 3.0158 / 15
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 105
Prueba T
Estadsticos para una muestra
Valor de prueba = 12
95% Intervalo de
confianza para la
Diferencia diferencia
t gl Sig. (bilateral) de medias Inferior Superior
Notas promocionales -.428 14 .675 -.333 -2.00 1.34
X 1 ~ N( 1 , 12 /n 1 ) y X 2 ~ N( 2 , 22 /n 2 )
Luego la estadstica X1 - X 2 ~ N( 1 - 2 , 12 /n 1 22 /n 2 ) .
X1 - X 2 N( 1 - 2 , 12 /n 1 22 /n 2 )
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 106
X1 X 2 ( 1 2 )
Z
12 22
n1 n 2
X1 X 2
Z ~ N(0, 1)
12 22
n1 n 2
2) Nivel de significancia:
X1 X 2
Z
3) Estadstica de prueba: 12 22
n1 n 2
Z
0 Z1-
Aceptar H0 Rechazar H0
R.C = {Z < - Z }
Solucin.
Sean X1 y X2 los tiempos de proceso con las maquinas A y B respectivamente y 1 y
2 sus medias respectivas.
Se desconocen las distribuciones de probabilidad de X 1 y X2, pero las muestras son
grandes.
X1 X 2
Z N(0, 1)
12 22
n1 n 2
= 0.05
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 108
Z
0 Z0.95=1.645
Luego,
1230 - 1190 40
Z 2.0655
(120) 2
(90) 2 19.365
60 60
A) Poblaciones no normales
X1 X 2
Z N(0,1)
S12 S 22
n1 n 2
B) Poblaciones normales
Hiptesis: H0: 1 = 2 ( H0 : 1 - 2 = 0)
H1: 1 > 2 ( H1 : 1 - 2 > 0)
Si la prueba nula H0 es verdadera y si las poblaciones son normales con varianzas
desconocidas supuestas iguales, entonces la estadstica de prueba es:
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 109
X1 X 2 X1 X 2
T
Sc2 Sc2 1 1
Sc
n1 n 2 n1 n 2
(n 1 1)S12 (n 2 1)S22
S c2
n1 n 2 2
T
0 t
Aceptar H0 Rechazar H0
(X1 X 2 ) ( 1 2 )
T ~ t
S12 S 22 (g)
n1 n 2
2
S12 S22
n n
si g no es entero, se aproxima g 12 2 2
al entero mayor ms cercano. S12 S22
n n
Si la hiptesis nula H 0 : 1 = 1 2
2 se supone verdadera, n1 1 n 2 1
entonces
( X1 X 2 )
T ~ t
S1 S2 2 2 (g)
El valor del estadstico T se
utiliza para probar H0 contra n1 n 2
cualquiera de las hiptesis
alternativas H1 : 1 2 H1 : 1 > 2 H1 : 1 < 2 , las regiones criticas y las
reglas de decisin son similares a los del caso B1.
Solucin.
Sean X1 y X2 las variables aleatorias que representan los puntajes obtenidos por los
tcnicos con los mtodos de entrenamiento 1 y 2 respectivamente.
X1 X 2
Z N(0,1)
S12 S 22
n1 n 2
Entonces,
X1 X 2 6 - 8.2 - 2.2
Z - 2.31
2
S S 2 2
(4) (4.3) 2 0.9522
1 2
n1 n 2 36 40
Nota. Con el mtodo del P-valor para la prueba de dos muestras se obtiene: P(Z<-
2.31) = 0.0104. Dado que p = 0.0104 > 0.01 no se debe rechazar H 0 en una prueba
unilateral.
A un nivel = 0.05, Los anteriores resultados, permiten concluir que hay una
diferencia en el rendimiento diurno y nocturno?. Suponer que las calificaciones se
distribuyen como una normal con varianzas poblacionales desconocidas, pero iguales
(es decir, 12 22 ).
Solucin.
Sean X1 y X2 las variables aleatorias que representan los nmeros de cuentas nuevas
de las ejecutivas y ejecutivos respectivamente.
Se sabe que X 1 ~ N( 1 , 12 ) y X 2 ~ N( 2 , 22 ) , donde las varianzas 12 y
22 son desconocidas, pero iguales.
Realizaremos el contraste de medias de poblaciones normales con varianzas
desconocidas pero iguales y muestras pequeas.
X1 X 2 X1 X 2
T
S c2 S c2 1 1
Sc
n1 n 2 n1 n2
entonces,
X1 X 2 15.72 - 14.1 1.62
T 2.41737
1 1 1 1 0.67015
Sc (1.4128)
n1 n 2 10 8
Prueba T
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 113
Estadsticos de grupo
Prueba de
Levene para la
igualdad de
varianzas Prueba T para la igualdad de medias
95% Intervalo de
confianza para la
Sig. Diferencia Error tp. de diferencia
F Sig. t gl (bilateral) de medias la diferencia Inferior Superior
Calificaciones Se han
promocionales asumido
varianzas .816 .380 2.42 16 .028 1.6200 .6701 .1993 3.0407
iguales
Sean X1, X2, ..., Xn una muestra escogida de una poblacin Bernoulli B(1, p), donde
p es la proporcin de xitos en la poblacin.
Sea
X 1 X 2 ... X n X
p
n n
X np p p
Z N (0, 1)
np(1 p) p(1 p) / n
X np0 p p 0
Z N (0, 1)
np0 (1 p 0 ) p 0 (1 p 0 ) / n
R.C { Z Z /2 Z Z /2 }
X np 0 p p 0
Se rechaza H0 si el valor de Z
np0 (1 p 0 )
p 0 (1 p0 ) / n
R.C. No se
R.C = {Z >Z }
Ejemplo 3.18. Un fabricante afirma que el 30% de todos los consumidores prefieren
su producto. Con el fin de evaluar est afirmacin se tomo una m.a de 400
consumidores y se encontr que 100 de ellos prefieren dicho producto.
es sta, suficiente evidencia para inferir que el porcentaje de preferencia del
producto no es 30% ?.- Utilice el nivel de significancia del 1%.
p p 0 p 0.3
Z N (0, 1)
p 0 (1 p 0 ) (0.3)(0.7)
n n
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 115
5) Clculos:
x 100
n = 400 , x = 100 , p 0.25
n 400
p p 0 0.25 0.3
Z 2.18
Luego se tiene: p 0 (1 p 0 ) (0.3)(0.7)
n 400
X1 X2
p1 y p 2
n1 n2
p 1 p 2 ( p1 p 2 )
Z N (0,1).
p1 (1 p1 ) p 2 (1 p 2 )
n1 n2
p 1 p 2
Z N (0,1).
p c (1 p c ) p c (1 p c )
n1 n2
donde pc es el valor comn de los parmetros p1 y p2 cuya estimacin insesgada es:
x 1 x 2 n 1p1 n 2 p 2
p
n1 n 2 n1 n 2
2) Nivel de significancia:
3) Estadstica de prueba:
p 1 p 2
Z .
p (1 p ) p (1 p )
n1 n2
Hiptesis:
H0: p1 = p2 contra H 1: p1 < p2.
Hiptesis:
H0: p1 = p2 contra H 1: p1 p2.
La Regin crtica es :
R.C Z Z /2 Z Z /2
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 117
Ejemplo 3.19. En una encuesta se pregunt sobre los hbitos de lectura, utilizando
una muestra aleatoria de 350 seoras que trabajan y otra muestra independiente de
325 que no lo hacen. En el primer caso, 105 manifestaron que estaban suscritas a
cierto tipo de revista. En el segundo, la respuesta fue de 130 que no estaban suscritas
ni mostraban inters por ninguna revista, argumentando la falta de tiempo. Al nivel
del 1% se podra afirmar que las seoras que trabajan leen menos que las seoras que
no trabaja?.
Solucin.
105
Seoras que trabajan : n1 = 350, X1 = 105 , p 1 0.3
350
130
Seoras que no trabajan : n2 = 325, X2 = 130, p 2 0.4
325
p 1 p 2 0.3 0.4
Z 2.725
p (1 p ) p (1 p ) (0.348)(0.652) (0.348)(0.652)
n1 n2 350 325