Capítulo 6 - Pruebas de Hipótesis
Capítulo 6 - Pruebas de Hipótesis
Capítulo 6 - Pruebas de Hipótesis
Existen 2 conclusiones:
1) Rechazar H0
2) No Rechazar H0
1) : > 0
2) : < 0
3) : 0
Ejemplo:
Un fabricante de automviles asegura que su nuevo modelo tiene un
rendimiento de no menos de 10 [km/l]. No sera aconsejable contradecir al
fabricante sin contar con fuerte evidencia en contra de lo que l afirma. Cul
sera una formulacin apropiada para el problema?
3
2.
Ejemplo
Un fabricante de cigarrillos indica que el promedio
de nicotina de la marca Kent de cigarrillos es de a
lo sumo 1,5 [mg].
Formulacin:
H 0 : 1,5
H a : 1,5
No se rechaza H0
1,6
Se rechaza H0
X
5
Errores Tipo I y II
ERROR TIPO I: Rechazar H0 cuando es verdadera.
ERROR TIPO II: No Rechazar H0 cuando es falsa.
H0 es verdadera
H0 es falsa
No Rechazar H0
No hay error
Error tipo II
Rechazar H0
Error tipo I
No hay error
Ejemplo
Represente con , el nivel de radiactividad promedio
real (picocuries por litro). El valor 5 [pCi/lt] es
considerado la lnea divisora entre el agua segura
e insegura.
Recomendara probar:
H0: = 5 v/s Ha: > 5 H0: = 5 v/s Ha: < 5?
Explique su razonamiento.
(Sugerencia: considere las consecuencias de un error
de tipo I y tipo II para cada posibilidad).
7
Ejemplo
Muchos hogares antiguos tienen sistemas elctricos que utilizan
fusibles en vez de interruptores de circuito. Un fabricante de
fusibles de 40 [A] quiere asegurarse de que el amperaje promedio al
que se queman los fusibles es de hecho 40. Si el amperaje promedio
es menor que 40, los clientes reclamarn porque los fusibles
requerirn ser cambiados con mucha frecuencia. Si el amperaje
promedio es mayor que 40, el fabricante podra ser responsable de
dao a un sistema elctrico debido al mal funcionamiento del
fusible. Para comprobar el amperaje de los fusibles, se elige e
inspecciona una muestra de fusibles. Si se realizara una prueba de
hiptesis a partir de los datos resultantes, cules hiptesis nula y
alternativa seran de inters para el fabricante? Describa los errores
tipo I y tipo II en el contexto de esta situacin del problema.
8
En CCU se toma una muestra de 20 botellas llenadas desde la lnea de produccin, y se mide el
volumen de llenado promedio. Si el verdadero promedio de llenado supera los 300 cc., habr
que detener el proceso productivo y volver a configurarlo. A partir de la muestra obtenida,
habr que detener el proceso?
En Falabella desean conocer si las mujeres gastan, en promedio, en las liquidaciones ms que
los hombres para as determinar el stock de mercadera apropiado y la distribucin (layout)
apropiada en sus tiendas.
10
0
/
~ (0,1)
0
/
0,1 =
0
/
(0,1)
0
~ 1
/
11
X 0
Regiones de rechazo:
Hiptesis alternativa
Ha : > 0
z z
Ha : < 0
z z
Ha : 0
z z / 2 z z / 2
12
Determinacin de la probabilidad
de cometer un error tipo II
Para la prueba de cola superior: Ha: > 0 , la regin de rechazo es:
H0 no es
z z o bien X 0 z
Para: X 0 z
rechazada
n
n
Entonces para una prueba de nivel , y siendo un valor de mayor al valor
nulo 0:
' P H 0 no sea rechazada | '
P X 0 z
'
n
X '
'
P
z 0
Mientras crece
( ) disminuye.
13
Determinacin de la probabilidad
de cometer un error tipo II
Anlogamente, para una prueba de nivel ,
Para Ha: < 0
Para Ha: 0
0 '
' 1 z
n
0 '
0 '
z 2
' z 2
n
n
14
0 '
0 '
z
n
n
Despejando n, se tiene:
z z 2
0 '
n
2
z 2 z
0 '
X
Z
S n
X 0
S
z
0
Regin de Rechazo: z z
0
Regin de Rechazo: z z
2
z 2
Regin de Rechazo:
z 2
z z /2
z z /2
17
X 0
S
Hiptesis alternativa
Ha : > 0
t t,n-1
Ha : < 0
t t,n-1
Ha : 0
t t / 2 ,n 1 t t / 2 , n 1
18
Ejemplo
Un fabricante de sistemas de aspersin utilizados para
proteccin de incendios en edificios de oficina, afirma que el
verdadero promedio de temperatura de activacin del sistema
es de 130 . Al probar = 9 sistemas de aspersin, se
produjo un promedio muestral de temperatura de activacin
de 131,08 . Si la distribucin de los tiempos de activacin
se distribuye normal con = 1,5 , la muestra obtenida
contradice la afirmacin del fabricante? Utilice un nivel de
significancia = 0,01.
19
2
,
2
2
X Y
2
1
2
2
Luego, la
estandarizacin
resulta en la variable
normal estndar,
X Y 1 2
12
m
22
n
20
H 0 : 1 2 0
X Y 0
12
m
22
n
Regiones de rechazo:
Hiptesis
alternativa
Ha: 1 2 > 0
z z
Ha: 1 2 < 0
z z
Ha: 1 2 0
z z / 2 z z / 2
21
Ejemplo
El anlisis de una muestra aleatoria formada por = 20
especmenes de acero laminado en fro, para determinar su
resistencia, dio por resultado una resistencia promedio
muestral de = 29,8 . Una segunda muestra de = 25
especmenes de acero galvanizado de 2 lados mostr una
resistencia promedio muestral de = 34,7 . Si se supone
que las dos distribuciones de resistencia son normales
con1 = 4 y 2 = 5 indican los datos que las verdaderas
resistencias promedio 1 y 2 son diferentes? Realice una
prueba al nivel de significancia de 0,01.
22
P X Y 0 z X Y cuando 1 2 '
' 0
z
X Y
Ha: 1 2 < 0
' 0
1 z
X Y
Ha: 1 2 0
' 0
' 0
z / 2
z / 2
X Y
X Y
24
' 0
( ) z
X Y
'
m n z z 2
2
1
'
2
2
( 12 22 )z z
mn
'
25
X Y 0
S12 S 22
m
n
Ejemplo
El gerente del supermercado R&P, el cual atiende las 24 hrs., preocupado
por la satisfaccin de sus clientes no slo en los alimentos adquiridos, si
no tambin en la calidad del servicio, desea saber si la cantidad de
personas que esperan en horarios Peak es mayor a la misma variable en
horarios normales (los horarios nocturnos no son relevantes para el
gerente debido a que el flujo de clientes es significativamente menor).
Para realizar este estudio, el gerente decidi que c/u de las 24 hrs. de un
da fueran divididas en 48 horarios de 30 min. c/u. Adems, los horarios
Peak definidos fueron: 6AM - 9AM, 11:30AM - 1:30PM, 4:30PM 6:30PM , mientras que el horario nocturno considerado es desde las 11 PM
hasta las 6 AM. De esta forma, los horarios normales son aquellos que no
quedaron anteriormente definidos.
27
Ejemplo (continuacin)
El periodo de estudio considerado fue de 1 semana, vale decir 24 x 7 = 168
hrs., o bien 168 x 2 = 336 horarios de 30 minutos, medidos continuamente
durante una semana. Un da Lunes a las 8 AM comenz el estudio. A
modo de ejemplo, se muestran los datos recopilados en los 32 horarios de
30 min. de ese da.
En base al estudio realizado, puede concluir el gerente del supermercado
R&P que el nmero promedio de clientes que esperan en los horarios
Peak es mayor que en los horarios normales? Utilice la cantidad de
clientes que esperan al final de cada horario para realizar su anlisis. Use
un nivel de significancia del 1%.
28
Da
Comienzo
Tipo de
Horario
Esperas
Iniciales
Llegadas
Salidas
Esperas
Finales
Cajeros
Clientes
Totales
Lun
8:00 AM
Peak
21
22
23
Lun
8:30 AM
Peak
25
18
26
Lun
9:00 AM
Normal
27
28
35
Lun
9:30 AM
Normal
21
23
28
Lun
10:00 AM
Normal
20
23
25
Lun
10:30 AM
Normal
36
31
38
Lun
11:00 AM
Normal
30
36
37
Lun
11:30 AM
Peak
34
29
35
Lun
12:00 PM
Peak
56
48
14
62
Lun
12:30 PM
Peak
14
58
64
72
Lun
1:00 PM
Peak
53
52
61
Lun
1:30 PM
Normal
30
36
39
Lun
2:00 PM
Normal
34
31
37
Lun
2:30 PM
Normal
36
37
42
Lun
3:00 PM
Normal
30
28
35
Lun
3:30 PM
Normal
29
34
36
Lun
4:00 PM
Normal
35
33
37
Lun
4:30 PM
Peak
32
25
11
36
Lun
5:00 PM
Peak
11
46
43
14
57
Lun
5:30 PM
Peak
14
39
45
53
X Y 1 2
S12 S 22
m
n
s12 s22
m
n
2
2
2
2
s
/
m
s
/
n
2
1
m 1
n 1
30
x y 0
s12 s22
m
n
Hiptesis alternativa
Ha: 1 2 > 0
t t,
Ha: 1 2 < 0
t t,
Ha: 1 2 0
t t / 2 , t t / 2 ,
31
Ejemplo
La siguiente tabla informa sobre la resistencia a la tensin, en psi, de
especmenes de forros (que podran ser utilizados para proteger tuberas),
en procesos con y sin fusin.
Proceso
Tamao muestral
Sin fusin
Con fusin
m = 10
n=8
277,3
205,9
32
V X Y V X V Y
indep .
2
m
1 1
2
n
m n
1
n
1
m
1
S
1
S
1
2
S p2
S12
S 22
mn2
mn2
mn2
X Y 1 2
Sp
1 1
m n
34
x y 0
sp
1 1
m n
Hiptesis alternativa
Ha: 1 2 > 0
t t, m + n 2
Ha: 1 2 < 0
t t , m + n 2
Ha: 1 2 0
t t / 2 , m + n 2 t t / 2 , m + n 2
35
Ejemplo
587
735
608
457
472
431
562
658
879
453
725
726
569
793
424
498
485
808
462
456
765
731
854
491
791
846
684
732
666
507
36
37
D E X Y E X E Y 1 2
Luego, en el caso de informacin por pares, se forman las diferencias Di. Como
las Di constituyen una muestra aleatoria normal con media D las hiptesis sobre
D se pueden probar usando una prueba t de una muestra.
La Hiptesis nula es de la forma:
El estadstico de prueba es:
H 0 : D 0
T
D 0
SD / n
Con n - 1 grados de
libertad (GL)
38
H 0 : D 0
(Donde D = X Y y D = 1 - 2)
Estadstico de prueba: T
D 0
SD / n
Hiptesis
alternativa
Ha: D > 0
t t, n 1
Ha: D < 0
t t, n 1
Ha: D 0
t t / 2 , n 1 t t / 2 , n 1
39
Ejemplo
10
11
12
13
14
15
16
17
18
Marido
Esposa
6
3
7
8
8
5
6
4
8
5
7
6
8
5
6
7
7
8
7
5
6
3
5
4
8
5
7
8
7
5
7
6
6
5
5
4
Pareja
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
Marido
10
Esposa
10
40
41
Introduccin al Valor p
Considere un procedimiento de prueba en el que H0: = 1,5 y Ha: > 1,5 (Cola
superior), luego H0 se rechaza si z z
Si se calcula que z = 2,1, entonces:
Nivel
Significacin
Regin de
Rechazo
Conclusin
0,05
z 1,645
Rechazar H0
0,025
z 1,96
Rechazar H0
0,01
z 2,33
No rechazar H0
0,005
z 2,58
No rechazar H0
42
P Rechazar
2. Valor
P No
H0
al
rechazar
H0
nivel
al
nivel
No Rechazar H0
Rechazar H0
1
43
44
0,01
0,05
0,10
valor p
convincente
fuerte
moderada
dbil o ninguna
45
Regin de Rechazo: z z
Valor P P Z z 1 z
46
0
Regin de Rechazo: z - z
Valor P P Z z z
47
z 2
z 2
Regin de Rechazo:
z - z / 2 z z / 2
Valor P 2 min P Z z , P Z z 2 1 z
48
1 z
Valor P
z
2
1
49
PX x
PX x
o bien si:
2
50
min P X x , P X x
O, equivalentemente, si
2 min P X x , P X x
Por lo tanto el Valor P para una prueba de dos colas, se calcula a partir de la
siguiente expresin:
Valor P 2 min P X x , P X x
51
0,40
0,60
0,60
0,60
52
P X x
Valor P
P X x
2 min P X x , P X x
53
54
Ejemplo
Considere que corresponde al verdadero calor
promedio emanado de una mezcla de cemento (en
caloras). Se prueba H0: = 50 [cal] v/s Ha : 50
[cal]. Supngase que el verdadero calor promedio es
de 52 [cal]. Cuando n = 10, se tiene que = 0,2643.
Cul es la potencia de esta prueba? Cmo
interpretamos este valor?
55
Si al encuestar a 1.000 chilenos sobre si son fumadores o no, el 45% afirma que s, y el Ministerio de
Salud est pensando en implementar una nueva campaa anti-tabaco si descubre que ms del 40%
de la poblacin chilena fuma, existe informacin concluyente para que el MinSal comience esta
campaa?
Una compaa manufactera que posee dos plantas productivas que producen los mismos productos
desea saber hasta qu punto la proporcin de productos fuera de los rangos de especificacin vlidos
difiere entre las dos plantas, para asegurar la calidad de sus productos independiente de la planta de
donde provengan.
56
p p0
p0 1 p0 n
...es el estadstico de
prueba cuando H0 es
verdadera.
Hiptesis alternativa
H a : p > p0
z z
H a : p < p0
z z
H a : p p0
z z / 2 z z / 2
Ejemplo
Muchos consumidores estn incurriendo a
productos genricos para reducir el costo de
medicamentos por prescripcin. Un estudio
realizado a 102 mdicos revel que slo 47 de ellos
conoca el nombre genrico de la metadona.
Proporciona esto fuerte evidencia para concluir que
menos de la mitad de todos los mdicos conocen el
nombre genrico de la metadona? Utilice un nivel de
significancia de 0,01.
58
Determinacin de
Si H0 no es verdadera y p = p, entonces para una prueba de cola superior, cuya
regin de rechazo es
Tenemos que
z z
P No Rechazar H 0 | H 0 es falsa
P Z z | p p '
Luego, las expresiones para son las que se muestran a continuacin.
59
Determinacin de
Hiptesis alternativa
(p)
H a : p > p0
p0 p ' z p0 1 p0 n
p ' 1 p ' n
H a : p < p0
H a : p p0
p0 p ' z p0 1 p0 n
p ' 1 p ' n
p0 p ' z 2 p0 1 p0 n
p ' 1 p ' n
p0 p ' z 2 p0 1 p0 n
p ' 1 p ' n
60
E p 1 p 2 p1 p2
V p 1 p 2
p1q1 p2 q2
m
n
Estimador Insesgado
(donde qi = 1 pi)
p 1 p 2 p1 p2
Z
p1q1 p2 q2
m
n
62
X Y
m
n
p
p 1
p 2
mn mn
mn
63
Estadstico de
prueba:
1 p
2
p
1
1
q
p
m n
Hiptesis
alternativa
Ha: p1 p2 > 0
z z
Ha: p1 p2 < 0
z z
Ha: p1 p2 0
z z / 2 z z / 2
64
Ejemplo
Una tienda de electrodomsticos est a punto de lanzar un nuevo
producto estrella al mercado. Desde sus bases de datos, selecciona 300 de
sus mejores clientes y los divide aleatoriamente en dos grupos de 150
clientes cada uno. A continuacin, enva por correo electrnico un
anuncio de venta a c/u de los 300 clientes, pero slo incluye un cupn de
descuento del 5% al segundo grupo de 150 clientes.
El estudio consider un periodo de tiempo de 1 mes (tiempo de validez de
los cupones de descuento). Tras dicho periodo, los resultados obtenidos
por la tienda fueron los siguientes: de los 150 clientes que recibieron slo
el aviso del nuevo producto (sin un cupn de descuento adjunto), slo 35
compraron el producto; mientras que de los 150 clientes que recibieron el
aviso y el cupn de descuento, slo 55 compraron el producto.
Qu puede concluir el gerente de la tienda sobre la eficacia de los
cupones de descuento? Use el criterio del valor p.
65
66
H 0 : 2 02
H 0 : 2 02
Ha :
Ha :
usaremos el estadstico de prueba:
2
2
0
X 02
2
n
1
S
02
2
0
H 0 : 2 02
H a : 2 02
~ n2 1
67
Ha : 2 > 02
X 02 2 , n 1
Ha : 2 < 02
X 02 12 , n 1
Ha : 2 02
X 02 12 / 2, n 1 X 02 2 / 2, n 1
Regin de Rechazo
para Ha:
(a) Ha: 2 02
69
Ejemplo
Un fabricante de detergente lquido est interesado en la
uniformidad de la mquina utilizada para llenar las botellas.
Al tomar una muestra aleatoria de 20 botellas, se obtuvo una
varianza muestral para el volumen de llenado de s2 = 0,0153
[oz2]. Si la varianza del volumen de llenado es mayor a 0,01
[oz2], entonces existe una proporcin inaceptable de botellas
que sern llenadas con una cantidad menor o mayor que la
especificada. Existe evidencia en los datos muestrales que
sugiera que el fabricante tiene un problema con el llenado de
las botellas? Use = 0,05, y asuma que el volumen de llenado
de detergente en las botellas sigue una distribucin normal.
Use el criterio del valor p.
70
Determinacin de y el tamao
muestral
En el caso de prueba de cola superior, tenemos que:
n 1 S 2
2
P
, n 1 | '
2
0
2
n 1 S 2
2
0
P
, n 1
2
' 2
'
2
2
0
P n 1 2 ,n 1
2
'
71
73
21 22
1
1 2
2
1
2 1
1
2 + 1
0
= +
0
2
=
2 2
1 +2
2
1 , 2
= 22
1 + 2 2
1 2 2 2 2 4
1,, =
1
,,
74
2
2
Hiptesis
alternativa
Estadstico de prueba:
H a : 12 22
f F ,m 1,n 1
H a : 12 22
f F1 ,m 1,n 1
H a : 12 22
S12
F 2
S2
Ejemplo
La Compaa SureStep, que fabrica trotadoras de alta calidad
para gimnasios, ahora est interesada en conocer si la
variabilidad en la duracin de los motores de ambos
proveedores (A y B) es la misma o no.
Usando los datos entregados, se puede concluir que los
motores de ambos proveedores presentan igual variabilidad?
Use el criterio del valor p.
Proveedor A 1358 793
Proveedor B 658 404
587
735
608
457
472
431
562
658
879
453
725
726
569
793
424
498
485
808
462
456
765
731
854
491
791
846
684
732
666
507
77