Apuntes Test de Hipotesis
Apuntes Test de Hipotesis
Apuntes Test de Hipotesis
_________________________________________________________________________________
TEST DE HIPOTESIS
INTRODUCCIN
En este tema trataremos el importante aspecto de la toma de decisiones, referida a decidir si
un valor obtenido a partir de la muestra es probable que pertenezca a la poblacin.
En general la media o proporcin en una muestra suele ser distinta a la media de la poblacin,
de la cual se extrae la muestra. Lo normal suele ser que tal diferencia entre la media muestral
y la poblacional sea pequea y debida al azar, pero podra suceder que dicha diferencia no
est justificada por el azar y se deba a un cambio en la poblacin, y debamos modificar los
datos que conocemos previamente.
El objetivo de realizar un test de hiptesis es pronunciarse respecto a la veracidad de una
hiptesis llamada Hiptesis nula (H0), en contraste con una segunda hiptesis llamada
Hiptesis alternativa (H1). El problema se plantea en trminos de una disyuntiva entre ambas
hiptesis (se tiene que cumplir una de las dos).
La hiptesis de nulidad (H0) plantea que el valor o los valores histricos del o los
parmetros del estudio no han cambiado y que las diferencias observadas se deben a error
de muestreo.
H 0 : 0
(Valor histrico).
La hiptesis de alternativa (H1) postula un valor diferente para el parmetro que el que
sostiene (H0).
H1 : 0 ( 0 0 )
ERRORES
Hay ocasiones en que la hiptesis nula es cierta, pero a la vista de la muestra tenemos que
rechazarla, en tal caso estamos cometiendo un error.
El error que consiste en rechazar la hiptesis nula cuando es verdadera, se denomina error tipo
I.
Otro tipo de error puede ocurrir cuando, siendo H 0 falsa, las evidencias de la muestra nos
llevan a aceptarla. Este error, cometido al aceptar cuando esta es falsa, se denomina error tipo
II .
INFERENCIA ESTADISTICA
_________________________________________________________________________________
Resumiendo:
Ho verdadera
Ho falsa
Rechazar Ho
Error Tipo I ( )
Correcto
No rechazar Ho
Correcto
Error Tipo II ( )
P Re chazar H0 / H0 es cierta
1 P Aceptar H0 / H0 es cierta
P Aceptar H0 / H0 es falsa
1 P Re chazar H0 / H 0 es falsa
A la probabilidad 1 se le denomina Potencia del Contraste.
Ambos errores no son independientes. Es decir, no se puede manipular uno sin afectar al
otro. Y lo deseable es que sean pequeos y parejos.
El error tipo I ( ) es dado por el investigador por ser ms delicada su falta. Y el error tipo II ( )
aparece como consecuencia del primero.
EJEMPLO:
1)
INFERENCIA ESTADISTICA
_________________________________________________________________________________
Al tener ya formulada la hiptesis nula, es necesario que las evidencias, sean muy fuertes para
rechazarla; es decir, puede que haya cambios debidos al azar, en cuyo caso el cambio no es
significativo, y no rechazamos Ho, pero puede que los cambios sean debidos a otras causas. En
este ltimo caso es cuando el cambio es significativo y rechazamos.
Por lo tanto, lo primero que debemos hacer es fijar un cierto intervalo, dentro del cual es
normal que haya cambios, es decir, una regin tal que si el parmetro se mantiene en dicho
intervalo, nos seguimos quedando con H 0 , pues esas pequeas variaciones son debidas al
azar.
Ese intervalo o regin se denomina Regin de Aceptacin y ser mayor o menor dependiendo
del nivel de confianza que precisemos 1 .
La regin que queda fuera de la regin de aceptacin indica que en este caso los cambios no
se pueden atribuir al azar, y por tanto tenemos que rechazar H 0 y aceptar H1 . Tal regin se
llama Regin Crtica o de Rechazo.
Distinguiremos entre dos tipos de contraste o test, que determinan la regin de aceptacin y
la de rechazo.
1.- Contraste bilateral (o de dos colas): En este caso la regin de rechazo o regin critica esta
formada por dos conjuntos de puntos disjuntos. Dicho caso se presenta cuando la hiptesis
nula es una igualdad ( ) y la alternativa es distinto ( )
INFERENCIA ESTADISTICA
_________________________________________________________________________________
2. Contraste unilateral (o de una cola) En este caso, la regin crtica esta formada por un solo
conjunto de puntos.
Valor P
El valor P o nivel de significacin emprico del contraste es la probabilidad obtenida a partir
del valor estadstico del contraste y que nos informa sobre cul sera el nivel de significacin
ms pequeo que nos hubiera permitido rechazar la hiptesis nula.
Se rechaza la hiptesis nula si el valor p es menor o igual al nivel de significacin.
Re chazar H 0 si valor p
No rechazo H0
Rechazo H0
INFERENCIA ESTADISTICA
_________________________________________________________________________________
H 0 : 0
H1 : 0
H1 : 0
H1 : 0
Z obs
X 0
/ n
Z obs
X 0
S/ n
H 0 : 30
Z obs
H1 : 30
32,5 30
3,33
6 / 64
Rechazar H 0 si Z obs Z1
3,33 Z 0.95
3,33 1.65
Luego, se rechaza Ho, existe evidencia suficiente en la muestra para concluir que la duracin
de las bateras de la nueva empresa tienen una duracin mayor a 30 meses.
INFERENCIA ESTADISTICA
_________________________________________________________________________________
H 0 : 0
H1 : 0
H1 : 0
H1 : 0
tobs
X 0
S/ n
EJEMPLO: La produccin diaria en una planta industrial qumica registrada durante 25 das
tiene una media muestral y una desviacin estndar de 871 toneladas y 21 toneladas,
respectivamente. Pruebe la hiptesis de que el promedio de la produccin diaria del producto
qumico es distinto de 880 toneladas por da. Use un nivel de significacin del 5%.
H 0 : 880
tobs
H1 : 880
X 0
S/ n
871 880
2,14
21/ 25
Se rechaza Ho, existe evidencia suficiente para concluir que la produccin diaria es distinta a
880 toneladas.
INFERENCIA ESTADISTICA
_________________________________________________________________________________
H1 : p p0
H1 : p p0
H1 : p p0
Z obs
p p0
p0 (1 p0 )
n
EJEMPLO: Supongamos que, respecto a una determinada ley, el 52% est en contra. Pasado el
tiempo, una encuesta realizada a 400 personas indica que los ciudadanos en contra han
descendido hasta el 49%, Ha cambiado realmente la opinin pblica o tal resultado es
debido al azar? Use 0, 05
H 0 : p 0,52
Z obs
H1 : p 0,52
0, 49 0,52
1.2
0,52(1 0,52)
400
Rechazar H 0 si Z obs Z1
1, 2 Z 0,95
1, 2 1.65
No se rechaza Ho; No existe evidencia para concluir que la proporcin de ciudadanos en contra
ha disminuido.
INFERENCIA ESTADISTICA
_________________________________________________________________________________
H1 : 2 02
H1 : 2 02
H1 : 2 02
2
obs
n 1 S 2
02
2n 1
2
Para : H1 : 2 02 rechazar H 0 si obs
2n 1;
2
H1 : 2 02 rechazar H 0 si obs
2n 1;1
2
2
H1 : 2 02 rechazar H 0 si obs
2n 1;1 obs
2n 1;
2
2
EJEMPLO: El contenido de siete contenedores similares de cido sulfrico son 9.8 10.2 10.4
9.8 10.0 10.2 y 9.6 litros. Pruebe la hiptesis que la varianza poblacional es menor a 0.1. Use
0, 05
H 0 : 2 0.1
2
obs
H1 : 2 0.1
6 0.08 4.8
0.1
2
Rechazar H 0 si obs
2n 1;
4.8 26;0.05
4.8
1.64
No rechazo Ho, no existe evidencia para creer que la varianza es menor a 0.1.
INFERENCIA ESTADISTICA
_________________________________________________________________________________
H1 : 1 2
H1 : 1 2
H1 : 1 2
Z obs
X1 X 2
12
n1
22
n2
Z obs
X1 X 2
S12 S 22
n1 n2
EJEMPLO: Una compaa desea comparar las expectativas salariales anuales de su personal de
ventas femenino y masculino, segn un nuevo plan de compensaciones ventas ms comisin.
Se pidi a 40 vendedoras y 40 vendedores muestreados al azar, predijeran sus ingresos
anuales bajo el nuevo plan. Las medias muestrales y desviaciones muestrales son:
Mujeres
Hombres
Promedio
31083
29745
Desv. Estndar
2312
2569
n
40
40
Proporcionan los datos evidencia que indique una diferencia en el promedio de ingreso anual
esperado tanto entre los vendedores como las vendedoras? Use un 5% de confianza
INFERENCIA ESTADISTICA
_________________________________________________________________________________
H 0 : 1 2
Z obs
H1 : 1 2
31083 29745
2, 45
(2312) 2 (2569) 2
40
40
Rechazar H 0 si Z obs Z1
2, 45 Z 0.975
2, 45 1,96
Se rechaza Ho, existe evidencia que indica una diferencia entre los promedios anuales
esperados por mujeres y hombres.
H1 : 1 2
H1 : 1 2
H1 : 1 2
tobs
X1 X 2
1 1
Sp
n1 n2
donde S p
EJEMPLO: Las ejecutivas de una empresa creen ganar en promedio menos que los hombres en
iguales cargos. Se toma una muestra aleatoria de 15 mujeres y 20 hombres, obtenindose los
siguientes resultados. Use = 0.05
Mujeres
Hombres
Promedio
400
430
Desv. Estndar
50
60
n
15
20
10
INFERENCIA ESTADISTICA
_________________________________________________________________________________
H 0 : 1 2
H1 : 1 2
(14)(50) 2 (19)(60) 2
55, 98
33
400 430
1, 57
1
1
55, 98
15 20
Sp
tobs
tobs t( n1 n2 2,1 )
Rechazar H 0 si
1, 57 t(33,0.95)
1, 57 1, 6924
No rechazo Ho, no existe evidencia para creer que las mujeres ganan menos que los hombres.
3.- Test de hiptesis para p1 p2
H 0 : p1 p2
H1 : p1 p2
H1 : p1 p2
H1 : p1 p2
Z obs
p1 p 2
1 1
p (1 p )
n1 n2
con
x1 x2
n1 n2
11
INFERENCIA ESTADISTICA
_________________________________________________________________________________
H 0 : p1 p2
p0
H1 : p1 p2
53
0.41
130
Z obs
0.4 0.42
1
1
(0.41)(0.59)
50 80
0.11
No se rechaza Ho, no existe evidencia para concluir que la proporcin de mujeres que fuman
es menor a la proporcin de hombres que fuman.
4.- Test para razn de varianzas
Consideremos dos muestras aleatorias de distribuciones normales independientes con medias
desconocidas 1 y 2 y varianzas desconocidas 12 y 22
H 0 : 12 22
H1 : 12 22
H1 : 12 22
H1 : 12 22
Fobs
S12
S22
Media
Desviacin Estndar
Mercado A
0.3
0.25
Mercado B
0.4
0.45
12
INFERENCIA ESTADISTICA
_________________________________________________________________________________
H1 : 12 22
0.25
Fobs
2
0.45
2
0.31
1
F15;20;0.95
0.31 F 20;15;0.95
1
0.31 2.9275
2.2033
D1 Y1 X 1
D2 Y2 X 2
.
.
.
Dn Yn X n
Las
diferencias
D1 , D2 ,...., Dn
son
variables
aleatorias
independientes
distribuidas
13
INFERENCIA ESTADISTICA
_________________________________________________________________________________
H 0 : D 0
H1 : D 0
H1 : D 0
H1 : D 0
n
tobs
D 0
SD
n
donde D
Di
i 1
S D2
D D
i 1
n 1
EJEMPLO: Se llev a cabo un estudio para determinar el grado en el cual el alcohol entorpece
la habilidad de pensamiento para realizar determinada tarea. Se seleccionaron al azar diez
personas de distintas caractersticas y se les pidi que participaran en el experimento. Despus
de proporcionarles la informacin pertinente, cada persona llevo a cabo la tarea, sin nada de
alcohol en su organismo. Entonces la tarea volvi a realizarse, despus de que cada persona
haba consumido una cantidad suficiente de alcohol para tener un contenido en su organismo
de 0,1%
Participante
Antes
Despus
1
28
39
2
22
45
3
55
67
4
45
61
5
32
46
6
35
58
7
40
51
8
25
34
9
37
48
10
20
30
H1 : D 10
D 14
y S D2 5,14
tobs
14 10
2, 45
5,14
10
Se rechaza Ho, el tiempo promedio para realizar la tarea, antes es menor al tiempo promedio
despus de ingerir alcohol por ms de 10 minutos.
14
INFERENCIA ESTADISTICA
_________________________________________________________________________________
4,5 6,3 2,6 3,2 6,4 5,3 5,5 5,2 2,3 2,6 3,4 3,8 4,5 4,1
2,6 3,4 2,9 3,1 3,7 4,3 5,2 3,8 2,8 2,5 4,1
Pruebe la hiptesis que las notas promedios obtenidas por ambos cursos son distintas, con un
5% de significacin.
2.- Se llevo a cabo un estudio para determinar el grado en el cual el alcohol entorpece la
habilidad de pensamiento para realizar determinada tarea. Se seleccionaron al azar diez
personas de distintas caractersticas y se les pidi que participaran en el experimento. Despus
de proporcionarles la informacin pertinente, cada persona llevo a cabo la tarea, sin nada de
alcohol en su organismo. Entonces la tarea volvi a realizarse, despus de que cada persona
haba consumido una cantidad suficiente de alcohol para un contenido en su organismo de
0,1%
Participante
Antes
Despus
1
28
39
2
22
45
3
55
67
4
45
61
5
32
46
6
35
58
7
40
51
8
25
34
9
37
48
10
20
30
15
INFERENCIA ESTADISTICA
_________________________________________________________________________________
S12 0.36 mientras y2 2.54 y S22 0.40 , para los n2 estudiantes con auto. Presentan estos
datos evidencia suficiente que indique una diferencia en el desempeo acadmico entre
estudiantes con y sin auto? Calcule el valor p.
16
INFERENCIA ESTADISTICA
_________________________________________________________________________________
Para cada solicitante. Se comete el error tipo I si se le niega un prstamo a un solicitante que
en verdad era un buen prospecto. Se comete un error tipo II si se da un prstamo a un
solicitante que era un mal prospecto. Discuta la seleccin del nivel de significancia en los
sgtes. casos:
a) Se tiene poco dinero para prestar, las tasas de inters son altas y se tiene un gran nmero
de solicitudes.
b) Hay bastante dinero para ser prestado, las tasas de inters son moderadas y existe
competencia para conseguir solicitantes de crdito.
8.- Una compaa aseguradora empezar una extensa campaa publicitaria para vender
seguros de vida si considera que el sueldo promedio obtenido por una familia es menor a
$400.000. Una muestra aleatoria de 50 familias en esa rea tiene un ingreso promedio de
$350.000 y una desviacin estndar $40.000
a) Tomando como base la evidencia de la muestra Se aceptar o rechazar la afirmacin al
nivel 0,05?
b) Calcule el valor p.
9.- Una mquina envasadora de caf est diseada para producir paquetes con un peso
distribuido normalmente con promedio 1 kg y una desviacin estndar de 20 gramos. Como el
envasador pierde plata si 1 y el cliente es perjudicado si 1 se desea construir un test
tal que la probabilidad de ajustar la mquina si est buena sea slo del 5 %.
a) Se toma una muestra de 25 paquetes y se encuentra un peso medio de 1 Kg y
9 gramos. Es necesario ajustar la mquina?
b) Determine el nivel de significacin * (p-value) e interprete su valor.
10.- Los rodamientos esfricos que fabrica una maquina deben de tener un dimetro uniforme
para ser aptos para su uso. El responsable de la maquina asegura que la varianza es 2 = 0,025.
Medidos 50 rodamientos se obtuvo una varianza muestral S2 = 0,0272 Es compatible este
resultado con la afirmacin previa?
17
INFERENCIA ESTADISTICA
_________________________________________________________________________________
11.- En una muestra de 100 personas de un barrio de Santiago se ha observado una proporcin
de 0.18 personas que leen el peridico diariamente. Puede ser que la verdadera proporcin
de personas que leen el peridico en ese barrio sea 0.20?
12.- En un estudio comparativo del tiempo medio de escolaridad para una muestra aleatoria
de 50 hombres y 50 mujeres en una industria, se obtuvieron los siguientes valores estadsticos
de muestra:
Hombres:
X 1 3.2 aos
S X 1 0.8 aos
Puede concluir que al nivel de 0,01 los hombres pasan un tiempo menor en la escuela que las
mujeres?
13.- Una agencia de empleos anuncia que los empleados nuevos que coloc en los ltimos
seis meses obtienen un sueldo promedio de $200.000 al mes. Una muestra aleatoria de ese
grupo, obtiene un sueldo promedio de $180.000 y una desviacin estndar de $50.000 sobre
la base de 20 personas.
a) Pruebe la hiptesis de la agencia de empleos, respecto a la alternativa que el sueldo es
menor de $200.000, utilizando el nivel de significancia 0.05.
b) Calcule e interprete el valor p
14.- La direccin de una empresa de automviles desea hacer cambios en la cadena de
montaje de la fbrica, pero el comit de la empresa tiene el temor de que los cambios afecten
demasiado el sueldo de los trabajadores ya que este depende del tipo de trabajo desarrollado
en la cadena de montaje. Por ello dicho comit decide consultar a los expertos y realizar un
muestreo aleatorio seleccionando 14 empleados con diferentes experiencias en la cadena de
produccin. La tabla adjunta muestra el sueldo por hora (en dlares) de los trabajadores en el
proceso nuevo (X) y en el antiguo (Y)
X
Y
8.14 4.61 6.33 7.38 6.87 6.62 6.82 6.87 8.12 4.75 6.43 7.38 6.45 6.16
8.05 3.96 6.13 8.21 6.05 5.21 5.25 6.32 7.35 4.13 6.37 7.08 7.56 6.24
Existe diferencia entre los sueldos de los trabajadores con ambos procesos, con un 10% de
significacin?
15.- La demanda de un determinado tipo de artculo ha venido comportndose durante los
ltimos aos como una distribucin normal con media 200 y desviacin estndar 20. A la
empresa que lo produce se le ofrece una campaa publicitaria del artculo, con objeto de
aumentar sus ventas. Si bien el precio de la campaa es alto, la empresa considera que si su
aplicacin eleva la venta media en ms de 250 unidades, su contratacin sera rentable. Para
tomar una decisin tal campaa se aplico durante un cierto periodo, obtenindose como
18
INFERENCIA ESTADISTICA
_________________________________________________________________________________
54
50
82
83
67
78
60
56
73
74
75
74
78
87
64
69
72
72
70
77
63
75
Promedio
Varianza
Empleado A
22.2
16.36
Empleado B
28.5
18.92
Es esta evidencia suficiente para indicar una diferencia en los tiempos medios requeridos
para completar los trmites necesarios de una cuenta corriente para un cliente nuevo? Use
=0.01. Calcule e interprete el valor p.
19
INFERENCIA ESTADISTICA
_________________________________________________________________________________
20.- Un fabricante de automviles decidi, recientemente, que el factor principal de las ventas
no era el automvil ni su servicio, sino el enfoque de venta empleado por sus vendedores.
Para probar esta teora, se dividi aleatoriamente un grupo de 16 vendedores en otros dos de
8 cada uno. Uno utiliz un enfoque con una publicidad dinmica (o agresiva) hacia los
clientes por un periodo de un mes; el otro grupo us un enfoque ms tranquilo, con una
publicidad ms discreta durante el mismo tiempo. En la tabla siguiente se proporcionan las
medias y desviaciones estndar de las ventas mensuales, en dlares, por vendedor para los
dos grupos.
Promedio
Varianza
Dinmica
106200
24400
Discreta
111900
28600
Proporcionan los datos evidencia suficiente que seale una diferencia en el nivel promedio de
las ventas para los dos enfoques de ventas? Use =0.010
21.- La variabilidad en la cantidad de impureza presente en un lote de productos qumicos,
utilizada para un proceso particular, depende del tiempo que tarda el proceso: Un fabricante
que emplea dos lneas de produccin 1 y 2, hizo un pequeo ajuste al proceso 2, con la
esperanza de reducir la variabilidad, as como la cantidad media de impurezas en los
productos qumicos. Muestras de 25 mediciones de dos lotes produjeron las siguientes medias
y varianzas
Promedio
Varianza
Produccin 1 Produccin 2
3.2
3.0
1.04
0.51
Presentan los datos evidencia suficiente para indicar que las variaciones del proceso son
menores para la lnea de produccin 2?
20