Estadc3adstica Inferencial Prueba de Hipc3b3tesis

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 16

UNIVERSIDAD DE MANAGUA

Al más alto nivel


Estadística Inferencial
Encuentro #11
Inferencia Estadística: Contraste de Hipótesis
Prof.: MSc. Julio Rito Vargas A. IIIC-2017

Inferencia Estadística: Contraste de Hipótesis:


Una hipótesis es una afirmación acerca de un hecho cualquiera, la cual se quiere contrastar
o verificar con la realidad.
Una hipótesis estadística es una hipótesis, proposición o supuesto sobre la distribución de
una variable aleatoria o sobre los parámetros de la distribución de una v.a.
Un contraste o test de hipótesis es una técnica de Inferencia Estadística que permite
comprobar si la información que proporciona una muestra observada concuerda (o no) con
la hipótesis estadística formulada sobre el modelo de probabilidad en estudio y, por tanto,
se puede aceptar (o no) la hipótesis formulada.
Este es uno de los aspectos más útiles de la inferencia estadística, puesto que muchos tipos
de problemas de toma de decisiones, pruebas o experimentos en el mundo de la ingeniería,
pueden formularse como problemas de prueba de hipótesis.
Suponga que se tiene interés en la rapidez de combustión de un agente propulsor sólido
utilizado en los sistemas de salida de emergencia para la tripulación de aeronaves. El interés
se centra sobre la rapidez de combustión promedio. De manera específica, el interés recae
en decir si la rapidez de combustión promedio es o no 50 cm/s. Esto puede expresarse de
manera formal como
Ho; µ= 50 cm/s
H1; µ≠50 cm/s

En una prueba de hipótesis surgen dos hipótesis excluyentes:


La proposición Ho; µ = 50 cm/s, se conoce como hipótesis nula, mientras que la
proposición H1; µ ≠ 50 cm/s, recibe el nombre de hipótesis alternativa.

TIPOS DE HIPÓTESIS:
1) Simples cuando se refieren a un solo valor del parámetro poblacional.

H o :   o
Prueba de 2 colas
H1 :    o

Julio Rito Vargas Avilés pág. 1


2) Compuestas cuando se refieren a más de un valor del parámetro poblacional.

H o :   o
Prueba de cola izquierda
H1 :    o

H o :   o
Prueba de cola derecha
H1 :    o

Es importante recordar que las hipótesis siempre son proposiciones sobre la población o
distribución bajo estudio, no proposiciones sobre la muestra. Por lo general, el valor del
parámetro de la población especificado en la hipótesis nula se determina en una de tres
maneras diferentes:
1. Puede ser resultado de la experiencia pasada o del conocimiento del proceso,
entonces el objetivo de la prueba de hipótesis usualmente es determinar si ha
cambiado el valor del parámetro.
2. Puede obtenerse a partir de alguna teoría o modelo que se relaciona con el proceso
bajo estudio. En este caso, el objetivo de la prueba de hipótesis es verificar la teoría
o modelo.
3. Cuando el valor del parámetro proviene de consideraciones externas, tales como las
especificaciones de diseño o ingeniería, o de obligaciones contractuales. En esta
situación, el objetivo usual de la prueba de hipótesis es probar el cumplimiento de
las especificaciones.
Un procedimiento que conduce a una decisión sobre una hipótesis en particular recibe el
nombre de prueba de hipótesis. Los procedimientos de prueba de hipótesis dependen del
empleo de la información contenida en la muestra aleatoria de la población de interés. Si
esta información es consistente con la hipótesis, se concluye que ésta es verdadera; sin
embargo si esta información es inconsistente con la hipótesis, se concluye que esta es falsa.
Debe hacerse hincapié en que la verdad o falsedad de una hipótesis en particular nunca
puede conocerse con certidumbre, a menos que pueda examinarse a toda la población.
Usualmente esto es imposible en muchas situaciones prácticas. Por tanto, es necesario
desarrollar un procedimiento de prueba de hipótesis teniendo en cuenta la probabilidad de
llegar a una conclusión equivocada.
La hipótesis nula, representada por Ho, es la afirmación sobre una o más características de
poblaciones que al inicio se supone cierta (es decir, la "creencia a priori").
La hipótesis alternativa, representada por H1, es la afirmación contradictoria a Ho, y ésta es
la hipótesis del investigador.
La hipótesis nula se rechaza en favor de la hipótesis alternativa, sólo si la evidencia muestral
sugiere que Ho es falsa. Si la muestra no contradice decididamente a Ho, se continúa

Julio Rito Vargas Avilés pág. 2


creyendo en la validez de la hipótesis nula. Entonces, las dos conclusiones posibles de un
análisis por prueba de hipótesis son rechazar Ho o no rechazar Ho.
PASOS PARA ESTABLECER UNA PRUEBA DE HIPOTESIS INDEPENDIENTEMENTE DE LA
DISTRIBUCION QUE SE ESTE TRATANDO
1. Precisar el problema y el nivel de significancia.
2. Definir las suposiciones que generan los datos (Normalidad de la distribución, si se
conoce o no la varianza, el tamaño de la muestra, etc)
3. Formular las hipótesis concernientes al objetivo que se persigue
H o :   o H o :   o H o :   o
H1 :    o H1 :    o H1 :    o

4. Fijar los valores críticos. Estos son estadísticos de acuerdo a los supuestos, basados
en el nivel de significación deseado y de la hipótesis planteada.
Para el caso Normal que es el que nos concierne en este momento seria:

a) Prueba de dos colas o bilateral


H o :   o
H1 :    o
b) Prueba de cola derecha
H o :   o
H1 :    o
c) Prueba de cola izquierda
H o :   o
H1 :    o

5. Establecer la regla de decisión: Sirve para determinar cual es la región de aceptación


y de rechazo. A partir del punto determinado por los valores críticos, en dirección a
la cola o las colas se inicia la región o regiones de rechazo.
Y la regla de decisión expresa que se rechazará Ho si el valor del estadístico cae en la
región de rechazo y que no se rechazará Ho si el valor del estadístico cae en la región
de aceptación.
6. Determinar el estadístico de prueba, se realiza de acuerdo a los datos y las
suposiciones que se establecieron.
7. Decisión y Conclusiones.

Julio Rito Vargas Avilés pág. 3


Error tipo I y II

• Las hipótesis nula y alternativa son aseveraciones sobre la población que compiten
entre sí
• No siempre es posible que las conclusiones sean verdaderas o correctas

H0 verdadera Ha verdadera

Conclusión
Aceptar H0 Error tipo II
Correcta

Conclusión
Rechazar H0 Error tipo I
Correcta

• No se puede eliminar la posibilidad de errores en la prueba de hipótesis, pero si es


posible considerar su probabilidad
• Se define como:

α=probabilidad de cometer un error tipo I

β=probabilidad de cometer error tipo II

• La máxima probabilidad permisible se le llama nivel de significancia para la prueba.


Los valores acostumbrados son de 0.05 y 0.01
• En la mayoría de las aplicaciones se controla la probabilidad de cometer error tipo
I, luego existe la incertidumbre con respecto al error tipo II
• Si los datos muestrales son consistentes con H0 se adopta en la práctica la conclusión
de “no rechazar H0”, ya que de esta forma evitamos el riesgo de cometer error tipo II

La conclusión de “aceptar H0” se toma sólo cuando se haya determinado el error


tipo II.

Suponga que se va a implantar un nuevo método de producción si una prueba de


hipótesis respalda la conclusión de que con ese método se reduce la media del costo
de operación por hora.

1) Enuncie las hipótesis nula y alterna si la media del costo para el método
actual de producción es de $220 por hora
2) ¿Cuál es el error de tipo I en este caso y sus consecuencias?
3) ¿Cuál es el error tipo II en este caso y sus consecuencias?

Julio Rito Vargas Avilés pág. 4


Pruebas unilaterales para la media

Muestra Grande

• En este caso (n>30) se asume distribución normal


• Para pruebas de hipótesis acerca de la media de una población se emplea el
estadígrafo z

z
 X  
/ n
• Se determina si la desviación del valor numérico en estudio es lo suficiente para
justificar el rechazo de la hipótesis nula
• La probabilidades 0.05 y 0.01 de cometer error tipo I están relacionadas con un
valor de z de –1.645 y –2.33 respectivamente
• Luego se debe rechazar H0 si el valor de z es menor a –1.645 o –2.33 dependiendo
del nivel de significancia
• El valor z establece el límite de la región de rechazo denominada valor crítico

Resumen de pruebas unilaterales sobre media de una población. Si n30


H 0 :   0 H 0 :   0
H a :   0 H a :   0

z
X   ;0
z
X   
0  X    X  
z z
0 0
;
/ n s/ n / n s/ n

Rechazar H 0 si z   z Rechazar H 0 si z  z
Julio Rito Vargas Avilés pág. 5
Ejemplo 1:
Una muestra aleatoria de 100 muertes registradas en Estados Unidos el año pasado
muestra una vida promedio de 71.8 años. Suponga una desviación estándar poblacional
de 8.9 años, ¿esto parece indicar que la vida media hoy en día es mayor que 70 años?
Utilice un nivel de significancia de 0.05.
1) Significancia del 5%
2) Se trata de una distribución muestral de medias con desviación estándar conocida,
y tamaño de muestra grande (N=100)
H o :   o
3) Será que la vida media mayor a 70 años?
H1 :    o

4)

5) Si el estadístico de prueba es mayor a 1.645 Rechazar Hipótesis nula


6) Calculo del estadístico de prueba:

(𝑥̅ − 𝜇) (71.8 − 70) 1.8


𝑧= 𝜎 = = = 2.022
⁄ 𝑛 8.9⁄ 0.89
√ √100

7) Como el Z es mayor a 1.645 se RECHAZA la hipótesis nula es decir que la vida


media si es mayor a 70 años.
Ejemplo 2:
Un agente de bienes raíces afirma que 60% de todas las viviendas privadas que se
construyen actualmente son casas con tres dormitorios. Para probar esta afirmación se
inspecciona una muestra grande de viviendas nuevas. Se registra la proporción de las casas
con 3 dormitorios y se utiliza como estadístico de prueba. Plantee las hipótesis nula y
alternativa que se utilizaran en esta prueba y determine la ubicación de la región crítica.
Solución:

Julio Rito Vargas Avilés pág. 6


Si el estadístico de prueba fuera considerablemente mayor o menor que p = 0.6,
rechazaríamos la afirmación del agente. En consecuencia, deberíamos plantear las
siguientes hipótesis:
H0: p = 0.6,
H1: p ≠ 0.6.

La hipótesis alternativa implica una prueba de dos colas con la región critica dividida por
igual en ambas colas de la distribución de P^, nuestro estadístico de prueba.

Muestra Pequeña
• En este caso (n < 30) se asume que la población tiene una distribución normal
• Con distribución t se pueden hacer inferencias acerca de la media de la población

X  0
t
s/ n

• Para este estadígrafo se debe considerar los grados de libertad asociados al tamaño
de la muestra (n-1) para definir el valor crítico que llevará al rechazo de H0. Por las
características de la tabla resulta complicado calcular el valor de p por lo que se
expresa en intervalos

Pruebas bilaterales para la media

Muestra grande
• La diferencia de esta prueba con respecto a las unilaterales está en que la región de
rechazo está ubicada simultáneamente en ambas colas
• En las pruebas bilaterales de hipótesis siempre se determina la región de rechazo
colocando un área de probabilidad igual a α/2 en cada cola de distribución
• Para este caso el valor de z para un nivel de significancia de 0.05 corresponderá a
1.96

Julio Rito Vargas Avilés pág. 7


Resumen de pruebas bilaterales sobre media de una población. Si n30

H 0 :   0
H a :   0

z
X  0 
; z
X  0 
/ n s/ n

Rechazar H 0 si z   z / 2 z  z / 2

Ejemplo 2:
Un diseñador quiere reducir el tiempo de secado de una pintura. Se prueban dos fórmulas
de pintura. La fórmula 1 es la normal y la fórmula 2 posee un ingrediente secante que se
espera reduzca el tiempo de secado. Se sabe que el tiempo de secado tiene una desviación
estándar de 8 min y que ésta no se afecta con la adición del nuevo ingrediente. Se pintan
10 especímenes con la fórmula 1, y 10 con la fórmula 2, obteniéndose tiempos promedio
de secado de x1=121 minutos y x2=112 minutos respectivamente. ¿A qué conclusión se llega
sobre la eficacia del nuevo ingrediente?

Solución:
̅̅̅1=121 ; 𝑋
𝑋 ̅̅̅2=112; 𝑛1 = 10; 𝑛2 = 10; 𝜎1 = 8 𝑚𝑖𝑛. ; 𝜎2 = 8 𝑚𝑖𝑛.
1) Cantidad de interés: 𝝁1 -- 𝝁2
2) H0: 𝝁 1 = 𝝁 2
3) H1: 𝝁 1 > 𝝁 2 (se busca evidencia fuerte que indique que el tiempo de secado
promedio de la muestra 2 es menor)
4) α =0.05 ___ ___ σ12 σ 22
5) El estadístico de prueba es Z  (X1  X 2)/ 
n1 n 2
6) H0 se rechazará si z>z0.05 = 1.645
7) Sustituyendo los datos, obtenemos z=(121-112)/(12.8)1/2=2.52

Julio Rito Vargas Avilés pág. 8


Conclusión: Puesto que z = 2.52 > 1.645 se rechaza H0 con un nivel de significancia
a=0.05 concluyéndose el nuevo ingrediente sí disminuye el tiempo de secado

I. A las personas que sufren de tensión alta, se les recomienda seguir una dieta
libre de sal. Queremos realizar un estudio para comprobar si esta dieta es
efectivamente ventajosa. Para el estudio se estudió una muestra de 8 personas
y se tomó la tensión antes de empezar la dieta y dos semanas después. Los
resultados obtenidos fueron:

Antes 93 106 87 92 102 95 88 110


Después 92 102 89 92 101 96 88 105
Denotamos μA y μB a las medias poblacionales de tensión antes y después de
empezar la dieta, respectivamente. De este modo, el contraste de hipótesis que
debemos plantear es:

Haga el contraste para un nivel de confianza del 96%. Responda si hay cambio
significativo después de empezar la dieta?

Recomendación:
Tiene que usar la siguiente fórmula como estadístico de prueba.

𝑋̅1 − 𝑋̅2
𝑡0 =
1 1
𝑆𝑝 √𝑛 + 𝑛
1 2

(𝑛1 − 1)𝑆12 + (𝑛2 − 1)𝑆22


𝑑𝑜𝑛𝑑𝑒: 𝑆𝑝 = √
𝑛1 + 𝑛2 − 2

Debe calcular: 𝑋̅1 𝑦 𝑋̅2


𝑆12 𝑦 𝑆22
Sustituir en Sp y luego calcular to

Hacer el contraste de hipótesis buscando en la tabla t-student


t0.02,7 =_______ y t0.98,7 =_________

II. Una compañía de transporte de carga desea escoger la mejor ruta para llevar la
mercancía de un depósito a otro. La mayor preocupación es el tiempo de viaje.
En el estudio se seleccionaron al azar 5 choferes de un grupo de 10 y se asignaron

Julio Rito Vargas Avilés pág. 9


a la ruta A; los cinco restantes se asignaron a la ruta B. Los datos obtenidos
fueron:
Ruta Tiempo del viaje en horas
A 18 24 30 21 32
B 22 29 34 25 35

a) Existen diferencias significativas entre las rutas?


b) Plantee la prueba de hipótesis estadística correspondiente?
Recomendación: siga los pasos orientados en el problema anterior.

III. Un sociólogo ha pronosticado, que en una determinada ciudad, el


nivel de abstención en las próximas elecciones será del 40% como
mínimo. Se elige al azar una muestra aleatoria de 200 individuos,
con derecho a voto, 75 de los cuales estarí an dispuestos a votar.
Determinar con un nivel de significación del 95%, si se puede
admitir el pronóstico.
a) Formula la hipótesis
b) Haga el contraste y determine si se admite al pronóstico.
Recomendación:
Formula esta hipótesis:
Ho: p= 40%
HA: p≠ 40%

𝑝̂ −𝑛𝑝
Use el siguiente estadístico de prueba: 𝑧𝑜 =
√𝑛𝑝(1−𝑝)

Busque en la tabla normal estándar el valor de z para 0.025 o 0975


Para las dos colas.

IV. El control de calidad una fábrica de pilas y baterías sospecha que


hubo defectos en la produ cción de un modelo de batería para
teléfonos móviles, bajando su tiempo de duración. Hasta ahora
el tiempo de duración en conversación seguía una distribución
normal con media de 300 minutos y desviación típica de 30
minutos. Sin embargo, en la inspección del último lote

Julio Rito Vargas Avilés pág. 10


producido, antes de enviarlo al mercado, se obtuvo que de una
muestra de 60 baterías el tiempo medio de duración en
conversación fue de 290 minutos. Suponiendo que ese tiempo
sigue siendo Normal con la misma desviación típica:

¿Se puede concluir que las sospechas del control de calidad son
ciertas a un nivel de significación del 98%?

Recomendación: formule la siguiente hipótesis.

H o : 𝝁=300 minutos

H A : 𝝁≠300 minutos.

Use el siguiente estadístico de prueba

𝑋̅ − 𝜇
𝑧0 = 𝜎
⁄ 𝑛

Busque en la tabla normal el valor z. y compara como en el


ejemplo III.

V. Un experimento se comparó el ahorro de combustible para dos


tipos de camiones: compactos que funcionan con diésel y están
equipados de forma similar. Suponga que se utilizaron 12 camiones
Volkswagen y 10 Toyota en pruebas con una velocidad constante
de 90 kilómetros por hora. Si los 12 camiones Volkswagen
promedian 16 kilómetros por litro con una desviación estándar de
1.0 kilómetros por litro, y los 10 Toyota promedian 11 kilómetros
por litro con una desviación estándar de 0.8 kilómetros por litro,
construya un intervalo de confianza del 90% para la diferencia de
medias entre los kilómetros promedio por litro de estos dos
camiones compactos. Suponga que las distancias por litro para
cada modelo de camión están distribuidas de forma
aproximadamente normal y que tienen vari anzas iguales.

Julio Rito Vargas Avilés pág. 11


Julio Rito Vargas Avilés pág. 12
Julio Rito Vargas Avilés pág. 13
Julio Rito Vargas Avilés pág. 14
Julio Rito Vargas Avilés pág. 15
Julio Rito Vargas Avilés pág. 16

También podría gustarte