Cap 05. Prueba de Hipotesis.

Descargar como doc, pdf o txt
Descargar como doc, pdf o txt
Está en la página 1de 21

ESTADISTICA Y PROBABILIDAD II CARLOS PAREDES GUZMAN

5. PRUEBA DE HIPOTESIS

5.1. Hipótesis estadística


Una hipótesis estadística es una proposición (afirmación, aseveración, enunciado)
acerca del valor de un parámetro poblacional o acerca de la distribución de una o
más variables aleatorias. Por ejemplo:

1) El ingreso mensual medio µ de los jubilados es de S/.350.


2) La proporción  de los delincuentes arrestados a los que se les sentencia y
encarcela es 0.20.
3) La varianza poblacional  2 del tiempo de operación de las computadoras del
pabellón W es de 5 horas2.
4) El diámetro exterior medio de los cojinetes de bolas producidos por una
empresa es de 2.54 cm.
5) Las resistencias al impacto de los parabrisas que producen dos empresas son
iguales.
6) El promedio de km. por galón de un automóvil en carretera es de 70 km.
7) Los datos tienen distribución normal.
8) Los promedios poblacionales µ1, µ2, µ3, µ4 de las resistencias a la compresión
de cuatro diferentes técnicas de mezclado de concreto son iguales.

Como puede observarse, las hipótesis pueden formularse de diversas formas. Por
lo tanto, se debe estudiar un procedimiento que permita probar a las hipótesis
estadísticas.

Es importante recordar que las hipótesis siempre son proposiciones sobre la


población o distribución bajo estudio, nunca son aseveraciones sobre la muestra.

5.2. Prueba de hipótesis


PRUEBA DE HIPÓTESIS: Procedimiento basado en la evidencia muestral y en la
teoría de probabilidad que se emplea para determinar si la hipótesis es un
enunciado razonable y no debe rechazarse, o si es irrazonable y debe ser
rechazada.

Una prueba de hipótesis estadística (contraste de hipótesis, docimasia de hipótesis)


es un procedimiento de toma de decisión respecto a la veracidad de la misma.
1
ESTADISTICA Y PROBABILIDAD II CARLOS PAREDES GUZMAN

A diferencia de los procedimientos de estimación, la prueba de hipótesis no es


un procedimiento exploratorio; en una prueba de hipótesis estamos más
interesados en confirmar una relación del parámetro de interés con un valor fijo
conocido, que en explorar un valor desconocido.

La prueba de hipótesis es un razonamiento inductivo, es decir, un razonamiento


de lo particular a lo general. De un conjunto de observaciones se extraen
conclusiones acerca de lo que podría suceder si la totalidad de las observaciones
fueran extraídas.

El procedimiento de la prueba de hipótesis depende de la información contenida


en una muestra aleatoria de la población de interés. Si la información es
consistente con la hipótesis, se concluye que esta es verdadera; sin embargo, si
esta información es inconsistente con la hipótesis , se concluye que esta es falsa.

Debe tenerse presente que la verdad o falsedad de una hipótesis en particular


nunca puede conocerse con certidumbre, a menos que pueda analizarse a toda la
población. Por lo general esto es imposible en la mayoría de las situaciones
prácticas. Esta es la razón por la que es necesario desarrollar un procedimiento de
prueba de hipótesis que tenga en consideración la posibilidad de alcanzar una
conclusión equivocada. Este tipo de razonamiento, de lo particular a lo general, no
puede efectuarse con certeza, por lo que la probabilidad ayuda a medir o
cuantificar esta incertidumbre.

5.3. Procedimiento de la prueba de hipótesis


Es un procedimiento de siete pasos que sistematiza la prueba de hipótesis; al
llegar al paso 7 se está en capacidad de tomar la decisión de rechazar o no una
hipótesis.

Al realizar pruebas de hipótesis, se parte de un valor supuesto (hipotético) de un


parámetro poblacional. Después de recolectar una muestra aleatoria, se compara
el estadístico muestral con el parámetro hipotético. Después se acepta o rechaza
el valor hipotético, según proceda. Se rechaza el valor hipotético solo si el
resultado muestral resulta muy poco probable cuando la hipótesis es cierta.

2
ESTADISTICA Y PROBABILIDAD II CARLOS PAREDES GUZMAN

El orden de ejecución de las etapas del (1) al (7) es estricta. No puede alterarse su
orden.

La estructura de los problemas de prueba de hipótesis es idéntica en todas las


aplicaciones.

En resumen, para probar una hipótesis, se debe tomar una muestra al azar, calcular
una estadístico de prueba apropiado a partir de los datos de la muestra, y después
utilizar la información contenida en este estadística de prueba para tomar una
decisión.

El propósito de la prueba de hipótesis no es cuestionar el valor calculado del


estadístico de prueba, sino hacer un juicio con respecto a la diferencia entre ese
estadístico de prueba y un parámetro de población propuesto en la hipótesis nula.
Es decir, la prueba estadística mide el acercamiento del valor de la muestra a la
hipótesis nula. Si existe diferencia entre el valor de la muestra y el valor
poblacional puede deberse al error muestral (aleatoria) o al error sistemático.
¿Hasta qué punto se puede considerar que la diferencia es debida a la aleatoriedad
de la muestra?. La respuesta a esta pregunta genera la región de rechazo.

Tipos de pruebas de hipótesis:


 Bilateral o dos colas.
 Unilateral a la izquierda o de cola izquierda.
 Unilateral a la derecha o de cola derecha.

Los pasos o reglas específicas del procedimiento son:

1) Plantear la hipótesis nula y la hipótesis alternativa: El primer paso es


plantear la hipótesis que se probará. Se le denomina hipótesis nula, designada
mediante H0. La letra H significa hipótesis y el subíndice cero indica “no hay
diferencia”.

HIPÓTESIS NULA: Es una enunciado tentativo que se hace acerca del


valor de un parámetro poblacional. Usualmente es una afirmación
de que el parámetro de población tiene un valor específic o.

Por ejemplo H0:  = S/.350


H0:  = 0.20
H0:  2 = 5 horas2

3
ESTADISTICA Y PROBABILIDAD II CARLOS PAREDES GUZMAN

H0:  = 2.54 cm.


H0: 1 = 2
H0:  = 70 km./galón
H0: La distribución poblacional es normal
H0: 1 = 2 = 3 = 4

La hipótesis nula es la afirmación que se formula en base al conocimiento


previo, a la experiencia de otros investigadores, experimentos previos, valor de
un proceso o teoría, especificaciones de diseño o ingeniería, o de obligaciones
contractuales.

El procedimiento de la prueba de hipótesis esta construido bajo la condición de


que la “hipótesis nula es verdadera o cierta”. Es decir, la prueba de hipótesis
esta diseñada para no rechazar “algo que es cierto”. La hipótesis nula es la
hipótesis que se desea probar. Sin embargo, cuando se concluye que la Ho no
es cierta, se dice que la prueba es significativa.

El rechazo de la hipótesis nula siempre conduce a la aceptación de la hipótesis


alternativa. En el caso de que la hipótesis nula no sea rechazada, no debe
entenderse que la H0 sea válida o cierta. Nunca se acepta la H0. Lo que se puede
decir es que no se tiene la evidencia estadística suficiente para rechazarla.

La hipótesis nula se denota por H0 y siempre esta asociada a cualquiera de la


siguientes relaciones = ,  y .

El rechazo de H0 siempre es una conclusión fuerte y su aceptación es una


conclusión débil.

La hipótesis alternativa describe lo que se considerará si se rechaza la


hipótesis nula. A menudo se denomina también hipótesis de investigación y
se designa por H1. La hipótesis alternativa se aceptará si los datos muestrales
proporcionan evidencia de que la hipótesis nula es falsa.

HIPÓTESIS ALTERNATIVA: Es una afirmación o enunciado que se aceptará


si los datos muestrales proporcionan amplia evidencia de que la hipótesis
nula es falsa.

Por ejemplo H1:  < S/.350


H1:   0.20
4
ESTADISTICA Y PROBABILIDAD II CARLOS PAREDES GUZMAN

H1:  2 > 5 horas2


H1:   2.54
H1: 1 >2
H1:  < 70 km./galón
H1: La distribución poblacional no es normal
H1: Por lo menos una de las j es diferente

La hipótesis alternativa es la hipótesis que se formula sobre el mismo


parámetro poblacional que se utiliza en la hipótesis nula. Generalmente, se
específica en H1 que el parámetro poblacional tiene un valor diferente al
establecido en la hipótesis nula. La hipótesis alternante se denota por H1 o Ha
y siempre esta asociada a uno de las siguientes relaciones: < , > , .

2) Especificar el nivel de significación: El nivel de significación es la


probabilidad de rechazar la hipótesis nula cuando en realidad es verdadera. El
nivel de significación se denota mediante . También se denomina nivel de
riesgo. Tradicionalmente se selecciona el nivel de significación de 0.05 para
proyectos de investigación sobre consumo, el 0.01 para control de calidad y
el 0.10 para encuestas políticas.

NIVEL DE SIGNIFICACIÓN : Es el riesgo que se asume al rechazar la


hipótesis nula cuando en realidad debe aceptarse por ser verdadera.
El propósito de la prueba de hipótesis no es cuestionar el valor calculado del
estadístico muestral, sino hacer un juicio con respecto a la diferencia entre
ese estadístico muestral y un parámetro poblacional hipotetizado.
Si suponemos que la hipótesis es en
Región correcta, entonces
la que no hay una el nivel de significación
diferencia sinificativa entre el
indicará el porcentaje de estadísticos muestrales que estarán fuera de ciertos
es tadís tico y el pará metro
límites. hipotetizado . Aceptamos Ho si el
estadístico cae en esta región (no
rechazamos Ho)
En la siguiente figura se ilustra como
REGIÓN DEinterpretar
ACEPTACIÓNun NIVEL DE SIGNIFICACIÓN
de 100%

 
REGIÓN DE RECHAZO REGIÓN DE RECHAZO
2 1-  2

-Z /2 H Z /2
0

En estas dos regiones, si hay una


diferencia significativa entre el
es ta d ís ti co y el p a rá metro
hipotetizado. Rechazamos la
hipótesis nula si el estadístico 5
cae en una de estas dos regiones
ESTADISTICA Y PROBABILIDAD II CARLOS PAREDES GUZMAN

Resulta conveniente hacer una advertencia en este punto. Incluso si el


estadístico muestral cae en la región de aceptación, esto no prueba que la H0
sea cierta; simplemente no nos proporciona evidencia estadística para
rechazarla.

El uso del término aceptar, en vez de no rechazar, se ha vuelto común.


Significa simplemente que cuando los datos de la muestra no hacen que
rechacemos una hipótesis nula, nos comportamos como si esa hipótesis fuera
cierta.

En la elección de  se debe tener presente que “mientras mayor sea  mayor es


la probabilidad de rechazar una H0 cuando es verdadera”.

Es claro que  debe asumir un valor pequeño. No existe un único valor de 


para probar hipótesis. Los valores más usados son 0.05 y 0.01, pero de ninguna
manera significa que sean los únicos valores.

Por ejemplo, un valor de  = 0.05 significa que estamos dispuestos a rechazar


la H0 únicamente si la diferencia entre el estadístico muestral y el parámetro de
la población de la H0 es lo bastante grande como para que ocurra ésta u otra
diferencia mayor, en promedio, sólo cinco o menos veces en cada 100 muestras
cuando la H0 es verdadera. Es decir, el nivel de significación indica el
porcentaje de veces que la prueba estadística se encuentra fuera de ciertos
límites.

ERROR TIPO I: Rechazar la hipótesis nula H0 cuando en realidad es


verdadera. La probabilidad de cometer un error tipo I se denota con la letra
griega .
 = P(Error tipo I) = P(Rechazar H0 / H0 es verdadera)

6
ESTADISTICA Y PROBABILIDAD II CARLOS PAREDES GUZMAN

ERROR TIPO II: Aceptar la hipótesis nula H0 cuando en realidad es falsa. La


probabilidad de cometer un error tipo II se denota con la letra griega .
 = P(Error tipo II) = P(Aceptar H0 / H0 es falsa)

En la siguiente tabla se resumen los tipos de decisiones y las consecuencias


posibles, al realizar pruebas de hipótesis:
SITUACIONES POSIBLES
DECISIONES POSIBLES H0 VERDADERA H0 FALSA
ACEPTAR H0 Decisión Correcta Error tipo II
RECHAZAR H0 Error tipo I Decisión Correcta

En la práctica no se sabe en que situación uno se encuentra, por lo que es


imposible medir de manera exacta los errores que se pueden cometer. Sin
embargo, con la ayuda de las probabilidades podemos tener información de
estos errores.

Las probabilidades asociadas con los cuatro resultados posibles en una


prueba de hipótesis se resumen en la siguiente tabla.

PROBABILIDA
DEFINICIÓN
D
 NIVEL DE SIGNIFICACIÓN: Probabilidad de un Error Tipo I
1- NIVEL DE CONFIANZA: P(Aceptar H0 / H0 es verdadera)
 Probabilidad de un Error Tipo II: P(Aceptar H0 / H0 es falsa)
1- POTENCIA DE LA PRUEBA: P(Rechazar H0 / H0 es falsa)

Para un tamaño de muestra dado, el investigador debe equilibrar los dos tipos
de errores. Si reduce , entonces aumenta . Si reduce , entonces aumenta .
Los valores de  y  dependen de la importancia de cada riesgo en un
problema particular. También depende de los costos inherentes en cada tipo de
error.

Generalmente, el procedimiento que se sigue con los dos tipos de errores es


fijar o elegir un valor pequeño para  y controlar  mediante el tamaño de
muestra.

POTENCIA DE LA PRUEBA: Es la probabilidad de rechazar H0 cuando es falsa.


Se denota como 1-.
7
ESTADISTICA Y PROBABILIDAD II CARLOS PAREDES GUZMAN

Potencia de la prueba = 1 -  = P(rechazar H0 / H0 es falsa)

La potencia de la prueba es una medida descriptiva y concisa de la sensibilidad


de una prueba estadística para detectar diferencias. Idealmente, se busca tener
una alta potencia para detectar una diferencia de interés, y baja potencia para
una diferencia de muy poca importancia.

El valor de la potencia se puede controlar con el aumento o disminución del


tamaño de la muestra.

Idealmente los errores  y  deben ser pequeños, pero la relación entre ambos
es inversa, es decir, cuando  aumenta  disminuye y viceversa.

Los factores que influyen en la potencia de la prueba son:

 El nivel de significación . Si  aumenta,  disminuye y por tanto la


potencia = 1- aumenta.
 Si  aumenta, la potencia disminuye.
 Si la diferencia poblacional del efecto disminuye, la potencia disminuye.
 Si n aumenta, la potencia aumenta.

3) Elegir la distribución muestral y el estadístico de prueba: Después de


decidir el nivel de significación a utilizar, la siguiente tarea en la prueba de
hipótesis consiste en determinar la distribución de probabilidad adecuada y el
estadístico de prueba.

ESTADÍSTICO DE PRUEBA: Es un valor, determinado a partir de la


información muestral, que se utiliza para aceptar a rechazar la hipótesis
nula.

En la prueba de hipótesis respecto a medias tenemos la opción de escoger


entre la Distribución Normal Z y la Distribución t, según las situaciones
siguientes:

2 2
CONOCIDO DESCONOCIDO
Distribución Normal Z Distribución t

8
ESTADISTICA Y PROBABILIDAD II CARLOS PAREDES GUZMAN

4) Formular y establecer una regla de decisión: Una regla de decisión


simplemente es una afirmación de las condiciones bajo las cuales se acepta o
se rechaza la hipótesis nula.

Para lograr esto, la distribución muestral se divide en dos partes, que


adecuadamente se denominan región de aceptación y región de rechazo.

La región de rechazo define la ubicación de todos los valores que son


demasiado grandes o demasiado pequeños, por lo que la probabilidad de que
ocurran según un hipótesis nula verdadera es muy remota.

Las pruebas de hipótesis se clasifican como PRUEBAS DE UNA COLA o


PRUEBAS DE DOS COLAS. Si la afirmación de H1 involucra < o > es apropiada
una prueba de una cola. Si la afirmación de H1 contiene , entonces es
adecuada una prueba de dos colas. La tabla siguiente resume lo expresado:

S IGNO EN H 1
<  >
Prueba de Prueba de Prueba de
PRUEBA
Cola Izquierda Dos Colas Cola Derecha

REGION DE REGION DE REGION DE REGION DE


RECHAZO  ACEPTACION ACEPTACIÓN RECHAZO 
1-  1- 
 H0
X
 H0 X

Z 0 Z 0 Z Z

(a) Prueba de Cola Izquierda (b) Prueba de Cola Derecha

1.- El área de aceptación incluye el 1.- El área de aceptación incluye


área a la derecha de Z  el área a la izquierda de Z
REGION
2.- El área de rechazo estáDEa la REGION DE 2.- REGION
El área deDE rechazo está a la
RECHAZO ACEPTACIÓN RECHAZO
izquierda de Z  1- derecha de Z
3.- El nivel de significación es  3.- El nivel de significación es 
4.- El valor Z  separa las 4.- El valor Z separa las
regiones de aceptación y-Z
 /2 0 Z regiones de
 /2 Z aceptación y rechazo
rechazo
(c) Prueba de dos colas

1.- El área de aceptación incluye el área


central entre -Z /2 y Z /2
2.- El área de rechazo está a la izquierda de
-Z /2 y a la derecha de Z /2
3.- El nivel de significación es
4.- Los valores -Z /2 y Z /2 separan
las regiones de aceptación y rechazo 9
ESTADISTICA Y PROBABILIDAD II CARLOS PAREDES GUZMAN

VALOR CRITICO: Número que divide la región de aceptación y la región de


rechazo. Se denota por Zc, Z, Z1-, Z1-/2, tc, t, t1-, t1-/2,  c2 , Fc

La siguiente tabla muestra los valores críticos Zc para ensayos de una y dos
colas a distintos niveles de significación , los que serán de utilidad para
propósitos de referencia.

NIVEL DE VALOR CRITICO Zc


SIGNIFICACIÓN Prueba de Cola Prueba de Cola Prueba de dos
 Izquierda Derecha Colas
0.10 1.2816 +1.2816 1.6449
0.05 1.6449 +1.6449 1.9600
0.01 2.3263 +2.3263 2.5758
0.005 2.5758 +2.5758 2.8070
0.002 2.8782 +2.8782 3.0902

5) Tomar una muestra y calcular el valor real del estadístico de prueba:


Al probar un valor hipotético de la media poblacional , se toma una muestra
aleatoria y se determina el valor de la media muestral. Si el valor crítico que
se establece es un valor de Z (Z  o Z 1 -  o Z 1 -  / 2 ) entonces se transforma
la media muestral en un valor de Z tal como Z0.

6) Tomar un decisión: Se compara el valor observado del estadístico


muestral Z con el valor o los valores críticos. Luego se acepta o se rechaza la
hipótesis nula. Si se rechaza H0, se acepta H1.

7) Conclusión: Las consecuencias de la decisión de la prueba de hipótesis


se expresan en términos del problema real que se esté tratando.
10
ESTADISTICA Y PROBABILIDAD II CARLOS PAREDES GUZMAN

Ejemplo 1.- Para cada pareja de hipótesis estadísticas, indicar cuál es la hipótesis
nula H0 y cual la hipótesis alternativa H1
a) A:  > 21 b) A:  = 0.7 c) A:   1.2 d) A:  2 < 8.1
B:  = 21 B:   0.7 B:  = 1.2 B:  2  8.1

Ejemplo 2.- Identificar cuáles de la hipótesis del ejemplo 1 están asociadas con
pruebas de una cola.

Ejemplo 3.- Para cada pareja de hipótesis estadísticas, indicar cuál es la hipótesis
nula H0 y cual la hipótesis alternativa H1
a) A:   235 b) A:   0.9 c) A:  2 = 32 d) A:  > 8
B:  < 235 B:  = 0.9 B:  2  32 B:   8

Ejemplo 4.- ¿Cuáles de las hipótesis en el ejemplo 3 están asociadas con pruebas
de dos colas?

Ejemplo 5.- Para cada una de las situaciones siguientes, identificar las hipótesis
y el tipo de error, cuando sea apropiado:
a) El fármaco cibenzolina está siendo comparado con el propanolol para su
posible uso en el control de la arritmia cardiaca. La afirmación es que la
cibenzolina es mejor que el propanolol; de hecho esto no es cierto, sin
embargo, la investigación concluyó que la cibenzolina es mejor.
b) Dos colegios son igualmente eficientes en la preparación de sus estudiantes.
Un equipo de evaluación concluyó que no hay diferencia significativa entre
los dos colegios.
c) Una mayor proporción de televisores MIRRAY que de SONY requieren
reparaciones. Un estudio hecho por el INDECOPI concluyó lo mismo.
d) Se comparó a dos personas con respecto a su eficiencia al realizar un cierto
trabajo; el individuo B es realmente más eficiente que el A. Una evaluación
concluyó que no hay diferencia entre las razones de eficiencia de A y de B.

Ejemplo 6.- Para cada una de las situaciones de investigación siguientes, indique
cuando es apropiada una prueba de una cola o de dos colas:

11
ESTADISTICA Y PROBABILIDAD II CARLOS PAREDES GUZMAN

a) La DIGEMID (Dirección General de Medicamentos y Drogas) quiere probar


un nuevo fármaco elaborado por UPJOHN para determinar si contiene 5 mg.
de codeína, como lo afirma tal laboratorio farmacéutico.
b) Se hizo un estudio entre mecánicos automotrices para determinar si hay una
diferencia entre la proporción de caros de las marcas DATSUN y TOYOTA,
que necesitan reparación; ellos creen que hay una diferencia, aunque no están
seguros.
c) Una asociación internacional de acreditación estaba convencida de que los
grados otorgados por las universidad A eran distintos de los de la universidad
B, sin embargo, no estaba segura de en cuál universidad obtenían los
estudiantes un mejor grado.

Ejemplo 7.- La OPA (Oficina de Protección Ambiental) quiere probar la


afirmación hecha por un fabricante de automóviles de que su automóvil
compacto da al menos 110 Km. por galón de gasolina.
a) ¿Cuál hipótesis nula debe probar?
b) ¿Por qué prefirió su respuesta por sobre las otras dos posibilidades para
escoger la hipótesis alternativa?
c) Describa los errores tipo I y II asociados con su hipótesis nula y discuta las
posibles consecuencias de cometerlos.

Ejemplo 8.- Al evaluar solicitudes de crédito, un agente financiero se encuentra


con el problema de otorgar crédito a aquellos clientes que son un buen prospecto
y negarlo a aquellos que no lo son; estaría probando lo siguiente para cada
solicitante:
H0 : El solicitante es un buen prospecto
H1 : El solicitante es un mal prospecto
a) En términos de conceder o negar el préstamo:
¿Cómo se cometería el error tipo I?
¿Cómo se cometería el error tipo II?
b) Discutir la elección del nivel de significación  en los siguientes casos.
 Se tiene poco dinero para prestar, las tasas de interés son altas y se tiene
un gran número de solicitudes.
 Hay bastante dinero para ser prestado, las tasas de interés son moderadas
y existe competencia para conseguir solicitantes de crédito.

12
ESTADISTICA Y PROBABILIDAD II CARLOS PAREDES GUZMAN

Ejemplo 9.- La gerencia de personal de LA POSITIVA ha solicitado los servicios


de un sicólogo para que verifique si un ejecutivo se adecua emocionalmente para
asumir un cargo en la alta dirección de la empresa.
a) ¿Qué tipo de error cometería si rechaza equivocadamente la hipótesis nula de
que el ejecutivo sea ideal para el cargo?
b) ¿ Qué tipo de error cometería si acepta equivocadamente la hipótesis nula de
que el ejecutivo es ideal para el cargo?

Ejemplo 10.- Suponer que interesa probar la siguiente hipótesis nula:


H0: Fumar es peligroso para la salud.
En términos de la hipótesis nula, establezca con palabras lo que significa:
a) Un error tipo I
b) Un error tipo II
c) Una buena decisión
d) ¿Qué tipo de error es más serio?

Ejemplo 11.- Jacinto Urdanivia, gerente general de PUBLIEX está preocupado


por la efectividad de un anuncio en T.V. ¿Qué hipótesis nula está probando si
comete:
a) Un error tipo I cuando afirma erróneamente que el comercial es efectivo?
b) Un error tipo II cuando afirma erróneamente que el comercial es efectivo?

Ejemplo 12.- Para cada una de las hipótesis nulas siguientes establezca cuáles
acciones constituirían los errores tipo I y II
a) H0: El método de enseñanza activo de la estadística es al menos tan bueno
como el pasivo.
b) H0: Al menos 2% de las máquinas son defectuosas.

Ejemplo 13.- Para cada una de las hipótesis nulas siguientes establezca cuáles
acciones constituirían los errores tipo I y II.
a) H0: El nuevo proceso de producción es al menos tan bueno como el antiguo.
b) H0: El 90% de los doctores recomiendan la preparación A.

13
ESTADISTICA Y PROBABILIDAD II CARLOS PAREDES GUZMAN

Ejemplo 14.- Considere el siguiente caso como una prueba de hipótesis. Se


acaba de recibir un paracaídas sobre el cual un inspector postula la siguiente
hipótesis nula “este paracaídas funcionará”.
a) Establezca cuidadosamente los 4 posibles resultados al tomar la decisión.
b) Decida sobre la gravedad de los dos errores posibles
c) Si se pudiesen controlar estadísticamente  y , ¿qué conjunto de
probabilidades preferiría el usuario del paracaídas
1)  = 0.001 y  = 0.10 2)  = 0.05 y  = 0.05 3)  = 0.10 y  = 0.001

Ejemplo 15.- Su hipótesis nula es que la batería de un marcapasos tiene una vida
promedio de 300 días, con una hipótesis alternativa que la vida de la batería es
más de 300 días. Usted es supervisor de control de calidad de la fábrica que
produce estas baterías.
a) ¿Preferiría cometer un error de tipo I o de tipo II?
b) Basándose en la respuesta del inciso anterior, ¿debería elegir un nivel de
significación alto o bajo?

5.4. Errores tipo I y II


El procedimiento de prueba de hipótesis deja abierta la posibilidad de rechazar
una hipótesis nula verdadera (error tipo I) o de aceptar una hipótesis nula falsa
(error tipo II)

Cuando se prueba una hipótesis no se sabe si es verdadera o falsa y si, por lo


tanto, la distribución muestral se parece a la figura (a) o a la figura (b). Si se
supone la primera y se selecciona un valor  (probabilidad del error tipo I), se
deriva una regla de decisión, la misma que en forma automática determina el
valor de  (probabilidad del error tipo II) si H0 es falsa.

14
ESTADISTICA Y PROBABILIDAD II CARLOS PAREDES GUZMAN

(a) H0 es verdadera
 4
  0.05

4 4.82 X
0 1.64
Z

(b) H0 es falsa
  5.8
  0.025
4.82 5.8 X
-1.96 0 Z

Dado el tamaño muestral n, cualquier disminución en  aumentará  (a medida


que la línea vertical punteada se mueve a la derecha). También es cierto lo
opuesto; cualquier aumento en  disminuye  (a medida que la línea se mueve a
la izquierda).

Las probabilidades de error asociadas con una prueba de hipótesis se determinan


de manera sistemática, como se ve en la siguiente tabla. La primera columna
muestra valores seleccionados posibles de la media poblacional cuando la
hipótesis nula es falsa; los valores correspondientes  y 1- (potencia de la
prueba) se derivan en el resto de la tabla.

Dado el tamaño muestral n = 36, una probabilidad máxima de error tipo I


especificada  = 0.05, y una hipótesis nula indicada (H0:  = 4), diferentes
probabilidades de error tipo II () y, por lo tanto, diferentes valores de potencia
de la prueba (1-) se asocian con parámetros poblacionales distintos.

Valores posibles Probabilidad de Potencia de la


X c   H1
seleccionados de  H Z  error tipo II, prueba
1
 n
cuando H0 es falsa  1-
4.1 1.44 0.9251 0.0749
4.6 0.44 0.6700 0.3200
5.0 -0.36 0.3594 0.6406
5.4 -1.16 0.1230 0.8770
5.8 -1.96 0.0250 0.9750
6.2 -2.76 0.0029 0.9971

Donde: X c = 4.82,  = 3, n = 36
15
ESTADISTICA Y PROBABILIDAD II CARLOS PAREDES GUZMAN

INTERPRETACIÓN DE LOS VALORES 1-: Puesto que rechazar una hipótesis


nula cuando es falsa es exactamente lo que debe hacer una buena prueba, un
valor alto de 1- (cerca de 1.0) significa que la prueba trabaja bastante bien
(rechazar la hipótesis nula cuando es falsa); un valor bajo de 1- (cerca de 0.0)
significa que la prueba trabaja muy mal (no rechaza la hipótesis nula cuando es
falsa). Puesto que el valor 1- es la medida de qué tan bien trabaja la prueba, se
le conoce como la potencia de la prueba.

CURVA CARACTERÍSTICA DE OPERACIÓN (CURVA OC): Esta curva gráfica, para


todos los valores posibles de un parámetro poblacional que contradice la
hipótesis nula (  H ), la probabilidad , de aceptar erróneamente H0 (de cometer
1

un error tipo II), dado un tamaño muestral y un  máximo especificado.

La curva característica de operación para una prueba de hipótesis muestra la


probabilidad de aceptar una hipótesis nula falsa para cada valor posible del
parámetro poblacional verdadero (página 17).

CURVA DE POTENCIA: Esta curva gráfica, para todos los valores posibles de un
parámetro que contradice la hipótesis nulas (  H ), la probabilidad 1- de
1

rechazar correctamente H0, dado un tamaño muestral y un  máximo


especificado.

La curva de potencia muestra la probabilidad de rechazar una hipótesis nula


falsa para cada valor posible del parámetro poblacional verdadero (página 17).

TAMAÑO DE LA MUESTRA: Es importante observar que cuando aumenta el


tamaño de la muestra, las probabilidades de error  y  se pueden reducir al
mismo tiempo o reducir una de las dos sin elevar la otra.

El hecho de saber que cualquier combinación de  máximo y  máximo se


puede alcanzar en realidad, por ejemplo al seleccionar el  deseado y luego
ajustar el tamaño de la muestra para obtener el  deseado, permite muchas
opciones al usuario de una prueba de hipótesis.

En el caso de la prueba de hipótesis, suponiendo que se tiene una prueba de una


cola, se puede determinar el tamaño de la muestra necesario para un nivel de
significación  especificado, y una potencia de prueba (1-), deseada, de la
manera siguiente:

X c   H0 
 Si  =  H 0
Z 1 
 n
y X c   H0  Z 1
n
16
ESTADISTICA Y PROBABILIDAD II CARLOS PAREDES GUZMAN

X c   H1 
 Si  =  H 1
Z 
 n
y X c   H1  Z 
n

Debido a que el valor crítico de la media muestral es el mismo si la hipótesis


nula es verdadera o falsa, se igualan las dos ecuaciones:

   Z

 H0  Z 1   H1  Z   ( Z 1 )   H1   H0
n n n

    H0 n Z 1  Z 
 n
Z 1  Z  
 H1
n Z 1  Z 

  H1   H 0

 H1  H0 

n
 Z   Z  
n
  Z  Z   
 H1   H 0 

  H1   H 0 

Z  Z   
2
TAMAÑO MUESTRAL ÓPTIMO PARA
n  
PRUEBA DE UNA COLA
   H1   H0  

Para prueba de dos colas se utilizan la siguiente fórmula:

Z  Z   
2
TAMAÑO MUESTRAL ÓPTIMO PARA
n 2 
PRUEBA DE DOS COLAS
   H1   H0  

1.00

0.90
1.00
0.80
0.90

0.80 0.70

0.70 0.60

0.60 0.50

0.50
0.40
0.40
0.30
0.30
0.20
0.20
0.10
0.10
0.00
0.00 17
4.0 4.2 4.4 4.6 4.8 5.0 5.2 5.4 5.6 5.8 6.0 6.2 6.4
4.0 4.2 4.4 4.6 4.8 5.0 5.2 5.4 5.6 5.8 6.0 6.2 6.4
ESTADISTICA Y PROBABILIDAD II CARLOS PAREDES GUZMAN

Ejemplo 16.- Suponer que el tiempo promedio de duración de un disquete es 500


horas de uso continuo. Luego de introducir algunos cambios en la fabricación se
espera aumentar el tiempo de duración. Para comprobar este aumento se plantea
la H0: µ = 500 versus la H1: µ > 500 y se selecciona una muestra de 25
observaciones. Si  = 50 horas, ¿cuál es la probabilidad de cometer un error tipo
II cuando el verdadero promedio es 520 horas? Asumir  = 0.05.

H0:  = 500 horas


H1:  > 500 horas  Prueba de Hipótesis de una cola (derecha)
 Si  =  H = 500 horas,
0  = 0.05  Z1- = 1.6449
X c   H0  50
Z 1   X c   H0  Z 1  500  1.6449   516.449
 n n 25

X c   H1 516.449  520
 Si  =  H = 520 horas,
1  Z 
 n

50 25
 0.3551

  P( Error tipo II )  P( X c  516.45 /   520 )  P( Z  Z   0.3551 /   520 )

 = 0.3613 
Además, la Potencia de la prueba = 1  = 1  0.3613 = 0.6387

Ejemplo 17.- Un fabricante de pintura desea probar la hipótesis de que su


pintura tiene un tiempo máximo de secado de cuatro horas. El fabricante
especifica que el  máximo tolerable es de 0.05 y el  máximo tolerable es
0.025 si su pintura tiene en efecto un tiempo de secado de 5.8 horas. Dadas estas
instrucciones, ¿cuál es el tamaño muestral óptimo?. Suponer que  = 3 horas.

H0:   4 horas
H1:  > 4 horas  Prueba de Hipótesis de una cola (derecha)

 Si  =  H = 4 horas,
0  = 0.05  Z = 1.6449
 Si  =  H = 5.8 horas,
1  = 0.025  Z = 1.96

  Z  Z      ( 1.6449  1.96 )  3 
2 2

n      36.09 = 37
   H1   H0    ( 5.8  4 ) 

El tamaño muestral necesario para lograr  y  máximas especificadas es n = 37

18
ESTADISTICA Y PROBABILIDAD II CARLOS PAREDES GUZMAN

Ejemplo 18.- El gerente de producción de una planta de envasado de cereal


desea determinar si el proceso de llenado de las cajas de cereal se encuentra bajo
control o no, es decir, si el contenido promedio por caja, en todo el proceso de
llenado seguía siendo de 368 gramos como está especificado o si había que
efectuar acciones correctivas.

Toma una muestra aleatoria de 25 cajas que arrojaron una media muestral X de
372.5 gramos y asume que la desviación estándar de la población es  = 15
gramos.

El proceso de llenado está sujeto a una inspección periódica por parte de un


representante de la Oficina de Defensa del Consumidor, que solamente se
preocupa de posibles cajas con menos contenido del especificado.

Asimismo el representante de la Oficina de Defensa del Consumidor desea tener


una probabilidad de 80% (potencia) de rechazar la afirmación de la compañía de
que la cantidad promedio de cereal por caja es de 368 gramos (H0), cuando la
media de la población es en realidad igual a 360 gramos, está dispuesto a correr
un riesgo de 5% de cometer un error tipo I, y acepta la afirmación de la
compañía de que  = 15 gramos.

¿Estará de acuerdo con el tamaño de la muestra seleccionada por el gerente de


producción?

H0:  = 368 gramos


H1:  < 368 gramos  Prueba de Hipótesis de una cola (izquierda)

Si  =  H = 368 gramos,
0  = 0.05  Z = 1.6449
Si  =  H = 360 gramos,
1 1 = 0.80   = 0.20  Z = 0.8416

  Z  Z      ( 1.6449  0.8416 )  15 
2 2

n      21.74 = 22
   H1   H0    ( 360  368 ) 

El representante de la Oficina de Defensa del Consumidor estará de acuerdo con


el tamaño de la muestra n = 25 seleccionada por el gerente de producción de la
empresa envasadora de cereal, ya que es mayor que el tamaño de muestra
necesario para lograr  y  máximos especificados.

19
ESTADISTICA Y PROBABILIDAD II CARLOS PAREDES GUZMAN

Ejemplo 19.- Un auditor desea probar la hipótesis nula de que el valor promedio
de todas las cuentas por cobrar es $260,000. Considera que una discrepancia de
$20,000 en cualquier dirección con respecto a este valor hipotético sería
importante. Se sabe que la desviación estándar de los montos de las cuentas por
cobrar es de  = $43,000. Los niveles aceptables de los errores tipo I ( ) y tipo
II () son 0.05 y 0.10, respectivamente. ¿Cuál es el tamaño mínimo de la
muestra que debe analizarse?

H0:  = $260,000
H1:   $260,000  Prueba de Hipótesis de dos colas

 Si  =  H = $260,000,
0  = 0.05  Z 2 = 1.96
 Si  =  H = $260,000 + 20,000 = $280,000,
1  = 0.10  Z = 1.2816
 Si  =  H = $260,000  20,000 = $240,000,
1  = 0.10  Z = 1.2816

  Z 2  Z        1.96  1.2816   43,000  2


2

n    48.57 = 49
   H1   H0    280 ,000  260 ,000 

El tamaño muestral mínimo para lograr  y  aceptables es igual a 49 cuentas.

5.5. P-value (Valor p)


Un procedimiento alternativo para decidir la validez de una hipótesis nula H0
involucra el concepto de p-value. Cuando para analizar datos estadísticos se usa
un programa computacional, tal como Minitab o SPSS, es común que los
resultados proporcionados contengan p-values.

El p-value se define como la probabilidad de obtener un valor mayor que el


observado cuando la Ho es verdadera

El p-value asociado con un estadístico de prueba, es el mínimo nivel de


significación que da lugar a rechazar H0.

Entonces, para una prueba de cola derecha, el p-value es la probabilidad de que


el estadístico de prueba sea a lo más tan grande como el valor calculado de la
muestra cuando H0 es verdadera.

Para una prueba de cola izquierda, el p-value corresponde a la probabilidad de


que el estadístico sea a lo más tan grande como el valor calculado de la muestra
cuando H0 es verdadera.

20
ESTADISTICA Y PROBABILIDAD II CARLOS PAREDES GUZMAN

Y para una prueba de dos colas, el p-value es la probabilidad de obtener un


resultado muestral que caiga en la cola cuyo extremo sea el estadístico obtenido
suponiendo verdadera H0.

Si el nivel de significación  de una prueba es mayor que el p-value reportado,


entonces H0 se rechaza.

Por tanto, la regla siguiente se puede usar para decidir si se acepta o rechaza la
hipótesis nula:

Aceptar H0 si el p-value > 


Rechazar H0 si el p-value  

El p-value proporciona una indicación de qué tan fuertemente difieren de H0 los


datos. Si se rechaza la Ho, el estadístico de prueba (y los datos) es denominado
significante. Por lo tanto, el valor del p-value se considera como el nivel de
significación  más pequeño para el que los datos son significativos.

Considerar las figuras siguientes; en cada caso el p-value se indica:

Prueba de cola izquierda Prueba de cola derecha Prueba de dos colas


p-value

p-value p-value

Z Z Z
Z 0 0 Z Z 0 Z
estadístico de prueba estadístico de prueba estadísticos de prueba

Aceptar H0 si p-value Rechazar H0 si p-value


El p-value es utilizado para reportar o notificar el resultado de una prueba de
hipótesis. En la actualidad es poco usado el nivel de significación  para
reportar un resultado, debido a que impone a otros usuarios el nivel de
significación predeterminado. Otros investigadores pueden sentirse insatisfechos
con el  utilizado. Esto ha motivado que el p-value sea usado en forma casi
generalizada.

21

También podría gustarte