Práctica 8a Contraste de Hipótesis
Práctica 8a Contraste de Hipótesis
Práctica 8a Contraste de Hipótesis
Objetivos
1. Realizar contrastes de hipótesis paramétricos para la media de una población normal.
2. Realizar contrastes de hipótesis paramétricos para comparar dos medias de variables
normales en muestras independientes y en muestras apareadas.
3. Realizar contrastes de hipótesis para comparar dos proporciones.
4. Realizar contrastes de hipótesis no-paramétricos de independencia para variables
cualitativas.
5. Realizar contrastes de hipótesis no-paramétricos de bondad de ajuste de distribuciones.
6. Realizar contrastes de hipótesis no-paramétricos de aleatoriedad.
7. Realizar contrastes de hipótesis no-paramétricos de dos muestras independientes y de
dos muestras relacionadas.
Conceptos básicos
Contraste de hipótesis.
Un contraste de hipótesis es un proceso estadístico mediante el cual se investiga si una
propiedad que se supone que cumple una población es compatible con lo observado en
una muestra de dicha población. Es un procedimiento que permite elegir una hipótesis de
trabajo de entre dos posibles y antagónicas.
Hipótesis Estadística.
Todo contraste de hipótesis se basa en la formulación de dos hipótesis exhaustivas y
mutuamente exclusivas:
1. Hipótesis nula (H0)
2. Hipótesis alternativa (H1)
La hipótesis H0 es la que se desea contrastar. Consiste generalmente en una afirmación
concreta sobre la forma de una distribución de probabilidad o sobre el valor de alguno de
los parámetros de esa distribución. El nombre de “nula” significa “sin valor, efecto o
consecuencia”, lo cual sugiere que H0 debe identificarse con la hipótesis de no cambio (a
partir de la opinión actual); no diferencia, no mejora, etc. H0 representa la hipótesis que
mantendremos a no ser que los datos indiquen su falsedad, y puede entenderse, por tanto,
en el sentido de “neutra”. La hipótesis H0 nunca se considera comprobada, aunque
puede ser rechazada por los datos. Por ejemplo, la hipótesis de que dos poblaciones tienen
la misma media puede ser rechazada fácilmente cuando ambas difieren mucho,
analizando muestras suficientemente grandes de ambas poblaciones, pero no puede ser
“demostrada” mediante muestreo, puesto que siempre cabe la posibilidad de que las
medias difieran en una cantidad lo suficientemente pequeña para que no pueda ser
detectada, aunque la muestra sea muy grande. Dado que descartaremos o no la hipótesis
nula a partir de muestras obtenidas (es decir, no dispondremos de información completa
sobre la población), no será posible garantizar que la decisión tomada sea la correcta.
La hipótesis H1 es la negación de la nula. Incluye todo lo que H0 excluye.
¿Qué asignamos como H0 y H1?
La hipótesis H0 asigna un valor específico al parámetro en cuestión y por lo tanto “el
igual” siempre forma parte de H0. La idea básica del contraste de hipótesis es que los
hechos tengan probabilidad de rechazar H0. La hipótesis H0 es la afirmación que podría
ser rechazada por los hechos. El interés del investigador se centra, por lo tanto, en la
hipótesis alternativa H1.
Regla de decisión.
Es el criterio que vamos a utilizar para decidir si la hipótesis nula planteada debe
mantenerse o ser rechazada. Este criterio se basa en la partición de la distribución muestral
del estadístico de contraste en dos regiones mutuamente excluyentes: Región crítica o de
rechazo y Región de mantenimiento.
Región de mantenimiento.
Es el área de la distribución muestral que corresponde a los valores del estadístico de
contraste próximos a la afirmación establecida en H0. Es decir, los valores del estadístico
de contraste que nos conducen a decidir H0. Es, por tanto, el área correspondiente a los
valores del estadístico de contraste que es probable que ocurran si H0 es verdadera. Su
probabilidad se denomina nivel de confianza y se representa por 1– α.
Región crítica.
Es el área de distribución muestral que corresponde a los valores del estadístico de
contraste que se encuentran tan alejados de la afirmación establecida en H0, que es muy
poco probable que ocurran si H0 es verdadera. Su probabilidad se denomina nivel de
significación y se representa con la letra α.
Ya definidas las dos zonas, la regla de decisión consiste en rechazar H0 si el pivote
(estadístico de contraste) toma un valor perteneciente a la zona de rechazo, o mantener
H0 si el estadístico de contraste toma un valor perteneciente a la zona de mantenimiento.
El tamaño de estas zonas se determina fijando el valor de α, es decir, fijando el nivel de
significación con el que se desea trabajar. Se suele tomar un 1% o un 5%.
La forma de dividir la distribución muestral en zona de rechazo y de mantenimiento
depende de si el contraste es bilateral o unilateral. La zona crítica debe situarse donde
puedan aparecer los valores muestrales incompatibles con H0.
Pivote (Estadístico de contraste).
Un pivote es un resultado muestral que cumple la doble condición de:
• Proporcionar información empírica relevante sobre la afirmación propuesta en la
H0.
• Poseer una distribución muestral conocida.
Tipos de contrastes.
Contrastes paramétricos.
Conocida una variable aleatoria con una determinada distribución, se establecen
afirmaciones sobre los parámetros de dicha distribución.
Contrastes no paramétricos.
Las afirmaciones establecidas no se hacen en base a la distribución de las observaciones,
que a priori es desconocida.
Regla de decisión.
1. Contraste bilateral: Si la hipótesis alternativa da lugar a una región crítica “a
ambos lados” del valor del parámetro, diremos que el test es bilateral o de dos
colas. Se rechaza H0 si el estadístico de contraste cae en la zona crítica, es decir,
si el pivote toma un valor tan grande o tan pequeño que la probabilidad de
obtener un valor tan extremo o más que el encontrado es menor que 𝟐.
2. Contraste unilateral: Si la hipótesis alternativa da lugar a una región crítica “a
un solo lado del valor del parámetro”, diremos que el test es unilateral o de una
sola cola Se rechaza H0 si el estadístico de contraste cae en la zona crítica, es
decir, si toma un valor tan grande que la probabilidad de obtener un valor como
ese o mayor es menor que α.
La decisión:
Planteada la hipótesis, formulados los supuestos, definido el estadístico de contraste y su
distribución muestral, y establecida la regla de decisión, el paso siguiente es obtener una
muestra aleatoria de tamaño n, calcular el estadístico de contraste y tomar una decisión:
• Si es estadístico de contraste cae en la zona crítica se rechaza H0.
• Si es estadístico cae en la zona de no rechazo se mantiene H0.
Si rechazamos H0 afirmamos que la hipótesis nula es falsa, es decir, que afirmamos con
una probabilidad α de equivocarnos, que hemos conseguido probar que esa hipótesis es
falsa. Por el contrario, si se la mantiene, no estamos afirmando que la hipótesis sea
verdadera. Simplemente que no tenemos evidencia empírica suficiente para rechazarla y
que se considera compatible con los datos.
Como conclusión, si se mantiene o no H0, nunca se puede afirmar que es verdadera.
Errores de Tipo I y II.
Error de tipo I
Se comete cuando se decide rechazar la hipótesis nula H0 que en realidad es verdadera.
La probabilidad de cometer ese error es α.
P[ Rechazar H0 / H0 es verdadera ] = α.
Error de tipo II
Se comete cuando se decide mantener la hipótesis nula H0 que en realidad es falsa. La
probabilidad de cometer ese error es β.
P[ Mantener H0 / H0 es falsa ] = β
Por tanto,
• 1–α es la probabilidad de tomar una decisión correcta cuando H0 es verdadera.
• 1–β es la probabilidad de tomar una decisión correcta cuando H0 es falsa.
El siguiente cuadro resume las ideas:
La dificultad al usar un procedimiento basado en datos muestrales es que debido a la
variabilidad de muestreo, puede resultar una muestra no representativa, y por tanto,
resultaría un rechazo erróneo de H0.
La probabilidad de cometer un error de tipo I con nuestra decisión es una probabilidad
conocida, pues el valor de α lo fija el propio investigador.
Sin embargo, la probabilidad de cometer un error de tipo II, β , es un valor desconocido
que depende de tres factores:
• La hipótesis H1 que consideremos verdadera.
• El valor de α.
• El tamaño del error típico (desviación típica) de la distribución muestral utilizada
para efectuar el contraste.
Esta salida muestra los resultados del contraste de la t de Student con un intervalo de
confianza para la diferencia entre el valor observado y el valor teórico (contrastado). Cada
una de las columnas de la tabla muestra:
• t = 8.878: El valor experimental del estadístico de contraste
• gl = 14: Los grados de libertad
• Sig.= 0,000: El p-valor o nivel crítico del contraste
• Diferencia de medias = 9.31267: Es la diferencia entre la media teórica (20) y la media
observada (29.3127)
• 95% Intervalo de confianza: (7.063, 11.5624): Es el intervalo de confianza para la
diferencia entre la media teórica y la media observada al nivel de confianza del 95%.
Ejercicio 1
Se realiza un experimento para estudiar el nivel (en minutos) que se requiere para que la
temperatura del cuerpo de un lagarto del desierto alcance los 45º partiendo de la
temperatura normal de su cuerpo mientras está en la sombra. Se obtuvieron las siguientes
observaciones:
10.1 12.5 12.2 10.2 12.8 12.1 11.2 11.4 10.7 14.9 13.9 13.3
Se pide:
a. Hallar estimaciones puntuales de la media y la varianza
b. Supóngase que la variable X: “Tiempo en alcanzar los 45º sigue una ley Normal
b1. ¿Puede concluirse que el tiempo medio requerido para alcanzar la dosis letal
es de 15 minutos?
b2. ¿Puede concluirse que el tiempo medio requerido para alcanzar la dosis letal
es inferior a 13 minutos?