Práctica 8a Contraste de Hipótesis

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 7

Práctica 8 CONTRASTES DE HIPÓTESIS

Objetivos
1. Realizar contrastes de hipótesis paramétricos para la media de una población normal.
2. Realizar contrastes de hipótesis paramétricos para comparar dos medias de variables
normales en muestras independientes y en muestras apareadas.
3. Realizar contrastes de hipótesis para comparar dos proporciones.
4. Realizar contrastes de hipótesis no-paramétricos de independencia para variables
cualitativas.
5. Realizar contrastes de hipótesis no-paramétricos de bondad de ajuste de distribuciones.
6. Realizar contrastes de hipótesis no-paramétricos de aleatoriedad.
7. Realizar contrastes de hipótesis no-paramétricos de dos muestras independientes y de
dos muestras relacionadas.
Conceptos básicos
Contraste de hipótesis.
Un contraste de hipótesis es un proceso estadístico mediante el cual se investiga si una
propiedad que se supone que cumple una población es compatible con lo observado en
una muestra de dicha población. Es un procedimiento que permite elegir una hipótesis de
trabajo de entre dos posibles y antagónicas.
Hipótesis Estadística.
Todo contraste de hipótesis se basa en la formulación de dos hipótesis exhaustivas y
mutuamente exclusivas:
1. Hipótesis nula (H0)
2. Hipótesis alternativa (H1)
La hipótesis H0 es la que se desea contrastar. Consiste generalmente en una afirmación
concreta sobre la forma de una distribución de probabilidad o sobre el valor de alguno de
los parámetros de esa distribución. El nombre de “nula” significa “sin valor, efecto o
consecuencia”, lo cual sugiere que H0 debe identificarse con la hipótesis de no cambio (a
partir de la opinión actual); no diferencia, no mejora, etc. H0 representa la hipótesis que
mantendremos a no ser que los datos indiquen su falsedad, y puede entenderse, por tanto,
en el sentido de “neutra”. La hipótesis H0 nunca se considera comprobada, aunque
puede ser rechazada por los datos. Por ejemplo, la hipótesis de que dos poblaciones tienen
la misma media puede ser rechazada fácilmente cuando ambas difieren mucho,
analizando muestras suficientemente grandes de ambas poblaciones, pero no puede ser
“demostrada” mediante muestreo, puesto que siempre cabe la posibilidad de que las
medias difieran en una cantidad lo suficientemente pequeña para que no pueda ser
detectada, aunque la muestra sea muy grande. Dado que descartaremos o no la hipótesis
nula a partir de muestras obtenidas (es decir, no dispondremos de información completa
sobre la población), no será posible garantizar que la decisión tomada sea la correcta.
La hipótesis H1 es la negación de la nula. Incluye todo lo que H0 excluye.
¿Qué asignamos como H0 y H1?
La hipótesis H0 asigna un valor específico al parámetro en cuestión y por lo tanto “el
igual” siempre forma parte de H0. La idea básica del contraste de hipótesis es que los
hechos tengan probabilidad de rechazar H0. La hipótesis H0 es la afirmación que podría
ser rechazada por los hechos. El interés del investigador se centra, por lo tanto, en la
hipótesis alternativa H1.
Regla de decisión.
Es el criterio que vamos a utilizar para decidir si la hipótesis nula planteada debe
mantenerse o ser rechazada. Este criterio se basa en la partición de la distribución muestral
del estadístico de contraste en dos regiones mutuamente excluyentes: Región crítica o de
rechazo y Región de mantenimiento.
Región de mantenimiento.
Es el área de la distribución muestral que corresponde a los valores del estadístico de
contraste próximos a la afirmación establecida en H0. Es decir, los valores del estadístico
de contraste que nos conducen a decidir H0. Es, por tanto, el área correspondiente a los
valores del estadístico de contraste que es probable que ocurran si H0 es verdadera. Su
probabilidad se denomina nivel de confianza y se representa por 1– α.
Región crítica.
Es el área de distribución muestral que corresponde a los valores del estadístico de
contraste que se encuentran tan alejados de la afirmación establecida en H0, que es muy
poco probable que ocurran si H0 es verdadera. Su probabilidad se denomina nivel de
significación y se representa con la letra α.
Ya definidas las dos zonas, la regla de decisión consiste en rechazar H0 si el pivote
(estadístico de contraste) toma un valor perteneciente a la zona de rechazo, o mantener
H0 si el estadístico de contraste toma un valor perteneciente a la zona de mantenimiento.
El tamaño de estas zonas se determina fijando el valor de α, es decir, fijando el nivel de
significación con el que se desea trabajar. Se suele tomar un 1% o un 5%.
La forma de dividir la distribución muestral en zona de rechazo y de mantenimiento
depende de si el contraste es bilateral o unilateral. La zona crítica debe situarse donde
puedan aparecer los valores muestrales incompatibles con H0.
Pivote (Estadístico de contraste).
Un pivote es un resultado muestral que cumple la doble condición de:
• Proporcionar información empírica relevante sobre la afirmación propuesta en la
H0.
• Poseer una distribución muestral conocida.
Tipos de contrastes.
Contrastes paramétricos.
Conocida una variable aleatoria con una determinada distribución, se establecen
afirmaciones sobre los parámetros de dicha distribución.
Contrastes no paramétricos.
Las afirmaciones establecidas no se hacen en base a la distribución de las observaciones,
que a priori es desconocida.
Regla de decisión.
1. Contraste bilateral: Si la hipótesis alternativa da lugar a una región crítica “a
ambos lados” del valor del parámetro, diremos que el test es bilateral o de dos
colas. Se rechaza H0 si el estadístico de contraste cae en la zona crítica, es decir,
si el pivote toma un valor tan grande o tan pequeño que la probabilidad de

obtener un valor tan extremo o más que el encontrado es menor que 𝟐.
2. Contraste unilateral: Si la hipótesis alternativa da lugar a una región crítica “a
un solo lado del valor del parámetro”, diremos que el test es unilateral o de una
sola cola Se rechaza H0 si el estadístico de contraste cae en la zona crítica, es
decir, si toma un valor tan grande que la probabilidad de obtener un valor como
ese o mayor es menor que α.

La decisión:
Planteada la hipótesis, formulados los supuestos, definido el estadístico de contraste y su
distribución muestral, y establecida la regla de decisión, el paso siguiente es obtener una
muestra aleatoria de tamaño n, calcular el estadístico de contraste y tomar una decisión:
• Si es estadístico de contraste cae en la zona crítica se rechaza H0.
• Si es estadístico cae en la zona de no rechazo se mantiene H0.
Si rechazamos H0 afirmamos que la hipótesis nula es falsa, es decir, que afirmamos con
una probabilidad α de equivocarnos, que hemos conseguido probar que esa hipótesis es
falsa. Por el contrario, si se la mantiene, no estamos afirmando que la hipótesis sea
verdadera. Simplemente que no tenemos evidencia empírica suficiente para rechazarla y
que se considera compatible con los datos.
Como conclusión, si se mantiene o no H0, nunca se puede afirmar que es verdadera.
Errores de Tipo I y II.
Error de tipo I
Se comete cuando se decide rechazar la hipótesis nula H0 que en realidad es verdadera.
La probabilidad de cometer ese error es α.
P[ Rechazar H0 / H0 es verdadera ] = α.
Error de tipo II
Se comete cuando se decide mantener la hipótesis nula H0 que en realidad es falsa. La
probabilidad de cometer ese error es β.
P[ Mantener H0 / H0 es falsa ] = β
Por tanto,
• 1–α es la probabilidad de tomar una decisión correcta cuando H0 es verdadera.
• 1–β es la probabilidad de tomar una decisión correcta cuando H0 es falsa.
El siguiente cuadro resume las ideas:
La dificultad al usar un procedimiento basado en datos muestrales es que debido a la
variabilidad de muestreo, puede resultar una muestra no representativa, y por tanto,
resultaría un rechazo erróneo de H0.
La probabilidad de cometer un error de tipo I con nuestra decisión es una probabilidad
conocida, pues el valor de α lo fija el propio investigador.
Sin embargo, la probabilidad de cometer un error de tipo II, β , es un valor desconocido
que depende de tres factores:
• La hipótesis H1 que consideremos verdadera.
• El valor de α.
• El tamaño del error típico (desviación típica) de la distribución muestral utilizada
para efectuar el contraste.

Relaciones entre los errores de Tipo I y II.


El estudio de las relaciones entre los errores lo realizamos mediante el contraste de
hipótesis:
H0 :  = 0
{
H1 :  = 1
Para ello utilizamos la información muestral proporcionada por el estadístico media
muestral ̅X.
• Cualquier valor atribuido a 1 en H1 (siempre mayor a 0 ) generará
distribuciones muestrales distintas para la media muestral. Aunque todas tendrán
la misma forma, unas estarán más alejadas que otras de la curva de H0, es decir,
unas serán distintas de otras únicamente en el valor asignado a 1 .
Cuanto más se aleje el valor 1 de 0 , más hacia la derecha se desplazará la
curva H1, y en consecuencia, más pequeña se hará el área β. Por lo tanto, el valor
de β depende del valor concreto de 1 que consideremos verdadero dentro de
todos los afirmados por H1.
• Cuanto mayor es α, menor es β. Se relacionan de forma inversa.
• Para una distancia dada entre 0 y 1 , el solapamiento entre las curvas
correspondientes a uno y otro parámetro será tanto mayor cuanto mayor sea el
error típico de la distribución muestral representada por esas curvas (cuanto
mayor es el error típico de una distribución, más ancha es esa distribución). Y
cuanto mayor sea el solapamiento, mayor será el valor de β.
Relaciones entre los errores de tipo I y tipo II
En lugar de buscar procedimientos libres de error, debemos buscar procedimientos para
los que no sea probable que ocurran ningún tipo de estos errores. Esto es, un buen
procedimiento es aquel para el que es pequeña la probabilidad de cometer cualquier tipo
de error. La elección de un valor particular de corte de la región de rechazo fija las
probabilidades de errores tipo I y tipo II.
Debido a que H0 especifica un valor único del parámetro, hay un solo valor de α. Sin
embargo, hay un valor diferente de β por cada valor del parámetro recogido en H 1. En
general, un buen contraste o buena regla de decisión debe tender a minimizar los dos tipos
de error inherentes a toda decisión. Como α queda fijado por el investigador, trataremos
de elegir una región donde la probabilidad de cometer el error de tipo II sea la menor.
Usualmente, se diseñan los contrastes de tal manera que la probabilidad a sea el 5%
(0,05), aunque a veces se usan el 10% (0,1) o 1% (0,01) para adoptar condiciones más
relajadas o más estrictas.
Potencia de un contraste.
Es la probabilidad de decidir H1 cuando ésta es cierta:
P[decidir H1 / H1 es verdadera ] = 1 – β
El concepto de potencia se utiliza para medir la bondad de un contraste de hipótesis.
Cuanto más lejana se encuentra la hipótesis H1 de H0 menor es la probabilidad de incurrir
en un error tipo II y, por consiguiente, la potencia tomará valores más próximos a 1. Si la
potencia en un contraste es siempre muy próxima a 1 entonces se dice que el estadístico
de contraste es muy potente para contrastar H0 ya que en ese caso las muestras serán, con
alta probabilidad, incompatibles con H0 cuando H1 sea cierta.
Por tanto, puede interpretarse la potencia de un contraste como su sensibilidad o
capacidad para detectar una hipótesis alternativa. La potencia de un contraste cuantifica
la capacidad del criterio utilizado para rechazar H0 cuando esta hipótesis sea falsa.
Es deseable en un contraste de hipótesis que las probabilidades de ambos tipos de error
fueran tan pequeñas como fuera posible. Sin embargo, con una muestra de tamaño
prefijado, disminuir la probabilidad del error de tipo I, α, conduce a incrementar la
probabilidad del error de tipo II, β. El recurso para aumentar la potencia del contraste,
esto es, disminuir la probabilidad de error de tipo II, es aumentar el tamaño muestral lo
que en la práctica conlleva un incremento de los costes del estudio que se quiere realizar.
El concepto de potencia nos permite valorar cual entre dos contrastes con la misma
probabilidad de error de tipo I, α, es preferible. Se trata de escoger entre todos los
contrastes posibles con α prefijado aquel que tiene mayor potencia, esto es, menor
probabilidad β de incurrir en el error de tipo II. En este caso el Lema de Neyman-Pearson
garantiza la existencia de un contraste de máxima potencia y determina cómo construirlo.
Contrastes de hipótesis paramétricos.
El propósito de los contrastes de hipótesis es determinar si un valor propuesto (hipotético)
para un parámetro u otra característica de la población debe aceptarse como plausible con
base en la evidencia muestral.
Podemos considerar las siguientes etapas en la realización de un contraste:
1. El investigador formula una hipótesis sobre un parámetro poblacional, por
ejemplo, que toma un determinado valor.
2. Selecciona una muestra de la población.
3. Comprueba si los datos están o no de acuerdo con la hipótesis planteada, es decir,
compara la observación con la teoría
• Si lo observado es incompatible con lo teórico entonces el investigador puede
rechazar la hipótesis planteada y proponer una nueva teoría.
• Si lo observado es compatible con lo teórico entonces el investigador puede
continuar como si la hipótesis fuera cierta.
Los contrastes de hipótesis que construye SPSS son los proporcionados por las Pruebas
T, estas son de tres tipos: Prueba T para una muestra, Prueba T para muestras
independientes y Prueba T para muestras relacionadas.
Contrastes de hipótesis para la media de una población normal
El objetivo es probar uno de los siguientes contrastes de hipótesis con respecto de μ
H0 :  = 0 H0 :  = 0 H0 :  = 0
{ o{ o{
H1 :  = 1 H1 :  > 1 H1 :  < 1
donde 0 es un valor conocido dado de antemano. Para ello se toma una m.a.s. concreta
1
x1 , x2 , ⋯ , xn cuya media valdrá 𝑥̅ = 𝑛 ∑𝑛𝑖=1 xi .
Se distinguen dos situaciones:
a. Varianza poblacional conocida y,
b. varianza poblacional desconocida.
El programa SPSS sólo resuelve el segundo caso. En el caso de varianza poblacional
desconocida, el estadístico de contraste que se utiliza sigue una distribución t Student y,
bajo la hipótesis nula H0 :  = 0 dicho pivote tiene la siguiente expresión
̅− |
|X 0
~St n−1

̂
√n − 1
Fijado un nivel de significación α
a. Para la hipótesis alternativa H1 :  ≠ 0 la correspondiente región de
mantenimiento es (−t1−,n−1 , t1−,n−1 ) y el pivote adopta la forma
2 2
̅− |
|X ̅− |
|X
0 0
c= =

̂ S
√n − 1 √n
Se utiliza la siguiente regla de decisión
H0 :  = 0 Si c < t1−,n−1 (se mantiene H0 )
2
H1 :  = 1 Si c ≥ t1−,n−1 (se rechaza H0 )
2
b. Para la hipótesis alternativa H1 :  > 0 la correspondiente región de
mantenimiento es (−∞, t1−,n−1 ) y el estadístico de contraste adopta la forma
̅− |
|X ̅− |
|X
0 0
c= =

̂ S
√n − 1 √n
Se utiliza la siguiente regla de decisión
H0 :  = 0 Si c < t1−,n−1 (se mantiene H0 )
H1 :  = 1 Si c ≥ t1−,n−1 (se rechaza H0 )
c. Para la hipótesis alternativa H1 :  < 0 la correspondiente región de
mantenimiento es (−t1−,n−1 , +∞) y el estadístico de contraste adopta la forma
̅− |
|X ̅− |
|X
0 0
c= =

̂ S
√n − 1 √n
Se utiliza la siguiente regla de decisión
H0 :  = 0 Si c > − t1−,n−1 (se mantiene H0 )
H1 :  = 1 Si c ≤ − t1−,n−1 (se rechaza H0 )
El procedimiento que utiliza SPSS es la Prueba T para una muestra que contrasta si la
media de una población difiere de una constante especificada. Para obtener una Prueba T
para una muestra se elige, en el menú principal,
Analizar/Comparar medias/Prueba T para una muestra…
En la salida correspondiente se selecciona una o más variables cuantitativas para
contrastarlas con el mismo valor supuesto. Por ejemplo, en la siguiente salida se muestra
un contraste para el caso en que la media de la variable longitud sea igual a 20 (Valor de
prueba: 20)
Pulsando Opciones… se puede elegir el nivel de confianza.
Se pulsa Continuar y Aceptar. Se obtiene un resumen estadístico para la muestra y la
salida del procedimiento.

Esta salida muestra los resultados del contraste de la t de Student con un intervalo de
confianza para la diferencia entre el valor observado y el valor teórico (contrastado). Cada
una de las columnas de la tabla muestra:
• t = 8.878: El valor experimental del estadístico de contraste
• gl = 14: Los grados de libertad
• Sig.= 0,000: El p-valor o nivel crítico del contraste
• Diferencia de medias = 9.31267: Es la diferencia entre la media teórica (20) y la media
observada (29.3127)
• 95% Intervalo de confianza: (7.063, 11.5624): Es el intervalo de confianza para la
diferencia entre la media teórica y la media observada al nivel de confianza del 95%.
Ejercicio 1
Se realiza un experimento para estudiar el nivel (en minutos) que se requiere para que la
temperatura del cuerpo de un lagarto del desierto alcance los 45º partiendo de la
temperatura normal de su cuerpo mientras está en la sombra. Se obtuvieron las siguientes
observaciones:
10.1 12.5 12.2 10.2 12.8 12.1 11.2 11.4 10.7 14.9 13.9 13.3
Se pide:
a. Hallar estimaciones puntuales de la media y la varianza
b. Supóngase que la variable X: “Tiempo en alcanzar los 45º sigue una ley Normal
b1. ¿Puede concluirse que el tiempo medio requerido para alcanzar la dosis letal
es de 15 minutos?
b2. ¿Puede concluirse que el tiempo medio requerido para alcanzar la dosis letal
es inferior a 13 minutos?

También podría gustarte