Contrastes de Hipotesis

Descargar como doc, pdf o txt
Descargar como doc, pdf o txt
Está en la página 1de 11

Contrastes de hipótesis

Tema 8.- CONTRASTES DE HIPOTESIS

Introducción.
Los contrastes de hipótesis o, también denominados tests de hipótesis, aparecen
muy relacionados con los intervalos de confianza. Pero mientras estos se usan para
estimar parámetros poblacionales, los tests de hipótesis se utilizan para tomar decisiones
sobre diversas características poblacionales.

La teoría de los contrastes de hipótesis fue introducida por Fisher y desarrollada


por Neyman y Pearson a mediados del siglo XX, de tal forma que está
considerablemente extendida y desarrollada en nuestros días.

Una hipótesis estadística es cualquier afirmación, que se trata de contrastar como


verdadera o falsa, sobre alguna característica de la población.

Una hipótesis estadística es paramétrica cuando se refiere a un valor de un


parámetro poblacional. Por ejemplo afirmar que en una determinada población de
Poisson, el valor del parámetro  es 3.

Una hipótesis estadística es no paramétrica cuando se refiere a una característica


no paramétrica de la población. Por ejemplo: decir que la distribución es normal.

Las aplicaciones de los contrastes de hipótesis son muy variadas. Preferencias de


programas en televisión. Niveles de audiencia. Efectos de nuevos medicamentos.
Valoración de la calidad, entre otras muchas.

Contrastes paramétricos. Planteamiento general.

Se parte de una variable aleatoria poblacional cuya función de probabilidad o de


densidad f(x,) depende de un parámetro desconocido , que toma valores en un cierto
conjunto , llamado espacio paramétrico, con al menos dos valores distintos.

Se formula una hipótesis sobre el parámetro. Por ejemplo:  = 0 y con la ayuda


de una muestra aleatoria simple obtenemos un estimador puntual θ̂ (X1, X2, …,Xn) que
se utiliza para inferir si la hipótesis formulada se acepta o no, con un cierto nivel de
confianza.

Tipos de hipótesis
Como nos vamos a referir a contrastes paramétricos, las hipótesis que se van a
formular son de tipo paramétrico, es decir, afirmaciones verdaderas o falsas sobre el
valor del parámetro  desconocido.

a) hipótesis simples e hipótesis compuestas.

Una hipótesis es simple cuando se refiere a un único valor del parámetro, es decir, a
un único punto del espacio paramétrico. Por ejemplo, afirmar que  = 5.

José Luís Gutiérrez de Mesa 1


Contrastes de hipótesis

Una hipótesis es compuesta cuando se refiere a un subconjunto más amplio del


espacio paramétrico u no a un único punto. Por ejemplo, afirmar que  > 5

(En el caso de dos parámetros, una hipótesis simple puede ser µ = 30 y σ =5 porque
se refiere a un único punto del espacio paramétrico bidimensional µ x σ)

b) Hipótesis nula e hipótesis alternativa.

La hipótesis nula es la hipótesis inicial que se acepta provisionalmente como cierta y


es sometida a comprobación experimental, se designa H0.

La hipótesis alternativa se designa H1 es la hipótesis complementaria de la nula.

Como consecuencia de la comprobación experimental, la hipótesis nula seguirá


siendo aceptada como verdadera o se rechazará, si hay razón suficiente, en cuyo caso se
aceptara la hipótesis complementaria.

Expresión general de un contraste de hipótesis.

H 0 :  0  
Un contraste de hipótesis se plantea de la siguiente forma
H 1 :   1     0

Que nos indica que provisionalmente admitimos que  pertenece a 0. Si después
del estudio resulta que no es cierto, se acepta la hipótesis alternativa.

Formas básicas de un contraste paramétrico.

Las formas de un contraste de hipótesis depende de las especificaciones apropiadas,


pero se pueden resumir en cuatro formas básicas.

H 0 :   1
1. Hipótesis simple frente a alternativa simple.
H1 :   2

H 0 :  0
2. Hipótesis simple frente a alternativa bilateral
H1 :    0

H 0 :  0 H 0 :  0
3. ó Contrastes unilaterales.
H1 :    0 H1 :    0

H 0 : 1     2
4. Contraste bilateral.
H 1 :   1 ó    2

José Luís Gutiérrez de Mesa 2


Contrastes de hipótesis

Región crítica y región de aceptación.


Ante un contraste de hipótesis hay que tomar una de las dos decisiones:
a) Se acepta la hipótesis nula y se rechaza la alternativa
b) Se acepta la hipótesis alternativa y se rechaza la hipótesis nula.

Para decidir qué decisión tomar, se toma una muestra aleatoria simple y se elige un
determinado estimador puntual θ̂ (X1, X2, …,Xn) y en función de los posibles valores
que tome, se tomará una u otra decisión.

Se denomina región crítica a la constituida por el conjunto de muestras para las que
se rechaza la hipótesis nula C   ( x1 , x2 ,..., xn / se rechaza H 0 

Se denomina región de aceptación la constituida por el conjunto de muestras para


las que se acepta la hipótesis nula. C   ( x1 , x2 ,..., xn / se acepta H 0 

Se denominan valores críticos de la muestra aquellos que separan la región crítica de


la región de aceptación.

Cuando estamos ante un contraste bilateral (hipótesis alternativa bilateral) la región


crítica también es bilateral y existen dos valores críticos.

Cuando el contraste es unilateral, la región crítica también lo es y únicamente existe


un valor crítico.

H 0 :   0 H 0 :   0
H1 :    0 H1 :    0

Una vez determinada la región crítica se elige una M.A.S. Si esa muestra
pertenece a la región crítica, rechazamos H0 y aceptamos H1; si la muestra está en la
región de aceptación, se acepta H0 y se rechaza H1.

Error de tipo I y error de tipo II.


En un contraste de hipótesis, igual que en cualquier problema de decisión, hay
varias alternativas y, por tanto, existe la posibilidad de equivocarse. Las posibles
alternativas y estados se resumen en el siguiente cuadro.

José Luís Gutiérrez de Mesa 3


Contrastes de hipótesis

Estados de la naturaleza
Decisión H0 verdadera H0 falsa
Aceptar H0 No hay error Error de tipo II
Nivel de confianza (1-) 
Rechazar Error de tipo I No hay error
H0  Potencia (1-)

Error de tipo I es el cometido al rechazar H0 cuando es cierta.


Error de tipo II es el cometido al aceptar H0 cuando es falsa.

Riesgo de error de tipo I para un parámetro ()

Es la probabilidad de cometer un error de tipo I, es decir:

 ( )  P Re chazar H 0 H es cierta   P ( X 1 , X 2 ,..., X n )  C    


 0   0

Habrá tantos errores de tipo I como valores posibles de 0. Se denomina talla del
error de tipo I, o tamaño del error de tipo I, a la mayor de estas probabilidades, que se
designa por , también denominado nivel de significación del contraste, o tamaño de la
región crítica.

Riesgo de error de tipo II para un parámetro ()

Es la probabilidad de cometer un error de tipo II, es decir:

 ( )  P Aceptar H 0   P ( X 1 , X 2 ,..., X n )  A 


H es falsa      
 0   1
Igual que en el caso anterior, habrá tantos errores de tipo II como valores
posibles de 1. Análogamente, se denomina talla del error de tipo II, o tamaño del error
de tipo II, a la mayor de estas probabilidades, que se designa por .

Interesa que  y  sean los más pequeños posibles. Si ambos son cero se dice
que es un contraste ideal y carece de interés. Cuando H 0 es simple se verifica que  =
() y no siempre se verifica que  +  = 1

Un ejemplo muy común para fijar las ideas es comparar un contraste de hipótesis
con un juicio en un Tribunal de Justicia. H 0 es suponer que el acusado es inocente hasta
que no se demuestre lo contrario. Por tanto, H1 es que el acusado es culpable.
El error de tipo I con probabilidad  es decidir que el acusado es culpable,
cuando en realidad es inocente. Se quiere que esta probabilidad sea muy pequeña.
El error de tipo II con probabilidad  es decidir que el acusado es inocente
cuando en realidad es culpable. También, se procura que esta probabilidad sea muy
pequeña.
La potencia del contraste es decidir que el acusado es culpable cuando en
realidad es culpable o que es inocente cuando en realidad es inocente.

José Luís Gutiérrez de Mesa 4


Contrastes de hipótesis

Las probabilidades  y  son contradictorias, si una aumenta, la otra disminuye


y ante la imposibilidad de hacer mínimo el error de tipo I y el de tipo II
simultáneamente, se opta por fijar un nivel de  y obtener la región crítica que haga
mínimo  ( o máxima la potencia 1 - ).

En la práctica, se fija, en primer lugar, el valor de  y para que  sea mínimo,


buscamos el mejor estimador posible del parámetro. Así, si estamos ante una población
normal de media desconocida y desviación típica  y se quiere realizar el contraste:
H 0 :   0
si se utiliza como estimador de la media poblacional la media muestral, la
H1 :   1
región crítica y la de aceptación vendrán determinadas en función de algún criterio que
se adopte sobre si la media muestral es inferior o superior a un determinado valor. Una
interpretación se puede ver en el siguiente gráfico.

Vamos a calcular estos valores con un ejemplo numérico.

Ejemplo:

El número de artículos producidos a la semana por una cierta factoria se


distribuye de forma normal con media desconocida y desviación típica 3. Se desea
contrastar la hipótesis de que la media es 15, frente a la hipótesis alternativa de que es
16. Para ello se establece el siguiente criterio: Se toma una muestra de tamaño 16
semanas y si el número medio de piezas fabricadas es superior a 15,5 se decide que la
media es 16 y si no se decide que es 15. Hallar las probabilidades de error de tipo I y de
tipo II. ¿Cuál debería ser el tamaño de la muestra para que la probabilidad de
equivocarnos en uno y otro tipo de error se inferior a 0.05? y si queremos que el error de
tipo I sea menor que 0,05 y mantenemos el tamaño de la muestra ¿cuál debería de ser el
punto crítico?

José Luís Gutiérrez de Mesa 5


Contrastes de hipótesis

Solución:
 
 Re chazar H 0   X  15,5   X  15 15,5  15 
a)   P H 0 es cierta 
 P
  15   P 3 
3  =
   
 16 16 
= P(Z > 0,66) = 0,2546
 
 Aceptar H 0   X  15 ,5   X  16 15,5  16 
  P H 0 es falsa 
 P
  16   P 3  
   3 
 16 16 
= P(Z < -0,66) = 0,2546

b) Como  y  son iguales, lo calculamos únicamente para .


  15,5  15
 X  15,5   X  15 15,5  15    1,645
  P   15   P 3    0,05 3 luego n
   3 
 n n  n
tiene que ser mayor o igual a 98.

  x0  15
 X  x0   X  15 x0  15    1,645
c) Análogamente:   P    15   P  3    0,05 3
   3 
 16 16  16
con lo que, despejando, el valor de x0 ha de ser 16,23.

Fases a realizar en un contraste de hipótesis.

Las fases para realizar un contraste de hipótesis son las siguientes:

Paso 1.- Planteamiento de las hipótesis nula y alternativa en términos estadísticos.


(Recordar que por motivos de cohesión teórica, el signo igual ha de estar siempre en la
hipótesis nula).

Paso 2.- Determinar un estadístico de prueba apropiado h(ˆ) que se utilizará para
aceptar o rechazar la hipótesis nula, ha de cumplir:

José Luís Gutiérrez de Mesa 6


Contrastes de hipótesis

a) Su función de probabilidad ha de ser conocida cuando H0 se supone cierta.


b) Debe de contener el parámetro que se quiere contrastar.
c) Los restantes términos que intervienen han de ser conocidos o se pueden
estimar a partir de la muestra.

Paso 3.- Fijar el nivel de significación .

Paso 4.- Determinar la región crítica del estadístico de prueba.

Paso 5.- Seleccionar aleatoriamente la muestra y calcular el valor del estadístico de


prueba o experimental.

Paso 6.- Decidir e interpretar si el valor del estadístico experimentado está o no en la


región crítica y rechazar o aceptar la hipótesis nula.

CONTRASTES EN POBLACIONES NORMALES.

A.- Contrastes para la media con σ conocida.

Paso 1.- Los contrastes para la media pueden ser de tres tipos:
H 0 :   0 H 0 :   0 H 0 :   0
a) b) c)
H1 :   0 H1 :    0 H1 :   0

X  0
Paso 2.- El estadístico de prueba es Z exp   N (0,1)
 n

Paso 3.- Dado , se calcula con las tablas de la normal:


En el caso a) z/2 y -z/2
En el caso b) z
En el caso c) -z

Paso 4.- Las regiones críticas son:

En el caso a) En el caso b) En el caso c)

C   z exp / z exp   z / 2 ó z exp  z / 2  C   z exp / z exp  z  C   z exp / z exp   z 

Esto aparece esquemáticamente en el libro de tablas:

José Luís Gutiérrez de Mesa 7


Contrastes de hipótesis

Ejemplo:

1.- Sea X una variable aleatoria normal con media desconocida y desviación típica 3.
Contrastar la hipótesis de que la media es igual a 2 con un nivel de significación de 0,10
tomando una muestra aleatoria simple de 40 elementos para los que resulta una media
muestral de 2,25.

2.- Se sabe que la distribución del peso de los sacos de patatas de una determinada
explotación agraria es normal de media desconocida pero de desviación típica igual a 3
Kg. Contrastar la hipótesis de que el peso medio de los sacos de patatas se mantiene
inferior a 25 Kg. Con un nivel de significación de 0,05 si se ha tomado una m.a.s. de 16
sacos y se ha obtenido un peso medio de 24,5 Kgs.

B- Contrastes para la media con σ desconocida.

Se siguen los mismos pasos del caso anterior. Los contrastes se plantean de igual
manera, pero cambia el estadístico de prueba.

Paso 1.- Los contrastes para la media pueden ser de tres tipos:
H 0 :   0 H 0 :   0 H 0 :   0
a) b) c)
H1 :   0 H1 :    0 H1 :   0

X  0
Paso 2.- El estadístico de prueba es Texp   Tn 1
Sc n

Paso 3.- Dado , se calcula con las tablas de la t de Student:


En el caso a) t/2 y -t/2
En el caso b) t
En el caso c) -t

Paso 4.- Las regiones críticas son:

En el caso a) En el caso b) En el caso c)

José Luís Gutiérrez de Mesa 8


Contrastes de hipótesis

C  t exp / t exp  t / 2 ó t exp  t / 2  C  t exp / t exp  t   C  t exp / t exp  t 

Esto aparece esquemáticamente en el libro de tablas:

Ejemplo:

3.- (6.11 pag 434 libro viejo) El peso medio escurrido de un determinado tipo de
conserva en lata es una v.a. normalmente distribuida. Las normas de envasado de esa
planta conservadora exigen que el peso neto escurrido sea menor o igual que 150 gr.
Con el fin de contrastar si el lote recientemente enlatado presenta diferencias
significativas con respecto a ese valor, se toma una m.a.s. de 15 latas y se obtiene que su
peso medio es de 151,234 gr. Con una desviación típica muestral de 4,072. Contrastar
la hipótesis con un nivel de significación del 10%.

C- Contrastes para la varianza con media desconocida.

Paso 1.- Los contrastes para la varianza pueden ser, igual que en casos anteriores, de
tres tipos:
H0 :   0 H0 :   0 H0 :  0
a) b) c)
H1 :    0 H1 :    0 H1 :    0

( n  1) Sc 2
Paso 2.- El estadístico de prueba es  2 exp    2 n 1
 2

José Luís Gutiérrez de Mesa 9


Contrastes de hipótesis

Paso 3.- Dado , se calcula con las tablas de la Chi cuadrado:


En el caso a) χ2n-1; /2 y χ2n-1; 1-/2
En el caso b) χ2n-1; 1-
En el caso c) χ2n-1; 

y se procede como aparece en el libro de tablas:

Ejemplo:

4.- (6.13 pag 449 libro viejo) Una máquina de inflado de neumáticos de coches se
considera averiada si la varianza del peso en aire de los neumáticos inflados es mayor o
igual que 0,02 gr2. Se selecciona una m.a.s. de 30 neumáticos resultando que su
varianza muestral es de 0,03 gr2. Suponiendo que el peso en aire de los neumáticos
inflados por esa máquina se distribuye de forma normal con media desconocida, afirmar
con un nivel de significación del 5% si la máquina puede considerarse averiada.

Otros ejemplos

5.- Los niveles de audiencia por capítulo de dos series de televisión se distribuyen
normalmente con desviaciones típicas 100.000 y 210.000 espectadores. Un estudio de
medios afirma que ambas series tiene igual nivel de audiencia. Las audiencias, en
millones de espectadores, de ocho capítulos seleccionados al azar para cada una de las
series fueron las siguientes:

Serie A 2,15 2,61 2,11 2,26 2,01 2,31 2,51 2,80


Serie B 2,24 2,53 2,35 2,22 2,21 2,22 2,21 2,01

¿Se podría afirmar, con un 5% de significación, que las audiencias medias de ambas
series son iguales?

CONTRASTES EN POBLACIONES NO NORMALES

A.- Contrastes para la media con σ conocida.

Se procede de igual forma que en el caso de distribuciones normales, siempre


que el tamaño muestral sea superior a 30.

B.- Contrastes para la proporción.

Se procede de forma análoga a los casos anteriores pero teniendo en cuenta los
cuadros siguientes:

José Luís Gutiérrez de Mesa 10


Contrastes de hipótesis

Ejemplo:

6.- (6.15 pag 455 libro viejo) Una empresa dedicada a la fabricación de lámparas de
bajo consumo anuncia que como máximo hay un 1% de defectuosas. Para contrastar si
es cierta esta afirmación con un nivel de significación del 8%, observamos una m.a.s. de
300 lámparas y obtenemos que hay 6 defectuosas. ¿Debemos aceptar la hipótesis del
fabricante?

José Luís Gutiérrez de Mesa 11

También podría gustarte