05.2 Inferencia Estadc3adstica Prueba de Hipc3b3tesis

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 16

Facultad de Ciencias Naturales, UNSa

Área de Estadística
Material de apoyo didáctico elaborado por Silvia Sühring

INFERENCIA ESTADÍSTICA: PUREBAS DE HIPÓTESIS

La prueba de hipótesis es un procedimiento de la inferencia estadística mediante el


cual podemos tomar la decisión de rechazar o no una hipótesis nula planteada con
base en la información proporcionada por una muestra. Este procedimiento consta
de una serie de pasos que nos guían a tomar la decisión en forma objetiva.
Una hipótesis es un supuesto o afirmación que se hace respecto de una
característica de la población. A partir de hipótesis científicas se establecen
hipótesis estadísticas que pueden referirse al valor del/los parámetros de una
población, a la distribución de una variable estudiada, o a la relación entre dos o
más variables, etc.
Hipótesis nula (H0): es el supuesto acerca de la población que debemos
rechazar o no rechazar sobre la base de la evidencia de la muestra. Es decir,
es la hipótesis que se establece como verdadera y que se pone a prueba.
Hipótesis alternativa (H1): es un supuesto que se hace respecto de la
población en el caso en que la H0 sea rechazada.
Ho H1
Supuesto que se considera Niega la Ho
provisoriamente verdadero
ejemplo: Ho µ ≤ 50 vs. H1 µ > 50

Una vez que se planteó la hipótesis nula debemos:


- Obtener los datos para validar o no esa hipótesis
- Seleccionar un estadístico que tenga una distribución de probabilidad definida bajo
el supuesto de que la Ho es verdadera
Si conocemos la distribución podremos asociar probabilidades a los eventos que
pudieran ocurrir bajo Ho verdadera: delimitar zonas de rechazo y no rechazo, y
definir la probabilidad de cometer un error al tomar la decisión.

Procedimiento de la prueba de hipótesis:


1- Formular las hipótesis: Ho y H1
La Ho es el supuesto referido a la población que se establece como verdadero y
que se pone a prueba. La H1 es un supuesto complementario a la Ho que se
aceptará como cierto en caso de rechazar la Ho.
2- Establecer el nivel de significación, P(eΙΙ) = α
El investigador determina la máxima probabilidad de cometer un error de tipo Ι
(rechazar la Ho nula cuando es verdadera), al tomar la decisión. En general se
utilizan los valores de α = 0,05 o 0,01.

Inferencia Estadística – Pruebas de hipótesis - 2016 1


3- Establecer cuál será el estadístico de prueba a utilizar, cuya distribución
quede completamente especificada bajo el supuesto de que la hipótesis nula es
verdadera. Los estadísticos de prueba siguen algún modelo teórico de distribución.
Estadístico de prueba
Es la medida de la discrepancia entre la información que proporciona la
muestra y lo expresado en la Ho. Es un valor que se calcula a partir de los
datos de la muestra y que se utiliza para tomar la decisión de rechazar o no la
Ho. Los estadísticos de prueba tienen alguna distribución teórica conocida que
es utilizada para determinar la probabilidad de error. Cuantifican las
diferencias entre las observaciones actuales (datos de la muestra) y las que
hubiéramos esperado si la Ho fuera verdadera. Los estadísticos de prueba nos
ayudan a decidir si estas diferencias son tan leves como para considerarlas un
simple reflejo de la variación al azar (las que tienen una probabilidad grande
de ocurrir cuando Ho es cierta), o si son tan grandes que pueden considerarse
que Ho no es verdadera (las que tienes una probabilidad pequeña de ocurrir
cuando Ho es cierta).
4- Fijar los criterios de decisión
Se establecen los criterios que se seguirán en el momento de tomar la decisión de
rechazar o no la Ho, es decir bajo qué condiciones la decisión será rechazar la Ho.
Para esto es necesario establecer qué intervalo de valores del estadístico de
prueba conducen al rechazo de la Ho (zona de rechazo), y qué intervalo de valores
conducen al no rechazo de la misma (zona de no rechazo). Estas zonas están
delimitadas por los valores críticos.
Valor crítico (VC): punto que delimita la región o zona en que la hipótesis nula es
rechazada y la región donde la hipótesis nula no es rechazada.
Los criterios se fijan sobre la base de los pasos anteriores (1 a 3) de la prueba de
hipótesis: la H1 define si la prueba planteada es de dos colas o de una cola, el nivel
de significación definen la amplitud de la región de rechazo y la distribución del
estadístico de prueba define cuáles son los valores críticos.
5- Realizar los cálculos necesarios
Se realizan todos los cálculos necesarios para obtener el valor del estadístico de
prueba teniendo en cuenta los datos de la muestra y lo propuesto en la Ho.
6- Tomar una decisión estadística
Con base en el valor del estadístico de prueba calculado se decide si se rechaza o
no la Ho siguiendo los criterios de decisión planteados en el paso 4.
Si el valor del estadístico de prueba calculado cae en la región de no rechazo
entonces se asume que los datos son compatibles con la hipótesis nula, entonces
no existen evidencias suficientes para rechazar la Ho con un nivel de significación α
y se dice que el estadístico de prueba no es significativo.
Si, por el contrario, el estadístico cae en la región de rechazo entonces se asume
que los datos no son compatibles con la hipótesis nula y se rechaza a un nivel de
significación α. En este caso se dice que el estadístico de prueba es
estadísticamente significativo.
Al tomar una decisión en este paso podríamos cometer un error (de tipo I o II).

Inferencia Estadística – Pruebas de hipótesis - 2016 2


7- Interpretar el resultado de la decisión en términos del problema planteado
(conclusión)

TIPOS DE ERROR
Teniendo en cuenta dos cosas: la decisión que se tome en el 6º paso del
procedimiento de prueba de hipótesis, y la veracidad de la Ho, se pueden plantear
las siguientes situaciones:
Hipótesis nula
Decisión Verdadera Falsa
Rechazar Error de tipo Ι decisión correcta
P(eΙ) = α P = (1 - β)
No rechazar Decisión correcta error de tipo ΙΙ
P = (1 - α) P(eΙΙ) = β

El error de tipo Ι consiste en rechazar la Ho cuando es verdadera.


El error de tipo ΙΙ consiste en no rechazar la Ho cuando es falsa.
α es la probabilidad de cometer un error de tipo Ι.
β es la probabilidad de cometer un error de tipo ΙΙ.
(1 - β ): potencia del test, es decir, la probabilidad de rechazar la hipótesis nula
cuando es falsa. Es la capacidad del test de detectar una diferencia entre lo
planteado en la hipótesis nula y lo que se evidencia a partir de la muestra, si es que
esta diferencia en realidad existe, es decir, la capacidad de afirmar que la Ho es
falsa cuando realmente lo es.

Valor p: probabilidad asociada al valor del estadístico de prueba calculado a partir


de los datos, es decir, la probabilidad de obtener un valor más extremo que el
calculado dado que la hipótesis nula es verdadera. Cuanto menor sea el valor p
mayor es el grado de incompatibilidad de la muestra con Ho, lo que lleva a rechazar
Ho.
El criterio de decisión a partir del valor p será:
• Si el valor p es más chico que el nivel de significación la hipótesis nula es
rechazada.
• Si el valor p es igual o más grande que el nivel de significación la hipótesis
nula no es rechazada.
0 ,4

0 ,3

0 ,2

α /2 1 - α α /2
0 ,1

0 ,0
-5 0 5

Z o n a d e re c h a z o Z o n a d e re c h az o
Z o n a d e n o re ch a zo
VC 1 VC 2

Caso de una prueba bilateral (extraído de di Rienzo et al.)

Inferencia Estadística – Pruebas de hipótesis - 2016 3


POTENCIA DE UNA PRUEBA
Corresponde a la probabilidad de rechazar la hipótesis nula cuando es falsa (1 - β).
La representación gráfica de la curva definida según lo planteado en la H0 permite
ubicar la probabilidad de error de tipo I (α), y su complemento (1 - α). Por otro lado
la curva definida según lo planteado en la H1 permite graficar la probabilidad de
cometer un error de tipo II (β) y su complemento (1 - β) o potencia de la prueba.
El valor crítico es el que separa la zona de rechazo de la de no rechazo de la Ho.
Normal(0,1): p(evento)=0.0500; Normal(2.5,1): p(evento)=0.1962
0.40

H0 H1
0.30
Densidad

0.20

0.10

0.00
-5.00 -2.50 0.00 2.50 5.00

β α
θ0 vc θ1
No rechazo Ho Rechazo Ho

CÓMO AUMENTAR LA POTENCIA DE UNA PRUEBA


Cuando la Ho expresa lo que el investigador cree que no es verdadero, mientras
que la H1 expresa lo que el investigador cree que es verdadero, resulta obvio que
debe plantear una prueba con alta potencia. Para lograr mayor potencia podemos
usar alguno de los siguientes recursos:

1) AUMENTAR EL VALOR DE α
Como β y α son inversamente proporcionales, al aumentar α disminuye β y
por lo tanto aumenta la potencia (1 - β).

Normal(0,1): p(evento)=0.0228; Normal(2.5,1): p(evento)=0.3085


0.40

0.30
Densidad

0.20

0.10

0.00
-3.00 -1.00 1.00 3.00 5.00

Inferencia Estadística – Pruebas de hipótesis - 2016 4


Normal(0,1): p(evento)=0.0505; Normal(2.5,1): p(evento)=0.1949
0.40

0.30
Densidad

0.20

0.10

0.00
-3.00 -1.00 1.00 3.00 5.00

2) AUMNETAR LA DISTANCIA ENTRE θ0 y θ1

Al aumentar la distancia entre el valor que se asigna al parámetro en la Ho (θ0) y


en la H1 (θ1), las curvas de H0 y H1 estarán menos solapadas, por lo tanto la
probabilidad β disminuye y su complemento (1 - β) aumenta.
Normal(0,1): p(evento)=0.0505; Normal(2.5,1): p(evento)=0.1949
0.40

0.30
Densidad

0.20

0.10

0.00
-3.00 -0.75 1.50 3.75 6.00

Normal(0,1): p(evento)=0.0505; Normal(3.5,1): p(evento)=0.0314


0.40

0.30
Densidad

0.20

0.10

0.00
-3.00 -0.75 1.50 3.75 6.00

3) AUMENTAR EL TAMAÑO DE LA MUESTRA

Al aumentar el tamaño de la muestra el error estándar del estadístico disminuye,


las curvas son más bajas en las colas y más altas en el centro (más leptocúrticas),
por lo tanto estarán menos solapadas.

Inferencia Estadística – Pruebas de hipótesis - 2016 5


0.60

0.45

0.30

0.15

0.00
-5.00 -2.00 1.00 4.00 7.00

0.60

0.45

0.30

0.15

0.00
-5.00 -2.00 1.00 4.00 7.00

# Prueba de hipótesis para la MEDIA POBLACIONAL (µ)

El propósito de esta prueba es comprobar si la media de una población tiene un


valor determinado (µ0). Los datos necesarios provienen de una muestra extraída al
azar de una población para la que se registró en cada unidad estadística el valor de
una variable cuantitativa.
Cuando el tamaño de la muestra de la cual se obtuvo la estimación de la
media poblacional es grande (≥30) y se conoce el valor de la varianza, se utiliza la
distribución Z (normal estandarizada) para realizar pruebas de hipótesis referidas a
µ. Esto surge a partir del Teorema Central del Límite, que afirma que la media
muestral tendrá una distribución normal, independientemente de la distribución de
la variable original.

Las hipótesis que se plantean son:


Ho : µ = µ0

H1 : µ ≠ µ0 ó H1: µ > µ0 ó H1: µ < µ0


Normal(0,1): p(evento)=0.0500 Normal(0,1): p(evento)=0.0505
0.40 Normal(0,1): p(evento)=0.0500 0.40
0.40

0.20 0.20 0.20

0.00 0.00 0.00


Inferencia
-5.00 Estadística
-2.50 – Pruebas
0.00 2.50 de hipótesis
5.00 -5.00 - 2016
-2.50 0.00 2.50 5.00
-5.00 -2.50 0.00 6
2.50 5.00
El estadístico de prueba utilizado para la prueba referida a µ es:

x − µ
zc =
s
n
Cuando el tamaño de la muestra de la cual se obtuvo la estimación de la media
poblacional es pequeño (<30), y se desconoce el valor de la varianza poblacional,
se utiliza la distribución t de Student. En este caso si la población es normal, el
estadístico de prueba para el test para µ será en este caso:
x − µ
tc = ≈ tδ
S
n
El estadístico tc sigue una distribución t de Student con δ = (n - 1) grados de
libertad.
En general, dado que si el tamaño de la muestra es grande (n >30) la distribución t
de Student converge a una normal, se puede utilizar siempre el segundo estadístico
de prueba planteado. Por esta razón la prueba para la media poblacional también
se llama “prueba t para una media”.

Ejemplo prueba de hipótesis para µ (n>30)


Un organismo de control ambiental está investigando el ruido que producen camiones
pesados que circulan en una calle de acceso a una ciudad. Para ello toma una muestra de
40 camiones registrando sus respectivos niveles de ruido en decibeles. Con los datos
obtenidos se determina que el promedio es de 86 db con una desviación típica de 0,81 db.
Si el máximo nivel de ruido aceptado es 85,7 decibeles, el organismo decidirá permitir la
circulación de estos camiones? (utilice una confianza del 95%)

Solución
Los datos corresponden a valores de una variable cuantitativa continua registrada en cada
individuo de una muestra de camiones tomada de la población de camiones que circulan en
el acceso a la ciudad.
Datos: x = 86 db S = 0,81 db n = 40
En función del tamaño de la muestra se espera que x tenga distribución normal
Prueba de hipótesis para µ
1) Ho : µ ≤ 85,7 db ⇒ los camiones pueden circular
Hi : µ > 85,7 db ⇒ los camiones no deben circular
2) Nivel de significación: α = 0,05
3) Estadístico de prueba: Zc = ( x - µ)/ σ x ∼ Z / Ho es V
4) Criterios de decisión: Rechazo la Ho si y sólo si el Zc es mayor que 1,64
Normal(0,1): p(evento)=0,0500
0,40
0,30
0,20
0,10
0,00
-5,00 -2,50 0,00 2,50 5,00

5) Cálculos:

Inferencia Estadística – Pruebas de hipótesis - 2016 7


S x = 0,81 / √40 = 0,128 Zc = (86 – 85m7) / 0m128 = 2.34
6) Decisión: como Zc es mayor que 1,64 rechazo la Ho.
7) Conclusión: Podemos afirmar con un 95% de confianza que el nivel de ruido excede el
límite aceptado de 85,7 db, por lo tanto el organismo ambiental no permitirá la circulación
de estos camiones.

Ejemplo prueba de hipótesis para µ (n<30)


Un investigador desea analizar la relación que existe entre la temperatura ambiental y la
temperatura corporal en los cangrejos que habitan las zonas intertidiales. Para ello mide la
temperatura corporal de 8 cangrejos expuestos a una temperatura ambiente de 26,2 ºC,
obteniendo los siguientes resultados:
25,8 24,6 26,1 24,9 25,3 24,0 24,5 25,1
Pruebe la hipótesis de que la temperatura corporal de los cangrejos es inferior a la
temperatura ambiente.

Solución
Los datos corresponden a valores de una variable cuantitativa continua registrada en cada
individuo de una muestra pequeña tomada de la población de cangrejos.
Prueba de hipótesis para la media poblacional
1) Ho : µ = 26,2 ºC ⇒ la temperatura corporal de los cangrejos es igual a la ambiental
Hi : µ < 26,2 ⇒ la temperatura corporal de los cangrejos es menor a la ambiental
2) Nivel de significación: α = 0,05
3) Estadístico de prueba: tc ∼ t7 / Ho es Verdadera
4) Criterios de decisión: Rechazo la Ho si y sólo si el tc es menor que -1,895
T Student(7): p(evento)=0,0500
0,39

0,29

0,19

0,10

0,00
-5,92 -2,96 0,00 2,96 5,92

5) Cálculos:
x = 25,04 ºC S = 0,69 ºC S x = 0,69 / √ 8 = 0,244 ºC

x − µ 25 . 04 − 26 . 2 26 . 04 − 26 . 2
tc = = = = − 4 . 75
S 0 . 69 0 . 244
n 8
6) Decisión: como tc es menor que -1,895, rechazo la Ho.
7) Conclusión: Se puede afirmar con una confianza del 95% que la temperatura corporal de
los cangrejos es menor que la temperatura ambiental.

Con InfoStat podemos hacer esta prueba si tenemos los datos cargados. La salida sería:
Prueba T para un parámetro
Valor del parámetro probado: 26.2
Variable n Media DE LS(95) T p(Unilateral I)
Temperatura 8 25,04 0,69 25,50 -4,75 0,0010

Notar que T = tc, la probabilidad para el valor T es 0,001 ⇒ menor que el nivel de significación ⇒
debo rechazar Ho. LS (95) corresponde la límite superior del intervalo de confianza para µ.

Inferencia Estadística – Pruebas de hipótesis - 2016 8


# Prueba de hipótesis para la PROPORCIÓN POBLACIONAL ( π)

El propósito de esta prueba es comprobar si la proporción de una población tiene


un valor determinado (π0). Los datos necesarios provienen de una muestra extraída
al azar de una población para la que se registró, en cada unidad estadística, el valor
de una variable cualitativa. A partir de estos datos se puede calcular p = nº de
éxitos/ n.
Cuando estimamos a π a partir de una muestra de tamaño suficientemente
grande, se utiliza la distribución Z (normal estandarizada) para realizar pruebas de
hipótesis sobre este parámetro. Esto es posible ya que de acuerdo con la teoría
estadística, la proporción muestral p tendrá en este caso, una distribución normal.

Las hipótesis que se plantean son:


Ho : π = π0
H1 : π ≠ π0 ó H1: π > π0 ó H1: π < π0
Normal(0,1): p(evento)=0.0500 Normal(0,1): p(evento)=0.0505
0.40 Normal(0,1): p(evento)=0.0500 0.40
0.40

0.20 0.20 0.20

0.00 0.00
0.00
-5.00 -2.50 0.00 2.50 5.00 -5.00 -2.50 0.00 2.50 5.00
-5.00 -2.50 0.00 2.50 5.00

El estadístico de prueba utilizado para el test referido a π es:

p −π p (1 − p)
Zc = donde σp =
σp n

# Prueba de hipótesis para la VARIANZA POBLACIONAL (σ 2)

El propósito de esta prueba es comprobar si la varianza de una población tiene un


valor determinado (σ20). Los datos necesarios provienen de una muestra extraída al
azar de una población para la que se registró, en cada unidad estadística, el valor
de una variable cuantitativa con distribución normal.

Las hipótesis que se plantean son:


Ho : σ2 = σ20
H1 : σ2 ≠ σ20 ó H1: σ2 > σ20 ó H1:σ2 < σ20
0.24 0.24
0.24

0.18 0.18 0.18


Densidad

Densidad
Densidad

0.12 0.12 0.12

0.06 0.06
0.06

0.00 0.00
0.00 3.81 7.62 11.44 15.25 0.00 0.00 3.81 7.62 11.44 15.25
Variable 0.00 3.81 7.62 11.44 15.25
Variable
Variable

Inferencia Estadística – Pruebas de hipótesis - 2016 9


El estadístico de prueba que se utiliza tiene distribución Chi cuadrado y es:

(n − 1).S 2
X = 2
≈ χδ2 donde δ = (n - 1)
c
σ 2

Ejemplo prueba de hipótesis para σ


2

Según un proveedor de fertilizantes, el contenido de fósforo de uno de sus productos es de


460 kg/ton, con una varianza de 280 kg2/ton2. El comprador está interesado en que la
variabilidad en el contenido de fósforo no supere esa cantidad. Se tomó una muestra de 51
2 2
productos y se determinó una varianza de 340 kg /ton . ¿Qué decisión tomará el comprador
con una confianza del 95%?

Solución:
Prueba de hipótesis para la varianza poblacional
1) Ho : σ ≤ 280 kg /ton ⇒ la varianza no supera la cantidad establecida ⇒ comprará el
2 2 2

producto
Hi : σ2 > 280 kg2/ton2 ⇒ la varianza supera la cantidad establecida ⇒ no comprará el
producto
2) Nivel de significación: α = 0,05
3) Estadístico de prueba: X ∼ X 50 / Ho es Verdadera
2 2

4) Criterios de decisión: Rechazo la Ho si y sólo si el X2c es mayor que X2(50;0.05): 67,5


Chi cuadrado(50): p(evento)=0,0500
0,041

0,030

0,020

0,010

0,000
0,00 25,00 50,00 75,00 100,00

5) Cálculos:
(n − 1).S 2 (51 − 1).340
X =2
= = 60.71
c
σ 2
280
6) Decisión: como X2c es menor que 67.5, no existen evidencias suficientes para rechazar
la Ho.
7) Conclusión: Dado que la varianza del contenido de fósforo no supera el nivel establecido
el comprador decidirá comprar el producto.

# Prueba para COMPARAR DOS PROPORCIONES POBLACIONALES (∆π)

El propósito de esta prueba es comprobar si dos poblaciones tienen el mismo valor


para el parámetro proporción poblacional, es decir, si π1 es igual a π2. El parámetro
que se pone a prueba es ∆π = (π1 - π2). Los datos necesarios provienen de dos
muestras, una extraída al azar de la población 1 y otra de la población 2, para las
que se registró, en cada unidad estadística, el valor de una variable cualitativa. A
partir de estos datos se puede calcular p1 = nº de éxitos/ n1 y p2 = nº de éxitos/ n2.
De acuerdo con la teoría estadística, la diferencia de proporciones
muestrales ∆p (p1 - p2) tendrá distribución normal si las muestras son

Inferencia Estadística – Pruebas de hipótesis - 2016 10


suficientemente grandes. Así, podemos poner a prueba hipótesis referidas a la
diferencia de proporciones poblacionales. Las hipótesis que se plantean son:
Ho : ∆π = 0
H1 : ∆π ≠ 0 ó ∆π > 0 ó ∆π < 0

El estadístico de prueba es:

∆p − ∆π p1 (1 − p1 ) p2 (1 − p2 )
Z= σ ∆p = +
σ ∆p donde n1 n2

# Prueba para COMPARAR LAS VARIANZAS DE DOS POBLACIONALES


(Prueba de Homogeneidad de Varianzas o "Prueba F")
El propósito de esta prueba es comprobar si dos poblaciones normales tienen el
mismo valor para el parámetro varianza, es decir, si σ21 es igual a σ22. Los datos
necesarios provienen de dos muestras, una extraída al azar de la población 1 y otra
de la población 2, para las que se registró, en cada unidad estadística, el valor de
una variable cuantitativa con distribución normal.
2 2
Si S 1 y S 2 son varianzas de muestras aleatorias independientes de tamaño n1 y n2,
tomadas de poblaciones con distribución normal con varianzas respectivas σ21 y
σ22, entonces el estadístico:
S 12
σ 2
F = 1
≈ F ( δ 1 ,δ )
S 22 2

σ 2
2

tiene distribución F de Snedecor con δ1 = (n1 – 1) y δ2 = (n2 – 1) grados de libertad.


Este estadístico se utiliza para probar si las varianzas poblacionales son iguales.

Las hipótesis que se plantean son:


σ 12
Ho : σ 12 = σ 22 ⇒ =1
σ 22

σ 12 σ 12 σ 12
H1 : σ 12 ≠ σ 22 ⇒ ≠1 ó >1 ó <1
σ 22 σ 22 σ 22

En general se utiliza como H1 (σ21/σ22) >1, por lo que se toma como población 1 a la
que tiene mayor varianza.
Dado que la hipótesis nula que se plantea en esta prueba es que las varianzas
poblacionales son iguales, el estadístico de prueba se simplifica:

S12
Fc = ≈ Fδ1 ;δ 2 donde δ1 = n1 – 1 y δ2 = n2 – 1
S 22

Inferencia Estadística – Pruebas de hipótesis - 2016 11


El valor obtenido se compara con el valor crítico de la distribución F (δ2; δ1) para
determinado nivel de significación.

# Prueba de hipótesis para COMPARAR LAS MEDIAS DE DOS POBLACIONES


("prueba t")
El propósito de esta prueba es comprobar si dos poblaciones tienen el mismo valor
para el parámetro media, es decir, si µ1 es igual a µ2. Los datos necesarios
provienen de dos muestras, una extraída al azar de la población 1 y otra de la
población 2, para las que se registró, en cada unidad estadística, el valor de una
variable cuantitativa.
Lo primero que debemos tener en cuenta para elegir qué prueba realizar es
si las muestras que se utilizan como fuente de información son independientes o
dependientes.

a) El Caso de Muestras Independientes


(los resultados de una muestra son independientes de los de la otra
muestra)

Al comparar las medias de dos muestras independientes para establecer si


dichas muestras provienen de la misma población o de poblaciones con medias
iguales, las hipótesis que se plantean son:

Ho : ∆µ = 0
H1 : ∆µ ≠ 0 ó ∆µ < 0 ó ∆µ > 0
∆x − ∆µ
El estadístico de prueba que se utiliza es: tc = ≈ tδ
Sd

donde Sd = S∆ x es la desviación típica de la diferencia de medias.

El cálculo de los valores de Sd y δ varían según:


-si las varianzas poblacionales ( σ 1 y σ 2 ) son o no iguales
2 2

-si los tamaños de las muestras (n1 y n2 ) son o no iguales

Para saber si las varianzas poblacionales son o no iguales (cuando no se dispone


de estos valores), se realiza la prueba de homogeneidad de varianzas.

En función de las distintas situaciones, los cálculos de Sd y δ serán:


a) Si σ21 = σ22 ; n1 = n2

S 12 + S 22
Sd = y δ = 2n - 2
n

b) Si σ = σ22 ; n1 ≠ n2
2
1

Inferencia Estadística – Pruebas de hipótesis - 2016 12


(n1 − 1) S12 + (n 2 − 1) S 22 1 1 
Sd = ⋅  +  y δ = n1 + n2 – 2
n1 + n 2 − 2  n1 n 2 

c) Si σ21 ≠ σ22 ; n1 = n2
2
 S 12 S 22 
 + 
S 12 + S 22  n1 n 2 
Sd = y δ = 2 2
− 2
n  S1  2
 S2 2
   
 n1  +  n 2 
n1 − 1 n2 − 1
d) Si σ21 ≠ σ22 ; n1 ≠ n2

S 12 S2
Sd = + 2 y δ se calcula como en c)
n1 n2

Ejemplo prueba de hipótesis para ∆µ


Un grupo de conejos fue sometido a una serie de situaciones de tensión que producían una
respuesta de temor. Después de un período de tiempo bajo estas condiciones, los conejos
fueron comparados con los de un grupo control, que no había sido sometido a tensión. La
variable de respuesta fue el peso (en mg) de la glándula suprarrenal. A partir de los datos
obtenidos, presentados más abajo, pruebe si la situación de tensión produce una modificación
en el tamaño de la glándula suprarrenal.
Grupo Experimental 3,8 6,8 8,0 3,6 3,9 5,9 6,0 5,7 5,6 4,5 3,9 4,5
Grupo control 4,2 4,8 4,8 2,3 6,5 4,9 3,6 2,4 3,2 4,9

Solución:
Interesa comparar las medias de las poblaciones “experimental” y “control” para evaluar si la
situación de tensión produce cambio en el tamaño promedio de la glándula. Dado que las
muestras son independientes se aplica la prueba t para muestras independientes.
Hipótesis: Ho : ∆µ = 0
Hi : ∆µ ≠ 0
Nivel de significación: α = 0.05

El InfoStat provee esta salida:


Prueba T para muestras Independientes
Variable:peso - Clasific:Grupo - prueba:Bilateral

Grupo 1 Grupo 2
Grupo control Grupo Experimental
n 10 12
Media 4,16 5,18
Varianza 1,69 1,89

Media(1)-Media(2) -1,02
LI(95) -2,22
LS(95) 0,17
pHomVar 0,8773
T -1,78
gl 20
p-valor 0,0900

Inferencia Estadística – Pruebas de hipótesis - 2016 13


Decisión: Dado que la probabilidad de encontrar valores de tc más extremos que -1.78 es 0,09
(valor mayor que el nivel de significación), no existen evidencias suficientes para rechazar Ho.
La decisión es no rechazo Ho.
Conclusión: Las situación de tensión no modifica el tamaño de la glándula suprarrenal en los
conejos.
Interpretación del intervalo de confianza: la probabilidad de que el intervalo de valores de
diferencia de peso de la glándula comprendido entre -2,22 y 0,17 mg contenga al
parámetro ∆µ es 0,95.
Nota: la columna p(Var.Hom.) indica el valor P de la prueba de homogeneidad de
varianzas. En este ejemplo la probabilidad es alta (mayor que 0,05) por lo que la decisión
en esta prueba es no rechazar la Ho. Concluimos que las varianzas de las poblaciones
estudiadas son iguales (homogéneas), ya que la Ho en esta prueba es: σ 1 = σ 2 .
2 2

2) Caso de Muestras Dependientes o Pareadas


(los resultados de una muestra no son independientes de los de la otra
muestra)
Cuando las muestras no son independientes implica que las observaciones de cada
muestra están pareadas o relacionadas entre sí. Se dicen muestras apareadas
cuando las observaciones en las dos poblaciones de interés se recaban de a pares,
con la premisa que cada par se toma en condiciones homogéneas, aunque estas
condiciones pueden cambiar de un par a otro.
Generalmente este tipo de datos pareados provienen de experimentos planeados
para evaluar el efecto de una variable, controlando el efecto de otras variables
(variables exógenas) que pudieran interferir en los resultados de dicho experimento.
Si las medias poblacionales son iguales esperaríamos que las diferencias entre
pares de observaciones (di) se compensen, y su promedio µd sea cero.

Las hipótesis planteadas son entonces:


Ho: µd = 0
H1: µd ≠ 0 ó µd < 0 ó µd > 0

En algunas situaciones se le puede asignar un valor diferente a cero a la media de


las diferencias.
El estadístico de prueba que se utiliza para comparar las medias poblacionales en
todos los casos es:
d − µd
tc = ≈ tδ donde δ = (n – 1)
Sd

donde di = diferencia de cada par de valores, d es la media de estas diferencias y:

Sd =
∑ (d i − d )2 Sd =
Sd
n −1 n

µd) se calcula utilizando la


El intervalo de confianza para la media de la diferencia (µ
expresión:

Inferencia Estadística – Pruebas de hipótesis - 2016 14


P(d − tα .S d ≤ µ d ≤ d + tα .S d ) = 1 − α
2 2

Ejemplo prueba de hipótsis para µd


Para comparar la efectividad de dos insecticidas A y B, en la plantación infectada se fumigó
cada planta con ambos productos aplicándolos al azar en cada mitad de la planta. Al
tiempo se seleccionaron 10 hojas en cada mitad de cada planta fumigada y se registró el
número medio de insectos por hoja. Los datos registrados fueron los siguientes:

Solución:
Se deben comparar las medias poblacionales. Las muestras son dependientes, ya que
cada valor de número medio de insectos por hoja de una mitad de la planta que recibió
insecticida A se aparea con el promedio de insectos por hoja de la otra mitad de la misma
planta que recibió el insecticida B. Cada par de datos corresponde a una planta, se utiliza la
prueba t para muestras apareadas.

1) Ho: µd = 0 ⇒ los insecticidas tienen la misma efectividad


H1: µd ≠ 0 ⇒ los insecticidas no tienen la misma efectividad
2) Nivel de significación: α = 0,05
d − µd
3) Estadístico de prueba: tc = ≈ t14 / Ho es Verdadera para δ = (8 – 1) = 7
Sd
4) Criterios de decisión: Rechazo la Ho si y sólo si el tc es mayor que t(7; 0.025): 2,365 ó si tc es
menor que -t(7; 0.025): -2,365
T Student(14): p(evento)=0,0500
0,39

0,29

0,20

0,10

0,00
-5,40 -2,70 0,00 2,70 5,40

5) Cálculos:
Debo calcular los valores de di, su media y su desviación estándar:

Planta 1 2 3 4 5 6 7 8
Insecticida A 1,3 0,8 3,5 1,2 5,1 4,3 10,7 1,4
Insecticida B 2,1 1,5 3,9 1,8 5,0 5,4 12,9 1,1
di -0,8 -0,7 -0,4 -0,6 0,1 -1,1 -2,2 0,3

Sd
d = -0.68 Sd = 0.77 Sd = = 0.77 = 0.27
n 8

d − µ d (−0.68) − 0
tc = = = −2.48
Sd 0.27

6) Decisión: como tc es menor que -2,365, rechazo la Ho.


7) Conclusión: Se puede afirmar con una confianza del 95% que los insecticidas A y B no
tienen la misma efectividad. Además, como la diferencia se calculó como (A – B) y es
negativa, podemos deducir que el promedio de insectos por hoja del insecticida A es menor
que el del B, por lo tanto el insecticida A es más efectivo.

Inferencia Estadística – Pruebas de hipótesis - 2016 15


Si realizamos el análisis con InfoStat, la salida es:

Prueba T (muestras apareadas)


Obs(1) Obs(2) N media(dif) Media(1) Media(2)
Insecticida A Insecticida B 8 -0.68 3.54 4.21

DE(dif) LI(95%)) LS(95%)) T Bilateral


0.77 -1.32 -0.03 -2.48 0.0423

El valor de P es menor que 0,05, por lo que rechazo la Ho. La probabilidad de cometer un
error de tipo I al tomar esta decisión es de 0,0423.
Los valores de las columnas LI(95%) y LS (95%) corresponden a los límites inferior y
superior del intervalo de confianza del 95% para el parámetro µd , que en este caso estima
al promedio de la diferencia en el número medio de insectos por hoja.

Inferencia Estadística – Pruebas de hipótesis - 2016 16

También podría gustarte