05.2 Inferencia Estadc3adstica Prueba de Hipc3b3tesis
05.2 Inferencia Estadc3adstica Prueba de Hipc3b3tesis
05.2 Inferencia Estadc3adstica Prueba de Hipc3b3tesis
Área de Estadística
Material de apoyo didáctico elaborado por Silvia Sühring
TIPOS DE ERROR
Teniendo en cuenta dos cosas: la decisión que se tome en el 6º paso del
procedimiento de prueba de hipótesis, y la veracidad de la Ho, se pueden plantear
las siguientes situaciones:
Hipótesis nula
Decisión Verdadera Falsa
Rechazar Error de tipo Ι decisión correcta
P(eΙ) = α P = (1 - β)
No rechazar Decisión correcta error de tipo ΙΙ
P = (1 - α) P(eΙΙ) = β
0 ,3
0 ,2
α /2 1 - α α /2
0 ,1
0 ,0
-5 0 5
Z o n a d e re c h a z o Z o n a d e re c h az o
Z o n a d e n o re ch a zo
VC 1 VC 2
H0 H1
0.30
Densidad
0.20
0.10
0.00
-5.00 -2.50 0.00 2.50 5.00
β α
θ0 vc θ1
No rechazo Ho Rechazo Ho
1) AUMENTAR EL VALOR DE α
Como β y α son inversamente proporcionales, al aumentar α disminuye β y
por lo tanto aumenta la potencia (1 - β).
0.30
Densidad
0.20
0.10
0.00
-3.00 -1.00 1.00 3.00 5.00
0.30
Densidad
0.20
0.10
0.00
-3.00 -1.00 1.00 3.00 5.00
0.30
Densidad
0.20
0.10
0.00
-3.00 -0.75 1.50 3.75 6.00
0.30
Densidad
0.20
0.10
0.00
-3.00 -0.75 1.50 3.75 6.00
0.45
0.30
0.15
0.00
-5.00 -2.00 1.00 4.00 7.00
0.60
0.45
0.30
0.15
0.00
-5.00 -2.00 1.00 4.00 7.00
x − µ
zc =
s
n
Cuando el tamaño de la muestra de la cual se obtuvo la estimación de la media
poblacional es pequeño (<30), y se desconoce el valor de la varianza poblacional,
se utiliza la distribución t de Student. En este caso si la población es normal, el
estadístico de prueba para el test para µ será en este caso:
x − µ
tc = ≈ tδ
S
n
El estadístico tc sigue una distribución t de Student con δ = (n - 1) grados de
libertad.
En general, dado que si el tamaño de la muestra es grande (n >30) la distribución t
de Student converge a una normal, se puede utilizar siempre el segundo estadístico
de prueba planteado. Por esta razón la prueba para la media poblacional también
se llama “prueba t para una media”.
Solución
Los datos corresponden a valores de una variable cuantitativa continua registrada en cada
individuo de una muestra de camiones tomada de la población de camiones que circulan en
el acceso a la ciudad.
Datos: x = 86 db S = 0,81 db n = 40
En función del tamaño de la muestra se espera que x tenga distribución normal
Prueba de hipótesis para µ
1) Ho : µ ≤ 85,7 db ⇒ los camiones pueden circular
Hi : µ > 85,7 db ⇒ los camiones no deben circular
2) Nivel de significación: α = 0,05
3) Estadístico de prueba: Zc = ( x - µ)/ σ x ∼ Z / Ho es V
4) Criterios de decisión: Rechazo la Ho si y sólo si el Zc es mayor que 1,64
Normal(0,1): p(evento)=0,0500
0,40
0,30
0,20
0,10
0,00
-5,00 -2,50 0,00 2,50 5,00
5) Cálculos:
Solución
Los datos corresponden a valores de una variable cuantitativa continua registrada en cada
individuo de una muestra pequeña tomada de la población de cangrejos.
Prueba de hipótesis para la media poblacional
1) Ho : µ = 26,2 ºC ⇒ la temperatura corporal de los cangrejos es igual a la ambiental
Hi : µ < 26,2 ⇒ la temperatura corporal de los cangrejos es menor a la ambiental
2) Nivel de significación: α = 0,05
3) Estadístico de prueba: tc ∼ t7 / Ho es Verdadera
4) Criterios de decisión: Rechazo la Ho si y sólo si el tc es menor que -1,895
T Student(7): p(evento)=0,0500
0,39
0,29
0,19
0,10
0,00
-5,92 -2,96 0,00 2,96 5,92
5) Cálculos:
x = 25,04 ºC S = 0,69 ºC S x = 0,69 / √ 8 = 0,244 ºC
x − µ 25 . 04 − 26 . 2 26 . 04 − 26 . 2
tc = = = = − 4 . 75
S 0 . 69 0 . 244
n 8
6) Decisión: como tc es menor que -1,895, rechazo la Ho.
7) Conclusión: Se puede afirmar con una confianza del 95% que la temperatura corporal de
los cangrejos es menor que la temperatura ambiental.
Con InfoStat podemos hacer esta prueba si tenemos los datos cargados. La salida sería:
Prueba T para un parámetro
Valor del parámetro probado: 26.2
Variable n Media DE LS(95) T p(Unilateral I)
Temperatura 8 25,04 0,69 25,50 -4,75 0,0010
Notar que T = tc, la probabilidad para el valor T es 0,001 ⇒ menor que el nivel de significación ⇒
debo rechazar Ho. LS (95) corresponde la límite superior del intervalo de confianza para µ.
0.00 0.00
0.00
-5.00 -2.50 0.00 2.50 5.00 -5.00 -2.50 0.00 2.50 5.00
-5.00 -2.50 0.00 2.50 5.00
p −π p (1 − p)
Zc = donde σp =
σp n
Densidad
Densidad
0.06 0.06
0.06
0.00 0.00
0.00 3.81 7.62 11.44 15.25 0.00 0.00 3.81 7.62 11.44 15.25
Variable 0.00 3.81 7.62 11.44 15.25
Variable
Variable
(n − 1).S 2
X = 2
≈ χδ2 donde δ = (n - 1)
c
σ 2
Solución:
Prueba de hipótesis para la varianza poblacional
1) Ho : σ ≤ 280 kg /ton ⇒ la varianza no supera la cantidad establecida ⇒ comprará el
2 2 2
producto
Hi : σ2 > 280 kg2/ton2 ⇒ la varianza supera la cantidad establecida ⇒ no comprará el
producto
2) Nivel de significación: α = 0,05
3) Estadístico de prueba: X ∼ X 50 / Ho es Verdadera
2 2
0,030
0,020
0,010
0,000
0,00 25,00 50,00 75,00 100,00
5) Cálculos:
(n − 1).S 2 (51 − 1).340
X =2
= = 60.71
c
σ 2
280
6) Decisión: como X2c es menor que 67.5, no existen evidencias suficientes para rechazar
la Ho.
7) Conclusión: Dado que la varianza del contenido de fósforo no supera el nivel establecido
el comprador decidirá comprar el producto.
∆p − ∆π p1 (1 − p1 ) p2 (1 − p2 )
Z= σ ∆p = +
σ ∆p donde n1 n2
σ 2
2
σ 12 σ 12 σ 12
H1 : σ 12 ≠ σ 22 ⇒ ≠1 ó >1 ó <1
σ 22 σ 22 σ 22
En general se utiliza como H1 (σ21/σ22) >1, por lo que se toma como población 1 a la
que tiene mayor varianza.
Dado que la hipótesis nula que se plantea en esta prueba es que las varianzas
poblacionales son iguales, el estadístico de prueba se simplifica:
S12
Fc = ≈ Fδ1 ;δ 2 donde δ1 = n1 – 1 y δ2 = n2 – 1
S 22
Ho : ∆µ = 0
H1 : ∆µ ≠ 0 ó ∆µ < 0 ó ∆µ > 0
∆x − ∆µ
El estadístico de prueba que se utiliza es: tc = ≈ tδ
Sd
S 12 + S 22
Sd = y δ = 2n - 2
n
b) Si σ = σ22 ; n1 ≠ n2
2
1
c) Si σ21 ≠ σ22 ; n1 = n2
2
S 12 S 22
+
S 12 + S 22 n1 n 2
Sd = y δ = 2 2
− 2
n S1 2
S2 2
n1 + n 2
n1 − 1 n2 − 1
d) Si σ21 ≠ σ22 ; n1 ≠ n2
S 12 S2
Sd = + 2 y δ se calcula como en c)
n1 n2
Solución:
Interesa comparar las medias de las poblaciones “experimental” y “control” para evaluar si la
situación de tensión produce cambio en el tamaño promedio de la glándula. Dado que las
muestras son independientes se aplica la prueba t para muestras independientes.
Hipótesis: Ho : ∆µ = 0
Hi : ∆µ ≠ 0
Nivel de significación: α = 0.05
Grupo 1 Grupo 2
Grupo control Grupo Experimental
n 10 12
Media 4,16 5,18
Varianza 1,69 1,89
Media(1)-Media(2) -1,02
LI(95) -2,22
LS(95) 0,17
pHomVar 0,8773
T -1,78
gl 20
p-valor 0,0900
Sd =
∑ (d i − d )2 Sd =
Sd
n −1 n
Solución:
Se deben comparar las medias poblacionales. Las muestras son dependientes, ya que
cada valor de número medio de insectos por hoja de una mitad de la planta que recibió
insecticida A se aparea con el promedio de insectos por hoja de la otra mitad de la misma
planta que recibió el insecticida B. Cada par de datos corresponde a una planta, se utiliza la
prueba t para muestras apareadas.
0,29
0,20
0,10
0,00
-5,40 -2,70 0,00 2,70 5,40
5) Cálculos:
Debo calcular los valores de di, su media y su desviación estándar:
Planta 1 2 3 4 5 6 7 8
Insecticida A 1,3 0,8 3,5 1,2 5,1 4,3 10,7 1,4
Insecticida B 2,1 1,5 3,9 1,8 5,0 5,4 12,9 1,1
di -0,8 -0,7 -0,4 -0,6 0,1 -1,1 -2,2 0,3
Sd
d = -0.68 Sd = 0.77 Sd = = 0.77 = 0.27
n 8
d − µ d (−0.68) − 0
tc = = = −2.48
Sd 0.27
El valor de P es menor que 0,05, por lo que rechazo la Ho. La probabilidad de cometer un
error de tipo I al tomar esta decisión es de 0,0423.
Los valores de las columnas LI(95%) y LS (95%) corresponden a los límites inferior y
superior del intervalo de confianza del 95% para el parámetro µd , que en este caso estima
al promedio de la diferencia en el número medio de insectos por hoja.