Prueba de Hipotesis - ANOVA

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 138

Fundamentos de Pruebas de

Hipótesis: Pruebas de una muestra

Lic. Daniel Fortuna Chap 9-1


¿Que es una hipótesis?
 Una hipótesis es un supuesto
acerca de un parámetro
poblacional:
 Media poblacional
Ejemplo: La media mensual de las
facturas de los teléfonos celulares en
esta ciudad es μ = $420

 Proporción poblacional
Ejemplo: La proporción de adultos en ésta
ciudad con teléfonos celulares es π>= 0.88
Chap 9-2
La hipótesis Nula H0

 Establece el estado del supuesto a ser probado


Ejemplo: El numero promedio de TV en las casas de esta
ciudad, es igual a tres televisores

 Es siempre acerca de un parámetro poblacional


jamás sobre un estadístico muestral,

H0 : μ  3 H0 : X  3

Chap 9-3
La Hipótesis Nula , H0
(continua)

 Empieza con el supuesto que la hipótesis nula es


verdadera. Es la Hipótesis que siempre es
testeada.
 Similar a inocente mientras
no se pruebe lo contrario
 Se refiere al mantenimiento del status quo
 Siempre se refiere a un valor específico del
parámetro poblacional, nunca del estadístico
muestral
 No innovar
 Siempre contiene los signos “=” , (“≤” o “” )
 Puede o no ser rechazada Chap 9-4
La Hipótesis Alternativa H1
 Es la opuesta a la hipótesis nula
 P.ej., El promedio del numero de TV en ésta
ciudad es distinto a 3 ( H1: μ ≠ 3 )
 Representa una afirmación de
investigación o inferencia específica que se
quiera demostrar.
 Representa la conclusión si la Hipótesis
nula es rechazada.
 Nunca contiene los signos “=” , (“≤” o “”)
 Es generalmente la hipótesis que el
investigador desea probar Chap 9-5
Las Hipótesis Nula (H0) y
Alternativa (H1)

Si no se rechaza la
Hipótesis nula, no se
ha podido demostrar la
Hipótesis alternativa,
pero no poder
demostrar la Hipótesis
alternativa no quiere
decir que se haya
demostrado la
Hipótesis nula.
Chap 9-6
Proceso de la Prueba de hipótesis

Supuesto: La edad media poblacional es 50 años


Hipótesis Nula : Poblacion
H0: μ = 50
Hipótesis Alternativa :
H1: μ ≠ 50 Seleccionamos
una muestra
aleatoria
Es cierta μ = 50?
Calculamos
Efectuamos la La Edad media Muestra
prueba de Muestral y
Hipótesis, supongamos
que es 45 años
X = 45
Proceso de la Prueba de hipótesis

Efectuamos la
prueba de
Hipótesis,

Si rechazamos Si no rechazamos la
la H0, H0, no podemos
aceptamos la afirmarla, sólo no
H1: La edad de podemos decir que la
la población no edad de la población
es 50 años sea distinta de 50 años
Regiones de Rechazo y No Rechazo

/2 /2
1- 
X
Rechazo Región de no Rechazo
H0
-Z
rechazo H0
+Z
H0 Z
0

valor valor
crítico crítico
Inferior Superior

Chap 9-9
Nivel de significación y
la Región de Rechazo
Nivel de significación = 

H0: μ = a /2 /2


H1: μ ≠ a Prueba de dos
colas VCI VCS

H0: μ ≤ a 
H1: μ > a
Cola superior VCS

H0: μ ≥ a

H1: μ < a
Cola inferior VCI

Chap 9-10
Errores de las pruebas y sus
Probabilidades

Posible resultados de las hipótesis

Situación Actual
Decisión H0 Verdadera H0 Falsa
No
No hay error Error Tipo II
Rechazar
H0
1-  β

Rechazar Error Tipo I No hay Error


H0  1-β

Chap 9-11
Nivel de significación 

 Es la probabilidad de cometer error de tipo I:


Rechazar una H0 verdadera
 Es la probabilidad de rechazo bajo la H0
 Determina el tamaño de la región de rechazo
 Se denota por  ,
 valores usuales son 0.01, 0.05, o 0.10
 Es seleccionado por el investigador al inicio
 Provee los valores críticos de la prueba

Chap 9-12
Nivel de Confianza 1-α

 Es el complemento de la probabilidad de error


de tipo I
 Es la probabilidad de no rechazar la H0 cuando
es verdadera (y por lo tanto no debe
rechazarse)
 Es una decisión correcta
 Valores Usuales son: 0,99; 0,95 y 0,90

Chap 9-13
Errores en la Toma de Decisiones

 Error Tipo I, de 1er especie, o del


productor
 Rechazar una hipótesis nula cuando es
verdadera
 Considerado un tipo serio de error

La probabilidad del error de tipo I Error es 


 Llamado nivel de significación de la prueba
 Definido por el investigador al inicio

Chap 9-14
Errores en la Toma de Decisiones
(continua)

 Error de Tipo II, de 2da Especie o, del


consumidor
 No Rechazar la hipótesis nula cuando es
falsa

La probabilidad del Tipo II, Error β

Chap 9-15
Relaciones de los Errores Tipo I y
II

Los Errores Tipo I y Tipo II no pueden variar en


el mismo sentido
Errorde Tipo I puede sólo ocurrir cuando H0
es verdadera
 Error Tipo II puede solo ocurrir si H0 falso

Si la probabilidad del error Tipo I (  ) ,


entonces la probabilidad del error Tipo II ( β )
Chap 9-16
Factores que Afectan al Error deTipo II

 Manteniéndose igual las demás condiciones


 β cuando las diferencias entre el parámetro
hipotetizados y el valor verdadero

 β cuando 
 β cuando σ
 β cuando n

Chap 9-17
6 Pasos en la Prueba de
hipótesis
1. Establecer la hipótesis nula H0 ,y, la hipótesis
alternativa, H1
2. Elegir el nivel de significación, , y el tamaño
de la muestra n
3. Determinar el estadístico, y, la distribución de
la Prueba de Hipótesis
4. Determinar ,el ,o los valores críticos, que
divide en dos regiones, rechazo, o aceptación
de la hipótesis nula

Chap 9-18
6 Pasos en la Prueba de
hipótesis
(continua)

5. Reunir los datos y calcular el valor del


estadístico de la prueba
6. En base al estadístico tomar la decisión, y,
señalar las conclusiones del investigador, de
acuerdo a que el estadístico caiga en la región
de aceptación, o rechazo de la hipótesis nula
H0.

Chap 9-19
Prueba de Hipótesis para la media

Prueba de hipótesis para 

 Conocida 
Prueba Z Desconocida

Muestra grande Muestra chica


Prueba Z Prueba t

Chap 9-20
Prueba de hipótesis Z para la
media (σ conocida o n>30)

Prueba de hipótesis para 

 Conocida 
Prueba Z Desconocida

Muestra grande Muestra chica


Prueba Z Prueba t

Chap 9-21
Prueba de hipótesis Z para la
media (σ conocida o n>30)

El estadístico es:

X μ
Z 
σ
n
Chap 9-22
Prueba de dos colas
H0: μ = a
 Hay dos valores H1: μ  a
de corte (valores
críticos),
definiendo las /2 1- /2
regiones de
rechazo
a X
Rechazo Región de no Rechazo
H0
-Z
rechazo H0
+Z
H0 Z
0

valor valor
crítico crítico
Inferior Superior
Chap 9-23
Prueba de una cola
(superior o derecha)

H0: μ ≤a  Hay un valor de


H1: μ  a corte (valor
crítico),
definiendo las
1-  regiones de
rechazo y no
X rechazo
a
Región de no Rechazo
rechazo H0
+Z
H0 Z
0
valor
crítico
Superior
Chap 9-24
Prueba de una cola
(inferior o izquierda)

H0: μ ≥a
 Hay un valor de
H1: μ < a
corte (valor
crítico),
 1-
definiendo las
regiones de
rechazo y no
a X rechazo
Rechazo Región de no
H0 rechazo H0
-Z
0

valor
crítico
Inferior
Chap 9-25
Ejemplo de la Prueba de hipótesis
Probar la afirmación que el numero de TV de las casas
de la ciudad es igual a 3.
(Suponemos σ = 0.8)
1. Establecer las apropiadas hipótesis nula y
alternativa
 H0: μ = 3 H1: μ ≠ 3 (Prueba a dos colas)
2. Especificamos el nivel de significación deseado y
el tamaño de la muestra
 Suponemos que  = 0.05 y n = 100 son elegidos

Chap 9-26
Ejemplo de la Prueba de hipótesis
(continua)

3. Determinar la técnica apropiada


 σ es conocida entonces se usa la prueba Z .
4. Determinar el, o los valores críticos
 Para  = 0.05 el valor crítico de z, es ±1.96
5. Reunir los datos y calcular el estadístico de la
prueba
 Supongamos que los resultados muestrales son
n = 100, X = 2.84 (σ = 0.8 se supone conocida)
Así el estadístico de la prueba es:
Xμ 2.84  3  .16
Z     2.0
σ 0.8 .08
n 100
Chap 9-27
Ejemplo de la Prueba de hipótesis
(continua
 6. ¿cae el estadístico de la prueba en la región de
rechazo, o en la de aceptación?
 = 0.05/2  = 0.05/2
Rechazo H0
si Z < -1.96
o, Z > 1.96; Rechazo No rechazo de Rechazo
En otro H0 H0 H0
-Z= -1.96 0 +Z= +1.96
caso no
rechazar H0
donde, Z = -2.0 < -1.96, así que
el estadístico de la prueba cae
en la región de rechazo
Chap 9-28
Ejemplo de la Prueba de hipótesis
(continua
6(continúa). Se toma la decisión, y, se interpreta el
resultado

 = 0.05/2  = 0.05/2

Rechazo No rechazo H0 Rechazo


H0 H0
-Z= -1.96 0 +Z= +1.96
-2.0
Siendo Z = -2.0 < -1.96, rechazamos la hipótesis nula
y concluimos, con un 95% de confianza, que la
evidencia es suficiente para afirmar que el numero
medio de aparato de TVs en la ciudad no es igual a 3
Chap 9-29
Prueba utilizando el p-Value

 p-value: Probabilidad de obtener un valor de


la prueba más extremo ( < ó >) que el valor
observado muestral dado que H0 es
verdadera
 Es también llamado nivel de significación
observado

 Pequeños valores de , para los cuales H0


puede ser rechazados

Chap 9-30
Ejemplo de la Prueba de hipótesis
(continua

 Convertir estadísticos muestrales (p.ej., X )


siendo el estadístico de la prueba (p.ej el
estadístico, Z )
 Obtener el p-value de la salida de la
computadora o de la tabla
 Comparar el p-value con 
 Si p-value <  , rechazo H0
 Si p-value   , no rechazo H0

Chap 9-31
p-Value Ejemplo
(continua)

El p-value nos indica


hasta qué nivel de
significación (α) se
puede rechazar la
Hipótesis Nula (H0)

Chap 9-32
Conexión con los Intervalos de
Confianza
 para X = 2.84, σ = 0.8 y n = 100, el intervalo de
confianza al 95% es:

0.8 0.8
2.84 - (1.96)    2.84  (1.96)
100 100

2.6832 ≤ μ ≤ 2.9968

 Como el intervalo no contiene la media hipotética (3.0),


rechazamos la hipótesis nula al  = 0.05
Conexión con los Intervalos
de Confianza

Si el intervalo de
confianza no contiene
al valor hipotetizado,
se rechaza la
Hipótesis Nula para
ese nivel de
significación

Chap 9-34
Pruebas de una cola

 En algunos casos la hipótesis alternativa se


focaliza en una dirección particular

Esta es una prueba de cola inferior-


H0: μ ≥ 3
pues allí se focaliza la hipótesis de
H1: μ < 3 que la media poblacional es menor
que 3
H0: μ ≤ 3 Esta es una prueba de cola superior
pues la hipótesis alternativa se
H1: μ > 3
focaliza en la cola superior o mayor
de 3

Chap 9-35
Prueba de cola izquierda
H0: μ ≥ 3
 Hay un solo valor H1: μ < 3
crítico siendo la
región de rechazo
pues el área de 
rechazo es solo de
una cola Rechazo No rechazo H0
Z
H0 -Z 0

μ X

valor
Crítico
Chap 9-36
Prueba de cola derecha

H0: μ ≤ 3
 Hay solo un valor
critico, estando el H1: μ > 3
área de rechazo solo
en una cola 

no rechazo H0 Rechazo
Z Zα H0
0
_
X μ

Valor
Crítico
Chap 9-37
Ejemplo: Cola derecha Prueba Z
para la media ( Conocida
Una empresa de telefonía celular piensa que el
consumo promedio de los clientes mensuales
superará el promedio de $420 por mes. La
empresa desea probar ésta hipótesis.
(Suponemos que  = 80 es conocida)

La prueba de hipótesis

H0: μ ≤ 420, el promedio no es superior a $420 mensuales


H1: μ > 420, el promedio es superior a $420 mensuales
(p.ej., hay suficiente evidencia del supuesto del ejecutivo)

Chap 9-38
Ejemplo: Encontrar la región de
rechazo
(continua)
 Supongamos que  = 0.10 es elegido para la
prueba
Determine la región de rechazo: Rechazo
H0

 = 0.10

No rechazo H0 Rechazo
0 1.28 H0

Rechazo H0 si Z > 1.28

Chap 9-39
Revisión de:
Valor Crítico de una cola
¿Cuál es el valor de Z dado
 = 0.10?
0.90 0.10

 = 0.10
0.90

z 0 1.28

Valor Crítico = 1.28

Chap 9-40
Ejemplo: Estadístico de la Prueba
(continua)

Obtener una muestra y calcular el estadístico de la


prueba

Suponemos que se toma una muestra con los


siguientes resultados: n = 64, X = 428
(=10 se supone conocida)

 El estadístico de la prueba es:


Xμ 428  420
Z    0.8
σ 80
n 64
Chap 9-41
Ejemplo: Decisión
(continua)
Tomar una decisión e interpretar el resultado
Rechazar
H0

 = 0.10

No rechazar H0 Rechazar
1.28 H0
0
Z = 0.8

No rechazar H0 pues Z = 0.8 ≤ 1.28


p.ej.:No hay evidencia suficiente para aceptar
que la media es superior a $420
Chap 9-42
Prueba de hipótesis para la
media (σ Desconocida n<30)

Prueba de hipótesis para 

 Conocida 
Prueba Z Desconocida

Muestra grande Muestra chica


Prueba Z Prueba t

Chap 9-43
Prueba de hipótesis para la
media (σ Desconocida n<30)

El estadístico es:

X μ
t n 1  
S
n

Chap 9-44
Ejemplo: Prueba de dos colas, distribución t
( desconocida)

El costo promedio de una habitación


en New York se sitúa en $168 por
noche.
Una muestra aleatoria de 25 hoteles
proporciona una X = $172.50 y ,
S = $15.40. Probar para el nivel H0: μ = 168
 = 0.05 . H1: μ  168
(Suponiendo que la distribución
poblacional es normal)

Chap 9-45
Ejemplo Solución:
Prueba de dos colas

H0: μ = 168 /2=.025 /2=.025


H1: μ  168

  = 0.05 Rechazo no rechazo H0 Reject H0


t n-1,α/2
H0 -t n-1,α/2 0
 n = 25 -2.0639 2.0639
  es
desconocido, por
ello, usamos una
prueba tn-1
 Valor Crítico :
t24 = ± 2.0639
Chap 9-46
Ejemplo Solución:
Prueba de dos colas

H0: μ = 168 /2=.025 /2=.025


H1: μ  168

  = 0.05 Rechazo no rechazo H0 Reject H0


t n-1,α/2
H0 -t n-1,α/2 0
 n = 25 -2.0639 2.0639
1.46
  es
desconocido, por X μ 172.50  168
t n 1    1.46
ello, usamos un S 15.40
estadístico t n 25
 Valor Crítico :
No rechazo H0: no hay suficiente evidencia,
t24 = ± 2.0639 que el costo medio verdadero es diferente a
$168
Chap 9-47
Conexión con el Intervalo de Confianza

 Para X = 172.5, S = 15.40 y n = 25, el intervalo


de confianza al 95% ,es:

15.4 15.4
172.5 − 2.0639 172.5 ≤ µ≤ 172.5 + 2.0639 172.5
25 25

166.14 ≤ μ ≤ 178.86

 Como el intervalo contiene la media hipotética (168), no


podemos rechazar la hipótesis nula a un nivel  = 0.05
Prueba de hipótesis para la
proporción

 Involucra variables categorícas


 Dos posibles resultados
 “Exitos” (posee una cierta característica)
 “Fracaso” ( no posee la característica)

 Fracción o proporción de la población en la


categoría “éxito” se denota por π

Chap 9-49
Ejemplo: Prueba Z para la
proporción

Una empresa marketinera


supone que recibe 8% de
respuesta de su mailing.
Para ésta prueba, se toma
una muestra aleatoria de
500 encuestas, obteniendo
25 respuestas. La prueba
Chequeamos
se realiza a un nivel de
significación de  = 0.05 . n π = (500)(.08) = 40

n(1-π) = (500)(.92) = 460

Chap 9-50
Prueba Z la proporción: Solución

H0: π = 0.08  = 0.05


H1: π  0.08 n = 500, p = 0.05

Rechazo Rechazo

.025 .025

-1.96 0 1.96
z

Valores Críticos : ± 1.96


Chap 9-51
Prueba Z la proporción: Solución

estadístico de la p  .05  .08


Z   2.47
prueba:  (1   ) .08(1  .08)
n 500

Rechazo Rechazo

.025 .025

-1.96 0 1.96
z

-2.47
Chap 9-52
Prueba Z la proporción: Solución

Conclusión:

Rechazar H0 para α= 0.05

Decisión:

Hay evidencia suficiente


para suponer que el nivel
de respuesta no es del 8%
Chap 9-53
Potencia de la prueba
1. Prueba de una cola es mas potente que la prueba
de dos colas
2. Ante un incremento en el nivel de significación (),
resulta en un incremento de la potencia
3. Ante un incremento en el tamaño de la muestra
resulta un incremento de la potencia de la prueba
4. El error de tipo II y la potencia de la prueba se dan
cuando el parámetro poblacional adopta valores
específicos que están incluidos en la Hipótesis
Alternativa.
5. Cuanto más se aleja la verdadera media de la
media postulada, mayor es la potencia
Chap 9-54
Prueba de dos muestras

Lic. Daniel Fortuna Chap 10-55


Pruebas de dos muestras

Pruebas de dos
muestras

Medias Proporciones Varianzas


Poblacionales Poblacionales Poblacionales

Muestras Muestras
Independientes Dependientes

Chap 10-56
Diferencia entre dos medias

Medias poblacionales Objetivo: Las pruebas de


hipótesis o intervalos de
confianza entre dos medias,
μ1 – μ
σ1 y σ2 conocidas

La estimación puntual para las


σ1 y σ2 desconocidas pero diferencias es
supuestamente iguales

X1 – X2
σ1 y σ2 desconocidas
desiguales

Chap 10-57
Diferencia entre dos medias
(Muestras Independientes)

 Fuentes de datos diferentes


Medias poblacionales
de muestras  No relacionados
independientes  Independientes
 Muestras seleccionadas de
una población no tiene efecto
σ1 y σ2 conocidas sobre la muestra seleccionada
de otra población
σ1 y σ2 desconocidas pero  Se usa la diferencia entre dos
supuestamente iguales medias muestrales
 Se utiliza la prueba Z
σ1 y σ2 desconocidas amalgamada y la prueba t
desiguales

Chap 10-58
Diferencia entre dos medias

Medias poblacionales
de muestras
independientes

Usamos un estadístico de
σ1 y σ2 conocidas la prueba Z
Usamos Sp para estimar σ , usamos el
σ1 y σ2 desconocidas pero estadístico t y la desviación estándar
supuestamente iguales amalgamada

σ1 y σ2 desconocidas Usamos S1 y S2 para estimar la


dispersión desconocida σ1 y σ2,
desiguales
usamos la prueba t

Chap 10-59
σ1 y σ2 Conocidas

Medias poblacionales Supuestos:


de muestras
independientes
 Muestras aleatoria e
independientemente
σ1 y σ2 conocidas
extraídas
σ1 y σ2 desconocidas pero
supuestamente iguales
 Distribuciones
poblacionales, normales
σ1 y σ2 desconocidas o, las dos provenientes de
desiguales muestras son  30
Chap 10-60
σ1 y σ2 Conocidas
(continua)

Medias poblacionales Cuando σ1 y σ2 son conocidas, ambas


de muestras poblaciones son normales, y, ambos
independientes tamaños de las muestras son como
mínimo 30, el estadístico de la prueba es
Z-value…
σ1 y σ2 conocidas

σ1 y σ2 desconocidas pero
Z
 X 1 
 X 2   μ1  μ2 
supuestamente iguales 2 2
σ σ2
1

σ1 y σ2 desconocidas n1 n2
desiguales

Chap 10-61
Prueba de hipótesis para μ1 – μ2
Dos medias poblacionales, muestras independientes

Prueba de cola Prueba de cola derecha: Prueba a dos colas:


izquierda:
H0: μ1 – μ2  0 H0: μ1 – μ2 ≤ 0 H0: μ1 – μ2 = 0
H1: μ1 – μ2 < 0 H1: μ1 – μ2 > 0 H1: μ1 – μ2 ≠ 0

  /2 /2

-z z -z/2 z/2


Rechazar H0 si Z < Rechazar H0 si Z Rechazar H0 si Z < -
-Z > Z Z/2 o Z > Z/2

Chap 10-62
Intervalo de Confianza,
σ1 y σ2 Conocida

Medias poblacionales
de muestras El intervalo de confianza es
independientes μ1 – μ2 :

 
σ1 y σ2 conocidas 2 2
σ σ2
X1  X 2  Z 1

σ1 y σ2 desconocidas n1 n2
supuestas iguales

σ1 y σ2 desconocidas
supuestas diferentes

Chap 10-63
σ1 y σ2 desconocidas supuestas
iguales

Medias poblacionales Supuestos:


de muestras
independientes
 Las muestras son aleatoria
e
σ1 y σ2 conocidas independiente extraídas

σ1 y σ2 desconocidas  Poblaciones son


supuestas iguales normalmente distribuidas, o,
ambos tamaños de las
σ1 y σ2 desconocidas muestras son como mínimo
supuestas diferentes
30
Chap 10-64
σ1 y σ2 desconocidas
supuestamente iguales
(continua)

Construimos estimaciones
Medias poblacionales
de muestras de intervalos:
independientes
 Las varianzas
σ1 y σ2 conocidas poblacionales se suponen
iguales, así que utilizamos
σ1 y σ2 desconocidas las varianzas de las dos
supuestas iguales muestras, y, la
amalgamamos para
σ1 y σ2 desconocidas estimar la varianza común
supuestas diferentes
S2
Chap 10-65
σ1 y σ2 desconocidas supuestas
iguales
(continua)

Medias poblacionales
de muestras
independientes

La varianza amalgamada es:


σ1 y σ2 conocidas

σ1 y σ2 desconocidas S 2

n1  1S
1
2
 n2  1S2
2

(n1  1)  (n2  1)
p
supuestas iguales

σ1 y σ2 desconocidas
supuestas diferentes

Chap 10-66
σ1 y σ2 Desconocidas Supuestas
iguales
(continua)
El estadístico de la prueba para estimar
Medias poblacionales μ1 – μ2 es :
de muestras

 X  X   μ  μ 
independientes

t
1 2 1 2
σ1 y σ2 conocidas
1 1 
S   
2
p
σ1 y σ2 desconocidas  n1 n2 
supuestas iguales
donde t tiene (n1 + n2 – 2) g de l.,
y
σ1 y σ2 desconocidas
S 2

n1  1S1  n2  1S2
2 2

supuestas diferentes
(n1  1)  (n2  1)
p

Chap 10-67
Intervalos de Confianza,
σ1 y σ2 desconocidos

Medias poblacionales El intervalo de confianza es


de muestras
independientes μ1 – μ2

σ1 y σ2 conocidas
X  X   t
1 2 n1 n2 -2
1 1 
S   
2
p
 n1 n2 
σ1 y σ2 desconocidas
supuestas iguales
Donde:

σ1 y σ2 desconocidas n
S2  1
 1 S1
2
 n 2  1 S 2
2

(n1  1)  (n2  1)
p
supuestas diferentes

Chap 10-68
Varianza amalgamada-Prueba t
Ejemplo

Ud es un analista financiero para una firma de


brokers. ¿Hay diferencias en los dividendos de
las acciones de los índices NYSE & NASDAQ?
Se obtuvieron los siguientesMERVAL
datos: BOVESPA
Muestra (n) 21 25
Media muestral (x) 3,27 2,53
Desvío estándar (s) 1,3 1,16
Supongamos que, ambas poblaciones son
aproximadamente normales con
varianzas iguales ¿hay diferencias en el
promedio de ambos mercados ( = 0.05)?

Chap 10-69
Desarrollando el estadístico de la
prueba
El estadístico de la prueba es::

t
X  X   μ  μ 
1 2
 1 2 3.27  2.53   0  2.040
1 1  1 1 
S   
2
1.5021  
 21 25 
p
 n1 n2 

n
S2  1
 1S1
2
 n 2  1S 2
2

21  11.30 2
 25  11.16 2
 1.5021
(n1  1)  (n2  1) (21 - 1)  (25  1)
p

Chap 10-70
Solución
H0: μ1 - μ2 = 0 ó (μ1 = μ2)  = 0.05
H1: μ1 - μ2 ≠ 0 ó (μ1 ≠ μ2) gl = 21 + 25 - 2 = 44
Rechazo H0 Rechazo H0

Rechazo H0 al  = 0.05

.025 .025 Hay evidencia de


diferencias en las
0 t medias de los dos
-2.0154 2.0154
mercados.
2.040
Chap 10-71
σ1 y σ2 Desconocidas y distintas

Supuestos:
Medias poblacionales
de muestras
independientes Muestras aleatorias e
independientes elegidas
σ1 y σ2 conocidas
Las mismas están
distribuidas
σ1 y σ2 desconocidas normalmente y los
supuestas iguales tamaños de
cada una es mayor que 30
σ1 y σ2 desconocidas
supuestas diferentes Las varianzas
poblacionales son Chap 10-72
σ1 y σ2 desconocidas,
No se suponen iguales
(continua

Medias poblacionales
de muestras Determinando el
independientes estadístico de la prueba:

σ1 y σ2 conocidas  Las varianzas


poblacionales no se
σ1 y σ2 desconocidas suponen iguales y se
supuestas iguales incluyen las dos varianzas
muestrales para calcular
σ1 y σ2 desconocidas el estadístico t de la
supuestas diferentes
prueba
Chap 10-73
σ1 y σ2 desconocidas no se
suponen iguales
(continua)

Medias poblacionales El numero de grados de


de muestras
independientes libertad es la parte entera
de:
σ1 y σ2 conocidas 2
 S1 S2 
2 2
  
n 
   12 2 
n
σ1 y σ2 desconocidas
2 2
supuestas iguales  S1   S2 
2
   
n  n 
 1   2 
σ1 y σ2 desconocidas
supuestas diferentes
* n1  1 n 2 1
Chap 10-74
σ1 y σ2 desconocidas,
No se suponen iguales
(continua

Medias poblacionales
de muestras El estadístico de la prueba es
independientes

 X  X   μ  μ 
σ1 y σ2 conocidas

t
1 2 1 2
σ1 y σ2 desconocidas 2 2
S S

supuestas iguales 1 2
n1 n2
σ1 y σ2 desconocidas
supuestas diferentes
*
Chap 10-75
Poblaciones relacionadas
Prueba de dos medias poblacionales relacionadas
 Muestras apareadas o (antes/después)
Muestras  Mediciones repetidas
relacionadas  Utiliza diferencias entre valores:

Di = X1i - X2i
 Elimina la Variación entre sujetos
 Supuestos:
 Ambas poblaciones están normalmente distribuías
 O, si no es normal, utilizar muestras grandes

Chap 10-76
Diferencia de Medias, σD
Conocidas
La diferencia iesima apareada es Di , donde

Muestras Di = X1i - X2i


relacionadas
n
La estimación puntual para la
media poblacional de las
D i
diferencias apareadas es D : D i1
n
Suponemos que la desviación estándar
poblacional de las diferencias de los
resultados , σD, es conocida

n es el numero de pares de muestras


apareadas
Chap 10-77
Diferencia de Medias, σD
Conocidas
(continua)
El estadístico de la prueba para la
diferencia de medias es el valor del
Muestras estadístico Z :
apareadas
D  μD
Z
σD
n
donde
μD = diferencia de medias hipotetizada
σD = desv estándar. poblacional de las
diferencias
n = tamaño de la muestra (numero de pares)
Chap 10-78
Intervalo de Confianza σD conocida

Muestras El intervalo de confianza para μD es


apareadas
σD
DZ
n
donde
n = el tamaño de la muestra
(numero de pares en la muestra
apareada)

Chap 10-79
Diferencia de Medias, σD
Desconocida

Si σD es desconocida, podemos estimar la


Muestras
desviación estándar poblacional
apareadas
desconocida utilizando la desviación
estándar de una muestra:

La desviación estándar n

muestral es  i
(D  D ) 2

SD  i 1
n 1

Chap 10-80
Diferencia de Medias, σD
Desconocida
(continua)

 Usamos como prueba la t, el estadístico D es


Muestras ahora el estadístico t, con n-1 gl.:
apareadas
D  μD
t
SD
n
n
donde t tiene n - 1 gl.
y SD es:
 i
(D  D ) 2

SD  i 1
n 1
Chap 10-81
Intervalo de Confianza, σD
desconocido

Muestras El intervalo de confianza para μD


apareadas
SD
D  t n1
n
n

 (D i  D )2
donde SD  i 1
n 1

Chap 10-82
Pruebas de hipótesis para la
Diferencia de Medias, σD Desconocida
Muestras apareadas

Prueba de Cola Prueba de cola Prueba de dos


izquierda: derecha: colas:
H0: μD  0 H0: μD ≤ 0 H0: μD = 0
H1: μD < 0 H1: μD > 0 H1: μD ≠ 0

  /2 /2

-t t -t/2 t/2


Rechazo H0 si t < -t Rechazo H0 si t > t Rechazo H0 si
t < -t/2 o t > t/2
donde t tiene n - 1 gl.
Chap 10-83
Ejemplo de Prueba t apareada

 Supongamos que envía la fuerza de ventas a un servicio al consumidor


para entrenarlos ¿Ha habido diferencias en el numero de ventas
realizadas después de realizarlo? Se dispone de los siguientes datos:
VENDEDOR ANTES DESPUES DIFERENCIA
(1) (2) (2-1)
C.B 6 4 -2
T.F 20 6 -14
M.H 3 2 -1
R.K 0 0 0
M.O 4 0 -4
DIFERENCIA TOTAL -21

D
 Di = 4.2 SD =
 i
(D - D) 2

= 5.67
n n-1 Chap 10-84
Prueba para Muestras apareadas
Solución
 ¿Ha servido el entrenamiento para aumentar las ventas
(nivel de significación 0.01 )?
Rechazo Rechazo
H0: μD =
0 /2 /2
H1: μD 
= D =- 4.2 - 4.604 4.604
0 - 1.66
Valor Crítico = ±
.01
4.604 gl = n - 1 = 4 Decisión No rechazar
Estadístico de la prueba H0 (el estadístico t no cae en la
región de rechazo)
D  μD  4.2  0
t    1.66 Conclusión: No hay
S D / n 5.67/ 5 cambios significativos
Chap 10-85
Diferencia de dos proporciones
poblacionales
Objetivo: Probar una hipótesis o construir un
intervalo de confianza para la diferencia de dos
Proporciones proporciones poblacionales,
Poblacionales
π1 – π2

Supuestos:
n1 π1  5 , n1(1- π1)  5
n2 π2  5 , n2(1- π2)  5

La estimación puntual para


estimar la diferencia de las
dos proporciones es
p1  p 2
Chap 10-86
Diferencia de dos proporcioónes
poblacionales
Empezamos bajo el supuesto que la hipótesis nula es
verdadera , y, asumimos que π1 = π2 utilizamos las
dos estimaciones muestrales
Proporciones
Poblacionales
La estimación de la proporción
total es:

X1  X 2
p
n1  n2
donde X1 y X2 son los números de las
muestras 1 y 2 que poseen la
característica de interés
Chap 10-87
Diferencia de dos proporciones
poblacionales
(continua)
El estadístico de la prueba para p1 – p2
es el estadístico Z
Proporciones
Poblacionales

Z
 p1  p2    π1  π2 
1 1
p (1 p)   
 n1 n2 
X1  X2 X X
donde p , p1  1 , p 2  2
n1  n2 n1 n2
Chap 10-88
Intervalo de Confianza
para la diferencia de dos
proporciones poblacionales

Proporciones El intervalo de confianza para


Poblacionales
π1 – π2 es:

p1(1 p1 ) p2 (1 p2 )
 p1  p2  Z 
n1 n2

Chap 10-89
Prueba de hipótesis para la diferencia
de dos proporciones poblacionales
(continua)
Prueba de cola Prueba de cola Prueba de dos colas:
inferior: superior
H0: π1  π2 H0: π1 ≤ π2 H0: π1 = π2
H1: π1 < π2 H1: π1 > π2 H1: π1 ≠ π2
ó ó ó
H0: π1 – π2  0 H0: π1 – π2 ≤ 0 H0: π1 – π2 = 0
H1: π1 – π2 < 0 H1: π1 – π2 > 0 H1: π1 – π2 ≠ 0

  /2 /2

-z z -z/2 z/2


Rechazo H0 si Z < Rechazo H0 si Z > Rechazo H0 si Z < -
-Z Z Z/2 o Z > Z/2
Chap 10-90
Ejemplo:
Diferencia de dos proporciones
poblacionales
¿Hay diferencias significativas entre las
proporciones de hombres y mujeres acerca
de la aceptación de una propuesta A?

 En una muestra aleatoria, 36 de 72 hombres y


31 de 50 mujeres indicaron que votaran por el
Si

 Probar lo afirmado a un nivel de significación


del .05

Chap 10-91
Ejemplo: Diferencias entre dos
proporciones poblacionales
(continua)

 La prueba de hipótesis es:


H0: π1 – π2 = 0 (las dos proporciones son iguales)
H1: π1 – π2 ≠ 0 (hay diferencias entre las proporciones)

 Las proporciones muestrales son:


 Hombre: p1 = 36/72 = .50
 Mujer p2 = 31/50 = .62
 La estimación amalgamada de la proporción total es:
X1  X 2 36  31 67
p    .549
n1  n2 72  50 122

Chap 10-92
Ejemplo: La diferencia de dos
proporciones poblacionales
(continua)
Rechazar Rechazar
El estadístico de la prueba para π1 – π2 es: H0 H0

.025 .025
z
 p1  p2     1   2 
1 1
p (1  p)    -1.96 1.96
 n1 n2  -1.31

 .50  .62    0   1.31
 1 1  Decisión: No rechazar
.549 (1  .549)    H0
 72 50  Conclusión: No hay evidencia
significativa de que la diferencia
entre las proporciones por el Si de
Valores Críticos = hombres y mujeres sean distintas.
±1.96
Para  = .05
Chap 10-93
Prueba de hipótesis para las
varianzas

Prueba para dos


Varianzas
poblacionales H0: σ12 = Prueba de
σ22 dos colas
H1: σ122 ≠ σ222
Estadístico F H0: σ1  σ2 Cola inferior
de la prueba H1: σ12 <
σ22 2
H0: σ1 ≤ σ22 Cola superior
H1: σ12 >
σ22

Chap 10-94
Prueba de hipótesis para las
varianzas
(continua)

Prueba para dos El estadístico de la


Varianzas
prueba F es:
poblacionales
2
S
F 1
2
Estadístico F S 2
De la prueba
S12 = Varianza de la muestra 1
n1 - 1 = g de l del numerador

S22 = Varianza de la muestra 2


n2 - 1 = g de denominator

Chap 10-95
La Distribución F

 Hay dos valores críticos para F, que se determina


utilizando la tabla F, Excel, Probability Distributions, etc.
 Hay dos grados de libertad, el del numerador y,, el del
denominador
S12 = n1 – 1 ; gl2 = n2 – 1
F 2 donde gl1
S2
 En la tabla F ,
 G de l del numerador por la columna
 G de l del denominador por la fila

Chap 10-96
Encontrando la región de rechazo
H0: σ12  σ22 H0: σ12 =
 H1: σ12 < σ22
σ22 /2
H1: σ12 ≠ σ22
0 F /2
Rechazo No rechazo de H0
H0 FL
Rechazo de H0 si F < FL 0 Rechazo H0
F
Rechazo No Rechazo
H0
FLH0 FU
H0: σ12 ≤ σ22
S12
H1: σ12 >  La región de F  2  FU
 rechazo para la S2
σ2 2
prueba de dos
0 S12
colas es: F  2 < FL
No rechazo H0 Rechazo F S2
FU H0
Rechazo H0 si F > FU
Chap 10-97
Prueba F: Un ejemplo

Ud es un analista financiero de un broker. Desea comparar la


variabilidad de los precios de las acciones de dos indicadores NYSE
& NASDAQ. Para ello reúne los siguientes datos:

NYSE NASDAQ
Numero 21 25
Media 3.27 2.53
Std dev 1.30 1.16

¿Hay diferencias entre las varianzas entre


los indicadores NYSE & NASDAQ
al nivel del  = 0.05?
Chap 10-98
Varianza amalgamada-Prueba t
Ejemplo

Ud es un analista financiero para una firma de


brokers. ¿Hay diferencias en la variabilidad de
los preciosde las acciones de los índices NYSE &
NASDAQ? : MERVAL BOVESPA
Muestra (n) 21 25
Media muestral (x) 3,27 2,53
Desvío estándar (s) 1,3 1,16

Hay diferencias entre las varianzas de los


índices MERVAL y BOVESPA ( = 0.05)?

Chap 10-99
Prueba F : Ejemplo Solución
 Para la prueba de hipótesis:
H0: σ21 / σ22 = 1 (No hay diferencias entre las varianzas)
H1: σ21 /σ22 ≠ 1 (Hay diferencias entre las varianzas

 Debemos encontrar el valor crítico para F, a un


nivel de significación  = 0.05:
FU: FL:
 Numerador:  Numerador:
 n1 – 1 = 21 – 1 = 20 gl.  n2 – 1 = 25 – 1 = 24 gl.
 Denominador:  Denominador:
 n2 – 1 = 25 – 1 = 24 gl.  n1 – 1 = 21 – 1 = 20 d.f.

FU = F.025, 20, 24 = 2.33 FL = 1/F.025, 24, 20 = 1/2.41


= 0.415
Chap 10-100
Prueba F : Ejemplo Solución
(continua)
 La prueba estadística es:
H0: σ12 = σ22
2 2 H1: σ12 ≠ σ22
S 1.30
F  1
2 2
 1.256
S 1.16
2
/2 = .025 /2 = .025

0
Rechazar No Rechaza H0
F
rechazamos H0
 F = 1.256 no cae en la región H0
FL=0.43 FU=2.33
de rechazo, así que no
rechazamos H0

 Conclusión: No hay suficiente evidencia para comprobar


que las varianzas de los dos mercados son diferentes a
un  = .05
Chap 10-101
Análisis de Varianza

Lic. Daniel Fortuna Chap 11-102


Consideraciones Generales del
ANOVA

 El Investigador controla una o mas variables


independientes
 Llamados factores (o variables de tratamiento)
 Cada factor contiene dos o mas niveles (o grupos o
categorías/clasificaciones)
 Objetivo: Observar efectos sobre la variable
dependiente (respuesta)
 Respuesta de los niveles a las variables independientes
 Diseño de Experimentos, es el plan usado para reunir
los datos

Chap 11-103
Diseño Completamente
aleatorizado

 Las unidades experimentales (sujetos) son


asignados aleatoriamente a los tratamientos
 Los sujetos se suponen homogéneos
 Solo un factor o variable independiente
 Con dos o mas niveles de tratamiento
 Analizar mediante el análisis de varianza de
una vía (ANOVA)

Chap 11-104
Análisis de Varianza Una-vía

 Evaluar las diferencias entre las medias de tres


o mas grupos
Ejemplo: Tasas de accidentes para 1ro, 2do, Y 3er grupo

 Supuestos
 La Población está normalmente distribuida
 Las poblaciones tienen iguales varianzas
 Las muestras están aleatoria e
independientemente extraídas
Chap 11-105
Hipótesis del ANOVA de una vía

 H :μ  μ  μ  μ
0 1 2 3 c
 Todas las medias poblacionales son iguales
 p.ej., no hay efecto en los tratamientos (no hay
variación entre las medias de los grupos)

 H1 : No todas las medias poblaciona les son iguales


 Al menos una media poblacional es diferente
 P.ej., hay un efecto de un tratamiento

Chap 11-106
ANOVA Una vía o factor

H0 : μ1  μ2  μ3    μc

Todas las medias son las mismas


La hipótesis nula es verdadera
(No hay efecto en los
tratamientos)

μ1  μ2  μ3
Chap 11-107
ANOVA Una vía o factor
(continua)

H1 : No todas las μ j son la misma


Al menos una media es diferente:
La hipótesis nula No es verdadera
(El Efecto de un Tratamiento está
presente)

μ1  μ2  μ3 μ1  μ2  μ3
Chap 11-108
Particionando la Variación

 Variación Total (Total variation) puede ser particionada en dos


partes:

SST = SSA + SSW


 SST = Sum of Squares Total - Suma total de cuadrados
(Variación total)

 SSA = Sum of squares among groups - Suma de cuadrados


entre Grupos (Among-group variation – Variación entre grupos)

 SSW = Sum of squares within groups - Suma de cuadrados


dentro de los Grupos (Within group variation – Variación dentro
de los grupos)

Chap 11-109
Particionando la variación
(continua)

SST = SSA + SSW


 Variación Total – Total Variation
Dispersión de los valores de los datos individuales a través
de varios niveles de factores (SST)

 Variación entre Grupos-Among Group Variation


Dispersión entre las medias muestrales de los factores
(SSA)

 Variación Dentro de los Grupos-Within Group Variation


Dispersión que existe entre los valores de los datos dentro
de un factor, a un nivel particular (SSW)

Chap 11-110
Particionando la Variación Total

Variación Total (SST)


d.f. = n – 1

Variación Variación debida al


= debida a un
+ muestreo aleatorio
=c–1
Factor gl.
(SSA) (SSW) gl. = n – c
Comúnmente conocida como: Comúnmente conocida como:
 Suma de cuadrados entre  Suma de cuadrados dentro de
grupos los grupos
 Suma de cuadradas  Suma de cuadrados del error
explicadas  Suma de cuadrados no
explicada
 Variación Entre Grupos
Chap 11-111
Suma Total de Cuadrados
SST = SSA + SSW
c nj

SST   ( Xij  X) 2

j1 i1
Donde:
SST = Suma Total de Cuadrados
c = numero de grupos (niveles de tratamientos)
nj = numero de observaciones en el grupo j
Xij = itesima observación del grupo j
X = Gran Media (media de todos los valores de
los datos)
Chap 11-112
Variación Total
(continua)

SST  ( X11  X)  ( X12  X)  ...  ( Xcnc  X)


2 2 2

Response, X

Group 1 Group 2 Group 3

Chap 11-113
Variación entre Grupos
SST = SSA + SSW
c
SSA   n j ( X j  X) 2

j1
donde:
SSA = Suma de cuadrados entre grupos
c = numero de grupos
nj = tamaño de la muestra dentro del grupo j
Xj = media muestral del grupo j
X = gran media (media de todos los valores de
los datos)
Chap 11-114
Variación entre grupos-Among
Group
(continua)
c
SSA   n j ( X j  X) 2

j1

SSA
variación debida a las
MSA 
diferencias entre grupos
c 1
Media cuadrática entre
Among = SSA/ gl (df)

i j

Chap 11-115
Variación entre Grupos
(continua)

SSA  n1 ( x1  x )  n2 ( x 2  x )  ...  nc ( x c  x )
2 2 2

Response, X

X3
X2 X
X1

Group 1 Group 2 Group 3


Chap 11-116
Variación dentro - Within Group

SST = SSA + SSW


c nj
SSW    ( Xij  X j ) 2

j1 i1
donde:
SSW = Suma de cuadrados dentro de los
grupos
c = numero de grupos
nj = tamaño muestral del grupo j
Xj = media muestral del grupo j
Xij = iesima observación en el grupo j Chap 11-117
Variación Dentro-Within Group
(continua)

c nj
SSW    ( Xij  X j ) 2

j1 i1
SSW
Suma de la variación dentro
MSW 
nc
de cada grupo, y, luego
sumando, la de todos los
grupos
Media cuadrática dentro =
SSW/ g de l

μj
Chap 11-118
Variación dentro –Within Group
(continua)

SSW  ( x11  X1 )  ( X12  X2 )  ...  ( Xcnc  Xc )


2 2 2

Response, X

X3
X2
X1

Group 1 Group 2 Group 3


Chap 11-119
Obteniendo las medias cuadráticas

SSA
MSA 
c 1
SSW
MSW 
nc
SST
MST 
n 1

Chap 11-120
Tabla de ANOVA una vía

Fuente SS Gl = MS estadístico
de df (Varianza) F
Variació
Entre SSA MSA
SSA c-1 MSA =
nGrupos c - 1 F = MSW
Dentro SSW
SSW n-c MSW =
Grupos n-c
Total SST = n-1
SSA + SSW
c = numero de grupos
n = suma de los tamaños muestrales de todos los
grupos
df = gl
Chap 11-121
ANOVA- Una vía
Estadístico de la Prueba F
H0: μ1= μ2 = … = μc
H1: Al menos dos medias poblacionales son diferentes

 Prueba del
 estadístico MSA
F
MSW
MSA es la media cuadrática entre grupos
MSW es la media cuadrática dentro de los grupos
 Grados de libertad
 gl1 = c – 1 (c = numero de grupos)
 df2 = n – c (n = suma de tamaños de la muestra de todas las
poblaciones)

Chap 11-122
Interpretando ANOVA de una vía
Estadístico F
 El estadístico F es el cociente de la
estimación de la varianza entre, y la
estimación de la varianza dentro
 El cociente debe siempre ser positivo
 gl1 = c -1 comúnmente pequeños
 gl2 = n - c comúnmente grandes

Reglas Decisionales
 Rechazar H0 sí F >  = .05
FU, en otro caso no
rechazar H0 0 no Rechazar
rechazar
H0 H0
FU
Chap 11-123
ANOVA una vía
Prueba F Ejemplo
MARCA A MARCA B MARCA C
Se desea conocer, si hay
254 234 200
diferencias entre la vida útil,
263 218 222
medida en días, de 3 marcas 241 235 197
distintas de una lámpara de luz 237 227 206
halógena. Para ello, se 251 216 204
seleccionan 5 productos de
cada marca y se realiza la
prueba. A un nivel de
significación del 0.05 ¿hay
diferencias en la vida útil media
de cada marca?

Chap 11-124
X 1

ANOVA de una vía Ejemplo:


Diagrama de dispersión
Distancia
MARCA A MARCA B MARCA C 270
254 234 200 260 •
263 218 222 ••
241 235 197
250 X1
240 •
237 227 206 • ••
251 216 204 230
• X
220
••
X2 •
210
XA = 249,2 XB = 226 XC = 205,8 •• X3
200 ••
190
X = 227
1 2 3
Club Chap 11-125
2358.2
F   25.275
93.3

ANOVA de una vía Ejemplo:


Cálculos
MARCA A MARCA B MARCA C
254 234 200 XA = 249,2 nA = 5
263 218 222
XB = 226,0 nB = 5
241 235 197
237 227 206 XC = 205,8 nC = 5
251 216 204 X = 227; n = 15; c = 3

SSA = 5 (249.2 – 227)2 + 5 (226 – 227)2 + 5 (205.8 – 227)2 = 4716.4


SSW = (254 – 249.2)2 + (263 – 249.2)2 +…+ (204 – 205.8)2 = 1119.6

MSA = 4716.4 / (3-1) = 2358.2 2358.2


F  25.275
MSW = 1119.6 / (15-3) = 93.3 93.3

Chap 11-126
ANOVA de una vía Ejemplo:
Solución
Estadístico de la Prueba:
H0: μ1 = μ2 = μ3
H1: μj no todas iguales F
MSA 2358.2
  25.275
α = 0.05 MSW 93.3
df1= 2 df2 = 12 Decisión:
Rechazar H0 al  = 0.05
Valor
crítico F
Conclusión:
Hay evidencia, que al menos una
= 3.89
de las medias μj , es diferente del
 = .05 resto

0 No Rechazo H0
rechazo H0 F = 25.275
FU = 3.89
Chap 11-127
ANOVA de una vía Ejemplo
Salida de Excel
EXCEL: tools | data analysis | ANOVA: single factor
Análisis de varianza de un factor

RESUMEN
Grupos Cuenta Suma Promedio Varianza
Marca A 5 1246 249,2 108,2
Marca B 5 1130 226 77,5
Marca C 5 1029 205,8 94,2

ANÁLISIS DE VARIANZA

Origen Suma cuad g de l Prom cuad F Probabilidad Valor crítico para F

Entre grupos 4716,4 2 2358,2 25,2754555 4,98524E-05 3,885293835


Dentro de los
grupos 1119,6 12 93,3

Total 5836 14

Chap 11-128
El Procedimiento de Tukey-Kramer

 Señala que medias poblacionales son


significativamente diferentes, uando se produce
el rechazo de la hipótesis nula, (igualdad de
medias) en la prueba ANOVA

P.ej.: μ1 = μ2  μ3

 Compara pares de pares de valores


 Compara las diferencias absolutas de las medias con el rango
crítico

μ = μ μ x
1 2 3 Chap 11-129
Rango Crítico Tukey-Kramer

MSW  1 1 
Rango Crítico  Q U 
2  n j n j' 

donde:
QU = Valor de la distribución de rango estudentizado
con c y n - c grados de libertad para el nivel deseado de 
MSW = Media cuadrática dentro
nj y nj’ = Tamaños de muestras de los grupos j y j’

Chap 11-130
El Procedimiento de Tukey-
Kramer: Ejemplo
1. Calcular las diferencias de
MARCA A MARCA B MARCA C medias absolutas:
254 234 200
263 218 222 x A  x B  249.2  226.0  23.2
241 235 197 x A  x C  249.2  205.8  43.4
237 227 206
x B  x C  226.0  205.8  20.2
251 216 204

2. Encontrar el valor de QU de la tabla con


c = 3 y (n – c) = (15 – 3) = 12 grados de libertad al
nivel de significacion  ( = 0.05 ):

QU  3.77
Chap 11-131
Valores críticos del rango
estudentizado QU

Chap 11-132
El Procedimiento de Tukey-
Kramer : Ejemplo
(continua)
3. Calcular el Rango
Crítico:
MSW  1 
Rango Crítico  Q U     3.77 93.3  1  1   16.285
1
2 n  2 5 5
 j n j' 

4. Calcular
Todas las diferencias absolutas
x A  x B  23.2
de medias. Si es mayor que el
rango crítico hay una diferencia x A  x C  43.4
significativa entre cada par de x B  x C  20.2
medias, al nivel de significación
del 5%. O sea con, 95% confianza
podemos concluir que la distancia media del
club 1 es mayor que el club 2 y el, club 2 es
mas grande que el club 3. Chap 11-133
ANOVA con PH Stat

ANOVA: Single Factor Calculations


c 3
SUMMARY n 15
Groups Count Sum Average Variance
Marca A 5 1246 249,2 108,2000
Marca B 5 1130 226 77,5000
Marca C 5 1029 205,8 94,2000

ANOVA
Source of Variation SS df MS F P-value F crit

Between Groups 4716,4000 2 2358,2000 25,2755 0,0000 3,8853

Within Groups 1119,6000 12 93,3000

Total 5836,0000 14
Level of significance 0,05

Chap 11-134
ANOVA con PH Stat
Tukey-Kramer Multiple Comparisons

Sample Sample Absolute Std. Error Critical


Group Mean Size Comparison Difference of Difference Range Results

1: Marca A 249,2 5 Group 1 to Group 2 23,2 4,319722213 16,285 Means are different

2: Marca B 226 5 Group 1 to Group 3 43,4 4,319722213 16,285 Means are different

3: Marca C 205,8 5 Group 2 to Group 3 20,2 4,319722213 16,285 Means are different

Other Data

Level of significance 0,05


Numerator d.f. 3
Denominator d.f. 12
MSW 93,3
Q Statistic 3,77

Chap 11-135
Supuestos del ANOVA. Prueba
de Levene

 Prueba el supuesto que las varianzas de cada


población son iguales
 Primero definimos la hipótesis nula y alternativa
 H0: σ21 = σ22 = …=σ2c
 H1: No todas las σ2j son iguales
 Segundo calculamos el valor absoluto de la
diferencia entre cada valor y la mediana de
cada grupo
 Tercero realizar la Prueba de Anova de 1 vía de
esas diferencias.
Chap 11-136
Ejemplo de la Prueba de Levene Homogeneidad de
las varianzas

 H0: σ21 = σ22 = σ23


 H1: No todas las σ2j son iguales

Calcular Medianas Calcular las Diferencias Absolutas


Club 1 Club 2 Club 3 Club 1 Club 2 Club 3
237 216 197 14 11 7
241 218 200 10 9 4
251 227 204 Medianas 0 0 0
254 234 206 3 7 2
263 235 222 12 8 18

Chap 11-137
Ejemplo de la Prueba de Levene Homogeneidad de
las varianzas (con PH Stat)

 Anova: Single Factor


 SUMMARY
 Groups Count Sum Average Variance
 Marca A 5 39 7.8 36.2
 Marca B 5 35 7 17.5
 Marca C 5 31 6.2 50.2
 Source of Variation SS df MS F P-value F crit
 Between Groups 6.4 2 3.2 0.092 0.912 3.885
 Within Groups 415.6 12 34.6
 Total 422 14

Se rechaza H0. No hay evidencia suficiente para rechazar la H0 que


las σ2j son iguales, por lo tanto la suposición de homogeneidad de
varianzas está justificada.
Chap 11-138

También podría gustarte