0% encontró este documento útil (0 votos)
82 vistas52 páginas

Diapositivas Anova

Descargar como ppt, pdf o txt
Descargar como ppt, pdf o txt
Descargar como ppt, pdf o txt
Está en la página 1/ 52

Distribucin F

Esta distribucin probabilstica se utiliza como


estadstico de prueba en varias situaciones. Sirve para
demostrar si dos varianzas muestrales provienen de la
misma poblacin o de poblaciones iguales, y tambin se
aplica cuando se desean comparar simultneamente tres o
ms medias poblacionales. Esta comparacin simultnea de
varias medias poblacionales se denomina Anlisis de
varianza (de anlisis of variance). En estos dos casos, las
poblaciones deben ser normales y los datos deben estar al
menos medidos en escala de intervalo.
Caractersticas de la distribucin F
1. Existe una familia de distribuciones F. Un elemento especfico de la familia
est determinado por dos parmetros: los grados de libertad en el numerador y
los grados de libertad en el denominador.
2. El valor de F no puede ser negativo.
3. La distribucin F es una distribucin continua.
4. La curva que representa una distribucin F tiene un sesgo positivo.
5. Sus valores varan de 0 a . A medida que aumenta el valor de F, la curva se
aproxima al eje X, pero nunca lo toca.
Comparacin de dos varianzas poblacionales




La distribucin F se utiliza para demostrar la hiptesis de que la
varianza de una poblacin normal es igual a la varianza de otra
poblacional normal. As, la prueba es til para determinar si una
poblacin normal tiene o no ms variacin que otra. En los siguientes
ejemplo se muestra el uso de esta prueba:

Dos cizallas se ajustan para producir elementos de acero de la misma
longitud. Por tanto, los elementos tener la misma longitud. Se desea
estar seguro que adems de tener la misma longitud, tengan una
variacin similar.

La tasa media de rendimiento a la inversin de dos tipos de acciones
puede ser la mismo, pero hay ms variacin en el rendimiento de una
que de otra. Una muestra de 10 acciones de industria aeroespacial y 10
acciones de servicios podran mostrar la misma tasa media de
rendimiento, pero es probable que haya ms variacin en el rendimiento
de las acciones aeroespaciales.
Consideraciones de validacin
Al comparar las varianzas de dos poblaciones usaremos datos
reunidos de dos muestras aleatorias independientes, una de la
poblacin 1 y la otra de la poblacin 2. Las dos varianzas de las
muestras,
2
1
s y
2
2
s sern la base para hacer inferencias acerca de las
dos varianzas poblacionales
2
1
o y
2
2
o . Siempre que las dos varianzas
poblacionales sean iguales (
2
1
o =
2
2
o ), la distribucin de la relacin de
las dos varianzas de las muestras
2
1
s /
2
2
s es la siguiente:
Distribucin muestral de
2
1
s /
2
2
s cuando
2
1
o =
2
2
o

Siempre que se seleccionan muestras aleatorias simples de
tamao n
1
y n
2
a partir de poblaciones normales con
varianzas iguales, la distribucin de las muestras
2
2
2
1
s
s
(9)
tiene distribucin F con n
1
1 grados de libertad para el
numerador y n
2
1 grados de libertad para el denominador;
2
1
s es la varianza de la muestra de los n
1
artculos
procedentes de la poblacin 1 y
2
2
s es la de los n
2
artculos
procedentes de la poblacin 2.
EJEMPLO


La Escuela bancaria va a renovar su contrato de servicio de
autobs escolar para el ao prximo, y debe seleccionar entre
las empresas Transportes rpidos, S.A. y Transportes eficaces,
S.A.. Usaremos la varianza de los tiempos de recepciones que
se tarda en recoger y entregar alumnos como medida principal
de la calidad del servicio. Los valores bajos de varianza indican
que el servicio es ms consistente y de mayor calidad. Si las
varianzas de los tiempos de llegada asociadas con los dos
servicios son iguales, los administradores de la Escuela
bancaria seleccionarn la empresa que ofrezca mejores
condiciones financieras. Sin embargo, si los datos de las
muestras de tiempos de llegada para las dos empresas indican
que hay una gran diferencia entre las varianzas, los
administradores tendrn muy en cuenta a la que tenga menor
varianza del servicio
Las hiptesis de prueba son las siguientes:
2
2
2
1 1
2
2
2
1 0
:
:
o o
o o
=
=
H
H

Si se puede rechazar
0
H , es adecuada la conclusin
de distinta calidad en los servicios. En tal caso, se
preferir a la empresa con menor varianza de la
muestra.
Suponga que se har la prueba de hiptesis con o =
0.10 y que se obtienen muestras de tiempos de
llegada con escuelas que actualmente usan los
servicios de los dos transportistas. Se obtiene una
muestra de 25 tiempos para los rpidos (poblacin
1) y una de 16 para los eficaces (poblacin 2). La
figura 3 es la grfica de la distribucin F con n
1

1 = 24 grados de libertad en el numerador y n
2
1
= 15 grados de libertad en el denominador.
Observe que la regin bilateral de rechazo se caracteriza por los valores crticos en
95 . 0
F y
05 . 0
F .

Fig. 3: Regin de rechazo para el ejemplo del autobs para la escuela bancaria con o = 0.05





2
2
2
1
s
s
F =

0.05 0.05



F
0.95
F
0.05

Se rechaza H
0
Se rechaza H
0
Suponga que las dos muestras de tiempos de
llegada del autobs produjeron las varianzas
2
1
s =
48 para los rpidos y
2
2
s = 20 para los eficaces.
Qu conclusin es la adecuada? Se supone que
las dos poblaciones de tiempos de llegada tienen
distribuciones normales de probabilidad, y que
0
H
es verdadera si
2
1
o =
2
2
o . Se puede aplicar la
distribucin F para llegar a una conclusin.
Especficamente, se calcula
2
2
2
1
/ s s F = y se emplea la
regin de rechazo que vemos en la figura 3.
De este modo, llegamos a:
40 . 2
20
48
2
2
2
1
= = =
s
s
F


Consultando la tabla, vemos que el valor crtico
unilateral superior (de la cola superior) con 24
grados de libertad en el numerador y 15 en el
denominador es
29 . 2
05 . 0
= F
. Aunque la tabla no
indica valores
95 . 0
F observamos que no es necesaria
la determinacin de este valor crtico unilateral
inferior. Se puede observar que F = 2.40 es mayor
que
29 . 2
05 . 0
= F
. Entonces, con un nivel de
significancia de 0.10 se rechaza H
0
.
Este resultado conduce a la conclusin de que los
dos servicios de autobs son distintos en lo
concerniente a varianzas de tiempos de recepcin
y de llegada. Nuestra recomendacin es que los
administradores de la Escuela bancaria den
consideracin especial al mejor servicio, con
menor varianza, que ofrecen los Transportes
eficaces, S.A.
Tambin se puede usar el criterio del valor p
para una prueba de hiptesis acerca de dos
varianzas poblacionales. Se aplica la regla de
rechazo comn: rechazar H
0
si el valor p < o . Sin
embargo, al igual que con la distribucin ji
cuadrada, es difcil determinar el valor p
directamente de las tablas de la distribucin F.
Prueba bilateral de la varianza de dos
poblaciones
2
2
2
1 1
2
2
2
1 0
:
:
o o
o o
=
=
H
H

Se denota la poblacin que tiene la mayor
varianza de la muestra como poblacin 1.

Estadstico de prueba

2
2
2
1
s
s
F =

Regla de rechazo

Con el estadstico de prueba: Rechazar
0
H
si
2 / o
F F >

Con el valor p : Rechazar 0
H
si el
valor p<
o

Donde el valor
2 / o
F se basa en una distribucin F
con n
1
1 grados de libertad en el numerador y n
2
1 grados de libertad en el denominador.
Prueba unilateral sobre las varianzas de dos poblaciones

2
2
2
1 1
2
2
2
1 0
:
:
o o
o o
>
s
H
H

Se denota la poblacin que tiene la mayor varianza de la muestra como
poblacin 1.

Estadstico de prueba

2
2
2
1
s
s
F =


Regla de rechazo

Con el estadstico de prueba: Rechazar
0
H
si
o
F F >
Con el valor p : Rechazar
0
H
si el valor p< o

Donde el valor
o
F
se basa en una distribucin F con n
1
1 grados de
libertad en el numerador y n
2
1 grados de libertad en el denominador.
Anova
Nocin general

El segundo uso de la distribucin F comprende la tcnica
del anlisis de varianza, que se simboliza por ANOVA.
Bsicamente, en ese anlisis se emplea informacin muestral
para determinar si tres o ms tratamientos producen o no
resultados diferentes. El uso de la palabra tratamiento tiene su
origen en la investigacin agrcola. Se trataron campos con
distintos fertilizantes o fumigantes, para determinar si haba o no
una diferencia global en la productividad. Se probar si cinco
aditivos para la gasolina (los tratamientos) dan o no como
resultado una diferencia en el rendimiento en millas por galn.
Adems se explotar la siguiente pregunta: Los cuatros mtodos
de entrenamiento (los tratamientos) son igualmente efectivos?
Tratamiento: Causa o fuente especfica de
variacin en un conjunto de datos.
Consideraciones en que se basa la prueba
ANOVA


Antes de realizar una prueba utilizando la tcnica ANOVA se
examinarn las consideraciones en que se basa la prueba. Si no
pueden cumplirse las consideraciones siguientes, es posible
aplicar otra tcnica de anlisis de varianza (que desarrollaron
Kruskal y Wallis).

1.Las tres o ms poblaciones de inters estn distribuidas
normalmente.
2.Tales poblaciones tienen desviaciones estndar iguales.
3.Las muestras que se seleccionan de cada una de las
poblaciones son aleatorias e independientes, es decir, no estn
relacionadas entre s.

Ejemplo


Suponga que renunci el gerente de la sucursal de
Los Olivos de la cadena de tiendas comerciales Metro, y
se considera que tres vendedores pueden ocupar este
puesto. Los tres tienen la misma antigedad, educacin,
etc. Para tomar una decisin, el gerente de personal, sugiri
examinar los registros de ventas mensuales de cada uno.
En la siguiente tabla se muestran los resultados maestrales de las ventas por mes:

Ventas mensuales ($ 000)

Sr. Quiroz Sr. Huarote Sr. Martnez

15 15 19
10 10 12
9 12 16
5 11 16
16 12 17
Media muestral: 11 12 16

En este problema los vendedores son los tratamientos.
3 2 1 0
: = = H
La hiptesis nula expresa que no
hay diferencia significativa entre las ventas
medias de los tres vendedores.

:
1
H
Plantea que al menos una media es diferente.

Se seleccion un nivel de significancia
o
=
0.05.
El estadstico de prueba adecuado es la
distribucin F. Este procedimiento se basa en
varias consideraciones: 1) Los datos deben estar al
menos en nivel de intervalo; 2) La seleccin real
de las ventas debe hacerse utilizando un
procedimiento de tipo probabilstico; 3) La
distribucin de las venta mensuales para cada una
de las poblaciones es normal y 4) Las varianzas de
las tres poblaciones son iguales, es decir,
2
3
2
2
2
1
o o o = =
.
F es la razn de dos varianzas:

muestras las en iacin la segn estimada l poblaciona Varianza
muestrales medias entre iacin segn estimada l poblaciona Varianza
F
var
var
=


La terminologa comn para el numerador es
varianza entre muestras. Para el denominador
es varianza en las muestras. El numerador
tiene 1 k grados de libertad. El denominador tiene
k N grados de libertad; donde k es el nmero de
tratamientos y N es el nmero de observaciones.
Para este problema relativo a un nuevo gerente de
almacn, hay tres tratamientos (vendedores), por lo que
se tiene k 1 = 3 1 = 2 g.l. en el numerado. Hay 15
observaciones (tres muestras de cinco cada una), por
tanto, hay N k = 15 3 = 12 g.l. en el denominador.

El valor crtico, esto es, el punto divisorio entre la regin de
aceptacin y la de rechazo, se obtiene consultando la
tabla correspondiente. Ese nmero es 3.89, y es el valor
crtico de F para el nivel 0.05.
Al utilizar el nivel predeterminado de 0.05, la regla de
decisin es aceptar la hiptesis nula si el valor calculado de
F es menor que o igual a 3.89; se rechaza la hiptesis nula
y se acepta la alternativa, si el valor calculado de F es
mayor que 3.89.
Para calcular F y tomar una decisin, el primer paso
es organizar una tabla ANOVA. Esta es slo una forma
conveniente de registrar la suma de cuadrados y otros
clculos. El formato general para un problema de anlisis
de varianza en un sentido se muestra en la siguiente tabla:
Fuente de Suma de
Grados
de Cuadrados
variacin cuadrados libertad medios
Entre
tratamientos SST k - 1
SST/k-1=
MSTR
Error (en los
tratamientos) SSE N - k
SSE/N-k =
MSE
Total Total SS

MSE
MSTR
k N
SSE
k
SST
F =

=
1


en donde:

MSTR: cuadrado medio entre tratamientos.
MSE : cuadrado medio debido al error. Tambin se denomina cuadrado
medio dentro de tratamiento.
SST : suma de cuadrados de tratamiento.
Se obtiene mediante la siguiente frmula:

=
N
X
n
T
SST
c
c
2
2
) (

en donde:

2
c
T : indica elevar al cuadrado el total de cada columna
(el subndice c se refiere a la columna)
c
n : es el nmero de observaciones para cada
tratamiento respectivo (columna). Hay cinco cifras de
ventas para el Sr. Quiroz, cinco para el Sr. Huarote y
cinco para el Sr. Martnez.

X : es la suma de todas las observaciones (ventas). Es


$ 195.
k : es el nmero de tratamientos (vendedores). Hay
tres.
N : es el nmero total de observaciones. Hay 15.

Sr. Quiroz Sr. Huarote Sr. Martnez
1
X
2
1
X
2
X
2
2
X
3
X
2
3
X

15 225 15 225 19 361
10 100 10 100 12 144
9 81 12 144 16 256
5 25 11 121 16 256
16 256 12 144 17 289 Total
Totales de columna: 55 60 80 195
Tamao de muestra 5 5 5 15
Suma de cuadrados 687 734 1306 2727


Clculo de SST
70 535 , 2 605 , 2
15
) 195 (
5
) 80 (
5
) 60 (
5
) 55 (
) (
2 2 2
2
2
= =
(

+ + =
(

=


N
X
n
T
SST
c
c


Clculo de SSE
122 605 , 2 727 , 2
2
2
= =
(

=

c
c
n
T
X SSE

La variacin total (Total SS) es la suma de la variacin entre columnas y entre renglones; es decir,
Total SS = SST + SSE = 70 + 122 = 192.
Verificacin
192 535 , 2 727 , 2
15
) 195 (
727 , 2
) (
2
2
2
= = = =


N
X
X SS Total
Las tres sumas de cuadrados y los clculos necesarios para determinar F, se presentan en el
siguiente cuadro:

Fuente de Suma de Grados de Cuadrados
variacin cuadrados libertad medios
Entre tratamientos SST= 70 k 1=3-1=2 70/2=35 = MSTR
Error (en los tratamientos) SSE=122 N k=15-3=12 122/12 =10.17= MSE
Total SS Total SS=192

Clculo de F
44 . 3
17 . 10
35
1
= = =

=
MSE
MSTR
k N
SSE
k
SST
F
La regla de decisin indica que si el valor calculado de F es
menor que o igual al valor crtico de 3.89, la hiptesis nula
se acepta. Si el valor de F es mayor que 3.89, la hiptesis
nula se rechaza y la hiptesis alternativa se acepta. Puesto
que 3.44 < 3.89, la hiptesis nula se acepta al nivel 0.05. En
otras palabras, las diferencias en las ventas medias
mensuales ($11,000, $12,000 y $16,000) se atribuyen al azar
(muestreo). Desde el punto de vista prctico, los niveles de
ventas de los tres vendedores que se consideran para el
puesto de gerente de almacn son iguales. No puede tomarse
una decisin respecto al puesto, con base en las ventas
mensuales
Ejemplo

Un profesor pidi a los estudiantes de un grupo grande del curso de
estadstica que evaluara su desempeo en el curso como 1 (excelente),
2 (bueno), 3 (aceptable) o 4 (deficiente). Un ayudante del profesor
recolect las evaluaciones y asegur a los estudiantes que el profesor
no las recibira hasta despus que las calificaciones del curso se
hubieran ingresado en la Direccin Acadmica. La evaluacin (el
tratamiento) que un estudiante asign al profesor se compar con su
calificacin final del curso. Lgicamente, se esperara que en general, el
grupo de estudiantes que pens que el profesor era excelente tuvieran
una calificacin promedio final del curso significativamente ms alta que
los alumnos que lo evaluaron como bueno, aceptable o regular, o
deficiente. Tambin se esperara que los alumnos que lo evaluaron
como deficiente tuvieran las calificaciones promedio ms bajas.
Se seleccionaron muestras de cada grupo de evaluacin. Los resultados son:

Excelente Bueno Regular Deficiente
94 75 70 68
90 68 73 70
85 77 76 72
80 83 78 65
88 80 74
68 65
65

La pregunta es si existe o no una diferencia estadstica entre la puntuacin media de los
cuatro grupos.
Se seleccion el nivel de significacin 0.01.

La regla de decisin es que la hiptesis nula, que plantea que no
hay diferencia entre las medias, no se rechazar si el valor
calculado de F es menor que el valor crtico. De otra manera, la
hiptesis nula se rechazar y se aceptar la hiptesis alternativa.
Recurdese que los grados de libertad en el numerador de la
razn F se obtienen por k 1, donde k es el nmero de
tratamientos (grupos de evaluacin del profesor). Hay cuatro
tratamientos, de manera que 4 1 = 3 g.l. Los grados de libertad
en el denominador son en total 18, que se obtienen mediante N
k, en donde N es el nmero total de estudiantes en la muestra.
Hay 22 estudiantes, por lo que 22 4 = 18 g.l.
Obsrvese que el valor crtico de F es 5.09, de acuerdo al
valor indicado en la tabla correspondiente. La regla de decisin
ser: acepte la hiptesis nula al nivel 0.01 si el valor calculado de
F es menor que o igual a 5.09, y rechace la hiptesis nula si el
valor calculado es mayor que 5.09.
Los clculos necesarios para determinar la razn F se muestran en la siguiente tabla:


Excelente Bueno Aceptable Deficiente
1
X
2
1
X
2
X
2
2
X
3
X
2
3
X
4
X
2
4
X
94 8836 75 5625 70 4900 68 4624
90 8100 68 4624 73 5329 70 4900
85 7225 77 5929 76 5776 72 5184
80 6400 83 6889 78 6084 65 4225
88 7744 80 6400 74 5476
68 4624 65 4225
65 4225
c
T
349 391 510 414
c
n
4 5 7 6

2
X
30561 30811 37338 28634

Ntese que la suma de los totales por columna

) (
i
x es 1 664; el total de los tamaos de
muestras (N) es 22; y la suma de los cuadrados 127344.
Calculando SST, SSE y total SS, se obtiene:

68 . 890
22
) 1664 (
6
) 414 (
7
) 510 (
5
) 391 (
4
) 349 (
) (
2 2 2 2 2
2
2
=
(

+ + + =
(

=


N
X
n
T
SST
c
c

41 . 594 59 . 126749 127344
2
2
= =
(

=

c
c
n
T
X SSE

Total SS = SST + SSE = 890.68 + 594.41 = 1485.09

Como verificacin:
09 . 1485 9 . 125858 127344
22
) 1664 (
127344
) (
2
2
2
= = = =


N
X
X SS Total
Estos valores se colocan en la tabla ANOVA:

Fuente de Suma de Grados de Cuadrados
variacin cuadrados libertad medios
Tratamiento (entre columnas) SST= 890.68 k 1=4-1=3 890.68/3=296.89 MSTR
Error (entre renglones) SSE=594.41 N k=22-4=18 594.41/18 =33.02= MSE
Total SS Total SS=1485.09

Introduciendo los cuadrados medios en la frmula de F, se obtiene:

99 . 8
02 . 33
89 . 296
= = =
MSE
MSTR
F
La decisin: como el valor calculado de F de 8.99 es
mayor que el valor crtico de 5.09, la hiptesis nula de
que no existe diferencia entre las medias se rechaza al
nivel 0.01. Bsicamente esto indica que es muy
probable que las diferencias observadas entre las
medias no se deban al azar. Desde el punto de vista
prctica, se sugiere que las calificaciones que
obtuvieron los estudiantes en un curso estn
relacionadas con las opiniones que tienen de la
capacidad general y la forma como se conduce en clase
el profesor.

Inferencias acerca de las medias de
tratamiento
Supngase que al aplicar el procedimiento ANOVA,
se decide rechazar la hiptesis nula. Esto permite concluir
que todas las medias de tratamiento no son iguales. Algunas
veces esta conclusin puede considerarse satisfactoria, pero
en otros casos se desea saber cules medias de tratamiento
son diferentes.
En este ejemplo, la hiptesis nula se rechaz y la
alternativa se acept. Si las opiniones de los estudiantes
son en realidad diferentes, la pregunta es: Entre qu
grupos difieren las medias de tratamiento?
Existen varios procedimientos para responder esta
pregunta. Tal vez el ms sencillo es mediante el uso de
niveles de confianza.
La distribucin t se utiliza como base para esta
prueba. Recurdese que una suposicin bsica
de ANOVA es que las varianzas poblacionales
son iguales para todos los tratamientos. Como
se observ, este valor poblacional comn se
denomina error cuadrado medio (MSE) que
se obtiene mediante SSE/(N-k).
Un intervalo de confianza para la diferencia entre dos medias poblacionales
se logra mediante:

|
|
.
|

\
|
+
2 1
2 1
1 1
) (
n n
MSE t x x
1
x : es la media del primer tratamiento.
2
x : es la media del segundo tratamiento
t : se obtiene a partir del la tabla t. Los grados de libertad son N k.
MSE : es el error cuadrado medio que se obtiene a partir de la tabla
ANOVA.
1
n : es el nmero de observaciones en el primer tratamiento.
2
n : es el nmero de observaciones en el segundo tratamiento.
Si el intervalo de confianza incluye al 0, se
concluye que no hay diferencia en el par de medias de
tratamiento. Sin embargo, si ambos extremos del intervalo
de confianza tienen el mismo signo, esto indica que las
medias de tratamiento son diferentes.

Utilizando el ejemplo anterior acerca de las
opiniones de estudiantes y el nivel de confianza de 0.95,
los extremos del intervalo de confianza son 10.46 y 26.04,
que se obtienen por:
04 . 26 46 . 10
79 . 7 25 . 18
6
1
4
1
0 . 33 101 . 2 ) 00 . 69 25 . 87 (
1 1
) (
2 1
2 1
y
n n
MSE t x x

|
.
|

\
|
+
|
|
.
|

\
|
+

Se conoce que el intervalo de confianza de 95% vara de 10.46 hasta 26.04. Ambos extremos
son positivos; en consecuencia, podemos concluir que estas medias de tratamiento difieren
significativamente. Es decir, los estudiantes que evaluaron al profesor como excelente tienen
calificaciones ms altas que los que lo evaluaron como malo.
Precaucin

La investigacin de diferencias de medias
de tratamiento es un proceso secuencial. El
paso inicial es realizar la prueba ANOVA.
Slo si se rechaza, la hiptesis nula de que
la medias de tratamiento son iguales, debe
intentarse llevar a cabo cualquier anlisis
de las medias de tratamiento
ANOVA en dos sentidos

Una compaa de autobuses, est ampliando el
servicio desde el centro de Lima al Aeropuerto por cuatro
rutas diferentes. La Empresa realiz recorridos de prueba
para determinar si hay diferencia significativa en los tiempos
medios del trayecto en las cuatro rutas. Los tiempos del
trayecto en minutos en cada una de las cuatro rutas se
muestran a continuacin:

Tiempo del recorrido del Centro al Aeropuerto
Da Ruta 1 Ruta 2 Ruta 3 Ruta 4
Lunes 18 20 20 22
Martes 21 22 24 24
Mircoles 20 23 25 23
Jueves 25 21 28 25
Viernes 26 24 28 25

Al nivel de significancia 0.05, puede concluirse que hay diferencia en las cuatro rutas?
Existe una diferencia dependiendo de qu da de la semana se trata?
En este caso, el da de la semana se denomina variable de bloque. En consecuencia, se tiene
variacin debida al tratamiento y debida a los bloques. La suma de cuadrados debida a los bloques
(SSB) se calcula como sigue:
N
x
k
B
SSB
r
2
2
) (

=
en donde B
r
se refiere al total del bloque, es decir, al total de cada rengln, y k es el nmero de
elementos en cada bloque.
El mismo formato que sirve para el caso de ANOVA en un sentido se utiliza para la tabla
ANOVA en dos sentidos. Los totales de SST y SS se calculan igual que antes. SSE se obtiene por
sustraccin (SSE = Total SS SST SSB). En la siguiente tabla se muestran los clculos necesarios:
Tiempo de viaje, por ruta (minutos)
Da Ruta 1 Ruta 2 Ruta 3 Ruta 4
Suma de
renglones B
r

Lunes 18 20 20 22 80
Martes 21 22 24 24 91
Mircoles 20 23 25 23 91
Jueves 25 21 28 25 99
Viernes 26 24 28 25 103 Totales
Totales por
columna, T
c
110 110 125 119 464
Suma de
cuadrados 2446 2430 3169 2839 10904
Tamao de la
muestra n
c
5 5 5 5 20

Anlogo a la tabla ANOVA para un anlisis en un sentido, el formato general en dos sentidos
es:

Fuente de variacin Suma de cuadrados Grados libertad Cuadrado medio
Tratamientos
SST
k - 1
MSTR
k
SST
=
1

Bloque
SSB
n -1
MSB
n
SSB
=
1

Error
SSE
(k-1)(n-1)
MSE
n k
SSE
=
) 1 )( 1 (

Total Total SS


Como antes, para calcular SST:

4 . 32
20
) 464 (
5
) 119 (
5
) 125 (
5
) 110 (
5
) 110 (
) (
2 2 2 2 2
2
2
=
(

+ + + =
(

=


N
X
n
T
SST
c
c


SSB se obtiene mediante:

2 . 78
20
) 464 (
4
) 103 (
4
) 99 (
4
) 91 (
4
) 91 (
4
) 80 (
) (
2 2 2 2 2 2
2
2
= + + + + =
(

N
x
k
B
SSB
r


Los dems trminos de suma de cuadrados son:

2 . 139
20
) 464 (
10904
) (
2
2
2
= = =


N
X
X SS Total
SSE = Total SS SST SSB=139.2 32.4 78.2 = 28.6
Los valores para los diferentes componentes de la tabla ANOVA se calculan de la siguiente manera:

Fuente de variacin Suma de cuadrados Grados libertad Cuadrado medio
Tratamientos
32.4
3
8 . 10
3
4 . 32
=
Bloque
78.2
4
55 . 19
4
2 . 78
=
Error
28.6
12
38 . 2
12
6 . 28
=
Total 139.0


1.-
4 3 2 1 0
: = = = H
. Las medias de tratamiento son iguales.
:
1
H Las medias de tratamiento no son iguales.
2.-
5 4 3 2 1 0
: = = = = H
. Las medias de bloques son iguales.
1
H : Las medias de bloques no son iguales.
Primero se demostrar la hiptesis sobre las medias de tratamiento. Hay k 1 = 4 1 = 3 grados de
libertad en el numerador y (k 1) (n 1) = (4 1) (5 1) = 12 grados de libertad en el
denominador. Al nivel de significancia 0.05, el valor crtico de F es 3.49. La hiptesis nula de que
los tiempos medios para las cuatro rutas son iguales se rechaza si la razn F es mayor que 3.49.

54 . 4
38 . 2
8 . 10
= = =
MSE
MSTR
F

La hiptesis nula se rechaza y se acepta la hiptesis alternativa. Se concluye que el tiempo
promedio de trayecto no es igual para todas las rutas. La empresa desea efectuar algunas pruebas
para determinar qu medias de tratamiento difieren.
A continuacin, se hace una prueba para determinar si el tiempo del trayecto es igual para
diferentes das de la semana. Los grados de libertad en el numerador para bloques es n 1 = 5 1 =
4. Los grados de libertad en el denominador son igual que antes, es decir, 12. La hiptesis nula de
que las medias de bloques son iguales se rechaza si la razn F es mayor que 3.26.
21 . 8
38 . 2
55 . 19
= = =
MSE
MSB
F

La hiptesis nula se rechaza, y la hiptesis alternativa se acepta. El tiempo promedio del
trayecto no es igual para los diferentes das de la semana.
En MINITAB los resultados son los siguientes:

Two-way Analysis of Variance

Analysis of Variance for Tiempos
Source DF SS MS F P
rutas 3 32.40 10.80 4.53 0.024
dias 4 78.20 19.55 8.20 0.002
Error 12 28.60 2.38
Total 19 139.20

Individual 95% CI
rutas Mean ----+---------+---------+---------+-------
1 22.00 (---------*---------)
2 22.00 (---------*---------)
3 25.00 (---------*---------)
4 23.80 (---------*---------)
----+---------+---------+---------+-------
21.00 22.50 24.00 25.50
Individual 95% CI
dias Mean -------+---------+---------+---------+----
1 20.00 (------*------)
2 22.75 (------*------)
3 22.75 (------*------)
4 24.75 (------*------)
5 25.75 (------*------)
-------+---------+---------+---------+----
20.00 22.50 25.00 27.50


Estadstica para Administracin y Economa, Mason y Lind

También podría gustarte