5 - Diseño Factorial
5 - Diseño Factorial
5 - Diseño Factorial
Marcelo Rodríguez G.
Ingeniero Estadístico - Magister en Estadística
Ejemplo
Suponga un diseño con dos factores el A y el B. El factor A tiene 2 niveles
(a = 2) y el factor B tiene 3 niveles (b = 3). Entonces existirían 6
tratamientos, cada uno formado por las combinaciones de estos niveles.
(Los datos)
La variable dependiente es cuantitativa.
Los factores son categóricos; pueden tener valores numéricos o valores
de cadena de hasta ocho caracteres.
(Supuestos)
Los datos son una muestra aleatoria de una población normal; en la
población, todas las varianzas de las casillas son iguales.
El análisis de varianza es robusto a las desviaciones de la normalidad,
aunque los datos deberán ser simétricos.
Para comprobar los supuestos, puede utilizar la prueba de
homogeneidad de varianzas y los grácos de dispersión por nivel.
También puede examinar los residuos y los grácos de residuos.
Variedad de trigo
El objetivo es determinar si existen diferencias Fertilizante 1 2 3
1 35 45 24
apreciables en la cantidad de trigo cosechado, 26 39 23
de entre 3 variedades y 2 tipos de fertilizantes. 38 39 36
Para el experimento se encontró una área muy 20 43 29
2 55 64 58
grande de siembra en la que las condiciones del 44 57 74
suelo eran, prácticamente, homogéneas. 68 62 49
64 61 69
B
A 1 2 ··· b Media t = a · b (n◦ de tratamientos)
1 y111 y121 ··· y1b1
y112 y122 ··· y1b2 n = t · r (tamaño de muestra)
.. .. .. ..
. . . . a b r
1 XXX
y11r y12r ··· y1br y= y
y 11 y 12 ··· y 1a y 1 n i =1 j =1 k =1 ijk
2 y211 y221 ··· y2b1
y212 y222 y2b2 r
.. ..
···
.. .. 1X
y ij = y
r k =1 ijk
. . . .
y21r y22r ··· y2br
y 21 y 22 ··· y 2b y 2
.. .. .. .. .. .. b
. . . . . . 1X
y i = y
a ya11
ya12
ya21
ya22
···
···
yab1
yab2
b j =1 ij
.. .. .. .. a
. . . .
1X
ya1r ya2r yabr y j = y
a i =1 ij
···
..
y a1 y a2 . y ab y a
Media y 1 y 2 ··· y b y
i =1 j =1 k =1
i =1 j =1 k =1
i =1 j =1 k =1
i =1 j =1 k =1
i =1 j =1 k =1
SCE = 6042, 5 − 4961 = 1081, 5
2 X 3 X 4
SCA = (y i − 46, 75)2 = 12[(33, 083 − 46, 75)2 + (60, 416 − 46, 75)2 ] = 4482, 6
X
i =1 j =1 k =1
2 X 3 X 4
SCB = (y j − 46, 75)2 = 8[(43, 753 − 46, 75)2 + (51, 25 − 46, 75)2 + (45, 25 − 46, 75)2 ] = 252
X
i =1 j =1 k =1
SCAB = 4961 − 4482, 6 − 252 = 226, 3
mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 8 / 33
Prueba de hipótesis
(Tabla de ANOVA)
Modelo Suma de Grados de Media Fc
cuadrados libertad cuadrática
SCA MCA
Factor A SCA a−1 MCA= FA =
(a − 1) MCE
SCB MCB
Factor B SCB b−1 MCB= FB =
(b − 1) MCE
SCAB MCAB
Interacción A y B SCAB (a − 1)(b − 1) MCAB= FAB =
(a − 1)(b − 1) MCE
SCE
Error SCE n − ab MCE=
(n − ab)
Total SCT n−1
Estadísticos descriptivos
Variable dependiente:Cantidad
Fertilizante Variedad de trigo Desviación
Media típica N
1 1 29,75 8,261 4
2 41,50 3,000 4
3 28,00 5,944 4
Total 33,08 8,361 12
2 1 57,75 10,658 4
2 61,00 2,944 4
3 62,50 11,210 4
Total 60,42 8,479 12
Total 1 43,75 17,376 8
2 51,25 10,780 8
3 45,25 20,226 8
Total 46,75 16,209 24
Subconjuntos homogéneos
El método indicaría que cuando se hacen las comparaciones de a pares en
las variedades, no existirían diferencias signicativas (valores−p >0,05).
Esto es lógico, pues la ANOVA nos había dicho lo mismo.
mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 23 / 33
Ejemplo de un ANOVA factorial en SPSS
Estos grácos de medias son útiles para detectar efectos de interacción,
cuando la interacción es signicativa, las líneas tienden a cruzarse, de
manera muy marcada (en forma de X), en este caso existe una interacción,
pero no es signicativa (según el ANOVA, pues el valor−p = 0, 181).
Medias marginales estimadas de Cantidad Medias marginales estimadas de Cantidad
Variedad Fertilizante
de trigo
1
60 1 60
2
2
Medias marginales estimadas
40 40
30
30
1 2 1 2 3
Variedad de trigo
Fertilizante
Pruebas de normalidad
a
tratamientos Kolmogorov-Smirnov Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Residuo para Cantidad 1 ,237 4 . ,939 4 ,650
2 ,298 4 . ,849 4 ,224
3 ,250 4 . ,900 4 ,430
4 ,221 4 . ,950 4 ,716
5 ,250 4 . ,953 4 ,734
6 ,219 4 . ,959 4 ,771
a. Corrección de la significación de Lilliefors
Estadístico de
1 2 3 4 5 6
tratamiento
Residuo para Cantidad
Hay que
Gráficos Q-Qser cautelosos con el supuesto de homogeneidad, pues si utilizamos
normales
el estadístico de Levene basado en la mediana con gl corregido , podríamos
asumir el supuesto de homogeneidad (valores−p = 0, 059 > 0, 05).
mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 32 / 33
¾Qué hacer si no se cumplen los supuestos de normalidad u
homogeneidad?