Capitulo 4
Capitulo 4
Capitulo 4
CONTENIDO
Pág.
4.1 Introducción al diseño de experimentos 4-2
4.2 Experimentos unifactoriales completamente al azar 4-8
4.3 Diseños experimentales en bloques completos al azar 4-34
4.4 Diseños cuadrados latinos 4-48
4.5 Diseños factoria les 4-56
k
4.6 Diseños factoriales 2 4-74
4.7 Problemas de diseño de experimentos 4-90
REFERENCIAS BIBLIOGRAFICAS 4-114
ANEXO A4. Tabla de números aleatorios 4-115
ANEXO B4. Tabla para la prueba de Dunett 4-116
ANEXO C4. Tabla para la prueba de Duncan 4-117
ANEXO D4. Curvas características de operación para el
4-118
análisis de varianza
ANEXO E4. Tabla para la prueba de homogeneidad de
4-126
varianzas F-máx
4-2
La aplicación del diseño estadístico de experimentos en estas áreas puede dar como
resultados una mejora del rendimiento de los procesos de medición, menor variabilidad y
4-3
mayor apego a los requerimientos de los procesos establecidos, y menor tiempo de desarrollo
y en general menores costos globales.
El uso inteligente de las técnicas estadísticas en la experimentación requiere que el
investigador tenga en mente los siguientes puntos (MONTGOMERY, 1991, cap.1):
Para usar el enfoque estadístico al dis eñar y analizar un experimento se requiere que todos
los participantes tengan una idea clara de que es exactamente lo que se va a estudiar, como
se van a recopilar los datos y, al menos, una idea cualitativa de cómo se van a analizar. A
continuación se presenta una guía del procedimiento recomendado:
5. RECOLECCION DE INFORMACION
Al llevar a cabo el experimento se deben tomar en cuenta las siguientes recomendaciones
(COCHRAN, 1965, cap.2):
a) Asegurar uniformidad en la aplicación de los tratamientos.
b) Ejercitar suficiente control sobre las influencias externas, de tal manera que cada
tratamiento produzca su efecto, bajo condiciones deseables.
c) Proyectar medidas convenientes y no sesgadas de los efectos de los tratamientos.
d) Prevenir errores importantes, de los cuales parece que ningún tipo de experimentos
está enteramente libre. La supervisión y comprobación adecuada del trabajo de los
ayudantes y un examen de los datos de cada unidad experimental por parte del
experimentador, permitirá tener un mayor alcance en el descubrimiento y
rectificación de errores.
Es aconsejable que el experimentador realice una prueba piloto para estimar parámetros
importantes para el cálculo del número adecuado de réplicas, así como también para
controlar el error producido por imprevistos en el experimento a escala completa.
La prueba piloto es la ejecución del experimento tomando una pequeña muestra
arbitraria con el fin de poner a prueba los instrumentos de medición, verificar el manejo
de las operaciones de campo y conocer el comportamiento de las unidades
experimentales ante un tratamiento determinado, etc. Los resultados de una prueba
piloto usualmente sugieren algunas modificaciones antes de realizar el experimento en su
totalidad.
El segundo paso consiste, en el análisis propiamente dicho de los datos. El método más
aplicable para el análisis de datos es el ANALISIS DE VARIANZA, que consiste en analizar
la variación en una respuesta y asignar proporciones (componentes) de esa variación a
cada una de las variables del conjunto de variables independientes controlables o no
(COCHRAN, 1965, cap. 3).
Teóricamente es posible dividir la variabilidad del resultado de un experimento en dos
partes:
1. La variabilidad originada por los factores que influyen directamente en el
resultado del experimento, estudiados en sus distintos niveles o tratamientos.
2. La variabilidad producida por el resto de los factores con influencia en el
resultado del experimento desconocida o no controlable, que se conoce como
error experimental.
Dentro de las ventajas del empleo de diseños unifactoriales se encuentran las siguientes
(COCHRAN, 1965, cap. 4):
i) Permite flexibilidad completa. Puede usarse cualquier número de tratamientos y
repeticiones. Puede variarse a voluntad el número de repeticiones de un tratamiento a otro
(pero no es recomendable sin una buena razón).
ii) El análisis estadístico es fácil, aún si el número de repeticiones no es el mismo para todos
los tratamientos, pues los cálculos para su análisis no presentan ninguna variante
significativa.
iii) Aún cuando los datos de alguna de las unidades se hayan perdido o se rechacen por
alguna causa, el método de análisis sigue siendo sencillo. Por otra parte la pérdida relativa de
información debida a los datos faltantes es de menos importancia que en cualquier otro
diseño.
iv) Permite el máximo número de grados de libertad para la suma de cuadrados del error.
i) Las unidades experimentales se suponen homogéneas. En dicho caso los errores debido a
la heterogeneidad son asignados al error aleatorio.
ii) No tiene mayor grado de precisión, hay otros diseños más eficientes en la estimación del
error estándar por unidad experimental.
Una vez que se ha definido claramente el problema y se han determinado los diferentes
elementos presentes en la investigación: población, marco muestral, unidades
experimentales, factores, variables a medir, tratamientos, etc., entonces se debe calcular el
tamaño de la muestra y generarla a través de un procedimiento que asegure la
aleatorización. Los tratamientos se alojan completamente al azar sobre las unidades
experimentales, bajo la condición de que cada unidad deberá tener una probabilidad
conocida de recibir un tratamiento en particular. Para la distribución, primeramente se
enumeran las unidades experimentales y luego se obtiene una permutación aleatoria. Los
procesos mas comúnmente empleados en la práctica para la obtención de permutaciones
aleatorias, son el uso de una tabla de números aleatorios como la que se presenta en la tabla
anexo A4, o bien, el uso de programas de computadora. En este caso el investigador debe
establecer un criterio para elegir las unidades experimentales y tratamientos; por ejemplo,
tomar el primer digito para el tratamiento y los dos últimos para la unidad experimental.
El objetivo será probar hipótesis apropiadas con respecto a los efectos del tratamiento y
hacer una estimación de ellos. Para probar las hipótesis, se supone que los errores del
modelo son variables aleatorias independientes con distribución normal, con media cero y
varianza σ2. Se supone que esta última es constante para todos los niveles del factor
(MONTGOMERY, 1991, cap. 3).
Además se requiere que el experimento se realice en orden aleatorio, de manera que el
medio ambiente en el que se usan los tratamientos sea lo mas uniforme posible.
El modelo estadístico, describe dos situaciones con respecto al efecto de los tratamientos.
Primero, los tratamientos podrían haber sido seleccionados específicamente por el
experimentador. En esta situación se desea probar hipótesis sobre las medias de los
tratamientos y las conclusiones se aplican sólo a los niveles del factor considerados en el
análisis. Las conclusiones no pueden hacerse extensivas a tratamientos similares que no
4-12
hayan sido consideradas específicamente. También será deseable estimar los parámetros del
modelo (µ, τi, σ2). Este modelo se denomina modelo de efectos fijos (MONTGOMERY, 1991,
cap. 3).
Alternativamente, los k tratamientos pueden ser una muestra aleatoria de una población
mayor de tratamientos. En esta situación sería deseable generalizar las conclusiones (basadas
en la muestra de tratamientos) a todos los tratamientos de la población, ya sea que hayan
sido explícitamente considerados en el análisis o no. En este caso, los τi son variables
aleatorias y resulta inútil conocer sus valores particulares para los tratamientos investigados.
En su lugar se prueban hipótesis con referencia a la variabilidad de los τi y se interpreta dicha
variabilidad. Este modelo de se conoce como modelo de efectos aleatorios o de componentes
de varianza (MONTGOMERY, 1991, cap. 3).
En el modelo unifactorial de efectos fijos, la media del i-ésimo tratamiento viene dada como
µi = µ + τi. Como puede observarse los efectos se definen usualmente como desviaciones
con respecto a la media global µ, por esta razón ∑τ i = 0 (MONTGOMERY, 1991, cap. 3).
La hipótesis nula que se deseará probar es que las medias de todos los tratamientos sean
iguales, es decir que (MONTGOMERY, 1991, cap. 3):
4-13
Ho: µ1 = µ2 =……= µk
O que
Ho: τ i = 0 para i = 1, 2,…., k
Por tanto, es posible hablar de probar la igualdad de medias de los tratamientos, o bien de
probar que los efectos de los tratamientos son cero. El procedimiento apropiado para probar
la igualdad en el nivel medio de k tratamientos es el análisis de varianza en un sentido.
La prueba de hipótesis consiste en evaluar el estadístico Fo que se define como la razón
(MONTGOMERY, 1991, cap. 3):
SCTratamientos ( k − 1) CM Tratamientos
Fo = =
SC Error ( N − k ) CM Error
F o > F α ,k −1 ,N −k
k ni
SC Total = ∑ ∑ (y −Y ) 2
ij (ec. 4.2)
i =1 j =1
4-14
k ni
∑∑ y ij k
∑n
i =1 j =1
en donde Y = con N = i para tamaños muestrales diferentes en cada
N i =1
k ni k k ni
∑ ∑ ( yij - Y )2 = ∑ ni ( y i - Y )2 + ∑ ∑ ( y ij - y i )2
i=1 j=1 i=1 i=1 j=1 (ec. 4.3)
(Donde y i es el promedio obtenido para cada tratamiento)
Es decir, que la suma total de los cuadrados de las desviaciones de cada observación con
respecto a la media global (SCTotal), se descompone en la suma de los cuadrados de las
desviaciones de las medias de los tratamientos en relación con la media global
(SCTratamientos ), que representa a la variabilidad total debida a la diferencia entre los
tratamientos, y la suma de los cuadrados de las desviaciones de las observaciones con
respecto a sus propias medias de tratamiento (SCError ), que representa la variabilidad debida
al error aleatorio. Por tanto puede escribirse(MONTGOMERY, 1991, cap. 3):
Entre más grande sea SCError , mayor será la variación en las observaciones que pueden
atribuirse al error aleatorio. Entre más grande es el valor de SCTratamientos , mayor es la
diferencia que existe entre las medias de los tratamientos y la media global.
Bajo la hipótesis nula y la suposición de que ε ij ∼ N(0, σ2), SCTratamientos /σ
σ2 y SCError /σ
σ2 son
dos variables aleatorias independientes con una distribución chi-cuadrado. Los grados de
libertad se obtienen al separar la suma total de cuadrados. La SCTotal tiene N -1 grados de
libertad, debido a que se pierde un grado de libertad al ser necesario que (MONTGOMERY,
1991, cap. 3):
k ni
∑ ∑ (y
i =1 j =1
ij −Y ) = 0
La suma de los cuadrados de los tratamientos tiene k-1 grados de libertad, debido a que se
impone la restricción (MONTGOMERY, 1991, cap. 3):
4-15
∑ (y i −Y ) = 0
i =1
Donde yi es la suma total para cada tratamiento e Y es la suma total de todos los
datos.
• Media de cuadrados debida al error, que viene dada como:
SCError
MC Error = (ec. 4.7)
N −k
La suma de cuadrados del error puede calcularse a partir de:
SC Error = SC Total − SC Tratamientos
El MCError es un estimador insesgado de σ2 sin importar si la hipótesis nula es cierta. Por otro
lado, si la hipótesis nula es cierta entonces E(MCTratamientos) = σ2; es decir, si Ho es cierta, tanto
MCError como MCTratamientos son estimadores insesgados de la varianza del error. Pero si la
hipótesis nula no es cierta, MCTratamientos tiende a ser generalmente mayor que MCError.
Los estimadores mínimos cuadrados de las medias poblacionales son las medias observadas
de los grupos en tratamiento y i . Las medias observadas son los promedios de ni
s2
s 2
yi =
ni
En donde a partir del análisis de varianza, s2 = MCError.
La construcción de un intervalo al 100(1 - α)% de confianza, para cada media del grupo en
tratamiento i, viene dado por (MONTGOMERY, 1991, cap. 3):
MC Error
IC (1−α)% = y i ± t α/ 2 ,N −k (ec. 4.9)
ni
2 MC Error
IC (1−α)% = ( yi − y j ) ± t α/ 2 ,N −k (ec. 4.10)
( ni + n j ) / 2
4-17
En muchos estudios, uno de los tratamientos actúa como un control para algunos o todos los
restantes. En este caso, el interés se centra en determinar si las respuestas medias de los
tratamientos difieren de la del tratamiento control (por ejemplo, comparar el trabajo de una
serie de laboratorios con un laboratorio de referencia). Dunnett (1955) introdujo un
procedimiento basado en una tasa de error con respecto al experimento con este propósito
(MONTGOMERY, 1991, cap 3).
Las hipótesis a contrastar son: Ho: µi = µcontrol contra H1: µi ≠ µcontrol. El estadístico de
contraste para la prueba, viene dado por:
y i − y control
1 1 1 1
D(k , αE ) = d α,k ,ν s 2 + = dα,k ,ν MC Error +
i
n n control i
n n control
Los valores de dα, k, ν para el método de Dunnett de uno o dos lados, se encuentran en la
tabla del anexo B4, para k tratamientos, un error tipo I de α con respecto al experimento y ν
grados de libertad para la estimación de la varianza del error experimental.
Las estimaciones de los intervalos de confianza simultáneos bilaterales para la diferencia
entre las medias de los tratamientos individuales y la media del control (µi - µcontrol) son
(KUEHL, 2001, cap.3):
y i − y control ± D (k , α )
Al rechazar la hipótesis nula puede concluirse que las medias o el efecto de los tratamientos
difieren significativamente; pero esto no es información suficiente para rechazar una
alternativa en particular, por ejemplo, sea la hipótesis nula Ho: µ1 = µ2 = µ3 rechazada, en
este caso se pudieran haber dado alguna de las siguientes situaciones µ1 = µ2, µ1 ≠ µ3, µ1 =
µ3, µ1 ≠ µ2, µ1 ≠ µ2 ≠ µ3, por lo tanto, esta es una buena razón para que el investigador
4-18
CM Error
S yi = (ec. 4.11)
n
Para el caso de muestras del mismo tamaño. Cuando el tamaño es diferente hay que
reemplazar n por la media armónica nh de {ni} (que es utilizada en el caso de promediar
razones) es decir (MONTGOMERY, 1991, cap. 3):
k
nh = k
∑ (1 n )
i =1
i
Como puede deducirse el promedio armónico de una serie de muestras de igual tamaño es
igual a n (nh = n).
En segundo lugar, deben calcularse los rangos menos significativos a partir de los cuales se
rechaza o no la diferencia entre dos medias determinadas, su ecuación es (MONTGOMERY,
1991, cap. 3):
R p = r α ( p , f )S y i para p = 2, 3,…, k (ec. 4.12)
4-19
Como se mencionó anteriormente, los valores de las cantidades Rp son llamados rangos
estudentizados menos significativos o mínimos intervalos significativos y dependen del niv el
de significación deseado (α) y del número de grados de libertad del cuadrado del error. Esta
dependencia es expresada en el término rα(p, f). Los valores de rα(p, f) pueden obtenerse de
la tabla del anexo C4, para p = 2, 3,...,10 medias (MONTGOMERY, 1991, cap. 3).
A continuación, se prueban las diferencias observadas entre las medias, comenzando por el
valor más alto contra el más pequeño, comparando esta diferencia con el rango menos
significativo Rk. Después se calcula la diferencia entre el valor más alto y el segundo más
pequeño y se compara con Rk-1. Este procedimiento continúa hasta que todas las medias han
sido comparadas con la media más grande. Posteriormente, se obtiene la diferencia entre la
segunda media más grande y la más pequeña y se compara contra el rango menos
significativo Rk-1. Este proceso continúa hasta que han sido consideradas las diferencias entre
todos los k (k-1)/2 posibles pares. Si una diferencia observada es mayor que el rango menos
significativo correspondiente, se concluye que la pareja de medias en cuestión es
significativamente diferente (MONTGOMERY, 1991, cap. 3).
Para evitar contradicciones, ninguna diferencia entre una pareja de medias se considera
significativa si las dos medias se encuentran entre otras dos que no difieren
significativamente (MONTGOMERY, 1991, cap. 3); es decir si sucede el siguiente caso:
Sean y 1 = y 2 y y 3 , parte del conjunto de k medias y y 1 − y 2 , y 1 − y 3 , y 2 − y 3
y 1 − y 3 < R3
y 3 − y 2 < R2
Se concluirá que y 3 − y 2 tienen una diferencia no significativa a pesar de ser mayor que R2,
ya que, en caso contrario, se estaría generando una contradicción, puesto que se está
considerando no significativa la diferencia de y 1 − y 2 y y 1 − y 3 siendo R4 > R3 > R2.
Es importante hacer notar, que a medida que el número de medias incluidas en el grupo
aumenta, la prueba requiere una diferencia observada más grande para detectar parejas de
medias significativamente diferentes. Lo anterior puede explicarse a partir del siguiente
razonamiento:
4-20
específico. En otras palabras cuando se comparan dos medias separadas p pasos, el nivel de
protección es (1-α)p-1 = (1-α)(1-α) …..(1-α); hasta p - 1 veces, en donde α es el nivel de
significación especificado para dos medias adyacentes. Así, el nivel del error de informar al
menos una diferencia significativa incorrecta entre dos medias cuando el tamaño del grupo es
p, será igual a: 1 - (1-α)p-1 (MONTGOMERY, 1991, cap. 3).
Por lo general, si el nivel de protección es α, las pruebas sobre las medias tienen un nivel de
significación mayor o igual que α. En consecuencia, el procedimiento de Duncan es muy
eficiente para determinar diferencias entre medias cuando estas diferencias realmente existen
(MONTGOMERY, 1991, cap. 3).
Muchas veces al experimentador le interesa analizar un factor que tiene un número infinito
de posibles niveles, o bien un número de niveles lo suficientemente grande como para
considerarse infinito. El objetivo de la investigación en este caso, debe ser la obtención de
conclusiones relativas a toda la población de niveles del factor y para lograrlo el investigador
debe seleccionar al azar k de estos niveles y estructurar un diseño unifactorial conocido como
diseño unifactorial de componentes de varianza o de efectos aleatorios. En este diseño las
hipótesis a probar hacen referencia a la variabilidad de los tratamientos y a su interpretación
(MONTGOMERY, 1991, cap. 3). Un ejemplo de aplicación del diseño unifactorial de
componentes de varianza, en análisis químico, es concluir respecto a la homogeneidad de la
concentración de un analito en un producto en polvo contenido en un recipiente, ya que se
puede concebir que el número de puntos a seleccionar en el interior del contenedor es de
carácter infinito.
El modelo estadístico lineal para este diseño, es el mismo que el presentado en la ecuación
4.1, en donde τi e εij son variables aleatorias. Si τi tienen una varianza a σ 2τ y es
independiente de εij, la varianza de cualquier observación es: V(y ij ) = σ 2τ + σ2. Las varianzas
σ 2τ y σ2 se conocen como componentes de varianza y para probar las hipótesis del modelo se
requiere que los εij sean independientes y normalmente distribuidos(NID(0, σ2)), que los ti
4-21
Contra
SCTratamientos ( k − 1) CM Tratamientos
Fo = =
SC Error ( N − k ) CM Error
Tiene una distribución F con k – 1 y N – k grados de libertad. Por tanto, Ho se rechaza si:
F o > F α ,k −1 ,N −k
las componentes de varianza. Al igualar los valores observados y los esperados de las medias
de cuadrados, se obtiene (MONTGOMERY, 1991, cap. 3):
y
CMError = σ2
Los estimadores de las componentes de varianza son (MONTGOMERY, 1991, cap. 3):
σ̂ 2 = CMError
y
CM Tratamientos − CM Error
σˆ τ2 =
n
En donde n es el número de observaciones por tratamiento.
Para tamaños de muestras desiguales, n debe reemplazarse por (MONTGOMERY, 1991, cap.
3):
k
2
1 k ∑ ni
n0 = ∑ n − i =k1
k − 1 i =1 i
∑ ni
i =1
Un intervalo con al menos 100(1 - 2α)% de confianza para σ 2τ es (KUEHL, 2001, cap. 5):
4-23
SCTratamientos (1 − ( Fu / Fo )) SCTratamientos (1 − ( Fl / Fo ))
< σ 2τ < (ec.4.15)
nC nD
Por definición, una componente de varianza es positiva; sin embargo, las estimaciones de σ 2τ
mediante la ecuación (4.15) pueden ser negativas. Existen varios cursos de acción sugeridos
en caso de estimaciones negativas (SEARLE, 1971; SEARLE, CASELLA Y MCCULLOCH, 1992):
1. Aceptar la estimación como evidencia de un valor verdadero de cero y usar el cero como la
estimación, reconociendo que el estimador será sesgado.
2. Conservar la estimación negativa, tomando en cuenta que es posible que los cálculos
subsecuentes con los resultados no tengan mucho sentido.
3. Interpretar la estimación de la componente negativa como una indicación de un modelo
estadístico incorrecto.
4. Utilizar un método diferente de análisis de varianza para estimar sus componentes.
5. Reunir más datos y analizarlos por separado o junto con los existentes y esperar que el
aumento de información conduzca a estimaciones positivas.
Uno de los problemas principales que se enfrentan al llevar a cabo una investigación
experimental, es la elección del número de réplicas necesario para detectar alguna diferencia
predeterminada entre las medias de los tratamientos. En análisis químico, esta elección
muchas veces está condicionada a la disponibilidad de recursos humanos, materiales, y
económicos.
No obstante, se considera de gran importancia poder definir el número de réplicas que sería
conveniente tomar para un determinado estudio y de esta forma establecer comparaciones y
estimaciones objetivas sobre la potencia de los contrastes a la hora de validar los modelos
empleados.
1
Para el cálculo del tamaño de la muestra se estará bajo el supuesto que n = n1 = n2 =...= nk .
4-24
Por otra parte, siempre que sea aplicable, toda investigación experimental que involucre un
diseño unifactorial debe partir con el calculo del número de réplicas pues ello conduce a un
control más eficiente del error tipo II (β).
El cálculo del número de réplicas en un diseño unifactorial depende en primer lugar, de la
aleatoriedad o no de los niveles del factor. Y en segundo lugar, de la sensibilidad de la
prueba, que describe la capacidad del procedimiento para detectar diferencias en las medias
poblacionales y se mide por la potencia de la prueba 1-ß2 .
A continuación, se describe el cálculo del número de réplicas para los modelos unifactoriales
de efectos fijos y efectos aleatorios.
∑τ
k
de libertad y parámetro de desplazamiento λ = n i
2
i / σ 2 (valor del efecto
2
Como se presentó en la sección 3.3.2 del capítulo 3, la potencia de una prueba es la probabilidad de
rechazar la hipótesis nula (Ho) siendo la hipótesis alternativa verdadera (decisión correcta). La potencia
de una prueba puede calcularse como 1-ß, donde ß es la probabilidad de cometer un error tipo II, el
cual se comete al aceptar Ho cuando en realidad es falsa (decisión incorrecta).
4-25
nD 2
Φ2 =
2kσ 2
En el anexo D4 se presentan tablas y curvas de potencia para la distribución F
desplazada.
σ2τ
λ = 1+ n
σ2
aumento en σy aceptable (P), y que con uno mayor se rechaza la hipótesis nula es:
σy σ2τ + σ 2
= = 1 + 0.01P
σ σ2
σ2τ
= ( 1 + 0.01P ) 2 − 1
σ2
La validez de las estimaciones y pruebas de hipótesis con respecto al análisis de los datos, se
apoyan en el establecimiento de varias suposiciones clave. Las suposiciones que
fundamentan el análisis de varianza son:
a. Que los datos estén descritos de manera adecuada por el modelo lineal:
i = 1,2 ,..., k
y ij = µ + τi + ε ij
j = 1, 2 ,..., n i
b. Que los errores (εij) sean variables aleatorias independientes y normalmente
distribuidas con media cero y varianza constante (εij ∼ N(0, σ2)).
4-27
ε ij = y ij − yˆij
Para el caso del modelo unifactorial los residuos quedan definidos como:
ε ij = y ij − y i
En otras palabras, los residuos del i-esimo tratamiento se determinan restando el promedio
del tratamiento a cada observación dentro del tratamiento.
La comprobación de la idoneidad del modelo consiste en observar la magnitud de los
residuos y su relación con otras variables, proporcionando evaluaciones visuales de las
suposiciones del análisis de varianza. La suposición de varianza homogénea se evalúa con
una gráfica de los residuos contra las medias estimadas de los tratamientos. La suposición de
independencia se evalúa con una gráfica de los residuos contra los valores predichos, y la
4-28
lo que cuando se detecta uno en potencia debe realizarse una cuidadosa investigación
(MONTGOMERY, 1991, cap. 4).
Un procedimiento informal para detectar residuos distanciados es analizar residuos
estandarizados (MONTGOMERY, 1991, cap. 4):
εij
d ij =
CM Error
Si los εij son N(0, σ2), los residuos estandarizados deben ser aproximadamente normales
con media cero y varianza igual a uno. Por lo tanto, es aplicable la regla empírica general
a los residuos estandarizados (ver capítulo 1). Un residuo a una distancia mayor que 3 ó
4 desviaciones estándar del origen es potencialmente un residuo distanciado ó anómalo
(MONTGOMERY, 1991, cap. 4).
99.9
99
95
Porcentaje
80
50
20
5
1
0.1
-0.45 -0.25 -0.05 0.15 0.35 0.55
Residuos
Algunas veces la varianza de las observaciones aumenta a medida que la magnitud de los
residuos lo hace. Esto resulta cuando el residuo es proporcional a la magnitud de la
observación, en este caso la gráfica de comportamiento de los residuos contra los valores
predichos ( yˆij ) parecerá un embudo que se ensancha. La varianza variable de los
residuos también ocurre en casos cuyos datos no tienen una distribución normal y están
sesgados (MONTGOMERY, 1991, cap. 4).
Si la suposición de homogeneidad no se cumple, la prueba F es solo ligeramente afectada
en los modelos balanceados de efectos fijos. Sin embargo, el problema es serio en el caso
desbalanceado y en el de efectos aleatorios (MONTGOMERY, 1991, cap. 4).
El enfoque usual para tratar varianzas variables de los residuos consiste en aplicar una
transformación para igualar varianzas y volver aplicar el análisis de varianza a los datos
trasformados (MONTGOMERY, 1991, cap. 4).
εij εij
yˆij yˆij
(a) (b)
εij
yˆij
(c)
FIGURA 4.2 PATRONES DE COMPORTAMIENTO DE LOS RESIDUOS CONTRA LOS VALORES PREDICHOS yˆij :
CASO (a), el error no está normalmente distribuido ni la varianza es constante. CASO (b), la distribución de los residuos no
presenta varianza constante. CASO (c), representa el comportamiento cuando existe homogeneidad en la varianza de las
observaciones (de varianza constante de los residuos).
4-31
La gráfica de dispersión (spread-location) s-l, es otra gráfica residual que revela más
sobre las varianzas heterogéneas. Las tendencias en la gráfica s-l se pueden usar para
revelar las posibles relaciones entre las medias y las varianzas de los grupos en
tratamiento (KUEHL, 2001, cap. 4).
ε ij
Las raíces cuadradas de los valores absolutos de los residuales, se usan para medir
la dispersión de los residuos, ya que su magnitud reflejará la dispersión o variación dentro
de un grupo de tratamiento. La raíz cuadrada elimina parte de la asimetría en los
residuales, mientras las estimaciones de las medias de grupos de tratamientos miden la
localización. En la figura 4.3 se muestra una gráfica s-l (KUEHL, 2001, cap. 4).
ε ij
Uniendo, mediante líneas rectas, las medianas de las para cada sitio en la gráfica
muestran el incremento en su magnitud con un incremento en las medias de los sitios.
Esta tendencia del incremento en la magnitud de los valores absolutos de los residuos,
representa el aumento en la varianza del sitio cuando crece la media (KUEHL, 2001, cap.
4).
En general, las hipótesis nula y alternativa para todas las pruebas son:
1 k
c =1+ ∑ (ni − 1)−1 − (N − k )−1
3(k − 1) i =1
k
∑ (n i − 1) S i 2
S2P = i =1
N −k
y S i 2 es la varianza muestral de la i-ésima población.
El valor de q es grande cuando hay una gran diferencia entre las varianzas muestrales
S i 2 y es igual a cero si todas las S i 2 son iguales. Por tanto, debe rechazarse Ho para
valores grandes de χo2 . En otras palabras, se rechaza Ho, sólo si, χo2 > χ α ,k −1 , en donde
2
libertad. Varios estudios indican que la prueba de Bartlett es muy sensible a la suposición
de normalidad y no debe ser aplicada cuando exista alguna duda en cuanto a esta
suposición (MONTGOMERY, 1991, cap. 4).
Una prueba menos sensible a las suposiciones de normalidad, es la prueba de
Levene(1960). Sea y ij la j-ésima observación del -i ésimo grupo de tratamiento y y~i su
mediana. Sea zij = | y ij - y~i | el valor absoluto de la diferencia entre una observación y la
CM Tratamientos ∑n (z i i − z ) 2 /( k − 1)
Fo = = k
i =1
ni
∑∑ ( z
CM Error
ij − z i ) 2 /( N − k )
i =1 j =1
Otra prueba sencilla válida cuando los tamaños de las muestras son iguales y las
observaciones tienen una distribución normal, es la prueba F máx (Hartley, 1950). El
estadístico de la prueba es el siguiente (KUEHL, 2001, cap. 4):
máx ( s i2 )
F o Máx =
min( s i2 )
Donde máx ( s i2 ) y min( s i2 ) son las varianzas mayor y menor respectivas dentro de
εij
εij
(t) (t)
(a) (b)
Cuando las unidades experimentales no son homogéneas, la variación entre las unidades
puede encubrir los verdaderos efectos de los tratamientos sobre una respuesta, evitando
tener comparaciones precisas entre los mismos. Factores como soluciones patrón de distinta
concentración, muestras de orígenes diferentes, lotes distintos de reactivos o material
fabricado, etc., son ejemplos de variables externas al tratamiento que marcan la diferencia
entre las unidades experimentales, aumentando por tanto, la variación entre las
observaciones de la variable respuesta.
El bloquear estratifica a las unidades experimentales en grupos homogéneos, o unidades
parecidas. Una buena elección de los criterios de bloqueo es un medio para reducir y
controlar la varianza del error experimental con el fin de lograr una mayor precisión. Algunos
criterios de bloqueo son: 1) proximidad (reactivos de un mismo lote); 2) características físicas
(soluciones de distintas concentraciones); 3) tiempo; 4) administración de la tarea del
experimento (KUEHL, 2001, cap. 8).
El diseño de bloques al azar es uno de los primeros válidos para estimar el error experimental
y para probar si los efectos de los tratamientos son significativos a pesar de la
heterogeneidad de las unidades experimentales sobre las que se hacen las observaciones.
4-35
Un bloque es simplemente una porción de material experimental que se espera que sea más
homogéneo que el total o por lo menos más homogéneo que el material primitivo no
clasificado (KENETT y ZACKS, 2000, cap. 12).
Los bloques completos al azar comprenden el mismo número de unidades experimentales.
Cada tratamiento se ensaya el mismo número de veces sobre otras tantas unidades
experimentales. El objetivo consiste en mantener la variabilidad entre unidades
experimentales dentro de un bloque tan pequeña como sea posible y maximizar la diferencia
entre bloques.
El diseño se recomienda en experimentos donde la variación debida a la heterogeneidad en
las unidades experimentales es tan grande que se puede reducir formando bloques. En
general, las condiciones bajo las cuales se hará uso del diseño de bloques completos al azar
son las siguientes (COCHRAN y COX, 1965, cap. 4):
Entre las ventajas del empleo de este tipo de diseño se encuentran (COCHRAN y COX, 1965,
cap. 4):
4) Si la varianza del error experimental es mayor para algunos tratamientos que para
otros aún puede obtenerse un error insesgado para probar cualquier combinación
específica de las medias de los tratamientos.
5) Las medias de las repeticiones dan comparaciones insesgadas de las diferencias entre
las repeticiones.
Las limitaciones principales en la aplicación de este tipo de diseño son las siguientes
(COCHRAN y COX, 1965, cap. 4):
en el diseño de bloques completos al azar no se deberá efectuar una prueba estadística del
efecto de bloques (ANDERSON y MC LEAN, 1974).
Donde µ es una media general, τi es el efecto del i-ésimo tratamiento, βj es el efecto del j-
ésimo bloque y ε ij es el error aleatorio. Según el modelo los efectos del tratamiento y el
bloque son aditivos, sin existir interacción; también se supone que los errores experimentales
son independientes, con media cero y varianza común σ2. La suposición de independencia se
justifica a través de la asignación aleatoria de los tratamientos a las unidades experimentales.
En la tabla 4.4 se muestra la plantilla de recolección de datos para un diseño completo de
bloques al azar.
BLOQUE
TRATAMIENTO
1 2 .…. b Suma Medias de
tratamiento
1 y11 y12 … y1b Yk1 yk1
2 y21 y22 … y2b Yk2 yk2
. . . . . .
. . . . . .
k yk1 yk2 … ykb Ykk y kk
Sumas de bloque Yb1 Yb2 … Ybb Y
Medias de bloque y b1 y b2 … y bb y
4-38
En donde:
Yki : Suma de las observaciones para el i-ésimo tratamiento.
Ybj : Suma de las observaciones en el j-ésimo bloque.
Y : Suma de todas las bk observaciones.
y ki : Media de las observaciones para el i-ésimo tratamiento.
• Error experimental: ( y ij − y i• − y • j + y )
El contraste de hipótesis en el diseño por bloques al azar es el mismo que para el caso del
diseño unifactorial, es decir (Montgomery, 1991, cap.5):
El reordenamiento de los términos de la ecuación 4.17, forma una identidad algebraica para
la desviación de las observaciones de la media del tratamiento (KUEHL, 2001, cap. 8):
Como puede observarse de la ecuación 4.18, se hace una partición de la desviación estándar
del error experimental del diseño totalmente aleatorizado, y ij − y i• , en dos componentes, el
(ec. 4.19)
La que se puede expresar simbólicamente como:
La suma de cualquier producto cruzado en el lado derecho es cero (lo que evidencia que se
asume que no existe efecto de interacción entre el factor y el factor de bloque).
Como se tienen N observaciones, la suma de cuadrados total( SCTotal) tiene N - 1 grados de
libertad. Las sumas de cuadrados de los tratamientos (SCTratamientos) y de los bloques
(SCBloques), tienen (k - 1) y (b - 1) grados de libertad respectivamente.
Los grados de libertad asociados con la suma de cuadrados del error (SCError ) se obtienen por
sustracción, esto es:
Por lo que, los grados de libertad de la suma de cuadrados del error son (k - 1)(b - 1).
Los valores esperados de las sumas de cuadrados para los tratamientos, bloques y el error
aleatorio, están dados por (MONTGOMERY, 1991, cap. 5):
4-40
k
b ∑τi2
i =1
E ( SCTratamientos ) = σ 2 +
k −1
b
k ∑ βi2
j=1
E ( SCBloques) = σ 2 +
b −1
E ( SCError ) = σ 2
CM Tratamientos
Fo =
CM Error
La cual es un valor de una variable aleatoria que tiene una distribución F con k-1 y (k-1)(b-1)
grados de libertad cuando la hipótesis nula es verdadera. La hipótesis nula se rechaza con un
nivel de significación α cuando (MONTGOMERY, 1991, cap. 5):
Se debe recordar que la aleatorización fue aplicada solo a los tratamientos dentro de los
bloques, y que la prueba F del análisis de varianza solamente se puede justificar con base en
la aleatorización sin necesidad de usar la suposición de normalidad; es por esa razón que
dicha prueba se excluye del análisis de varianza.
La razón entre CMBloques/CMError puede ser un procedimiento aproximado para investigar el
efecto de la variable bloque. Un valor grande de esa razón, implica que el factor bloque tiene
un efecto grande y que la reducción del error obtenido al analizar por bloques probablemente
fue útil al mejorar la precisión de las comparaciones de las medias de los tratamientos.
Existen ecuaciones más sencillas para el cálculo de la suma de cuadrados que son:
k b 2
SCTotal = ∑ ∑ y ij − Y
2
i=1 j=1 bk
k 2
y i• Y 2
SCTratamientos = ∑ -
i=1 b bk
y• j 2 Y 2
b
SCBloques = ∑ -
j=1 k bk
Por ejemplo, si los bloques son aleatorios, se espera que las comparaciones entre los
tratamientos sean las mismas en toda la población de bloques de la que se eligieron
aleatoriamente los que se usaron en el experimento. También existen cambios que
corresponden a la esperanza de la media de cuadrados. Por ejemplo, si los bloques son
aleatorios, E ( CM Bloques ) = σ + kσBloqies en donde σBloqies es la componente de varianza
2 2 2
del efecto de bloques. La varianza de una media de tratamiento con bloques aleatorios
incluye la componente de la varianza para los bloques, σBloqies , y será mayor que la varianza
2
La elección adecuada del número de bloques, es una decisión importante cuando se trabaja
con un diseño de bloques completos al azar. Al aumentar el número de bloques, aumenta el
número de réplicas por tratamiento, ya que cada tratamiento aparece representado en cada
uno de los bloques. En otras palabras a mayor número de bloques, pruebas más confiables3.
Por otro lado, al aumentar el número de bloques los costos aumentan, el investigador corre el
riesgo de perder control sobre el experimento, etc. Por lo que hay necesidad de tomar el
número de bloques óptimo que garanticen una probabilidad mínima (1-ß) de no equivocarse
al rechazar la hipótesis nula siendo ésta falsa. Dicha prueba, como se vio en la sección
3
bajo el supuesto que el investigador tiene los recursos necesarios para controlar grandes
cantidades de datos.
4-43
CM Tratamientos
1-β=P[ > Fα,(k-1),(k-1)(b-1) cuando H1 es verdadera ]
CM Error
CM Tratamientos k
=P[
CM Error
> Fα,(k-1),(k-1)(b-1) cuando ∑τ i ≠ 0]
i =1
Cualquiera de las técnicas presentadas en la sección 4.2.3, para la selección del número de
réplicas pueden aplicarse a un diseño aleatorizado por bloques (MONTGOMERY, 1991, cap.
5).
Las expresiones para λ2 y Φ 2 así como los grados libertad para el diseño de bloques
aleatorizados se presentan en la tabla 4.6.
Diseño de Bloques
ν1 ν2 λ2 Φ2
k-1 (k-1)(b-1) k k
b ∑τ ∑τ
2
i b i
2
i= 1 i= 1
σ2 kσ 2
En caso que sea difícil encontrar τi para calcular Φ 2, puede obtenerse en función de la
diferencia mínima entre dos medias de bloque que se desea determinar (D). De esta forma
(MONTGOMERY, 1991, cap. 5):
bD2
Φ =
2
2k σ2
La potencia de la prueba puede incrementarse utilizando un tamaño de bloque b más
grande. Para el diseño en bloques se desea determinar un valor de b con el cual se
satisfagan los requerimientos de potencia.
El objetivo de encontrar el número de bloques es para asegurar que el número de éstos den
una prueba satisfactoria, con una probabilidad 1-ß de rechazar Ho siendo H o falsa.
4-44
Cuando el factor es aleatorio, λ viene dado por (MONTGOMERY, 1991, cap. 5):
bσ 2τ
λ = 1+
σ2
en donde k-1 son los grados de libertad del numerador y (k-1)(b-1), los grados de libertad
del denominador.
Si tanto los tratamientos como los bloques son fijos, los parámetros del modelo de diseño
aleatorio por bloques completos pueden estimarse mediante mínimos cuadrados.
Dado que los efectos de tratamientos y de bloques se consideran como desviaciones de la
media general, se imponen las restricciones (MONTGOMERY, 1991, cap. 5)::
k k
∑ τi = 0 y ∑β i =0
i =1 i =1
Por lo tanto las ecuaciones normales se reducen a (MONTGOMERY, 1991, cap. 5):
kbµˆ = Y
bµ
ˆ + bτˆi = y i• i = 1,2,..., k
kµˆ + kβˆ j = y • j j = 1,2,..., b
yˆ ij = µˆ + τˆi + βˆ i
yˆ ij = yi• + y • j − y
Si los tratamientos en un diseño aleatorizado por bloques son fijos, y el análisis indica una
diferencia significativa entre las medias de tratamiento, sería interesante llevar a cabo
comparaciones múltiples, para determinar qué medias de tratamiento son diferentes.
Cualquiera de los métodos de comparación planteados en la sección 4.2.2.4, puede usarse
4-45
con este propósito. Simplemente, hay que reemplazar el número de réplicas del diseño
unifactorial completamente aleatorizado (n), por el número de bloques (b) en las fórmulas,
por otra parte, también deben usarse como grados de libertad del error, los correspondientes
al diseño por bloques al azar: (k-1)(b-1) (MONTGOMERY, 1991, cap. 5).
Las suposiciones relativas a los errores experimentales del modelo lineal para el diseño de
bloques completos al azar se pueden evaluar con un análisis de residuos, como el presentado
en la sección 4.2.4. Se calculan los residuos a partir de la componente de la desviación del
error experimental mostrada en la ecuación 4.17, como:
εij = yij − y i• − y• j + y
Es posible que en algunos experimentos en los que se usan diseños aleatorizados por
bloques no puedan realizarse los ensayos de todas las combinaciones de tratamiento
dentro de cada bloque. Situaciones como esta ocurren debido a la escasez en los recursos
del experimento, por el tamaño físico de los bloques. En estos casos es posible usar
diseños aleatorizados por bloques en los que cada tratamiento no está presente en cada
bloque. Estos diseños se conocen como diseños aleatorizados por bloques
incompletos (MONTGOMERY, 1991, cap. 6).
Cuando las comparaciones entre todos los tratamientos tienen la misma importancia, estas
deben elegirse de manera que ocurran en forma balanceada en cada bloque. Esto significa
que cada par de tratamientos ocurren juntos el mismo número de veces que cualquier otro
par. Por lo tanto, un diseño balanceado (o equilibrado) por bloques incompletos es un
diseño en el que cualquier par de tratamientos ocurren juntos el mismo número de veces
(MONTGOMERY, 1991, cap. 6).
Los diseños de bloques incompletos balanceados son los que asignan k tratamientos a b
bloques de tamaño r, r ( k, como sigue (KENETT y ZACKS, 2000, cap. 12):
k − 1 k − 2
t = y a =
r − 1 r − 2
k − 1 k! k
N = kt = k = = r = rb
r − 1 ( r − 1)! ( k − r )! r
del tema se proporcionan algunos planes para pocos tratamientos (KENETT y ZACKS,
2000, cap. 12).
Una vez construido el diseño básico con los números de código de los tratamientos, los
pasos para aleatorizar son los siguientes (KENETT y ZACKS, 2000, cap. 12):
Donde µ es una media general, τi es el efecto del i-ésimo tratamiento, βj es el efecto del j-
ésimo bloque y ε ij son los errores aleatorios independientes, con media cero y varianza
común σ2.
Los efectos de tratamientos y bloques no son ortogonales en los diseños de bloques
incompletos porque no aparecen todos los tratamientos en cada bloque; por lo tanto no sería
correcto para el diseño incompleto calcular la partición de la suma de cuadrados para los
tratamientos igual que para el diseño de bloques completos, tampoco las medias de
tratamiento proporcionan estimaciones insesgadas de µi. Los parámetros estimados y las
sumas de cuadrados de los tratamientos para los diseños de bloque incompleto balanceados
se calculan con fórmulas relativamente directas.
Supóngase que Tj es el conjunto de los índices de bloques que contienen el i-ésimo
tratamiento. Los estimados de los efectos del tratamiento, por mínimos cuadrados, se
obtienen como sigue (MONTGOMERY, 1991, cap. 6):
4-48
∑
b
tratamiento. Y que W i * = j =1
n ij y bj es la suma de valores en todos los t bloques que
Q i = W i − ( 1 / r )W i * i = 1, 2,…, k
∑Q i =0
i =1
k b
por consiguiente, ∑ˆτi = 0 , sea y = 1 / N ∑ ∑y il (Bj conjunto de tratamientos en el j-
i =1 j =1 l ∈B j
Entre las ventajas del empleo del diseño cuadrado latino se encuentran (COCHRAN, 1965,
cap. 4):
Entre las limitaciones de la aplicación del diseño cuadrado latino (COCHRAN, 1965, cap.
4):
• Como el número de tratamientos depende del número de filas y columnas esto le
quita flexibilidad al diseño para su uso.
• Se cuenta con menos grados de libertad para el error experimental que con los
diseños anteriores.
• El número de unidades experimentales requeridas para establecer un experimento,
se incrementa notablemente a medida que aumenta el número de tratamientos en
ensayo.
Puesto que cada fila es un bloque, cada fila de cuatro unidades deberá tener A, B, C, D en
un orden cualquiera.
Asimismo, puesto que cada columna es un bloque, deberá tener A, B, C, D en un orden
cualquiera. Se debe comprobar detenidamente que en cada fila y en cada columna
aparecen A, B, C, D sin duplicación.
Un ejemplo de la distribución de unidades para el diseño cuadrado latino seleccionado
podría ser:
COLUMNAS
FILAS 1 2 3 4
1 A B C D
2 D A B C
3 C D A B
4 B C D A
Como ya se mencionó el diseño de cuadrado latino se usa para eliminar dos fuentes de
variación no controlada, es decir, permite analizar sistemáticamente por bloques en dos
direcciones. En este diseño, las filas y las columnas representan las restricciones de la
aleatorización. Un cuadrado latino r x r, es un cuadrado que contiene r filas y r columnas.
El modelo estadístico lineal para este diseño es el siguiente (MONTGOMERY, 1991, cap.
5):
y mij = µ + α m + τ i + β j + ε mij
Las hipótesis a probar en este tipo de diseño son las mismas que para el caso del diseño
unifactorial, es decir:
Ho: τ i = 0 para todo i = 1, 2,…., k
l k b
∑ αm =
m =1
∑ τi = ∑ β j = 0
i =1 j =1
4-53
Se supone que no hay interacción entre los tratamientos y las columnas y los renglones.
La notación para totales y las medias de las observaciones para renglones y columnas
∑
l
siguen la convención usual con Y m = j
y ij para el total de un renglón y
∑
b
Yj = j
y ij para el total de columna. El total de tratamiento estará representado como Yi
que implica una suma de observaciones sobre las unidades experimentales que reciben el
tratamiento k. De igual forma, y ki representa la media de las observaciones en el k-ésimo
tratamiento. Se asume que y mij son valores de variables aleatorias independientes que
tienen distribuciones normales con media µmij donde µmij = µ + αm + τi + β j . Siendo la
y imj − y = ( y ki − y ) + ( y bj − y ) + ( y lm − y ) + ( y imj − y ki − y bj − y lm + 2y )
(ec. 4.22)
Los términos del lado derecho de la ecuación 4.22 son:
Al elevar al cuadrado ambos lados de la ecuación 4.22 y sumar los términos se llega a la
partición aditiva de:
k l b m b k
∑ ∑∑ ( yimj − y )2 = l∑ ( y ml − y )2 + l ∑ ( ybj − y ) 2 + l∑ ( y ki − y )2 +
i =1 m=1 j=1 l =1 j=1 i =1
k b l
∑ ∑ ∑( y
i =1 j =1 m =1
imj − y ki − y bj − y ml + y ) 2
4-54
Es decir,
SCTotal =SCTratamientos + SCColumnas + SCRenglones + SCError (ec. 4.23)
Al dividir cada una de las sumas de cuadrados del lado derecho de la ecuación 4.23 por
sus correspondientes números de grados de libertad, considerando que b = k = l = r, se
obtienen cuatro estimaciones independientes de σ2 que son: el cuadrado medio de los
renglones, columnas, tratamientos y error, respectivamente, y que se denotan por:
CMRenglones=SCRenglones/r-1
CMColumnas=SCColumna s/r-1
CMTratamientos =SCTratamientos/r-1
CMError = SCError /(r-2)(r-1).
Para probar la hipótesis nula de que los efectos de los tratamientos son todos iguales a
cero, se calcula la relación (MONTGOMERY, 1991, cap. 5):
CM Tratamientos
Fo =
CM Error
La cual es un valor de una variable aleatoria que tiene una distribución F con k-1 y (r -2)(r-1)
grados de libertad cuando la hipótesis nula es verdadera. La hipótesis nula se rechaza con un
nivel de significación α cuando (MONTGOMERY, 1991, cap. 5):
El cuadrado medio del error es un estimador insesgado de σ2, sin importar si la hipótesis
nula es cierta. Si Ho es cierta, CMRenglones, CMColumnas , CMTratamientos son estimadores
insesgados de σ2 también; en caso contrario se dan las siguientes relaciones (BOX et al.,
1989, cap. 8):
r r
r ∑α 2
i
r ∑ βi2
j =1
E ( CM Re nglones ) = σ +
2 l =1
E ( CM Columnas ) = σ 2 +
r −1 r −1
r
r ∑ τ 2i
E ( CM Tratamientos ) = σ2 + i =1
E ( CM Error ) = σ 2
r −1
4-55
Para facilitar el cálculo manual de las expresiones de la tabla se presentan las alternativas
siguientes (MONTGOMERY, 1991, cap.5):
2
r r r
Y
SCTotal = ∑∑ ∑ y
i =1 j =1 l =1
2
ijl −
r
r
∑y 2
ml
Y
2
SC Re nglones = l =1
−
r r
∑y 2
bj
Y
2
j =1
SC Columnas = −
r r
r
∑y 2
ki
Y
2
SC Tratamientos = i =1
−
r r
SC Error = SC Total − SC Re nglones − SC Columnas − SC Tratamientos
CM Tratamientos
1-β=P[ > Fα,(r-1),(r-1)(r-2) cuando H1 es verdadera ]
CM Error
CM Tratamientos k
=P[ > Fα,(r-1),(r-1)(r-2) cuando ∑ τi ≠ 0 ]
CM Error i =1
Siguiendo el mismo análisis del tamaño de muestra para diseños anteriores se define Φ 2
por la relación:
r
b ∑ τi 2
λ2
Φ2 = i =1
=
r
rσ2
El procedimiento para determinar el número de bloques fila o columna para garantizar una
prueba potente es similar a los estudiados anteriormente.
Los residuos se pueden usar para evaluar las suposiciones del modelo (como se describe
en la sección 4.2.4, de la ecuación 4.22, el residuo de las observaciones del i-ésimo
tratamiento en el m-ésimo renglón y la j-ésima columna es:
tipo cualitativo o cuantitativo sobre una respuesta, y que en general, son conocidos como
diseños factoriales.
Los diseños factoriales pueden clasificarse como: diseños factoriales completos, diseños
MODELAJE OPTIMIZACION
DIAGNOSTICO EMPIRICO Diseños de MODELAJE
k-p
Diseños factoriales 2 Diseños factoriales superficie TEORICO
Diseños Placket- completos respuesta Modelos
Burman Diseños 2 k Diseños de mezclas mecanicistas
Diseños anidados Diseños simplex
En las secciones 4.5 y 4.6 se presenta la descripción para la realización de los diseños
factoriales completos y 2k respectivamente. Un estudio detallado de los demás tipos de
diseños factoriales se considera fuera del alcance de este trabajo, pudiéndose estudiar con
más detalle en MONTGOMERY (1991), PRAT et al. (1999) y LAWSON et al. (1992) (ver
referencias bibliográficas).
Los experimentos factoriales completos son aquellos en los que se efectúan pruebas
completas de todas las combinaciones de los diversos factores de carácter fijo o aleatorio.
El número de combinaciones de tratamiento a obtener en un diseño factorial viene dado por
mismo número de niveles para cada factor y el mismo número de replicas para cada
k
combinación, la representación del diseño puede reducirse a P x n, en donde P indica el
número de niveles común de todos los factores, el superíndice k indica el número de factores
y n el número de replicas para cada combinación de tratamientos. El orden en el que se
efectúan las pruebas es aleatorio.
Los niveles de un factor cuantitativo toman valores métricos, mientras que los niveles de un
factor cualitativo son las categorías del factor. Por ejemplo el factor temperatura de secado
esta expresado en escala métrica (25ºC, 30ºC, etc.) y el factor material del envase es de
carácter cualitativo (plástico, vidrio, etc.).
El efecto de un factor es un cambio en la respuesta media ocasionado por un cambio en el
nivel de ese factor. Los dos efectos de interés en un experimento factorial son los simples o
principales y los de interacción. Los efectos simples o principales de un factor son las
comparaciones entre los niveles del mismo. Los efectos de interacción miden las diferencias
entre los efectos simples de un factor a diferentes niveles del otro. Por ejemplo, si hay I
I
factores, A, B, C,… a dos niveles cada uno hay I tipos de efectos principales, hay tipos de
2
I
interacciones apareadas AB, AC, BC,….., interacciones entre tres factores, ABC, ABD, ….,
3
etcétera. En total junto con la media general µ, hay 2 I tipos de parámetros.
El análisis de varianza para diseños factoriales completos se hace para probar las hipótesis de
que los efectos principales o los de interacción son igual a cero. A continuación se presentará
el análisis de varianza para un caso con dos factores: el factor A con a niveles y el factor B
con b niveles. El método se puede generalizar a cualquier otra cantidad de factores.
La estructura del experimento es tal que se prueban todas las a x b combinaciones. Cada
combinación de tratamientos se repite n veces. El modelo estadístico lineal es:
B
En donde µ es la media general; τ Ai es el efecto principal del factor A; τ j es el efecto
AB
principal del factor B; τ ij es el efecto de interacción de primer orden entre los factores A y
B; y εijk es el error aleatorio k-ésima réplica. Se supone que los εijk son variables aleatorias
independientes para las que E[εijk ] = 0 y V[εijk ] = σ2 para toda i, j y k.
Sean a y b el número de niveles del factor A y B respectivamente, n el número de réplicas en
cada tratamiento (combinación de niveles) y y ijk la respuesta observada cuando el factor A se
encuentra en el i-ésimo nivel, el factor B en el j-ésimo nivel y en la k-ésima réplica. En
general, los datos para un diseño bifactorial se organizan como en la tabla 4.10.
FACTOR B
FACTOR A
1 2 ... b
1 y111, y112, ..., y11n y121,y122,..., y12n ... y1b1,y1b2 ,..., y1bn
2 y211, y212, ..., y21n y221,y222, ..., y22n ... y2b1,y2b2 ,..., y2bn
. . . . .
. . . .
.
a ya11, ya12, ..., ya1n ya21, ya22, ..., ya2n ... yab1,yab2, ..., yabn
n
1 n
y ij = ∑ y ijk →yij = ∑y
k =1 n k =1 ijk
b
1 b
y i• = ∑ yij → y i• = ∑ y ij i = 1,..., a
j=1 b j =1
a
1 a
y • j = ∑ y ij → y • j = ∑y j = 1,..., b
i =1 a i =1 ij
a b
1 a b
Y = ∑∑ y ij → Y = ∑∑ yij
i =1 j =1 ab i=1 j =1
4-61
Y:
a b n
SCTotal = ∑∑∑ ( y ijk − Y ) 2
i=1 j =1 k =1
Es decir,
SCTratamientos = SCInteraccines + SCA + SCB
En la tabla 4.11, se presenta el análisis de varianza para el modelo bifactoria l general.
a b n nY 2
SCTotal = ∑ ∑ ∑ y 2ijk -
i=1 j=1 k=1 ab
a
ny 2 2 ny 2• j nY 2
b
SC A = ∑ i•. - nY SC B = ∑ -
i=1 b ab j=1 a ab
Esta suma de cuadrados contiene a la suma de cuadrados de los factores A y B. Por lo tanto,
la segunda etapa consiste en calcular SCInteracciones mediante (MONTGOMERY, 1991, cap. 7):
En un diseño factorial de dos factores fijos, tanto los factores (o tratamientos) de renglón
como los de columna tienen la misma importancia. Específicamente el interés consiste en
probar hipótesis acerca de la igualdad de los efectos de renglón, columna y de los de
interacción, es decir:
Para el factor A:
H o : τiA = 0
H 1 : τ Aj ≠ 0 al menos para un i
Para el factor B:
4-63
H o : τBj = 0
H 1 : τBj ≠ 0 al menos para un j
H o : τijA B = 0
H 1 : τijA B ≠ 0 al menos para un par ij
Cada suma de cuadrados divididos entre sus grados de libertad produce una media de
cuadrados. Los valores esperados de las medias de cuadrados son (MONTGOMERY, 1991,
cap. 7):
a
bn ∑( τ A
i )2
SC A
E(CM A ) = E( ) = σ2 + i =1
a- 1 a-1
b
an ∑ ( τBJ ) 2
SC B j =1
E(CM B ) = E( ) = σ2 +
b-1 b-1
a b
SC A B
n ∑ ∑( τ AB
ij )2
E(CM A B ) = E( ) = σ2 + i = 1 j = 1
(a - 1)(b - 1) (a - 1)(b - 1)
SC Error
E(CM Error ) = E( ) = σ2
ab (n − 1)
Si las hipótesis nulas son verdaderas, entonces los cuadrados medios para los factores de
de cuadrados del error (CMA /CMError , CMB/CMError y CMAB/CMError ) tienen una distribución
F con a - 1, b - 1 y (a - 1)(b - 1) grados de libertad en el numerador, y ab(n - 1) grados de
libertad en el denominador respectivamente (MONTGOMERY, 1991, cap. 7).
De esta forma la hipótesis nula para el factor A se rechaza si (MONTGOMERY, 1991, cap. 7):
FB = CMB/CMError> F α,b-1,ab(n-1)
Los parámetros en el modelo del diseño bifactorial, pueden estimarse por el método de los
mínimos cuadrados, imponiendo las restricciones(MONTGOMERY, 1991, cap. 7):
a b a b
∑ˆτiA = 0 ∑ˆτ Bj = 0
j =1
∑ˆτijA B = 0 j = 1,2 ,..., b ∑ˆτ
j =1
AB
ij = 0 i = 1,2 ,..., a
i =1 i =1
µ
ˆ =Y
τˆiA = y i. − Y
τˆ Bj = y. j − Y
τˆijAB = y ij − y i. − y. j + Y
Usando las ecuaciones anteriores puede determinarse el valor ajustado de y ijk mediante:
ŷ ijk = y ij
Considérese ahora la situación en la que los niveles de los factores A y B se eligen al azar de
poblaciones más grandes, este caso es relativo al modelo de efectos aleatorios o de
componentes de varianza. Las inferencias pueden generalizarse a todos los niveles de las
poblaciones bajo estudio, porque los a niveles de A y los b niveles de B se eligieron al azar.
Las observaciones se pueden representar mediante el modelo lineal, de la ecuación 4.25, sin
A B AB
embargo, se hace la suposición adicional de que τ i , τ j , τij son variables aleatoria s
V ( y ijk ) = σ 2A + σB2 + σ 2A B + σ 2
Las hipótesis que deben probarse para el caso de dos factores aleatorios son:
H 0 : σ 2A = 0, H 0 : σ 2B = 0, H 0 : σ 2A B = 0
El análisis de varianza básico permanece sin cambios, en otras palabras, SCA , SCB, SCAB, y
SCError se calculan como en el modelo de efectos fijos. Sin embargo, para determinar las
estadísticas con objeto de probar las hipótesis, deben examinarse antes los valores esperados
de las medias de cuadrados (MONTGOMERY, 1991, cap. 7):
E (CM A ) = σ2 + nσ 2A B + bnσ 2A
E (CM B ) = σ2 + nσ 2A B + anσB2
E (CM A B ) = σ 2 + nσ 2A B
E (CM Error ) = σ 2
A partir de estos valores esperados, puede apreciarse que la estadística apropiada para
CM A B
probar la hipótesis Ho: σ 2A B = 0 es F A B = , porque si la hipótesis nula es verdadera,
CM Error
4-66
tanto el numerador como el denominador de FAB tienen un valor esperado igual a σ 2 , y solo
si Ho es falsa E (CM A B ) será mayor que E (CM Error ) . La razón FAB tiene una distribución Fα,(a-
CM A
FA =
CM A B
que tiene una distribución Fα,a-1,(a-1)(b-1).
En forma similar para probar Ho: σ 2B = 0, la estadística debe ser:
CM B
FB =
CM A B
Y tiene una distribución Fα,a-1,(a-1)(b-1).
Con igual número de observaciones para cada combinación de tratamiento, se puede usar el
análisis de varianza estudiado en la sección 4.5.1.2 para estimar los componentes de
varianza. Esta estimación se hace igualando los cuadrados medios observados con los
cuadrados medios esperados correspondientes y se despejan los valores desconocidos de los
componentes. Las estimaciones de los cuatro componentes de varianza son (MONTGOMERY,
1991, cap. 7):
Error: σ 2 = CMError
CM A B − CM Error
Interacció n : σ 2A B =
n
CM A − CM A B
Factor A : σ 2A =
bn
CM B − CM A B
Factor B : σ2B =
an
Muchos experimentos se diseñan para estudiar los efectos de un factor sobre la media de la
población y los efectos de otro sobre la varianza de la misma, estos experimentos tienen una
mezcla de factores fijos y aleatorios. Los modelos para arreglos factoriales que incluyen
4-67
factores fijos y aleatorios se llaman modelos mixtos, pues contienen una mezcla de ambos
tipos de efectos (KUEHL, 2001, cap. 7).
El modelo y análisis para los efectos mixtos se compone de dos partes porque hay dos tipos
de inferencias. Las inferencias para los factores de efectos aleatorios se aplican a la variación
en una población de efectos, mientras que las inferencias para los factores de efectos fijos
están restringidas a los niveles específicos usados en el experimento (KUEHL, 2001, cap. 7).
El modelo lineal para este experimento es el mismo que el presentado en la ecuación 4.25,
suponiendo en este caso que las variables aleatorias independientes y normalmente
distribuidas con varianza constante, son además de ε ij , los efectos de uno de los factores
B AB
principales, por ejemplo τ j , y el de la interacción τ ij (o bien en el caso más general, el de
E (CM A B ) = σ 2 + nσ 2A B
E (CM Error ) = σ 2
CM A
FA =
CM A B
correspondiente es:
CM A B
FAB =
CM Error
CM B
FB =
CM A B
4-68
La estimación de los efectos del factor fijo (para el caso A), del modelo, viene dada por
(KUEHL, 2001, cap. 7):
ˆµ = y
ˆτ i = y i . − y para i = 1,..., a
A
Y las estimaciones para los componentes de varianza del factor aleatorio B y la interacción
vienen dadas por (KUEHL, 2001, cap. 7):
CM A B − CM Error
Interacció n : σ 2A B =
n
CM B − CM A B
Factor B : σB2 =
an
σ 2 puede ser estimado a través de experiencias anteriores con diseños similares, una prueba
piloto o estimaciones propuestas.
Φ 2 se puede estimar eligiendo valores de las medias de tratamie ntos para las cuales se debe
rechazar Ho, con una probabilidad alta. Otra forma es elegir un tamaño de muestra, de tal
manera que la hipótesis nula se rechace si la diferencia entre cualquier par de medias de
tratamientos excede un valor específico o si la diferencia entre dos medias es por lo menos D.
Si este es el caso el valor mínimo de Φ 2 viene dado por (MONTGOMERY, 1991, cap. 7):
n′ D2
Φ = 2
2 σ 2 (ν + 1)
4-69
para considerar que dos medias son diferentes;σ 2 es la varianza y ν son los grados de
libertad.
Así se tiene que si la diferencia entre dos medias de renglón es D, el valor mínimo de Φ 2 será
(MONTGOMERY, 1991, cap. 7):
2
nbD
Φ =
2
2b σ2
Mientras que si la diferencia entre dos medias de columna es D el valor mínimo de Φ 2 será
(MONTGOMERY, 1991, cap. 7):
2
naD
Φ =
2
2b σ2
2
nD
Φ =
2
2 σ [(a - 1)(b - 1) + 1]
2
a σ2
b
∑( τ
2
an B
j )
B j=1
b-1 ab(n-1)
b σ2
a b
n ∑ ∑ ( τijA B ) 2
AB i =1 j =1
(a-1)(b-1) ab(n-1)
σ [(a - 1)(b - 1) + 1]
2
4-70
Para los modelos de efectos aleatorios y mixtos deben usarse las curvas de operación
característica del anexo D4. El parámetro λ así como los grados de libertad del numerador y
denominador para ambos modelos se muestran en las tablas 4.13 y 4.14 respectivamente.
a-1 (a-1)(b-1)
bn σ2A
1+ 2
A σ + n σ2A B
b-1 (a-1)(b-1)
an σB2
B
1+
σ 2 + n σ2A B
(a-1)(b-1) ab(n-1)
AB nσ 2
1+ AB
σ 2
a
bn ∑ ( τ Ai ) 2
A a-1 (a-1)(b-1)
Φ2 = i =1
(fijo) a ( σ2 + σ A B )
2
an σB2
1+
B σ2 b-1 (a-1)(b-1)
(aleatorio)
En las figuras 4.5 y 4.6, se ilustra de manera gráfica la ausencia o presencia de interacción
para un arreglo con dos factores, A y B, cada uno con dos niveles; en la figura 4.5 se
muestra la medición gráfica de un solo efecto de cada uno de los factores. La respuesta
causada por A se grafica por separado para cada nivel de B, pero cuando no hay interacción
las líneas son paralelas, mostrando que existe una respuesta idéntica al factor A en ambos
niveles de B. En este caso, los factores son independientes y los efectos principales pueden
usarse para interpretar por separado los efectos de ambos factores.
En la figura 4.6, se muestra la presencia de la interacción, entre los dos factores, aquí las
líneas de respuesta no son paralelas. La diferencia en la magnitud (figura 4.6 a) o en la
dirección (figura 4.6 b) de las respuestas representan la interacción entre los factores, estos
no actúan de forma independiente y las interpretaciones deben basarse en los contrastes
para cada combinación de los dos factores (KUEHL, 2001, cap. 6).
Los resultados del diseño factorial de dos factores pueden extenderse al caso general en el
que existen a niveles del factor A, b niveles del factor B, c niveles del factor C, y así
sucesivamente, arregla dos en un diseño factorial. En general habrá un total de (abc...n)
observaciones; si hay n réplicas por cada tratamiento. Hay que notar que deben recopilarse
al menos dos réplicas para poder determinar la suma de cuadrados del error si todas las
posibles interacciones en el modelo están incluidas (MONTGOMERY, 1991, cap. 7).
En el caso de que todos los factores del experimento sean de efectos fijos, fácilmente pueden
formularse hipótesis acerca de los efectos principales y de las interacciones. Los estadísticos
que prueban cada efecto principal y cada interacción se pueden construir dividiendo la media
de cuadrados del efecto de las interacciones correspondientes entre las medias de cuadrados
del error. Todas las pruebas F corresponden a pruebas unilaterales del extremo superior. Los
grados de libertad de cualquier efecto principal son iguales al número de niveles del factor
menos uno; y los grados de libertad de una interacción son el producto de los grados de
libertad asociados con los componentes individuales de la interacción (MONTGOMERY, 1991,
cap. 7).
En los estudios de investigación surgen situaciones en las que solo se dispone de una
observación por celda del arreglo factorial. La varianza del error experimental no puede
estimarse con una sola réplica de las combinaciones de los tratamientos, porque las
particiones de las sumas de cuadrados para los efectos principales e interacción del factor
son iguales a la suma de cuadrados total para las observaciones. Lo anterior implica que no
se puedan efectuar contrastes de hipótesis sobre los efectos en estudio. Una forma de
solventar esta situación es usando la asunción de la aditividad la cual describe que no hay
interacción entre los factores. Bajo la aditividad de factores se puede usar la partición de los
cuadrados medios de la interacción como una estimación del error experimental. Como la
aditividad de los efectos principales o de la ausencia de interacción no esta garantizada, son
necesarios algunos medios para evaluar la presencia de interacción (KUEHL, 2001, cap 6).
Aun cuando existan algunos métodos para evaluar la presencia de interacciones que en
general, serán función de que los factores que se combinan sean cualitativos y/o
cuantitativos, lo más recomendable es prever desde el principio de la investigación los
recursos disponibles y en función de ellos pensar en el uso de diseños experimentales
alternativos, que aun con el uso de una sola réplica, permiten métodos de análisis más
versátiles para el estudio de los efectos de los factores principales y de interacción, como por
ejemplo pueden mencionarse los diseños 2 k (ver sección 4.6).
Muchas veces puede darse el caso de datos faltantes en los estudios de investigación,
situación que puede ocurrir por ejemplo, por la perdida imprevista de datos y la escasez de
recursos para hacer repeticiones, o bien, porque el investigador crea a propósito diseños
desbalanceados dado que algunas combinaciones por celda son más caras o difíciles de
ensayar. Por otro lado, algunas combinaciones de tratamientos pueden ser de mayor interés
para el experimentador porque representan condiciones nuevas o inesperadas
(MONTGOMERY, 1991, cap. 7).
En general, sea cual sea la causa de datos faltantes, cuando se tienen diseños
“desbalanceados” se pierde la propiedad de ortogonalidad de los efectos principales y de
interacción, lo que implica que para estos diseños no puedan aplicarse las técnicas usuales de
análisis de varianza.
4-74
i. Métodos aproximados: que son útiles cuando los datos no están muy desbalanceados
para convertir este problema en uno balanceado. Para la aplicación de estos métodos
aproximados se supone que cada celda tiene al menos una observación. Entre estos
métodos están: el método de la estimación de datos faltantes, el método de la
eliminación de datos y el método de los promedios no ponderados (una descripción
detallada de estos métodos la presenta MONTGOMERY, 1991, sección 7.7.2).
ii. Métodos exactos: En casos en los que los análisis aproximados se vuelven
inapropiados, debido a que los datos están bien desbalanceados (como por ejemplo,
presencia de celdas vacías o con números de réplicas bien diferentes), deben usarse
análisis exactos que se basan en el desarrollo de métodos de partición del análisis de
varianza, cuyo enfoque es representar el análisis de varianza mediante el ajuste de
modelos de regresión. Como es lógico existen diferentes formas de hacer esto, y
puede ser que cada método produzca resultados diferentes, sin embargo, las rutinas
estadísticas generales, programadas para aceptar la teoría estadística conocida, han
eliminado en parte, las diferencias asociadas con el análisis de conjuntos incompletos
de datos. Una descripción detallada de la aplicación de un método exacto para el
análisis de diseños desbalanceados se presenta en KUEHL, 2001, sección 6.9).
El diseño 2K es particularmente útil en las primeras etapas del trabajo experimental, cuando
es probable que haya muchos factores por investigar. La difusión industrial de los diseños 2k ,
se fundamenta en tres motivos (PRAT et al., 2000, cap. 7):
En estos diseños el plan experimental tiene por objeto el estudio del efecto sobre una
respuesta, de k factores, cada uno a dos niveles. El modelo estadístico del diseño 2k incluye
el cálculo de 2k -1 efectos que se distribuyen como: k efectos principales, k(k-1)/2
interacciones de dos factores, k(k-1)(k-2)/3! interacciones de tres factores,…, y una
interacción de k factores (JURAN y GRYNA, 1997, cap. 26). Los diseños 2k, aun cuando
constituyen una variante de los diseños factoriales, se estudian por separado debido a que
pueden aplicarse técnicas de análisis diferentes al análisis de varianza.
Los diseños en los que cada factor varía a dos niveles sólo permiten estudiar relaciones
lineales entre la respuesta y los diferentes factores, lo que puede considerarse como un grave
inconveniente si este hecho no se compensa con la elección de niveles lo suficientemente
cercanos, de tal manera que una línea recta sea una buena aproximación a la verdadera
forma de la respuesta en la región de interés.
En general, las fases para un trabajo experimental que involucre un diseño factorial 2k , son
las mismas que para cualquier otro tipo de diseño, estas son: a) fase de diseño, b) fase de
recolección, c) fase de estimación de efectos, d) fase de significación de efectos, y e) fase de
evaluación o validación del modelo. En las secciones de la 4.6.1 a la 4.6.2, se presenta la
descripción de la aplicación de cada una de estas fases.
En el diseño 2k, los valores correspondientes a los dos niveles se codifican asignando al nivel
bajo el valor de -1 (o simplemente -) y al alto +1 (o simplemente +). Si el factor es
cualitativo, a un nivel se le asigna -1 y al otro +1 arbitrariamente. El arreglo de experimentos
en un diseño con k factores, se puede generar fácilmente. En general, el número total de
experimentos cuando se tienen k factores es igual a 2k si no hay replicaciones. En problemas
que tengan hasta cinco factores, la estructuración de todas las combinaciones posibles se
puede elaborar empleando la tabla 4.15 como referencia. Una forma de recordar estos
arreglos es observando que la primera columna alterna signos – y +, la segunda alterna
pares de signos – y +, la tercera alterna cuartetas, etc. Obsérvese que el tamaño de los
grupos de signos es una potencia de 2. Esto es, el tamaño en la primera columna equivale a
20, en la segunda 21, en la siguiente 22, y así sucesivamente hasta 2 k grupos de signos. Cada
fila de signos representa el conjunto de condiciones a que estará sujeto dicho experimento.
Conviene señalar que en cada experimento se pueden medir diversas variables dependientes,
4-76
El orden en que se presentaron los experimentos en la tabla 4.15 se conoce como orden
estándar u orden de Yates. Este representa una forma conveniente de mostrar los resultados,
pero a pesar de ello no es recomendable que los experimentos se ejecuten en ese orden, ya
que se pueden producir sesgos. El orden de la experimentación debe ser totalmente
4-77
Cuando se sabe que el sistema objeto de experimentación es muy variable, se hacen varios
experimentos bajo cada condición experimental. A estas repeticiones se les denomina
réplicas. Como se verá en la sección 4.6.4, al analizar los resultados se considera la media de
estas réplicas como la única respuesta, y se procede a calcular los efectos como si sólo se
hubiese experimentado una vez bajo cada condición y el resultado hubiese sido precisamente
esa media. Conviene destacar que una réplica implica la realización de todo el experimento
(bajo la condición señalada) y no recoger dos medidas de la misma respuesta, ambas
consecuencias del mismo experimento. Las réplicas así consideradas tienen la ventaja de que
permiten medir la variabilidad del sistema con el que se está experimentando y esta
variabilidad puede ser utilizada para determinar la significación de los efectos de los factores.
Tal como se verá en la sección 4.6.5 (PRAT et al., 2000, cap. 7).
Existen dos formas rápidas y sencillas de calcular los efectos principales y de interacción en
un diseño 2k :
a. Algoritmo de los signos: Este algoritmo calcula los efectos a partir de los signos
utilizados para definir los niveles en la matriz de diseño, añadiendo las columnas de
signos generadas para las interacciones (ver sección 4.6.1). Se añade además una
columna con +1, que servirá para calcular la media. Cada efecto estimado es un
estadístico de la forma y + − y − , es decir esta expresado por la diferencia entre dos
Una vez calculados los efectos, la primera tarea, mediante la técnica estadística más
adecuada, será distinguir cuáles de ellos son significativamente diferentes de cero4 y cuáles
no lo son. Hay dos situaciones de partida distintas al abordar este problema: cuando se ha
replicado el experimento, y cuando cada experimento elemental se ha llevado a cabo una
sola vez (por razones obvias de economía experimental, la segunda situación es la más
habitual).
Existen varias formas estadísticamente válidas para evaluar la significación de los efectos en
un diseño 2k, entre ellas están:
Para poder determinar la significación de los efectos por la prueba de t-Student, es necesario
disponer de una medida de la variación que el error experimental ha inducido en la
estimación de los mismos. El cálculo de dicha medida de variabilidad depende si el diseño es
replicado o no.
Si el diseño es replicado y no se tiene igual número de réplicas en las distintas combinaciones
de tratamientos, la varianza del error puede calcularse a partir de (PRAT et al., 2000, cap. 7):
( n 1 − 1) s 12 + ( n 2 − 1) s 22 + ..... + ( n c − 1) s c2
s =
r
2
n1 + n 2 + .... + n c − C
4
Que la estimación de un efecto, hallada a través del experimento, sea distinta de cero no implica
que el verdadero valor del mismo lo sea. Es decir, no implica que afecte en forma detectable a la
respuesta y que, por tanto, corresponda a un término que deba ser incluido en el modelo.
4-81
e
N ∑ ( efecto de interaccio nes de orden tres o mayor) 2
i =1
Para obtener la estimación de la varianza del error experimental, debe dividirse la suma de
cuadrados de la ecuación anterior entre e, siendo e el número de los efectos de interacción
que contribuyen al total. En un factorial 2k , el número de interacciones de orden tres o mayor
serán 2k – (k2 + k + 2)/2.
Finalmente, si no se dispone de réplicas de las distintas combinaciones, pero el diseño es
aumentado con puntos centrales (ver sección 4.6.9), la varianza del error experimental puede
estimarse como la varianza de las “q” repeticiones de los puntos centrales. Los grados de
libertad en este caso son nq – 1, en donde nq es el número de repeticiones de los puntos
centrales.
A continuación se describe el procedimiento general para la prueba t-Student de significación
de los efectos (JURAN y GRYNA, 1997, cap. 26):
En los diseños 2k replicados la prueba de significación de los efectos puede realizarse también
a partir de análisis de varianza, lo que implica estimar y calcular las sumas de cuadrados para
cada uno de ellos. En general, las sumas de cuadrados de los efectos vendrán dadas, por
(JURAN y GRYNA, 1997, cap. 26):
1 N
SCEfecto = ( y+ − y− ) 2 = ( y+ − y− ) 2
N 4
En donde N es el número total de observaciones que para un diseño con n réplicas viene
dado por n x 2k.
En la tabla 4.16, se presenta el análisis de varianza para el diseño 2k. Obsérvese que la suma
de cuadrados medios se excluye de ésta tabla ya que la suma de cuadrados de los efectos
principales y de interacción son iguales, a excepción del cuadrado medio del error CMError =
SCError / (2 k(n-1)) (MONTGOMERY, 1991, cap. 9).
Las razones SCA/CMError , SCB/CMError ,…., etc., tienen una distribución F con un grado
de libertad en el numerador y 2k(n - 1) grados de libertad en el denominador. Las regiones
críticas corresponden al extremo superior de la distribución F. En otras palabras, la hipótesis
4-83
nula para un nivel de significación α se rechaza cuando Ffactor > Fα, (1, 2k (n-1)); donde Ffactor es
el F calculado para cada factor (MONTGOMERY, 1991, cap. 9).
Si se tiene una sola réplica el análisis de varianza puede realizarse tomando como estimación
de la varianza del error la presentada para la prueba t de una sola réplica de la sección
4.6.5.1.
Suma de
Fuente de variación Grados de libertad
Cuadrados
K efectos principales
A SCA 1
B SCB 1
. . .
. . .
K SCK 1
k
2 Interacción de 2 Factores
AB SCAB 1
AC SCAC 1
. . .
. . .
JK SCJK 1
k
3 Interacción de 3 Factores
ABC SCABC 1
ABD SCABD 1
. . .
. . .
IJK SCIJK 1
k
k Interacción de k Factores
SCABC...K 1
ABC...K
SCError 2k (n - 1)
Error
SCTotal n2k - 1
Total
Las gráficas en escala probabilístic a normal de los efectos se construyen de la siguiente forma
(LAWSON et. al., 1992, cap. 1):
1. Se ordenan las estimaciones de los efectos en sentido creciente (de menor a mayor).
2. Se crean percentiles pi = (i – 0.5)/(número de efectos) para cada uno de los efectos
ordenados, en donde i indica el orden del efecto.
3. Se calculan los estadísticos de orden z asociados a cada pi,(z-score), obtenidos de la
tabla del anexo A1. Si se desea puede utilizarse la aproximación:
[
z = 5.05 p i0 .135 − ( 1 − p i ) 0 .135 ]
4. Representar gráficamente las parejas (efecto, pi x100) o bien (orden de efecto, z-
score).
5. Interpretar. Requiere cierta práctica trazar correctamente las rectas e interpretar los
resultados. Es obvio que la recta debe ajustarse a los puntos centrales y no a los de
los extremos, que son los efectos potencialmente significativos. Un error común es
considerar como significativos efectos que se apartan de la recta por estar demasiado
próximos a cero (esto ocurre con cierta frecuencia, ya que al extraer muestras de
tamaño reducido de una ley normal los extremos tienden a estar sobrepresentados).
Ver figura 4.8.
Una vez que se ha determinado cuales de los efectos son significativos un paso importante es
interpretar físicamente esos resultados. Una forma de interpretarlos es observando si los
efectos producen un aumento o decremento en la respuesta. Un recurso bastante útil
consiste en elaborar gráficos de los niveles de los efectos con respecto a las respuestas
obtenidas tanto para los efectos principales, como para los de interacción (ver figura 4.6). Por
supuesto es imprescindible hacer estas interpretaciones a la luz de los conocimientos previos
que sobre el problema se pudiesen tener.
Por otra parte, si lo que se quiere lograr con la experimentación es construir un modelo, la
interpretación de los resultados puede venir enfocada sobre la búsqueda de una función que
represente aproximadamente la relación entre la respuesta y los factores, que resulte útil en
la zona experimental (es importante recalcar que no es conveniente extrapolar variables más
allá de los niveles que se han experimentado).
Mediante diseños 2k se pueden estimar los coeficientes de modelos polinómicos sin términos
cuadráticos. El modelo a estimar es del tipo:
4-87
∑β ∑∑β
k 2
ŷ = β o + ii xi + ij xix j +... + (hasta 2 – (k + k + 2)/2 interacciones de orden
i =1 i j
tres o mayor)
donde:
En el modelo sólo deben incluirse los términos correspondientes a aquellos factores que
resultaron significativos. La superficie creada en función de los factores codificados permite
interpretar los efectos de los factores. La decodificación de las variables puede lograrse a
partir de:
nivel sup. + nivel inf.
Xo −
Xc = 2
nivel sup. + nivel inf.
2
Donde el subíndice C indica unidades codificadas y el O originales. Las ecuaciones con las
variables en las unidades originales deben ser tratadas con cautela, ya que su interpretación
es más compleja. Son útiles para predecir, pero no para interpretar los efectos de los factores
(PRAT et al., 2000, cap. 7).
Es fácil calcular los residuos de un diseño 2k por medio del modelo de regresión creado. En
general los residuos vienen dados por:
4-88
ε = y − ŷ
En donde ŷ es el valor previsto para cada condición experimental. Los residuos calculados
permiten comprobar si se cumplen las hipótesis del modelo, que son independencia,
normalidad y varianza constante, y que pueden ser comprobadas mediante las técnicas
gráficas para el análisis de residuos presentadas en la sección 4.2.4.
Como se vio en la sección 4.6.3, las repeticiones son necesarias para lograr la precisión
deseada cuando el sistema es muy variable. Si δ identifica la magnitud máxima de la
diferencia práctica5 entre las medias muestrales que se está dispuesto a aceptar, y σ es la
desviación estándar, el número de experimentos necesarios para lograr una precisión
deseada es (LAWSON et al., 1992, cap. 2):
2
8σ
N =
δ
Por ejemplo, si se requiere un 24 y en función de la precisión el N = 32, el experimento debe
replicarse. Si N no es un número entero el valor debe aproximarse al múltiplo más cercano a
2k (r2k). Lo anterior garantizará que el error máximo sea menor al 10% y permitirá probar
con un 95% de confianza, la significación de los efectos (LAWSON et al., 1992, cap. 2).
A medida que δ disminuye (mayor precisión) el número de experimentos necesarios (N), será
mayor. A menudo no es necesario que δ sea mucho menor que σ (a menos que los
experimentos sean baratos). La precisión será la misma independientemente del tamaño del
factorial. La precisión depende del número de combinaciones totales ejecutadas y no del
número de factores (LAWSON et al., 1992, cap. 2).
Al iniciar un programa experimental es recomendable empezar determinando N, ya que es
útil para determinar el costo del programa experimental, con la precisión deseada. En la
práctica es útil definir a δ = 8σ/ n , ya que así se indica la precisión que es posible comprar
con N datos (presupuesto disponible para el estudio). Si δ no es adecuado se debe proponer
5
La diferencia práctica puede tener una significación estadística o empírica , se dice que es estadísticamente
significativa si su valor es muy grande con respecto a la media de cuadrados del error. Por otra parte, es
empíricamente significativa cuando esta diferencia es lo suficientemente grande como para producir
beneficios económicos o en la operación del proceso a largo plazo. Se pueden tener estudios en los que se
encontrará significación estadística pero no práctica o viceversa.
4-89
Los puntos centrales son respuestas obtenidas cuando todos los factores experimentales se
encuentran a un nivel intermedio a los niveles inferior (-) y superior (+) del diseño 2k . La
repetición del experimento en los puntos centrales es importante en los factoriales a dos
niveles, debido a dos razones (LAWSON et al., 1992, cap. 2):
a. Proporcionan un estimador del error, con base en el cual se pueden medir los efectos:
La repetición de puntos centrales permite determinar un estimador “puro” del error ya
que son puntos repetidos.
b. Producen una prueba para el modelo: Un factorial se basa en que los cambios en la
variable dependiente, se pueden estimar bien con un modelo lineal. La validez de
dicha hipótesis no se puede verificar ya que sólo se tienen dos niveles para cada
factor. En el caso de existir efectos no lineales (curvatura), las predicciones no son
buenas excepto en los puntos cercanos a los puntos factoriales. El uso de puntos
centrales permite determinar la no linealidad analizando la magnitud de la diferencia
entre los promedios del punto central y los puntos factoriales (LAWSON et al., 1992,
cap. 2):
Efecto de curvatura = C = y factorial − y puntoscentrales
centrales.
El análisis de significación del efecto de curvatura puede lograrse mediante la prueba
t para el estadístico (LAWSON et al., 1992, cap. 2):
C 1 1
tc = en donde S c viene dado por Sc = s +
Sc N f n p.c
4-90
Analista Muestra
1 9 1 11
2 3 10 12
3 4 6 8
4 5 2 7
y ij = µ + τi + εij
2. Contraste de hipótesis:
Ho: µ1 = µ2 = µ3 = µ4
H1: µi ≠ µj (en al menos un par)
3. Criterio de decisión:
SC Tratamientos ( k − 1) MC Tratamientos
Fo = =
SC Error ( N − k ) MC Error
5. Cálculos:
TABLA E4.1.1
Porcentaje de alcohol
Analista Total Promedio
metílico
1 84.99 84.38 84.02 253.39 84.46
2 85.15 84.88 85.13 255.16 85.05
3 84.72 85.15 84.48 254.36 84.79
4 84.20 84.55 84.10 252.85 84.28
Total 1015.76 84.65
k
y i2 Y 2 ( 253.39 ) + ( 255.16 ) 2 + ( 254.36 ) 2 + ( 252.85 ) 2 ( 1015.76 ) 2
∑
2
SC Tratamientos = − = −
i =1
ni N 3 N
4 3
Y2
SCTotal = ∑∑ y ij2 − = 85982.62 − 85980.7 = 1.92
i =1 j =1 N
SCError = 1.92 – 1.05 = 0.87
TABLA E4.1.2
Fuente de Suma de Grados de Media de Fo
variación cuadrados libertad cuadrados
Entre tratamientos 1.05 3 0.35 3.21
Dentro
0.87 8 0.109
tratamientos
Total 1.92 11
Conclusión:
No existe evidencia significativa al 5% como para asegurar que los analistas del
laboratorio trabajan diferente.
4-93
ε ij = y ij − ŷ ij = y ij − y i
Analista 1 2 3 4 Media
µ i = y i = ŷ ij 84.4633 85.0533 84.7867 84.2833 84.6467
Analista 1 1 1 2 2 2
y ij 84.99 84.02 84.38 85.15 85.13 84.88
ε ij = y ij − ŷ ij 0.5267 -0.4433 -0.0833 0.0967 0.0767 -0.1733
Analista 3 3 3 4 4 4
y ij 84.72 84.48 85.16 84.2 84.1 84.55
ε ij = y ij − ŷ ij -0.0667 -0.3067 0.3733 -0.0833 -0.1833 0.2667
• Prueba de normalidad de los residuos: según el gráfico E4.1.1, para esta prueba
la variabilidad de los residuos puede considerarse normal, por lo que se cumplen
hipótesis, que justifican el análisis de la varianza.
GRAFICO E4.1.1
99.9
99
95
Porcentaje
80
50
20
5
1
0.1
-0.45 -0.25 -0.05 0.15 0.35 0.55
Residuos
Por otra parte, puede considerarse a través de una prueba de hipótesis que la
media de los residuos no es significativamente diferente de cero a un nivel de
significación del 5%.
4-94
GRAFICO E4.1.2
0.6
0.4
0.2
RESIDUOS εij
0
-0.2
-0.4
-0.6
84 84.2 84.4 84.6 84.8 85 85.2
Predichos yij
VALORES PREDICHOS ŷ ij
• Según la prueba de Barlett, puede considerarse que la varianza para cada analista
es la misma.
Prueba de Barlett:
Las hipótesis a probar son:
q
La estadística de prueba (ver sección 4.2.4b) es: χ 2o = 2.3026
c
donde:
k
q = (N − k ) log 10 S P 2 − ∑ (ni − 1) log 10 S i 2
i =1
1 k
c =1+ ∑ (ni − 1)−1 − (N − k )−1
3(k − 1) i =1
k
∑ (n i − 1) S i 2
S2P = i =1
N −k
y S i 2 es la varianza muestral de la i-ésima población.
Analista Varianza
muestral
1 0.240433
2 0.0226333
3 0.118933
4 0.0558333
k ( y ji − yi )2
En donde cada S i viene dada por:
2
S i2 =∑
i =1 ni − 1
Por tanto:
q 1.19811
χ 2o = 2.3026 = 2.3026 = 2.283
c 1.20833
Cálculo del tamaño del número de repeticiones por tratamiento (cálculo del
tamaño de muestra:
Como no existe evidencia significativa al 5% (ni al 10%), como para asegurar que los
analistas del laboratorio trabajan dif erente, vale la pena analizar el número de
repeticiones por tratamiento y la potencia de la prueba, adecuados a esta investigación.
Media
Analista
muestral µ i
1 84.4633
2 85.0533
3 84.7867
4 84.2833
µ)
Media(µ 84.6467
k n
∑∑ ( y ij − µ) 2
i
i=1 j =1
S2 = = 0.1752
N −1
4-96
Utilizando las tablas de potencia del anexo D4 y tomando α = 0.01, se procede a calcular
el número de mediciones más apropiado por analista.
n ν1 = k - 1 ν2 = N - k Φ 2 = 0.5n Φ 1-β
Por lo tanto, para obtener resultados más concluyentes sobre si existe o no diferencia
en el trabajo de los analistas, es recomendable realizar un nuevo experimento en el
que el número de réplicas por tratamiento sea de 11, ya que sólo así se logra
satisfacer el requisito mínimo de potencia de la prueba que es de 0.9, como puede
observarse en la tabla anterior.
SOLUCION:
2. Contraste de hipótesis:
Ho: στ 2 = 0
H1: στ 2 > 0
3. Criterio de decisión:
Debe rechazarse Ho si Fo = CMTratamientos/ CMError > Fα, k-1, N -k
4. Cálculos:
Profundidad
de la muestra Agua recuperada (%) Yi yi
(m)
7 33.3, 33.3, 35.7, 38.1, 31.0, 33.3 204.7 34.12
8 43.6, 45.2, 47.7, 45.4, 43.8, 46.5 272.2 45.37
16 73.2, 68.7, 73.6, 70.9, 72.5, 74.5 433.4 72.23
23 72.5, 70.4, 65.2, 66.7, 77.6, 69.8 422.2 70.37
Totales 1332.5 55.55
SUMA DE CUADRADOS:
k
y i2 Y 2
SCTratamientos = ∑ − = [(204) 2 + (272.2) 2 + (433.4)2 + (422.2) 2]/ 6 -
i =1 ni N
2
[(1332.15) /24]
SCTra tamientos= 6365.7
SCError = SCTotal - SCTratamientos
4 3
Y2
SCTotal = ∑∑ y ij2 −
i =1 j =1 N
SCTotal = (33.3 + .... + 69.8 ) − ((1332) / 24) = 80509.25 − 73981.51 = 6527.74
2 2 2
CONCLUSIÓN
Dado que se ha constatado el efecto del factor aleatorio profundidad (m), se procede
a estimar qué parte de la variabilidad en el contenido de agua intersticial de las
piedras es debida a este factor.
Las estimaciones de los componentes de varianza son:
CMError = σ2 = 8.102
στ 2 = (CMrratamientos – CMError)/n
Los datos para calcular la potencia de la prueba para este análisis son:
σ2τ 352.3
λ = 1+ = 1+ 6 = 16.18
σ 2
8.102
ν1 = k – 1 = 3; ν2 = N – k = 20
Al utilizar las tablas del anexo D4, se obtiene una potencia de la prueba de más del
99%.
Para la prueba de idoneidad del modelo es necesario estimar los parámetros del
modelo lineal para luego determinar los valores predichos (ajustados) y sus
respectivos residuos, como se muestra a continuación:
Las estimaciones de los efectos para las distintas profundidades son:
Dados: µ =y = 55.55 y τi = y i − µ , los valores de los efectos para cada nivel son:
Profundidad Valor
predicho
7 34.12
8 45.37
16 72.23
23 70.37
Profundidad de la ε ij = y ij − ŷ ij
muestra (m)
7 -0.82, -0.82, 1.45, 3.98, -3.12, -0.82
8 -1.77, -0.17, 2.33, 0.03, -1.57, 1.13
16 0.97, -3.53, 1.37, -1.33, 0.27, 2.27
23 2.13, 0.03, -5.17,-3.67, 7.23, -0.57
GRAFICO E4.2.1
99.9
99
95
Proporcion
80
50
20
5
1
0.1
-6 -3 0 3 6 9
Residuos
En función del análisis del gráfico E4.2.2, que describe el comportamiento de los
residuos contra los valores predichos, puede concluirse que la varianza de los residuos
es homogénea, los puntos en el gráfico están dispersos sin sugerir ninguna tendencia.
4-100
GRAFICO E4.2.2
Residuos
0
-4
-8
34 44 54 64 74
Predichos
Laboratorio 1 2 3
muestra A2, B3, C1 A1, B2, C3 A3, B1, C2
Muestra Laboratorio
1 2 3
A 5.10 5.35 5.20
B 5.60 5.65 5.35
C 6.40 6.65 6.45
SOLUCION:
y ij = µ + τi + βJ + εij
4-101
2. Contraste de hipótesis:
Ho: µ1 = µ2 = µ3
H1: µi ≠ µj (en al menos un par)
3. Criterio de decisión:
SCTratamientos (k − 1) CM Tratamientos
Fo = =
SCError ( N − k − b + 1) CM Error
Debe rechazarse Ho si Fo > Fα, k-1, N -k . Si se rechaza Ho, estimar los efectos.
4. Cálculos:
MUESTRA 1 2 3 y bj y bj
A 5.1 5.35 5.20 15.65 5.23
B 5.6 5.65 5.35 16.6 5.53
C 6.4 6.65 6.45 19.5 6.5
yi 17.1 17.65 17.00 51.75
Grados
Fuente de Suma de Media de
de Fo
variación cuadrados cuadrados
libertad
Laboratorio 0.08167 2 0.0408 4.45
Muestra 2.6817 2 1.34 146.27
Error 0.0367 4 0.00917
Total 2.8 8
F0.05, 2, 4 = 6.94
CONCLUSIÓN
No existe evidencia significativa como para afirmar que los laboratorios están
trabajando de forma diferente, con un grado de confianza del 95%.
ε ij = y ij − y ki − y bj + y
MUESTRA 1 2 3
A -0.08 -0.01 0.05
B 0.12 -0.01 -0.1
C -0.05 0.02 0.03
GRAFICO E4.3.1
Grafico de residuos para cantidad de Arsenico
0.12
0.08
0.04
Residuo
-0.04
-0.08
-0.12
5.1 5.5 5.9 6.3 6.7 7.1
Predicho
4-103
GRAFICO E4.3.2
Probabilidad Normal para los residuos
99.9
99
95
Proporcion
80
50
20
5
1
0.1
-0.1 -0.06 -0.02 0.02 0.06 0.1 0.14
Residuos
0 3 7
SOLUCION:
Para dar respuestas a los tres literales; hay que probar las siguientes hipótesis:
Para el factor marca (factor A):
H o : τiA = 0
H 1 : τ Aj ≠ 0 al menos para un i
H o : τBj = 0
H 1 : τBj ≠ 0 al menos para un j
H o : τijA B = 0
H 1 : τijA B ≠ 0 al menos para un par ij
FB = CMB/CMError> F α,b-1,ab(n-1)
a b n
nY 2 4 * ( 431.05) 2
SCTotal = ∑∑∑ y ijk
2
− = (52.6 2 + 54.2 2 + ..... + 45.2 2 + 47.6 2 ) − = 531.08
i=1 j =1 k =1 ab 9
SC Interaccio nes = SC Subtotales − SC M A R C A − SC TIEMPO = 276 .94 − 32 .97 − 226 .68 = 17 .29
Total 531.08 35
TABLA E4.4.3
MARCA 0 3 7
GRAFICO E4.4.1
Probabilidad normal para los residuos
99.9
99
95
Proporcion
80
50
20
5
1
0.1
-6 -4 -2 0 2 4 6
Residuos
De las gráficas E4.4.2 y E4.4.3, se puede observar que los errores no siguen ningún
modelo matemático específico y además la varianza permanece relativamente
constante. Por lo que se puede concluir que el modelo es estadísticamente valido para
aplicar el análisis de varianza.
GRAFICO E4.4.2
4
2
Residuo
-2
-4
-6
0 10 20 30 40
Tiempo
4-108
GRAFICO E4.4.3
2
Residuo
-1
-4
-7
40 44 48 52 56
Predicho
SOLUCION:
2
2 nD
Φ =
2 σ2 [(a - 1)(b - 1) + 1]
2
5
⇒ Φ2 = n
2(0.7)(5)
⇒ Φ2 = 3.57n
Se partirá de una prueba con un α = 0.01 y 1-ß > 0.9. Para el cálculo del tamaño de
la muestra se hace uso de las curvas características, obteniéndose la tabla E4.5.1:
4-109
TABLA E4.5.1
n Φ2 Φ ν1 ν2 1-ß
el tamaño apropiado es de 2 para lograr que 1-ß = 0.9. Por lo que se tomó el máximo
tamaño de muestra para garantizar potencia en la prueba de hipótesis de la
interacción; es decir 4 observaciones por tratamiento.
FACTOR
pH (A)
TEMPERATURA (B)
TIPO DE PAPEL FILTRO (C)
SOLUCION:
Estimación de efectos
En la tabla E4.6.1 se presenta la cuantificación de los efectos de los factores por el
método de Yates (ver sección 2.6.4). El número de columnas a crear son k + 2 = 3 +
2 = 5.
TABLA E4.6.2
Percentil z-score
Efectos Orden(i) p i = ( i − 0 .5 ) / 7 z = 5 . 05 p 0 . 135 − ( 1 − pi ) 0 . 135
i
2
A
1.5 2.295
1 0.11
z-score
0.5 0.06
0 -0.04
-0.08
-0.5
-0.6
-1
-0.715
-1.5
-2
-1 -0.5 0 0.5 1 1.5 2 2.5
efectos ordenados
g(A)
g(AB)
g(B)
g(C)
g(ABC)
g(AC)
g(BC)
Para calcular los residuos ε ij = y ijk − ŷ ijk , primero se calcula el valor estimado
( ŷ ijk ) lo cual se hace por medio de un modelo de regresión ajustado, de la forma:
g ( A) g( B ) g ( AB )
ŷ ijk = y + x1 + x2 + x 1x 2 + ... + (sobre todos los efectos significat ivos)
2 2 2
donde x1 y x 2 son los valores codificados (-1), (+1), nivel bajo y alto de cada factor.
En este ejemplo, el modelo es el siguiente:
g( A)
ŷ ijk = y + x 1 = 5.268 + 1.148x 1
2
El valor predicho para ambos factores a nivel bajo, es por ejemplo:
Experimento y ŷ ε =y − ŷ
ijk ijk ij ijk ijk
(1) 4.05 4.12 -0.07
A 6.92 6.416 0.504
B 4.14 4.12 0.02
AB 5.74 6.416 -0.676
C 4.06 4.12 -0.06
AC 7.21 6.416 0.794
BC 4.23 4.12 0.11
ABC 5.79 6.416 -0.626
4-113
GRAFICO E4.6.3
1
0.8
0.6
residuos
0.4
0.2
0
-0.2 3 3.5 4 4.5 5 5.5 6 6.5 7
-0.4
-0.6
-0.8
valores predichos
GRAFICO E4.6.3
Yates k=3
4-114
REFERENCIAS BIBLIOGRAFICAS
• Box, G.E.P, Hunter, N.G y Hunter, J.S (1989). Estadística para investigadores.
España: Reverté.