Capitulo 4

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 114

4-1

CONTENIDO

Pág.
4.1 Introducción al diseño de experimentos 4-2
4.2 Experimentos unifactoriales completamente al azar 4-8
4.3 Diseños experimentales en bloques completos al azar 4-34
4.4 Diseños cuadrados latinos 4-48
4.5 Diseños factoria les 4-56
k
4.6 Diseños factoriales 2 4-74
4.7 Problemas de diseño de experimentos 4-90
REFERENCIAS BIBLIOGRAFICAS 4-114
ANEXO A4. Tabla de números aleatorios 4-115
ANEXO B4. Tabla para la prueba de Dunett 4-116
ANEXO C4. Tabla para la prueba de Duncan 4-117
ANEXO D4. Curvas características de operación para el
4-118
análisis de varianza
ANEXO E4. Tabla para la prueba de homogeneidad de
4-126
varianzas F-máx
4-2

4.1 INTRODUCCION AL DISEÑO DE EXPERIMENTOS

Es indudable que en el mundo competitivo en el que se mueve actualmente cualquier


organización, uno de los factores claves del éxito es el ritmo en el que la organización es
capaz de aprender. Los químicos analistas que se desarrollan en el ámbito de la metrología
química, no están exentos de esto, y es muy importante que hagan esfuerzos para
aprender y entender mejor los procesos de cuantificación química que ellos practican. Uno
de los recursos que más puede contribuir a cumplir con ese objetivo es la
experimentación. La experimentación no consiste más que en reproducir artificialmente la
aparición de fuerzas “extrañas” en presencia de personas especialmente preparadas para
interpretar y extraer conclusiones de lo que ocurra.
Sin embargo, para que un experimento se realice en la forma más eficiente, es necesario
planificarlo, sistemática y objetivamente, puesto que éste se concibe como un medio para
verificar o rechazar las hipótesis planteadas. La aplicación de la metodología estadística
constituye la única forma objetiva de analizar un problema que involucre datos sujetos a
errores experimentales. Es decir, se requiere de un enfoque estadístico de la planificación
o del diseño de los experimentos para obtener conclusiones significativas a partir de los
datos. El diseño estadístico de experimentos, es por tanto, el proceso de planear un
experimento para obtener datos apropiados, que pueden ser analizados mediante métodos
estadísticos, con el objeto de producir conclusiones válidas y objetivas (MONTGOMERY, 1991,
cap. 1).
Los métodos de diseño experimental, tienen una aplicación importante en las actividades de
diseño y desarrollo del laboratorio mediante la creación de nuevos procesos de medición o la
mejora de los ya existentes. Algunas de las aplicaciones del diseño estadístico de
experimentos en el diseño y desarrollo en metrología química son:

a. Evaluar y comparar las metodologías de medición posibles.


b. Evaluar materiales y procedimientos alternativos.
c. Desarrollar procesos de medición que sean robustos.

La aplicación del diseño estadístico de experimentos en estas áreas puede dar como
resultados una mejora del rendimiento de los procesos de medición, menor variabilidad y
4-3

mayor apego a los requerimientos de los procesos establecidos, y menor tiempo de desarrollo
y en general menores costos globales.
El uso inteligente de las técnicas estadísticas en la experimentación requiere que el
investigador tenga en mente los siguientes puntos (MONTGOMERY, 1991, cap.1):

1. Uso del conocimiento no estadístico del problema.


2. Mantener el diseño y análisis tan simple como sea posible.
3. Reconocer la diferencia entre la significación práctica y la estadística.
4. Reconocer que usualmente los experimentos son iterativos.

Para usar el enfoque estadístico al dis eñar y analizar un experimento se requiere que todos
los participantes tengan una idea clara de que es exactamente lo que se va a estudiar, como
se van a recopilar los datos y, al menos, una idea cualitativa de cómo se van a analizar. A
continuación se presenta una guía del procedimiento recomendado:

1. PLANTEAMIENTO DEL PROBLEMA


En la práctica no es sencillo diseñar un planteamiento claro y aceptable de un problema.
Es necesario desarrollar todas las ideas sobre el objetivo del experimento. A continuación
se dan a conocer las directrices para su planificación (KENETT y ZACKS, 2000, cap. 12):

i) Investigar todas las fuentes disponibles de información.


ii) Clasificar los problemas dados dentro del contexto de un problema conocido
(marco teórico).
iii) Contar con los medios económicos y humanos para alcanzar los objetivos de la
investigación.
iv) Identificar las respuestas que hay que medir, los factores que pueden ser variados,
los que han de permanecer constantes y los que no pueden ser controlados.
v) Identificar los intervalos o las limitaciones de las mediciones y los factores
experimentales.

Las tres herramientas más importantes del aspecto estadístico de la planificación


experimental son: la creación de bloques, la aleatorización y la replicación
(MONTGOMERY, 1991, cap.1).
4-4

2. SELECCION DE FACTORES Y NIVELES


En el momento de planear un experimento es indispensable definir claramente los
diferentes elementos a incluir: Unidades experimentales, factores, niveles, etc.
Los objetos sobre los cuales se hacen las mediciones se denominan unidades
experimentales.
La mayoría de los experimentos implican el estudio del efecto de una o más variables
independientes en una respuesta. Las variables independientes se denominan factores.
Los factores pueden ser cualitativos o cuantitativos.
Al grado de intensidad de un factor se le llama nivel. Cada tratamiento implica una
combinación de uno o más niveles de un factor (o factores). En la selección de los
tratamientos es importante definir claramente cada uno de ellos y entender el papel que
jugarán para alcanzar los objetivos del experimento. La elección del número de niveles así
como su espaciamiento es importante para lograr respuestas apropiadas a las preguntas
planteadas.
Algunos experimentos incluyen un " Testigo " (mezcla inerte) que es utilizado en la
mayoría de los casos como punto de referencia para medir el grado de intensidad de los
demás tratamientos. El testigo debe ser una parte integral del experimento, de tal
manera que los resultados para el testigo sean directamente comparables con los de
otros tratamientos (COCHRAN, 1965, cap. 1).

3. ELECCION DE VARIABLES RESPUESTA


Al seleccionar la respuesta o variable dependiente el experimentador debe estar seguro
que la respuesta que se va a medir realmente provea información útil acerca del proceso
de estudio. Con mayor frecuencia, el promedio o la desviación estándar (o ambos) de la
característica u observación será la variable respuesta. La capacidad de medición también
es un factor importante.

4. ELECCIÓN DEL DISEÑO EXPERIMENTAL Y MODELO ESTADISTICO


Los planes de experimentación deben guardar cierta relación con los objetivos,
necesidades y limitaciones físicas de los experimentos. Asimismo, deben ofrecer ciertas
ventajas en la economía de la experimentación y proporcionar estimaciones directas de
los efectos experimentales y estimaciones válidas de la varianza.
4-5

Algunos de los aspectos que deben considerarse para la elección de un diseño


experimental y modelo estadístico son los siguientes (LAWSON et al., 1992, cap. 2):
Tener metas bien definidas: Es responsabilidad del investigador definir claramente sus
metas antes de proceder con el experimento y escoger el diseño que va a utilizar. Así
mismo, debe indicar que información se obtendrá, así como la magnitud en la diferencia
de medias que debe considerarse (con respecto al error experimental σ).
Evitar la confusión de los efectos: Los efectos de cada factor involucrado en el
experimento no deben estar confundidos con otras variables. Este problema se puede
evitar usando el diseño apropiado.
Procurar resultados insesgados: Los resultados no deben tener ningún sesgo (provocado
de forma consciente o inconsciente). Esto se puede regular revisando cuidadosamente el
lugar en que se planea ejecutar el experimento, así como el procedimiento que se intenta
emplear. Adicionalmente, existen algunas técnicas estadísticas útiles para enfrentar este
tipo de situaciones: a) el uso de bloques para considerar variables latentes, b) la
aleatorización dentro de cada bloque que minimiza la confusión de los factores con las
variables latentes y c) el uso de repeticiones para volver más efectiva la aleatorización.
Estimar la precisión de los resultados: El diseño debe permitir estimar la precisión de los
resultados, de tal forma que pueda determinarse si los efectos de los factores son reales
o producidos por el error aleatorio en los datos. El uso de repeticiones permite estimar la
precisión y su validez es apoyada por el empleo de la aleatorización.
Establecer la precisión del diseño: La precisión del diseño experimental debe ser la
suficiente como para satisfacer los objetivos del mismo.

En general, existen varias formas de clasificar a los diseños de experimentación, por


ejemplo las siguientes (JURAN y GRYNA, 1993, cap. 26):

1. Según el número de factores experimentales a investigar (por ejemplo, planes


unifactoriales y multifactoriales).
2. Según la estructura del plan de experimentación (por ejemplo, planificado por
bloques, factorial, anidado, o por el método de superficie respuesta).
4-6

3. Según la clase de información que se pretende que el experimento proporcione


(por ejemplo, estimación de efectos, estimación de componentes de varianza,
planificación empírica).

En el cuadro 4.1, se presenta una clasificación para los distintos planes de


experimentación.

CUADRO 4.1 RESUMEN DE LA CLASIFICACION DE LOS PLANES DE


EXPERIMENTACION

OBJETIVO BASICO ESTRUCTURADO SOLO CON ESTRUCTURADO CON


FACTORES CONTROLABLES FACTORES CONTROLABLES Y
NO CONTROLABLES
Diseño por bloques al azar
completos e incompletos
ANALISIS DE
UNIFORMIDAD DEL Diseño unifactorial de efectos Diseño cuadrado latino
EFECTO DE UN FACTOR
fijos Diseño cuadrado greco-latino
Diseño cuadrado de Youden
Diseños factoriales pk con
restricciones en la aleatorización
(con bloques)
Diseños factoriales pk
ANALISIS DEL EFECTO DE
DOS O MAS FACTORES Diseños factoriales 2k Diseños factoriales 2k (con
SOBRE UNA RESPUESTA bloques
Diseños mixtos
Diseño en parcelas divididas o
subdivididas
ANALISIS DEL EFECTO DE
MUCHOS FACTORES Diseños factoriales fraccionarios Diseños factoriales fraccionarios
SOBRE UNA RESPUESTA 2k-p 2k-p (con bloques)
(CRIBADO DE Diseño Placket-Burman
VARIABLES)
OBTENCION DE
TRAZADOS EMPIRICOS
(DIAGRAMAS DE
CONTORNO)
ILUSTRATIVOS DE QUE Diseños de superficie respuesta
FACTORES BAJO
CONTROL INFLUYEN
SOBRE LOS RESULTADOS
ESTUDIO DE LA Diseños unifactoriales de efectos
VARIABILIDAD RELATIVA aleatorios
SOBRE UNA MISMA
MUESTRA Y ENTRE Diseños anidados
MUESTRAS
4-7

5. RECOLECCION DE INFORMACION
Al llevar a cabo el experimento se deben tomar en cuenta las siguientes recomendaciones
(COCHRAN, 1965, cap.2):
a) Asegurar uniformidad en la aplicación de los tratamientos.
b) Ejercitar suficiente control sobre las influencias externas, de tal manera que cada
tratamiento produzca su efecto, bajo condiciones deseables.
c) Proyectar medidas convenientes y no sesgadas de los efectos de los tratamientos.
d) Prevenir errores importantes, de los cuales parece que ningún tipo de experimentos
está enteramente libre. La supervisión y comprobación adecuada del trabajo de los
ayudantes y un examen de los datos de cada unidad experimental por parte del
experimentador, permitirá tener un mayor alcance en el descubrimiento y
rectificación de errores.

Es aconsejable que el experimentador realice una prueba piloto para estimar parámetros
importantes para el cálculo del número adecuado de réplicas, así como también para
controlar el error producido por imprevistos en el experimento a escala completa.
La prueba piloto es la ejecución del experimento tomando una pequeña muestra
arbitraria con el fin de poner a prueba los instrumentos de medición, verificar el manejo
de las operaciones de campo y conocer el comportamiento de las unidades
experimentales ante un tratamiento determinado, etc. Los resultados de una prueba
piloto usualmente sugieren algunas modificaciones antes de realizar el experimento en su
totalidad.

6. ANALISIS DE DATOS Y VALIDACION DE LA IDONEIDAD DEL MODELO


Hay dos aspectos en cualquier problema experimental: el diseño del experimento y el
análisis estadístico de los datos. Estos dos temas están estrechamente relacionados, ya
que el método de análisis depende directamente del diseño empleado (MONTGOMERY,
1991, cap.1).
El primer paso en el análisis del experimento consiste en determinar la ecuación para
cada observación, con los componentes siguientes (COCHRAN, 1965, cap. 3):
i) Un promedio general alrededor del cual fluctúan las observaciones.
ii) Los componentes que representan el efecto de los tratamientos, bloques y sus
interacciones.
4-8

iii) Un componente residual que representa a las fuentes que influyeron en la


observación y que se conoce como error experimental.

El segundo paso consiste, en el análisis propiamente dicho de los datos. El método más
aplicable para el análisis de datos es el ANALISIS DE VARIANZA, que consiste en analizar
la variación en una respuesta y asignar proporciones (componentes) de esa variación a
cada una de las variables del conjunto de variables independientes controlables o no
(COCHRAN, 1965, cap. 3).
Teóricamente es posible dividir la variabilidad del resultado de un experimento en dos
partes:
1. La variabilidad originada por los factores que influyen directamente en el
resultado del experimento, estudiados en sus distintos niveles o tratamientos.
2. La variabilidad producida por el resto de los factores con influencia en el
resultado del experimento desconocida o no controlable, que se conoce como
error experimental.

Existen otros métodos estadísticos que permiten el análisis de datos y validación de la


idoneidad del modelo que pueden ser de tipo gráfico, como el análisis de residuos,
elaboración de contornos, análisis de Pareto de efectos, etc. o bien de tipo analítico, como el
estimación de efectos. Sin embargo, hay que recordar que los métodos estadísticos no
pueden probar experimentalmente que un factor o varios factores tienen un efecto particular.
Solo proporcionan directrices para la veracidad y validez de los resultados, mediante el
establecimiento de la probabilidad de error de una conclusión o la asignación de un nivel de
confiabilidad a los resultados. La ventaja principal de la aplicación de métodos estadísticos es
que agregan objetividad al proceso de toma de decisiones. Las técnicas estadísticas, aunadas
a un buen conocimiento técnico o del proceso y al sentido común, suelen llevar a
conclusiones razonables.

4.2 EXPERIMENTOS UNIFACTORIALES COMPLETAMENTE AL AZAR

El diseño unifactorial completamente al azar o randomizado, es el más simple de todos los


diseños. En éste, los tratamientos se distribuyen al azar sobre todas las unidades
4-9

experimentales y el número de réplicas o unidades por tratamiento pueden ser iguales o


diferentes (COCHRAN, 1965, cap. 4).
Este diseño se utilizará cuando se estudian dos o más tratamientos, bajo las siguientes
condiciones (COCHRAN, 1965, cap. 4):
i) Cuando el material experimental es homogéneo, es decir tiene las mismas características
deseadas para la investigación.
ii) Cuando es probable que una parte apreciable de las unidades experimentales se destruya
o no responda. En estos casos el análisis de los datos en otros diseños se vuelve difícil o
imposible.
iii) En experimentos pequeños en donde la mayor precisión de otros diseños no compensa la
pérdida de grados de libertad del error (a través de otros diseños las unidades
experimentales podrían darnos resultados más precisos; pero si esta precisión no sobrepase
lo perdido con la disminución de los grados de libertad, no valdría la pena utilizar otro
diseño).
iv) Cuando el experimentador no tiene los criterios o no tiene los elementos necesarios para
determinar la heterogeneidad en el material experimental.

Dentro de las ventajas del empleo de diseños unifactoriales se encuentran las siguientes
(COCHRAN, 1965, cap. 4):
i) Permite flexibilidad completa. Puede usarse cualquier número de tratamientos y
repeticiones. Puede variarse a voluntad el número de repeticiones de un tratamiento a otro
(pero no es recomendable sin una buena razón).
ii) El análisis estadístico es fácil, aún si el número de repeticiones no es el mismo para todos
los tratamientos, pues los cálculos para su análisis no presentan ninguna variante
significativa.
iii) Aún cuando los datos de alguna de las unidades se hayan perdido o se rechacen por
alguna causa, el método de análisis sigue siendo sencillo. Por otra parte la pérdida relativa de
información debida a los datos faltantes es de menos importancia que en cualquier otro
diseño.
iv) Permite el máximo número de grados de libertad para la suma de cuadrados del error.

Dentro de las limitaciones del uso de un diseño unifactorial se encuentran:


4-10

i) Las unidades experimentales se suponen homogéneas. En dicho caso los errores debido a
la heterogeneidad son asignados al error aleatorio.
ii) No tiene mayor grado de precisión, hay otros diseños más eficientes en la estimación del
error estándar por unidad experimental.

En general, el uso de diseños unifactoriales es recomendable en aquellos experimentos en


donde el material de ensayo es suficientemente homogéneo. Es decir, cuando todas las
unidades experimentales reúnen prácticamente las mismas características, de modo que el
efecto de un tratamiento sobre la variable bajo estudio, es el mismo, independientemente de
la unidad experimental donde se mide, salvo por variaciones aleatorias debido a las fuentes
del error en la investigación. Tal condición de homogeneidad en el material experimental,
permite que cada tratamiento pueda ensayarse con el número de repeticiones que se desee.

4.2.1 DISEÑOS UNIFACTORIALES Y DISTRIBUCION ALEATORIA DE LOS


TRATAMIENTOS

Una vez que se ha definido claramente el problema y se han determinado los diferentes
elementos presentes en la investigación: población, marco muestral, unidades
experimentales, factores, variables a medir, tratamientos, etc., entonces se debe calcular el
tamaño de la muestra y generarla a través de un procedimiento que asegure la
aleatorización. Los tratamientos se alojan completamente al azar sobre las unidades
experimentales, bajo la condición de que cada unidad deberá tener una probabilidad
conocida de recibir un tratamiento en particular. Para la distribución, primeramente se
enumeran las unidades experimentales y luego se obtiene una permutación aleatoria. Los
procesos mas comúnmente empleados en la práctica para la obtención de permutaciones
aleatorias, son el uso de una tabla de números aleatorios como la que se presenta en la tabla
anexo A4, o bien, el uso de programas de computadora. En este caso el investigador debe
establecer un criterio para elegir las unidades experimentales y tratamientos; por ejemplo,
tomar el primer digito para el tratamiento y los dos últimos para la unidad experimental.

4.2.2 ANALISIS DEL DISEÑO UNIFACTORIAL


Supóngase que se desea comparar k tratamientos o niveles de un factor único. La respuesta
que se desea observar en cada uno de los k tratamientos es una variable aleatoria. Los datos
4-11

aparecerían como en la tabla 4.2. En general, habrá ni observaciones del tratamiento i


(MONTGOMERY, 1991, cap. 3).
La generalización del modelo estadístico lineal para cada observación viene dada por
(MONTGOMERY, 1991, cap. 3):
y ij = µ + τi + ε ij (ec. 4.1)

(observación = media global + efecto del factor + error aleatorio)


donde: i= 1,2,…, k; j = 1, 2, …., ni; y ij es la (ij)-ésima observación, µ es un parámetro común
a todos los tratamientos denominado media global; τi es un parámetro único que manifiesta
el efecto del i-ésimo tratamiento, y εij es la componente aleatoria del error para cada
observación.

TABLA 4.2 PLANTILLA DE RECOLECCION DE DATOS PARA UN EXPERIMENTO


UNIFACTORIAL

Tratamiento Observaciones Totales (Yi) Media


yi
(1) y11 ..........y1n1 Y1 y1
(2) y21 ..........y2n2 Y2 y2
. . . .
. . . .
(k) yk1 ..........yknk Yk yk
Y Y

El objetivo será probar hipótesis apropiadas con respecto a los efectos del tratamiento y
hacer una estimación de ellos. Para probar las hipótesis, se supone que los errores del
modelo son variables aleatorias independientes con distribución normal, con media cero y
varianza σ2. Se supone que esta última es constante para todos los niveles del factor
(MONTGOMERY, 1991, cap. 3).
Además se requiere que el experimento se realice en orden aleatorio, de manera que el
medio ambiente en el que se usan los tratamientos sea lo mas uniforme posible.
El modelo estadístico, describe dos situaciones con respecto al efecto de los tratamientos.
Primero, los tratamientos podrían haber sido seleccionados específicamente por el
experimentador. En esta situación se desea probar hipótesis sobre las medias de los
tratamientos y las conclusiones se aplican sólo a los niveles del factor considerados en el
análisis. Las conclusiones no pueden hacerse extensivas a tratamientos similares que no
4-12

hayan sido consideradas específicamente. También será deseable estimar los parámetros del
modelo (µ, τi, σ2). Este modelo se denomina modelo de efectos fijos (MONTGOMERY, 1991,
cap. 3).
Alternativamente, los k tratamientos pueden ser una muestra aleatoria de una población
mayor de tratamientos. En esta situación sería deseable generalizar las conclusiones (basadas
en la muestra de tratamientos) a todos los tratamientos de la población, ya sea que hayan
sido explícitamente considerados en el análisis o no. En este caso, los τi son variables
aleatorias y resulta inútil conocer sus valores particulares para los tratamientos investigados.
En su lugar se prueban hipótesis con referencia a la variabilidad de los τi y se interpreta dicha
variabilidad. Este modelo de se conoce como modelo de efectos aleatorios o de componentes
de varianza (MONTGOMERY, 1991, cap. 3).

4.2.2.1 ANÁLISIS DE VARIANZA PARA EL MODELO DE EFECTOS FIJOS

Como se había mencionado en la sección anterior, en el modelo de efectos fijos los


tratamientos son seleccionados específicamente por el experimentador (considerándose un
número contable de ellos), por lo que interesa probar hipótesis relativas a la igualdad de los
efectos de los tratamientos. Algunos ejemplos de aplicación de este tipo de diseño en análisis
químico son los siguientes:

• Determinar si el tipo de envase en el que es envasada una solución influye sobre la


concentración media de un analito contenido en la misma, después de un tiempo
fijado de almacenaje.
• Comparar el trabajo de los analistas en un laboratorio.
• Comparar los resultados obtenidos al aplicar diferentes procesos de medición.
• Etc.

En el modelo unifactorial de efectos fijos, la media del i-ésimo tratamiento viene dada como
µi = µ + τi. Como puede observarse los efectos se definen usualmente como desviaciones

con respecto a la media global µ, por esta razón ∑τ i = 0 (MONTGOMERY, 1991, cap. 3).

La hipótesis nula que se deseará probar es que las medias de todos los tratamientos sean
iguales, es decir que (MONTGOMERY, 1991, cap. 3):
4-13

Ho: µ1 = µ2 =……= µk
O que
Ho: τ i = 0 para i = 1, 2,…., k

En forma correspondiente, la hipótesis alternativa es que no todas las medias de los


tratamientos son iguales, o sea que (MONTGOMERY, 1991, cap. 3):

H1: µi ≠ µj para al menos un par (i, j)


O que
H1: τ i ≠ 0 cuando menos para un valor de i

Por tanto, es posible hablar de probar la igualdad de medias de los tratamientos, o bien de
probar que los efectos de los tratamientos son cero. El procedimiento apropiado para probar
la igualdad en el nivel medio de k tratamientos es el análisis de varianza en un sentido.
La prueba de hipótesis consiste en evaluar el estadístico Fo que se define como la razón
(MONTGOMERY, 1991, cap. 3):

SCTratamientos ( k − 1) CM Tratamientos
Fo = =
SC Error ( N − k ) CM Error

Si la hipótesis nula es verdadera, Fo tiene una distribución F con k-1 y N – k grados de


libertad. Debe rechazarse la hipótesis, si el valor del estadístico es demasiado grande. Esto
implica una región crítica unilateral superior. En otras palabras, se rechaza Ho si:

F o > F α ,k −1 ,N −k

La denominación de análisis de varianza resulta de descomponer la variabilidad total de los


datos en sus partes componentes, que en general, puede medirse por la suma total de
cuadrados corregida, que viene dada por (MONTGOMERY, 1991, cap. 3):

k ni
SC Total = ∑ ∑ (y −Y ) 2
ij (ec. 4.2)
i =1 j =1
4-14

k ni

∑∑ y ij k

∑n
i =1 j =1
en donde Y = con N = i para tamaños muestrales diferentes en cada
N i =1

tratamiento, o bien, N = kn cuando el número de observaciones es el mismo para todos los


tratamientos.
Se puede demostrar que (MONTGOMERY, 1991, cap. 3):

k ni k k ni
∑ ∑ ( yij - Y )2 = ∑ ni ( y i - Y )2 + ∑ ∑ ( y ij - y i )2
i=1 j=1 i=1 i=1 j=1 (ec. 4.3)
(Donde y i es el promedio obtenido para cada tratamiento)

Es decir, que la suma total de los cuadrados de las desviaciones de cada observación con
respecto a la media global (SCTotal), se descompone en la suma de los cuadrados de las
desviaciones de las medias de los tratamientos en relación con la media global
(SCTratamientos ), que representa a la variabilidad total debida a la diferencia entre los
tratamientos, y la suma de los cuadrados de las desviaciones de las observaciones con
respecto a sus propias medias de tratamiento (SCError ), que representa la variabilidad debida
al error aleatorio. Por tanto puede escribirse(MONTGOMERY, 1991, cap. 3):

SCTotal = SCTratamientos + SCError (ec. 4.4)

Entre más grande sea SCError , mayor será la variación en las observaciones que pueden
atribuirse al error aleatorio. Entre más grande es el valor de SCTratamientos , mayor es la
diferencia que existe entre las medias de los tratamientos y la media global.
Bajo la hipótesis nula y la suposición de que ε ij ∼ N(0, σ2), SCTratamientos /σ
σ2 y SCError /σ
σ2 son
dos variables aleatorias independientes con una distribución chi-cuadrado. Los grados de
libertad se obtienen al separar la suma total de cuadrados. La SCTotal tiene N -1 grados de
libertad, debido a que se pierde un grado de libertad al ser necesario que (MONTGOMERY,
1991, cap. 3):
k ni

∑ ∑ (y
i =1 j =1
ij −Y ) = 0

La suma de los cuadrados de los tratamientos tiene k-1 grados de libertad, debido a que se
impone la restricción (MONTGOMERY, 1991, cap. 3):
4-15

∑ (y i −Y ) = 0
i =1

Entonces, como SCTotal = SCError + SCTratamientos, el número de grados de libertad para


SCError será igual a la diferencia entre el número de grados de libertad SCTotal y SCTratamientos ,
es decir N - k.
De esta forma pueden definirse las cantidades (MONTGOMERY, 1991, cap. 3):

• Media de cuadrados debida a los tratamientos:


SCTratamientos
MC Tratamientos = (ec. 4.5)
k −1
El cálculo de la suma de cuadrados de los tratamientos se facilita si se aplica la
siguiente ecuación:
k
y i2 Y 2
SC Tratamientos = ∑
i =1 n i

N
(ec. 4.6)

Donde yi es la suma total para cada tratamiento e Y es la suma total de todos los
datos.
• Media de cuadrados debida al error, que viene dada como:
SCError
MC Error = (ec. 4.7)
N −k
La suma de cuadrados del error puede calcularse a partir de:
SC Error = SC Total − SC Tratamientos

Donde la suma de cuadrados total puede calcularse como:


k ni
Y2
SCTotal = ∑∑ y ij2 − (ec. 4.8)
i =1 j= N

El procedimiento de prueba de hipótesis se resume en la tabla 4.3. Las fuentes de variación,


grados de libertad, suma de cuadrados, cuadrados medios y el cociente Fo, juntos,
constituyen lo que se conoce como tabla de análisis de varianza (ANDEVA o ANOVA).
4-16

TABLA 4.3 ANÁLISIS DE VARIANZA PARA EL DISEÑO COMPLETAMENTE ALEATORIO


Fuente de g.l. Suma de Cuadrados Estadístico(Fp)
Variación Cuadrados (SC) medios(CM)
Tratamiento k-1 SCTratamientos SCTratamientos /k-1
MC Tratamientos
Error N-k SCError SCError /N-k Fo =
MC Error

Total N-1 SCTotal

El MCError es un estimador insesgado de σ2 sin importar si la hipótesis nula es cierta. Por otro
lado, si la hipótesis nula es cierta entonces E(MCTratamientos) = σ2; es decir, si Ho es cierta, tanto
MCError como MCTratamientos son estimadores insesgados de la varianza del error. Pero si la
hipótesis nula no es cierta, MCTratamientos tiende a ser generalmente mayor que MCError.

4.2.2.2 ESTIMACION DE PARAMETROS DEL MODELO

Los estimadores mínimos cuadrados de las medias poblacionales son las medias observadas
de los grupos en tratamiento y i . Las medias observadas son los promedios de ni

observaciones independientes, de forma que la varianza de la media de un grupo de

tratamiento es σ y i = σ n i , siendo su estimador (KUEHL, 2001, cap. 3):


2 2

s2
s 2
yi =
ni
En donde a partir del análisis de varianza, s2 = MCError.
La construcción de un intervalo al 100(1 - α)% de confianza, para cada media del grupo en
tratamiento i, viene dado por (MONTGOMERY, 1991, cap. 3):

MC Error
IC (1−α)% = y i ± t α/ 2 ,N −k (ec. 4.9)
ni

En gran parte, el interés no se centra solamente en la estimación de la media del -i ésimo


tratamiento, sino también en la diferencia entre la s medias de los tratamientos. Un intervalo
de confianza al 100(1 - α)% para la diferencia entre las medias de dos tratamientos
cualesquiera, será (MONTGOMERY, 1991, cap. 3):

2 MC Error
IC (1−α)% = ( yi − y j ) ± t α/ 2 ,N −k (ec. 4.10)
( ni + n j ) / 2
4-17

4.2.2.3 COMPARACION DE TRATAMIENTOS CON UN CONTROL

En muchos estudios, uno de los tratamientos actúa como un control para algunos o todos los
restantes. En este caso, el interés se centra en determinar si las respuestas medias de los
tratamientos difieren de la del tratamiento control (por ejemplo, comparar el trabajo de una
serie de laboratorios con un laboratorio de referencia). Dunnett (1955) introdujo un
procedimiento basado en una tasa de error con respecto al experimento con este propósito
(MONTGOMERY, 1991, cap 3).
Las hipótesis a contrastar son: Ho: µi = µcontrol contra H1: µi ≠ µcontrol. El estadístico de
contraste para la prueba, viene dado por:

y i − y control

El criterio de Dunnett para comparar k tratamientos con el control es (MONTGOMERY, 1991,


cap 3):

1 1  1 1 
D(k , αE ) = d α,k ,ν s 2  +  = dα,k ,ν MC Error  + 
 i
n n control   i
n n control 

La hipótesis nula se rechaza, a un nivel de significación α si: y i − y control >D(k, αE )

Los valores de dα, k, ν para el método de Dunnett de uno o dos lados, se encuentran en la
tabla del anexo B4, para k tratamientos, un error tipo I de α con respecto al experimento y ν
grados de libertad para la estimación de la varianza del error experimental.
Las estimaciones de los intervalos de confianza simultáneos bilaterales para la diferencia
entre las medias de los tratamientos individuales y la media del control (µi - µcontrol) son
(KUEHL, 2001, cap.3):
y i − y control ± D (k , α )

4.2.2.4 METODO DE COMPARACION DE MEDIAS INDIVIDUALES

Al rechazar la hipótesis nula puede concluirse que las medias o el efecto de los tratamientos
difieren significativamente; pero esto no es información suficiente para rechazar una
alternativa en particular, por ejemplo, sea la hipótesis nula Ho: µ1 = µ2 = µ3 rechazada, en
este caso se pudieran haber dado alguna de las siguientes situaciones µ1 = µ2, µ1 ≠ µ3, µ1 =
µ3, µ1 ≠ µ2, µ1 ≠ µ2 ≠ µ3, por lo tanto, esta es una buena razón para que el investigador
4-18

necesite un análisis más completo para encontrar las diferencias estadísticamente


significativas entre cierto número de medias de tratamientos en la población.
Hay una diversidad de métodos para realizar análisis pareados de las medias o para realizar
contrastes entre dichas medias, según sea la necesidad del investigador, entre ellas se
encuentran la prueba de Duncan, método de la diferencia mínima significativa (ó LSD), la
prueba de Newman-Keuls, la prueba de Tuckey.
A continuación se describe la prueba de intervalos múltiples de Duncan para contrastes
pareados de medias.
La prueba de intervalos múltiples de Duncan se basa en la noción general del rango
estudentizado, que establece que la diferencia entre las medias consideradas debe exceder
un cierto rango para ser consideradas significativamente diferentes. En este caso dicho rango
recibe el nombre de rango menos significativo y se representa por RP (en donde p = 2,3,..k) .
En un primer momento para la prueba de Duncan es necesario colocar en forma ascendente
los k promedios de tratamientos, y se determina el error estándar de cada promedio, a partir
de la expresión (MONTGOMERY, 1991, cap. 3):

CM Error
S yi = (ec. 4.11)
n

Para el caso de muestras del mismo tamaño. Cuando el tamaño es diferente hay que
reemplazar n por la media armónica nh de {ni} (que es utilizada en el caso de promediar
razones) es decir (MONTGOMERY, 1991, cap. 3):
k
nh = k

∑ (1 n )
i =1
i

Como puede deducirse el promedio armónico de una serie de muestras de igual tamaño es
igual a n (nh = n).
En segundo lugar, deben calcularse los rangos menos significativos a partir de los cuales se
rechaza o no la diferencia entre dos medias determinadas, su ecuación es (MONTGOMERY,
1991, cap. 3):
R p = r α ( p , f )S y i para p = 2, 3,…, k (ec. 4.12)
4-19

Como se mencionó anteriormente, los valores de las cantidades Rp son llamados rangos
estudentizados menos significativos o mínimos intervalos significativos y dependen del niv el
de significación deseado (α) y del número de grados de libertad del cuadrado del error. Esta
dependencia es expresada en el término rα(p, f). Los valores de rα(p, f) pueden obtenerse de
la tabla del anexo C4, para p = 2, 3,...,10 medias (MONTGOMERY, 1991, cap. 3).
A continuación, se prueban las diferencias observadas entre las medias, comenzando por el
valor más alto contra el más pequeño, comparando esta diferencia con el rango menos
significativo Rk. Después se calcula la diferencia entre el valor más alto y el segundo más
pequeño y se compara con Rk-1. Este procedimiento continúa hasta que todas las medias han
sido comparadas con la media más grande. Posteriormente, se obtiene la diferencia entre la
segunda media más grande y la más pequeña y se compara contra el rango menos
significativo Rk-1. Este proceso continúa hasta que han sido consideradas las diferencias entre
todos los k (k-1)/2 posibles pares. Si una diferencia observada es mayor que el rango menos
significativo correspondiente, se concluye que la pareja de medias en cuestión es
significativamente diferente (MONTGOMERY, 1991, cap. 3).
Para evitar contradicciones, ninguna diferencia entre una pareja de medias se considera
significativa si las dos medias se encuentran entre otras dos que no difieren
significativamente (MONTGOMERY, 1991, cap. 3); es decir si sucede el siguiente caso:
Sean y 1 = y 2 y y 3 , parte del conjunto de k medias y y 1 − y 2 , y 1 − y 3 , y 2 − y 3

diferencias de las k (k-1)/2 parejas de medias.


Entonces si:
y 1 − y 2 < R4

y 1 − y 3 < R3

y 3 − y 2 < R2

Se concluirá que y 3 − y 2 tienen una diferencia no significativa a pesar de ser mayor que R2,

ya que, en caso contrario, se estaría generando una contradicción, puesto que se está
considerando no significativa la diferencia de y 1 − y 2 y y 1 − y 3 siendo R4 > R3 > R2.

Es importante hacer notar, que a medida que el número de medias incluidas en el grupo
aumenta, la prueba requiere una diferencia observada más grande para detectar parejas de
medias significativamente diferentes. Lo anterior puede explicarse a partir del siguiente
razonamiento:
4-20

Los valores de rα ( p , f ) deben elegirse para obtener un nivel de protección o seguridad

específico. En otras palabras cuando se comparan dos medias separadas p pasos, el nivel de
protección es (1-α)p-1 = (1-α)(1-α) …..(1-α); hasta p - 1 veces, en donde α es el nivel de
significación especificado para dos medias adyacentes. Así, el nivel del error de informar al
menos una diferencia significativa incorrecta entre dos medias cuando el tamaño del grupo es
p, será igual a: 1 - (1-α)p-1 (MONTGOMERY, 1991, cap. 3).
Por lo general, si el nivel de protección es α, las pruebas sobre las medias tienen un nivel de
significación mayor o igual que α. En consecuencia, el procedimiento de Duncan es muy
eficiente para determinar diferencias entre medias cuando estas diferencias realmente existen
(MONTGOMERY, 1991, cap. 3).

4.2.2.5 ANÁLISIS DE VARIANZA PARA EL MODELO DE EFECTOS ALEATORIOS

Muchas veces al experimentador le interesa analizar un factor que tiene un número infinito
de posibles niveles, o bien un número de niveles lo suficientemente grande como para
considerarse infinito. El objetivo de la investigación en este caso, debe ser la obtención de
conclusiones relativas a toda la población de niveles del factor y para lograrlo el investigador
debe seleccionar al azar k de estos niveles y estructurar un diseño unifactorial conocido como
diseño unifactorial de componentes de varianza o de efectos aleatorios. En este diseño las
hipótesis a probar hacen referencia a la variabilidad de los tratamientos y a su interpretación
(MONTGOMERY, 1991, cap. 3). Un ejemplo de aplicación del diseño unifactorial de
componentes de varianza, en análisis químico, es concluir respecto a la homogeneidad de la
concentración de un analito en un producto en polvo contenido en un recipiente, ya que se
puede concebir que el número de puntos a seleccionar en el interior del contenedor es de
carácter infinito.
El modelo estadístico lineal para este diseño, es el mismo que el presentado en la ecuación
4.1, en donde τi e εij son variables aleatorias. Si τi tienen una varianza a σ 2τ y es

independiente de εij, la varianza de cualquier observación es: V(y ij ) = σ 2τ + σ2. Las varianzas

σ 2τ y σ2 se conocen como componentes de varianza y para probar las hipótesis del modelo se
requiere que los εij sean independientes y normalmente distribuidos(NID(0, σ2)), que los ti
4-21

sean independientes y normalmente distribuidos (NID (0, σ 2τ )) y que τi e εij sean

independientes (MONTGOMERY, 1991, cap. 3).


La variabilidad total en las observaciones se descompone en una componente que mide la
variación entre los tratamientos. (SCTratamientos) y otra que mide la variación dentro de los
tratamientos (SCError). La suma de identidad de cuadrados: SCTotal = SCTratamientos + SCError, aun
es válida (MONTGOMERY, 1991, cap. 3).
En este caso, carece de sentido probar hipótesis que se refieren a los efectos de tratamientos
individuales y en su lugar deben probarse las hipótesis (MONTGOMERY, 1991, cap. 3):

Ho: σ 2τ = 0 (todos los tratamientos son idénticos)

Contra

H1: σ 2τ > 0 (existe variabilidad entre los tratamientos)

Si la hipótesis nula es verdadera:

SCTratamientos ( k − 1) CM Tratamientos
Fo = =
SC Error ( N − k ) CM Error

Tiene una distribución F con k – 1 y N – k grados de libertad. Por tanto, Ho se rechaza si:

F o > F α ,k −1 ,N −k

El procedimiento computacional y tabla de análisis de varianza para el modelo de efectos


aleatorios es idéntico al de efectos fijos. Sin embargo, las conclusiones son un tanto
diferentes, ya que se aplican a toda la población de tratamientos (MONTGOMERY, 1991, cap.
3).

Usualmente interesa calcular las componentes de varianza en el modelo ( σ 2τ y σ2). El

procedimiento usado para estimar σ 2τ y σ2 se conoce como método de análisis de varianza

(MONTGOMERY, 1991, cap. 3).


El procedimiento consiste en igualar los valores esperados de las medias de cuadrados con su
correspondiente valor observando en la tabla de análisis de varianza, para después despejar
4-22

las componentes de varianza. Al igualar los valores observados y los esperados de las medias
de cuadrados, se obtiene (MONTGOMERY, 1991, cap. 3):

CMTratamientos= σ2 + nσ 2τ (ec. 4.13)

y
CMError = σ2

Los estimadores de las componentes de varianza son (MONTGOMERY, 1991, cap. 3):

σ̂ 2 = CMError
y
CM Tratamientos − CM Error
σˆ τ2 =
n
En donde n es el número de observaciones por tratamiento.
Para tamaños de muestras desiguales, n debe reemplazarse por (MONTGOMERY, 1991, cap.
3):
 k
2

1  k ∑ ni 
n0 = ∑ n − i =k1 
k − 1  i =1 i
∑ ni 
 i =1 

El método de análisis de varianza para la estimación de las componentes de varianza no


requiere la suposición de normalidad.
Se pueden calcular las estimaciones de los intervalos de confianza al 100(1 - α)%, para
ambos componentes de varianza. Para σ2 el intervalo viene dado como (KUEHL, 2001, cap.
5):
SC Error SC Error
< σ2 < (ec.4.14)
A B
donde A = χ α / 2 ,N −k y B = χ (1 −α / 2 ),N −k
2 2

Un intervalo con al menos 100(1 - 2α)% de confianza para σ 2τ es (KUEHL, 2001, cap. 5):
4-23

SCTratamientos (1 − ( Fu / Fo )) SCTratamientos (1 − ( Fl / Fo ))
< σ 2τ < (ec.4.15)
nC nD

En donde C = χ α / 2 ,k −1 , D = χ (1 −α / 2 ),k −1 , Fo es el estadístico observado. Las cantidades Fu =


2 2

Fα/2, (k-1),(N -k) y Fl = F(1-α/2), (k-1),(N-k) que son valores de la variable F.

Por definición, una componente de varianza es positiva; sin embargo, las estimaciones de σ 2τ

mediante la ecuación (4.15) pueden ser negativas. Existen varios cursos de acción sugeridos
en caso de estimaciones negativas (SEARLE, 1971; SEARLE, CASELLA Y MCCULLOCH, 1992):

1. Aceptar la estimación como evidencia de un valor verdadero de cero y usar el cero como la
estimación, reconociendo que el estimador será sesgado.
2. Conservar la estimación negativa, tomando en cuenta que es posible que los cálculos
subsecuentes con los resultados no tengan mucho sentido.
3. Interpretar la estimación de la componente negativa como una indicación de un modelo
estadístico incorrecto.
4. Utilizar un método diferente de análisis de varianza para estimar sus componentes.
5. Reunir más datos y analizarlos por separado o junto con los existentes y esperar que el
aumento de información conduzca a estimaciones positivas.

4.2.3 CALCULO DEL TAMAÑO DE LA MUESTRA 1

Uno de los problemas principales que se enfrentan al llevar a cabo una investigación
experimental, es la elección del número de réplicas necesario para detectar alguna diferencia
predeterminada entre las medias de los tratamientos. En análisis químico, esta elección
muchas veces está condicionada a la disponibilidad de recursos humanos, materiales, y
económicos.
No obstante, se considera de gran importancia poder definir el número de réplicas que sería
conveniente tomar para un determinado estudio y de esta forma establecer comparaciones y
estimaciones objetivas sobre la potencia de los contrastes a la hora de validar los modelos
empleados.

1
Para el cálculo del tamaño de la muestra se estará bajo el supuesto que n = n1 = n2 =...= nk .
4-24

Por otra parte, siempre que sea aplicable, toda investigación experimental que involucre un
diseño unifactorial debe partir con el calculo del número de réplicas pues ello conduce a un
control más eficiente del error tipo II (β).
El cálculo del número de réplicas en un diseño unifactorial depende en primer lugar, de la
aleatoriedad o no de los niveles del factor. Y en segundo lugar, de la sensibilidad de la
prueba, que describe la capacidad del procedimiento para detectar diferencias en las medias
poblacionales y se mide por la potencia de la prueba 1-ß2 .
A continuación, se describe el cálculo del número de réplicas para los modelos unifactoriales
de efectos fijos y efectos aleatorios.

a. Calculo del número de réplicas para el modelo unifactorial de efectos fijos:


(MONTGOMERY, 1991, cap. 3)
Al plantear un diseño completamente aleatorizado, el objetivo principal es probar la
hipótesis nula(Ho), es decir: Ho: τi = 0 para i = 1, 2,…., k, mediante el uso del
estadístico (Fo = CM Tratamientos/CMError). La potencia de la prueba se define en general,
como:
1 - β = P(Fo > F α,k-1,N -k |Ho falsa)

Cuando Ho es falsa, Fo tiene una distribución F desplazada con K – 1 y N – k grados

∑τ
k
de libertad y parámetro de desplazamiento λ = n i
2
i / σ 2 (valor del efecto

poblacional = µi - µ ). Si la hipótesis nula es cierta, entonces el parámetro de

desplazamiento tienen un valor de cero, puesto que todo τi = 0 y Fo tiene una


distribución F centrada.
Se cuenta con tablas de valores y gráficas de la potencia de la prueba F desplazada
en función del nivel de significación α; la potencia 1 - β; los grados de libertad K – 1 y

N – k, y Φ (una función del parámetro de desplazamiento que es: Φ = λ k ), y que

se usan para estimar el número de réplicas necesario para realizar un diseño

2
Como se presentó en la sección 3.3.2 del capítulo 3, la potencia de una prueba es la probabilidad de
rechazar la hipótesis nula (Ho) siendo la hipótesis alternativa verdadera (decisión correcta). La potencia
de una prueba puede calcularse como 1-ß, donde ß es la probabilidad de cometer un error tipo II, el
cual se comete al aceptar Ho cuando en realidad es falsa (decisión incorrecta).
4-25

unifactorial de efectos fijos. Como puede observarse un valor de Φ requiere de un


valor de σ2 y valores específicos de las medias de los tratamientos que conducen a
rechazar la hipótesis nula (µ1, µ2, …, µk ).
Dado que es difícil especificar los efectos deseados para un conjunto de niveles del
factor, es más conveniente especificar la diferencia entre cualquier pareja de medias
de los tratamientos (D = µi - µj), que puede establecerse como una diferencia
significativa dentro del fenómeno de estudio. En este caso se trabaja con el cálculo de
un valor mínimo de Φ 2, que viene dado como:

nD 2
Φ2 =
2kσ 2
En el anexo D4 se presentan tablas y curvas de potencia para la distribución F
desplazada.

b. Calculo del número de réplicas para el modelo unifactorial de efectos aleatorios:


(KUEHL, 2001, cap.5)
En el caso de efectos fijos, el cálculo de potencia requiere de la distribución no central
de F. Este no es el caso para el modelo de efectos aleatorios.
La hipótesis nula de interés en el modelo de efectos aleatorios, Ho: σ 2τ = 0 se prueba

con Fo =C MTratamientos/CMError, y la potencia de la prueba es:

1 - β = P(F > F α,k-1,k(n-1)Ho falso) = P(F > Fα,k-1,k(n-1) σ 2τ > 0)

Cuando σ 2τ > 0, la distribución F es la distribución central Fα,k-1,k(n-1) multiplicada por


una constante 1/λ2, donde:

σ2τ
λ = 1+ n
σ2

La potencia de la prueba se puede determinar a partir de la distribución F central


como sigue:
4-26

1 - β = P[ F > 1/λ2 (Fα,k-1,k(n-1)) ]

El número de réplicas necesario, se determina a partir de valores tabulados o gráficos


de potencia para la prueba F central (similares a los de los efectos fijos), tal como
los que se presentan en el anexo D4, dados el número de tratamientos k, un nivel de
significación (α), una potencia deseada (1 - β) y λ.
Para determinar el valor de λ es necesario establecer una razón deseada de los
componentes de varianza, que puede determinarse mediante juicio o experiencia
anterior, o según la desviación estándar de una observación individual, σy .

El valor necesario para la razón σ 2τ /σ2, en términos del porcentaje fijo de

aumento en σy aceptable (P), y que con uno mayor se rechaza la hipótesis nula es:

σy σ2τ + σ 2
= = 1 + 0.01P
σ σ2

Por lo que el valor necesario para la razón σ 2τ /σ2 es:

σ2τ
= ( 1 + 0.01P ) 2 − 1
σ2

4.2.4 COMPROBACIÓN DE LA IDONEIDAD DEL MODELO

La validez de las estimaciones y pruebas de hipótesis con respecto al análisis de los datos, se
apoyan en el establecimiento de varias suposiciones clave. Las suposiciones que
fundamentan el análisis de varianza son:

a. Que los datos estén descritos de manera adecuada por el modelo lineal:

i = 1,2 ,..., k 
y ij = µ + τi + ε ij  
 j = 1, 2 ,..., n i 
b. Que los errores (εij) sean variables aleatorias independientes y normalmente
distribuidas con media cero y varianza constante (εij ∼ N(0, σ2)).
4-27

c. En el caso de los modelos de efectos aleatorios se hace la suposición adicional de que


los τi son independientes y están distribuidos normalmente con media cero y varianza

σ 2τ , y además que σ 2τ y εij son independientes.

Las condiciones ideales raramente se cumplen en los estudios reales. En el análisis de


varianza, la magnitud de las discrepancias en los datos, con respecto a las suposiciones de
independencia, la distribución normal supuesta y las varianzas homogéneas, pueden conducir
a inferencias erróneas. Las discrepancias menores generalmente, no ocasionan
modificaciones sustanciales en la eficiencia de las estimaciones y en los niveles de
significación de las pruebas. Sin embargo, es posible que discrepancias mayores, en especial
una heterogeneidad excesiva de la varianza o alguna heterogeneidad de la varianza con
números de réplicas desiguales, afecten en forma importante las inferencias estadísticas.
Lo anterior implica, la necesidad de implementar el proceso de validación del modelo como
un paso indispensable en cada proyecto que se realice.
La validación del modelo consiste en el uso de herramientas de tipo gráfico o analítico que
permiten “diagnosticar” en que medida las suposiciones tomadas para el análisis son
adecuadas.
Las herramientas principales para el diagnóstico están basadas en el análisis de los residuos
observados. En general, los residuos se definen como la diferencia entre la respuesta
observada y valor de respuesta predicho con el modelo supuesto, es decir:

ε ij = y ij − yˆij

Para el caso del modelo unifactorial los residuos quedan definidos como:

ε ij = y ij − y i

En otras palabras, los residuos del i-esimo tratamiento se determinan restando el promedio
del tratamiento a cada observación dentro del tratamiento.
La comprobación de la idoneidad del modelo consiste en observar la magnitud de los
residuos y su relación con otras variables, proporcionando evaluaciones visuales de las
suposiciones del análisis de varianza. La suposición de varianza homogénea se evalúa con
una gráfica de los residuos contra las medias estimadas de los tratamientos. La suposición de
independencia se evalúa con una gráfica de los residuos contra los valores predichos, y la
4-28

suposición de distribución normal mediante una gráfica de probabilidad normal de los


residuos.
A continuación se describe el análisis de residuos para la prueba de normalidad,
independencia y homogeneidad de varianzas.

a. PRUEBA DE SUPOSICIÓN DE NORMALIDAD:


Un procedimiento útil para comprobar la suposición de normalidad de los residuos es
construir una gráfica de probabilidad normal con los residuos, tal como la que se presenta
en la figura 4.1.
Una gráfica de probabilidad normal organiza los residuos en orden creciente y los grafica
contra los cuantiles correspondientes de la distribución normal estándar. El residuo de
orden i-ésimo tiene una frecuencia acumulada de i/N en una muestra de tamaño N, valor
al que se le aplica una corrección por continuidad fi = (i -0.5)/N.
El cuantil de una variable normal se conoce por una probabilidad acumulada dada, y el
valor del cuantil de un residuo se conoce por su frecuencia acumulada en el conjunto de
datos residuales. Se forman pares con los cuantiles correspondientes de los residuos y la
distribución normal estándar y se grafican como valores X e Y en una gráfica bivariada
llamada gráfica cuantil-cuantil. Si los cuantiles de los residuos son iguales a los de la
variable normal para la misma frecuencia acumulada, la gráfica será una línea recta (ver
capítulo 2).
En general, se dice que un análisis de varianza (y otros procedimientos relacionados
como los de comparaciones múltiples) es consistente o robusto ante la suposición de
normalidad, porque la prueba F se ve muy poco afectada por la falta de normalidad,
sobre todo para el caso de efectos fijos. Usualmente las desviaciones de la normalidad
hacen que tanto el nivel de significación verdadero como la potencia difieran ligeramente
de los valores que se especifican, siendo generalmente la potencia menor. El modelo de
efectos aleatorios se ve más afectado por la no normalidad. En particular, los niveles
reales de confianza en las estimaciones por intervalo de los componentes de varianza
pueden diferir mucho de los valores especificados (MONTGOMERY, 1991, cap. 4).
Un defecto que se presenta a menudo en las gráficas de probabilidad normal, es un
residuo que es mucho menor o mayor que el resto (residuo inusitado). La presencia de
uno o más residuos inusitados puede distorsionar seriamente el análisis de varianza, por
4-29

lo que cuando se detecta uno en potencia debe realizarse una cuidadosa investigación
(MONTGOMERY, 1991, cap. 4).
Un procedimiento informal para detectar residuos distanciados es analizar residuos
estandarizados (MONTGOMERY, 1991, cap. 4):
εij
d ij =
CM Error

Si los εij son N(0, σ2), los residuos estandarizados deben ser aproximadamente normales
con media cero y varianza igual a uno. Por lo tanto, es aplicable la regla empírica general
a los residuos estandarizados (ver capítulo 1). Un residuo a una distancia mayor que 3 ó
4 desviaciones estándar del origen es potencialmente un residuo distanciado ó anómalo
(MONTGOMERY, 1991, cap. 4).

99.9
99
95
Porcentaje

80
50
20
5
1
0.1
-0.45 -0.25 -0.05 0.15 0.35 0.55
Residuos

FIGURA 4.1 GRAFICA DE PROBABILIDAD NORMAL


PARA RESIDUOS

b. SUPOSICION DE HOMOGENEIDAD DE LAS VARIANZAS:


Si el modelo es correcto y las suposiciones se satisfacen los residuos no deben tener
algún patrón, ni deben estar relacionados con alguna otra variable incluyendo la
respuesta yij. Una comprobación sencilla consiste en graficar los residuos contra los
valores ajustados yˆij . En esta gráfica no debe revelarse ningún patrón obvio. En la figura

4.2 se presentan algunos posibles patrones de comportamiento de los residuos cuando se


grafican en función de los valores predichos yˆij . El último caso (gráfica 4.2, c) es el que

se presenta cuando la suposición de varianza constante en los grupos de tratamiento se


cumple.
4-30

Algunas veces la varianza de las observaciones aumenta a medida que la magnitud de los
residuos lo hace. Esto resulta cuando el residuo es proporcional a la magnitud de la
observación, en este caso la gráfica de comportamiento de los residuos contra los valores
predichos ( yˆij ) parecerá un embudo que se ensancha. La varianza variable de los

residuos también ocurre en casos cuyos datos no tienen una distribución normal y están
sesgados (MONTGOMERY, 1991, cap. 4).
Si la suposición de homogeneidad no se cumple, la prueba F es solo ligeramente afectada
en los modelos balanceados de efectos fijos. Sin embargo, el problema es serio en el caso
desbalanceado y en el de efectos aleatorios (MONTGOMERY, 1991, cap. 4).
El enfoque usual para tratar varianzas variables de los residuos consiste en aplicar una
transformación para igualar varianzas y volver aplicar el análisis de varianza a los datos
trasformados (MONTGOMERY, 1991, cap. 4).

εij εij

yˆij yˆij
(a) (b)
εij

yˆij
(c)
FIGURA 4.2 PATRONES DE COMPORTAMIENTO DE LOS RESIDUOS CONTRA LOS VALORES PREDICHOS yˆij :
CASO (a), el error no está normalmente distribuido ni la varianza es constante. CASO (b), la distribución de los residuos no
presenta varianza constante. CASO (c), representa el comportamiento cuando existe homogeneidad en la varianza de las
observaciones (de varianza constante de los residuos).
4-31

La gráfica de dispersión (spread-location) s-l, es otra gráfica residual que revela más
sobre las varianzas heterogéneas. Las tendencias en la gráfica s-l se pueden usar para
revelar las posibles relaciones entre las medias y las varianzas de los grupos en
tratamiento (KUEHL, 2001, cap. 4).

ε ij
Las raíces cuadradas de los valores absolutos de los residuales, se usan para medir
la dispersión de los residuos, ya que su magnitud reflejará la dispersión o variación dentro
de un grupo de tratamiento. La raíz cuadrada elimina parte de la asimetría en los
residuales, mientras las estimaciones de las medias de grupos de tratamientos miden la
localización. En la figura 4.3 se muestra una gráfica s-l (KUEHL, 2001, cap. 4).

ε ij
Uniendo, mediante líneas rectas, las medianas de las para cada sitio en la gráfica
muestran el incremento en su magnitud con un incremento en las medias de los sitios.
Esta tendencia del incremento en la magnitud de los valores absolutos de los residuos,
representa el aumento en la varianza del sitio cuando crece la media (KUEHL, 2001, cap.
4).

FIGURA 4.3 GRAFICO DE DISPERSION


(SPREAD-LOCATION) s-l

Aparte de las gráficas de residuos que frecuentemente se usan para diagnosticar la


igualdad en las varianzas, se han propuesto algunas pruebas estadísticas formales de
homogeneidad de las varianzas para diseños completamente aleatorizados, entre las
cuales se encuentran: la prueba de Bartlett, la prueba de Levene y la prueba F máx.
4-32

En general, las hipótesis nula y alternativa para todas las pruebas son:

Ho: σ12 = σ 22 = σ 23 = ... = σ 2k

H1: lo anterior no es cierto al menos para una σ j


2

Una técnica ampliamente usada es la prueba de Bartlett. Este procedimiento consiste en


calcular un estadístico cuya distribución muestral es, aproximadamente, chi- cuadrado
con k-1 grados de libertad cuando las k muestras aleatorias provienen de poblaciones
normales independientes. La estadística de prueba es (MONTGOMERY, 1991, cap. 4):
q
χ 2o = 2.3026
c
Donde:
k
q = (N − k ) log 10 S P 2 − ∑ (ni − 1) log 10 S i 2
i =1

1  k 
c =1+  ∑ (ni − 1)−1 − (N − k )−1 
3(k − 1)  i =1 
k

∑ (n i − 1) S i 2
S2P = i =1

N −k
y S i 2 es la varianza muestral de la i-ésima población.

El valor de q es grande cuando hay una gran diferencia entre las varianzas muestrales
S i 2 y es igual a cero si todas las S i 2 son iguales. Por tanto, debe rechazarse Ho para

valores grandes de χo2 . En otras palabras, se rechaza Ho, sólo si, χo2 > χ α ,k −1 , en donde
2

χ 2α ,k −1 es el punto α porcentual de la distribución chi-cuadrado con k-1 grados de

libertad. Varios estudios indican que la prueba de Bartlett es muy sensible a la suposición
de normalidad y no debe ser aplicada cuando exista alguna duda en cuanto a esta
suposición (MONTGOMERY, 1991, cap. 4).
Una prueba menos sensible a las suposiciones de normalidad, es la prueba de
Levene(1960). Sea y ij la j-ésima observación del -i ésimo grupo de tratamiento y y~i su

mediana. Sea zij = | y ij - y~i | el valor absoluto de la diferencia entre una observación y la

mediana del grupo de tratamiento i. Para probar la homogeneidad de varianzas, se


calcula el análisis de varianza en un sentido para zij y a partir del estadístico (KUEHL,
2001, cap. 4):
4-33

CM Tratamientos ∑n (z i i − z ) 2 /( k − 1)
Fo = = k
i =1
ni

∑∑ ( z
CM Error
ij − z i ) 2 /( N − k )
i =1 j =1

Se rechaza H o si Fo > Fα,(k-1),(N -k).

Otra prueba sencilla válida cuando los tamaños de las muestras son iguales y las
observaciones tienen una distribución normal, es la prueba F máx (Hartley, 1950). El
estadístico de la prueba es el siguiente (KUEHL, 2001, cap. 4):

máx ( s i2 )
F o Máx =
min( s i2 )

Donde máx ( s i2 ) y min( s i2 ) son las varianzas mayor y menor respectivas dentro de

los grupos de tratamiento. La hipótesis nula se rechaza al nivel de significación α si Fo


Máx, es el valor de la variable F Máx excedida, con una probabilidad α para k grupos

de tratamientos y (k – 1) grados de libertad para cada s i2 . Los valores críticos del

estadístico F Máx se encuentran en la tabla del anexo E4.

c. SUPOSICION DE INDEPENDENCIA DE LOS RESIDUOS:


Además, también es im portante graficar los residuos contra el orden del tiempo en que
se recopilaron los datos ya que ello permitirá detectar cuando la suposición de
independencia de los residuos se ha violado; pudiendo haber sido originado por las
siguientes razones: Los tratamientos no han sido correctamente distribuidos (en forma
completamente aleatoria), cambios en los instrumentos de medición conforme el tiempo
transcurre, etc. Una tendencia a tener rachas con residuos positivos y negativos indica
una correlación positiva de los residuos. Potencialmente este es un problema serio y difícil
de corregir, por ello es importante prevenir el problema durante la recolección de los
datos. Un paso importante para asegurar la independencia es un procedimiento
apropiado de aleatorización (MONTGOMERY, 1991, cap. 4).
La figura 4.4, presenta un ejemplo de gráfico de residuos contra la secuencia en el
tiempo.
4-34

εij
εij

(t) (t)
(a) (b)

FIGURA 4.4 GRAFICO DE RESIDUOS CONTRA SECUENCIA EN TIEMPO


CASO (a) no se cumple la suposición de independencia de los residuos; CASO (b) si se cumple el
Principio de independencia

4.3 DISEÑOS EXPERIMENTALES EN BLOQUES COMPLETOS AL AZAR

Cuando las unidades experimentales no son homogéneas, la variación entre las unidades
puede encubrir los verdaderos efectos de los tratamientos sobre una respuesta, evitando
tener comparaciones precisas entre los mismos. Factores como soluciones patrón de distinta
concentración, muestras de orígenes diferentes, lotes distintos de reactivos o material
fabricado, etc., son ejemplos de variables externas al tratamiento que marcan la diferencia
entre las unidades experimentales, aumentando por tanto, la variación entre las
observaciones de la variable respuesta.
El bloquear estratifica a las unidades experimentales en grupos homogéneos, o unidades
parecidas. Una buena elección de los criterios de bloqueo es un medio para reducir y
controlar la varianza del error experimental con el fin de lograr una mayor precisión. Algunos
criterios de bloqueo son: 1) proximidad (reactivos de un mismo lote); 2) características físicas
(soluciones de distintas concentraciones); 3) tiempo; 4) administración de la tarea del
experimento (KUEHL, 2001, cap. 8).
El diseño de bloques al azar es uno de los primeros válidos para estimar el error experimental
y para probar si los efectos de los tratamientos son significativos a pesar de la
heterogeneidad de las unidades experimentales sobre las que se hacen las observaciones.
4-35

Un bloque es simplemente una porción de material experimental que se espera que sea más
homogéneo que el total o por lo menos más homogéneo que el material primitivo no
clasificado (KENETT y ZACKS, 2000, cap. 12).
Los bloques completos al azar comprenden el mismo número de unidades experimentales.
Cada tratamiento se ensaya el mismo número de veces sobre otras tantas unidades
experimentales. El objetivo consiste en mantener la variabilidad entre unidades
experimentales dentro de un bloque tan pequeña como sea posible y maximizar la diferencia
entre bloques.
El diseño se recomienda en experimentos donde la variación debida a la heterogeneidad en
las unidades experimentales es tan grande que se puede reducir formando bloques. En
general, las condiciones bajo las cuales se hará uso del diseño de bloques completos al azar
son las siguientes (COCHRAN y COX, 1965, cap. 4):

i) Cuando las unidades experimentales no sean homogéneas; es decir que no


puedan reaccionar o responder a los tratamientos de la misma manera o con la
misma capacidad debido a sus diferencias y ello no significa necesariamente que
no tengan el mismo aspecto.

ii) Cuando el investigador tenga suficientes elementos que le garanticen la


heterogeneidad en las unidades experimentales.

iii) Cuando se tenga un solo criterio de formación de bloques.

iv) Donde es poco probable que las unidades experimentales se destruyan o no


respondan a un tratamiento determinado.

Entre las ventajas del empleo de este tipo de diseño se encuentran (COCHRAN y COX, 1965,
cap. 4):

1) En el caso de que se presente heterogeneidad en las unidades experimentales, por


medio de la agrupación se reduce el error aleatorio.
4-36

2) Puede incluirse cualquier número de tratamientos y repeticiones. En el diseño de


bloques completos al azar, cada tratamiento tendrá el mismo número de repeticiones.

3) Si por un accidente se hace necesario la omisión de un bloque completo o de todos


los datos de uno o más tratamientos, el análisis no presenta ninguna dificultad.

4) Si la varianza del error experimental es mayor para algunos tratamientos que para
otros aún puede obtenerse un error insesgado para probar cualquier combinación
específica de las medias de los tratamientos.

5) Las medias de las repeticiones dan comparaciones insesgadas de las diferencias entre
las repeticiones.

Las limitaciones principales en la aplicación de este tipo de diseño son las siguientes
(COCHRAN y COX, 1965, cap. 4):

1) Se pierden grados de libertad para la suma de los cuadrados del error.

2) Cuando faltan datos de algunas unidades separadas, el análisis requiere de un


cálculo adicional.

4.3.1 ALEATORIZACION EN DISEÑOS POR BLOQUES AL AZAR

El muestreo y la distribución de las unidades experimentales en el diseño de bloques está


constituido por dos etapas. La primera consiste en reunir entre sí las unidades parecidas para
formar un grupo homogéneo; el grupo así formado recibe el nombre de bloque.
La segunda etapa consiste en asignar los diferentes tratamientos a las unidades
experimentales, sorteando los tratamientos independientemente en cada bloque de la misma
manera en que se realizó para el diseño completamente aleatorio. Esta clase de diseño se
caracteriza porque cada tratamiento aparece representado una vez en cada uno de los
bloques.
Debido a que los tratamientos se asignan aleatoriamente a las unidades experimentales
dentro de cada bloque, pero que los bloques se forman decididamente en forma no aleatoria,
4-37

en el diseño de bloques completos al azar no se deberá efectuar una prueba estadística del
efecto de bloques (ANDERSON y MC LEAN, 1974).

4.3.2 ANÁLISIS DE DATOS EN EL DISEÑO DE BLOQUES AL AZAR

Supóngase que se tienen k tratamientos asignados a b bloques, se realiza una observación


por tratamiento en cada bloque, y los tratamientos se asignan aleatoria - mente a los bloques.
El modelo lineal para un experimento en diseño por bloques al azar requiere un término que
represente la variación identificable en las observaciones como consecuencia de los bloques.
La respuesta de la unidad con el -i ésimo tratamiento en el j-ésimo bloque se escribe como
(MONTGOMERY, 1991, cap. 5):
y ij = µ + τ i + β j + ε ij

i = 1, 2, …, k j = 1, 2, …., b (ec. 4.16)

Donde µ es una media general, τi es el efecto del i-ésimo tratamiento, βj es el efecto del j-

ésimo bloque y ε ij es el error aleatorio. Según el modelo los efectos del tratamiento y el

bloque son aditivos, sin existir interacción; también se supone que los errores experimentales
son independientes, con media cero y varianza común σ2. La suposición de independencia se
justifica a través de la asignación aleatoria de los tratamientos a las unidades experimentales.
En la tabla 4.4 se muestra la plantilla de recolección de datos para un diseño completo de
bloques al azar.

TABLA 4.4 PLANTILLA DE RECOLECCION DE DATOS PARA EL DISEÑO DE BLOQUES AL


AZAR

BLOQUE

TRATAMIENTO
1 2 .…. b Suma Medias de
tratamiento
1 y11 y12 … y1b Yk1 yk1
2 y21 y22 … y2b Yk2 yk2
. . . . . .
. . . . . .
k yk1 yk2 … ykb Ykk y kk
Sumas de bloque Yb1 Yb2 … Ybb Y

Medias de bloque y b1 y b2 … y bb y
4-38

En donde:
Yki : Suma de las observaciones para el i-ésimo tratamiento.
Ybj : Suma de las observaciones en el j-ésimo bloque.
Y : Suma de todas las bk observaciones.
y ki : Media de las observaciones para el i-ésimo tratamiento.

y bj : Media de las observaciones en el j-ésimo bloque.

y : Media de todas las bk observaciones.

N : Número total de observaciones(N = bk)

La desviación de cualquier observación con respecto a la gran media en la tabla 4.4, se


puede escribir como la identidad algebraica (KUEHL, 2001, cap. 8):

yij − y = ( yi • − y ) + ( y• j − y ) + ( yij − y i• − y• j + y ) (ec. 4.17)

Los términos del lado derecho de la ecuación 4.17 son:


• Una desviación de tratamiento: ( y i• − y )

• Una desviación de bloque: ( y • j − y )

• Error experimental: ( y ij − y i• − y • j + y )

El contraste de hipótesis en el diseño por bloques al azar es el mismo que para el caso del
diseño unifactorial, es decir (Montgomery, 1991, cap.5):

Ho: τ i = 0 para i = 1, 2,…., k


y
H1: τ i ≠ 0 cuando menos para un valor de i

El reordenamiento de los términos de la ecuación 4.17, forma una identidad algebraica para
la desviación de las observaciones de la media del tratamiento (KUEHL, 2001, cap. 8):

y ij − yi • = ( y• j − y ) + ( yij − y i• − y• j + y ) (ec. 4.18)


4-39

Como puede observarse de la ecuación 4.18, se hace una partición de la desviación estándar
del error experimental del diseño totalmente aleatorizado, y ij − y i• , en dos componentes, el

primer término se identifica con el criterio de bloques como ( y • j − y ) , el segundo término

se identifica sólo como un residual o error experimental, ( y ij − y i• − y • j + y ) .

Elevando al cuadrado y sumando ambos términos de la ecuación 4.17, se tiene (KUEHL,


2001, cap. 8):
k b k n k n
∑∑ ( yij − y )2 = n∑ ( y i• − y ) 2 + k ∑ ( y • j − y ) 2 + ∑∑ ( y ij − y i• − y• j + y )2
i =1 j =1 i =1 j =1 i =1 j =1

(ec. 4.19)
La que se puede expresar simbólicamente como:

SCTotal =SCTratamientos + SCBloques + SCError (ec. 4.20)

La suma de cualquier producto cruzado en el lado derecho es cero (lo que evidencia que se
asume que no existe efecto de interacción entre el factor y el factor de bloque).
Como se tienen N observaciones, la suma de cuadrados total( SCTotal) tiene N - 1 grados de
libertad. Las sumas de cuadrados de los tratamientos (SCTratamientos) y de los bloques
(SCBloques), tienen (k - 1) y (b - 1) grados de libertad respectivamente.
Los grados de libertad asociados con la suma de cuadrados del error (SCError ) se obtienen por
sustracción, esto es:

g.l.(SCTotal ) = g.l.( SCTratamientos) + g.l.( SCBloques ) + g.l.( SCError )


kb - 1 = (k - 1) + (b - 1) + g.l.( SCError )
g.l.( SCError ) = kb - 1 - (k - 1) - (b - 1)
g.l.( SCError ) = kb - k - b + 1
g.l.( SCError ) = k(b -1) - (b - 1)
g.l.( SCError ) = (k -1)(b -1)

Por lo que, los grados de libertad de la suma de cuadrados del error son (k - 1)(b - 1).
Los valores esperados de las sumas de cuadrados para los tratamientos, bloques y el error
aleatorio, están dados por (MONTGOMERY, 1991, cap. 5):
4-40

k
b ∑τi2
i =1
E ( SCTratamientos ) = σ 2 +
k −1
b
k ∑ βi2
j=1
E ( SCBloques) = σ 2 +
b −1
E ( SCError ) = σ 2

Suponiendo que los errores se distribuyen normalmente, entonces las cantidades


σ2 SCBloques/σ
SCTratamientos/σ σ2 y SCError /σ2, son variables aleatorias independientes con
distribución chi-cuadrado. Por otra parte, cada suma de cuadrados dividida por sus
respectivos grados de libertad es igual a una media de cuadrados. Si no hay efecto de los
tratamientos o de los bloques los cuadrados medios asociados constituyen ambos
estimadores insesgados de σ2. Por otra parte, la media de cuadrados del error, constituye un
estimador insesgado de σ2 sin importar que la hipótesis nula sea verdadera o falsa
(MONTGOMERY, 1991, cap. 5).
Para probar la hipótesis nula de que los efectos de los tratamientos son todos iguales a cero,
se calcula la relación (MONTGOMERY, 1991, cap. 5):

CM Tratamientos
Fo =
CM Error

La cual es un valor de una variable aleatoria que tiene una distribución F con k-1 y (k-1)(b-1)
grados de libertad cuando la hipótesis nula es verdadera. La hipótesis nula se rechaza con un
nivel de significación α cuando (MONTGOMERY, 1991, cap. 5):

Fo > Fα, (k-1),(k-1)(b-1)

La tabla 4.5, resume la partición de la suma de cuadrados. Este procedimiento constituye el


análisis de varianza en el diseño de bloques al azar.
4-41

TABLA 4.5 ANÁLISIS DE VARIANZA PARA EL DISEÑO DE BLOQUES AL AZAR


Fuente de g.l. Suma de Cuadrados Estadístico(Fp)
Variación Cuadrados (SC) medios(CM)
Tratamiento k-1 SCTratamientos SCTratamientos /k-1 CMTratamientos
Fo =
CM Error
Bloque b-1 SCBloques SCBloques/b-1

Error (k-1)(b-1) SCError SCError /(k-1)(b-1)


Total N-1 SCTotal

Se debe recordar que la aleatorización fue aplicada solo a los tratamientos dentro de los
bloques, y que la prueba F del análisis de varianza solamente se puede justificar con base en
la aleatorización sin necesidad de usar la suposición de normalidad; es por esa razón que
dicha prueba se excluye del análisis de varianza.
La razón entre CMBloques/CMError puede ser un procedimiento aproximado para investigar el
efecto de la variable bloque. Un valor grande de esa razón, implica que el factor bloque tiene
un efecto grande y que la reducción del error obtenido al analizar por bloques probablemente
fue útil al mejorar la precisión de las comparaciones de las medias de los tratamientos.
Existen ecuaciones más sencillas para el cálculo de la suma de cuadrados que son:
k b 2
SCTotal = ∑ ∑ y ij − Y
2

i=1 j=1 bk

k 2
y i• Y 2
SCTratamientos = ∑ -
i=1 b bk

y• j 2 Y 2
b
SCBloques = ∑ -
j=1 k bk

SCError = SCTotal - SCTratamientos - SCBloques

Hasta el momento se han descrito procedimientos de prueba, considerando que los


tratamientos y los bloques son factores fijos. Sin embargo, el mismo procedimiento de
análisis puede usarse si tanto los tratamientos como los bloques (o ambos) son aleatorios.
Por supuesto que hay cambios correspondientes en la interpretación de los resultados. Los
lotes de material fabricado (como tela, asfalto o producto químico) usados como bloques de
tratamientos experimentales son lotes aleatorios, el lote se divide en unidades experimentales
más pequeñas a las que se administra el tratamiento (MONTGOMERY, 1991, cap. 5).
4-42

Por ejemplo, si los bloques son aleatorios, se espera que las comparaciones entre los
tratamientos sean las mismas en toda la población de bloques de la que se eligieron
aleatoriamente los que se usaron en el experimento. También existen cambios que
corresponden a la esperanza de la media de cuadrados. Por ejemplo, si los bloques son
aleatorios, E ( CM Bloques ) = σ + kσBloqies en donde σBloqies es la componente de varianza
2 2 2

del efecto de bloques. La varianza de una media de tratamiento con bloques aleatorios
incluye la componente de la varianza para los bloques, σBloqies , y será mayor que la varianza
2

con efectos de bloques fijos (MONTGOMERY, 1991, cap. 5).


En cualquier caso, E(CMTratamientos) siempre es independiente del efecto de los bloques y el
estadístico de prueba para la variabilidad entre los tratamientos siempre es: Fo =
CMTratamientos/CMError (MONTGOMERY, 1991, cap. 5).
Si existe la interacción entre los tratamientos y los bloques, la prueba para las medias de los
tratamientos no se ve afectada en el caso de que los bloques sean aleatorios. La razón de
ello es que tanto el valor esperado de la media de cuadrados de tratamiento como la del
error contienen el efecto de interacción. En consecuencia, la prueba para la diferencia en el
nivel medio de los tratamientos se realiza en la forma usual comparando la media de
cuadrados de tratamiento con la media de cuadrados del error. Esta prueba no produce
información sobre la interacción (MONTGOMERY, 1991, cap. 5).

4.3.3 CALCULO DEL TAMAÑO DE LA MUESTRA

La elección adecuada del número de bloques, es una decisión importante cuando se trabaja
con un diseño de bloques completos al azar. Al aumentar el número de bloques, aumenta el
número de réplicas por tratamiento, ya que cada tratamiento aparece representado en cada
uno de los bloques. En otras palabras a mayor número de bloques, pruebas más confiables3.
Por otro lado, al aumentar el número de bloques los costos aumentan, el investigador corre el
riesgo de perder control sobre el experimento, etc. Por lo que hay necesidad de tomar el
número de bloques óptimo que garanticen una probabilidad mínima (1-ß) de no equivocarse
al rechazar la hipótesis nula siendo ésta falsa. Dicha prueba, como se vio en la sección

3
bajo el supuesto que el investigador tiene los recursos necesarios para controlar grandes
cantidades de datos.
4-43

anterior se basa en los cuadrados medios de los tratamientos y el error (MONTGOMERY,


1991, cap. 5).
Matemáticamente la potencia de la prueba 1-ß viene dada por:

CM Tratamientos
1-β=P[ > Fα,(k-1),(k-1)(b-1) cuando H1 es verdadera ]
CM Error

CM Tratamientos k
=P[
CM Error
> Fα,(k-1),(k-1)(b-1) cuando ∑τ i ≠ 0]
i =1

Cualquiera de las técnicas presentadas en la sección 4.2.3, para la selección del número de
réplicas pueden aplicarse a un diseño aleatorizado por bloques (MONTGOMERY, 1991, cap.
5).
Las expresiones para λ2 y Φ 2 así como los grados libertad para el diseño de bloques
aleatorizados se presentan en la tabla 4.6.

TABLA 4.6 VALORES DE λ2 Y Φ2 PARA EL DISEÑO DE BLOQUES AL AZAR

Diseño de Bloques
ν1 ν2 λ2 Φ2

k-1 (k-1)(b-1) k k
b ∑τ ∑τ
2
i b i
2

i= 1 i= 1

σ2 kσ 2

En caso que sea difícil encontrar τi para calcular Φ 2, puede obtenerse en función de la
diferencia mínima entre dos medias de bloque que se desea determinar (D). De esta forma
(MONTGOMERY, 1991, cap. 5):
bD2
Φ =
2

2k σ2
La potencia de la prueba puede incrementarse utilizando un tamaño de bloque b más
grande. Para el diseño en bloques se desea determinar un valor de b con el cual se
satisfagan los requerimientos de potencia.
El objetivo de encontrar el número de bloques es para asegurar que el número de éstos den
una prueba satisfactoria, con una probabilidad 1-ß de rechazar Ho siendo H o falsa.
4-44

Cuando el factor es aleatorio, λ viene dado por (MONTGOMERY, 1991, cap. 5):

bσ 2τ
λ = 1+
σ2
en donde k-1 son los grados de libertad del numerador y (k-1)(b-1), los grados de libertad
del denominador.

4.3.4 ESTIMACION Y COMPARACION DE PARAMETROS EN EL MODELO DE


BLOQUES AL AZAR DE EFECTOS FIJOS

Si tanto los tratamientos como los bloques son fijos, los parámetros del modelo de diseño
aleatorio por bloques completos pueden estimarse mediante mínimos cuadrados.
Dado que los efectos de tratamientos y de bloques se consideran como desviaciones de la
media general, se imponen las restricciones (MONTGOMERY, 1991, cap. 5)::
k k

∑ τi = 0 y ∑β i =0
i =1 i =1

Por lo tanto las ecuaciones normales se reducen a (MONTGOMERY, 1991, cap. 5):
kbµˆ = Y

ˆ + bτˆi = y i• i = 1,2,..., k
kµˆ + kβˆ j = y • j j = 1,2,..., b

Cuyas soluciones son (MONTGOMERY, 1991, cap. 5):


µˆ=y
τˆ i = y i• − y
βˆ j = y• j − y

Al sustituir la solución de las ecuaciones normales en las ecuaciones anteriores se encuentra


que los valores estimados o ajustados de y ij, son:

yˆ ij = µˆ + τˆi + βˆ i
yˆ ij = yi• + y • j − y

Si los tratamientos en un diseño aleatorizado por bloques son fijos, y el análisis indica una
diferencia significativa entre las medias de tratamiento, sería interesante llevar a cabo
comparaciones múltiples, para determinar qué medias de tratamiento son diferentes.
Cualquiera de los métodos de comparación planteados en la sección 4.2.2.4, puede usarse
4-45

con este propósito. Simplemente, hay que reemplazar el número de réplicas del diseño
unifactorial completamente aleatorizado (n), por el número de bloques (b) en las fórmulas,
por otra parte, también deben usarse como grados de libertad del error, los correspondientes
al diseño por bloques al azar: (k-1)(b-1) (MONTGOMERY, 1991, cap. 5).

4.3.5 ANALISIS DE RESIDUOS PARA EL DISEÑO POR BLOQUES AL AZAR

Las suposiciones relativas a los errores experimentales del modelo lineal para el diseño de
bloques completos al azar se pueden evaluar con un análisis de residuos, como el presentado
en la sección 4.2.4. Se calculan los residuos a partir de la componente de la desviación del
error experimental mostrada en la ecuación 4.17, como:
εij = yij − y i• − y• j + y

4.3.6 DISEÑO POR BLOQUES INCOMPLETOS

Es posible que en algunos experimentos en los que se usan diseños aleatorizados por
bloques no puedan realizarse los ensayos de todas las combinaciones de tratamiento
dentro de cada bloque. Situaciones como esta ocurren debido a la escasez en los recursos
del experimento, por el tamaño físico de los bloques. En estos casos es posible usar
diseños aleatorizados por bloques en los que cada tratamiento no está presente en cada
bloque. Estos diseños se conocen como diseños aleatorizados por bloques
incompletos (MONTGOMERY, 1991, cap. 6).
Cuando las comparaciones entre todos los tratamientos tienen la misma importancia, estas
deben elegirse de manera que ocurran en forma balanceada en cada bloque. Esto significa
que cada par de tratamientos ocurren juntos el mismo número de veces que cualquier otro
par. Por lo tanto, un diseño balanceado (o equilibrado) por bloques incompletos es un
diseño en el que cualquier par de tratamientos ocurren juntos el mismo número de veces
(MONTGOMERY, 1991, cap. 6).
Los diseños de bloques incompletos balanceados son los que asignan k tratamientos a b
bloques de tamaño r, r ( k, como sigue (KENETT y ZACKS, 2000, cap. 12):

I. Cada tratamiento sólo se asigna una vez a cualquier bloque.


4-46

II. Cada tratamiento aparece en t bloques; t es la cantidad de réplicas.


III. Cado par de dos tratamientos distintos aparece en a bloques.
IV. El orden de tratamientos dentro de cada bloque está aleatorizado.
V. El orden de los bloques está aleatorizado.

De acuerdo con estos requisitos, hay en total N = kt = br ensayos. Además se


debe cumplir la siguiente igualdad: a(k – 1) = t(r-1). La cuestión es como diseñar
bloques balanceados para determinados k yr. Se puede obtener un diseño de estos
k 
haciendo una lista combinatoria completa de las   selecciones sin reposición, de
r 
r letras tomadas de k letras. En este caso la cantidad de bloques es (KENETT y
ZACKS, 2000, cap. 12):
k 
b =  
r 
La cantidad de réplicas es (KENETT y ZACKS, 2000, cap. 12):

 k − 1  k − 2
t =   y a =  
 r − 1 r − 2

La cantidad total de ensayos es (KENETT y ZACKS, 2000, cap. 12):

 k − 1 k! k 
N = kt = k   = = r   = rb
 r − 1  ( r − 1)! ( k − r )! r 

Estos diseños de bloques incompletos balanceados se llaman diseños combinatorios. Sin


embargo, pueden ser demasiado grandes; con frecuencia es posible obtener el balance
k 
con menos de   bloques. No existe un método único para construir todas la s clases de
r 
diseños de bloques incompletos pero existen métodos para construir algunos. La
construcción de estos diseños ha sido tema de diversas investigaciones matemáticas que
han arrojado un vasto arreglo de bloques balanceados y parcialmente balanceados. Al final
4-47

del tema se proporcionan algunos planes para pocos tratamientos (KENETT y ZACKS,
2000, cap. 12).
Una vez construido el diseño básico con los números de código de los tratamientos, los
pasos para aleatorizar son los siguientes (KENETT y ZACKS, 2000, cap. 12):

Paso 1. Aleatorizar el arreglo de los bloques conformados por grupos de los


números código asignados a los tratamientos.
Paso 2. Aleatorizar el arreglo de los números de tratamiento dentro de cada
bloque.
Paso 3. Aleatorizar la asignación de los tratamientos a los números de código en
el plan.

El modelo estadístico lineal para un diseño de bloques incompleto balanceado es


(MONTGOMERY, 1991, cap. 6):
yij = µ + τi + β j + εij

i = 1, 2, …, k j = 1, 2, …., b (ec. 4.16)

Donde µ es una media general, τi es el efecto del i-ésimo tratamiento, βj es el efecto del j-

ésimo bloque y ε ij son los errores aleatorios independientes, con media cero y varianza

común σ2.
Los efectos de tratamientos y bloques no son ortogonales en los diseños de bloques
incompletos porque no aparecen todos los tratamientos en cada bloque; por lo tanto no sería
correcto para el diseño incompleto calcular la partición de la suma de cuadrados para los
tratamientos igual que para el diseño de bloques completos, tampoco las medias de
tratamiento proporcionan estimaciones insesgadas de µi. Los parámetros estimados y las
sumas de cuadrados de los tratamientos para los diseños de bloque incompleto balanceados
se calculan con fórmulas relativamente directas.
Supóngase que Tj es el conjunto de los índices de bloques que contienen el i-ésimo
tratamiento. Los estimados de los efectos del tratamiento, por mínimos cuadrados, se
obtienen como sigue (MONTGOMERY, 1991, cap. 6):
4-48

Supóngase que W i = ∑y ij es la suma de todos los valores de y pertenecientes al i-ésimo


i ∈T j


b
tratamiento. Y que W i * = j =1
n ij y bj es la suma de valores en todos los t bloques que

contienen al i-ésimo tratamiento, con nij = 1 si el tratamiento i ocurre en el bloque j, y nij = 0


en otro caso. Se calcula (MONTGOMERY, 1991, cap. 6)

Q i = W i − ( 1 / r )W i * i = 1, 2,…, k

El estimador de τi por mínimos cuadrados es


rQi
ˆτ i = i = 1, 2,…, k
ka
Observe que
k

∑Q i =0
i =1

k b
por consiguiente, ∑ˆτi = 0 , sea y = 1 / N ∑ ∑y il (Bj conjunto de tratamientos en el j-
i =1 j =1 l ∈B j

ésimo bloque). El promedio ajustado del tratamiento se define como: y *i = y +ˆτ i , i =

1,…, k. El análisis de varianza para un diseño de bloques incompleto balanceados se


presenta en la tabla 4.7.

TABLA 4.7 ANALISIS DE VARIANZA PARA EL DISEÑO DE BLOQUES INCOMPLETOS


Fuente de g.l. Suma de Cuadrados Estadístico(Fp)
Variación Cuadrados (SC) medios(CM)
Tratamiento k-1 r ∑ Qi 2 SCTratamientos /k-1
Fo =
CMTratamientos
ak CM Error
Bloque b-1 SCBloques/b-1
y bj2 Y2
∑ r

N

Error N – k – b +1 SCError= SCTotal – SCError /N-k-b+1


SCBloques(no ajustada)-
SCTratamientos(ajustada)
Total N -1 Y2
∑∑ y 2
ij −
N
4-49

4.4 DISEÑO EN CUADRADOS LATINOS

Cuando las unidades experimentales se agrupan en bloques homogéneos en dos


direcciones, formando un arreglo de filas y columnas, con la particularidad de que cada fila
o columna constituye una repetición completa de los tratamientos, se genera un diseño
experimental que se conoce con el nombre de cuadrado latino. Si las unidades difieren con
respecto a una característica los bloques se basan únicamente en ella; cuando las
unidades difieren en cuanto a dos características, se supone básicamente que tanto una
como la otra actúan independientemente y aditivamente entre sí, con esta suposición se
pueden formar los bloques de acuerdo con una característica y después de acuerdo a la
otra. Es decir la columna son los bloques que se basan en la primera característica y las
filas son bloques que se basan en la segunda. Tanto las filas como las columnas satisfacen
la condición de un bloque con relación a una característica cada vez.
Como se puede observar el diseño de cuadrados latinos es una ampliación lógica del
diseño de bloques completamente aleatorizados, en él se impone la misma restricción para
los bloques, más otra restricción igual para las columnas. En el cuadrado latino, cada
tratamiento debe aparecer una vez en cada fila y columna; aquí se requiere que el número
de filas y columnas sea igual al número de tratamientos (diseño restrictivo) (KUEHL, 2001,
cap.8).
El diseño de cuadrados latinos se usa con más frecuencia en experimentos agrícolas e
industriales; y en general, cuando se dispone de unidades experimentales cuya
variabilidad ocurre en dos sentidos. La particularidad del diseño, de construir bloques
completos en sentido de filas y columnas permite absorber en ambos sentidos la
variabilidad de las unidades experimentales. La utilidad de este diseño se limita a
proyectos de experimentos que comprenden unos pocos tratamientos, tal vez hasta un
número no mayor que diez (JURAN y GRYNA, 1997, cap. 26).
Este diseño permite controla r la variabilidad de las unidades experimentales en dos
direcciones (a través del doble bloqueo).
El diseño de cuadrados latinos se aplica bajo las siguientes condiciones (COCHRAN, 1965,
cap. 4):
i) Cuando las unidades experimentales no sean homogéneas; es decir que no puedan
reaccionar o responder a los tratamientos de la misma manera o con la misma capacidad
debido a sus diferencias.
4-50

ii) Cuando el investigador tenga suficientes elementos que le garanticen la heterogeneidad


en las unidades experimentales en dos direcciones.

iii) Cuando sea posible formar bloques según dos características.


iv) Donde es poco probable que las unidades experimentales se destruyan o no respondan
a un tratamiento determinado.

Entre las ventajas del empleo del diseño cuadrado latino se encuentran (COCHRAN, 1965,
cap. 4):

• Disminuyen los efectos de dos fuentes de variación en las unidades


experimentales; ya que el efecto de filas y columnas no está incluido en el error.
• Reduce el número de combinaciones de tratamiento.
• El anális is de varianza no es complicado.

Entre las limitaciones de la aplicación del diseño cuadrado latino (COCHRAN, 1965, cap.
4):
• Como el número de tratamientos depende del número de filas y columnas esto le
quita flexibilidad al diseño para su uso.
• Se cuenta con menos grados de libertad para el error experimental que con los
diseños anteriores.
• El número de unidades experimentales requeridas para establecer un experimento,
se incrementa notablemente a medida que aumenta el número de tratamientos en
ensayo.

4.4.1 DISTRIBUCION ALEATORIA DE TRATAMIENTOS EN DISEÑOS


CUADRADOS LATINOS

Para una mejor comprensión, la distribución en el diseño de cuadrados latinos se explicará


mediante un ejemplo. Supóngase que se desean probar cuatro tratamientos (A, B, C, D).
Se deberá hacer cuatro réplicas de cada tratamiento. De acuerdo con el principio básico de
los bloques al azar, los tratamientos deberán asignarse al azar a las cuatro unidades de un
bloque.
4-51

Puesto que cada fila es un bloque, cada fila de cuatro unidades deberá tener A, B, C, D en
un orden cualquiera.
Asimismo, puesto que cada columna es un bloque, deberá tener A, B, C, D en un orden
cualquiera. Se debe comprobar detenidamente que en cada fila y en cada columna
aparecen A, B, C, D sin duplicación.
Un ejemplo de la distribución de unidades para el diseño cuadrado latino seleccionado
podría ser:
COLUMNAS
FILAS 1 2 3 4
1 A B C D
2 D A B C
3 C D A B
4 B C D A

En general, la aleatorización en un cuadrado latino de tamaño t x t se logra con los


siguientes pasos (KUEHL, 2001, cap. 8):

Paso 1. Seleccionar al azar uno de los cuadrados estándar


Paso 2. Ordenar al azar todos menos el primer renglón
Paso 3. Ordenar al azar todas las columnas
Paso 4. Asignar al azar los tratamientos con letras

En la tabla 4.8, se presentan distribuciones sugeridas de cuadrados latinos de diversos


tamaños.

TABLA 4.8 CUADRADOS LATINOS SELECCIONADOS


(JURAN y GRYNA, 1997, cap. 26)
4-52

4.4.2 ANALISIS DE LOS DISEÑOS CUADRADOS LATINOS

Como ya se mencionó el diseño de cuadrado latino se usa para eliminar dos fuentes de
variación no controlada, es decir, permite analizar sistemáticamente por bloques en dos
direcciones. En este diseño, las filas y las columnas representan las restricciones de la
aleatorización. Un cuadrado latino r x r, es un cuadrado que contiene r filas y r columnas.
El modelo estadístico lineal para este diseño es el siguiente (MONTGOMERY, 1991, cap.
5):
y mij = µ + α m + τ i + β j + ε mij

i = 1, 2, …, k j = 1, 2, …., b (ec. 4.21)


m = 1, 2, …., l
Donde:
ymij : Representa una observación en la m-ésima fila y en la j-ésima columna
correspondiente al i-ésimo tratamiento.
α m y βj : Son los efectos de la m-ésima fila y de la j-ésima columna
respectivamente.
τi : Es el efecto del i-ésimo tratamiento.
µ : Es la media principal
ε mij : El error aleatorio, independiente con media 0 y varianza σ2

Las hipótesis a probar en este tipo de diseño son las mismas que para el caso del diseño
unifactorial, es decir:
Ho: τ i = 0 para todo i = 1, 2,…., k

En forma correspondiente, la hipótesis alternativa es:


H1: τ i ≠ 0 cuando menos para un valor de i

Aquí se imponen las restricciones (KENETT y ZACKS, 2000, cap. 12):

l k b

∑ αm =
m =1
∑ τi = ∑ β j = 0
i =1 j =1
4-53

Se supone que no hay interacción entre los tratamientos y las columnas y los renglones.
La notación para totales y las medias de las observaciones para renglones y columnas


l
siguen la convención usual con Y m = j
y ij para el total de un renglón y


b
Yj = j
y ij para el total de columna. El total de tratamiento estará representado como Yi

que implica una suma de observaciones sobre las unidades experimentales que reciben el
tratamiento k. De igual forma, y ki representa la media de las observaciones en el k-ésimo

tratamiento. Se asume que y mij son valores de variables aleatorias independientes que
tienen distribuciones normales con media µmij donde µmij = µ + αm + τi + β j . Siendo la

varianza común σ2.


Las particiones de sumas de cuadrados se pueden derivar de la identidad algebraica
(KUEHL, 2001, cap. 8):

y imj − y = ( y ki − y ) + ( y bj − y ) + ( y lm − y ) + ( y imj − y ki − y bj − y lm + 2y )

(ec. 4.22)
Los términos del lado derecho de la ecuación 4.22 son:

• Una desviación de tratamiento: ( y ki − y )

• Una desviación de la columna: ( y bj − y )

• Una desviación de la fila: ( y lm − y )

• Error experimental: ( y imj − y ki − y bj − y lm + 2y )

Al elevar al cuadrado ambos lados de la ecuación 4.22 y sumar los términos se llega a la
partición aditiva de:

k l b m b k
∑ ∑∑ ( yimj − y )2 = l∑ ( y ml − y )2 + l ∑ ( ybj − y ) 2 + l∑ ( y ki − y )2 +
i =1 m=1 j=1 l =1 j=1 i =1

k b l

∑ ∑ ∑( y
i =1 j =1 m =1
imj − y ki − y bj − y ml + y ) 2
4-54

Es decir,
SCTotal =SCTratamientos + SCColumnas + SCRenglones + SCError (ec. 4.23)

Al dividir cada una de las sumas de cuadrados del lado derecho de la ecuación 4.23 por
sus correspondientes números de grados de libertad, considerando que b = k = l = r, se
obtienen cuatro estimaciones independientes de σ2 que son: el cuadrado medio de los
renglones, columnas, tratamientos y error, respectivamente, y que se denotan por:

CMRenglones=SCRenglones/r-1
CMColumnas=SCColumna s/r-1
CMTratamientos =SCTratamientos/r-1
CMError = SCError /(r-2)(r-1).

Para probar la hipótesis nula de que los efectos de los tratamientos son todos iguales a
cero, se calcula la relación (MONTGOMERY, 1991, cap. 5):
CM Tratamientos
Fo =
CM Error
La cual es un valor de una variable aleatoria que tiene una distribución F con k-1 y (r -2)(r-1)
grados de libertad cuando la hipótesis nula es verdadera. La hipótesis nula se rechaza con un
nivel de significación α cuando (MONTGOMERY, 1991, cap. 5):

Fo > Fα, (k-1),(r-2)(r-1)

El cuadrado medio del error es un estimador insesgado de σ2, sin importar si la hipótesis
nula es cierta. Si Ho es cierta, CMRenglones, CMColumnas , CMTratamientos son estimadores
insesgados de σ2 también; en caso contrario se dan las siguientes relaciones (BOX et al.,
1989, cap. 8):
r r

r ∑α 2
i
r ∑ βi2
j =1
E ( CM Re nglones ) = σ +
2 l =1
E ( CM Columnas ) = σ 2 +
r −1 r −1
r
r ∑ τ 2i
E ( CM Tratamientos ) = σ2 + i =1
E ( CM Error ) = σ 2
r −1
4-55

En la tabla 4.9, se presenta el análisis de varianza para un diseño cuadrado latino r x r.

TABLA 4.9 ANALISIS DE VARIANZA PARA EL DISEÑO CUADRADO LATINO r x r


Fuentes de Suma de Grados de Cuadrados Estadístico
variación cuadrados libertad medios Fo
Renglones SCRenglones r-1 CMRenglones
Columnas SCColumnas r-1 CMColumnas
Tratamientos SCTratamientos r-1 CMTratamientos Fo =
CMTratamient os
CM Error
Error SCError (r-1)(r-2) CMError
Total SCTotal r2-1

Para facilitar el cálculo manual de las expresiones de la tabla se presentan las alternativas
siguientes (MONTGOMERY, 1991, cap.5):
2
r r r
Y 
SCTotal = ∑∑ ∑ y
i =1 j =1 l =1
2
ijl − 
r 
r

∑y 2
ml
Y 
2

SC Re nglones = l =1
− 
r r 

∑y 2
bj
Y 
2
j =1
SC Columnas = − 
r r 
r

∑y 2
ki
Y 
2

SC Tratamientos = i =1
− 
r r 
SC Error = SC Total − SC Re nglones − SC Columnas − SC Tratamientos

4.4.3 CALCULO DEL TAMAÑO DE LA MUESTRA EN DISEÑOS CUADRADOS


LATINOS

Como en todo diseño experimental, en el cuadrado latino es necesario también calcular un


tamaño de muestra que garantice una probabilidad alta de rechazar la hipótesis nula si
ésta es falsa. La potencia de la prueba (1-ß) para el diseño cuadrado latino viene dada
como:
4-56

CM Tratamientos
1-β=P[ > Fα,(r-1),(r-1)(r-2) cuando H1 es verdadera ]
CM Error

CM Tratamientos k
=P[ > Fα,(r-1),(r-1)(r-2) cuando ∑ τi ≠ 0 ]
CM Error i =1

Siguiendo el mismo análisis del tamaño de muestra para diseños anteriores se define Φ 2
por la relación:
r
b ∑ τi 2
λ2
Φ2 = i =1
=
r
rσ2
El procedimiento para determinar el número de bloques fila o columna para garantizar una
prueba potente es similar a los estudiados anteriormente.

4.4.4 ANALISIS DE RESIDUOS PARA EVALUAR SUPOSICIONES

Los residuos se pueden usar para evaluar las suposiciones del modelo (como se describe
en la sección 4.2.4, de la ecuación 4.22, el residuo de las observaciones del i-ésimo
tratamiento en el m-ésimo renglón y la j-ésima columna es:

ε imj = y imj − y ki − y bj − y lm + 2y (ec. 4.24)

4.5 DISEÑOS FACTORIALES

El experimento con un factor se ha convertido en el modelo típico de la investigación


científica, ya que ha resultado ser muy adecuado. Sin embargo, en muchas situaciones se
requiere del estudio del efecto de más de un factor. Por ejemplo, en análisis químico, muchas
veces es de interés el estudio de cómo dos o más factores controlables en un proceso de
medición pueden influir en la cuantificación de un analito contenido en una determinada
muestra, o bien cuales son los niveles de los factores que permiten cuantificar óptimamente
la cantidad de dicho analito.
En éstos casos los diseños unifactoriales además de ser inadecuados por lo restringido, son
imprecisos en cuanto a los resultados obtenidos. En ésta sección se estudian diseños
experimentales que permiten evaluar simultáneamente el efecto de dos o más factores de
4-57

tipo cualitativo o cuantitativo sobre una respuesta, y que en general, son conocidos como
diseños factoriales.
Los diseños factoriales pueden clasificarse como: diseños factoriales completos, diseños

factoriales 2 k , diseños factoriales fraccionarios 2 k − p , diseños jerárquicos o anidados, diseños


de mezclas, experimentos factoriales con restricciones en la aleatorización, y diseños de
superficie respuesta. En el cuadro 4.1 (sección 4.1), se presentan los objetivos de la
aplicación de cada uno de estos tipos de diseños. En el esquema 4.1 se presenta la secuencia
de utilización de los diseños factoriales.

MODELAJE OPTIMIZACION
DIAGNOSTICO EMPIRICO Diseños de MODELAJE
k-p
Diseños factoriales 2 Diseños factoriales superficie TEORICO
Diseños Placket- completos respuesta Modelos
Burman Diseños 2 k Diseños de mezclas mecanicistas
Diseños anidados Diseños simplex

ESQUEMA 4.1 SECUENCIA DEL DESARROLLO DE EXPERIMENTOS FACTORIALES

Un diseño factorial, en general, es aquel proceso en el que además de investigar


independientemente el efecto producido por cada factor, sobre la respuesta, también se
estudia el efecto producido por la interacción entre dichos factores, ya que toma en cuenta
todas las posibles combinaciones de los niveles de los factores, o combinación de
tratamientos, en cada ensayo completo o réplica del experimento.
En un experimento factorial, se eligen los niveles de cada factor y se hacen las mediciones en
cada una de las posibles combinaciones de niveles de los factores, manteniendo el principio
de la aleatorización. Los factores se representan por letras mayúsculas mientras que sus
niveles con las letras minúsculas.
En el análisis de los experimentos factoriales, se habla de estimación de efectos principales y
de efectos de interacción (o simplemente interacciones). Los efectos principales de un factor
dado son siempre función de la respuesta o resultado medio de los distintos niveles de dicho
factor sobre la respuesta. Las interacciones resultan cuando en dos o más factores el efecto
de uno de ellos sobre la respuesta depende de los niveles del otro factor o factores. Las
interacciones pueden ser de primer orden, cuando se presenta el efecto combinado de dos
factores entre sí, de segundo orden cuando intervienen tres factores; de tercer orden cuando
intervienen cuatro factores y así sucesivamente.
4-58

Entre las ventajas de la aplicación de este tipo de diseño experimental se encuentran:


i. Facilitan el estudio de varios factores simultáneamente.
ii. Requieren menor número de observaciones que las necesarias, para estudiar cada
factor independientemente.
iii. Proporcionan una información más completa de cada factor en estudio, pues no sólo
se comprueban los efectos aislados de cada uno, sino también las interacciones entre
sí.
iv. Las conclusiones pueden tener mayor valor desde un punto de vista práctico, pues los
distintos niveles de cada factor se experimentan en presencia del otro factor o
factores.
v. La precisión en el análisis de varianza es mayor, ya que el cálculo estadístico es más
preciso.

Entre las limitaciones de la aplicación de este tipo de diseños se encuentran:


i. El planeamiento requiere una cuidadosa administración así como de la interpretación
de resultados.
ii. El análisis de los datos se complica cuando se incluyen muchos factores.

En las secciones 4.5 y 4.6 se presenta la descripción para la realización de los diseños
factoriales completos y 2k respectivamente. Un estudio detallado de los demás tipos de
diseños factoriales se considera fuera del alcance de este trabajo, pudiéndose estudiar con
más detalle en MONTGOMERY (1991), PRAT et al. (1999) y LAWSON et al. (1992) (ver
referencias bibliográficas).

4.5.1 EXPERIMENTOS FACTORIALES COMPLETOS

Los experimentos factoriales completos son aquellos en los que se efectúan pruebas
completas de todas las combinaciones de los diversos factores de carácter fijo o aleatorio.
El número de combinaciones de tratamiento a obtener en un diseño factorial viene dado por

el producto: (a A ) x ( bB ) x …. x (q Q ), en donde iI indica el número de niveles o

tratamientos para el factor i. Todas ellas se prueban. También el experimento factorial


completo se puede replicar ni veces para cada combinación de tratamientos. Si se tiene el
4-59

mismo número de niveles para cada factor y el mismo número de replicas para cada
k
combinación, la representación del diseño puede reducirse a P x n, en donde P indica el

número de niveles común de todos los factores, el superíndice k indica el número de factores
y n el número de replicas para cada combinación de tratamientos. El orden en el que se
efectúan las pruebas es aleatorio.
Los niveles de un factor cuantitativo toman valores métricos, mientras que los niveles de un
factor cualitativo son las categorías del factor. Por ejemplo el factor temperatura de secado
esta expresado en escala métrica (25ºC, 30ºC, etc.) y el factor material del envase es de
carácter cualitativo (plástico, vidrio, etc.).
El efecto de un factor es un cambio en la respuesta media ocasionado por un cambio en el
nivel de ese factor. Los dos efectos de interés en un experimento factorial son los simples o
principales y los de interacción. Los efectos simples o principales de un factor son las
comparaciones entre los niveles del mismo. Los efectos de interacción miden las diferencias
entre los efectos simples de un factor a diferentes niveles del otro. Por ejemplo, si hay I
I 
factores, A, B, C,… a dos niveles cada uno hay I tipos de efectos principales, hay   tipos de
2  
I 
interacciones apareadas AB, AC, BC,…..,   interacciones entre tres factores, ABC, ABD, ….,
3  
etcétera. En total junto con la media general µ, hay 2 I tipos de parámetros.

4.5.1.1 ANALISIS DE VARIANZA PARA DISEÑOS FACTORIALES COMPLETOS

El análisis de varianza para diseños factoriales completos se hace para probar las hipótesis de
que los efectos principales o los de interacción son igual a cero. A continuación se presentará
el análisis de varianza para un caso con dos factores: el factor A con a niveles y el factor B
con b niveles. El método se puede generalizar a cualquier otra cantidad de factores.
La estructura del experimento es tal que se prueban todas las a x b combinaciones. Cada
combinación de tratamientos se repite n veces. El modelo estadístico lineal es:

y ijk = µ + τ Ai + τ Bj + τijA B + ε ijk (ec. 4.25)

i = 1,2,…,a j = 1,2,…,b k = 1,2,…, n


4-60

B
En donde µ es la media general; τ Ai es el efecto principal del factor A; τ j es el efecto
AB
principal del factor B; τ ij es el efecto de interacción de primer orden entre los factores A y

B; y εijk es el error aleatorio k-ésima réplica. Se supone que los εijk son variables aleatorias
independientes para las que E[εijk ] = 0 y V[εijk ] = σ2 para toda i, j y k.
Sean a y b el número de niveles del factor A y B respectivamente, n el número de réplicas en
cada tratamiento (combinación de niveles) y y ijk la respuesta observada cuando el factor A se
encuentra en el i-ésimo nivel, el factor B en el j-ésimo nivel y en la k-ésima réplica. En
general, los datos para un diseño bifactorial se organizan como en la tabla 4.10.

TABLA 4.10 PLANTILLA DE RECOLECCION DE DATOS PARA UN DISEÑO BIFACTORIAL

FACTOR B
FACTOR A
1 2 ... b

1 y111, y112, ..., y11n y121,y122,..., y12n ... y1b1,y1b2 ,..., y1bn

2 y211, y212, ..., y21n y221,y222, ..., y22n ... y2b1,y2b2 ,..., y2bn

. . . . .
. . . .
.

a ya11, ya12, ..., ya1n ya21, ya22, ..., ya2n ... yab1,yab2, ..., yabn

El análisis de varianza cuando se considera más de un factor es similar al unifactorial;


prácticamente la lógica y fundamentos teóricos que lo sustentan son los mismos.
La partición de la suma de cuadrados total se puede deducir de la ecuación:

n
1 n
y ij = ∑ y ijk →yij = ∑y
k =1 n k =1 ijk
b
1 b
y i• = ∑ yij → y i• = ∑ y ij i = 1,..., a
j=1 b j =1
a
1 a
y • j = ∑ y ij → y • j = ∑y j = 1,..., b
i =1 a i =1 ij
a b
1 a b
Y = ∑∑ y ij → Y = ∑∑ yij
i =1 j =1 ab i=1 j =1
4-61

El análisis de varianza divide primero la suma total de cuadrados de desviaciones respecto a

Y:
a b n
SCTotal = ∑∑∑ ( y ijk − Y ) 2
i=1 j =1 k =1

en dos componentes, la suma dentro de tratamientos (SCError) y la suma entre tratamientos


(SCTratamientos), es decir:
a b n a b
SCError = ∑∑∑ ( y ijk − y ij ) 2 y SCTratamientos = n∑∑ ( yij − Y ) 2
i =1 j =1 k =1 i =1 j =1

Se puede demostrar que: SCTotal = SCError + SCTratamientos . En la segunda etapa, se divide la


suma de cuadrados de los tratamientos (SCTratamientos), en tres componentes: de las
interaciones (SCInteracciones), del efecto principal de A (SCA ) y del efecto principal de B (SCB),
son:
a b
SCInteracciones = SC AB = n ∑∑ ( y ij − yi . − y. j + Y ) 2
i =1 j=1
b
SC A = nb∑ ( y i. − Y ) 2
j =1
a
SCB = na∑ ( y. j − Y ) 2
i =1

Es decir,
SCTratamientos = SCInteraccines + SCA + SCB
En la tabla 4.11, se presenta el análisis de varianza para el modelo bifactoria l general.

TABLA 4.11 ANALISIS DE VARIANZA PARA EL MODELO BIFACTORIAL GENERAL

Fuente Suma de Grados de Media de F


de variación cuadrados libertad cuadrados

Factor A SCFA a-1 CMFA FA


Factor B SCFB b-1 CMFB FB
Interacción AB SCFAB (a-1)(b-1) CMFAB FAB
Error SCError ab(n-1) CMError

Total SCTotal abn-1

A continuación se presentan formulas que permitirán calcular las diferentes sumas de


cuadrados de una forma más sencilla. Para la suma de cuadrados total se tiene:
4-62

a b n nY 2
SCTotal = ∑ ∑ ∑ y 2ijk -
i=1 j=1 k=1 ab

Las sumas de cuadrados para los efectos principales son:

a
ny 2 2 ny 2• j nY 2
b
SC A = ∑ i•. - nY SC B = ∑ -
i=1 b ab j=1 a ab

Es conveniente obtener la SCInteracciones en dos etapas. Primero se calcula la suma de


cuadrados entre los totales de las ab celdas, conocida como la suma de cuadrados de los
“subtotales”:
a b y ij2 nY 2
SCSubtotales = ∑ ∑ −
i=1 j =1 n ab

Esta suma de cuadrados contiene a la suma de cuadrados de los factores A y B. Por lo tanto,
la segunda etapa consiste en calcular SCInteracciones mediante (MONTGOMERY, 1991, cap. 7):

SC Interaccio nes = SC Subtotales − SC A − SC B

Mientras que la suma de cuadrados del error se calcula por diferencia:

SC Error = SC Total − SC Subtotales

4.5.1.2 INFERENCIA PARA EL MODELO DE EFECTOS FIJOS

En un diseño factorial de dos factores fijos, tanto los factores (o tratamientos) de renglón
como los de columna tienen la misma importancia. Específicamente el interés consiste en
probar hipótesis acerca de la igualdad de los efectos de renglón, columna y de los de
interacción, es decir:
Para el factor A:
H o : τiA = 0
H 1 : τ Aj ≠ 0 al menos para un i

Para el factor B:
4-63

H o : τBj = 0
H 1 : τBj ≠ 0 al menos para un j

Para el factor de interacción AB:

H o : τijA B = 0
H 1 : τijA B ≠ 0 al menos para un par ij

Cada suma de cuadrados divididos entre sus grados de libertad produce una media de
cuadrados. Los valores esperados de las medias de cuadrados son (MONTGOMERY, 1991,
cap. 7):
a
bn ∑( τ A
i )2
SC A
E(CM A ) = E( ) = σ2 + i =1

a- 1 a-1
b
an ∑ ( τBJ ) 2
SC B j =1
E(CM B ) = E( ) = σ2 +
b-1 b-1
a b

SC A B
n ∑ ∑( τ AB
ij )2
E(CM A B ) = E( ) = σ2 + i = 1 j = 1
(a - 1)(b - 1) (a - 1)(b - 1)

SC Error
E(CM Error ) = E( ) = σ2
ab (n − 1)
Si las hipótesis nulas son verdaderas, entonces los cuadrados medios para los factores de

renglón, columna y de interacción (CMA , CMB y CMAB) son estimadores insesgados de σ 2 .


Sin embargo, al existir diferencias en los tratamientos de renglón entonces CMA > CMError .
En forma similar, si hay efecto de tratamiento columna o interacciones, las medias de los
cuadrados correspondientes serán mayores que CMError . Por lo tanto, para probar el
significado de ambos efectos principales, así como de su interacción simplemente deben
dividirse las medias de cuadrados correspondientes entre las medias del cuadrado del error;
valores grandes de estas razones implican que los datos no concuerdan con la hipótesis nula.
En otras palabras, si se considera que el modelo es adecuado y que los términos del error εij
son independientes con distribución normal y varianza constante, entonces las razones de las
medias de cuadrados de los factores principales y de la interacción con respecto a la media
4-64

de cuadrados del error (CMA /CMError , CMB/CMError y CMAB/CMError ) tienen una distribución
F con a - 1, b - 1 y (a - 1)(b - 1) grados de libertad en el numerador, y ab(n - 1) grados de
libertad en el denominador respectivamente (MONTGOMERY, 1991, cap. 7).
De esta forma la hipótesis nula para el factor A se rechaza si (MONTGOMERY, 1991, cap. 7):

FA = CMA /CMError> F α,a-1,ab(n-1)

Para el factor B la hipótesis nula se rechaza si (MONTGOMERY, 1991, cap. 7):

FB = CMB/CMError> F α,b-1,ab(n-1)

Y finalmente, la hipótesis nula para el factor de interacción se rechaza si (MONTGOMERY,


1991, cap. 7):
FAB = CMAB/CMError> F α,(a-1)(b-1),ab(n-1)

Los parámetros en el modelo del diseño bifactorial, pueden estimarse por el método de los
mínimos cuadrados, imponiendo las restricciones(MONTGOMERY, 1991, cap. 7):

a b a b

∑ˆτiA = 0 ∑ˆτ Bj = 0
j =1
∑ˆτijA B = 0 j = 1,2 ,..., b ∑ˆτ
j =1
AB
ij = 0 i = 1,2 ,..., a
i =1 i =1

Al aplicar estas restricciones, las ecuaciones normales se simplifican considerablemente y se


obtienen las soluciones (MONTGOMERY, 1991, cap. 7):

µ
ˆ =Y
τˆiA = y i. − Y
τˆ Bj = y. j − Y
τˆijAB = y ij − y i. − y. j + Y

Usando las ecuaciones anteriores puede determinarse el valor ajustado de y ijk mediante:
ŷ ijk = y ij

En otras palabras, la k-ésima observación de la ij-ésima celda se estima mediante el


promedio de las n observaciones de dicha celda.
4-65

4.5.1.3 INFERENCIA PARA EL MODELO DE EFECTOS ALEATORIOS

Considérese ahora la situación en la que los niveles de los factores A y B se eligen al azar de
poblaciones más grandes, este caso es relativo al modelo de efectos aleatorios o de
componentes de varianza. Las inferencias pueden generalizarse a todos los niveles de las
poblaciones bajo estudio, porque los a niveles de A y los b niveles de B se eligieron al azar.
Las observaciones se pueden representar mediante el modelo lineal, de la ecuación 4.25, sin
A B AB
embargo, se hace la suposición adicional de que τ i , τ j , τij son variables aleatoria s

independientes normalmente distribuidas con media cero y varianzas respectivas σ 2A , σ 2B y

σ 2A B constantes. En general, la varianza de cualquier observación es (MONTGOMERY, 1991,


cap. 7):

V ( y ijk ) = σ 2A + σB2 + σ 2A B + σ 2

en donde σ 2A , σ 2B y σ 2A B y σ 2 se conocen como componentes de varianza.

Las hipótesis que deben probarse para el caso de dos factores aleatorios son:

H 0 : σ 2A = 0, H 0 : σ 2B = 0, H 0 : σ 2A B = 0

El análisis de varianza básico permanece sin cambios, en otras palabras, SCA , SCB, SCAB, y
SCError se calculan como en el modelo de efectos fijos. Sin embargo, para determinar las
estadísticas con objeto de probar las hipótesis, deben examinarse antes los valores esperados
de las medias de cuadrados (MONTGOMERY, 1991, cap. 7):

E (CM A ) = σ2 + nσ 2A B + bnσ 2A

E (CM B ) = σ2 + nσ 2A B + anσB2

E (CM A B ) = σ 2 + nσ 2A B

E (CM Error ) = σ 2

A partir de estos valores esperados, puede apreciarse que la estadística apropiada para
CM A B
probar la hipótesis Ho: σ 2A B = 0 es F A B = , porque si la hipótesis nula es verdadera,
CM Error
4-66

tanto el numerador como el denominador de FAB tienen un valor esperado igual a σ 2 , y solo
si Ho es falsa E (CM A B ) será mayor que E (CM Error ) . La razón FAB tiene una distribución Fα,(a-

1)(b-1),ab(n-1) (MONTGOMERY, 1991, cap. 7).


La estadística apropiada, para probar Ho: σ 2A = 0, es:

CM A
FA =
CM A B
que tiene una distribución Fα,a-1,(a-1)(b-1).
En forma similar para probar Ho: σ 2B = 0, la estadística debe ser:

CM B
FB =
CM A B
Y tiene una distribución Fα,a-1,(a-1)(b-1).
Con igual número de observaciones para cada combinación de tratamiento, se puede usar el
análisis de varianza estudiado en la sección 4.5.1.2 para estimar los componentes de
varianza. Esta estimación se hace igualando los cuadrados medios observados con los
cuadrados medios esperados correspondientes y se despejan los valores desconocidos de los
componentes. Las estimaciones de los cuatro componentes de varianza son (MONTGOMERY,
1991, cap. 7):

Error: σ 2 = CMError
CM A B − CM Error
Interacció n : σ 2A B =
n
CM A − CM A B
Factor A : σ 2A =
bn
CM B − CM A B
Factor B : σ2B =
an

4.5.1.4 INFERENCIA PARA EL MODELO DE EFECTOS MIXTOS

Muchos experimentos se diseñan para estudiar los efectos de un factor sobre la media de la
población y los efectos de otro sobre la varianza de la misma, estos experimentos tienen una
mezcla de factores fijos y aleatorios. Los modelos para arreglos factoriales que incluyen
4-67

factores fijos y aleatorios se llaman modelos mixtos, pues contienen una mezcla de ambos
tipos de efectos (KUEHL, 2001, cap. 7).
El modelo y análisis para los efectos mixtos se compone de dos partes porque hay dos tipos
de inferencias. Las inferencias para los factores de efectos aleatorios se aplican a la variación
en una población de efectos, mientras que las inferencias para los factores de efectos fijos
están restringidas a los niveles específicos usados en el experimento (KUEHL, 2001, cap. 7).
El modelo lineal para este experimento es el mismo que el presentado en la ecuación 4.25,
suponiendo en este caso que las variables aleatorias independientes y normalmente
distribuidas con varianza constante, son además de ε ij , los efectos de uno de los factores
B AB
principales, por ejemplo τ j , y el de la interacción τ ij (o bien en el caso más general, el de

las interacciones que involucran al factor aleatorio).


Los cuadrados medios esperados para el análisis de varianza de efectos mixtos vienen
dados como (KUEHL, 2001, cap. 7):
a
bn∑ (τiA ) 2
E (CM A ) = σ 2 + nσ AB
2
+ i =1
a −1
E (CM B ) = σ2 + nσ 2A B + anσB2

E (CM A B ) = σ 2 + nσ 2A B

E (CM Error ) = σ 2

Por lo tanto la estadística apropiada para probar H o : τiA = 0 es:

CM A
FA =
CM A B

que tiene una distribución F . Para probar H 0 : σ 2A B = 0, la estadística


α,a-1,(a-1)(b-1)

correspondiente es:
CM A B
FAB =
CM Error

cuya distribución es F α,(a-1)(b-1),ab(n-1). Finalmente, para probar H 0 : σ 2B = 0, la estadística es:

CM B
FB =
CM A B
4-68

que tiene una distribución F α,b-1,(a-1)(b-1)

La estimación de los efectos del factor fijo (para el caso A), del modelo, viene dada por
(KUEHL, 2001, cap. 7):
ˆµ = y
ˆτ i = y i . − y para i = 1,..., a
A

Y las estimaciones para los componentes de varianza del factor aleatorio B y la interacción
vienen dadas por (KUEHL, 2001, cap. 7):

CM A B − CM Error
Interacció n : σ 2A B =
n
CM B − CM A B
Factor B : σB2 =
an

4.5.1.5 DETERMINACION DEL NUMERO DE REPLICAS

Para determinar el tamaño apropiado de la muestra (número de réplicas n) en los diseños


factoriales; el procedimiento es similar a los explicados para el caso de los diseños
unifactoriales (MONTGOMERY, 1991, cap. 7).
En la tabla 4.12, se muestra el valor apropiado del parámetro Φ 2 , para el caso del modelo
bifactorial de efectos fijos.

σ 2 puede ser estimado a través de experiencias anteriores con diseños similares, una prueba
piloto o estimaciones propuestas.

Φ 2 se puede estimar eligiendo valores de las medias de tratamie ntos para las cuales se debe
rechazar Ho, con una probabilidad alta. Otra forma es elegir un tamaño de muestra, de tal
manera que la hipótesis nula se rechace si la diferencia entre cualquier par de medias de
tratamientos excede un valor específico o si la diferencia entre dos medias es por lo menos D.
Si este es el caso el valor mínimo de Φ 2 viene dado por (MONTGOMERY, 1991, cap. 7):

n′ D2
Φ = 2
2 σ 2 (ν + 1)
4-69

Donde: n' es el número de unidades experimentales consideradas; D es la diferencia mínima

para considerar que dos medias son diferentes;σ 2 es la varianza y ν son los grados de
libertad.
Así se tiene que si la diferencia entre dos medias de renglón es D, el valor mínimo de Φ 2 será
(MONTGOMERY, 1991, cap. 7):
2
nbD
Φ =
2

2b σ2

Mientras que si la diferencia entre dos medias de columna es D el valor mínimo de Φ 2 será
(MONTGOMERY, 1991, cap. 7):
2
naD
Φ =
2

2b σ2

Finalmente, el valor mínimo de Φ 2 que corresponde a una diferencia igual a D entre


cualquier par de efectos de interacción será (MONTGOMERY, 1991, cap. 7):

2
nD
Φ =
2

2 σ [(a - 1)(b - 1) + 1]
2

TABLA 4.12 PARAMETROS DE LA CURVA CARACTERISTICA DE OPERACIÓN MODELO


BIFACTORIAL DE EFECTOS FIJOS (MONTGOMERY, 1991, cap. 7)

Grados de libertad Grados de libertad


FACTOR Φ2 del numerador del denominador
a
bn ∑ ( τiA ) 2
A i =1
a-1 ab(n-1)

a σ2
b

∑( τ
2
an B
j )
B j=1
b-1 ab(n-1)

b σ2
a b
n ∑ ∑ ( τijA B ) 2
AB i =1 j =1
(a-1)(b-1) ab(n-1)

σ [(a - 1)(b - 1) + 1]
2
4-70

Para los modelos de efectos aleatorios y mixtos deben usarse las curvas de operación
característica del anexo D4. El parámetro λ así como los grados de libertad del numerador y
denominador para ambos modelos se muestran en las tablas 4.13 y 4.14 respectivamente.

TABLA 4.13 PARAMETROS DE LA CURVA CARACTERISTICA DE OPERACIÓN MODELO


BIFACTORIAL DE EFECTOS ALEATORIOS (MONTGOMERY, 1991, cap. 7)

Grados de libertad Grados de libertad


FACTOR λ del numerador del denominador

a-1 (a-1)(b-1)
bn σ2A
1+ 2
A σ + n σ2A B

b-1 (a-1)(b-1)
an σB2
B
1+
σ 2 + n σ2A B
(a-1)(b-1) ab(n-1)

AB nσ 2
1+ AB

σ 2

TABLA 4.14 PARAMETROS DE LA CURVA CARACTERISTICA DE OPERACIÓN MODELO


BIFACTORIAL DE EFECTOS MIXTOS

Grados de libertad Grados de libertad


FACTOR Parámetro
del numerador del denominador

a
bn ∑ ( τ Ai ) 2
A a-1 (a-1)(b-1)
Φ2 = i =1

(fijo) a ( σ2 + σ A B )
2

an σB2
1+
B σ2 b-1 (a-1)(b-1)
(aleatorio)

AB n σ2A B (a-1)(b-1) ab(n-1)


1+
σ2
4-71

4.5.1.6 PRUEBA DE IDONEIDAD DEL MODELO

Las suposiciones para el modelo en cuanto a la homogeneidad de las varianzas y la


distribución normal, se pueden evaluar con el análisis de residuos desarrollado en la sección
4.2.4. Los residuos para el diseño factorial con dos factores se calculan como la desviación de
los valores observados de las medias estimadas para cada celda en el arreglo, el residual de
cualquier celda es por tanto:
ε ij = y ijk − ŷ ijk = y ijk − y ij .

4.5.1.7 ANALISIS GRAFICO DE LOS EFECTOS DE INTERACCION

En las figuras 4.5 y 4.6, se ilustra de manera gráfica la ausencia o presencia de interacción
para un arreglo con dos factores, A y B, cada uno con dos niveles; en la figura 4.5 se
muestra la medición gráfica de un solo efecto de cada uno de los factores. La respuesta
causada por A se grafica por separado para cada nivel de B, pero cuando no hay interacción
las líneas son paralelas, mostrando que existe una respuesta idéntica al factor A en ambos
niveles de B. En este caso, los factores son independientes y los efectos principales pueden
usarse para interpretar por separado los efectos de ambos factores.
En la figura 4.6, se muestra la presencia de la interacción, entre los dos factores, aquí las
líneas de respuesta no son paralelas. La diferencia en la magnitud (figura 4.6 a) o en la
dirección (figura 4.6 b) de las respuestas representan la interacción entre los factores, estos
no actúan de forma independiente y las interpretaciones deben basarse en los contrastes
para cada combinación de los dos factores (KUEHL, 2001, cap. 6).

FIGURA 4.5 COMPORTAMIENTO DE NO INTERACCION EN UN ARREGLO FACTORIAL


4-72

FIGURA 4.6 PRESENCIA DE EFECTOS DE INTERACCION


EN UN ARREGLO FACTORIAL

4.5.1.8 TEMAS GENERALES PARA LOS DISEÑOS FACTORIALES COMPLETOS

a) DISEÑO FACTORIAL GENERAL

Los resultados del diseño factorial de dos factores pueden extenderse al caso general en el
que existen a niveles del factor A, b niveles del factor B, c niveles del factor C, y así
sucesivamente, arregla dos en un diseño factorial. En general habrá un total de (abc...n)
observaciones; si hay n réplicas por cada tratamiento. Hay que notar que deben recopilarse
al menos dos réplicas para poder determinar la suma de cuadrados del error si todas las
posibles interacciones en el modelo están incluidas (MONTGOMERY, 1991, cap. 7).
En el caso de que todos los factores del experimento sean de efectos fijos, fácilmente pueden
formularse hipótesis acerca de los efectos principales y de las interacciones. Los estadísticos
que prueban cada efecto principal y cada interacción se pueden construir dividiendo la media
de cuadrados del efecto de las interacciones correspondientes entre las medias de cuadrados
del error. Todas las pruebas F corresponden a pruebas unilaterales del extremo superior. Los
grados de libertad de cualquier efecto principal son iguales al número de niveles del factor
menos uno; y los grados de libertad de una interacción son el producto de los grados de
libertad asociados con los componentes individuales de la interacción (MONTGOMERY, 1991,
cap. 7).

b) UNA SOLA REPLICA EN EL DISEÑO FACTORIAL COMPLETO:


4-73

En los estudios de investigación surgen situaciones en las que solo se dispone de una
observación por celda del arreglo factorial. La varianza del error experimental no puede
estimarse con una sola réplica de las combinaciones de los tratamientos, porque las
particiones de las sumas de cuadrados para los efectos principales e interacción del factor
son iguales a la suma de cuadrados total para las observaciones. Lo anterior implica que no
se puedan efectuar contrastes de hipótesis sobre los efectos en estudio. Una forma de
solventar esta situación es usando la asunción de la aditividad la cual describe que no hay
interacción entre los factores. Bajo la aditividad de factores se puede usar la partición de los
cuadrados medios de la interacción como una estimación del error experimental. Como la
aditividad de los efectos principales o de la ausencia de interacción no esta garantizada, son
necesarios algunos medios para evaluar la presencia de interacción (KUEHL, 2001, cap 6).
Aun cuando existan algunos métodos para evaluar la presencia de interacciones que en
general, serán función de que los factores que se combinan sean cualitativos y/o
cuantitativos, lo más recomendable es prever desde el principio de la investigación los
recursos disponibles y en función de ellos pensar en el uso de diseños experimentales
alternativos, que aun con el uso de una sola réplica, permiten métodos de análisis más
versátiles para el estudio de los efectos de los factores principales y de interacción, como por
ejemplo pueden mencionarse los diseños 2 k (ver sección 4.6).

c) REPLICAS DESIGUALES EN LOS TRATAMIENTOS O DISEÑOS FACTORIALES


DESBALANCEADOS:

Muchas veces puede darse el caso de datos faltantes en los estudios de investigación,
situación que puede ocurrir por ejemplo, por la perdida imprevista de datos y la escasez de
recursos para hacer repeticiones, o bien, porque el investigador crea a propósito diseños
desbalanceados dado que algunas combinaciones por celda son más caras o difíciles de
ensayar. Por otro lado, algunas combinaciones de tratamientos pueden ser de mayor interés
para el experimentador porque representan condiciones nuevas o inesperadas
(MONTGOMERY, 1991, cap. 7).
En general, sea cual sea la causa de datos faltantes, cuando se tienen diseños
“desbalanceados” se pierde la propiedad de ortogonalidad de los efectos principales y de
interacción, lo que implica que para estos diseños no puedan aplicarse las técnicas usuales de
análisis de varianza.
4-74

Los métodos generales para el análisis de diseños factoriales desbalanceados pueden


dividirse en (MONTGOMERY, 1991, cap. 7):

i. Métodos aproximados: que son útiles cuando los datos no están muy desbalanceados
para convertir este problema en uno balanceado. Para la aplicación de estos métodos
aproximados se supone que cada celda tiene al menos una observación. Entre estos
métodos están: el método de la estimación de datos faltantes, el método de la
eliminación de datos y el método de los promedios no ponderados (una descripción
detallada de estos métodos la presenta MONTGOMERY, 1991, sección 7.7.2).

ii. Métodos exactos: En casos en los que los análisis aproximados se vuelven
inapropiados, debido a que los datos están bien desbalanceados (como por ejemplo,
presencia de celdas vacías o con números de réplicas bien diferentes), deben usarse
análisis exactos que se basan en el desarrollo de métodos de partición del análisis de
varianza, cuyo enfoque es representar el análisis de varianza mediante el ajuste de
modelos de regresión. Como es lógico existen diferentes formas de hacer esto, y
puede ser que cada método produzca resultados diferentes, sin embargo, las rutinas
estadísticas generales, programadas para aceptar la teoría estadística conocida, han
eliminado en parte, las diferencias asociadas con el análisis de conjuntos incompletos
de datos. Una descripción detallada de la aplicación de un método exacto para el
análisis de diseños desbalanceados se presenta en KUEHL, 2001, sección 6.9).

4.6 DISEÑOS FACTORIALES 2 K

El diseño 2K es particularmente útil en las primeras etapas del trabajo experimental, cuando
es probable que haya muchos factores por investigar. La difusión industrial de los diseños 2k ,
se fundamenta en tres motivos (PRAT et al., 2000, cap. 7):

i. Proporcionan una excelente relación entre el esfuerzo experimental y la información


obtenida.
ii. Son sencillos de construir, realizar, analizar e interpretar.
iii. Son fáciles de combinar entre ellos para obtener otros diseños más com plejos.
4-75

En estos diseños el plan experimental tiene por objeto el estudio del efecto sobre una
respuesta, de k factores, cada uno a dos niveles. El modelo estadístico del diseño 2k incluye
el cálculo de 2k -1 efectos que se distribuyen como: k efectos principales, k(k-1)/2
interacciones de dos factores, k(k-1)(k-2)/3! interacciones de tres factores,…, y una
interacción de k factores (JURAN y GRYNA, 1997, cap. 26). Los diseños 2k, aun cuando
constituyen una variante de los diseños factoriales, se estudian por separado debido a que
pueden aplicarse técnicas de análisis diferentes al análisis de varianza.
Los diseños en los que cada factor varía a dos niveles sólo permiten estudiar relaciones
lineales entre la respuesta y los diferentes factores, lo que puede considerarse como un grave
inconveniente si este hecho no se compensa con la elección de niveles lo suficientemente
cercanos, de tal manera que una línea recta sea una buena aproximación a la verdadera
forma de la respuesta en la región de interés.
En general, las fases para un trabajo experimental que involucre un diseño factorial 2k , son
las mismas que para cualquier otro tipo de diseño, estas son: a) fase de diseño, b) fase de
recolección, c) fase de estimación de efectos, d) fase de significación de efectos, y e) fase de
evaluación o validación del modelo. En las secciones de la 4.6.1 a la 4.6.2, se presenta la
descripción de la aplicación de cada una de estas fases.

4.6.1 MATRIZ DEL DISEÑO 2 k

En el diseño 2k, los valores correspondientes a los dos niveles se codifican asignando al nivel
bajo el valor de -1 (o simplemente -) y al alto +1 (o simplemente +). Si el factor es
cualitativo, a un nivel se le asigna -1 y al otro +1 arbitrariamente. El arreglo de experimentos
en un diseño con k factores, se puede generar fácilmente. En general, el número total de
experimentos cuando se tienen k factores es igual a 2k si no hay replicaciones. En problemas
que tengan hasta cinco factores, la estructuración de todas las combinaciones posibles se
puede elaborar empleando la tabla 4.15 como referencia. Una forma de recordar estos
arreglos es observando que la primera columna alterna signos – y +, la segunda alterna
pares de signos – y +, la tercera alterna cuartetas, etc. Obsérvese que el tamaño de los
grupos de signos es una potencia de 2. Esto es, el tamaño en la primera columna equivale a
20, en la segunda 21, en la siguiente 22, y así sucesivamente hasta 2 k grupos de signos. Cada
fila de signos representa el conjunto de condiciones a que estará sujeto dicho experimento.
Conviene señalar que en cada experimento se pueden medir diversas variables dependientes,
4-76

las cuales se analizan individualmente. La columna de signos de los factores de interacción se


obtiene multiplicando los signos correspondientes en las columnas (factores) involucrados en
la interacción, esta operación se realiza por hileras (LAWSON et al., 1992, cap. 2).

TABLA 4.15 ORDEN DE YATES DE EXPERIMENTOS 2k (LAWSON et al., 1992, cap. 2)

4.6.2 RECOLECCION DE DATOS EN EL DISEÑO 2 k

El orden en que se presentaron los experimentos en la tabla 4.15 se conoce como orden
estándar u orden de Yates. Este representa una forma conveniente de mostrar los resultados,
pero a pesar de ello no es recomendable que los experimentos se ejecuten en ese orden, ya
que se pueden producir sesgos. El orden de la experimentación debe ser totalmente
4-77

aleatorio, ya que de esta forma se evita o minimiza la influencia de los factores no


controlables, al no permanecer constantes durante el experimento.
En ocasiones, el costo de cambiar un factor de nivel es muy elevado (esto ocurre con
frecuencia cuando alguno de los factores y el coste energético y tiempo de calentamiento es
muy elevado, así como el tiempo para el enfriamiento). Se puede recurrir a aleatorizaciones
restringidas para minimizar el número de veces que se cambia el nivel de un factor. Sin
embargo, siempre que sea posible y no se origine ningún problema serio, ni coste adicional
importante en la realización del experimento, es conveniente aleatorizar totalmente el orden
de la experimentación (LAWSON et al., 1992, cap. 2).

4.6.3 REPLICAS EN EL DISEÑO 2 k

Cuando se sabe que el sistema objeto de experimentación es muy variable, se hacen varios
experimentos bajo cada condición experimental. A estas repeticiones se les denomina
réplicas. Como se verá en la sección 4.6.4, al analizar los resultados se considera la media de
estas réplicas como la única respuesta, y se procede a calcular los efectos como si sólo se
hubiese experimentado una vez bajo cada condición y el resultado hubiese sido precisamente
esa media. Conviene destacar que una réplica implica la realización de todo el experimento
(bajo la condición señalada) y no recoger dos medidas de la misma respuesta, ambas
consecuencias del mismo experimento. Las réplicas así consideradas tienen la ventaja de que
permiten medir la variabilidad del sistema con el que se está experimentando y esta
variabilidad puede ser utilizada para determinar la significación de los efectos de los factores.
Tal como se verá en la sección 4.6.5 (PRAT et al., 2000, cap. 7).

4.6.4 CALCULO DE EFECTOS EN EL DISEÑO 2 k

Existen dos formas rápidas y sencillas de calcular los efectos principales y de interacción en
un diseño 2k :

a. El algoritmo de los signos también llamado de BOX, HUNTER y HUNTER (1989).


b. El algoritmo de Yates

A continuación se describe cada uno de estos métodos.


4-78

a. Algoritmo de los signos: Este algoritmo calcula los efectos a partir de los signos
utilizados para definir los niveles en la matriz de diseño, añadiendo las columnas de
signos generadas para las interacciones (ver sección 4.6.1). Se añade además una
columna con +1, que servirá para calcular la media. Cada efecto estimado es un
estadístico de la forma y + − y − , es decir esta expresado por la diferencia entre dos

medias, cada una conteniendo 2k-1 observaciones. Otra forma de conceptualizar, la


cuantificación de cualquiera de los efectos por este procedimiento, es mediante la
suma algebraica de la respuesta, de acuerdo con los signos definidos en la columna
del efecto correspondiente, y se divide por la mitad del número de condiciones
experimentales. Para hallar la media, la operación es exactamente la misma que
antes, excepto que se divide por el número de condiciones experimentales
especificadas en la matriz de diseño, este valor es el promedio de todas las
respuestas obtenidas durante la experimentación, pero resulta de escasa utilidad
práctica.
En resumen, el cálculo de cualquier efecto viene dado por:

Efecto = prom y + − prom y − = y + − y −

En donde: prom y + es el promedio aritmético de todas las respuestas con signo


positivo cuando la columna de los resultados obtenidos en la experimentación se
multiplica por el vector columna de los signos del efecto L y prom y- es el promedio de
todas las respuestas con signo negativo cuando la columna de los resultados
obtenidos en la experimentación se multiplica por el vector columna de los signos del
efecto L (JURAN y GRYNA, 1997, cap. 26).

b. Algoritmo de Yates: Este procedimiento requiere un menor número de operaciones


que el anterior y, al mismo tiempo, es el más adecuado para implementarlo en una
hoja de cálculo o cualquier otro programa informático. Para la aplicación de este
algoritmo de Yates se procede como sigue (JURAN y GRYNA, 1997, cap. 26):

1. Listar los datos en el orden de Yates o estándar.


4-79

2. Crear k+2 columnas, en la primera columna colocar el diseño experimental, es


decir, las combinaciones de los 2k tratamientos en el orden estándar de Yates
(ver tabla 4.15).
3. En la segunda columna, colocar las observaciones o respuestas a cada
combinación de tratamientos. Si el plan es replicado indicar el total de cada
combinación.
4. En la primera mitad de la tercera columna, colocar las sumas de los pares
consecutivos de datos correspondientes, es decir el primer valor será la suma
del 1º y 2º dato, el segundo valor la suma del 3º y 4º dato y así
sucesivamente. En la segunda mitad indicar por orden las diferencias de los
pares consecutivos de datos (primer valor resta del 2º menos el 1º dato,
segundo valor resta del 4º menos el 3º dato, y así sucesivamente).
5. Calcular las columnas 4, 5, ….., k+2 de la misma forma que la columna 3, es
decir, obteniendo en cada caso las sumas y diferencias de los pares de datos
de la columna precedente.
6. Los datos de la columna k+2, se designan con los códigos g(T), g(A), g(AB),
etc. Las letras entre paréntesis corresponden a los signos más de la notación
geométrica, es decir, de la combinación de tratamientos de la fila
correspondiente del diseño experimental. El primer valor g(T) se divide entre
N para obtener el promedio global. Las estimaciones de los efectos principales
y de interacción se obtienen dividiendo cada valor g(…) por N/2.
(Las siguientes etapas son controles)
7. La suma de las respuestas individuales en la segunda columna, ha de ser igual
al primer dato de la columna de las g(…), ya que g(T) es el total general.
8. La suma de los cuadrados de las cantidades de la columna dos, ha de ser
igual a la suma de los cuadrados de los datos de la columna k+2, dividida
entre 2k .
9. Cada g(…), de la última columna ha de ser igual a la sumatoria de las
observaciones con signo más (+) menos la sumatoria de las observaciones
con signo menos (-).
4-80

4.6.5 SIGNIFICACION DE EFECTOS EN EL DISEÑO 2 k

Una vez calculados los efectos, la primera tarea, mediante la técnica estadística más
adecuada, será distinguir cuáles de ellos son significativamente diferentes de cero4 y cuáles
no lo son. Hay dos situaciones de partida distintas al abordar este problema: cuando se ha
replicado el experimento, y cuando cada experimento elemental se ha llevado a cabo una
sola vez (por razones obvias de economía experimental, la segunda situación es la más
habitual).
Existen varias formas estadísticamente válidas para evaluar la significación de los efectos en
un diseño 2k, entre ellas están:

a) La prueba t-Student de significación de los efectos


b) La prueba de análisis de varianza
c) Pruebas gráficas de significación de efectos
A continuación, en las secciones de la 4.6.5.1 a la 4.6.5.2, se presenta una descripción de
cada una de ellas.

4.6.5.1 PRUEBA T-STUDENT DE SIGNIFICACIÓN DE EFECTOS

Para poder determinar la significación de los efectos por la prueba de t-Student, es necesario
disponer de una medida de la variación que el error experimental ha inducido en la
estimación de los mismos. El cálculo de dicha medida de variabilidad depende si el diseño es
replicado o no.
Si el diseño es replicado y no se tiene igual número de réplicas en las distintas combinaciones
de tratamientos, la varianza del error puede calcularse a partir de (PRAT et al., 2000, cap. 7):

( n 1 − 1) s 12 + ( n 2 − 1) s 22 + ..... + ( n c − 1) s c2
s =
r
2

n1 + n 2 + .... + n c − C

4
Que la estimación de un efecto, hallada a través del experimento, sea distinta de cero no implica
que el verdadero valor del mismo lo sea. Es decir, no implica que afecte en forma detectable a la
respuesta y que, por tanto, corresponda a un término que deba ser incluido en el modelo.
4-81

con n1 + n2 +….+ nc – C grados de libertad, donde C es el número de condiciones


experimentales distintas (C = 2K ) y ni el número de réplicas de la i-ésima condición
experimental.
Si se tiene una sola réplica para cada combinación, la varianza del error experimental puede
estimarse utilizando la suma de los cuadrados correspondientes a las interacciones de tres o
más factores. La suma de los cuadrados con un grado de libertad correspondiente al efecto
factorial de dos niveles viene dada por la fórmula (JURAN y GRYNA, 1997, cap. 26):

e
N ∑ ( efecto de interaccio nes de orden tres o mayor) 2
i =1

Para obtener la estimación de la varianza del error experimental, debe dividirse la suma de
cuadrados de la ecuación anterior entre e, siendo e el número de los efectos de interacción
que contribuyen al total. En un factorial 2k , el número de interacciones de orden tres o mayor
serán 2k – (k2 + k + 2)/2.
Finalmente, si no se dispone de réplicas de las distintas combinaciones, pero el diseño es
aumentado con puntos centrales (ver sección 4.6.9), la varianza del error experimental puede
estimarse como la varianza de las “q” repeticiones de los puntos centrales. Los grados de
libertad en este caso son nq – 1, en donde nq es el número de repeticiones de los puntos
centrales.
A continuación se describe el procedimiento general para la prueba t-Student de significación
de los efectos (JURAN y GRYNA, 1997, cap. 26):

1. Elegir el nivel de significación α.


2. Estimar la varianza del error experimental (de acuerdo a lo anteriormente expuesto).
3. Buscar tα/2 para los grados de libertad correspondientes, según sea la estimación de la
varianza del error experimental.
4. El error tipo de cada efecto estimado viene dado por:
2s
ET (efecto estimado) = ET( y + − y− ) =
N /2
en donde N es el número total de observaciones.
5. Los límites de confianza para el 100(1- α)% de cada efecto son por tanto:
4-82

Efecto ± t α / 2 [ET (efecto estimado )]

6. Para cualquier estimación de los efectos principales o de interacción, si el valor


absoluto de uno de los efectos es mayor que t α / 2 [ET (efecto estimado) ] , concluir que

la diferencia del verdadero efecto a partir de cero es estadísticamente, significativa.


Otra forma de evaluar la significación de los efectos es a través del intervalo de
confianza creado para cada uno de ellos, ya que puede concluirse que el efecto es
significativo si el intervalo no contiene al valor de cero.
En la práctica por razones de comodidad y rapidez, se recurre al cálculo de
intervalos de confianza aproximados, en la forma (PRAT et al., 2000, cap.
7) :
efecto ± 2 desviacion es tipo de los efectos

Y se consideran significativos aquellos cuyo intervalo no contiene al cero.

4.6.5.2 ANALISIS DE VARIANZA PARA LA SIGNIFICACIÓN DE EFECTOS

En los diseños 2k replicados la prueba de significación de los efectos puede realizarse también
a partir de análisis de varianza, lo que implica estimar y calcular las sumas de cuadrados para
cada uno de ellos. En general, las sumas de cuadrados de los efectos vendrán dadas, por
(JURAN y GRYNA, 1997, cap. 26):
1 N
SCEfecto = ( y+ − y− ) 2 = ( y+ − y− ) 2
N 4
En donde N es el número total de observaciones que para un diseño con n réplicas viene
dado por n x 2k.
En la tabla 4.16, se presenta el análisis de varianza para el diseño 2k. Obsérvese que la suma
de cuadrados medios se excluye de ésta tabla ya que la suma de cuadrados de los efectos
principales y de interacción son iguales, a excepción del cuadrado medio del error CMError =
SCError / (2 k(n-1)) (MONTGOMERY, 1991, cap. 9).
Las razones SCA/CMError , SCB/CMError ,…., etc., tienen una distribución F con un grado
de libertad en el numerador y 2k(n - 1) grados de libertad en el denominador. Las regiones
críticas corresponden al extremo superior de la distribución F. En otras palabras, la hipótesis
4-83

nula para un nivel de significación α se rechaza cuando Ffactor > Fα, (1, 2k (n-1)); donde Ffactor es
el F calculado para cada factor (MONTGOMERY, 1991, cap. 9).
Si se tiene una sola réplica el análisis de varianza puede realizarse tomando como estimación
de la varianza del error la presentada para la prueba t de una sola réplica de la sección
4.6.5.1.

4.6.5.3 PRUEBAS GRAFICAS DE SIGNIFICACION DE EFECTOS

En el trabajo experimental, muchas veces no se tendrá la disponibilidad de realizar replicas.


Sin embargo, existen métodos sencillos de tipo gráfico que permiten detectar la presencia de
efectos significativos de forma eficaz, dos de los cuales son: (a) Los gráficos en escala
probabilística normal de los efectos, y (b) el gráfico de Pareto. A continuación se describe
cada uno de estos métodos.

(a) GRAFICOS DE LOS EFECTOS EN ESCALA PROBABILISTICA NORMAL:


La respuesta experimental esta sometida a variación aleatoria. Esta variación seguirá, en
general, una ley normal con media cero y una desviación típica que refleja el error
experimental. Aún el caso nfrecuente
i en que no se sigue la ley normal, los efectos son
combinaciones lineales de la respuesta, y por el teorema central del límite tendrán tendencia
a seguirla (PRAT et al., 2000, cap. 7).
Supóngase que se tiene un experimento en el que todos los efectos sean no significativos, los
efectos hallados oscilan alrededor de cero, siguiendo una ley normal (N(0, σefectos)). Al
representarlos en una escala probabilística normal aparecerán todos ellos alineados, la
pendiente de la recta es una indicación del tamaño del error experimental. Una recta más
horizontal indicaría una mayor variabilidad (PRAT et al., 2000, cap. 7).
Por lo contrario, cuando al menos uno de los efectos es significativo, si bien tiene la misma
desviación tipo, la media varía dependiendo del tamaño del efecto. De forma que cada efecto
se distribuye como N(µefecto, σefectos), donde µefecto es distinta en cada caso. En la figura 4.7, se
presenta un ejemplo del comportamiento de los efectos en escala probabilística normal
(PRAT et al., 2000, cap. 7).
4-84

TABLA 4.16 ANALISIS DE VARIANZA PARA EL DISEÑO 2k (MONTGOMERY, 1991, cap. 9)

Suma de
Fuente de variación Grados de libertad
Cuadrados

K efectos principales
A SCA 1
B SCB 1
. . .
. . .
K SCK 1
k 
 
 2  Interacción de 2 Factores
AB SCAB 1
AC SCAC 1
. . .
. . .
JK SCJK 1
k 
 
 3  Interacción de 3 Factores
ABC SCABC 1
ABD SCABD 1
. . .
. . .
IJK SCIJK 1
k 
 
 k  Interacción de k Factores
SCABC...K 1
ABC...K
SCError 2k (n - 1)
Error
SCTotal n2k - 1
Total

FIGURA 4.7 GRAFICA DE PROBABILIDAD NORMAL DE LOS EFECTOS


4-85

Las gráficas en escala probabilístic a normal de los efectos se construyen de la siguiente forma
(LAWSON et. al., 1992, cap. 1):

1. Se ordenan las estimaciones de los efectos en sentido creciente (de menor a mayor).
2. Se crean percentiles pi = (i – 0.5)/(número de efectos) para cada uno de los efectos
ordenados, en donde i indica el orden del efecto.
3. Se calculan los estadísticos de orden z asociados a cada pi,(z-score), obtenidos de la
tabla del anexo A1. Si se desea puede utilizarse la aproximación:
[
z = 5.05 p i0 .135 − ( 1 − p i ) 0 .135 ]
4. Representar gráficamente las parejas (efecto, pi x100) o bien (orden de efecto, z-
score).
5. Interpretar. Requiere cierta práctica trazar correctamente las rectas e interpretar los
resultados. Es obvio que la recta debe ajustarse a los puntos centrales y no a los de
los extremos, que son los efectos potencialmente significativos. Un error común es
considerar como significativos efectos que se apartan de la recta por estar demasiado
próximos a cero (esto ocurre con cierta frecuencia, ya que al extraer muestras de
tamaño reducido de una ley normal los extremos tienden a estar sobrepresentados).
Ver figura 4.8.

FIGURA 4.8 INTERPRETACION DE SIGNIFICACIÓN DE LOS EFECTOS

(b) GRAFICOS DE PARETO DE LOS EFECTOS:


El análisis de Pareto constituye otro recurso gráfico muy útil para representar la significación
de los efectos y consiste en elaborar un histograma ordenado en el que la longitud de cada
4-86

rectángulo representa la magnitud de los efectos estimados. El análisis de significación


consiste en comparar la altura de cada rectángulo con una línea trazada sobre el valor del
efecto normal calculado con un nivel de significación α, para el σefectos correspondiente, es
decir: zα = µefecto/σefectos, en donde µefecto es el promedio de los valores de los efectos
obtenidos. En la figura 4.9 se presenta un análisis de Pareto para la significación de efectos.

FIGURA 4.9 GRAFICO DE PARETO PARA EL ANALISIS DE SIGNIFICACIÓN DE LOS


EFECTOS

4.6.6 INTERPRETACION DE RESULTADOS

Una vez que se ha determinado cuales de los efectos son significativos un paso importante es
interpretar físicamente esos resultados. Una forma de interpretarlos es observando si los
efectos producen un aumento o decremento en la respuesta. Un recurso bastante útil
consiste en elaborar gráficos de los niveles de los efectos con respecto a las respuestas
obtenidas tanto para los efectos principales, como para los de interacción (ver figura 4.6). Por
supuesto es imprescindible hacer estas interpretaciones a la luz de los conocimientos previos
que sobre el problema se pudiesen tener.
Por otra parte, si lo que se quiere lograr con la experimentación es construir un modelo, la
interpretación de los resultados puede venir enfocada sobre la búsqueda de una función que
represente aproximadamente la relación entre la respuesta y los factores, que resulte útil en
la zona experimental (es importante recalcar que no es conveniente extrapolar variables más
allá de los niveles que se han experimentado).
Mediante diseños 2k se pueden estimar los coeficientes de modelos polinómicos sin términos
cuadráticos. El modelo a estimar es del tipo:
4-87

∑β ∑∑β
k 2
ŷ = β o + ii xi + ij xix j +... + (hasta 2 – (k + k + 2)/2 interacciones de orden
i =1 i j

tres o mayor)

donde:

βo Término independiente del modelo. Corresponde a la media.


β1,.., β123… Coeficientes. Son la mitad de los efectos calculados. Esto es debido a que
el efecto principal de un factor representa el cambio en la respuesta al
pasar del nivel bajo (-) al alto (+). Mientras que el coeficiente representa
el cambio en la respuesta al cambiar el factor una unidad (del 0 al 1, o
del -1 al 0).
x i, xj,… Valores que toma cada uno de los factores.
x ixj , x ix jx l Productos de los valores que toman los factores que se indican. En el
modelo representan los efectos de las interacciones.
ŷ Valor que toma la respuesta para los valores dados de los factores.

En el modelo sólo deben incluirse los términos correspondientes a aquellos factores que
resultaron significativos. La superficie creada en función de los factores codificados permite
interpretar los efectos de los factores. La decodificación de las variables puede lograrse a
partir de:
nivel sup. + nivel inf.
Xo −
Xc = 2
nivel sup. + nivel inf.
2
Donde el subíndice C indica unidades codificadas y el O originales. Las ecuaciones con las
variables en las unidades originales deben ser tratadas con cautela, ya que su interpretación
es más compleja. Son útiles para predecir, pero no para interpretar los efectos de los factores
(PRAT et al., 2000, cap. 7).

4.6.7 DIAGNOSIS DEL MODELO

Es fácil calcular los residuos de un diseño 2k por medio del modelo de regresión creado. En
general los residuos vienen dados por:
4-88

ε = y − ŷ
En donde ŷ es el valor previsto para cada condición experimental. Los residuos calculados

permiten comprobar si se cumplen las hipótesis del modelo, que son independencia,
normalidad y varianza constante, y que pueden ser comprobadas mediante las técnicas
gráficas para el análisis de residuos presentadas en la sección 4.2.4.

4.6.8 CALCULO DEL NUMERO DE REPLICAS EN EL DISEÑO 2k

Como se vio en la sección 4.6.3, las repeticiones son necesarias para lograr la precisión
deseada cuando el sistema es muy variable. Si δ identifica la magnitud máxima de la
diferencia práctica5 entre las medias muestrales que se está dispuesto a aceptar, y σ es la
desviación estándar, el número de experimentos necesarios para lograr una precisión
deseada es (LAWSON et al., 1992, cap. 2):
2
 8σ 
N = 
 δ
Por ejemplo, si se requiere un 24 y en función de la precisión el N = 32, el experimento debe
replicarse. Si N no es un número entero el valor debe aproximarse al múltiplo más cercano a
2k (r2k). Lo anterior garantizará que el error máximo sea menor al 10% y permitirá probar
con un 95% de confianza, la significación de los efectos (LAWSON et al., 1992, cap. 2).
A medida que δ disminuye (mayor precisión) el número de experimentos necesarios (N), será
mayor. A menudo no es necesario que δ sea mucho menor que σ (a menos que los
experimentos sean baratos). La precisión será la misma independientemente del tamaño del
factorial. La precisión depende del número de combinaciones totales ejecutadas y no del
número de factores (LAWSON et al., 1992, cap. 2).
Al iniciar un programa experimental es recomendable empezar determinando N, ya que es
útil para determinar el costo del programa experimental, con la precisión deseada. En la

práctica es útil definir a δ = 8σ/ n , ya que así se indica la precisión que es posible comprar
con N datos (presupuesto disponible para el estudio). Si δ no es adecuado se debe proponer

5
La diferencia práctica puede tener una significación estadística o empírica , se dice que es estadísticamente
significativa si su valor es muy grande con respecto a la media de cuadrados del error. Por otra parte, es
empíricamente significativa cuando esta diferencia es lo suficientemente grande como para producir
beneficios económicos o en la operación del proceso a largo plazo. Se pueden tener estudios en los que se
encontrará significación estadística pero no práctica o viceversa.
4-89

aumentar N ó no ejecutar el programa (o tratar de disminuir la desviación estándarσ)


(LAWSON et al., 1992, cap. 2).

4.6.9 ADICION DE PUNTOS CENTRALES EN EL DISEÑO 2 k

Los puntos centrales son respuestas obtenidas cuando todos los factores experimentales se
encuentran a un nivel intermedio a los niveles inferior (-) y superior (+) del diseño 2k . La
repetición del experimento en los puntos centrales es importante en los factoriales a dos
niveles, debido a dos razones (LAWSON et al., 1992, cap. 2):

a. Proporcionan un estimador del error, con base en el cual se pueden medir los efectos:
La repetición de puntos centrales permite determinar un estimador “puro” del error ya
que son puntos repetidos.
b. Producen una prueba para el modelo: Un factorial se basa en que los cambios en la
variable dependiente, se pueden estimar bien con un modelo lineal. La validez de
dicha hipótesis no se puede verificar ya que sólo se tienen dos niveles para cada
factor. En el caso de existir efectos no lineales (curvatura), las predicciones no son
buenas excepto en los puntos cercanos a los puntos factoriales. El uso de puntos
centrales permite determinar la no linealidad analizando la magnitud de la diferencia
entre los promedios del punto central y los puntos factoriales (LAWSON et al., 1992,
cap. 2):
Efecto de curvatura = C = y factorial − y puntoscentrales

En donde, y factorial es el promedio de las respuestas de las 2k x n corridas

factoriales y ypuntoscentrales es el promedio de las respuestas asociadas a los puntos

centrales.
El análisis de significación del efecto de curvatura puede lograrse mediante la prueba
t para el estadístico (LAWSON et al., 1992, cap. 2):

C 1 1
tc = en donde S c viene dado por Sc = s +
Sc N f n p.c
4-90

(en el cual s es la estimación de la desviación estándar de y , Nf es el número de


puntos factoriales y np.c. es el número de puntos centrales).
El efecto de curvatura resulta significativo si tc es mayor que el valor de una t de
Student con ν grados de libertad, en donde ν son los grados de libertad con los que
se ha estimado σ a partir de s (PRAT et al., 2000, cap. 9).

4.6.10 BLOQUES EN DISEÑOS FACTORIALES 2 k

El experimento factorial puede sesgarse sustancialmente, si existe la posibilidad que los


niveles de ciertas variables latentes (factores no controlables) cambien, es decir, si hay
motivos que provoquen que el experimento no se lleve a cabo bajo condiciones homogéneas.
Al bloquear es posible dividir el global de experimentos en grupos o bloques dentro de los
cuales se piensa que las condiciones bajo las que se va a experimentar son homogéneas.
Para conseguir esas divisiones, se confunden interacciones, de las que en principio se piensa
que no son importantes (en general, tres o más factores), con los factores de bloqueo. Los
principios para crear variables de bloque son los que se aplican a los diseños factoriales
fraccionarios, que pueden estudiarse con más detalle en PRAT et. al.(2000).

4.7 PROBLEMAS DE DISEÑ O DE EXPERIMENTOS

EJEMPLO 4.7.1 DISEÑO UNIFACTORIAL DE EFECTOS FIJOS

Se quiere comparar el trabajo de los cuatro analistas de un laboratorio en el ensayo


de determinación del porcentaje de alcohol metílico en muestras de un producto
químico mediante la técnica de cromatografía líquida de alta resolución (HPLC). Cada
uno efectúa tres determinaciones. Para asegurar la distribución aleatoria de las
muestras se procedió de la siguiente forma:
Los analistas se enumeraron del 1 al 4 y las muestras del producto químico del 1 al
12, seguidamente se tomaron al azar un analista y una muestra, hasta completar la
distribución. La distribución resultante de los análisis se presenta a continuación:
4-91

Analista Muestra
1 9 1 11
2 3 10 12
3 4 6 8
4 5 2 7

Los resultados reportados por los analistas fueron los siguientes:

Analista Porcentaje de alcohol metílico


1 84.99 84.38 84.02
2 85.15 84.88 85.13
3 84.72 85.15 84.48
4 84.20 84.55 84.10
Total

En función de los resultados obtenidos determine si el trabajo de los analistas difiere


significativamente. Use un nivel de significación (α) de 0.05.
Solución:

Objetivo del problema: Comparar el trabajo de los cuatro analistas de un laboratorio,


en el análisis de metanol en un producto químico por HPLC, como parte del proceso
de aseguramiento de la calidad del laboratorio.

1. El modelo estadístico lineal para el análisis de datos en el modelo unifactorial de


efectos fijos es el siguiente:

y ij = µ + τi + εij

2. Contraste de hipótesis:

Ho: µ1 = µ2 = µ3 = µ4
H1: µi ≠ µj (en al menos un par)

3. Criterio de decisión:

SC Tratamientos ( k − 1) MC Tratamientos
Fo = =
SC Error ( N − k ) MC Error

Debe rechazarse Ho si Fo > Fα, k-1, N -k

4. Si se rechaza Ho, estimar los efectos.


4-92

5. Cálculos:

• En la tabla E4.1.1 se presentan los totales y los promedios obtenidos de los


resultados de cada analista:

TABLA E4.1.1
Porcentaje de alcohol
Analista Total Promedio
metílico
1 84.99 84.38 84.02 253.39 84.46
2 85.15 84.88 85.13 255.16 85.05
3 84.72 85.15 84.48 254.36 84.79
4 84.20 84.55 84.10 252.85 84.28
Total 1015.76 84.65

• Suma de cuadrados de tratamientos SC Tratamientos

k
y i2 Y 2 ( 253.39 ) + ( 255.16 ) 2 + ( 254.36 ) 2 + ( 252.85 ) 2 ( 1015.76 ) 2

2
SC Tratamientos = − = −
i =1
ni N 3 N

SCTratamientos = 8598175 − 8598070 = 1.05

• Suma de cuadrados del error y suma de cuadrados total (SCError y


SCTotal)

SCError= SCTotal – SCTratamientos

4 3
Y2
SCTotal = ∑∑ y ij2 − = 85982.62 − 85980.7 = 1.92
i =1 j =1 N
SCError = 1.92 – 1.05 = 0.87

• En la tabla E.4.1.2 se presenta el análisis de la varianza:

TABLA E4.1.2
Fuente de Suma de Grados de Media de Fo
variación cuadrados libertad cuadrados
Entre tratamientos 1.05 3 0.35 3.21
Dentro
0.87 8 0.109
tratamientos
Total 1.92 11

F0.05,3, 8 = 4.06 > Fo

Conclusión:
No existe evidencia significativa al 5% como para asegurar que los analistas del
laboratorio trabajan diferente.
4-93

Prueba de idoneidad del modelo

En general, los residuos para el modelo unifactorial vienen dados por:

ε ij = y ij − ŷ ij = y ij − y i

A continuación se presenta el cálculo de los residuos para el ejemplo 4.1.


Las estimaciones de los y ij vienen dadas por:

Analista 1 2 3 4 Media
µ i = y i = ŷ ij 84.4633 85.0533 84.7867 84.2833 84.6467

Por tanto, los residuos son:

Analista 1 1 1 2 2 2
y ij 84.99 84.02 84.38 85.15 85.13 84.88
ε ij = y ij − ŷ ij 0.5267 -0.4433 -0.0833 0.0967 0.0767 -0.1733
Analista 3 3 3 4 4 4
y ij 84.72 84.48 85.16 84.2 84.1 84.55
ε ij = y ij − ŷ ij -0.0667 -0.3067 0.3733 -0.0833 -0.1833 0.2667

• Prueba de normalidad de los residuos: según el gráfico E4.1.1, para esta prueba
la variabilidad de los residuos puede considerarse normal, por lo que se cumplen
hipótesis, que justifican el análisis de la varianza.

GRAFICO E4.1.1
99.9
99
95
Porcentaje

80
50
20
5
1
0.1
-0.45 -0.25 -0.05 0.15 0.35 0.55
Residuos

Por otra parte, puede considerarse a través de una prueba de hipótesis que la
media de los residuos no es significativamente diferente de cero a un nivel de
significación del 5%.
4-94

• Prueba de homogeneidad de la varianza de los residuos: Según el gráfico E4.1.2,


hay una dispersión aleatoria de los puntos, por lo tanto puede decirse que existe
homocedasticidad.

GRAFICO E4.1.2
0.6
0.4
0.2
RESIDUOS εij
0
-0.2
-0.4
-0.6
84 84.2 84.4 84.6 84.8 85 85.2
Predichos yij
VALORES PREDICHOS ŷ ij

• Según la prueba de Barlett, puede considerarse que la varianza para cada analista
es la misma.

Prueba de Barlett:
Las hipótesis a probar son:

Ho: σ12 = σ 22 = σ 23 = ... = σ 2k

H1: lo anterior no es cierto al menos para una σ j


2

q
La estadística de prueba (ver sección 4.2.4b) es: χ 2o = 2.3026
c
donde:
k
q = (N − k ) log 10 S P 2 − ∑ (ni − 1) log 10 S i 2
i =1

1  k 
c =1+  ∑ (ni − 1)−1 − (N − k )−1 
3(k − 1)  i =1 
k

∑ (n i − 1) S i 2
S2P = i =1

N −k
y S i 2 es la varianza muestral de la i-ésima población.

Las varianzas muestrales ( S i 2 ) para cada analista, son las siguientes:


4-95

Analista Varianza
muestral
1 0.240433
2 0.0226333
3 0.118933
4 0.0558333

k ( y ji − yi )2
En donde cada S i viene dada por:
2
S i2 =∑
i =1 ni − 1
Por tanto:

2( 0.240433) + 2( 0.022633 ) + 2( 0.118933 ) + 2( 0.05583 )


S p2 =
8
1  4 1
c =1+  −  = 1.20833
3( 3)  2 8 

q = 8 log 10 ( 0.10945815) − [2 log 10 ( 0.240433) + ... + 2 log 10 (0.0558333)] = 1.198109576

q 1.19811
χ 2o = 2.3026 = 2.3026 = 2.283
c 1.20833

Dado que χ α ,k −1 = χ 0 .05 ,3 = 7.815 , y es mayor que χo2 =2.283, se concluye


2 2

mediante la prueba de Barlett que existe homogeneidad de las varianzas


entre los tratamientos, para un nivel de significancia del 5%.

Cálculo del tamaño del número de repeticiones por tratamiento (cálculo del
tamaño de muestra:

Como no existe evidencia significativa al 5% (ni al 10%), como para asegurar que los
analistas del laboratorio trabajan dif erente, vale la pena analizar el número de
repeticiones por tratamiento y la potencia de la prueba, adecuados a esta investigación.

Los valores de las medias y de σ2, son:

Media
Analista
muestral µ i
1 84.4633
2 85.0533
3 84.7867
4 84.2833
µ)
Media(µ 84.6467
k n
∑∑ ( y ij − µ) 2
i

i=1 j =1
S2 = = 0.1752
N −1
4-96

Utilizando las tablas de potencia del anexo D4 y tomando α = 0.01, se procede a calcular
el número de mediciones más apropiado por analista.

Los resultados se muestran a continuación:

n ν1 = k - 1 ν2 = N - k Φ 2 = 0.5n Φ 1-β

3 3 8 1.5 1.22 0.10


5 3 16 2.5 1.58 0.35
10 3 36 5 2.24 0.86
11 3 40 5.5 2.34 0.90

Por lo tanto, para obtener resultados más concluyentes sobre si existe o no diferencia
en el trabajo de los analistas, es recomendable realizar un nuevo experimento en el
que el número de réplicas por tratamiento sea de 11, ya que sólo así se logra
satisfacer el requisito mínimo de potencia de la prueba que es de 0.9, como puede
observarse en la tabla anterior.

EJEMPLO 4.7.2 DISEÑO UNIFACTORIAL DE EFECTOS ALEATORIOS

Los siguientes resultados muestran el porcentaje de agua intersticial total recuperada


al centrifugar muestras de piedras areniscas tomadas de diferentes profundidades:

Profundidad de Agua recuperada (%)


la muestra (m)
7 33.3, 33.3,35.7, 38.1,31.0, 33.3
8 43.6, 45.2, 47.7, 45.4, 43.8, 46.5
16 73.2, 68.7, 73.6, 70.9,72.5, 74.5
23 72.5, 70.4, 65.2,66.7,77.6,69.8

Demuestre que el porcentaje de agua recuperada difiere significativamente a las


diferentes profundidades.

SOLUCION:

1. El modelo estadístico lineal es: y ij = µ + τi + εij

Por tratarse de un modelo de efectos aleatorios la varianza de cualquier observación


vendrá dada por:
4-97

V(y ij ) = στ 2 + σ2 (componentes de varianza)

2. Contraste de hipótesis:
Ho: στ 2 = 0
H1: στ 2 > 0

3. Criterio de decisión:
Debe rechazarse Ho si Fo = CMTratamientos/ CMError > Fα, k-1, N -k

4. Cálculos:

Profundidad
de la muestra Agua recuperada (%) Yi yi
(m)
7 33.3, 33.3, 35.7, 38.1, 31.0, 33.3 204.7 34.12
8 43.6, 45.2, 47.7, 45.4, 43.8, 46.5 272.2 45.37
16 73.2, 68.7, 73.6, 70.9, 72.5, 74.5 433.4 72.23
23 72.5, 70.4, 65.2, 66.7, 77.6, 69.8 422.2 70.37
Totales 1332.5 55.55

SUMA DE CUADRADOS:

k
y i2 Y 2
SCTratamientos = ∑ − = [(204) 2 + (272.2) 2 + (433.4)2 + (422.2) 2]/ 6 -
i =1 ni N
2
[(1332.15) /24]
SCTra tamientos= 6365.7
SCError = SCTotal - SCTratamientos
4 3
Y2
SCTotal = ∑∑ y ij2 −
i =1 j =1 N
SCTotal = (33.3 + .... + 69.8 ) − ((1332) / 24) = 80509.25 − 73981.51 = 6527.74
2 2 2

SCError = 6527.74 – 6365.7 = 162.04

TABLA DE ANALISIS DE VARIANZA

Fuente de variación Suma de Grados de Media de Fo


cuadrados libertad cuadrados
Entre tratamientos 6365.7 3 2121.9 261.898
Dentro de tratamientos 162.04 20 8.102
Total 6527.74 23
F0.05, 3, 20 = 3.098, F 0.1, 3, 20 = 2.38
4-98

CONCLUSIÓN

Existe efecto significativo al 5% y al 10% de la profundidad sobre el contenido del


agua intersticial de las piedras areniscas. En otras palabras, puede concluirse que el
contenido de agua intersticial en las piedras areniscas varía con la profundidad de la
que fueron tomadas, para los niveles de significación del 5 y el 10%.

Calculo de los componentes de varianza:

Dado que se ha constatado el efecto del factor aleatorio profundidad (m), se procede
a estimar qué parte de la variabilidad en el contenido de agua intersticial de las
piedras es debida a este factor.
Las estimaciones de los componentes de varianza son:

CMError = σ2 = 8.102

στ 2 = (CMrratamientos – CMError)/n

στ 2 = (2121.9 – 8.102)/ 6 = 352.3

La estimación de la varianza de cualquier estimación de la muestra es: 8.102 + 352.3


= 360.4. La mayor parte de la variabilidad se atribuye a diferencias en la profundidad.
La variabilidad debida a la profundidad constituye el 97%.

Los datos para calcular la potencia de la prueba para este análisis son:

σ2τ 352.3
λ = 1+ = 1+ 6 = 16.18
σ 2
8.102

ν1 = k – 1 = 3; ν2 = N – k = 20

Al utilizar las tablas del anexo D4, se obtiene una potencia de la prueba de más del
99%.

Prueba de idoneidad del modelo:

Para la prueba de idoneidad del modelo es necesario estimar los parámetros del
modelo lineal para luego determinar los valores predichos (ajustados) y sus
respectivos residuos, como se muestra a continuación:
Las estimaciones de los efectos para las distintas profundidades son:
Dados: µ =y = 55.55 y τi =  y i − µ , los valores de los efectos para cada nivel son:

τ1 = 34.12 – 55.55 = -21.43


τ2 = 45.37 – 55.55 = -10.18
τ3 = 72.23 – 55.55 = 16.68
τ4 = 70.37 – 55.55= 14.82
4-99

Por tanto, los valores predichos dados por yˆ ij = 55.55 + τi , son:

Profundidad Valor
predicho
7 34.12
8 45.37
16 72.23
23 70.37

Y los residuos, ε ij = y ij − ŷ ij , son entonces:

Profundidad de la ε ij = y ij − ŷ ij
muestra (m)
7 -0.82, -0.82, 1.45, 3.98, -3.12, -0.82
8 -1.77, -0.17, 2.33, 0.03, -1.57, 1.13
16 0.97, -3.53, 1.37, -1.33, 0.27, 2.27
23 2.13, 0.03, -5.17,-3.67, 7.23, -0.57

En el gráfico E4.2.1, se presenta la distribución de variabilidad de los residuos en


escala probabilística normal:

GRAFICO E4.2.1

Probabilidad normal para los residuos

99.9
99
95
Proporcion

80
50
20
5
1
0.1
-6 -3 0 3 6 9
Residuos

Como se puede observar la distribución de variabilidad de los residuos puede


considerarse normal.

En función del análisis del gráfico E4.2.2, que describe el comportamiento de los
residuos contra los valores predichos, puede concluirse que la varianza de los residuos
es homogénea, los puntos en el gráfico están dispersos sin sugerir ninguna tendencia.
4-100

GRAFICO E4.2.2

Grafico de residuos para agua recuperada (%)

Residuos
0

-4

-8
34 44 54 64 74
Predichos

EJEMPLO 4.7.3 DISEÑO DE BLOQUES ALEATORIOS

En un experimento de colaboración entre laboratorios para la determinación de


arsénico en carbón (ver capítulo 6), se enviaron muestras de carbón de tres
regiones diferentes a tres laboratorios. Cada laboratorio realizó un análisis de cada
muestra y para la distribución aleatoria se etiquetaron las muestras como (A1, A2,
A3, B1, B2, B3, C1, C2, C3) y los laboratorios como (1, 2, 3). La asignación
aleatoria muestra – laboratorio para el ensayo fue la siguiente:

Laboratorio 1 2 3
muestra A2, B3, C1 A1, B2, C3 A3, B1, C2

Los resultados obtenidos (medidos en µg/g) se muestran a continuación:

Muestra Laboratorio
1 2 3
A 5.10 5.35 5.20
B 5.60 5.65 5.35
C 6.40 6.65 6.45

Determinar si existen diferencias significativas en el trabajo de los tres laboratorios.

SOLUCION:

1. El modelo estadístico lineal para el análisis de datos es el siguiente:

y ij = µ + τi + βJ + εij
4-101

es un modelo de BLOQUES ALEATORIOS, porque existe heterogeneidad en el


material experimental.

2. Contraste de hipótesis:
Ho: µ1 = µ2 = µ3
H1: µi ≠ µj (en al menos un par)

Nivel de significación α = 0.05

3. Criterio de decisión:

SCTratamientos (k − 1) CM Tratamientos
Fo = =
SCError ( N − k − b + 1) CM Error

Debe rechazarse Ho si Fo > Fα, k-1, N -k . Si se rechaza Ho, estimar los efectos.

4. Cálculos:

MUESTRA 1 2 3 y bj y bj
A 5.1 5.35 5.20 15.65 5.23
B 5.6 5.65 5.35 16.6 5.53
C 6.4 6.65 6.45 19.5 6.5
yi 17.1 17.65 17.00 51.75

yi 5.7 5.88 5.67 5.75

CALCULO DE SUMAS DE CUADRADOS

Suma de cuadrados de tratamientos:


k
y i2 Y 2
SCTratamientos = ∑ − = (17.12 +17.652 + 172)/3 - (51.75)2/9 =0.08167
i =1 ni N
Suma de cuadrados de bloques:
b y bj 2 Y 2
SCBloques = ∑ - = (15.652 + 16.6 2 + 19.52 ) / 3 − (53.75) 2 / 2 = 2.6817
j =1 k bk
Suma de cuadrados total:
4 3
Y2
SCTotal = ∑∑ y ij2 − = (5.12 +…..+6.452) - (51.75)2/9 = 2.8
i =1 j =1 N

Suma de cuadrados del error:

SCError = SCTotal – SCTratamientos – SCBloques = 0.0367

Tabla de análisis de varianza


4-102

Grados
Fuente de Suma de Media de
de Fo
variación cuadrados cuadrados
libertad
Laboratorio 0.08167 2 0.0408 4.45
Muestra 2.6817 2 1.34 146.27
Error 0.0367 4 0.00917
Total 2.8 8
F0.05, 2, 4 = 6.94

CONCLUSIÓN

No existe evidencia significativa como para afirmar que los laboratorios están
trabajando de forma diferente, con un grado de confianza del 95%.

Prueba de idoneidad del modelo

Recuerde que los residuos en este modelo son:

ε ij = y ij − y ki − y bj + y

En la tabla siguiente se presentan los residuos calculados:

MUESTRA 1 2 3
A -0.08 -0.01 0.05
B 0.12 -0.01 -0.1
C -0.05 0.02 0.03

En el gráfico E4.3.1, se presenta el comportamiento de los residuos versus los


valores predichos: Como puede observarse del gráfico, hay una distribución
aleatoria de los puntos, por lo que se cumple la hipótesis de homogeneidad de la
varianza.

GRAFICO E4.3.1
Grafico de residuos para cantidad de Arsenico

0.12

0.08
0.04
Residuo

-0.04

-0.08
-0.12
5.1 5.5 5.9 6.3 6.7 7.1
Predicho
4-103

La prueba de normalidad de los residuos viene dada por la grafica en papel


probabilístico normal y como puede observarse en el grafico E4.3.2 los residuos se
distribuyen en forma normal.

GRAFICO E4.3.2
Probabilidad Normal para los residuos

99.9
99
95

Proporcion
80
50
20
5
1
0.1
-0.1 -0.06 -0.02 0.02 0.06 0.1 0.14
Residuos

EJEMPLO 4.7.4 APLICACIÓN DEL DISEÑO BIFACTORIAL DE EFECTOS FIJOS

En una planta de fabricación de jugos se quiere decidir si la concentración de vitamina


C en el concentrado de jugo de naranja varía en función del tiempo de almacenaje y
del proveedor. Los resultados, en miligramos de ácido ascórbico por litro se
registraron de la siguiente manera:

Marca Tiempo (días)

0 3 7

XXX 52.6 54.2 49.4 49.2 42.7 48.8


49.8 46.5 42.8 53.2 40.4 47.6

YYY 56.0 48.0 48.8 44.0 49.2 44.0


49.6 48.4 44.0 42.4 42.0 43.2

ZZZ 52.5 52.0 48.0 47.0 48.5 43.4


51.8 53.6 48.2 49.6 45.2 47.6

Utilizando un nivel de significación de 0.05 probar si:


a) El nivel de variación en el contenido de ácido ascórbico en el concentrado de
jugo de naranja depende del tipo de marca;
b) El contenido de ácido ascórbico en el concentrado de jugo de naranja varía
con el tiempo de almacenaje;
4-104

c) Las marcas de concentrado de jugo de naranja y el número de días que


transcurren desde su almacenamiento no interactúan.

SOLUCION:

Para dar respuestas a los tres literales; hay que probar las siguientes hipótesis:
Para el factor marca (factor A):

H o : τiA = 0
H 1 : τ Aj ≠ 0 al menos para un i

Para el factor tiempo de almacenaje (factor B):

H o : τBj = 0
H 1 : τBj ≠ 0 al menos para un j

Para el factor de interacción AB:

H o : τijA B = 0
H 1 : τijA B ≠ 0 al menos para un par ij

De esta forma la hipótesis nula para el factor A se rechaza si:

FA = CMA /CMError> F α,a-1,ab(n-1)

Para el factor B la hipótesis nula se rechaza si:

FB = CMB/CMError> F α,b-1,ab(n-1)

Y finalmente, la hipótesis nula para el factor de interacción se rechaza si:

FAB = CMAB/CMError> F α,(a-1)(b-1),ab(n-1)

CALCULO DE SUMAS DE CUADRADOS (ver tabla E4.4.1):

Suma de cuadrados total:

a b n
nY 2 4 * ( 431.05) 2
SCTotal = ∑∑∑ y ijk
2
− = (52.6 2 + 54.2 2 + ..... + 45.2 2 + 47.6 2 ) − = 531.08
i=1 j =1 k =1 ab 9

Las sumas de cuadrados para los efectos principales son:


4-105

ny2i. nY 2 4 * (144.3 2 + 139.9 2 + 146.85 2 ) 4 * (431.05) 2


a
SCMARCA = ∑ - = − = 32.96
i=1 b ab 3 9
bny.2j nY 2 4 * (153.75 2 + 141.65 2 + 135.65 2 ) 4 * (431.05) 2
SCTIEMPO = ∑ - = − = 226.68
j=1 a ab 3 9

a b yij2 nY 2 203.12 + 194.6 2 + ....192.8 2 + 184.7 2 4 * (431.05) 2


SCSubtotales = ∑ ∑ − = − = 276.94
i=1 j=1 n ab 4 9

SC Interaccio nes = SC Subtotales − SC M A R C A − SC TIEMPO = 276 .94 − 32 .97 − 226 .68 = 17 .29

Mientras que la suma de cuadrados del error se calcula por diferencia:

SC Error = SC Total − SC Subtotales = 531 .08 − 276 .94 = 254 .14

TABLA E4.4.1 TOTALES Y PROMEDIOS


TIEMPO
MARCA 0 3 7 TOTALES Σ PROM.

52.6 54.2 49.4 49.2 42.7 48.8


49.8 46.5 42.8 53.2 40.4 47.6
XXX 577.2 144.3
203.1 194.6 179.5
50.78 48.65 44.88

56.0 48.0 48.8 44.0 49.2 44.0


49.6 48.4 44.0 42.4 42.0 43.2
YYY 559.6 139.9
202 179.2 178.4
50.5 44.8 44.6

52.5 52.0 48.0 47.0 48.5 43.4


51.8 53.6 48.2 49.6 45.2 47.6
ZZZ 587.4 146.85
209.9 192.8 184.7
52.48 48.2 46.18

TOTALES 615 566.6 542.6 1724.2 47.89

Σ PROM. 153.75 141.65 135.65

A continuación se presenta la tabla E4.4.2 de análisis de varianza:


4-106

TABLA E4.4.2 ANALISIS DE VARIANZA PARA EL EJEMPLO 4.4

Fuente Suma de Grados de Media de Fo


de variación Cuadrados libertad cuadrados

Factor A 32.97 2 16.48 1.75


Factor B 226.68 2 113.34 12.04
Interacción AB 17.30 4 4.32 0.46
Error 254.14 27 9.41

Total 531.08 35

Para ambos factores A ó B, F0.05 (2,27) = 3.35 y para la interacción AB,


F0.05 (4,27) = 2.73.
Por lo tanto, el único efecto considerado significativo es el efecto producido por el
factor tiempo (factor B); es decir, que para un nivel de significación del 5%, la
variación en el contenido de vitamina C del concentrado de jugo de naranja sólo
depende del tiempo de almacenamiento.
Al analizar los datos en un paquete estadístico, los resultados de la columna P
valor indican que la hipótesis nula para el factor A se rechaza para un α = 0.191;
por consiguiente la hipótesis nula no se rechaza para α = 0.05, y la hipótesis nula
para el factor B sí se rechaza para cualquier α.
La hipótesis nula para la interacción AB no se rechaza para α= 0.05 ya que
requiere de un α mínimo α= 0.767.

Prueba de idoneidad del modelo

El elemento principal para la prueba de idoneidad del modelo es el análisis de los


residuos; los residuos para el modelo factorial de dos factores son:

ε ij = y ijk − ŷ ijk = y ijk − y ij .

Los residuos obtenidos para este ejemplo se presentan en la tabla E4.4.3.

TABLA E4.4.3
MARCA 0 3 7

1.82 3.42 0.75 0.55 -2.18 3.92


XXX -0.98 -4.28 -5.85 4.55 -4.48 2.72
50.78 48.65 44.88

5.5 -2.5 4.0 -0.8 4.6 -0.6


YYY -0.9 -2.1 -0.8 -2.4 -2.6 -1.4
50.5 44.8 44.6

0.02 -0.48 -0.2 -1.2 2.32 -2.78


ZZZ -0.68 1.12 0 1.4 -0.98 1.42
52.48 48.2 46.18
4-107

La distribución de los residuos en escala probabilística, se presenta en el gráfico


E4.4.1, según ésta la variabilidad de los residuos es prácticamente normal, por lo
que se cumple la hipótesis de normalidad.

GRAFICO E4.4.1
Probabilidad normal para los residuos

99.9
99
95
Proporcion

80
50
20
5
1
0.1
-6 -4 -2 0 2 4 6
Residuos

De las gráficas E4.4.2 y E4.4.3, se puede observar que los errores no siguen ningún
modelo matemático específico y además la varianza permanece relativamente
constante. Por lo que se puede concluir que el modelo es estadísticamente valido para
aplicar el análisis de varianza.

GRAFICO E4.4.2

Grafica de residuos para Acido

4
2
Residuo

-2

-4
-6
0 10 20 30 40
Tiempo
4-108

GRAFICO E4.4.3

Grafico de residuos para el Acido

2
Residuo
-1

-4

-7
40 44 48 52 56
Predicho

EJEMPLO 4.7.5 DETERMINACION DEL TAMAÑO DE MUESTRA PARA UN


DISEÑO BIFACTORIAL

En el ejemplo 4.4, se tomó como tamaño de muestra 4 observaciones por


tratamiento, a continuación se explica un procedimiento a seguir para calcularlo.

SOLUCION:

Se obtiene σ 2 a través de una prueba piloto; en este caso supongamos que σ 2 =


0.7; además se decide rechazar la hipótesis nula con una probabilidad alta (1-ß >
90%) si la diferencia en el nivel medio del ácido ascórbico fuera por lo menos igual a
5 (D=5). Se tiene que:

2
2 nD
Φ =
2 σ2 [(a - 1)(b - 1) + 1]
2
5
⇒ Φ2 = n
2(0.7)(5)
⇒ Φ2 = 3.57n

Se partirá de una prueba con un α = 0.01 y 1-ß > 0.9. Para el cálculo del tamaño de
la muestra se hace uso de las curvas características, obteniéndose la tabla E4.5.1:
4-109

TABLA E4.5.1

n Φ2 Φ ν1 ν2 1-ß

2 7.14 2.67 2 9 0.30


3 10.71 3.27 2 18 0.70
4 14.28 3.78 2 27 0.94

Luego se debe tomar un tamaño de muestra de 4 unidades experimentales por


tratamiento para lograr una prueba con potencia de al menos 0.9.
Nota: Si se toma cualquiera de las ecuaciones:
2 2
2 nbD 2 naD
Φ = Φ =
2a σ2 2b σ2

el tamaño apropiado es de 2 para lograr que 1-ß = 0.9. Por lo que se tomó el máximo
tamaño de muestra para garantizar potencia en la prueba de hipótesis de la
interacción; es decir 4 observaciones por tratamiento.

EJEMPLO 4.7.6 APLICACIÓN DEL DISEÑO 2K

Actualmente en un laboratorio la determinación de compuestos fenólicos en aguas


residuales, se logra por la destilación de la muestra y posterior reacción de los fenóles
con 4 amono antipirina en un pH de 10.0, en presencia del ferro cianato. La
intensidad del color del compuesto es medida espectrofotométricamente.
Se desea conocer si la etapa de la destilación podría ser eliminada, sustituyéndola por
la filtración de la muestra y posterior determinación de los compuestos fenólicos en la
suspensión formada. Los factores que se considera afectan al proceso de filtración
para la separación de los compuestos fenólicos son:

FACTOR
pH (A)
TEMPERATURA (B)
TIPO DE PAPEL FILTRO (C)

Se decide planificar un experimento 2 3 para estudiar el efecto de los distintos factores


sobre la etapa de filtración. Los niveles de los factores se presentan a continuación:

FACTOR NIVEL ( + ) NIVEL ( - )


pH Medio básico Medio ácido
TEMPERATURA 80 oC 20 oC
papel filtro papel filtro semi-
TIPO DE PAPEL FILTRO
cuantitativo cuantitativo
4-110

La variable respuesta a considerar fue el contenido fenólico determinado en muestras


procesadas con el método modíficado de medición. Normalmente el valor obtenido de
la concentración de fenoles, en ese tipo de muestras, a través del método tradicional
del análisis gira alrededor de 4.1.
Los resultados obtenidos a través de la planificación de la experiencia se muestran en
la siguiente tabla:

EXPERIENCIAS (1) a b ab c ac bc abc


Yijk 4.05 6.92 4.14 5.74 4.06 7.21 4.23 5.79

Compruebe qué efectos afectan más significativamente a la etapa de filtración.

SOLUCION:
Estimación de efectos
En la tabla E4.6.1 se presenta la cuantificación de los efectos de los factores por el
método de Yates (ver sección 2.6.4). El número de columnas a crear son k + 2 = 3 +
2 = 5.

TABLA E4.6.1 APLICACIÓN DEL METODO DE YATES

Combinaciones y ijk (1) (2) (3) efectos


- -- (1) 4.05 10.97 20.85 42.14 g(T) 5.268
+- - (a) 6.92 9.88 21.29 9.18 g(A) 2.295
-+- (b) 4.14 11.27 4.47 -2.34 g(B) -0.585
++ - (ab) 5.74 10.02 4.71 -2.86 g(AB) -0.715
--+ (c) 4.06 2.87 -1.09 0.44 g(C) 0.11
+- + (ac) 7.21 1.6 -1.25 0.24 g(AC) 0.06
-+ + (bc) 4.23 3.15 -1.27 -0.16 g(BC) -0.04
+++ (abc) 5.79 1.56 -1.59 -0.32 g(ABC) -0.08

Prueba de significación de efectos

La prueba de significación de los efectos se hará a través de la representación


gráfica de los efectos en escala probabilística. En la tabla E4.6.2 se presentan los
datos para la construcción de la gráfica E4.6.1.
4-111

TABLA E4.6.2

Percentil z-score
Efectos Orden(i) p i = ( i − 0 .5 ) / 7 z = 5 . 05 p 0 . 135 − ( 1 − pi ) 0 . 135 
 i 

g(A) 2.295 7 0.9286 1.4635


g(B) -0.585 2 0.2143 -0.7864
g(AB) -0.715 1 0.0714 -1.4635
g(C) 0.11 6 0.7857 0.7864
g(AC) 0.06 5 0.6428 0.3628
g(BC) -0.04 4 0.5000 0
g(ABC) -0.08 3 0.3571 -0.3630

GRAFICA E4.6.1 EFECTOS ORDENADOS

2
A
1.5 2.295

1 0.11
z-score

0.5 0.06
0 -0.04
-0.08
-0.5
-0.6
-1
-0.715
-1.5
-2
-1 -0.5 0 0.5 1 1.5 2 2.5
efectos ordenados

En la gráfica E4.6.2 se presenta el diagrama de Pareto de los efectos. La variable


normal para una distribución con la media de los efectos de 0.555 y con la
desviación estándar de los mismos de 0.8154, correspondiente al área de
probabilidad de 0.95, puede calcularse aplicando la función
DISTR.NORM.INV(0.95,0.555,0.8152) de Excel, siendo su valor de 1.896.
Como puede observarse de las figuras E4.6.1 y E4.6.2, el único factor significativo
es el factor A. Es decir, que la variación en la medición del contenido fenólico de las
muestras usando la etapa de filtración sólo es función de la regulación del pH,
tendiéndose al uso de pH bajo. Si la prueba de idoneidad lo justifica, sería
conveniente proceder con estudios para determinar cuál es el valor de pH óptimo a
emplear en la etapa de filtración y luego de comparación de las técnicas
(modificada y no modificada), de tal manera que se asegure que la técnica de
medición modificada permite obtener resultados confiables.
4-112

GRAFICO E4.6.2 GRAFICO DE PARETO DE EFECTOS

g(A)

g(AB)

g(B)
g(C)

g(ABC)

g(AC)
g(BC)

0 0.5 1 1.5 2 2.5

Prueba de idoneidad del modelo

Para calcular los residuos ε ij = y ijk − ŷ ijk , primero se calcula el valor estimado
( ŷ ijk ) lo cual se hace por medio de un modelo de regresión ajustado, de la forma:
g ( A) g( B ) g ( AB )
ŷ ijk = y + x1 + x2 + x 1x 2 + ... + (sobre todos los efectos significat ivos)
2 2 2

donde x1 y x 2 son los valores codificados (-1), (+1), nivel bajo y alto de cada factor.
En este ejemplo, el modelo es el siguiente:

g( A)
ŷ ijk = y + x 1 = 5.268 + 1.148x 1
2
El valor predicho para ambos factores a nivel bajo, es por ejemplo:

ŷ ijk = 5.268 + 1.148( −1) = 4.12

El cálculo de los residuos se presenta en la tabla E4.6.3.

TABLA E4.6.3 CALCULO DE RESIDUOS

Experimento y ŷ ε =y − ŷ
ijk ijk ij ijk ijk
(1) 4.05 4.12 -0.07
A 6.92 6.416 0.504
B 4.14 4.12 0.02
AB 5.74 6.416 -0.676
C 4.06 4.12 -0.06
AC 7.21 6.416 0.794
BC 4.23 4.12 0.11
ABC 5.79 6.416 -0.626
4-113

La prueba de homogeneidad de la varianza viene dada por el gráfico de residuos


versus los valores predichos, gráfico E4.6.3. Mientras que la prueba de normalidad
de los residuos se presenta en el gráfico E4.6.4.

GRAFICO E4.6.3

1
0.8
0.6

residuos
0.4
0.2
0
-0.2 3 3.5 4 4.5 5 5.5 6 6.5 7
-0.4
-0.6
-0.8
valores predichos

GRAFICO E4.6.3

Como puede observarse no existe ninguna tendencia que evidencie la falta de


homogeneidad de la varianza (gráfico E4.6.3); y la distribución de variabilidad de
los residuos puede considerarse normal (gráfico E4.6.4).
En el archivo Yates k=3, se presenta una hoja para el calculo de efectos por el
algoritmo de Yates para un modelo 23.

Yates k=3
4-114

REFERENCIAS BIBLIOGRAFICAS

• Box, G.E.P, Hunter, N.G y Hunter, J.S (1989). Estadística para investigadores.
España: Reverté.

• Ferré, J. y Rius, F.X (2000).Introducción al diseño estadístico de experimentos.


Tarragona: Departamento de Química Analítica y Química Orgánica. Universitat Rovira i
Virgili.

• Juran, J.M y Gryna, F. M. (1998). Manual de control de calidad. (2 tomos). España:


Mcgraw-Hill.

• Kenett, R. S. y Zacks, S. (2000). Estadística industrial moderna. Diseño y control de la


calidad y la confiabilidad. México: International Thomson Editores.

• Kuehl, R. O. (2001). Diseño de experimentos. Principios estadísticos de diseño y análisis


de investigación. México:International Thomson Editores.
• Lawson, J., Madrigal, J.L. y Erjavec, J. (1992). Estrategias experimentales para el
mejoramiento de la calidad en la industria. México: Grupo Editorial Hiberoamérica.

• Miller, J. C. y Miller, J. N. (1993). Estadística para química analítica. Segunda edición.


Wilmington, Delaware, E.U.A: Addison-Wesley Iberoamericana, S.A.

• Montgomery, D. C. (1991). Diseño y análisis de experimentos. México: Grupo Editorial


Iberoamérica.
• Prat, A., Tort-Martorell, X., Grima, P. y Pozueta, L. (2000). Métodos estadísticos.
Control y mejora de la calidad. México: Alfaomega Grupo Editor.

• Walpole, R. E. y Myers, R. H. (1992). Probabilidad y estadística. Cuarta edición.


México: Mcgraw-Hill.

• Wayne, W. D. (1992). Bioestadística. Base para el análisis de las ciencias de la salud.


Cuarta edición. México: Limusa.

También podría gustarte