La Tesis Imprimir PDF

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 184

Universidad Central “Marta Abreu” de Las Villas.

Facultad Matemática, Física y Computación


Licenciatura en Matemática

Diseño Estadístico de Experimentos.

Autor: FélixArley Díaz Rosell.


Tutor: Dra. Gladys Cardoso Romero.

“Año de la Revolución Energética en Cuba”

Santa Clara
2006
Hago constar que el presente trabajo fue realizado en la Universidad Central Marta Abreu de
Las Villas como parte de la culminación de los estudios de la especialidad de Licenciatura
en Matemáticas, autorizando a que el mismo sea utilizado por la institución, para los fines
que estime conveniente, tanto de forma parcial como total y que además no podrá ser
presentado en eventos ni publicado sin la autorización de la Universidad.

_____________________
Firma del autor

Los abajo firmantes, certificamos que el presente trabajo ha sido realizado según acuerdos
de la dirección de nuestro centro y el mismo cumple con los requisitos que debe tener un
trabajo de esta envergadura referido a la temática señalada.

________________ _________________________
Firma del tutor Firma del jefe del Seminario
Dedicatoria.

A Jesús de Nazaret mi salvador y padre fiel.


A mi madre Caridad Rosell y a Francisco R.
Siempre pendientes de mí.
A Yainet por existir.
A mis hermanos y amigos.
Agradecimientos.

Con este trabajo culmina una etapa importante de nuestra vida, y el momento insta a la
reflexión y en nuestra memoria se dibujan las imágenes de todos aquellos que
contribuyeron de una u otra forma a la culminación exitosa del mismo, a alcanzar una
meta tan deseada como esta. No quisiera mencionar sus nombres, pues cometería la grave
injusticia de olvidar algunos y eso sería imperdonable. Así damos las gracias a esa
inmensidad, a los que nos enseñaron poniendo en nosotros su esperanza, a aquel que un
día nos dio una hoja o nos prestó un lápiz, a aquel que en un momento amargo nos hizo
sonreír, al que nos escuchó, al que se mostró espontáneo, a todos aquellos que confiaron
en nosotros.

También es el momento para pedir excusas por aquellas interrupciones, o por alguna
tardanza o quizás porque algún día fui inoportuno.

En fin agradecer la dedicación y la paciencia, por darnos un espacio de su tiempo, un


pedacito de sus vidas, porque cualquier atención, preocupación, desvelo, aunque pequeño
siempre será recordado.

Especiales.
Para la Dr. Gladys Cardoso Romero y Lic. Juan M. Navarro Céspedes, por sus valiosos
y oportunos conocimientos, los cuales me sirvieron de gran ayuda en el desarrollo del
trabajo.
Resumen.

En este trabajo se presenta un material bibliográfico que tendrá como fin el apoyo de la
docencia para las carreras de Licenciatura en Matemáticas y Licenciatura en Química
específicamente para la asignatura Diseño de Experimentos.

En él, se ofrece una serie de definiciones y conceptos preliminares, lo que posibilita


preparar al lector para el estudio del contenido ha desarrollarse. Además se presenta un
compendio teórico de diferentes Diseños Estadísticos agrupados por capítulos según sus
características. El material cuenta también con una colección de ejercicios resueltos y
propuestos.
Summary.

In this work we present a bibliographical material that has specifically as the end the
support of the teaching for the careers of Degree in the Mathematics and Degree in the
Chemistry for the subject Designs of Experiments.

In him, we offer a series of definitions and the preliminary concepts, what facilitates to
prepare the reader for the study of the volume has to be developed. A theoretical summary
of several Statistical Designs contained by chapters according to their characteristics. The
material also has a collection of resolved exercises and proposed exercises.
Índice.

Introducción................................................................................................................ 1
Capítulo 1. Principios básicos, conceptos y definiciones. ... 4
1.1 Principios básicos del diseño de experimentos.............................................................. 5
1.2 Etapas de un diseño de experimentos ............................................................................ 8
1.3 Ventajas y Desventajas de los experimentos diseñados estadísticamente ................... 11
1.4 Modelos de Diseño de Experimentos .......................................................................... 11
1.5 Tipos de variabilidad.................................................................................................... 13
1.6 Planificación de un experimento.................................................................................. 14
1.7 Elegir una regla de asignación de las unidades experimentales a las condiciones de
estudio (“tratamientos”) ..................................................................................................... 19
1.8 Especificar las medidas que se realizarán (la “respuesta”), el procedimiento
experimental y anticiparse a las posibles dificultades ....................................................... 19
1.9 Ejecutar un experimento piloto.................................................................................... 20
1.10 Especificar el modelo................................................................................................. 20
1.11 Esquematizar los pasos del análisis estadístico ......................................................... 21
1.11.1 Determinar el tamaño muestral........................................................................... 21
1.11.2 Revisar las decisiones anteriores. Modificar si es necesario .............................. 21
1.12 Resumen de los principales conceptos....................................................................... 22
1.13 Algunos diseños experimentales clásicos .................................................................. 23
Capítulo 2 Diseños unifactoriales, bifactoriales y trifactoriales.
................................................................................................................................................ 24
2.1 Diseño Completamente al Azar ................................................................................... 24
2.1.1 Ventajas, desventajas y usos del DCA.................................................................. 24
2.1.2 Aleatorización y Croquis Experimental................................................................ 25
2.1.3 Presentación de los datos ...................................................................................... 26
2.1.4 Modelo matemático del diseño lineal ................................................................... 27
2.1.5 Supuestos del Modelo Estadístico ........................................................................ 28
2.1.6 ¿Cómo obtener los residuales?.............................................................................. 28
2.1.7 Estimación de los efectos...................................................................................... 31
2.1.8 Obtener la tabla ANOVA. Análisis de varianza de clasificación simple. ............ 32
2.1.9 Prueba de Duncan ................................................................................................. 35
2.1.10 Prueba de Duncan cuando las observaciones por tratamiento difieren............... 37
2.1.11 Coeficiente de Variación..................................................................................... 37
2.1.12 Pruebas de Comparación de Medias de Tratamientos ........................................ 39
2.1.13 Prueba de Tukey ................................................................................................. 40
2.1.14 Prueba de Sheffé ................................................................................................. 42
2.1.15 Prueba de Dunnet................................................................................................ 43
2.1.16 Diseño Completamente al Azar Desbalanceado ................................................. 43
2.1.17 Submuestreo de un diseño completamente al azar ............................................. 44
2.1.18 Ejercicios resueltos y propuestos ........................................................................ 47
2.2 Diseño de Bloques Completamente al Azar ................................................................ 51
2.2.1 Ventajas y desventajas del DBCA ....................................................................... 52
2.2.2 Aleatorización y Croquis Experimental............................................................... 53
2.2.3 Modelo Aditivo Lineal.......................................................................................... 53
2.2.4 Supuestos del modelo estadístico.......................................................................... 54
2.2.5 Estimación de los efectos...................................................................................... 54
2.2.6 Análisis de Varianza ............................................................................................. 55
2.2.7 Construcción de la tabla ANOVA ........................................................................ 56
2.2.8 Prueba de Sheffé ................................................................................................... 60
2.2.9 Bloques al Azar (BA) con datos perdidos............................................................. 60
2.2.10 Ejercicios propuestos .......................................................................................... 61
2.3 Diseño Cuadrado Latino .............................................................................................. 64
2.3.1 Ventajas y Desventajas del DCL .......................................................................... 65
2.3.2 Aleatorización y Croquis Experimental................................................................ 65
2.3.3 Modelo Aditivo Lineal.......................................................................................... 66
2.3.4 Supuestos del Modelo Estadístico ........................................................................ 67
2.3.5 Estimación de los Efectos ..................................................................................... 67
2.3.6 Análisis de Varianza ............................................................................................. 69
2.3.7 Pruebas de Comparación de Medias de Tratamientos .......................................... 73
2.3.8 Ejercicios............................................................................................................... 74
2.4 Diseño de Bloques Incompletos................................................................................... 75
2.4.1 Análisis estadístico................................................................................................ 76
2.4.2 Modelo estadístico ................................................................................................ 77
2.4.3 Conformando la tabla ANOVA ............................................................................ 77
2.4.4 Calculo de los efectos ........................................................................................... 81
Capítulo 3 Diseños factoriales. ................................................................ 83
3.1 Diseños factoriales ....................................................................................................... 83
3.1.1 Ventajas, Desventajas y Usos ............................................................................... 83
3.1.2 Notación y Definiciones ....................................................................................... 84
3.1.3 Presentación de los datos ...................................................................................... 85
3.1.4 Experimentos Factorial pxq .................................................................................. 87
3.1.5 Análisis de Varianza ............................................................................................. 90
3.1.6 Análisis de Efectos Simples.................................................................................. 94
3.1.7 Pruebas de comparación de Medias...................................................................... 96
3.1.8 Ejercicios............................................................................................................... 96
3.2 Diseños 2k .................................................................................................................... 99
3.2.1 Diseño bifactorial sin replicas............................................................................... 99
3.2.2 Diseño bifactorial con replicas............................................................................ 102
3.2.3 Modelo bifactorial mixto .................................................................................... 111
3.2.4 El diseño 22 ......................................................................................................... 113
3.2.5 El diseño 23 ......................................................................................................... 116
3.2.6 Supuestos del Modelo Estadístico ...................................................................... 119
3.2.7 Representación de los factores y niveles ............................................................ 120
3.2.8 Ejercicios............................................................................................................. 120
Capítulo 4 Diseño de Parcelas Divididas y jerárquicos. .. 122
4.1 Diseño de Parcelas Divididas..................................................................................... 122
4.1.1 Modelo Aditivo Lineal........................................................................................ 124
4.1.2 Análisis de Varianza ........................................................................................... 126
4.1.3 Pruebas de comparación de medias .................................................................... 130
4.1.4 Pruebas de comparación de medias de efectos simples ...................................... 131
4.1.5 Ejercicios............................................................................................................. 132
4.2 Diseños Jerárquicos .................................................................................................. 134
4.2.1 Representación de los datos ............................................................................... 135
4.2.2 Modelos de ANOVA ......................................................................................... 136
4.2.3 Modelo Aditivo Lineal........................................................................................ 136
4.2.4 Calculo de la ANOVA ........................................................................................ 137
4.2.5 Ejemplo para el procedimiento estadístico y conclusiones................................. 138
4.2.6 Ejercicio .............................................................................................................. 142
Capítulo 5 Regresión Lineal y Covarianza. ................................ 144
5.1 Regresión lineal simple y múltiple ............................................................................ 144
5.1.1 Regresión Lineal Simple..................................................................................... 144
5.1.2 Modelo Estadístico.............................................................................................. 147
5.1.3 Análisis de Varianza ........................................................................................... 150
5.1.4 Coeficiente de Correlación y de Determinación................................................. 152
5.1.5 Predicción ........................................................................................................... 153
5.1.6 Ejercicios............................................................................................................. 155
5.1.7 Regresión lineal múltiple .................................................................................... 157
5.2 Análisis de Covarianza .............................................................................................. 159
5.2.1 Modelo Aditivo Lineal........................................................................................ 160
5.2.4 Suposiciones del Modelo Estadístico.................................................................. 163
5.2.5 Análisis de Covarianza ....................................................................................... 163
5.2.6 Pruebas de Comparación de Medias de Tratamientos ........................................ 168
5.2.7 Ejercicios............................................................................................................. 170
Recomendaciones. ............................................................................................... 173
Bibliografía. ............................................................................................................. 174
Introducción.

La aplicación de las técnicas estadísticas a las investigaciones para la planificación inicial


de los experimentos, el procesamiento e interpretación de los resultados obtenidos se ha
convertido en una necesidad imperiosa de las ciencias, particularmente para obtener la
mayor información del sistema estudiado con un mínimo de experiencias en el menor
tiempo posible.

La experimentación como una de las principales vías para adquirir conocimientos de una
determinada disciplina ha sido objeto de atención de numerosos científicos. Para mejorar la
eficiencia del trabajo experimental se han desarrollado durante el siglo XX un conjunto de
técnicas y procedimientos con fundamentos estadísticos. En este contexto es que surge el
Diseño de Experimentos que tiene como principal precursor a Ronald A. Fisher. Aunque
biólogo de profesión, sus investigaciones en la agricultura y en ramas de la genética lo
obligaron a desarrollar toda una teoría estadística para poder darle respuesta a problemas
que surgieron producto de las investigaciones desarrolladas él.

En breves palabras el Diseño Estadístico de Experimentos no es más que planificar el


experimento de forma tal que sea capaz de proporcionar toda la información para el análisis
de las hipótesis bajo estudio.

Sin embargo también es importante que el diseño sea tan simple como sea posible.
Además la investigación debe llevarse a cabo de la forma más eficiente posible. Esto es,
debe hacerse todo el esfuerzo posible para ahorrar tiempo, dinero, personal y material
experimental. Generalmente la mayoría de los diseños estadísticos no sólo son fáciles de
analizar sino también son eficientes en ambos sentidos, el económico y el estadístico.

En las carreras de Licenciatura en Matemática y Licenciatura en Química se imparte la


asignatura optativa: Diseño Estadístico de Experimentos, por lo cual debido a la falta de
bibliografía suficiente se decidió elaborar un material de apoyo a la docencia que se ajuste a
los programas de las asignaturas. En el cual se brindan las características de los diferentes
diseños, su formulación teórica así como algunos ejercicios resueltos y propuestos de forma
que sirvan de guía para el desarrollo de la asignatura.

Por lo cual los objetivos del trabajo de diploma son:

¾ Elaborar un material de apoyo a la docencia para la asignatura optativa Diseño


Estadístico de Experimentos que se imparte en las carreras de Lic. en Matemáticas y
Lic. en Química.

1
¾ Desarrollar los aspectos teóricos relativos a los diseños siguientes:

• Diseño Completamente al Azar.


• Diseño de Bloques Completamente al Azar.
• Diseño Cuadrado Latino.
• Diseño de Bloques Incompletos.
• Diseños factoriales.
• Diseño 2k.
• Diseño de Parcelas Divididas.
• Diseños jerárquicos.
• Regresión lineal simple y múltiple.
• Análisis de Covarianza.

¾ Crear un folleto que conste de un gran número de ejercicios propuestos para que le
permiten el trabajo independiente de los estudiantes.

Para ello el presente trabajo consta de 5 Capítulos, los cuales presentan los siguiente
subtemas:

Capítulo 1.

− Principios básicos, conceptos y definiciones.

Capítulo 2.

− Diseño Completamente al Azar.


− Diseño de Bloques Completamente al Azar.
− Diseño Cuadrado Latino.
− Diseño de Bloques Incompletos.

Capítulo 3.

− Diseños factoriales.
− Diseños 2k.

Capítulo 4.

− Diseño de Parcelas Divididas.


− Diseños jerárquicos.

Capítulo 5.

− Regresión lineal simple y múltiple.


− Análisis de Covarianza.

2
3
Capítulo 1. Principios básicos, conceptos y definiciones.

En este capítulo analizaremos una serie de definiciones y conceptos que nos serán útiles a
lo largo del estudio de los Diseños Estadísticos de Experimentos.

Que es un experimento: Es un conjunto de pruebas con el objetivo de obtener


información que permita variar cierto efecto de un objeto o proceso en estudio. La finalidad
última es ayudar a tomar alguna decisión importante con respecto a lo estudiado.

Experimento aleatorio: Es aquel en que el resultado no se puede predecir con exactitud.

Cual es el resultado del experimento: Aquellas características de calidad o productividad


resultantes del producto o proceso sobre las que se quiere incidir para mejorar.

Qué se entiende por "diseño de un experimento"

• Diseñar un experimento significa planear un experimento de modo que reúna la


información pertinente al problema bajo investigación.
• El diseño de un experimento es la secuencia completa de pasos tomados de
antemano para asegurar que los datos apropiados se obtendrán de modo que permitan
un análisis objetivo que conduzca a deducciones válidas con respecto al problema
establecido.

La necesidad de un diseño de experimento surge de la necesidad de responder a


preguntas como:

• ¿Cómo se va a medir el efecto? ó ¿Cuáles son las características a analizar?


• ¿Qué factores afectan las características que se van a analizar?
• ¿Cuáles son los factores que se estudiaran en esta investigación?
• ¿Cuántas veces deberá ejecutarse el experimento?
• ¿Cuál será la forma de análisis?
• ¿A partir de que valores se considera importante el efecto?

Objetivos de un diseño de experimentos

• Proporcionar la máxima cantidad de información pertinente al problema bajo


investigación.
• El diseño, plan o programa debe ser tan simple como sea posible.
• La investigación debe efectuarse lo más eficientemente posible; ahorrar tiempo,
dinero, personal y material experimental. “Proporcionar la máxima cantidad de
información al mínimo costo”.

4
1.1 Principios básicos del diseño de experimentos

Al planificar un experimento hay cuatro principios básicos que se deben tener siempre
en cuenta:

— Reproducción.
— El principio de aleatorización.
— El control local o bloqueo.
— La factorización del diseño.

Los dos principios (aleatorizar y bloquear) son estrategias eficientes para asignar los
tratamientos a las unidades experimentales sin preocuparse de qué tratamientos
considerar. Por el contrario, la factorización del diseño define una estrategia eficiente
para elegir los tratamientos sin considerar en absoluto como asignarlos después a las
unidades experimentales.

Reproducción. (También se llama replicación)

• Proporciona una estimación del error experimental.


• Permite obtener una estimación más precisa del efecto medio de cualquier factor.

Unidad Experimental

Unidad a la cual se le aplica un solo tratamiento (que puede ser una combinación de
muchos factores) en una reproducción del experimento.

Error Experimental

Describe la situación de no llegar a resultados idénticos con dos unidades


experimentales tratadas idénticamente y refleja:

• Errores de experimentación
• Errores de observación
• Errores de medición
• Variación del material experimental (esto es, entre unidades experimentales)
• Efectos combinados de factores extraños que pudieran influir las características
en estudio, pero respecto a los cuales no se ha llamado la atención en la
investigación.

5
El error experimental puede reducirse:

• Usando material experimental más homogéneo o por estratificación cuidadosa


del material disponible.
• Utilizando información proporcionada por variables aleatorias relacionadas.
• Teniendo más cuidado al dirigir y desarrollar el experimento.
• Usando un diseño experimental muy eficiente.

Confusión

Dos o más efectos se confunden en un experimento si es posible separar sus efectos,


cuando se lleva a cabo el subsiguiente análisis estadístico.

Aleatorización.

Asignación al azar de tratamiento a las unidades experimentales. Una suposición


frecuente en los modelos estadísticos de diseño de experimentos en que las
observaciones o los errores en ellas están distribuidos independientemente. La
aleatorización hace válida esta suposición.

“Aleatorizar todos los factores no controlados por el experimentador en el diseño


experimental y que pueden influir en los resultados serán asignados al azar a las
unidades experimentales”.

Ventajas de aleatorizar los factores no controlados:

• Transforma la variabilidad sistemática no planificada en variabilidad no


planificada o ruido aleatorio. Dicho de otra forma, aleatorizar previene contra
la introducción de sesgos en el experimento.
• Evita la dependencia entre observaciones al aleatorizar los instantes de
recogida muestral.
• Valida muchos de los procedimientos estadísticos más comunes.

Control local.

Consiste en el uso de técnicas de balanceo, bloqueo y agrupamiento de las unidades


experimentales para asegurar que el diseño usado sea el más eficiente.

Agrupamiento.

Colocación de un conjunto de unidades experimentales homogéneas en grupos, de


modo que los diferentes grupos puedan sujetarse a distintos tratamientos.

6
Bloqueo.

Distribución de las unidades experimentales en bloques, de manera que las unidades


dentro de un bloqueo sean relativamente homogéneas, de esta manera, la mayor parte de
la variación predecible entre las unidades queda confundida con el efecto de los bloques.

Balanceo.

Obtención de las unidades experimentales, el agrupamiento, el bloqueo y la asignación


de los tratamientos a las unidades experimentales de manera que resulte una
configuración balanceada.

Tratamiento o combinación de tratamientos.

Conjunto particular de condiciones experimentales que deben imponerse a una unidad


experimental dentro de los confines del diseño seleccionado.
Combinación de variantes y/o niveles de cada factor que se utiliza en una determinada
prueba.

Factor.

Una variable independiente. En la mayoría de las investigaciones se trata con más de


una variable independiente y con los cambios que ocurren en la variable independiente,
cuando varia una o mas de las variables independientes.

“Se deben dividir o particionar las unidades experimentales en grupos llamados


bloques de modo que las observaciones realizadas en cada bloque se realicen bajo
condiciones experimentales lo más parecidas posibles.
A diferencia de lo que ocurre con los factores tratamiento, el experimentador no está
interesado en investigar las posibles diferencias de la respuesta entre los niveles de los
factores bloque”.
Bloquear es una buena estrategia siempre y cuando sea posible dividir las unidades
experimentales en grupos de unidades similares.
La ventaja de bloquear un factor que se supone que tienen una clara influencia en la
respuesta pero en el que no se está interesado, es la siguiente:

• Convierte la variabilidad sistemática no planificada en variabilidad sistemática


planificada.

Con el siguiente ejemplo se trata de indicar la diferencia entre las estrategias de


aleatorizar y de bloquear en un experimento.

7
Ejemplo.

Se desea investigar las posibles diferencias en la producción de dos máquinas, cada


una de las cuales debe ser manejada por un operario.
En el planteamiento de este problema la variable respuesta es “la producción de una
máquina (en un día)”, el factor-tratamiento en el que se está interesado es el “tipo de
máquina” que tiene dos niveles y un factor nuisance es el “operario que maneja la
máquina”. En el diseño del experimento para realizar el estudio se pueden utilizar dos
estrategias para controlar el factor “operario que maneja la máquina”.

Aleatorizar: Se seleccionan al azar dos grupos de operarios y se asigna al azar cada


grupo de operarios a cada una de las dos máquinas. Finalmente se evalúa la producción
de las mismas.

Bloquear: Se introduce el factor-bloque “operario”. Se elige un único grupo de


operarios y todos ellos utilizan las dos máquinas.

¿Qué consideraciones se deben tener en cuenta al utilizar estas dos estrategias? ¿Qué
estrategia es mejor?

La factorización del diseño.

“Un diseño factorial es una estrategia experimental que consiste en cruzar los niveles
de todos los factores tratamiento en todas las combinaciones posibles”.

Ventajas de utilizar los diseños factoriales:

• Permiten detectar la existencia de efectos interacción entre los diferentes factores


tratamiento.
• Es una estrategia más eficiente que la estrategia clásica de examinar la influencia
de un factor manteniendo constantes el resto de los factores.

1.2 Etapas de un diseño de experimentos

• Enunciado o planteamiento del problema.


• Formulación de hipótesis.
• Proposición de la técnica experimental y el diseño.
• Examen de sucesos posibles y referencias en que se basan las razones para la
indagación que asegure que el experimento proporcionará la información
requerida y en la extensión adecuada.
• Consideración de los posibles resultados desde el punto de vista de los
procedimientos estadísticos que se aplicarán y para asegurar que se satisfagan las
condiciones necesarias para que sean válidos estos procedimientos.
• Ejecución del experimento.

8
• Aplicación de las técnicas estadísticas a los resultados experimentales.
• Extracción de conclusiones con medidas de la confiabilidad de las estimaciones
generadas. Deberá darse cuidadosa consideración a la validez de las conclusiones
para la población de objetos o eventos a la cual se van a aplicar.
• Valoración de la investigación completa y contrastación con otras
investigaciones del mismo problema o similares.

Lista de comprobación para planear programas de pruebas.

Obtenga un enunciado claro del problema

1. Identifique la nueva e importante área del problema.


2. Subraye el problema específico dentro de sus limitaciones usuales.
3. Defina el propósito exacto del programa de prueba.
4. Determine la relación del problema particular con la investigación total o
desarrollo del programa.
5. Reúna la información básica disponible.
6. Investigue todas las fuentes de información posible.
7. Tabule los datos pertinentes para planear el nuevo problema.
8. Diseñe el programa de prueba
9. Sostenga una conferencia respecto a todas las partes concernientes.

a. Enuncie las proposiciones por probar.


b. Especifique respecto a la magnitud de las diferencias que usted considere que
valen la pena.
c. Esboce las alternativas posibles de los sucesos.
d. Escoja los factores por estudiar.
e. Determine el rango práctico de estos factores y los niveles específicos a los
que se harán las pruebas.
f. Escoja las mediciones finales que van a hacerse.
g. Considere el efecto de variabilidad de muestreo y de la precisión de métodos
de prueba.
h. Considere las posibles interrelaciones (o interacciones) de los factores.
i. Determine las limitaciones de tiempo, costo, materiales, potencia humana,
instrumentación y otros factores y de condiciones extrañas tales como
condiciones meteorológicas.
j. Considere los aspectos de las relaciones humanas del programa.

10. Diseñe el programa en forma preliminar.

a. prepare una cédula sistemática y completa.


b. Proporcione las etapas de ejecución o adaptación de la cédula si es necesario.
c. Elimine los efectos de las variables que no están en estudio.
d. Reduzca al mínimo el número de ejecuciones del experimento.
e. Elija el método de análisis estadístico.
f. Haga las indicaciones prudentes para una acumulación ordenada de datos.

9
11. Revise el diseño con todo lo concerniente.

a. Ajuste el programa de acuerdo con los comentarios.


b. Desglose en términos precisos los pasos a seguir.

12. Planee y lleve a cabo el trabajo experimental.

1) Desarrolle métodos, materiales y equipo.


2) Aplique los métodos o técnicas.
3) Supervise y verifique los detalles modificando los métodos si es necesario.
4) Registre cualquier modificación al diseño del programa.
5) Sea cuidadoso en la colección de datos.
6) Registre el avance del programa.

13. Analice los datos.

1) Reduzca los datos registrados a forma numérica, si es necesario.


2) Aplique las técnicas adecuadas de la Estadística Matemática.

14. Interprete los resultados.

1) Considere todos los datos observados.


2) Limite las conclusiones a deducciones estrictas a partir de la evidencia
obtenida.
3) Pruebe, mediante experimentos independientes, las controversias que
susciten los datos.
4) Llegue a conclusiones, tanto respecto al significado técnico de resultados
como respecto a significación estadística.
5) Especifique lo que implican los resultados para su aplicación y para trabajos
posteriores.
6) Tome en cuente las limitaciones impuestas por los métodos usados.
7) Enuncie los resultados en términos de probabilidades verificables.

15. Prepare el reporte.

1) Describa claramente el trabajo dando antecedentes, aclaraciones pertinentes


del problema y del significado de los resultados.
2) Use métodos gráficos y tabulares para la presentación de los datos en forma
eficiente para usos futuros.
3) Suministre información suficiente para que el lector pueda verificar
resultados y sacar sus propias conclusiones.
4) Limite las conclusiones a un resumen objetivo, tal que el trabajo evidencie su
uso para consideraciones rápidas y acciones decisivas.

10
1.3 Ventajas y Desventajas de los experimentos diseñados estadísticamente

Ventajas

1. Se requiere una estrecha colaboración entre los estadísticos y el investigador o


científicos con las consiguientes ventajas en el análisis e interpretación de las
etapas del programa.
2. Se enfatiza respecto a las alternativas anticipadas y respecto a la pre-planeación
sistemática, permitiendo aun la ejecución por etapas y la producción única de datos
útiles para el análisis en combinaciones posteriores.
3. Debe enfocarse la atención a las interrelaciones y a la estimación y cuantificación
de fuentes de variabilidad en los resultados.
4. El número de pruebas requerido puede determinarse con certeza y a menudo puede
reducirse.
5. La comparación de los efectos de los cambios es más precisa debido a la
agrupación de resultados.
6. La exactitud de las conclusiones se conoce con una precisión matemáticamente
definida.

Desventajas

1. Tales diseños y sus análisis, usualmente están acompañados de enunciados basados


en el lenguaje técnico del estadístico. Sería significativos a la generalidad de la
gente, además, el estadístico no debería subestimar el valor de presentarnos los
resultados en forma gráfica. De hecho, siempre debería considerar a la
representación gráfica como un paso preliminar de un procedimiento más analítico.
2. Muchos diseños estadísticos, especialmente cuando fueron formulados por primera
vez, se han criticado como demasiado caros, complicados y que requieren mucho
tiempo. Tales críticas, cuando son válidas, deben aceptarse de buena fe y debe
hacerse un intento honesto para mejorar la situación, siempre que no sea en
detrimento de la solución del problema.

1.4 Modelos de Diseño de Experimentos

Los modelos de “Diseño de experimentos” son modelos estadísticos clásicos cuyo


objetivo es averiguar si unos determinados factores influyen en la variable de interés y,
si existe influencia de algún factor, cuantificarla. Ejemplos donde habría que utilizar
estos modelos son los siguientes:

• En el rendimiento de un determinado tipo de máquinas (unidades producidas por


día) se desea estudiar la influencia del trabajador que la maneja y la marca de la
máquina.

11
• Se quiere estudiar la influencia del tipo de pila eléctrica y de la marca en la
duración de las pilas.
• Una compañía telefónica está interesada en conocer la influencia de varios
factores en la variable de interés “la duración de una llamada telefónica”. Los
factores que se consideran son los siguientes: hora a la que se produce la
llamada; día de la semana en que se realiza la llamada; zona de la ciudad desde la
que se hace la llamada; sexo del que realiza la llamada; tipo de teléfono (público
o privado) desde el que se realiza la llamada.
• Una compañía de software está interesada en estudiar la variable “porcentaje que
se comprime un fichero al utilizar un programa que comprime ficheros” teniendo
en cuenta el tipo de programa utilizado y el tipo de fichero que se comprime.
• Se quiere estudiar el rendimiento de los alumnos en una asignatura y, para ello,
se desean controlar diferentes factores: profesor que imparte la asignatura;
método de enseñanza; sexo del alumno.

La metodología del diseño de experimentos se basa en la experimentación. Es


conocido que si se repite un experimento, en condiciones indistinguibles, los resultados
presentan variabilidad que puede ser grande o pequeña. Si la experimentación se realiza
en un laboratorio donde la mayoría de las causas de variabilidad están muy controladas,
el error experimental será pequeño y habrá poca variación en los resultados del
experimento. Pero si se experimenta en procesos industriales, administrativos, u otros la
variabilidad es grande en la mayoría de los casos.
El objetivo del diseño de experimentos es estudiar si utilizar un determinado
tratamiento produce una mejora en el proceso o no. Para ello se debe experimentar
utilizando el tratamiento y no utilizándolo. Si la variabilidad experimental es grande,
sólo se detectará la influencia del uso del tratamiento cuando éste produzca grandes
cambios en relación con el error de observación.

La metodología del Diseño de Experimentos estudia cómo variar las condiciones


habituales de realización de un proceso empírico para aumentar la probabilidad de
detectar cambios significativos en la respuesta, de esta forma se obtiene un mayor
conocimiento del comportamiento del proceso de interés.

Para que la metodología de diseño de experimentos sea eficaz es fundamental que el


experimento esté bien diseñado.
Un experimento se realiza por alguno de los siguientes motivos:

• Determinar las principales causas de variación en la respuesta.


• Encontrar las condiciones experimentales con las que se consigue un valor
extremo en la variable de interés o respuesta.
• Comparar las respuestas en diferentes niveles de observación de variables
controladas.
• Obtener un modelo estadístico-matemático que permita hacer predicciones de
respuestas futuras.

12
La utilización de los modelos de diseño de experimentos se basa en la experimentación
y en el análisis de los resultados que se obtienen en un experimento bien planificado. En
muy pocas ocasiones es posible utilizar estos métodos a partir de datos disponibles o
datos históricos, aunque también se puede aprender de los estudios realizados a partir de
datos recogidos por observación, de forma aleatoria y no planificada. En el análisis
estadístico de datos históricos se pueden cometer diferentes errores, los más comunes
son los siguientes:

¾ Inconsistencia de los datos. Los procesos cambian con el tiempo, se


producen cambios en el personal (cambios de personas, mejoras del
personal por procesos de aprendizaje, motivación,...), cambios en las
máquinas (reposiciones, reparaciones, envejecimiento,...). Estos cambios
tienen influencia en los datos recogidos, lo que hace que los datos
históricos sean poco fiables, sobre todo si se han recogido en un amplio
espacio de tiempo.

¾ Variables con fuerte correlación. Puede ocurrir que en el proceso existan


dos o más variables altamente correlacionadas que pueden llevar a
situaciones confusas. Por ejemplo, en el proceso hay dos variables X1 y X2
fuertemente correlacionadas que influyen en la respuesta, pero si en los
datos que se tiene aumenta al mismo tiempo el valor de las dos variables no
es posible distinguir si la influencia es debida a una u otra o a ambas
variables (confusión de los efectos). Otra situación problemática se
presenta si solo se dispone de datos de una variable (por ejemplo de X1 y no
de X2), lo que puede llevar a pensar que la variable influyente es la X1
cuando, en realidad, la variable influyente es la X2 (variable oculta).

¾ El rango de las variables controladas es limitado. Si el rango de una de


las variables importantes e influyentes en el proceso es pequeño, no se
puede saber su influencia fuera de ese rango y puede quedar oculta su
relación con la variable de interés o los cambios que se producen en la
relación fuera del rango observado. Esto suele ocurrir cuando se utilizan los
datos recogidos al trabajar el proceso en condiciones normales y no se
experimenta (cambiando las condiciones de funcionamiento) para observar
el comportamiento del proceso en situaciones nuevas.

1.5 Tipos de variabilidad

Uno de los principales objetivos de los modelos estadísticos y, en particular, de los


modelos de diseño de experimentos, es controlar la variabilidad de un proceso
estocástico que puede tener diferente origen. De hecho, los resultados de cualquier
experimento están sometidos a tres tipos de variabilidad cuyas características son las
siguientes:

13
¾ Variabilidad sistemática y planificada. Esta variabilidad viene originada por
la posible dispersión de los resultados debida a diferencias sistemáticas entre
las distintas condiciones experimentales impuestas en el diseño por expreso
deseo del experimentador. Es el tipo de variabilidad que se intenta identificar
con el diseño estadístico.
Cuando este tipo de variabilidad está presente y tiene un tamaño importante,
se espera que las respuestas tiendan a agruparse formando grupos (clusters).
Es deseable que exista esta variabilidad y que sea identificada y cuantificada
por el modelo.

¾ Variabilidad típica de la naturaleza del problema y del experimento. Es la


variabilidad debida al ruido aleatorio. Este término incluye, entre otros, a la
componente de variabilidad no planificada denominada error de medida. Es
una variabilidad impredecible e inevitable.
Esta variabilidad es la causante de que si en un laboratorio se toman medidas
repetidas de un mismo objeto ocurra que, en muchos casos, la segunda medida
no sea igual a la primera y, más aún, no se puede predecir sin error el valor de
la tercera. Sin embargo, bajo el aparente caos, existe un patrón regular de
comportamiento en esas medidas: todas ellas tenderán a fluctuar en torno a un
valor central y siguiendo un modelo de probabilidad que será importante
estimar.
Esta variabilidad es inevitable pero, si el experimento ha sido bien
planificado, es posible estimar (medir) su valor, lo que es de gran importancia
para obtener conclusiones y poder hacer predicciones.
Es una variabilidad que va a estar siempre presente pero que es tolerable.

¾ Variabilidad sistemática y no planificada. Esta variabilidad produce una


variación sistemática en los resultados y es debida a causas desconocidas y no
planificadas. En otras palabras, los resultados están siendo sesgados
sistemáticamente por causas desconocidas. La presencia de esta variabilidad
supone la principal causa de conclusiones erróneas y estudios incorrectos al
ajustar un modelo estadístico.
Como se estudiará posteriormente, existen dos estrategias básicas para tratar
de evitar la presencia de este tipo de variabilidad: la aleatorización y la técnica
de bloques.
Este tipo de variabilidad debe de intentar evitarse y su presencia lleva a
conclusiones erróneas.

1.6 Planificación de un experimento

La experimentación forma parte natural de la mayoría de las investigaciones científicas


e industriales, en muchas de las cuales, los resultados del proceso de interés se ven
afectados por la presencia de distintos factores, cuya influencia puede estar oculta por la
variabilidad de los resultados maestrales. Es fundamental conocer los factores que

14
influyen realmente y estimar esta influencia. Para conseguir esto es necesario
experimentar, variar las condiciones que afectan a las unidades experimentales y
observar la variable respuesta. Del análisis y estudio de la información recogida se
obtienen las conclusiones.
La forma tradicional que se utilizaba en la experimentación, para el estudio de estos
problemas, se basaba en estudiar los factores uno a uno, esto es, variar los niveles de un
factor permaneciendo fijos los demás. Esta metodología presenta grandes
inconvenientes:

• Es necesario un gran número de pruebas.


• Las conclusiones obtenidas en el estudio de cada factor tiene un campo de
validez muy restringido.
• No es posible estudiar la existencia de interacción entre los factores.
• Es inviable, en muchos casos, por problemas de tiempo o costo.

Las técnicas de diseño de experimentos se basan en estudiar simultáneamente los


efectos de todos los factores de interés, son más eficaces y proporcionan mejores
resultados con un menor coste.
A continuación se enumeran las etapas que deben seguirse para una correcta
planificación de un diseño experimental, etapas que deben ser ejecutadas de forma
secuencial. También se introducen algunos conceptos básicos en el estudio de los
modelos de diseño de experimentos.
Las etapas a seguir en el desarrollo de un problema de diseño de experimentos son las
siguientes:

1) Definir los objetivos del experimento.


2) Identificar todas las posibles fuentes de variación, incluyendo:

• Factores tratamientos y sus niveles.


• Unidades experimentales.
• Factores nuisance (molestos): factores bloque, factores ruido y covariables.

3) Elegir una regla de asignación de las unidades experimentales a las condiciones de


estudio (tratamientos).
4) Especificar las medidas con que se trabajará (la respuesta), el procedimiento
experimental y anticiparse a las posibles dificultades.
5) Ejecutar un experimento piloto.
6) Especificar el modelo.
7) Esquematizar los pasos del análisis.
8) Determinar el tamaño muestral.
9) Revisar las decisiones anteriores. Modificarlas si se considera necesario.

Los pasos del listado anterior no son independientes y en un determinado momento


puede ser necesario volver atrás y modificar decisiones tomadas en algún paso previo.

15
A continuación se hace una breve descripción de las decisiones que hay que tomar en
cada uno de los pasos enumerados. Sólo después de haber tomado estas decisiones se
procederá a realizar el experimento.

1) Definir los objetivos del experimento

Se debe hacer una lista completa de las preguntas concretas a las que debe dar
respuesta el experimento. Es importante indicar solamente cuestiones fundamentales
ya que tratar de abordar problemas colaterales puede complicar innecesariamente el
experimento.
Una vez elaborada la lista de objetivos, puede ser útil esquematizar el tipo de
conclusiones que se espera obtener en el posterior análisis de datos.
Normalmente la lista de objetivos es refinada a medida que se van ejecutando las
etapas del diseño de experimentos.

2) Identificar todas las posibles fuentes de variación

Una fuente de variación es cualquier “cosa” que pueda generar variabilidad en la


respuesta. Es recomendable hacer una lista de todas las posibles fuentes de variación
del problema, distinguiendo aquellas que, a priori, generarán una mayor variabilidad.
Se distinguen dos tipos:

- Factores tratamiento: Son aquellas fuentes cuyo efecto sobre la respuesta


es de particular interés para el experimentador.
- Factores “nuisance”: Son aquellas fuentes que no son de interés directo
pero que se contemplan en el diseño para reducir la variabilidad no
planificada.

A continuación se precisan más estos importantes conceptos.

1) Factores y sus niveles

Se denomina factor tratamiento a cualquier variable de interés para el


experimentador cuyo posible efecto sobre la respuesta se quiere estudiar.

Los niveles de un factor tratamiento son los tipos o grados específicos del factor
que se tendrán en cuenta en la realización del experimento.
Los factores tratamiento pueden ser cualitativos o cuantitativos.

Ejemplos de factores cualitativos y sus niveles respectivos son los siguientes:

• Proveedor (diferentes proveedores de una materia prima).


• Tipo de máquina (diferentes tipos o marcas de máquinas).
• Trabajador (los trabajadores encargados de hacer una tarea).

16
• Tipo de procesador (los procesadores de los que se quiere comparar su
velocidad de ejecución).
• Un aditivo químico (diferentes tipos de aditivos químicos).
• El sexo (hombre y mujer).
• Un método de enseñanza (un número determinado de métodos de
enseñanza cuyos resultados se quieren comparar).

Ejemplos de factores cuantitativos son los siguientes:

• Tamaño de memoria (diferentes tamaños de memoria de ordenadores).


• Droga (distintas cantidades de la droga).
• La temperatura (conjuntos de temperaturas seleccionadas en unos rangos de
interés).

Debe tenerse en cuenta que en el tratamiento matemático de los modelos de


diseño de experimento los factores cuantitativos son tratados como cualitativos y
sus niveles son elegidos equiespaciados o se codifican. Por lo general, un factor no
suele tener más de cuatro niveles.

Cuando en un experimento se trabaja con más de un factor, se denomina:

Tratamiento a cada una de las combinaciones de niveles de los distintos factores.

Observación es una medida en las condiciones determinadas por uno de los


tratamientos.

Experimento factorial es el diseño de experimentos en que existen observaciones


de todos los posibles tratamientos.

2) Unidades experimentales

Son el material donde evaluar la variable respuesta y al que se le aplican los


distintos niveles de los factores tratamiento.

Ejemplos de unidades experimentales son:

• En informática, ordenadores, páginas Web, buscadores de Internet.


• En agricultura, parcelas de tierra.
• En medicina, individuos humanos u animales.
• En industria, lotes de material, trabajadores, máquinas.

Cuando un experimento se ejecuta sobre un período de tiempo de modo que las


observaciones se recogen secuencialmente en instantes de tiempo determinados,
entonces los propios instantes de tiempo pueden considerarse unidades
experimentales.

17
Es muy importante que las unidades experimentales sean representativas de la
población sobre la que se han fijado los objetivos del estudio. Por ejemplo, si se
utilizan los estudiantes universitarios de un país como unidades experimentales,
las conclusiones del experimento no son extrapolables a toda la población adulta
del país.

3) Factores “nuisance”: bloques, factores ruido y covariables

En cualquier experimento, además de los factores tratamiento cuyo efecto


sobre la respuesta se quiere evaluar, también influyen otros factores, de escaso
interés en el estudio, pero cuya influencia sobre la respuesta puede aumentar
significativamente la variabilidad no planificada. Con el fin de controlar esta
influencia pueden incluirse en el diseño nuevos factores que, atendiendo a su
naturaleza, pueden ser de diversos tipos.

Factor bloque. En algunos casos el factor nuisance puede ser fijado en distintos
niveles, de modo que es posible controlar su efecto a esos niveles. Entonces la
forma de actuar es mantener constante el nivel del factor para un grupo de
unidades experimentales, se cambia a otro nivel para otro grupo y así
sucesivamente. Estos factores se denominan factores de bloqueo (factores-
bloque) y las unidades experimentales evaluadas en un mismo nivel del bloqueo
se dice que pertenecen al mismo bloque. Incluso cuando el factor nuisance no es
medible, a veces es posible agrupar las unidades experimentales en bloques de
unidades similares: parcelas de tierra contiguas o períodos de tiempo próximos
probablemente conduzcan a unidades experimentales más parecidas que parcelas
o períodos distantes.

Desde un punto de vista matemático el tratamiento que se hace de los factores-


bloque es el mismo que el de los factores-tratamiento en los que no hay
interacción, pero su concepto dentro del modelo de diseño de experimentos es
diferente. Un factor-tratamiento es un factor en el que se está interesado en
conocer su influencia en la variable respuesta y un factor-bloque es un factor en
el que no se está interesado en conocer su influencia pero se incorpora al diseño
del experimento para disminuir la variabilidad residual del modelo.

Covariable. Si el factor nuisance es una propiedad cuantitativa de las unidades


experimentales que puede ser medida antes de realizar el experimento (el tamaño
de un fichero informático, la presión sanguínea de un paciente en un experimento
médico o la acidez de una parcela de tierra en un experimento agrícola). El factor
se denomina covariable y juega un papel importante en el análisis estadístico.

Ruido. Si el experimentador está interesado en la variabilidad de la respuesta


cuando se modifican las condiciones experimentales, entonces los factores
nuisance son incluidos deliberadamente en el experimento y no se aísla su efecto
por medio de bloques. Se habla entonces de factores ruido.

En resumen, las posibles fuentes de variación de un experimento son:

18
Fuente Tipo
Debida a las condiciones de Planificada y sistemática
interés (Factores tratamiento)
Debida al resto de condiciones Planificada y sistemática
controladas (Factores “nuisance”)
Debida a condiciones no No planificada, pero
controladas (error de medida, ¿sistemática?
material experimental,...)

1.7 Elegir una regla de asignación de las unidades experimentales a las


condiciones de estudio (“tratamientos”)

La regla de asignación o diseño experimental especifica que unidades experimentales


se observarán bajo cada tratamiento. Hay diferentes posibilidades:

• Diseño factorial o no.


• Anidamiento.
• Asignación al azar en determinados niveles de observación.
• El orden de asignación, etc.

En la práctica, existen una serie de diseños estándar que se utilizan en la mayoría de


los casos.

1.8 Especificar las medidas que se realizarán (la “respuesta”), el


procedimiento experimental y anticiparse a las posibles dificultades

Variable respuesta o variable de interés. Los datos que se recogen en un experimento


son medidas de una variable denominada variable respuesta o variable de interés.
Es importante precisar de antemano cuál es la variable respuesta y en qué unidades se
mide. Naturalmente, la respuesta está condicionada por los objetivos del experimento.
Por ejemplo, si se desea detectar una diferencia de 0.05 gramos en la respuesta de dos
tratamientos no es apropiado tomar medidas con una precisión próxima al gramo.
A menudo aparecen dificultades imprevistas en la toma de datos. Es conveniente
anticiparse a estos imprevistos pensando detenidamente en los problemas que se pueden
presentar o ejecutando un pequeño experimento piloto (etapa 5). Enumerar estos
problemas permite en ocasiones descubrir nuevas fuentes de variación o simplificar el
procedimiento experimental antes de comenzar.
También se debe especificar con claridad la forma en que se realizarán las mediciones:
instrumentos de medida, tiempo en el que se harán las mediciones, etc.

19
1.9 Ejecutar un experimento piloto

Un experimento piloto es un experimento que utiliza un número pequeño de


observaciones. El objetivo de su ejecución es ayudar a completar y chequear la lista de
acciones a realizar. Las ventajas que proporciona la realización de un pequeño
experimento piloto son las siguientes:

• Permite practicar la técnica experimental elegida e identificar problemas no


esperados en el proceso de recogida de datos.
• Si el experimento piloto tiene un tamaño suficientemente grande puede ayudar
a seleccionar un modelo adecuado al experimento principal.
• Los errores experimentales observados en el experimento piloto pueden ayudar
a calcular el número de observaciones que se precisan en el experimento
principal.

1.10 Especificar el modelo

El modelo matemático especificado debe indicar la relación que se supone que existe
entre la variable respuesta y las principales fuentes de variación identificadas en el (paso
2). Es fundamental que el modelo elegido se ajuste a la realidad con la mayor precisión
posible.
Los modelos de diseño de experimentos, según sean los factores incluidos en el
mismo, se pueden clasificar en: modelo de efectos fijos, modelo de efectos aleatorios y
modelos mixtos. A continuación se precisan estas definiciones.

Factor de efectos fijos: Es un factor en el que los niveles han sido seleccionados por el
experimentador. Es apropiado cuando el interés se centra en comparar el efecto sobre la
respuesta de esos niveles específicos.
Ejemplo: Un empresario está interesado en comparar el rendimiento de tres máquinas
del mismo tipo que tiene en su empresa.

Factor de efectos aleatorios: Es un factor del que sólo se incluyen en el experimento una
muestra aleatoria simple de todos los posibles niveles del mismo. Evidentemente se
utilizan estos factores cuando tienen un número muy grande de niveles y no es razonable
o posible trabajar con todos ellos. En este caso se está interesado en examinar la
variabilidad de la respuesta debida a la población entera de niveles del factor.
Ejemplo: Una cadena de hipermercados que tiene en plantilla 300 trabajadores de caja
está interesada en estudiar la influencia del factor trabajador en la variable “tiempo en el
cobro a un cliente”.

Modelo de efectos fijos: Es un modelo en el que todos los factores son factores de
efectos fijos.

20
Modelo de efectos aleatorios: Es un modelo en el que todos los factores son factores de
efectos aleatorios.

Modelo mixto: Es un modelo en el que hay factores de efectos fijos y factores de


efectos aleatorios.

1.11 Esquematizar los pasos del análisis estadístico

El análisis estadístico a realizar depende de:

• Los objetivos indicados en el paso 1.


• El diseño seleccionado en el paso 3.
• El modelo asociado que se especificó en el paso 5.

Se deben esquematizar los pasos del análisis a realizar que deben incluir:

• Estimaciones que hay que calcular.


• Contrastes a realizar.
• Intervalos de confianza que se calcularán.
• Diagnosis y crítica del grado de ajuste del modelo a la realidad.

1.11.1 Determinar el tamaño muestral

Calcular el número de observaciones que se deben tomar para alcanzar los


objetivos del experimento.
Existen, dependiendo del modelo, algunas fórmulas para determinar este tamaño.
Todas ellas sin embargo requieren el conocimiento del tamaño de la variabilidad no
planificada (no sistemática y sistemática, si es el caso) y estimarlo a priori no es
fácil, siendo aconsejable sobreestimarla. Normalmente se estima a partir del
experimento piloto y en base a experiencias previas en trabajos con diseños
experimentales semejantes.

1.11.2 Revisar las decisiones anteriores. Modificar si es necesario

De todas las etapas enumeradas, el proceso de recogida de datos suele ser la tarea
que mayor tiempo consume, pero es importante realizar una planificación previa,
detallando los pasos anteriores, lo que garantizará que los datos sean utilizados de la
forma más eficiente posible.
Es fundamental tener en cuenta que:

21
“Ningún método de análisis estadístico, por sofisticado que sea, permite extraer
conclusiones correctas en un diseño de experimentos mal planificado”.

Recíprocamente, debe quedar claro que el análisis estadístico es una etapa más que
está completamente integrado en el proceso de planificación.

“El análisis estadístico no es un segundo paso independiente de la tarea de


planificación. Es necesario comprender la totalidad de objetivos propuestos antes de
comenzar con el análisis. Si no se hace así, tratar que el experimento responda a
otras cuestiones a posteriori puede ser (lo será casi siempre) imposible”.

Pero no sólo los objetivos están presentes al inicio del análisis sino también la
técnica experimental empleada. Una regla de oro en la experimentación y que debe
utilizarse es la siguiente:

“No invertir nunca todo el presupuesto en un primer conjunto de experimentos y


utilizar en su diseño toda la información previa disponible”.

Finalmente indicar que todas las personas que trabajan en el experimento se deben
implicar en el mismo, esto es:

“Toda persona implicada en la ejecución del experimento y en la recolección de los


datos debe ser informada con precisión de la estrategia experimental diseñada”.

1.12 Resumen de los principales conceptos

En esta sección se hace un resumen de la terminología común utilizada en la teoría de


los modelos de diseño de experimentos:

Unidad experimental: Son los objetos, individuos, intervalos de espacio o tiempo sobre
los que se experimenta.

Variable de interés o respuesta: Es la variable que se desea estudiar y controlar su


variabilidad.

Factor: Son las variables independientes que pueden influir en la variabilidad de la


variable de interés.

Factor tratamiento: Es un factor del que interesa conocer su influencia en la respuesta.

Factor bloque: Es un factor en el que no se está interesado en conocer su influencia en la


respuesta pero se supone que ésta existe y se quiere controlar para disminuir la
variabilidad residual.

22
Niveles: Cada uno de los resultados de un factor. Según sean elegidos por el
experimentador o elegidos al azar de una amplia población se denominan factores de
efectos fijos o factores de efectos aleatorios.

Tratamiento: Es una combinación específica de los niveles de los factores en estudio.


Son, por tanto, las condiciones experimentales que se desean comparar en el
experimento. En un diseño con un único factor son los distintos niveles del factor y en
un diseño con varios factores son las distintas combinaciones de niveles de los factores.

Observación experimental: Es cada medición de la variable respuesta.

Tamaño del experimento: Es el número total de observaciones recogidas en el diseño.

Interacción de factores: Existe interacción entre dos factores FI y FJ si el efecto de algún


nivel de FI cambia al cambiar de nivel en FJ. Esta definición puede hacerse de forma
simétrica y se puede generalizar a interacciones de orden tres o superior.

Ortogonalidad de factores: Dos factores FI y FJ con I y J niveles, respectivamente, son


ortogonales si en cada nivel I de FI el número de observaciones de los J niveles de FJ
están en las mismas proporciones. Esta propiedad permite separar los efectos simples de
los factores en estudio.

Diseño equilibrado o balanceado: Es el diseño en el que todos los tratamientos son


asignados a un número igual de unidades experimentales.

1.13 Algunos diseños experimentales clásicos

Un diseño experimental es una regla que determina la asignación de las unidades


experimentales a los tratamientos. Aunque los experimentos difieren unos de otros en
muchos aspectos, existen diseños estándar que se utilizan con mucha frecuencia.
Algunos de los más utilizados son los siguientes:

• Diseño Completamente Aleatorizado.


• Diseño en Bloques Completamente al azar.
• Diseño Cuadrado Latino.
• Diseños Factoriales.
• Diseños 2k.
• Diseños de Parcelas Divididas.
• Diseños Jerárquicos.

23
Capítulo 2 Diseños unifactoriales, bifactoriales y trifactoriales.
♦ Diseño Completamente al Azar.
♦ Diseño de Bloques Completamente al Azar.
♦ Diseño Cuadrado Latino.
♦ Diseño de Bloques Incompletos.

2.1 Diseño Completamente al Azar

El diseño completamente al azar (DCA) es el más simple de todos los diseños. Es un


diseño en el cual los tratamientos son asignados aleatoriamente a las unidades
experimentales sin ningún tipo de restricción. Este diseño es utilizado cuando las unidades
experimentales son bastante homogéneas, es decir, cuando la variabilidad entre ellas es
pequeña y no existe ningún criterio de bloqueo que permita disminuirla. Dado que los
tratamientos constituyen el único criterio de clasificación para las unidades
experimentales, a este diseño se le conoce también como diseño de clasificación de una
vía (One Way).

Se verán los casos paramétrico y no paramétrico del DCA, el análisis de la varianza y las
pruebas de comparación de medias de tratamientos.

2.1.1 Ventajas, desventajas y usos del DCA.

Ventajas

− Es un diseño flexible en tanto que el número de tratamientos y de repeticiones solo


está limitado por el número de unidades experimentales.
− El número de repeticiones puede variar entre tratamientos aunque generalmente lo
ideal es tener un número igual para cada tratamiento.
- El análisis estadístico es simple ya sea cuando todos los tratamientos tengan igual
número de réplicas (balanceado), diferente número de réplicas (desbalanceado) o
pérdida de datos, caso en el cual se trata como un análisis desbalanceado.
− El número de grados de libertad para estimar el error experimental es máximo:
Ocurre porque el diseño tiene solo dos fuentes de variación que son los
tratamientos y el error y los grados de libertad para este error están dados por la
expresión k(n- 1). Esto mejora la precisión del experimento.
− En el caso en que se hayan perdido algunos datos, el método de análisis sigue
siendo sencillo y la pérdida relativa de información es de menor importancia que
en cualquier otro diseño.

24
Desventajas

− Solo se aplica en situaciones en las que el material experimental es homogéneo.


− Dado que no hay restricciones de aleatoriedad toda la variabilidad existente en las
unidades experimentales tratadas en el mismo tratamiento estará incluida en el
error experimental.

Usos

− Es recomendado cuando es posible que gran parte de las unidades experimentales


no respondan al tratamiento o puedan perderse durante el experimento.
− Es útil en experimentos en los que el número de unidades experimentales es
limitado, ya que provee el máximo número de grados de libertad del error.

2.1.2 Aleatorización y Croquis Experimental

Como ya se mencionó, en este diseño no existe ninguna restricción de aleatoriedad por


lo que la asignación de los tratamientos a las unidades experimentales será
completamente aleatoria (Esto quiere decir que cualquier distribución de los tratamientos
en las unidades experimentales es igualmente probable), y permite:

1) La validación del error experimental.


2) Evita sesgos.
3) Garantiza la independencia de los errores.

Para lograr la asignación aleatoria de los tratamientos se puede utilizar cualquier


método de generación de números aleatorios como los que mostramos a continuación:

1) La tabla de números al azar.

Explicación:
Suponga que se tienen N= 16 unidades experimentales (u.e) homogéneas, para un
experimento bajo un DCA con t= 4 tratamientos y r= 4 réplicas. Inicialmente asigne los
dígitos 01, 02, . . ., 16 a las u.e, ubique la punta de su lápiz aleatoriamente en cualquier
lugar de la tabla de números aleatorios, por decir en la fila 26 columna 4 donde aparece
el número 24878, a partir de lo dos primeros dígitos (24) empiece a recorrer en cualquier
sentido, suponga que se hace hacia abajo de la columna donde está el número 24,
registre los números de dos cifras (o de tres cifras cuando los rótulos de las u.e tengan
tres cifras) que estén entre 1 y 16 inclusive. En este caso son: 04, 02, 01, 14, continuando
desde la parte inferior de la columna (6) hacia arriba se obtiene: 06, 13, 10, 11 siga a la
parte superior de la columna (7): 15, 09, 16, 07, continuando se asignan las otras cuatro:
03, 08, 05, 12. Por lo que al tratamiento 1 se le siguientes cuatro: 04, 02, 01, 14 al
tratamiento 2 las siguientes cuatro: 06, 13, 10, 11 las restantes al: 15, 09, 16, 07 y al
tratamiento 3 las restantes 03, 08, 05, 12.

25
2) Modelo de urnas.

Explicación:

Suponga que se tienen N= 16 unidades experimentales (u.e) homogéneas, para un


experimento bajo un DCA con t= 4 tratamientos y r= 4 réplicas. Marque las 16 unidades
experimentales con los números 1, 2, 3, ...,16. Luego rotule unos papelitos con los
números k =1, 2, 3, ...,16, colóquelos en una bolsa. Seleccione un papelito y márquelo
por el reverso de donde esta marcado con el número (11), deje este papelito fuera de la
bolsa. Proceda nuevamente a seleccionar otro papelito y márquelo ahora con el número
(12). Continúe este proceso hasta que queden marcados todos los papelitos como 11,
12,..., 4, 21,22,..., 24, 31, 32, ...,34. Si un papelito está rotulado 4 y por el reverso con la
etiqueta (3,2), entonces la unidad experimental marcada con el número 4 recibirá el
tratamiento 3 y 2 será la réplica.

3) Sistema de cómputo (aunque los números generados por calculadoras y computadoras


no son estrictamente aleatorios sino solo pseudo aleatorios, son aceptables).

Explicación:

Mediante la opción Ram#, la cual genera números aleatorios entre 0 y 1. Si usted tiene
16 unidades experimentales y 4 tratamientos de 4 réplicas cada uno, se enumeran las
unidades experimentales de 01 a 16, luego active la función con Shift, Ran# que produce
por ejemplo el número 0.3047432316, usted debe seleccionar los dos primeros dígitos,
en este caso es 30 pero no existe una u.e rotulada con este número por tanto debemos
generar otro número aleatorio activando nuevamente Shift, Ran# suponga que se obtiene
0.0800937965, así la primera u.e del primer grupo será la rotulada con el número 08.
Continué este proceso hasta obtener las cinco primeras u.e del primer grupo y así
sucesivamente hasta obtener las u.e de los demás grupos. Asigne las primeras 4 u.e al
tratamiento 1 y así para los demás tratamientos.

2.1.3 Presentación de los datos

Al arreglar el material experimental de manera aleatoria utilizando un procedimiento


de aleatorización para el caso de un experimento con 16 unidades experimentales (u. e.)
y 4 tratamientos y 4 réplicas por tratamiento usted puede obtener por ejemplo el
siguiente arreglo:

26
Tratamientos
T1 T2 …. Tk
Y11 Y21 …. Yk
Réplicas 1
Y12 Y22 …. Yk
2
…. …. …. ….
Y1n1 Y2n2 …. Yknk
Ti · T1 · T2 · …. Tk · T· ·

2.1.4 Modelo matemático del diseño lineal

El modelo aditivo lineal para un diseño completamente al azar es el siguiente:

Yij = µ + α i + ε ij i = 1,....., k j = 1,...., ni


donde:
Yij es el valor o rendimiento observado en el i-ésimo tratamiento, j-ésima repetición.
µ es el efecto de la media general.
α i es el efecto del i-ésimo tratamiento, definido como la diferencia entre la media del
i-ésimo tratamiento y la media global; esto es, α i = µi-µ.
ε ij es el efecto del error experimental en el i-ésimo tratamiento, j-ésima repetición, la
cual cumple los supuestos: (i) Normalidad con media cero (ii) Independencia (iii)
Homogeneidad de varianza.
k es el número de tratamientos.
ni es el número de repeticiones para el i-ésimo tratamiento

Ejemplo 1: Se realizó un experimento para evaluar el efecto de la adicción de


compuestos vitamínicos al alimento balanceado en la ganancia de peso en cerdos. Tres
diferentes compuestos fueron evaluados (A, B y C) y un control (D –sin la adicción de
compuesto vitamínico). El aumento de peso tras una semana en una muestra aleatoria de
22 cerdos se da a continuación:

Compuesto Aumento de peso


Vitamínico tras una semana en lb

A 11.1 10.9 10.8 10.2 11.4 10.7


B 11.5 11 10.8 10.6 11.2 10.9
C 10.1 10.6 11.2 10.2 10.4
D 9.2 9.8 10.1 9.7 10.4

27
Este experimento fue conducido bajo los lineamientos de un DCA, por lo que el
modelo aditivo es el siguiente:

Yij = µ + α i + ε ij i = 1,....., k j = 1,...., ni

donde:
Yij es la ganancia de peso obtenida en el j-ésimo cerdo alimentado con el i-ésimo
compuesto vitamínico.
µ es el efecto de la media general de peso.
α i es el efecto del i-ésimo compuesto vitamínico.
ε ij es el efecto del error experimental con el j-ésimo cerdo alimentado con el i-ésimo
complejo vitamínico.
k = 4 (Número de tratamientos)
n1 = 6, n 2 = 6, n3 = 5, n 4 = 5 (número de repeticiones por tratamiento).

2.1.5 Supuestos del Modelo Estadístico

El modelo estadístico debe cumplir con los siguientes supuestos:

1) Aditividad: Los efectos del modelo son aditivos.


2) Linealidad: Las relaciones entre los efectos del modelo son lineales.
3) Normalidad: Los errores del modelo deben tener una distribución normal con
media cero y varianza σ2.
4) Independencia: Los resultados obtenidos en el experimento son
independientes entre sí.
5) Homogeneidad de la Varianza: Las diferentes poblaciones generadas por la
aplicación de los diferentes tratamientos tienen variancias iguales (σ2).

Más adelante se presentarán pruebas estadísticas para evaluar los supuestos de


normalidad de errores y de homogeneidad de varianzas.

2.1.6 ¿Cómo obtener los residuales?

Para que el análisis a realizar sea válido es necesario determinar si los datos
experimentales obtenidos evidencian el cumplimiento de los supuestos del modelo,
para lo cual se debe obtener todos los residuales y con estos realizar las pruebas de
normalidad con media cero, independencia y homogeneidad de varianza.

28
El residual de cada respuesta Yij es denotado por ε ij y se pueden obtener
calculando la diferencia entre el valor real y el valor estimado por el modelo; es
decir,
ε ij = yij − yˆ ij
ε ij = respuesta observada − respuesta teórica estimada

Donde el valor de la respuesta teórica estimada según el modelo, ŷ ij es obtenido


como el estimado del valor esperado de una respuesta según el modelo, esto es:

(1)

Pero como Yij = µ + α i + ε ij entonces reemplazando en la expresión anterior se


tiene que el valor esperado del modelo, E ( µ + α i + ε ij ) es determinado como

E ( µ + α i + ε ij ) = E ( µ ) + E (α i ) + E (ε ij )

Se conoce que µ y αi son parámetros y por tanto constantes entonces su valor


esperado es el mismo: E(µ)=µ y E (α i ) = α i . También de los supuestos del modelo
se tiene que la variable error εij se distribuye normal con media (o valor esperado)
cero, E(εij)=0. Luego
E ( µ + α i + ε ij ) = µ + α i
Reemplazando en (1) se tiene
yˆ ij = µ + α i
= µˆ + αˆ i

Donde µ̂ es el estimador de la media global, α̂ i es el estimador del efecto del


i-ésimo tratamiento.
Vemos que se requiere encontrar los estimadores µˆ , αˆ 1 , αˆ 2 , αˆ 3 , αˆ 4 de los
parámetros del modelo: µ, α 1 , α 2 , α 3 , α 4 lo cual se hace utilizando uno de los
métodos de estimación puntual de parámetros denominado mínimos cuadrados, el
cual busca los mejores estimadores de los parámetros de tal manera que la suma de
los cuadrados de todos los residuales sea mínima; en otras palabras se puede decir
que determina la curva que mejor se acerca a los datos observados. Para aplicar el
método de mínimos cuadrados se debe:

a) Escribir la Suma de Cuadrados del error (SCerror). En este caso es dada por:

29
SC error = (ε 11 ) 2 + (ε 11 ) 2 + ....(ε 1nk ) 2
+ (ε 21 ) 2 + ......... + (ε 2nk ) 2
+ (ε 31 ) 2 + ......... + (ε 3nk ) 2
+ (ε k 1 ) 2 + ......... + (εk nk ) 2
k n
= ∑∑ (ε ij ) 2
i =1 j =1

y como ε ij = y ij − yˆ ij entonces

SC error = ( y11 − yˆ11 ) 2 + ............... + ( y1nk − yˆ1nk ) 2


+ ( y21 − yˆ 21 ) 2 + ............... + ( y2 nk − yˆ 2 nk ) 2
+ ( y31 − yˆ 31 ) 2 + ............... + ( y3 nk − yˆ 3nk ) 2
+ ( y k1 − yˆ k1 ) 2 + ............... + ( y knk − yˆ knk ) 2
k n
= ∑∑ + ( y ij − yˆ ij ) 2
i =1 j =1

pero sabemos también que: yˆ ij = µˆ − αˆ i por lo que toma la forma:


SCE = ( y11 − µˆ − αˆ 1 ) 2 + ............... + ( y14 − µˆ −2 αˆ1 )
+ ( y2 1 − µˆ − αˆ 2 ) 2 + ........... ..... + ( y2 4 − µˆ − αˆ 2 )2
+ ( yk 1 − µˆ − αˆ k ) 2 + ........... ..... + ( ykk − µˆ − αˆ k )2
k n
= ∑∑ ( y
i =1 j =1
ij − µˆ −αˆ i ) 2

Para determinar los valores de los parámetros µ y αi (i= 1, 2, …, k), se debe derivar
la suma de cuadrados del error con respecto a cada parámetro e igualar a cero y
luego resolver el sistema de k+ 1 ecuaciones. Haciendo lo anterior se llega a que los
estimadores de los parámetros son:

µˆ = Y ••
(i= 1,2, … , k)
αˆ i = Y 1• − Y ••

y así el valor estimado según el modelo para cada observación ŷ ij es dado por

yˆ ij = µˆ + αˆ i = Y •• + (Y i• − Y •• )
= Y i•

30
Es decir cada respuesta observada se puede modelar como el valor de la media del
tratamiento donde se encuentra la observación.

2.1.7 Estimación de los efectos

Los efectos del modelo son estimados por el método de Mínimos Cuadrados. Este
método permite obtener los valores de µ y αi que minimizan la suma de los errores al
cuadrado, es decir, que minimizan la siguiente expresión:

k n
Q = ∑∑ ε ij2 =∑∑ (Yij − µ − α i ) 2
i =1 j =i

Para calcular los valores de µ y αi que minimizan la suma de los errores al cuadrado,
se debe solucionar el sistema de ecuaciones obtenido al igual las derivadas parciales de
Q con respecto a µ y cada uno de los αi a cero, y la siguiente restricción adicional:

∑rα i =0

La ampliación de este método de los siguientes resultados para la estimación de los


parámetros.

µˆ = Y..
αˆ = y i , − y ..
εˆ = y ji , − y i.

Ejemplo 1 (Cont.): Con los datos del ejemplo anterior, la media estimada es:

µˆ = 10.582

Los efectos estimados de los tratamientos:

αˆ1 = Y 1• − Y •• = 10.850 − 10.582 = 0.268


αˆ 2 = Y 2• − Y •• = 11.000 − 10.582 = 0.418
αˆ 3 = Y 3• − Y •• = 10.500 − 10.582 = −0.082
αˆ 4 = Y 4• − Y •• = 9.840 − 10.582 = −0.742

El efecto estimado del error ε 42 :

31
ε 42 = Y42 − Y 4• = 9.8 − 9.840 = −0.04

2.1.8 Obtener la tabla ANOVA. Análisis de varianza de clasificación simple.

La técnica de análisis de varianza le permite al experimentador probar la hipótesis


global:

Ho: Las medias de los tratamientos son iguales.


H1: Algún par de medias de los tratamientos difieren.

Que de manera simbólica queda:


Ho: µ1 = µ2 = … =µk
H1: µi ≠ µj para algún i ≠ j; i = 1,2, …, k; j = 1,2,…., nk

2.1.8.1 Para obtener la tabla de ANOVA es necesario determinar:

a) Las fuentes de variación


En un experimento bajo un DCA con un sólo factor de, las fuentes de variación
son:
1) Tratamientos
2) Error experimental
3) Total

b) Determinar los grados de libertad de las fuentes de variación.

gltratamientos = Número de tratamientos -1 = k -1


gltotal = Número de datos -1 = n - 1
glerror = gltotal- gltratamientos =n-k

c) Determinar las sumas de cuadrados de las fuentes de variación. En general la


suma de cuadrados es dada por:

k
Ti •2
SCTrat =∑ − FC
i =1 ni

d) Determinar las sumas de cuadrados del error. En general la suma de cuadrados


es dada por:

32
k n
Ti •2 k
SC error = ∑ ∑ y − FC − (∑
2
ij − FC )
i =1 j =1 i =1 ni

d) Determinar la suma de cuadrados total. En general la suma de cuadrados total es


dada por:
k n
SCtotal = ∑∑ y ij2 − FC
i =1 j =1
e) Calcular FC.

T•2•
FC =
n
donde:
k
n = ∑ ni
i =1

f) Calcular el valor de F.

CM Trat
F= ~ Fα [(k − 1); (n − k )]
CM error

g) Expresar la tabla de ANOVA.

Causa de Suma de Grados Cuadrados


Variación cuadrados de Medios F
(SC) libertad (CM)
(gl)
SCTrat CM Trat
Tratamientos SC trat k-1 CM Trat =
k −1 CM Eror
Error SCtratamientos
Experimental SCerror n-k CM T =
k −1
Total SCtotal n-1

h) Comparación y grado de significación.

Si Fcal < Fcrít H0 no se rechaza.


Si Fcal > Fcrít H0 se rechaza.

33
Ejemplo 1 (Cont.): A continuación se presenta el análisis de varianza y la prueba de
hipótesis correspondiente para el ejemplo tratado en esta sección:

k n
SC total = ∑∑ y ij2 − FC
i =1 j =1

232.8 2
= (11.1 + 10.9 + .... + 10.4 ) −
2 2 2
= 7.1527
22

k
Ti•2
SCTrat = ∑ − FC =
i =1 ni

65.12 66 2 52.5 2 49.2 2 232.8 2


= + + + − = 4.2657
6 6 5 5 22

SC ( Error ) = SC (Total ) − SC (Trat .) = 2.8870

Cuadro ANOVA

Fuente de Gl SC CM F
variación
Tratamientos 3 4.2657 1.4219 8.87
Error 18 2.8870 0.1604
Exptal.
Total 21 7.1527

Asumiendo un modelo de efectos fijos, la hipótesis en términos de los efectos de los


tratamientos son:

Ho: αi =0 con i= 1, …., 4


H1: αi ≠ 0 para algún i

En términos de las medias de los tratamientos:

Ho: µ1 = µ2 = … =µ4
H1: µi ≠ µ para algún i

o literalmente;

Ho: Todos los compuestos vitamínicos tienen el mismo defecto en la ganancia de peso
de los cerdos.
H1: Con al menos uno de los compuestos vitamínicos se obtiene una ganancia de peso
diferente.

34
El estadístico de prueba es F = 8.87. El valor de la tabla para un nivel de significación
del 5% es F( 0.95,3.18) = 3.19 . Dado que el estadístico de prueba resulta mayor que el valor
de la tabla se rechaza Ho. En conclusión, existe suficiente evidencia estadística para
aceptar que con al menos uno de los compuestos vitamínicos se obtienen ganancias de
peso diferentes en los cerdos.

El nivel de significación usual y aceptado en investigación científica para considerar


que un efecto o diferencia es significativa es 5%. Cuando la prueba resulta significativa
con α= 1% se dice que el efecto o diferencia es altamente significativo.

2.1.9 Prueba de Duncan

MLG: Comparaciones múltiples post hoc de las medias observadas. La prueba de


rangos múltiples de Duncan, la de Student-Newman-Keuls (S-N-K) y la b de Tukey
son pruebas de rangos que asignan rangos a medias de grupo y calculan un valor de
rango. Estas pruebas no se utilizan con tanta frecuencia como las pruebas explicadas
previamente. La prueba t de Waller-Duncan utiliza una aproximación Bayesiana. Esta
prueba de rango emplea la media armónica del tamaño de la muestra cuando los
tamaños de las muestras no son iguales. La prueba de Duncan realiza comparaciones
por pares utilizando un orden por pasos idéntico al orden usado por la prueba de
Student-Newman-Keuls, pero establece un nivel de protección en la tasa de error para
la colección de contrastes, en lugar de usar una tasa de error para los contrastes
individuales. Utiliza el estadístico del rango estudentizado. La prueba Waller-Duncan
realiza la prueba de comparaciones múltiples basada en un estadístico t. Utiliza la
aproximación Bayesiana.
Se aconseja seguir los siguientes pasos:

1) Ordenar las medias en orden creciente.

P 1 2 … k
n1 n2 nk

Yj ∑y
j =1
1j ∑y
j =1
2j … ∑y
j =1
ij

n1 n2 nk

2) Calcular el error estándar de la media.


CM error
Sx =
r
r representa el número de datos por tratamientos y en este caso
n1 = n 2 = ... = n k = r .

3) Se buscan los valores críticos en la prueba de Duncan.


Llamaremos P= 2,3,…,k en n-k y un α.

35
Nota: En esta no se toma el primer tratamiento, sino que se empieza desde el
segundo.

Tabla de Duncan:

Valor P 2 3 … k
VT VT1 VT2 VTk
Rp R2 R3 … Rk

Donde:
Los valores VTi están en tablas.

R p = VT * S x

4) Se construye la tabla siguiente de doble entrada y se analiza la significación de la


diferencia de las medias.

P 2 3 … K
Rp R2 R3 … Rk
Y Ya Yb … Yk
y1 Y a − y1 Y b − y1 … Y k − y1

y2 Y a − y2 Y b − y2 … Y k − y2

… … … … …
y k −1 Y a − y k −1 Y b − y k −1 … Y k − y k −1

Los valores dentro de la tabla representan las diferencias entre las medias
( Y i − y j ). Los valores de Y i comienzan por el segundo elemento y están
ordenados de mayor a menor; y los valores y j comienzan desde el primer
elemento y no toma el último, además están ordenados de menor a mayor.

Comencemos a analizar la significación de la primera columna (P= 2)


Y i − y j y se señalan los que no presentan diferencias significativas entre si:

Entonces los tratamientos que sean señalados no tienen diferencias significativas


entre sí, y por consiguiente los restantes si presentan diferencias significativas. El
que mayor valor tiene es el tratamiento de mayor rendimiento.

36
2.1.10 Prueba de Duncan cuando las observaciones por tratamiento difieren

Llamaremos S a:

S = CM error

Si

(Y i − y j )
〉 Rp
1 1 1
( + )
2 ni n j

entonces la diferencia es significativa, siendo

Rp= S (Valor tabulado de Duncan.)

Nota: Un aspecto que debe puntualizarse es que es posible que el ANOVA rechace H0
y sin embargo al aplicar Duncan no se detectan diferencias entre las medias, esta
situación no es común pero refleja que el ANOVA es una prueba más potente que el de
Duncan. En este caso lo que sucede es que los errores de tipo II en la prueba de Duncan
son más frecuentes y mayores que el del ANOVA.

2.1.11 Coeficiente de Variación

Es una medida usada para los experimentadores para evaluar el grado de


homogeneidad de los resultados de un experimento. Para saber si un determinado
coeficiente de variación es demasiado grande o pequeño, es preciso tener experiencia
con datos similares.
En el DCA, el cuadrado medio del error (CME) es el estimador de la varianza del
experimento σ 2 y el coeficiente de variación es calculado por la siguiente expresión:

CME
cv =
Y ••

Con los datos del ejemplo, el coeficiente de variación será:

0.1604
cv = = 3.78%
10.58

37
Ejemplo 2: Se desarrolló un experimento para evaluar 4 tratamientos para la
preparación del terreno:

T1: Aplicación de herbicida.


T2: Quemado del campo.
T3: Escarificación.
T4: Control (Sin preparación del terreno)

La variable respuesta fue el tamaño de los plantones en cm. a los 30 días. Los
resultados del experimento se dan a continuación:

Tratamiento
Repetición T1 T2 T3 T4
1 25 15 12 4
2 18 22 7 6
3 29 17 8 5
4 24 17 13 9

Este experimento fue conducido bajo los lineamientos de un DCA, por lo que el
modelo aditivo lineal es el siguiente:

Yij = µ + α i + ε ij i = 1,....., k j = 1,...., ni

donde:
Yij es el tamaño de los plantones a los 30 días obtenido con el i-ésimo método de
preparación del terreno y en la j-ésima repetición.
µ es el efecto de la media general de los tamaños de los plantones.
α i es el efecto del i-ésimo método de preparación del terreno.
ε ij es el efecto del error experimental con el i-ésimo método de preparación del
terreno en la j-ésima repetición.
k = 4 (Número de tratamientos)
n = 6 (Número de repeticiones por tratamiento).

En este problema aceptamos los supuestos de normalidad y homogeneidad de varianza


y proponemos al lector la prueba de esta. El cuadro de análisis de varianza se presenta a
continuación:

Cuadro ANOVA:

Fuente de Gl SC CM F
Variación
Tratamientos 3 773.2 257.7 24.02
Error 12 128.8 10.7
Total 15 901.9

38
Ho: µ1 = µ i = 1,....,4
H1: µi ≠ µ para algún i

Como F = 24.02 > F[ 0.95,3,12 ] = 3.49 , entonces se rechaza H0 y se concluye que existe
suficiente evidencia estadística con un nivel de significación del 5% para aceptar que
con al menos uno de los tratamientos para la preparación del terreno se obtienen
resultados diferentes en el tamaño de los plantones. El coeficiente de variación en este
problema es:

10.73
cv = = 22.68%
14.44

2.1.12 Pruebas de Comparación de Medias de Tratamientos

Note que la conclusión obtenida tras un análisis de varianza significativo es que con al
menos uno de los tratamientos se obtienen resultados diferentes. Si bien esta conclusión
ya resulta valiosa, definitivamente no es suficiente. Un investigador, querrá ir más allá
en el análisis y responder preguntas tales como: ¿Con qué tratamiento se obtienen los
mejores resultados?, ¿es este tratamiento significativamente superior a los demás?, ¿es el
tratamiento A mejor que el B?. Para responder a este tipo de preguntas será necesario
realizar pruebas adicionales que permitan comparar a los distintos tratamientos, en forma
individual o por grupos, unos con otros.

A algunas de estas pruebas se les conoce también como pruebas de comparaciones


múltiples, ya que permiten efectuar un conjunto de comparaciones. Suponga por ejemplo
que usted conduce un experimento con 3 tratamientos (A, B y C). En este caso usted
podría efectuar 3 comparaciones por pares (A con B, A con C y B con C). Si tiene cuatro
tratamientos, el número de comparaciones por pares sería 6, con cinco tratamientos sería
10, y en general, con t tratamientos, el número de comparaciones por pares sería C 2t .
Debido a que se están efectuando varias pruebas de hipótesis simultáneamente y no
solo una, un problema a tener en cuenta es el de la definición del nivel de significación.
Por ejemplo, suponga que usted hace un experimento con 5 tratamientos entre los cuales
realmente no existen diferencias. En este caso la hipótesis nula de no diferencias sería
verdadera para todas las comparaciones, aunque de hecho por cuestiones de azar usted
obtendría resultados ligeramente diferentes en su experimento. Si usted realiza una
prueba para comparar dos de estos tratamientos a un nivel de significación del 5%, y
repitiera esta misma prueba con diferentes datos varias veces, encontraría diferencias
significativas en aproximadamente el 5% de las veces; pero ¿qué pasa si usted decide
comparar los dos tratamientos en los que se obtuvieron los resultados más similares?,
¿Qué pasa si usted decide comparar los dos tratamientos en los que se obtuvieron los
resultados más extremos? En el primer caso la probabilidad de encontrar diferencias

39
significativas va a ser menor a 5% y en el segundo caso mayor. Por esta razón, algunas
de las pruebas que se verán más adelante deben ser planteadas con anterioridad a la
ejecución del experimento y no sugeridas por los resultados obtenidos.

Por último, otro factor a considerar es el número de comparaciones que se están


efectuando. En el caso descrito anteriormente, con un total de cinco tratamientos, usted
efectuará 10 pruebas. Cada una de esas pruebas tendrá probabilidad de 5% de resultar en
diferencias, pero ¿Cuál es la probabilidad de que al menos una de las 10 comparaciones
resulte significativa?. Dado que realmente no existen diferencias entre los 5
tratamientos, bastará que se encuentren diferencias significativas en una de las 10
comparaciones para cometer un error. Obviamente, la probabilidad de errar en al menos
una de las 10 comparaciones será mayor al 5%. Esta característica lleva a la necesidad
de definir el nivel de significación en dos formas. Al total de comparaciones por pares
que se puedan plantear entre todos los tratamientos considerados en un experimento se le
llamará una “familia de comparaciones”, y entonces al nivel de significación para una
comparación se le llamará “error individual” y al nivel de significación para el total de
comparaciones (probabilidad de encontrar diferencias significativas en al menos una de
las comparaciones) “error por familia”. Las pruebas en las que el nivel de significación
sea individual servirán para efectuar comparaciones individuales planeadas con
anterioridad; las pruebas en las que el nivel de significación sea por familia servirán para
efectuar todas las comparaciones posibles (comparaciones múltiples).

2.1.13 Prueba de Tukey

La prueba de Tukey permite evaluar la significación de todas las diferencias entre


tratamientos. Las hipótesis correspondientes a todas las comparaciones constituyen una
familia y por lo tanto el error es familiar. Los supuestos para la realización de esta
prueba son:

• Varianzas homogéneas.
• Las muestras son extraídas al azar.

Hipótesis:
Ho: µi = µj ∀ i ≠ j
H1: µi ≠ µj

Amplitud Límite Significativa de Tukey:

ALS(T)= AES(T) Sd

donde:
- AES(T) es la amplitud estandarizada significativa de Tukey, obtenida desde la
tabla de Tukey con α= nivel de significación, p= número de tratamientos del
experimento y los grados de libertad del error experimental.

40
CME
- Sd = es la desviación estándar de la diferencia de las medias maestrales
n
de dos tratamientos para la prueba de Tukey cuando los tratamientos tienen el
mismo número de repeticiones.

Si los tratamientos no están igualmente repetidos, entonces la desviación estándar


puede calcularse por:

CME ⎛⎜ 1 1 ⎞
Sd = + ⎟
2 ⎜⎝ ni n j ⎟⎠

Sin embargo, esta aproximación hace que la prueba sea ligeramente conservada (esto
es, disminuye la probabilidad de detectar diferencias significativas) ya que el nivel de
significación real es ligeramente menor que el establecido en la prueba.

Regla de Decisión:

La hipótesis nula se rechaza con un nivel de significación α si Y i • − Y j• > ALS (T ) .

Ejemplo 1 (Cont.):
Aplique la prueba de Tukey para evaluar la significación de las diferencias entre los
tratamientos.

En este caso se están evaluando un conjunto de hipótesis:

H0 : µA = µB H 0 : µ A = µC H0 : µ A = µD

H1 : µ A ≠ µ B H1 : µ A ≠ µC H1 : µ A ≠ µ D

H 0 : µ B = µC H0 : µB = µD H 0 : µC = µ D

H1 : µ B ≠ µC H1 : µ B ≠ µ D H1 : µC ≠ µ D

El valor de tabla con α= 5%, p= 5 tratamientos y 18 grados de libertad para el error


experimental es AES(T)= 4.00. Dado que los tratamientos tienen diferentes números
de repeticiones, la desviación estándar para la diferenta de dos medias será diferente
dependiendo de los tratamientos que se estén comparando. En el siguiente cuadro se
resumen los cálculos necesarios para efectuar las 6 comparaciones:

41
Tratamientos Número de
comparados repeticiones Sd ALS(T) Y i• − Y j• Sig.

AyB 6y6 0.1675 0.6840 0.15 n.s.

AyC 6y5 0.1715 0.6859 0.35 n.s.

AyD 6y6 0.1715 0.6859 1.01 *

ByC 6y5 0.1715 0.6859 0.50 n.s.

ByD 6y6 0.1715 0.6859 1.16 *

CyD 5y5 0.1791 0.7164 0.66 n.s.

“n.s.” significa que la diferencia entre ambos tratamientos no es significativa (es


decir, que no existe evidencia suficiente para rechazar H0).
“*” significa que la diferencia entre ambos tratamientos si es significativa. Es usual el
símbolo “*” para denotar diferencias o efectos significativos con α= 5% y “**” para
denotar diferencias o efectos significativos con α= 1%. En el primer caso se dice que la
diferencia o efecto es “significativo” y en el segundo que es “altamente significativo”.
Esta simbología es muy útil para presentar los resultados de pruebas múltiples en las que
se evalúan un gran número de hipótesis.

2.1.14 Prueba de Sheffé

Hipótesis:

H0: µi= µj ∀ i, j
H1: µi≠ µj para al menos alguno distinto

1 1
D = CM Error ( + )(k − 1) Fα [(k − 1); (b − k )]
bi bj

si y i − y j > D entonces H0 se rechaza.

si y i − y j < D entonces H0 no se rechaza.

42
2.1.15 Prueba de Dunnet

Hipótesis:

H0: µi= µj ∀ i, j
H1: µi≠ µj para al menos alguno distinto

2CME
Dunnet Sd =
t

si y i − y j > S d entonces H0 se rechaza.

si y i − y j < S d entonces H0 no se rechaza.

2.1.16 Diseño Completamente al Azar Desbalanceado

Algunas veces es posible que el número de réplicas de cada tratamiento sea diferente y
así cada tratamiento tendrá ri réplicas (i = 1, 2, 3,…, t). Estos diseños se pueden
presentar en el caso que se esté comparando un control contra otros tratamientos ya que
queremos obtener buena información acerca del control, por ello este tendrá más
replicaciones que los otros tratamientos (¿Cuántas?, Ver Montgomery). Otro caso en el
que suele presentarse es cuando entre los t tratamientos algunos son más importantes que
otros. Otra razón es cuando la observación de alguna unidad experimental por algún
motivo se pierde. El modelo sobre el cual se basa el análisis está dado por:

Yij = µ + τ i + ε ij i = 1,2,..., t ; j = 1,2,..., ri

La tabla del ANOVA está dada por:

Causa de Grados de Suma de Cuadrados


variación libertad cuadrados medios
Tratamientos t- 1 SCTrat CMTrart


t
Error i =1 i
r −t SCerror CMError


t
Total i =1 i
r −1

43
donde:

SC Tratamient os = ∑i =1 ∑ j1=1 ( y i • − y •• ) 2 = ∑i =1 ri ( y i • − y •• ) 2
t r t

SC Error = ∑i =1 ∑ j1=1 ( y ij − y i • ) 2
t r

SC Total = ∑i =1 ∑ j1=1 ( y ij − y •• ) 2
t r

Ejemplo: Se realizó un experimento para determinar la influencia de dos


medicamentos sobre el tiempo en realizar una tarea por parte de unos estudiantes. Los
datos se presentan a continuación:

Grupo 1 Grupo 2 Grupo 3 Grupo 4


(No medic.) (Medic. 1) (Medic. 2) (Ambos medic.)
1 12 12 13
8 10 4 14
9 13 11 14
9 13 7 17
4 12 8 11
0 10 10 14
1 12 13
5 14

Analice la anterior situación

2.1.17 Submuestreo de un diseño completamente al azar

En algunos experimentos, pueden obtenerse varias observaciones en cada Unidad


Experimental (UE). Si éstas observaciones están todas en la misma característica (o se
mide la misma variable respuesta), el proceso para obtener las observaciones es
frecuentemente llamado Submuestreo.

En algunos estudios de educación cuando se quieren comparar dos métodos de


enseñanza, (tratamientos) se considera a la clase (colección de estudiantes) como la
unidad experimental. Pero como las observaciones al aplicar una prueba se hacen
sobre cada estudiante, entonces los estudiantes son las unidades observacionales. En
este caso se presenta un error asociado a las unidades observacionales el cual es
llamado error de muestreo u observacional ya que los estudiantes tomados para el
estudio serían una muestra de los posibles que pueden pertenecer a dicha clase. Este
tipo de estudios generalmente se refieren a Diseño completamente Aleatorio con
submuestreo.

44
Algunos ejemplos de submuestreo son:

1) En un experimento de campo, el investigador puede no tener tiempo de cosechar


(totalmente) cada parcela experimental, de esta manera podrá seleccionar al azar
varios cuadros por parcela y cosechar el grano en cada cuadro seleccionado. Esta
observaciones serán muestras dentro de la UE.
2) En un experimento de tecnología de alimentos que implica el almacenamiento de
fresas congeladas, se almacenan 10 pintas (UE) a cada 5 lapsos de
almacenamiento (tratamientos). Cuando se hicieron las determinaciones de ácido
ascórbico después del almacenamiento, se hicieron dos determinaciones en cada
pinta (muestra dentro de la UE).

La realización del submuestreo tiene efectos sobre el análisis. El modelo estadístico


propuesto por un DCA se transforma en:

Modelo para desigual número de observaciones por UE y diferentes réplicas por UO.

⎧i = 1,2,..., t

Yijk = µ + τ i + ε ij + η ijk ⎨ j = 1,2,..., ri
⎪k = 1,2,..., r
⎩ ij

Modelo para igual número de observaciones por UE e igual réplica por UO.

⎧i = 1,2,..., t

Yijk = µ + τ i + ε ij + η ijk ⎨ j = 1,2,..., r
⎪k = 1,2,..., n

Donde ε ij representa el error experimental y η ijk el error observacional. Se supone


que ε ij ~ i.i.d . N (0, σ s2 ) y η ij ~ i.i.d . N (0,σ η2 ) .

Calculemos la suma de cuadrados para realizar el análisis de varianza:

t ri rij t ri rij
SCTTOS = ∑ ∑ ∑ ( y i•• − y ••• ) SC EE = ∑ ∑ ∑ ( y ij • − y i•• )
i =1 j =1 k =1 i =1 j =1 k =1

t ri rij t ri rij

SC EM = ∑∑∑ ( y ijk − y ij • ) SCT = ∑∑∑ ( y ijk − y ••• )


i =1 j =1 k =1 i =1 j =1 k =1

45
La tabla de análisis de varianza para un modelo de efectos fijos desbalanceado es
dada por:

Causa Grados de Suma de Cuadrados medios


de variación liberta cuadrados
Tratamientos t −1 SC SCTTOS (t − 1)
TTOS

Error Experimental
∑ ∑
t t
(r − 1)
i =1 i
SCEE SCEE i =1
(ri − 1)

Error t r
SCEM
de Muestreo ∑ ∑ (r ij − 1) SC EM
∑∑
t ri
i =1 j =1
i=1 j=1
(rij −1)

Total N −1
SC T
Para un experimento de efectos fijos bajo un DCA con submuestreo, igual número
de réplicas y de observaciones por UE presentaremos la tabla de análisis de varianza
a continuación.
Antes presentaremos las sumas de cuadrados:

t r
SC EE = n∑∑ ( y ij − y i•• ) 2
2
SCTTOS = rn∑i =1 ( y1•• − y••• )
t

i =1 j =1
t r n t r n
SC EO = ∑∑∑ (Yijk − y ij• ) 2
SCT = ∑∑∑ (Yijk − y ••• ) 2
i =1 j =1 k =1 i =1 j =1 k =1

Tabla ANOVA:

Causa de Grados Suma de Cuadrados Esperanza de


variación de cuadrados medios cuadrados medios
libertad
SC TTOS rη

t
Tratamientos t −1 CM(TTOS) σ η2 + ησ s2 + τ2
i =1 i
t −1
SCEE σ η2 + ησ s2
Error t ( r − 1) CM(EE)
Experimental
Error
Observacional tr (n − 1) SCEO CM(EO) σ η2

SCT
Total trn − 1

46
2.1.18 Ejercicios resueltos y propuestos

1) Una empresa fundidora de acero surte de laminas de hojalata a tres fabricantes de


latas, la especificación principal es que el peso del revestimiento de estaño deberá ser
al menos de 0.25 libras en el fondo del envase de hojalata. La fundidora y cada uno de
los fabricantes de latas tienen laboratorios donde se realizan mediciones de los pesos
de los revestimientos de estaño, tomando muestras de cada cargamento. Al ocurrir
algunos desacuerdos sobre los pesos reales de los revestimientos de estaño de los
cargamentos de láminas, se desea realizar un experimento para determinar si los cuatro
laboratorios están realizando mediciones consistentes. Un factor que complica las
cosas es que parte del proceso de medidas consiste en eliminar con productos
químicos el estaño de la superficie del metal de la base; de manera que es imposible
tener las mismas mediciones en las muestras de cada laboratorio para determinar qué
tan aproximadas son las mediciones.

Se mandaran aleatoriamente 12 muestras a cada uno de los laboratorios


(considerando que tendrán un revestimiento promedio o igual) cortados de igual
forma.

Cada laboratorio mide los pesos de los revestimientos de estaño de 12 discos y los
resultados son los siguientes:

Lab. A Lab. B Lab. C Lab. D


.25 .18 .19 .23
.27 .28 .25 .30
.22 .21 .27 .28
.30 .23 .24 .28
.27 .25 .28 .24
.28 .20 .26 .34
.32 .27 .28 .20
.24 .19 .24 .18
.31 .24 .25 .24
.26 .22 .20 .28
.21 .29 .21 .22
.28 .16 .19 .21
3.21 2.72 2.86 3.00

FC= (11.69)2/48 = 2.8470

SCT = (0.25)2 + (0.22)2 +……. +(0.22)2 +(0.21)2 -2.8470 = 0.0809

SC(Tr)= [(3.21)2 + (2.72)2 +(2.76)2 + (3.00)2 ]/12 - 2.8470 = 0.0130

SCE = 0.0809-0.0130= 0.0679

47
Fuente de Grados
Suma de Cuadrado
Variación de F
cuadrados medio
Libertad
Laboratorios 3 0.0130 0.0043 2.87
-
Error 44 0.0679 0.0015
- -
Total 47 0.0809

Como el valor obtenido para F excede a 2.82 que corresponde al valor de F0.05 con
3 y 44 grados de libertad, la hipótesis nula puede rechazarse con nivel de significación
de 0.05. Se concluye que los laboratorios no están logrando resultados consistentes.

2) Se diseñó un experimento para estudiar el rendimiento de cuatro detergentes


diferentes. Las siguientes lecturas de "blancura" se obtuvieron con un equipo
especialmente diseñado para 12 cargas de lavado distribuidas en tres modelos de
lavadoras:

- Lav. 1 Lav. 2 Lav. 3 Totales


Detergente A 45 43 51 139
Detergente B 47 46 52 145
Detergente C 48 50 55 153
Detergente D 42 37 49 128
Totales 182 176 207 565

Considerando los detergentes como tratamientos y las lavadoras como bloques,


se obtiene la tabla de análisis de varianza adecuada y se prueba con un nivel de
significación de 0.01 si existen diferencias entre los detergentes o entre las
lavadoras.

H0 : a1 =a2 = a13 =a4 = 0 ; ß1 =ß2 =ß3 =0


H1 : Al menos alguna es distinta de cero.

T1. = 139 T2.= 145 T3. = 153 T4.= 128 T..= 565

∑∑ y 2
ij = 26867 FC = (565) 2 12 = 26602

SCT= 452 + 432 +……..+ 492 –FC = 265

SC(Tr)= [1392 +1452 +1532 +1282]/3 –FC =111

SC(Bl)= [1822 +1762 +2072]/4 – 26602 = 135

SCE= 265 -11 -135= 19

48
Fuente de
Varianza Grados de Suma de Cuadrado
F
libertad cuadrados medio
Detergentes 3 111 37.0 11.6
Lavadoras 2 135 67.5 21.1
Error 6 19 3.2 -
Total 11 265 - -

Dado que Ftr = 11.6 sobrepasa 9.78 que es el valor de F0.01 con 3 y 6 grados de
libertad, concluye que existen diferencias en la eficiencia de los cuatro
detergentes.

También, puesto que Fbl = 21.1 excede a 10.9, el valor de F0.01 con 2 y 6 grados
de libertad, se llega a que existen diferencias significativas entre los resultados de
las 3 lavadoras.

Se rechaza H0 esto quiere decir que al menos una de ellas tiene un rendimiento
significativamente distinto al de los demás.
Por lo que los efectos de los detergentes y las lavadoras son significativos.

3) En una estación experimental se estudiaron cuatro dosis de insecticidas (3 l/ha, 5


l/ha, 7 l/ha y 9 l/ha) para el control de la Racha de la papa. Los resultados se
presentan a continuación en TM de rendimiento de para por ha:

Dosis de insecticida
3 l/ha 5 l/ha 7 l/ha 9 l/ha
4.29 8.50 10.75 5.63
4.24 8.03 11.52 2.96
4.53 7.94 11.49 5.47
4.26 6.75 11.52 6.01
4.62 7.16 10.81 6.09

a) Presente el modelo aditivo lineal e interprete cada uno de sus componentes en


términos del problema.
b) Estime los efectos de los tratamientos.
c) Realice el análisis de varianza. Calcule el coeficiente de variación.
d) Realice la prueba de Tukey.
e) Antes de realizar el experimento, el experimentador sostenía que con la dosis 2
(5 l/ha) se podía obtener un rendimiento medio superior en más de 2 Tm/ha al
de la dosis 1 (3 l/ha). A que conclusión puede llegar con la información del
experimento.

49
4) Se desea comparar los resultados obtenidos en el examen parcial de Métodos
Estadísticos para la investigación I por las clases de 4 profesores. A continuación
se presentan los resultados de una muestra aleatoria de 8 alumnos de cada clase.

Profesor Nota en el examen parcial


A 10 16 17 13 14 17 18 12
B 16 14 13 7 9 13 11 14
C 9 6 10 8 14 11 12 8
D 13 13 12 16 8 11 7 12

a) ¿Presentan los datos suficiente evidencia para aceptar que las notas en el
examen parcial son diferentes entre los grupos?

5) Los datos que se presentan a continuación corresponden al tiempo de coagulación


(en segundos) de sangre extraída a 24 animales, asignados aleatoriamente a cuatro
dietas diferentes.

Dieta
A B C D
62 63 68 56
60 67 66 62
63 71 71 60
59 64 67 61
65 68 63
64

a) Presente el modelo aditivo lineal. Interprete cada uno de sus componentes en


términos del problema.
b) Estime los efectos de los tratamientos.
c) Calcules los residuales obtenidos con la dieta B (error experimental).
d) Realice el análisis de varianza. Calcule el coeficiente de variación.
e) Realice la prueba de Tukey.

6) Se realizó un estudio para evaluar el efecto de tres fármacos en la duración de la


relajación masculina inducida. En el experimento 24 pacientes fueron
aleatoriamente asignados a los cuatro grupos, cinco pacientes a los primeros
grupos y 7 a los dos últimos.
Un grupo no recibió fármaco alguno, uno recibió Innovar, uno Droperidol y uno
Fenatayl antes de la aplicación de anestesia. Para cada paciente la duración de la
relajación muscular fue registrada en minutos. Los siguientes resultados del
experimento son dados a continuación:

50
Fármaco
Sin droga Innovar Droperidol Fentayl
5.9 16.1 10.3 7.2
8.0 11.2 6.8 10.5
11.5 9.0 5.3 8.5
6.0 8.8 3.2 4.2
9.2 10.2 6.5 6.5
7.0 6.6
7.5 9.1

a) Presente el modelo aditivo lineal. Interprete cada uno de sus componentes


en términos del problema.
b) Estime los efectos de los tratamientos.
c) Calcules los residuales obtenidos con la droga Innovar.
d) Realice el análisis de varianza. Calcule el coeficiente de variación.
e) Uno de los objetivos del experimento era comparar los fármacos
Droperidol y Fentayl, razón por la cual se asignaron 7 repeticiones a cada
uno.
¿Existe suficiente evidencia estadística para aceptar que Fentayl es mejor
que Droperidol?

7) Cuatro programas de entrenamiento para cierto trabajo fueron probados con 20


empleados nuevos. Los 20 empleados fueron asignados al mismo supervisor y, al
final del periodo de entrenamiento, el supervisor calificó a los empleados de
acuerdo a su habilidad para el trabajo, asignando los rangos más bajos a aquellos
empleados con la menor habilidad.

Programa Rangos
A 4 6 7 2 10
B 1 8 12 3 11
C 20 19 19 14 5
D 18 15 17 13 9

¿Indican estos datos diferencias en la efectividad de los programas de


entrenamiento? Si la respuesta es afirmativa, ¿Cuáles son diferentes?

2.2 Diseño de Bloques Completamente al Azar

El Diseño Completamente al Azar (DCA) es aplicable en casos en los que la única


fuente de variabilidad son los tratamientos. En casos en los que se identifican de antemano
otras fuentes de variación, que no constituyen el objetivo de la investigación, estas deberán

51
ser controladas por el experimentador. Esto puede ocurrir por ejemplo en experimentos en
el terreno, en donde se sabe que parcelas adyacentes suelen presentar resultados más
homogéneos entre sí que parcelas más separadas, o en experimentos en donde los datos se
toman por días, y en donde se sabe que los resultados pueden diferir entre los distintos
días. Estas fuentes de variación son controladas mediante la formación de bloques; la idea
es agrupar a las observaciones en los distintos bloques de modo que sean lo más
homogéneas dentro del bloque y heterogéneas entre bloques.
Al diseño que controla una fuente de variación adicional a los tratamientos se le conoce
como el Diseño de Bloques. Aquí se verá el Diseño de Bloques Completos al Azar
(DBCA), en el caso paramétrico y no paramétrico, y sus respectivas pruebas de
comparación de medias. Los bloques son completos porque todos los tratamientos
aparecen en igual número, usualmente una vez, dentro de cada bloque, y son al azar por
que los tratamientos son asignados aleatoriamente dentro de cada bloque. A este diseño se
le conoce también como diseño de clasificación de dos vías sin interacción (Two Way).
Los diseños de bloques pueden también ser incompletos balanceados. En este caso, los
bloques son incompletos porque no todos los tratamientos aparecen dentro de cada bloque,
y balanceados porque el número de tratamientos dentro de cada bloque es el mismo y
cada tratamiento se repite el mismo número de veces dentro del experimento.

2.2.1 Ventajas y desventajas del DBCA

Ventajas

− El agrupamiento de las unidades experimentales en bloques, debido a la


existencia real de esta fuente de variabilidad, aumenta la precisión del
experimento con relación al DCA.
− No existen restricciones en cuanto al número de tratamientos o bloques.
− El análisis estadístico es simple.
− Si se pierden los datos de un bloque completo, estos puedes omitirse sin mayores
complicaciones para el análisis. Si faltan datos de unidades experimentales, estos
pueden estimarse

Desventajas

− Cuando la variabilidad entre las unidades experimentales dentro de los bloques


es grande, resulta un error experimental considerable. Esto ocurre usualmente
cuando el número de tratamiento es muy grande.
− Si existe interacción entre los bloques y los tratamientos, ésta va incluida en el
error experimental.
− Si no existe una real diferencia entre los bloques, habrá una pérdida de
precisión en el experimento con relación al DCA, debido a la disminución de
los grados de libertad del error.

52
2.2.2 Aleatorización y Croquis Experimental

En este diseño los tratamientos son asignados en forma aleatoria dentro de cada bloque.
Por ejemplo suponga que va a evaluar k tratamientos con b repeticiones cada uno, en
donde cada repetición constituye un bloque; en este caso necesitará de b*k unidades
experimentales. Para asignar los tratamientos en forma aleatoria dentro de un bloque, se
puede ver los métodos dados para el Diseño Completamente al Azar.
Esquema de los datos:

BLOQUES
B1 B2 … Bb Ti·
T1 Y11 Y12 … Y1b T1·
T
R T2 Y21 Y22 … Y2b T2·
A : … … … … :
T. Tk Yk1 Yk2 … Ykb Tk·
B·j B·1 B·2 … B·b T··

2.2.3 Modelo Aditivo Lineal

El modelo matemático se expresa de la siguiente forma:

y ij = µ + α i + β j + ε ij
donde
i= 1,2,…., k y j= 1,2,…, b
µ es una media general
αi es el efecto del i-ésimo tratamiento
βj es el efecto del j-ésimo bloque
εij es el término usual de error aleatorio

Ejemplo 1: Tres diferentes soluciones están siendo estudiadas para evaluar su


efectividad en el retardo del crecimiento de bacterias en contenedores de leche de 5
galones. Los análisis son hechos en un laboratorio y solo tres ensayos pueden efectuarse
en un día dado. Debido a que los días pueden ser una fuente de variabilidad, el
investigador decide utilizar un diseño de bloques completamente al azar. Las
observaciones fueron tomadas en cuatro días y los datos (en UFC) se muestran en la
siguiente tabla.

Días
Solución 1 2 3 4
1 13 22 18 39
2 16 24 17 44
3 5 4 1 22

53
El modelo aditivo lineal es el siguiente:

y ij = µ + α i + β j + ε ij

donde
i= 1,2,…., k y j= 1,2,…, b

Yij es el número de UCF observado con la i-ésima solución, j-ésima día (bloque).
µ es el efecto de la media general.
αi es el efecto del i-ésimo solución.
βj es el efecto del j-ésimo día (bloque).
εij es el efecto del error experimental con la i-ésima solución, j-ésimo día (bloque).
t= 3 (Número de tratamientos).
b= 4 (Número de días o bloques).

2.2.4 Supuestos del modelo estadístico

El modelo estadístico debe cumplir con los siguientes supuestos:


1. Aditividad: Los efectos del modelo aditivo.
2. Linealidad: Las relaciones entre los efectos del modelo son lineales.
3. Normalidad: Los errores del modelo deben tener una distribución normal con media
cero.
4. Independencia: Los resultados obtenidos en el experimento son independientes entre
sí.
5. Homogeneidad de Variancias: Las diferentes poblaciones generadas por la aplicación
de los diferentes tratamientos tienen variancias iguales (σ2).
6. No existe interacción entre

2.2.5 Estimación de los efectos

Los efectos del modelo, µ , α i , β j , son estimados de modo que se minimice la siguiente
expresión (Método de Mínimos Cuadrados):

Q = ∑i =1 ∑ ji=1 ε ij2 = ∑i =1 ∑ ji=1 (Yij − µ − α i − β j ) 2


k r k r

Inicialmente se considera que tanto los tratamientos como los bloques son factores fijos.
Más aún, los efectos de tratamiento y de bloque se consideran como desviaciones de la
media general, por lo tanto:

54
k b

∑α
i =1
i =0 y ∑β
j =1
j =0

La aplicación de este método da los siguientes resultados para la estimación de los


parámetros:

µ̂ = Y •• α̂ i = Y i• − Y ••
β̂ j = Y • j − Y •• ε ij = Yij − Y i• − Y • j + Y ••

Ejemplo 1 (Cont.): Con los datos del ejemplo anterior, la media estimada es:

µˆ = 18.75

Los efectos estimados de los tratamientos:

αˆ1 = Y 1• − Y •• = 23 − 18.75 = 4.25


αˆ 2 = Y 2• − Y •• = 25.25 − 18.75 = 6.5
αˆ 3 = Y 3• − Y •• = 8 − 18.75 = −10.75

Los efectos estimados de los bloques:

βˆ1 = Y •1 − Y •• = 11.33 − 18.75 = −7.42


βˆ2 = Y •2 − Y •• = 16.67 − 18.75 = −2.08

βˆ 3 = Y •3 − Y •• = 12 − 18 .75 = −6.75
βˆ 4 = Y • 4 − Y •• = 35 − 18 .75 = 16 .25

El efecto estimado del error ε 24 :

εˆ24 = Y24 − Y 2• − Y •4 + −Y •• = 44 − 25.25 − 35 + 18..75 = 2.5

2.2.6 Análisis de Varianza

En este modelo la variabilidad total se descompone en tres fuentes de variación, la


explicada por los tratamientos, la explicada por los bloques y la explicada por el error. Por
lo tanto, el modelo de descomposición de la varianza será el siguiente:

Variabilidad Total + Var(Trat ) + Var( Bloq ) + Var( Error )

55
La variabilidad total es cuantificada por la suma de cuadrados total:

k b
T•2•k b
= SC( y) = ∑∑ (Yij − T •• ) = ∑∑Yij −2 2
SCtotal
i =1 j =1 i =1 j =1 kb
T •2•
donde es el término de correlación (TC).
kb
Las sumas de los cuadrados de los tratamientos, bloques y error se calculan de la
siguiente manera:
k
Ti•2 b T•2j
SCTrat. =∑ − TC SC Bloques = ∑ − TC
i =1 b j =1 k

2
k b
Ti•2 b T• j
k
SCError = ∑∑Yij −∑ − ∑ 2
+ TC
i =1 j =1 i =1 b j =1 k

SC Error = SC Total − SC Trat − SC Bloq

Estas fuentes de variación son comparadas mediante la prueba de hipótesis a partir del
cuadro de análisis de varianza (Cuadro ANOVA)

2.2.7 Construcción de la tabla ANOVA

Para la obtener la tabla ANOVA es necesario determinar:

a) Determinar los grados de libertad de las fuentes de variación.

gltrat = k -1
glbloque = b-1
gltotal = kb - 1
glerror = (k-1)(b-1)

b) Obtener los Cuadrados Medios (CM)


La obtención de los CM se tiene al dividir la Suma de Cuadrados y los Grados de
Libertad.

SCTrat . SC Bloques
CM Trata. = CM Bloques =
glTrat . gl Bloques

56
SC Error
CM Error =
gl Error

c) Expresar la tabla de ANOVA.

Causa de Suma de Grados de Cuadrados F


Variación Cuadrados Libertad Medios
(SC) (gl) (CM)
CM Bloques
Bloques SC Bloques b −1 CM Bloques CM Error
CM Trat
Tratamientos SC Tratamieno t k −1 CM Tratamienot CM Error
Error
Experimental SC Error (k − 1)(b − 1) CM Error
Total SCTotal kb − 1

d) Hipótesis.

Para el Modelo I (Efectos fijos) las hipótesis son, en términos de los efectos de
los tratamientos siguientes:
H0: αi= 0 ∀ i
H1: αi≠ 0 para al menos algún i

En términos de las medias de los tratamientos:

H0: µBi= µBj ∀ i, j


H1: µBi≠ µBj para al menos alguno distinto

H0: µTi= µTj ∀ i, j


H1: µTi≠ µTj para al menos alguno distinto

Para el Modelo II (Efectos aleatorios) las hipótesis serán planteadas en términos


de la varianza de los tratamientos:

H0: σ k = 0
2

H1: σ k > 0
2

En cualquiera de los casos, la hipótesis nula implica que los tratamientos no


afectan la variable respuesta o lo que es lo mismo, que con todos los tratamientos
se obtienen los mismos resultados.

57
Ejemplo 1 (Cont.): A continuación se presenta el análisis de varianza y la prueba
de hipótesis correspondiente para el ejemplo tratado en esta sección:

225 2
SCTotal = (13 2 + 22 2 +... + 22 2 ) − = 1862.25
(3)(4)
92 2 1012 32 2 225 2
SCTratamienot = + + + = 703.5
4 4 4 (3)(4)

34 2 50 2 36 2 105 2 225 2
SC Bloques = + + + − = 1106.92
3 3 3 3 (3)(4)
SC ( Error ) = SC (Total ) − SC (Trat .) − SC ( Bloq ) = 51.83

Cuadro ANOVA

Causa de Suma de Grados de Cuadrados F


Variación Cuadrados Libertad Medios
(SC) (gl) (CM)
Tratamientos 2 703.5 351.75 40.72
Bloques 3 1106.92 368.97
Error 6 51.83
Experimental
Total 11 1862.25

Asumiendo un modelo de efectos fijos, la hipótesis en términos de los efectos de


los tratamientos son:

H0: αi= 0 ∀ i
H1: αi≠ 0 para al menos algún i

En términos de las medias de los tratamientos:


H0: µBi= µBj ∀ i, j
H1: µBi≠ µBj para al menos alguno distinto

H0: µTi= µTj ∀ i, j


H1: µTi≠ µTj para al menos alguno distinto

O literalmente
H0: Las tres soluciones son iguales efectivas en el retardo del crecimiento de
bacterias en contenedores de leche.
H1: Al menos una de las soluciones tiene una efectividad diferente en el retardo
del crecimiento de bacterias en contenedores de leche.

58
El estadístico de prueba es F = 40.72 . El valor de tabla para un nivel de
significación del 5% es F( 0.95 , 2 , 6 ) = 5.14 . Dado que el estadístico de prueba
resulta mayor que el valor de tabla se rechaza H0. En conclusión, existe
suficiente evidencia estadística para aceptar que las tres soluciones no son
igualmente efectivas en el retardo del crecimiento de bacterias en contenedores
de leche.

El coeficiente de variación para este experimento es:

CME 8.64
cv = = = 15.68%
Y •• 18.75

e) Valores Esperados de los Cuadrados Medios.


En la siguiente tabla se presentan los valores esperados de los cuadrados medios
para un experimento en DBCA, en el caso de los efectos fijos y aleatorios tanto
para los tratamientos como para los bloques.

Causa de Grados de Valor Esperado de los Cuadrados Medios


Variación Libertad Modelo I Modelo II
(gl)
k
α i2
Tratamientos k −1 σ + b∑
2
σ 2 + bσ α2
i =1 k −1
b β j2
Bloques b −1 σ + k∑
2
σ 2 + kσ β2
j =1 b −1
Error
Experimental (k − 1)(b − 1) σ2 σ2
Total kb − 1

h) Estadístico de Prueba.

CM Bloques
FBloques = ~ Fα [(b − 1); (b − 1)(k − 1)]
CM Error

Si FBloques > Fα [(b − 1); (b − 1)(k − 1)]

Entonces H0 se rechaza y
∴ Hay diferencias entre los bloques.

59
CM Trat
FTrat = ~ Fα [(k − 1); (b − 1)(k − 1)]
CM Error

Si FTrat > Fα [(k − 1); (b − 1)(k − 1)]

Entonces H0 se rechaza y
∴ Hay diferencias entre los tratamientos.

2.2.8 Prueba de Sheffé

Hipótesis:
H0: µBi= µBj ∀ i, j
H1: µBi≠ µBj para al menos alguno distinto

1 1
D = CM Error ( + )(k − 1) Fα [(k − 1); (b − k )]
bi bj
si y i − y j > D entonces H0 se rechaza.

si y i − y j < D entonces H0 no se rechaza.

2.2.9 Bloques al Azar (BA) con datos perdidos

Algunas veces los datos de ciertas unidades se pierden o no son utilizables, como es el
caso de un animal que se enferma o muere, y no completa todo el tratamiento; cuando se
pierde una parcela experimental en un campo, producto de una plaga, u otra causa
cualquiera.
Yates (1933) desarrolló un método para estimar los datos perdidos. El estimado de un
dato perdido no proporciona una información adicional, sino que solo facilita el análisis
de los datos restantes.
Cuando se pierde un dato en el diseño de BA se puede calcular un estimado del valor
perdido mediante la expresión siguiente:

bB + kT − G
Yˆij =
(b − 1)(k − 1)

donde:
B: total de unidades restantes en el bloque al que pertenece el valor.
T: total de las unidades restantes en el tratamiento al que pertenece el valor.
G: gran total.

60
b: número de bloques.
k: número de tratamientos.

El valor obtenido se introduce en la tabla de datos y se realiza el análisis de varianza


de la forma tradicional y después se rectifica como se muestra a continuación.
El análisis de varianza ajustado se calcula entonces de la siguiente forma:

(T + bB − G1 ) 2
SC Bloques( ajustados) = SC Bloques −
k (k − 1)(b − 1) 2

( B + kT − G1 ) 2
SCTrat ( ajustados ) = SCTrat −
b(b − 1)(k − 1) 2

donde G1 es el gran total de la tabla con los nuevos datos incluidos.

Además, debe restársele 1 grado de libertad a los grados de libertad de error y el total.

2.2.10 Ejercicios propuestos

1) El propósito del experimento de comparar cuatro procesos, A, B, C y D para la


producción de penicilina. La materia prima, licor de maíz, es algo variable y sólo
puede ser preparada en cantidad suficiente para cuatro en sayos. De este modo,
cinco preparaciones son necesarias para poder contar con cinco repeticiones. Los
resultados del experimento, para la producción de penicilina en mg. se presentan
en la siguiente tabla:

Preparación
Proceso I II III IV V
A 85 81 82 85 82
B 85 79 86 89 81
C 97 92 89 91 86
D 93 85 87 88 87

a) Presente el modelo aditivo lineal e interprete cada uno de sus componentes en


términos del problema.
b) Efectúe el análisis de varianza.
c) Se justifica el uso de los bloques. Explique brevemente.
d) Realice las comparaciones por pares en caso de ser necesario.
e) Estime los efectos de los tratamientos.
f) Antes de realizar el experimento se tenía principal interés en comparar los
procesos C y D. Realice la prueba correspondiente.

61
g) Los procesos A y B son dos variantes de una metodología, llamémosla
metodología 1, y los procesos C y D son variantes de otra, llamémosla
metodología 2. Se cree que la metodología 2 es mejor que la metodología 1.
¿Aportan los resultados de este experimento suficiente evidencia para aceptar
que la metodología 2 es mejor que la metodología 1?

2) Se realizó un experimento para comparar el contenido de colesterol de 3


alimentos dietéticos. Cada uno de los 3 laboratorios que fabrican alimentos
dietéticos produce alimentos de estos 3 tipos en paquetes de similar peso. Al
evaluar el contenido de colesterol (en miligramos por paquete) se obtuvo los
siguientes resultados:

Alimento Laboratorio
Dietético 1 2 3
A 13 15 12
B 17 18 14
C 15 18 13

a) Presente el modelo aditivo lineal e interprete cada uno de sus componentes


en términos del problema.
b) Efectúe el análisis de varianza.
c) Realice la prueba de Tukey.

3) En un experimento de riegos en el cultivo de algodón se tuvieron los siguientes


tratamientos que están expresados en metros cúbicos de agua absorbidos por
hectárea:

T1= 5400, T2= 4800, T3= 4200 y T5= 3600. El experimento se condujo en
parcelas de 300 m2 de área útil y los resultados están expresados en kilogramos.

A continuación se dan los rendimientos:

Bloques Tratamientos
T1 T2 T3 T4
I 68 73 53 50
II 86 90 62 62
III 68 71 46 50

a) Presente el modelo aditivo lineal e interprete cada uno de sus componentes


en términos del enunciado.
b) Efectúe el análisis de varianza.

62
c) Realice la prueba de Tukey.
d) ¿Se puede afirmar que con T2 el rendimiento por parcela supera en más de
80 kilogramos al que se obtiene con T4?

4) Con la finalidad de estudiar el efecto de los tratamientos de semilla de soya sobre


el % de germinación, se llevó a cabo un experimento conducido en el DBCA. En
el experimento se utilizaron 3 tratamientos + 1 testigo (semillas no tratadas), en 4
unidades experimentales. Los resultados fueron:

Tratamiento
Bloque Testigo A B C
1 92 98 96 91
2 90 94 90 93
3 88 93 91 97
4 86 91 89 95

a) Presente el modelo aditivo lineal e interprete cada uno de sus componentes


en términos del enunciado.
b) Efectúe el análisis de varianza.

5) Un investigador realiza un estudio de la efectividad de cuatro cremas para el


tratamiento de un cierto tipo de enfermedad cutánea. El cuenta con 28 pacientes
para dividirlos en cuatro grupos de 7 pacientes cada uno. Los pacientes son
evaluados y colocados en bloques de cuatro de acuerdo a la severidad de la
condición inicial de su piel. De esta manera, los cuatros casos más severos son
asignados al primer bloque, los cuatro siguientes más severos al segundo, y así
hasta completar el séptimo bloque con los cuatro casos menos severos. Los
cuatro miembros de cada bloque fueron asignados aleatoriamente, uno a cada
uno de los cuatro tratamientos. Al final del tratamiento, cada paciente fue
nuevamente evaluado y calificado en una escala del 1 al 7 de acuerdo al estado
final de su piel. El calificativo de 7 corresponde a una piel completamente sana.
Los resultados del experimento se presentan en la siguiente tabla:

Crema Bloque
1 2 3 4 5 6 7
1 3 3 4 4 3 4 5
2 4 4 6 5 5 6 6
3 5 4 6 5 5 7 7
4 4 5 4 6 4 6 7

a) ¿Existen diferencias significativas entre las cremas?


b) Realice comparaciones.

63
6) A seis soldadores, con diferente nivel de experiencia, se les pidió que unieran dos
tubos metálicos utilizando 5 diferentes tipos de llama. Las llamas fueron
utilizadas en orden aleatorio por cada soldador. Las soldaduras ya terminadas
fueron evaluadas sobre una variedad de factores cualitativos y calificadas del 1 al
10, donde 10 representa un trabajo perfecto. Los resultados fueron los siguientes:

Soldador Tipo de llama


1 2 3 4 5
1 3.9 4.1 4.2 4.1 3.3
2 9.4 9.5 9.4 9.0 8.6
3 9.7 9.3 9.3 9.2 8.4
4 8.3 8.0 7.9 8.6 7.4
5 9.8 8.9 9.0 9.0 8.3
6 9.9 10.0 9.7 9.6 9.1

a) Presente el modelo aditivo lineal e interprete cada uno de sus componentes


en términos del enunciado.
b) ¿Existen diferencias significativas entre las llamas?
c) Realice comparaciones.

2.3 Diseño Cuadrado Latino

Anteriormente se estudió el Diseño de Bloques al Azar, en el cual se controlaba una


fuente de variación adicional a los tratamientos que constituía los bloques. El diseño en el
cual las unidades experimentales son clasificadas de acuerdo a los criterios de bloqueo se
conoce como el Diseño Cuadrado Latino (DCL), también es concebido como una
extensión del DBA. Al igual que en el DBCA, los bloques formados en el DCL en sus dos
criterios de clasificación, a los que se llamará bloques por filas y bloques por columnas,
son completos, es decir, cada tratamiento aparece una vez en cada fila y en cada columna.
El número de criterios de clasificación por bloques puede ser aun mayor que en el DCL.
Así tenemos por ejemplo el Diseño Greco-Latino (3 criterios de bloques) y el Diseño
Hiper Greco-Latino (4 criterios de bloques).

El DCL es usado en muchos campos de investigación donde hay dos fuentes principales
de variación en la realización del experimento. En experimentos sobre el terreno, la
disposición de las unidades experimentales suele ser sobre un área rectangular,
permitiendo así la eliminación de la variación proveniente de diferencias en el suelo en
dos direcciones. El DCL ha sido utilizado también un la industria, laboratorio y en las
ciencias sociales.

La principal desventaja de este diseño es que el número de tratamientos, filas y


columnas debe ser el mismo. Los cuadrados más comunes van de 5x5 a 8x8; cuadrados
muy pequeños dejan muy pocos grados de libertad para la estimación del error

64
experimental y cuadrados muy grandes implican la utilización de muchas unidades
experimentales además de que al tener bloques grandes el error experimental aumenta.

2.3.1 Ventajas y Desventajas del DCL

Ventajas:

− La existencia real de dos fuentes de variabilidad entre las unidades experimentales y


su separación en el análisis de varianza permite incrementar la precisión del
experimento.
− La pérdida de una o más unidades experimentales no influye esencialmente en el
análisis de varianza, siendo posible estimar los resultados de las unidades
experimentales perdidas.

Desventajas:

− El número de tratamientos, filas y columnas debe ser el mismo. Por esta razón, no es
recomendable para un número elevado de tratamientos ya que se requerirá de un
número elevado de unidades experimentales (u.e.) (el número de u.e. es igual a t2).
− Si existe interacción entre los bloques y tratamientos, ésta va incluida en el error
experimental. En este caso se tiene la interacción filas por columnas, filas por
tratamientos, columnas por tratamientos y filas por columnas por tratamientos.

2.3.2 Aleatorización y Croquis Experimental

En este diseño se tienen dos restricciones de aleatoriedad para la asignación de los


tratamientos a las u.e. (filas y columnas) por lo que cada tratamiento debe aparecer una
vez en cada fila y en cada columna. La aleatorización en este diseño consiste en elegir un
cuadrado al azar de entre todos los cuadrados latinos posibles.
Tomaremos Ai como el tratamiento i-ésimo de los t tratamientos que existen, los cuales
se usan en las filas de manera aleatoria en cada una de ellas.

COLUMNAS
FILAS C1 C2 … Ct
F1 A1 A5 … A7
F2 A7 At … A2
… … … … …
Ft A3 A6 … A4

donde:
Ci: Columna i-ésima.
Fj: Fila j-ésima
Yij: Tratamiento aplicado a la i-ésima columna y j-ésima fila.

65
2.3.3 Modelo Aditivo Lineal

El modelo aditivo lineal para un Diseño Cuadrado Latino es el siguiente:

Yij ( k ) = µ + α i + β j + ζ ( k ) + ε ijk

donde:

Yij (k ) : es el valor de la observación en el i-ésimo tratamiento, j-ésima fila, k-ésima


columna.
µ : efecto de la media general.
α i : efecto del i-ésimo tratamiento.
β j : efecto del i-ésimo fila.
ζ (k ) : efecto de la k-ésima columna.
ε ijk : efecto del error experimental en el i-ésimo tratamiento, j-ésima fila, k-ésima
columna.
t: es el número de tratamientos que es igual al número de filas y de columnas.

La simbología (i) implica que no es una clasificación ordinaria de tres vías.

Ejemplo 1: Se realizó un experimento para comparar la efectividad de 4 abonos


nitrogenados en el cultivo de caña de azúcar. Las claves para los abonos son:

1) NA: Nitrato amónico NH4NO3


2) SA: Sulfato amónico (NH4)2SO4
3) SS: Salitre sódico.
4) UR: Urea.

Todos los abonos se aplicaron a razón de 100 Kg. Por hectárea. El diseño empleado fue un
Cuadrado Latino, donde las unidades experimentales fueron clasificadas en filas y
columnas según su ubicación en el terreno tal y como se muestra en el siguiente croquis
junto con los resultados del experimento (en Kg. de caña/parcela):

Columna
Fila 1 2 3 4
1 432(SA) 518(NA) 458(SS) 583(UR)
2 550(SS) 724(UR) 400(NA) 524(SA)
3 556(UR) 384(SS) 400(SA) 297(NA)
4 500(NA) 506(SA) 501(UR) 494(SS)

66
El modelo aditivo lineal es el siguiente:

Y(i ) jk = µ + α (i ) + β j + ζ k + ε (i ) jk
donde:

Y(i ) jk : es el rendimiento de caña observado con el i-ésimo abono nitrogenado, j-ésimo


bloque por fila, k-ésimo bloque por columna.
µ : efecto de la media general.
α (i ) : efecto del i-ésimo abono nitrogenado.
β j : efecto del i-ésimo bloque fila.
ζ (k ) : efecto de la k-ésimo bloque columna.
ε ijk : efecto del error experimental en el i-ésimo abono nitrogenado, j-ésima bloque fila,
k-ésima bloque columna.
t = 4 : es el número de tratamientos que es igual al número de filas y de columnas.

2.3.4 Supuestos del Modelo Estadístico

El modelo estadístico debe cumplir con los siguientes supuestos:

1. Aditividad: Los efectos del modelo son aditivos.


2. Normalidad: Las relaciones entre los efectos del modelo son lineales.
3. Normalidad: Los errores del modelo deben tener una distribución Normal con
media cero y varianza (σ2).
4. Independencia: Los resultados obtenidos en el experimento son independientes
entre sí.
5. Homogeneidad de varianza: Las diferentes poblaciones generadas por la aplicación
de los diferentes tratamientos tienen varianzas iguales (σ2).

No existe interacción entre los bloques por filas, por bloques y los tratamientos.

2.3.5 Estimación de los Efectos

Los efectos del modelo µ , α ( i ) , β j y ζ k son de modo que se minimice la siguiente


expresión (Método de los Mínimos Cuadrados):

Q = ∑ j =1 ∑k =1 ε (2i ) jk = ∑ j =1 ∑k =1 (Y(i ) jk − µ − α (i ) − β j − ζ k ) 2
t t t t

67
teniendo en cuenta las siguientes restricciones:

t t t

∑α
i =1
(i ) =0 ∑β
j =1
j =0 ∑ζ
k =1
k =0

La aplicación de este método da los siguientes resultados para la estimación de los


parámetros:

µˆ = Y (•)•• αˆ ( i ) = Y (i )•• − Y (•)••

βˆ j = Y (•) j • − Y (•)•• ζ k = Y ( • ) • k − Y ( • ) ••

εˆ( i ) jk = Y( i ) jk − Y (i )•• − Y ( •) j • − Y ( •)•k + 2Y ( •)••

Ejemplo 1 (Cont.): Con los datos del ejemplo anterior, la media estimada es:

µˆ = Y (• )•• = 489.2

Los efectos estimados de los tratamientos:

αˆ (1) = Y (1)•• − Y ( •)•• = 428.8 − 489.2 = −60.4


αˆ ( 2 ) = Y ( 2 )•• − Y (• )•• = 465.5 − 489.2 = −23.7
αˆ (3) = Y ( 3)•• − Y (• )•• = 471.5 − 489.2 = −17.7
αˆ ( 4 ) = Y ( 4 )•• − Y (• )•• = 591.0 − 489.2 = 101.8

Los efectos estimados de los bloques por columnas:

βˆ1 = Y ( • )1• − Y ( • )•• = 497 .7 − 489 .2 = 8.5


βˆ 2 = Y ( • ) 2• − Y ( • )•• = 549 .5 − 489 .2 = 60 .3
βˆ 3 = Y ( • ) 3• − Y ( • )•• = 409 .2 − 489 .2 = −80
βˆ 4 = Y ( • ) 4• − Y ( • )•• = 500 .25 − 489 .2 = 11 .05
Los efectos estimados de los bloques por columnas:

ζ 1 = Y ( • )•1 − Y ( • )•• = 509 .5 − 489 .2 = 20 .3


ζ 2 = Y ( • )• 2 − Y ( • )•• = 533 − 489 .2 = 43 .8
ζ 3 = Y ( • )•3 − Y ( • )•• = 439 .7 − 489 .2 = − 49 .5
ζ 4 = Y ( • )• 4 − Y ( • )•• = 474 .5 − 489 .2 = − 14 .7

68
El efecto estimado del error ε 21 :

εˆ(1) 23 = Y(1) 23 − Y (1)•• − Y ( • ) 2• − Y ( • )•3 + 2Y ( • )••


= 400 − 428 .8 − 549 .5 − 439 .7 + 2( 489 .2) = −39.6

2.3.6 Análisis de Varianza

En este modelo la variabilidad total se descompone en cuatro fuentes de variación, la


explicada por los tratamientos, por los bloques filas, por los bloques columnas y por el
error.
Por lo tanto, el modelo de descomposición de la varianza será el siguiente:

VariabilidadTotal = VarTrat + VarBloq Fila + VarBloq Col + VarError

La variabilidad total es cuantificada por la suma de los cuadrados total:

t t t t Y(2•)••
scTotal = ∑∑(Y(i) jk − Y (•)•• )2 = ∑∑Y(i2) jk −
j=1 k=1 j=1 k=1 t2

Y(2• )••
donde FC = (Factor de corrección).
t2
Las sumas de cuadrados de los tratamientos, bloques por filas y por columnas y error
experimental se calculan de la siguiente manera:
t Y(2i)•• t Y(2•) j•
SCTrat = ∑ − FC SCbloq Fila = ∑ − FC
i=1 t j =1 t

t Y(2•)•k
SCbloq Columnas= ∑ − FC
k=1 t
t t t Y(i2)•• t Y(•2) j• t Y(2•)•k
SCError = ∑∑Y 2
(i ) jk −∑ −∑ −∑ + 2FC
j =1 k =1 i=1 t j =1 t k =1 t

SC Error = SCTotal − SCTrat − SC Bloq Fila − SC Bloq Col

69
Estas fuentes de variación son comparadas mediante el siguiente procedimiento de
prueba de hipótesis a partir del cuadro de análisis de varianza (Cuadro ANOVA)

Fuentes de Suma de Grados de Cuadrados F


Variación Cuadrados Libertad Medios
(SC) (gl) (CM)
Filas SC(Filas) t −1 SC(Filas) CM(Trat)
gl(Filas) CM(Error)

Columnas t −1 SC(Col)
SC(Col.)
gl(Col)
Tratamientos t −1 SC(Trat)
SC(Trat)
gl(Trat)
Error (t − 1)(t − 2) SC(Error)
SC(Error)
gl(Error)
Total SC(Total) t 2 −1

Hipótesis:

Para el Modelo I (Efectos fijos) las hipótesis son, en términos de los efectos de los
tratamientos las siguientes:
H0: αi= 0 ∀ i
H1: αi≠ 0 para algún i

En términos de las medias de los tratamientos:


H0: µi= µ ∀ i
H1: µi≠ µ para algún i

Para el Modelo II (Efectos aleatorios) las hipótesis serán planteadas en términos de la


varianza de los tratamientos:
H0: σ t = 0
2

H1: σ t > 0
2

En cualquiera de los casos, la hipótesis nula implica que los tratamientos no afectan a la
variable respuesta o lo que es lo mismo, que con todos los tratamientos se obtienen los
mismos resultados.

Valores Esperados de los Cuadrados Medios.


En la siguiente tabla se presentan los valores esperados de los cuadrados medios para un
experimento en DCL, en el caso de los efectos fijos y aleatorios tanto para los tratamientos
como por filas y columnas.

70
Causa de Grados Valor Esperado de los Cuadrados
Variación de Medios
Libertad Modelo I Modelo II
(gl)
t
α i2
Tratamientos t-1 σ + t∑
2
σ 2 + tσ α2
i =1 t −1
t β j2
Filas t-1 σ + t∑
2
σ 2 + tσ β2
j =1 t −1
t-1 t
ζ k2
Columna σ + t∑
2
σ 2 + tσ ζ2
j =1 t −1
Error (t- 1)(t- 2)
Experimental σ2 σ2
Total t2- 1

Estadístico de Prueba.

CM Trat
F= ~ F( gl (Trat ), gl ( Error ))
CM Error
Regla de decisión:

Si F > F ( gl ( Trat ), gl ( Error ))

Entonces H0 se rechaza y
∴ Hay entre los tratamientos.
Ejemplo 1 (Cont.): A continuación se presenta el análisis de varianza y la prueba de
hipótesis correspondiente para el ejemplo tratado en esta sección:

t t Y(2•)••
scTotal = ∑∑Y 2
(i ) jk −
j=1 k=1 t2
7827 2
= (432 + 550 + ..... + 494 ) −
2 2
= 42586 2

42

71
t Y(2i)••
SCTrat = ∑ − FC
i =1 t
17152 18622 18862 23642 7827 2
= + + + + = 59570
4 4 4 4 42

t Y(2•) j •
SCbloq Fila = ∑ − FC
j =1 t
19912 2198 2 1637 2 20012 7827 2
= + + + + = 40893
4 4 4 4 42

t Y(2•)•k
SCbloq Columnas = ∑ − FC
k =1 t
20382 21322 17592 18982 7827 2
= + + + + = 19968
4 4 4 4 42

SC Error = SCTotal − SCTrat − SC Bloq Fila − SC Bloq Col = 22426

ANOVA

Fuentes de Suma de Grados de Cuadrados F


Variación Cuadrados Libertad Medios
(SC) (gl) (CM)
Filas 59570 3 19857 5.31
Columnas 40893 3 13631
Tratamientos 19968 3 6656
Error 22426 6 3738
Total 142856 15

Asumiendo un modelo de efectos fijos, las hipótesis en términos de los efectos de los
tratamientos son:

H0: αi= 0 ∀ i
H1: αi≠ 0 para algún i

72
En términos de las medias de los tratamientos:

H0: µi= µ ∀ i
H1: µi≠ µ para algún i

O literalmente:

H0: Los cuatro abonos nitrogenados tienen el mismo efecto en el cultivo de caña de
azúcar.
H1: Con al menos uno de los abonos nitrogenados se obtiene un efecto diferente en el
cultivo de caña de azúcar.

El estadístico de prueba es F = 5.31 . El valor de tabla para un nivel de significación del


5% es F( 0.95,3, 6) = 4.76. Dado que el estadístico de prueba resulta mayor que el valor
de la tabla se rechaza H0 y se concluye que existe suficiente evidencia estadística para
aceptar que con al menos uno de los abonos nitrogenados se obtiene un efecto
diferente (rendimientos diferentes) en el cultivo de la caña de azúcar.

El coeficiente de variación para este experimento es:

CME 3738
cv = = = 12.50%
Y ( • ) •• 489.19

2.3.7 Pruebas de Comparación de Medias de Tratamientos

A continuación se presentan las desviaciones estándar a utilizar en cada una de las


pruebas:

2CME
1) Prueba t y DLS Sd =
t
ci2
S Lˆ = CME ∑i =1
t
2) Contrastes Ortogonales
t
CME
3) Tukey Sd =
t
2CME
4) Dunnet Sd =
t

73
2.3.8 Ejercicios

1) Un ingeniero industrial está investigando el efecto que tiene cuatro métodos de


ensamblaje (A, B, C y D) sobre el tiempo (en minutos) de ensamblaje de un
componente para televisores a color. Se seleccionan cuatro operadores para realizar
este estudio.
Por otra parte, el ingeniero sabe que no todos los operadores son igualmente hábiles
y que el trabajo produce fatiga, por lo que el tiempo que se tarda en el último
ensamblaje es mayor que en el primero, independientemente del método. Para
controlar estas posibles fuentes de variabilidad, el ingeniero utiliza el DCL. Los
resultados se muestran a continuación:

Orden de Operador
Montaje 1 2 3 4
1 C= 10 D= 14 A= 07 B= 08
2 B= 07 C= 18 D= 11 A= 09
3 A= 05 B= 10 C= 11 D= 09
4 D= 10 A= 10 B= 12 C= 14

a) Presente el modelo aditivo lineal e interprete cada uno de sus componentes en


términos del enunciado.
b) Efectué el análisis de varianza.
c) Mediante la prueba DLS compare los métodos A y D.

2) Se probaron 4 raciones alimenticias para pollos, criados en jaula tipo batería de 4


pisos (filas) y 4 casilleros (columnas). La variable analizada fué: Peso del pollo (kg.)
a las 8 semanas de edad

Casilleros
Pisos 1 2 3 4
1 1.40(A) 1.38(B) 1.40(C) 1.60(D)
2 1.35(B) 1.28(A) 1.45(D) 1.62(C)
3 1.38(C) 1.40(D) 1.42(B) 1.63(A)
4 1.39(D) 1.39(C) 1.40(A) 1.60(B)

a) Presente el Modelo Aditivo Lineal


b) Realice la Prueba de Hipótesis correspondiente. Use α=0.05
c) Realice la Prueba de Duncan para comparar si existe diferencias entre los
tratamientos en estudio. Use α=0.05
d) Realice la prueba de Tukey para comparar si existe diferencia entre el
tratamiento A y B. Use α=0.05

74
e) Realice la prueba DLS para comparar si existe diferencia entre el tratamiento
C y D. Use α=0.01
f) Utilice la prueba T para comparar si el peso promedio utilizando el
tratamiento C es menor al peso promedio usando el tratamiento B. Use
α=0.05

3) Se realizó un experimento para observar el rendimiento en kilogramos por parcela de


5 variedades de garbanzo (A, B, C, D y E) en el cual se tuvo que utilizar el diseño
Cuadrado Latino. Las filas fueron definidas como niveles de riego y las columnas
como fertilidad del suelo. Los datos se presentan a continuación:

Niveles Fertilidad del suelo


de riego 1 2 3 4 5
1 B= 65 C= 80 A= 55 E= 83 D= 80
2 C= 95 A= 60 E= 94 D= 95 B= 62
3 A= 63 E= 98 D= 79 B= 69 C= 100
4 E= 97 D= 94 B= 46 C= 71 A= 42
5 D= 76 B= 54 C= 106 A= 36 E= 96

a) Presente el modelo aditivo lineal e interprete cada uno de sus componentes en


términos del enunciado.
b) Presente el cuadro ANOVA y pruebe la hipótesis respectiva.
c) Realice la prueba de Tukey.

2.4 Diseño de Bloques Incompletos

Es posible que en algunos experimentos que usan diseños por bloques no puedan
realizarse los ensayos de todas las combinaciones de tratamiento dentro de cada bloque o
que en algún momento se pierdan los valores tomados. Situaciones como éstas ocurren
debido a escasez en los recursos del experimento, por descuidos o por el tamaño físico
de los bloques. Por ejemplo, supongamos un experimento en el que el tamaño físico de
las probetas sólo alcanza para probar tres puntas en cada probeta. En estos casos en
posible usar diseños aleatorizados por bloques en los que cada tratamiento no está
presente en cada bloque. Estos diseños se conocen como Diseños Aleatorizados de
Bloques Incompletos (DBI), y serán el motivo de estudio.
Cuando las comparaciones entre todos los tratamientos tienen la misma importancia,
éstas deben elegirse de manera que ocurran en forma balanceada dentro de cada bloque.
Esto significa que cualquier par de tratamientos ocurren juntos el mismo número de
veces que cualquier otro par. Por lo tanto, un diseño balanceado de bloques incompletos
es un diseño de bloques incompletos en el que cualquier par de tratamientos ocurren
juntos el mismo número de veces.

75
2.4.1 Análisis estadístico

Como es usual, suponemos que existen a tratamientos y b bloques. Se supone además,


que se prueban k tratamientos en cada bloque, que cada tratamiento sucede r veces en el
diseño (o se repite r veces) y que hay un total de N= a•r = b•k observaciones. Más aún,
el número de veces que cada par de tratamientos ocurre en el mismo bloque es

λ = r ⋅ (k − 1) a − 1
Se dice que el diseño es simétrico si a = b.

El parámetro λ debe ser un entero. Para deducir la relación de λ, considérese cualquier


tratamiento, por ejemplo el 1.Como el tratamiento 1 ocurre en r bloques, y hay otros k-1
tratamientos en cada uno de esos bloques, existen r• (k-1) observaciones en un bloque
que contiene al tratamiento 1. Estas r• (k-1) observaciones deben representar al resto de
los a-1 tratamientos λ veces. Por lo tanto, λ• (a-1) =r• (k-1).

EJEMPLO 1: Para a = 4 (nº de tratamientos), b = 4, (nº de bloques) k = 3 (tratamientos


en cada bloque), un diseño BIB puede ser construido con:
R = (b• k / a)= 3 (cada tratamiento sucede 3 veces en el diseño)
λ = r• (k-1) . a-1 =3. (3- 1)/4-1 =2 (el número de veces que cada par de tratamientos
ocurre en el mismo bloque)

Bloques Tratamientos
1 1 2 3
2 1 2 4
3 1 3 4
4 2 3 4

EJEMPLO 2: Para a = 4 (nº de tratamientos), b = 6, (nº de bloques) k = 2 (tratamientos


en cada bloque), un diseño BIB puede ser construido con:
R = (b• k / a)= 3 (cada tratamiento sucede 3 veces en el diseño)
λ = r• (k-1) • a-1 =3. (2- 1)/4-1 =1 (el número de veces que cada par de tratamientos
ocurre en el mismo bloque)

Bloques Tratamientos
1 1 2
2 3 4
3 1 3
4 2 4
5 1 4
6 2 3

76
EJEMPLO 3: Supongamos b = 4 bloques incompletos para investigar b = 6
tratamientos.

Bloques Tratamientos
1 1 2 3
2 1 3 6
3 2 3 5
4 4 5 6

Aunque r =2 (cada tratamiento sucede 2 veces en el diseño), pero no es un diseño BIB


porque λ no es igual para todas las parejas de tratamientos. Los pares de tratamientos
(1,5), (2,6) y (3,4) no ocurren en todos los bloques, el resto de parejas aparecen una sola
vez en el mismo bloque.

2.4.2 Modelo estadístico

El modelo estadístico que se usa en este tipo de diseño es:

Yij = µ + τ i + β j + ε ij

En donde Yij es la i-ésima observación del j-ésimo bloque, µ es la media general,


τ i es el efecto del i-ésimo tratamiento, βj es el efecto del j-ésimo bloque, y ε ij es la
componente del error aleatorio NID (0, σ2).

2.4.3 Conformando la tabla ANOVA

La variación total en los datos se expresa mediante la suma total de cuadrados


corregidos (o ajustados).

SS T = ∑i ∑ j y ij2 − ( y •2• N )

La variabilidad total puede ser descompuesta

SS T = SS Tratemient os ajustada + SS Bloques + SS ε

En donde corrige la suma de cuadrados de tratamiento para separar los efectos de


tratamiento y de bloque. Esta corrección es necesaria porque cada tratamiento ocurre en
un conjunto diferente de r bloques. Por esta razón las diferencias entre los totales de

77
tratamientos no corregidos, y1 , y 2 ,..., y a también son afectadas por las diferencias entre
los bloques.

La suma de cuadrados de los bloques es

SS Bloques = (∑ j =1 y•2j k ) − ( y•2• N )


b

en donde y j es el total del j-ésimo bloque. La SS Bloques tiene b-1 grados de libertad. La
suma de cuadrados de tratamiento corregida (o ajustada) es

SSTratamientos ajustada = k ∑i=1 Qi2 λa


a

En donde Qi es el total corregido del i-ésimo tratamiento, el cual se calcula mediante

b
Qi = y i• − (∑ nij ⋅ y • j ) k , i = 1,2,...., a
j =1

con nij = 1 si el tratamiento i ocurre en el bloque j, nij = 0 en otro caso. Por lo tanto,

(1 / k ) ⋅ ∑ j =1 nij ⋅ y• j
b
es el promedio de los totales de

los bloques en los que se aplica el tratamiento i. La suma de los totales de tratamiento
corregidos siempre será 0. La SSTratamientos ajustada tiene a -1 grados de libertad. La
suma de cuadrados del error se calcula por diferencia

SS ε = SS T − SS Tratamientos ajustada − SS Bloque


Y tiene N = a ⋅ b ⋅ c grados de libertad.

SSBloque
La estadística apropiada para probar la igualdad de los efectos de tratamiento es:

F = CM Tratamientos / CM ε

78
Análisis de varianza para el diseño DBI

Fuente de Suma de Cuadrados G. Media Cuadrados F


Variación libertad
Tratamientos
Corregidos
SSTratamientos ajustada a- 1 SSTTOS a − 1 CM T CM E

Bloques
SS Bloques b- 1
SS Bloques b − 1
Error
SSε N-a- b+ 1
SSε ( N − a − b + 1)
Total N- 1
SST

Fuente de Variación Suma de cuadrados G. libertad Media Cuadrados F

EJEMPLO: Supóngase que un ingeniero químico cree que el tiempo de reacción en un


proceso químico es función del catalizador empleado. De hecho 4 catalizadores están
siendo investigados. El procedimiento experimental consiste en seleccionar un lote de
materia prima, cargar una planta piloto, aplicar cada catalizador a ensayos separados de
dicha planta y observar el tiempo de reacción. Debido a que las variaciones en los lotes
de materia prima pueden afectar el comportamiento del catalizador, el ingeniero decide
controlar este factor por medio de bloques. Sin embargo, cada lote es lo suficientemente
grande para permitir el ensayo de 3 catalizadores únicamente. Por lo tanto, es necesario
utilizar un diseño aleatorizado por bloques incompletos. El diseño BIB, junto con las
observaciones recopiladas aparecen en la siguiente tabla:

Tratamiento Bloque (Lote de Materia Prima)


(Catalizador) 1 2 3 4 y i•
1 73 74 - 71 218
2 - 75 67 72 214
3 73 75 68 - 216
4 75 - 72 75 222
y• j 221 224 207 218 870= y ••

Considérense los datos de la Tabla para el experimento de los catalizadores. Éste es un


diseño DBI con a = 4, b = 4, k = 3, r = 3, λ= 2 y N = 12.
A continuación vamos a realizar el análisis de estos datos.

La Suma Total de Cuadrados:

SS T = ∑i∑ j y ij2 − ( y •2• 12)


= 63.156 − (870) 2 12 = 81.00

79
La Suma de Cuadrados de Bloque es:

SS Bloques = (∑ j =1 y•2j 3) − ( y•2• 12)


4

(221) 2 + (207) 2 + (224) 2 + (218) 2 (870) 2


= − = 55.00
3 12
Para calcular la suma de cuadrados de tratamiento corregida que tome en cuenta los
bloques, primero hay que determinar los totales de tratamientos corregidos:

Q1= (218) – (221+ 224 + 218)/ 3 = - 9/ 3


Q2 = (214) – (207 + 224 + 218) /3 = - 7/3
Q3 = (216) – (221 + 207+ 224) / 3 = - 4/3
Q4 = (222) – (221 + 207 + 224) /3 = 20 /3

Se calcula ahora la suma de cuadrados de tratamiento corregida:

SSTratamientos ajustada = k ∑i=1 Qi2 λa


a

9 7 4 20
(− ) 2 + (− ) 2 + (− ) 2 + ( ) 2
= 3⋅ 3 3 3 3 = 22.75
2⋅4

La suma de cuadrados del error se calcula por diferencia:

SS ε = SS T − SS Tratamientos ajustada − SS Bloque


= 81.00 – 22.75 – 55.00 = 3.25

Vamos a escribir la Tabla para el Análisis de la Varianza:

Fuente de Suma de Grados de Media de F


Variación Cuadrados Libertad Cuadrados
Tratamientos 22.75 3 7.58 11.66
(corregidos)
Bloques 55.00 3 ----
Error 3.25 5 0.65
Total 81.00 11

Como F > F0.05;3, 5 = 5.41 , se concluye que el catalizador empleado tiene un efecto
significativo sobre el tiempo de reacción.

80
2.4.4 Calculo de los efectos

Evaluación de los efectos del bloque:

En ocasiones, se desea evaluar los efectos de los bloques. Para lograrlo se requiere una
descomposición alterna de SST, en otras palabras,

SS T = SS Tratemientos ajustada + SS Bloques + SS ε

a
Q j `= y• j − (∑ nij ⋅ yi• ) r , j = 1,2,...., b
i =1

SS Bloques ajustada = r ∑ j =1 (Qi `) 2 λ ⋅ b


b

Como a = b = 4, el diseño balanceado por bloques incompletos es simétrico. Por lo


tanto,

Q1’ = (221)- (218+ 216 + 222) / 3 = 7/3

Q2’ = (224) – (218 + 214 + 216) / 3 = 24 /3

Q3’ = (207)- (214 + 216+ 222)/ 3 = -31/3

Q4’ = (218) – (218 + 214 + 222)/3 = 0

7 24 31
( ) 2 + ( ) 2 + (− ) 2 + 0 2
SS Bloques ajustada = 3⋅ 3 3 3 = 66.08
2⋅4

( 218) 2 + ( 214) 2 + (216) 2 + (222) 2 (870) 2


SSTratamientos = − = 11.67
3 12
El resumen del Análisis de la Varianza para el diseño BIB simétrico, se muestra en la
siguiente tabla:

81
Fuente de Suma de Grados de Media de F
Variación Cuadrados Libertad Cuadrados
Tratamientos 22.75 3 7.58 11.66
(corregidos)
Tratamientos
(no 11.67 3 ----
corregidos)
Bloques 55.00 3 ----
Bloques 66.08 3 22.03 33.90
(corregidos)
Error 3.25 5 0.65
Total 81.00 11

Hay que observar que la suma se cuadrados asociadas con cada media de cuadrados en
la tabla anterior no es igual a la suma total de cuadrados, o sea que

SS T ≠ SS Tratemient os ajustada + SS Bloques ajustada + SS ε

82
Capítulo 3 Diseños factoriales.
♦ Diseños factoriales.
♦ Diseños 2k.

3.1 Diseños factoriales

En capítulos anteriores se estudiaron los diseños Completamente al Azar, en los cuales


se analizó un solo factor de tratamientos. Un experimento factorial es aquel en el que se
estudian simultáneamente varios factores de modo que los tratamientos se forman por
todas las posibles combinaciones de los niveles de los factores. Un experimento factorial
no constituye un nuevo diseño experimental, sino un diseño para la formación de los
tratamientos. Los experimentos factoriales pueden ser conducidos bajo los lineamientos de
cualquier diseño experimental tal como el DCA, DBCA o DCL.
Los experimentos factoriales son ampliamente utilizados y son de gran valor en el
trabajo exploratorio cuando se sabe poco sobre los niveles óptimos de los factores o ni
siquiera qué factores son importantes. Estos experimentos son útiles también en campos de
estudio más complejos en los que se sabe que un factor no actúa independientemente sino
en estrecha relación con otros factores.
Ahora trataremos los experimentos factoriales con dos factores conducidos bajo los
lineamientos de un DCA y DBCA.

3.1.1 Ventajas, Desventajas y Usos

Ventajas:

− Permite obtener más información que en un experimento de un solo factor, ya que se


estudian los efectos principales, los efectos simples, los efectos cruzados y de
interacción entre los factores.
− Todas las unidades intervienen en la estimación de los efectos principales y de
interacción, por lo que el número de repeticiones es elevado para estos casos.
− El número de grados de libertad para el error experimental es alto, comparándolo con
los grados de libertad de los experimentos simples de los mismos factores, lo que
contribuye a disminuir la variancia del error experimental, aumentando por este
motivo la precisión del experimento.

83
Desventajas:

− Se requiere un mayor número de unidades experimentales que en los experimentos


con un solo factor.
− Dado que todos los niveles de un factor se combinan con todos los niveles de los
otros, por requerimientos del análisis estadístico, se tendrá que algunas
combinaciones que no son de interés para el investigador, serán también incluidas en
el experimento.
− El análisis estadístico y la interpretación de los resultados son más complicados que
en los experimentos con un solo factor, y la dificultad aumenta considerablemente
conforme más factores son incluidos.

Usos:

Los diseños factoriales son apropiados:

− En el trabajo de exploración donde el objetivo es determinar rápidamente los efectos


de cada uno de ciertos números de factores dentro de un intervalo.
− En investigaciones de las interacciones entre los efectos de varios factores.
− En experimentos diseñados para poder llegar a recomendaciones que deben aplicarse
a una gran variedad de condiciones.

(Sigarroa, A. 1985)

3.1.2 Notación y Definiciones

En este tema abordaremos la notación y algunas definiciones necesarias para la


comprensión de este tipo de diseño.

3.1.2.1 Factor

Los factores son designados por letras mayúsculas. Por ejemplo en un experimento en el
que se evalúan 3 cantidades de semilla con 4 dosis de nitrógeno por parcela y 2 variedades
de maíz destinado a chala, el factor cantidad de semilla se puede denotar por A, el factor
dosis de nitrógeno por B y el factor de maíz por C.

3.1.2.2 Niveles de un Factor

Los niveles de un factor son denotados por letras minúsculas con subíndices. Por
ejemplo, las 3 cantidades de semilla podrían ser denotadas por a1, a2 y a3, las 4 dosis de
nitrógeno por b1, b2, b3, b4, y las 2 variedades de maíz por c1, c2.

84
Una combinación de letras minúsculas con sus respectivos subíndices es utilizada para
denotar una combinación de los niveles de los factores. Por ejemplo la combinación a2b2c1
denotará el tratamiento conformado por la aplicación de la cantidad a2 de semilla con la
dosis b2 de nitrógeno y la variedad c1 de maíz.

3.1.2.3 Tipos de Factores

Dependiendo de la naturaleza de los niveles de los factores, estos pueden ser cualitativos
o cuantitativos. En el ejemplo, los factores A y B son cuantitativos y el factor C cualitativo.
En el caso de factores cuantitativos estos pueden ser igualmente espaciados o no. Así por
ejemplo, para el factor B, niveles de 0, 10, 20, 30 Kg/parcela y de 10, 20, 40, y 80
Kg/parcela constituirían niveles igualmente espaciados y no igualmente espaciados
respectivamente.
Adicionalmente, los factores pueden ser fijos o al azar, dependiendo de la forma en que
son seleccionados sus niveles. Un experimento factorial con todos sus factores fijos
corresponderá a un modelo I o de efectos fijos, un experimento factorial con todos sus
factores aleatorios corresponderá a un modelo II o de efectos aleatorios y un experimento
factorial con algunos factores fijos y otros aleatorios corresponderá a un modelo III o de
efectos mixtos. En este caso se considerarán que todos los factores son fijos.

3.1.2.4 Tipos de Experimentos Factoriales

Un experimento factorial queda definido por el número de factores y niveles de cada


factor.
Un experimento factorial puede ser denotado utilizando las letras correspondientes a los
factores antecedidas por el número de niveles correspondiente a cada uno. Por ejemplo, el
experimento con 3 niveles del factor A, 4 del factor B y 2 del factor C puede ser denotado
por 3A4B2C o simplemente 3x4x2.

3.1.2.5 Efectos en los Experimentos Factoriales

Efecto Principal: Es el efecto de un factor en promedio sobre los niveles de los otros
factores.
Efectos Simple: Es el efecto de un factor, en un nivel de los demás factores.
Efectos Interacción: Está dado por la variación que tiene un efecto simple de un factor al
pasar de un nivel a otro de otro factor.
Efectos Cruzado: Está dado por las combinaciones cruzadas de dos factores.

3.1.3 Presentación de los datos

A continuación mostraremos la forma en que organizaremos los datos dentro de la tabla,


ella nos permitirá expresar de una forma estructural los datos.

85
FACTOR B
B1 B2 … Bb
Y111 Y121 … Y1b1
F A1 … … … …
A Y11r Y12r … Y1br
C Y211 Y221 … Y2b1
T A2 … … … …
O
Y21r Y22r … Y2br
R

A Yh11 Yh21 … Yhb1
Ah … … … …
Yh1r Yh2r … Yhbr

Ejemplo 1: A continuación se presenta datos para un experimento factorial 2x2.

Niveles del a1 a2
Factor A
Niveles del b1 b2 b1 b2
Factor B
Medias 54 38 45 56

Efectos Simples:

- De A en b1: ES(A(b1))= a1b1 –a2b1= 54- 45= 9


- De A en b2: ES(A(b2))= a1b2 –a2b2= 38- 56= -18
- De B en a1: ES(B(a1))= a1b1 –a1b2= 54- 38= 16
- De B en a2: ES(B(a2))= a2b1 –a2b2= 45- 56= -11

Efectos Principales:

- De A: EP(A)=
1
[ES ( A(b1 ) + ES ( A(b2 ))] = 9 − 18 = −4.5
2 2
1 16 − 11
- De B: EP(B)= [ES ( B (a1 ) + ES ( B (a 2 ))] = = 2 .5
2 2

Efecto de interacción:

- De AB: EI(AB)=
1
[ES ( A(b1 ) + ES ( A(b2 ))] = 9 + 18 = 6.75
2× 2 2
- EP(AB)=
1
[ES ( B(a1 ) + ES ( B(a 2 ))] = 16 + 11 = 6.75
2× 2 2

86
Efectos cruzados:

- entre a1b1 y a2b2: EC(a1b1 - a2b2)= a1b1- a2b2= 54- 56= -2


- entre a1b2 y a2b1: EC(a1b2 - a2b1)= a1b2- a2b1= 38- 45= -7

3.1.4 Experimentos Factorial pxq

3.1.4.1 Modelo Aditivo Lineal

En un DCA, el modelo aditivo lineal está dado por:

Yij = µ + α i + ε ij i = 1,....., k j = 1,...., ni

Ahora, dado que los tratamientos son generados por las combinaciones entre los niveles
de dos factores, el efecto de los tratamientos se descompone en el efecto del factor A, el
efecto del factor B y el efecto de la interacción entre los dos factores. Así, el modelo
aditivo lineal para un factorial pxq en DCA será:

Yijk = µ + α i + β j + I ij + ε ijk
donde:
Yijk: es el valor o rendimiento observado con el i-ésimo nivel del factor A, j-ésimo factor
B, k-ésima representación de la celda (ij).
µ: es el efecto de la media general.
αi: es el efecto del i-ésimo nivel del factor A.
β: es el efecto del j-ésimo nivel del factor B.
Iij: es el efecto del interacción del i-ésimo nivel del factor A con el j-ésimo nivel del factor
B.
εijk: es el efecto del error experimental en el i-ésimo nivel del factor A, j-ésimo factor B, k-
ésima representación de la celda (ij). εijk~ N(0; σ2).
h: es el número de niveles de factores A.
b: es el número de niveles de factores B.

En el caso de un experimento factorial en DBCA, el modelo aditivo lineal es:

Yijk = µ + αi + β j + Iij + γ k + ε ijk

donde:
γk: es el efecto del k-ésimo bloque.

Los supuestos del modelo serán los mismos que para el DCA o DBCA con un solo
factor vistos anteriormente. Los cálculos y procedimientos presentados de aquí en adelante

87
corresponderán al caso del experimento factorial pxq en DBCA. El caso del experimento
factorial en DCA es similar al del DBCA.

Ejemplo 2 (Experimento Factorial en DBCA):

Se realizó un experimento con un arreglo factorial 2A3B en DBCA en 4 campos de


cultivo, para evaluar el efecto en el rendimiento de maíz obtenido con dos tipos de abono
(a1 y a2) y tres dosis (b1=20, b2= 30, b3= 40 kg/ha). Los resultados obtenidos (en TM/ha) se
presentan a continuación:

Campos a1 a2
b1 b2 b3 b1 b2 b3
1 1.9 1.8 2.7 1.8 2.9 3.0
2 2.3 2.1 2.4 2.2 2.7 3.2
3 2.0 2.4 2.9 2.0 3.2 2.9
4 2.1 2.9 2.8 2.4 3.5 3.4
Total 8.3 9.2 10.8 8.4 12.3 12.5

El modelo aditivo lineal para este ejemplo será:

Yijk = µ + αi + β j + I ij + γ k + ε ijk

donde:
Yijk: es el rendimiento de maíz en Tm/Ha obtenido con el i-ésimo nivel de abono, j-
ésima dosis, k-ésimo campo de cultivo.
µ: es el efecto de la media general.
αi: es el efecto del i-ésimo tipo de abono.
β: es el efecto del j-ésima dosis de abono.
Iij: es el efecto del interacción del i-ésimo tipo de abono, j-ésima dosis.
γk: es el efecto del k-ésimo campo de cultivo.

εijk: es el efecto del error experimental en el i-ésimo nivel del factor A, j-ésimo factor B,
k-ésima representación de la celda (ij). εijk~ N(0; σ2).
h= 2: es el número de niveles de factores A.
b= 3: es el número de niveles de factores B.
r= 4 es el número de bloques.

3.1.4.2 Estimación de los Efectos.

Los efectos del modelo, µ, αi, βj, Iij, γk son estimados de modo que se minimice la
siguiente expresión (Método de los Mínimos Cuadrados):

88
h b r
Q = ∑∑∑ε ijk
2
= ∑∑∑(Yijk − µ − αi − β j − I ij − γ k ) 2
i =1 j =1 k =i

teniendo en cuenta las siguientes restricciones:

h b h b r

∑α =0
i=1
i ∑β
j=1
j =0 ∑I
i=1
ij =0 ∑I
j=1
ij =0 ∑γ
k=1
k =0

La aplicación de este método de los siguientes resultados para la estimación de los


parámetros:

µ̂ = Y ••• α̂ i = Y i•• − Y ••• βˆ j = Y • j • − Y •••


Iˆij = Y ij • − Y i •• − Y • j • + Y ••• γ k = Y •• k − Y • •• εˆijk = Yijk − Y •• k + Y •••

Ejemplo 2 (Cont.): Con los datos del ejemplo anterior, la media estimada es:
µˆ = Y ••• = 2.5625
Los efectos estimados de los niveles del factor A:
αˆ1 = Y 1•• − Y ••• = 2.3583 − 2.5625 = −0.2042
αˆ 2 = Y 2•• − Y ••• = 2.7667 − 2.5625 = 0.2042

Los efectos estimados de los niveles del factor B:


βˆ1 = Y •1• − Y ••• = 2.0875 − 2.5625 = −0.475
βˆ 2 = Y •2• − Y ••• = 2.6875 − 2.5625 = 0.125
βˆ3 = Y •3• − Y ••• = 2.9125 − 2.5625 = 0.35

El efecto estimado de la interacción entre el nivel 1 del factor A y el nivel 2 del factor B:
Iˆ12 = Y 12• − Y 1•• − Y •2• + Y •••
= 2.3 − 2.3583 − 2.6875 + 2.5625
= −0.1833

El efecto estimado del error εˆ234 :


εˆ234 = Y234 − Y 23• − Y ••4 + Y •••
= 3.4 − 3.125 − 2.85 + 2.5625
= −0.0125

89
3.1.5 Análisis de Varianza

En este modelo la variabilidad total se descompone de la siguiente manera:

VariabilidadTotal = VarTrat + VarBloq Fila + VarBloq Col + VarError

donde a su vez, la variabilidad corresponde a los tratamientos que se descomponen en:

Variabilidad (Trat) = Var (Factor A) + Var (Factor B) + Var (I = AxB)

La variabilidad total es cuantificada por la suma de cuadrados total:

k b r k b r
SCTotal = ∑ ∑∑ (Yijk − Y ••• ) =∑∑∑Yijk2 − FC
2

i =1 j =1 k =1 i =1 j =1 k =1

Y•2••
donde FC = . El cual significa factor de correlación.
kbr

La variabilidad correspondiente a los tratamientos, la cual corresponde al efecto


combinado de los factores A y B, se calcula por:

k b Yij2•
SC I = SC ( A) + SC ( B) + SC ( I ) = ∑∑ − FC
i =1 j =1 r

Las sumas de cuadrados de los factores A y B, para la interacción, bloques y error se


calculas de la siguiente manera:
Yi•2•
b Y•2j •
SC ( B) = ∑
k
SC ( A) = ∑ − FC − FC
i =1 br j =1 kr

Y•2•k
r

SC(I)= SC(I)- SC(A)- SC(B) SC Bloques =∑ − FC


k =1 kb

SCError = SCTotal − SCI − SCBloq

Estas Fuentes de variación son comparadas mediante el siguiente procedimiento de


prueba de hipótesis a partir del cuadro de análisis de varianza (Cuadro ANOVA):

90
Fuente de Grados de Sumas de Cuadrados F
Variación Libertad Cuadrados Medios
(gl) (SC) (CM)
SC Bloques
Bloques r-1 SC Bloques gl Bloques
SC A CM A
A k-1 SC A gl A CM Error
SC B CM B
B b-1 SC B gl B CM Error
SC I CM I
I= (AxB) (k-1)(b- 1) SC AB gl I CM Error
Error (kb- 1)(r- 1) SC Error
Experimental
Total kbr- 1 SC Total

Hipótesis:

Para el Modelo I (Efectos fijos) las hipótesis son, en términos de los efectos de los
niveles de los factores las siguientes:

Para el efecto principal de A:


Ho: αi = 0 ∀ i
H1: α i ≠ 0 para al menaos algún i.

Para el efecto principal de B:


Ho: βi = 0 ∀ j
H1: β j ≠ 0 para al menos algún j.

Para el efecto principal de I:


Ho: Iij = 0 ∀ i,j
H1: Iij ≠ 0 para al menos algún i,j.

Para el Modelo II (Efectos aleatorios) las hipótesis serán planteadas en términos de la


varianza de los niveles de los factores:

Para el efecto principal de A:


Ho: σ α = 0
2

H1: σ α > 0
2

91
Para el efecto principal de B:
Ho: σ β2 = 0
H1: σ β >0
2

Para el efecto principal de I:


Ho: σ αβ = 0
2

H1: σ αβ > 0
2

Estadístico de Prueba:
CM A
Para el efecto principal de A: F= ~ F( gl ( A), gl ( Error ))
CM Error

CM B
Para el efecto principal de B: F= ~ F( gl ( B ), gl ( Error ))
CM Error

CM I
Para el efecto principal de I: F= ~ F( gl ( I ), gl ( Error ))
CM Error

Regla de Decisión:
La hipótesis nula se rechaza con un nivel de significación de α si el F resulta mayor que
el valor de la tabla F(1−σ ) con los grados de libertad correspondientes a cada caso.

La hipótesis nula a evaluar es la correspondiente a la interacción. Que no exista


interacción significa que el efecto de un factor es el mismo en cualquiera de los niveles del
otro, por lo que las conclusiones para los factores se obtendrán a partir del análisis de sus
efectos principales. Si en cambio existe interacción, el efecto de un factor dependerá de los
niveles del otro y el análisis de los efectos principales no será apropiado. En este caso se
deberá efectuar un análisis de los efectos simples de los factores.

Ejemplo 2 (Cont.): A continuación se presenta el análisis de varianza y las prueba de


hipótesis correspondiente para el ejemplo tratado en esta sección:

k b r
SCTotal = ∑∑∑ Yijk2 − FC
i =1 j =1 k =1

61.52
= (1.9 2 + 2.32 + ..... + 3.4 2 ) − = 6.0763
(2)(3)(4)

92
Yi•2•
k
SC ( A) = ∑ − FC
i =1 br
28.32 33.2 2 61.52
= + − = 1.0004
(3)(4) (3)(4) (2)(3)(4)

b Y•2j •
SC ( B) = ∑ − FC
j =1 kr
16.7 2 21.52 23.32 61.52
= + + − = 2.91
(2)(4) (2)(4) (2)(4) (2)(3)(4)

SC I = SC I − SC A − SC B
= 4.4738- 1.0004- 2.91= 0.5633

r
Y•2• k
SC Bloques =∑ − FC
k =1 kb

14.12 14.9 2 15.4 2 17.12 61.52


= + + + − = 0.8046
(2)(3) (2)(3) (2)(3) (2)(3) (2)(3)(4)

SC E = SCTotal − SC I − SC Bloq
= 6.0763- 4.4738- 0.8046
= 0.7979

Cuadro ANOVA:

Fuente de Grados de Sumas de Cuadrados F


Variación Libertad Cuadrados Medios
(gl) (SC) (CM)
Bloques 3 0.8046 0.2682
A 1 1.0004 1.0004 18.81
B 2 2.9100 1.4550 27.35
I= (AxB) 2 0.5633 0.2817 5.30
Error Exp. 15 0.7979 0.0532
Total 23 6.0763

Para un modelo de efectos fijos las hipótesis serán:

Para el efecto principal de A: Ho: αi = 0 ∀ i


H1: α i ≠ 0 para al menaos algún i.

93
Para el efecto principal de B:
Ho: βi = 0 ∀ j
H1: β j ≠ 0 para al menos algún j.

Para el efecto principal de I:


Ho: Iij = 0 ∀ i,j
H1: Iij ≠ 0 para al menos algún i,j.

Para la interacción el estadístico de prueba es F = 5.30 y el valor de la tabla, con un


nivel de significación de 5% es F( 0.95, 2,15 ) = 3.68 . Dado que el estadístico de prueba
resulta mayor que el valor de la tabla se rechaza H0 y se concluye que hay suficiente
evidencia estadística para aceptar la existencia de interacción entre el tipo de abono y la
dosis; por lo tanto, será necesario analizar los efectos simples de los factores en vez de sus
efectos principales.

El coeficiente de variación para este experimento es:

CME 0.0532
cv = = = 9% .
Y •• • 2.5625

3.1.6 Análisis de Efectos Simples

Este análisis debe ser efectuado en el caso que la interacción resulte significativa y
consiste en evaluar a cada factor en cada uno de los niveles del otro. Las hipótesis a
contrastar en este caso, asumiendo un Modelo I (Efectos fijos) son las siguientes:

1) Para el efecto simple de A en el j-ésimo nivel de B:


Ho: µ1 j • = µ 2 j • = ...... = µ kj • ∀ j
H1: Al menos un µ ij • es diferente.
2) Para el efecto simple de B en el i-ésimo nivel de A:
Ho: µ i1• = µ i 2• = ...... = µ ib• ∀ i
H1: Al menos un µ ij • es diferente.

Los grados de libertad para cada efecto simple serán iguales a los grados de libertad del
correspondiente efecto principal y las sumas de cuadrados son calculadas de acuerdo con
las siguientes fórmulas:

1) Para el efecto simple de A en el j-ésimo nivel de B:

k Yij2• Y•2j •
SC ( Ab j ) = ∑ −
i =1 r kr

94
2) Para el efecto simple de B en el i-ésimo nivel de A:

b Yij2•Yi•2•
SC ( Ba j ) = ∑ −
j =1 r br

Para cada efecto simple el estadístico de prueba F se calcula dividiendo el cuadrado


medio del efecto simple entre el cuadrado medio del error. El efecto será significativo con
un nivel de significación α si es que el F es mayor que el valor de F de la tabla con los
grados de libertad del efecto y del error.

Ejemplo 2 (Cont.): Análisis de los efectos simples:

Yi12• Y•12• 8.3 2 8.4 2 16.7 2


k
SC ( Ab1 ) = ∑ − = + − = 0.00125
i =1 r kr 4 4 (2)(4)

Yi 22• Y•22• 9.2 2 12.3 2 21.5 2


k
SC ( Ab2 ) = ∑ − = + − = 1.20125
i =1 r kr 4 4 (2)(4)

Yi 32• Y•23• 10.8 2 12.5 2 23.3 2


k
SC ( Ab3 ) = ∑ − = + − = 0.36125
i =1 r kr 4 4 (2)(4)

b Y12j • Y1•2• 8.3 2 9.2 2 10.8 2 28.3 2


SC ( Ba1 ) = ∑ − = + + − = 0.80167
j =1 k kb 4 4 4 (3)(4)

b Y22j • Y22•• 8.4 2 12.3 2 12.5 2 33.2 2


SC ( Ba2 ) = ∑ − = + + − = 2.67167
j =1 k kb 4 4 4 (3)(4)

Cuadro ANOVA:

Fuente de Grados de Sumas de Cuadrados F


Variación Libertad Cuadrados Medios
(gl) (SC) (CM)
Ab1 1 0.00125 0.00125 0.02 ns
Ab2 1 1.20125 1.20125 22.58 *
Ab3 1 0.36125 0.36125 6.79 *
Ba1 2 0.80167 0.40083 7.54 *
Ba2 2 2.67167 1.33583 25.11 *
Error Exp. 15 0.79792 0.05319
Total 23 6.07625

95
Para un modelo de efectos fijos las hipótesis serán:

Para A en b1: Para A en b3:


Ho: µ11• = µ 21• Ho: µ13• = µ 23•
H1: µ11• ≠ µ 21• H1: µ13• ≠ µ 23•

Para A en b2: Para B en a1:


Ho: µ12• = µ 22• Ho: µ11• = µ12• = µ13•
H1: µ12• ≠ µ 22• H1: Al menos un µ 1 j •

Para B en a2:
Ho: µ 21• = µ 22• = µ 23•
H1: Al menos un µ 2 j •

Los efectos simples del factor A son comparados con el valor de la tabla
F( 0.95 ,1,15 ) = 4.54 y los efectos simples del factor B con F( 0.95, 2,15) = 3.86 . No te que
solo el efecto simple A en b1 resulta no significativo. Las conclusiones en este experimento
serían las siguientes:

- No existe suficiente evidencia estadística para aceptar que con los dos tipos de
abono se obtengan mejores resultados diferentes en el rendimiento de maíz
cuando se aplican en l \a dosis b1(20 kg/Ha).
- Existe suficiente evidencia estadística para aceptar que con los dos tipos de
abono se obtienen resultados diferentes en el rendimiento de maíz cuando se
aplican en las dosis b2(30 kg/ha) y b3(40 kg/ha).
- Existe suficiente evidencia estadística para aceptar que con al menos una de las
dosis se obtienen resultados diferentes en el rendimiento de maíz tanto en el
abono a1 como en el a1.

3.1.7 Pruebas de comparación de Medias

3.1.7.1 Prueba de comparación de medias de efectos principales

Para comparar las medias de los niveles i y j de un factor sobre todos los niveles del otro
utilicemos las siguientes fórmulas para las desviaciones estándar:

96
Prueba Factor A Factor B
T y DLS 2CME 2CME
Sd = Sd =
br kr
Tukey 2CME 2CME
Sd = Sd =
br kr

3.1.7.2 Prueba de comparación de medias de efectos simples

Para comparar las medias de los niveles i y j de un factor sobre todos los niveles del otro
utilicemos las siguientes fórmulas para las desviaciones estándar:

Prueba Factor A en bj Factor B en ai


T y DLS 2CME 2CME
Sd = Sd =
r r
Tukey 2CME 2CME
Sd = Sd =
r r

3.1.8 Ejercicios

1) En la tabla que se presenta a continuación se representan los tiempos de


supervivencia en horas de animales asignados aleatoriamente a tres venenos (v1, v2, v3)
y tres antídotos (a1, a2, a3). El experimento fue parte de una investigación para
combatir los efectos de ciertos agentes tóxicos y el diseño que fue un DCA.

v1 v2 v3
Rep. a1 a2 a3 a1 a2 a3 a1 a2 a3
1 4.5 6.3 3.5 4.1 4.0 3.6 4.2 4.8 3.9
2 4.4 6.9 3.5 3.9 3.5 3.1 4.3 4.3 3.6
3 4.2 6.4 4.0 3.6 4.0 3.5 3.8 3.9 4.0
4 3.9 6.5 3.2 4.1 4.1 3.9 4.7 4.2 4.1

a) Presente el modelo aditivo lineal e interprete cada uno de sus componentes en


términos del enunciado.
b) Efectúe el análisis de la varianza. Analice los efectos principales o simples según
corresponda.

96
c) Efectué la prueba de Tukey para el evaluar si existen diferencias entre los venenos
cuando se aplica el antídoto a2.
d) Se cree que el antídoto a2 es más efectivo que el a1 para contrarrestar el veneno v1.
Efectúe la prueba correspondiente.

2) Se realizó un experimento para evaluar es efecto del estrógeno en la ganancia de


peso en ovejas. Las ovejas fueron bloqueadas por corral con seis tratamientos por el
bloque. Los tratamientos resultaron de las combinaciones del sexo de las ovejas (s1, s2)
y el nivel de estrógeno (d1, d2, d3). La dosis d1 fue un testigo (sin la aplicación de
estrógeno) y d3 la dosis mayor. Los resultados en libras se representan en la siguiente
tabla.

Bloque s1 (Machos) s2 (Hembras)


d1 d2 d3 d1 d2 d3
1 45 57 57 40 49 52
2 50 53 55 45 52 56
3 42 63 65 43 53 55
4 46 60 61 39 50 55

a) Presente el modelo aditivo lineal e interprete cada uno de sus componentes en


términos del enunciado.
b) Efectúe el análisis de la varianza. Analice los efectos principales o simples según
corresponda.
c) Efectué la prueba de Tukey para el evaluar si existen diferencias entre las dosis.

3) Una compañía grande de productos alimenticios realizó un experimento para


investigar el efecto de dos factores, el material de la envoltura de paquete y el color de la
envoltura, sobre las ventas de uno de sus productos. Se utilizaron dos tipos de material
(a1= Papel encerado y a2= Plástico), entres colores (b1= Amarillo, b2= Rojo y b3=
Verde). Se seleccionaron 4 supermercados para el experimento y después de estar el
producto en el mercado por una semana se registró la venta total (en miles de pesos) para
cada una de las 6 combinaciones. Los resultados se muestran a continuación:

Supermercado Papel encerado Plástico


Amarillo Rojo Verde Amarillo Rojo Verde
1 2.6 2.7 2.2 2.9 3.0 2.4
2 1.8 2.3 1.5 1.9 2.5 1.8
3 2.4 2.2 1.8 2.4 2.8 2.1
4 2.6 2.9 2.5 2.8 3.2 2.7

a) Presente el modelo aditivo lineal e interprete cada uno de sus componentes en


términos del enunciado.

97
b) Efectúe el análisis de la varianza. Analice los efectos principales o simples según
corresponda.
c) Efectué la prueba de Tukey donde sea necesario.

4) Se realizó un experimento para evaluar el efecto de tres densidades de siembra (d1,


d2, d3) con tres variedades de frijol (v1, v2, v3), el rendimiento de frijol en kg/parcela. El
diseño utilizado para el experimento DBCA.

Bloque v1 v2 v3
d1 d2 d3 d1 d2 d3 d1 d2 d3
I 10.05 9.66 9.14 10.71 10.35 11.42 9.03 10.46 13
II 8.71 8.45 9.02 9.45 10.24 12.91 8.54 10.5 10.1
III 9.9 8.05 8.01 9.25 11.1 11.5 7.24 8.85 11.57

a) Presente el modelo aditivo lineal e interprete cada uno de sus componentes en


términos del enunciado.
b) Efectúe el análisis de la varianza. Analice los efectos principales o simples según
corresponda.
c) Efectué la prueba de Tukey donde sea necesario.
d) A partir de los resultados obtenidos en las preguntas anteriores, presente sus
recomendaciones.

5) En un experimento de algodón se analizaron 3 distanciamientos entre matas y dos


dosis de nitrógeno, en 4 campos de cultivo (bloques).

A: Distancia entre matas (25, 37.5, 50 cm)


B: Abonamiento nitrogenado (50 y 100 kg de N por ha)
Y: Rendimiento por parcela (en libras).

Campo a1 a2 a3
b1 b2 b1 b2 b1 b2
1 9.56 8.26 9.18 8.90 8.26 9.82
2 9.32 8.50 8.86 8.50 8.64 9.84
3 8.96 8.42 8.22 9.82 8.10 9.7
4 8.78 8.26 8.70 9.78 8.72 10.04

a) Presente el modelo aditivo lineal e interprete cada uno de sus componentes en


términos del enunciado.
b) Efectúe el análisis de la varianza. Analice los efectos principales o simples según
corresponda.
c) Mediante la prueba DLS compare a1b2 con a3b2.

98
6) Con la finalidad de estudiar el efecto de tres niveles de Nitrógeno (a1, a2, a3) y dos
niveles de fósforo (b1, b2), en el cultivo de una variedad de papa se realizó un
experimento con un arreglo factorial conducido en el DCA con 4 repeticiones. Los
resultados obtenidos en kg/parcela son los siguientes:

Repetición a1 a2 a3
b1 b2 b1 b2 b1 b2
1 31 43 42 45 48 51
2 32 41 38 46 50 47
3 34 43 36 44 48 50
4 35 39 41 43 51 52

a) Presente el modelo aditivo lineal e interprete cada uno de sus componentes en


términos del enunciado.
b) Efectúe el análisis de la varianza. Analice los efectos principales o simples según
corresponda.
c) Efectué la prueba de Tukey donde sea necesario.

3.2 Diseños 2k
3.2.1 Diseño bifactorial sin replicas

Se puede considerar un diseño en el que se presentas dos factores y sólo se realiza


una observación por cada tratamiento.

El modelo es:

Yij = µ + α i + β j + (αβ ) ij + ε ij
i = 1, . . . , a j = 1, . . . , b

donde:

µ es el efecto medio global.


αi es el efecto incremental sobre la media causado por el nivel i del factor A.
βj el efecto incremental sobre la media causado por el nivel j del factor B.
(αβ)ij el efecto incremental sobre la media causado por la interacción del nivel i-
ésimo del factor A y el nivel j-ésimo del factor B.
εij el término de error

99
Supongamos que:

a b a b

∑α = ∑ β = ∑ (αβ ) = ∑ (αβ )
i =1
i
j =1
i
i =1
ij
j =1
ij =0

Se obtiene una tabla con esta forma:

Factores A1 … Aa
B1 Y11 … Y1a
: : … :
Bb Yb1 … Yba

En este caso, el número de parámetros a estimar es igual que en el caso del diseño
bifactorial replicado:

1 + (a − 1) + (b − 1) + (a − 1)(b − 1) = ab

y como el número de observaciones es ab, entonces no hay grados de libertad


MCE
suficientes para estimar σˆ =
2
.
ab − ab

Una posible solución es considerar que la interacción es nula

(αβ ) ij = 0
donde i= 1, … , a j=1, … ,b

Calcularemos la Suma de Cuadrados.

1 a 2 1 2 1 b 2 1 2
SC A = ∑ i• ab y ••
b i =1
y − SC B =
a
∑ y −
j =1 • j
ab
y ••

1 2
SCT = ∑i =1 ∑ j =1 y ij2 −
a b
SC E = SCT − SC A − SC B y ••
ab
Calcularemos los test F.

SC A SC B
FA = a −1 FB = b −1
SC E SC E
( a − 1)(b − 1) (a − 1)(b − 1)

100
obteniéndose la siguiente tabla ANOVA

Fuente de Suma de Grados de F


Variación Cuadrados Libertad
Factor A SC A a- 1 FA
Factor B SC B b-1 FB
Error SC E (a- 1)(b- 1)

Total SC T ab- 1

Se observa que al suponer la interacción nula, el efecto de la interacción y el error


experimental se juntan.
Otra alternativa es suponer que el efecto de la interacción es de la siguiente forma

(αβ ) ij = kα i β j

donde k es una constante desconocida que se determina mediante Regresión.

Se descompone la SC E en dos componentes:

1) Una componente para la interacción con 1 grado de libertad, de modo que la suma
de cuadrados correspondiente es:
2)
2
1 ⎡ a b y•2• ⎤
SCN = ⎢∑i=1 ∑j =1 yij yi• y• j − y•• (SCA + SCB + )⎥
a ⋅ b ⋅ SCA ⋅ SCB ⎣ ab ⎦

3) Una componente para el error


SC E = SC T − SC N

con (a − 1)(b − 1) − 1 grados de libertad.

Se determina

SC N
F0 = ∗
SC E
(a − 1)(b − 1) − 1

Si F0 > F1,( a −1)(b −1) −1,α la hipótesis nula de no interacción se rechaza.

101
3.2.2 Diseño bifactorial con replicas

Se consideran dos factores A y B con a y b niveles respectivamente. Se tienen a ⋅ b


combinaciones o posibles tratamientos y n observaciones para cada tratamiento, eso es, un
diseño balanceado.

El modelo es:

Yijk = µ + α i + β j + (αβ ) ij + ε ijk


i = 1, . . . , a j = 1, . . . , b k = 1, … , n

donde:

µ es el efecto medio global.


αi es el efecto incremental sobre la media causado por el nivel i del factor A.
βj el efecto incremental sobre la media causado por el nivel j del factor B.
(αβ)ij el efecto incremental sobre la media causado por la interacción del nivel i-
ésimo del factor A y el nivel j-ésimo del factor B.
εijk el término de error

Supongamos que:

a b a b

∑ α = ∑ β = ∑ (αβ )
i =1
i
j =1
i
i =1
ij = ∑ (αβ ) ij = 0
j =1

Se obtiene una tabla con esta forma:

Factores A1 … Aa
Y111 … Y1a1
B1 : … :
Y11k … Y1ak
: : … :
Yb11 … Ybak
Bb : … :
Yb1k … Ybak

donde k = 1, … , n.

102
Estimación de los parámetros

Se calcula:

mín φ = mín∑i=1 ∑j =1 ∑k =1 ( yijk − µ − αi − β j − (αβ )ij ) 2


a b n

µ ,αi , β j ,(αβ )ij


sujeto a

a b a b

∑α = ∑β = ∑(αβ) = ∑(αβ)
i =1
i
j =1
i
i =1
ij
j =1
ij =0

Se tiene

∂φ
= −2∑i =1 ∑ j =1 ∑k =1 ( y ijk − µ − α i − β j − (αβ ) ij ) 2 = 0 ⇒
a b n

∂µ

∑ ∑ ∑
a b n
i =1 j =1 k =1
y ijk − abnµ = 0 ⇒

1
∑ ∑ ∑ y ijk = y •••
a b n
µ̂ =
abn i =1 j =1 k =1
Para i fijado

∂φ
= −2∑ j =1 ∑ k =1 ( y ijk − µ − α i − β j − (αβ ) ij ) = 0 ⇒
b n

∂α i

∑ ∑
b n
j =1 k =1
y ijk − bnµ − bnα i = 0 ⇒

1
∑ ∑
b n
α̂ i = y ijk − y ••• ⇒
bn j =1 k =1
α̂ i = y i •• − y •••
Análogamente, para j fijado,

α̂ j = y • j • − y •••

Para (i, j) fijado, se deriva respecto de (αβ ) ij

103
∂φ
= − 2 ∑ k =1 ( y ijk − µ − α i − β j − (αβ ) ij ) = 0 ⇒
n

∂ (αβ ) ij
***
∑ [ y ijk − n y
•••
− n( y i •• − y ••• ) − n( y • j • − y ••• ) − n(αβ ) ij ] = 0 ⇒
***
(αβ ) ij = y ij • − y i•• − y • j • + y •••

Así

yˆ ijk = y ••• + ( y i •• − y ••• ) +


+ ( y • j • − y ••• ) + ( y ij • − y i•• − y • j • + y ••• ) = y ij •

esto quiere decir que:

ŷ ijk = y ij •

El número de parámetros a estimar en total es

1 + ( a − 1) + (b − 1) + ( a − 1)(b − 1)

ya que la suma de las estimaciones de las interacciones por filas es igual a 0, con lo cual
hay (b − 1) términos. Del mismo modo sucede para las columnas, y se obtienen (a − 1)
términos.
En total hay ( a − 1)(b − 1) términos.

Como el número total de observaciones es N = abn , entonces el número de grados de


libertad es:

abn − 1 − (a − 1) − (b − 1) − (a − 1)(b − 1) = abn − ab = ab(n − 1) .

De este modo, como

SCE = ∑i =1 ∑ j =1 ∑k =1 ( yijk − yˆ ijk ) 2


a b n

= ∑i =1 ∑ j =1 ∑k =1 ( y ijk − y ij • ) 2
a b n

entonces la estima de la varianza total es:

104
1
∑ ∑ ∑
a b n
σˆ 2 = ( y ijk − y ij • ) 2
ab(n − 1) i =1 j =1 k =1

Descomposición de la varianza

La técnica de análisis de la varianza se utilizará en los siguientes contrastes de hipótesis:

⎧⎪ H 0 : α 1 = .... = α a = 0 (el factor A no inf luye)



⎪⎩ H 1 : a lg ún α 1 ≠ 0 (el factor A inf luye)
⎧⎪ H 0 : β 1 = .... = β a = 0 (el factor B no inf luye)

⎪⎩ H 1 : a lg ún β 1 ≠ 0 (el factor B inf luye)
⎧⎪ H 0 : (αβ )11 = .... = (αβ ) ab = 0 (no hay int eracción )

⎪⎩ H 1 : a lg ún (αβ ) ij ≠ 0 (hay int eracción )

Para contrastar estas hipótesis, descomponemos la Suma de Cuadrados total en la


siguiente Suma de Cuadrados:

SC T = ∑i =1 ∑ j =1 ∑ k =1 ( y ijk − y ••• ) 2 =
a b n

= ∑i =1 ∑ j =1 ∑k =1 ( y ijk
a b n 2
2
) − N ⋅ y •• • =
1 2
= ∑i =1 ∑ j =1 ∑k =1 ( y ij2k ) −
a b n
y • •• =
abn
= SC A + SC B + SC AB + SC E

donde N = abn y

SC A = bn∑i =1 ( y i •• − y ••• ) 2 = bn∑i =1 ( y i •• ) − N ⋅ y ••• =


a a 2 2

1 1 2

a
= y 2
i • • − y •• •
bn i =1 abn
≡ “Suma de Cuadrados explicada debido al factor A”.

SC B = an∑ j =1 ( y • j • − y ••• ) 2 = an∑ j =1 ( y • j • ) − N ⋅ y ••• =


b b 2 2

1 1 2

b
= y 2
• j • − y •• •
an j =1 abn
≡ “Suma de Cuadrados explicada debido al factor B”.

105
SC AB = n ∑ i =1 ∑ j =1 ( y ij • − y i •• − y • j • + y ••• ) 2 =
a b

[
= n∑i =1 ∑ j =1 ( y ij • − y ••• ) − ( y i •• − y ••• ) − ( y • j • − y ••• ) =
a b
]
2

= n∑i =1 ∑ j =1 y ij • − N ⋅ y ••• −SC A − SC B =


a b 2 2

1 a 1 1 1 2
∑ ∑ ∑ ∑
b a b
= y 2
− y 2
− y 2
− y
n i =1 j =1 ij • bn i =1 i •• an j =1 • j • abn •••
≡ “Suma de Cuadrados explicada debido a la interacción”.

SC E = ∑i =1 ∑ j =1 ∑k =1 ( yijk − y ij • ) 2 = ab(n − 1)σˆ 2


a b n

≡ “Suma de Cuadrados residual”.

Calculamos las medias cuadráticas.

SC A SC B
MC A = MC B =
a −1 b −1

SC AB SC E
MC AB = MC E =
( a − 1)(b − 1) ab (n − 1)

Calculamos el test F.

MC A MC B MC AB
FA = FB = FAB =
MC E MC E MC E

La tabla de análisis de la varianza es:

Fuente de Suma de Grados de Media F


Variación Cuadrados Libertad Cuadrática
Factor A SC A a- 1 MC A FA
Factor B SC B b-1 MCB FB
Interacción SC AB (a- 1)(b- 1)
MC AB FAB
Error SC E ab(n- 1)
MCE
Total SCT abn- 1

106
Entonces:

1) Rechazamos H 0 : α 1 = .... = α a = 0 al nivel α cuando

F A > F a −1 , ab ( n −1 );α

2) Rechazamos H 0 : β1 = .... = β a = 0 al nivel α cuando


F B > F b −1 , ab ( n − 1 ); α

3) Rechazamos H 0 : (αβ )11 = .... = (αβ ) ab = 0 al nivel α cuando


F AB > F( a −1 )( b −1 ), ab ( n −1 );α

Observación: Siempre trataremos de buscar el modelo más sencillo que explique bien la
variable respuesta. Por ejemplo, si aceptamos H 0 : (αβ )11 = .... = (αβ ) ab = 0 ,
concluimos que la interacción no influye de manera apreciable en la respuesta, y
pasaríamos a considerar un modelo con dos factores sin interacción y calcularíamos de
nuevo la tabla ANOVA.

Si además, aceptamos que uno de los factores no influye en la respuesta, lo


eliminaríamos del modelo y trabajaríamos con un modelo de un factor.

Ejemplo: Se aplican pinturas tapa poros para aeronaves en superficies de aluminio, con
dos métodos; inmersión y rociado. La finalidad del tapa poros es mejorar la adhesión de
pintura, y puede aplicarse en algunas partes utilizando cualquier método. El grupo de
ingeniería de procesos responsable de esta operación está interesado en saber si existen
diferencias entre tres tapa poros diferentes e cuanto a sus propiedades de adhesión.

Para investigar el efecto que tienen el tipo de pintura tapa poros y el método de
aplicación sobre adhesión de la pintura, se realiza un diseño factorial. Para ello, se pintan
tres muestras con cada tapa poro utilizando cada método de aplicación, después se aplica
una capa fina de pintura y a continuación se mide la fuerza de adhesión. Los resultados
son los siguientes:

Tapa poros Inmersión Rociado


1 4 4.5 4.3 5.4 4.9 5.6
2 5.6 4.9 5.4 5.8 6.1 6.3
3 3.8 3.7 4 5.5 5 5

Entonces, a = 3, b = 2, n = 3, N = 18 .

107
Las medias de las observaciones son:

Tapa poros Inmersión Rociado


y i ••
1 y 11• = 4.267 y 12• = 5.3 28.7
= 4.783
6
2 y 21• = 5.3 y 22• = 6.067 34.1
= 5.683
6
3 27
y 31• = 3.833 y 32• = 5.167 = 4.5
6
y • j• 40.2 49.6 89.8
= 4.467 = 5.511 y • •• = = 4.989
9 9 18

Las sumas de los cuadrados son:

SC T = ∑i =1 ∑ j =1 ∑ k =1 ( y ijk − y ••• ) 2 =
a b n

= ∑ i =1 ∑ j =1 ∑ k =1 ( yijk
a b n 2
2
) − N ⋅ y ••• =
= 4 2 + 4.5 2 + ... + 5 2 + 5 2 − 18 × 4.989 2 = 10.72

SC A = bn ∑ i =1 ( y i •• ) − N ⋅ y ••• =
a 2 2

= 6(4.783 2 + 5.683 2 + 4.5 2 ) − 18 × 4.989 2 = 4.58

SC B = an ∑ j =1 ( y • j • ) − N ⋅ y ••• =
b 2 2

= 9(4.467 2 + 5.5112 ) − 18 × 4.989 2 = 4.91

SC AB = n ∑i =1 ∑ j =1 y ij • − N ⋅ y ••• −SC A − SC B =
a b 2 2

= 3(4.267 2 + 5.3 2 + 5.3 2 + 6.067 2 + 3.833 2 + 5.167 2 ) −


− 18 × 4.989 2 − 4.58 − 4.91 = 0.24

SC E = SCT − SC A − SC B − SC AB =
= 10.72 − 4.58 − 4.91 − 0.24 = 0.99

108
La tabla ANOVA es:

F.V. S.C. G.L. M.C. F


Tapaporo (A) 4.58 2 2.29 27.7576
Método (B) 4.91 1 4.91 59.5152
Interacción 0.24 2 0.12 1.4545
Error 0.99 12 0.0825
Total 10.72 17

F2 ,12:0.05 = 3.8853 F1,12:0.05 = 4.7472

Por tanto, no hay evidencia de la existencia de interacción entre los factores. Los efectos
del tipo de tapaporos y del método de aplicación empleado afectan a la fuerza de adhesión.
En este caso, debemos simplificar el modelo, considerado un modelo sin interacción
(juntando las sumas de cuadrados de la interacción a las del error), donde la tabla ANOVA
sería:

F.V. S.C. G.L. M.C. F


Tapaporo (A) 4.58 2 2.29 26.082
Método (B) 4.91 1 4.91 55.9225
Error 0.99+0.24=1.23 12+2=14 0.0878
Total 10.72 17

F2,14:0.05 = 3.7389 F1,14:0.05 = 4.6001

Concluimos que los efectos del tipo de tapaporos y del modelo de aplicación empleado
afectan a la fuerza de adhesión.

Ejemplo: Supongamos que un ingeniero diseña una batería para su uso en un dispositivo
que será sometido a ciertas variaciones extremas de temperatura. El único parámetro de
diseño que se puede seleccionar es el material de la cubierta de la batería, y tiene tres
alternativas. Cuando el dispositivo se manufactura y se envía al campo, el ingeniero no
tiene control sobre los extremos de temperatura a que será expuesto el dispositivo, y sabe
por experiencia que es probable que la temperatura influya en la duración efectiva de la
batería. Sin embargo, sí es posible controlar la temperatura en el laboratorio de desarrollo
de productos para los fines de ensayo.

El ingeniero decide probar los tres materiales de la cubierta a tres niveles de temperatura
(15, 70 y 125 oF) consistentes en el entorno de uso final del producto. Se prueban cuatro
baterías con cada combinación de material de cubierta y temperatura y las 36 pruebas se
ejecutan al azar. Los datos son los siguientes:

109
Material 15 oF 70 oF 125 oF
1 130 155 34 40 20 70
74 180 80 75 82 58
2 150 188 136 122 25 70
159 126 106 115 58 45
3 138 110 174 120 96 104
168 160 150 139 82 60

En este ejemplo: a= 3, b= 3, n= 4, N= 36. Las medias de las observaciones son:

Material 15 oF 70 oF 125 oF y i ••
1 134.75 57.25 57.5 83.17
2 155.75 119.75 49.5 108.33
3 144 145.75 85.5 125.083
y • j• 144.83 107.583 64.17 y ••• = 105.53

Las sumas de cuadrados son:

SCT = ∑ i =1 ∑ j =1 ∑ k =1 ( yijk − y ••• ) 2 =


a b n

= (130 − 105.53)2 + (155 − 105.53)2 +


... + (82 − 105 .53) 2 + (60 − 105 .53) 2 =
= 77646 .972

SC A = bn ∑i =1 ( y i•• ) − N ⋅ y ••• =
a 2 2

= 12(83.17 2 + 108.332 + 125.0832 ) − 36 × 105.532 =


= 10683.722

SC B = an ∑ j =1 ( y • j • ) − N ⋅ y ••• =
b 2 2

= 12(144.832 + 107.5832 + 192.52 ) − 36 × 105.532 =


= 39118.722

SC AB = n∑i =1 ∑ j =1 y ij • − N ⋅ y ••• −SC A − SC B =


a b 2 2

= 4(134.75 2 + 57.25 2 + ... + 107.5832 + 192.5 2 ) − 36 × 105.53 2 −


− 10633.167 − 39083.167 = 9613.778

SC E = SCT − SC A − SC B − SC AB = 18230.75

110
La tabla ANOVA es:

F.V. S.C. G.L. M.C. F


Tapaporo (A) 10683.722 2 5341.861 7.91
Método (B) 39118.722 2 19559.361 28.97
Interacción 9613.778 4 2403.444 3.56
Error 18230.75 27 675.213
Total 77646.972 35

F2, 27:0.05 = 3.3541 F4, 27:0.05 = 2.7278

Por tanto, existe una interacción significativa entre los factores. Los efectos del tipo de
material y de la temperatura son significativos.

Estudio de las medias individuales

Si se rechaza la igualdad entre los efectos del factor A ó B se puede considerar el tests de
recorrido studentizado (para el factor correspondiente), pero no son recomendables cuando
aparece interacción significativa. Se puede hacer fijando un nivel concreto de uno de los
factores.
Si se rechaza la igualdad entre las interacciones, se pueden contrastar las medias que
aparecen y ij • en todos los posibles tratamientos.

3.2.3 Modelo bifactorial mixto

Se puede considerar un modelo de efectos mixtos en el que uno de los factores es fijo y
el otro aleatorio:

Yijk = µ + α i + β j + (αβ ) ij + ε ijk

donde αi (para i = 1, . . . , a) corresponde al efecto fijo del factor A, de modo que



a
i =1
α i = 0 y el resto de los parámetros del modelo son variables aleatorias
independientes entre sí, tales que

β j ~ N (0, σ β )
(αβ ) ij ~ N (0, σ αβ )
ε ijk ~ N (0, σ )

para i = 1, …, a j = 1, …., b k = 1, … , n

111
Se puede demostrar que

∑ αi
a 2
⎛ SC A ⎞
⎟ = σ + nσ αβ + bn i =1
2 2
E⎜
⎝ a −1⎠ a −1
⎛ SC ⎞
E ⎜ B ⎟ = σ 2 + nσ αβ2 + anσ β2
⎝ b −1⎠
⎛ SC AB ⎞
E ⎜⎜ ⎟⎟ = σ 2 + nσ αβ2
⎝ (a − 1)(b − 1) ⎠
⎛ SC E ⎞
E ⎜⎜ ⎟⎟ = σ 2
⎝ ab(n − 1) ⎠
Así, para contrastar

H 0 : α i = 0, (i = 1,..., a) MC A
⇒ F0 =
H1 : α i ≠ 0 MC AB

H 0 : σˆ β2 = 0
MC B
⇒ F0 =
H 1 : σˆ β ≠ 0
2
MC AB

H 0 : σˆ αβ
2
=0 MC AB
⇒ F0 =
H 1 : σˆ αβ ≠ 0
2
MC E

y las estimas de efectos y los componentes de la varianza son

µ̂ = y •••
αˆ i = y i•• − y ••• (i = 1,..., a)
MCB − MC AB
σˆ β2 =
an
MC AB − MC E
σ̂ αβ
2
=
n
σˆ = MC E
2

112
3.2.4 El diseño 22

Se consideran dos factores A y B con dos niveles:

BAJO: 0

ALTO: 1

Los niveles altos de los factores se representan mediante las letras a y b respectivamente
y los niveles bajos se representan por la ausencia de dichas letras. Si ambos niveles son
bajos se considera un valor igual a (1).

(0,0) ⇒ (1)
(1,0) ⇒ a
(0,1) ⇒ b
(1,1) ⇒ ab

(1), a, b y ab son las respuestas para las n réplicas. Los efectos medios de A y B son

1
A= ( ab + a − b − (1))
2n
1
B= ( ab + a − a − (1))
2n
Estos valores se obtienen considerando que, por ejemplo, el efecto de A se obtiene como
la diferencia entre el nivel alto del factor menos el nivel bajo (en cada caso en relación a
los niveles del otro factor): El efecto de A en el nivel bajo de B es ( a − (1)) n y el efecto
de A en el nivel alto de B es ( ab − b) n .

Así, el efecto medio de A es

ab + a b + (1) 1
A= − = (ab + a − b − (1))
2n 2n 2n

El efecto de la interacción AB se define como la diferencia media entre el efecto de A al


nivel alto de B, y el efecto de A al nivel bajo de B:

1
AB = [(ab + a − b − (1))] = 1 [ab + (1) − a − b] .
2n 2n
Del mismo modo se puede definir BA, obteniéndose que AB = BA.

113
En general, se trata de medir la importancia y el efecto de los factores que intervienen,
en términos de la magnitud y del signo de los efectos anteriores.
Las sumas de cuadrados se pueden definir en términos, también, de las estimas
anteriores:

SC Factor =
n∑ c
1
a 2
[∑ a
i =1 i
c yi• ]2

.
i =1 i

Así, en este caso,

SC A =
[ab + a − b − (1)]
2

4n

SC B =
[ab + b − a − (1) ]
2

4n
SC AB =
[ab + (1) − a − b ]
2

4n

La Suma de Cuadrados total es, como habitualmente,


y •2••
SCT = ∑i =1 ∑ j =1 ∑k =1 y
2 2 n 2
ijk −
4n
y tiene ( 2 ⋅ 2 ⋅ n ) − 1 grados de libertad.

La Suma de Cuadrados del error es:

SCE = SCT − SC A − SCB − SCAB

y SCE tiene 4(n − 1) grados de libertad.

La Media Cuadrática sería:

SC E
MC E =
4(n − 1)
La F del test se calcula de la siguiente forma:
SC A SCB SC AB
FA = FB = FAB =
MC E MCE MC E
La tabla de análisis de la varianza es, entonces,

114
Fuente de Suma de Grados de Media F
Variación Cuadrados Libertad Cuadrática
Factor A SC A 1 MC A FA
Factor B SC B 1 MC B FB
Interacción SC AB 1 MC AB FAB
Error SC E 4(n- 1) MC E
Total SC T 4n- 1

Ejemplo: Se trata de estudiar la influencia de los factores:

Temperatura (1: alta ó 0: baja) y Catalizador (1: se usa ó 0: no se usa)

en la variable respuesta: dureza de un material cerámico. Los datos son:

Combinación Replicación Respuesta Codificación


1 2 Total
(0, 0) 86 92 178 (1)
(0, 1) 47 39 86 a
(1, 0) 104 114 218 b
(1, 1) 141 153 294 ab

y••• = 776
Los efectos medios y las medias de cuadrados son:

294 + 86 − 218 − 178 294 + 218 − 86 − 178


A= = −4 B= = 62
4 4
294 + 178 − 86 − 218 (4A) 2
AB = = 42 SC A = = 32
4 4× 2

(4 B ) 2 (4 AB) 2
SC B = = 7688 SC AB = = 3528
4× 2 4× 2

776 2
SCT = (86 + .... + 153 ) −
2 2
= 11420 SC E = 172
8

115
La tabla de análisis de la varianza es:

Fuente de Suma de Grados de Media F


Variación Cuadrados Libertad Cuadrática
Factor A 32 1 32 0.74
Factor B 7688 1 7688 178.79
Interacción 3528 1 3528 82.05
Error 172 4 43
Total 11420 7

De modo que el Factor B y la interacción entre A y B son significativos al nivel 0.05, ya


que F1, 4; 0.05 = 7.71 .

3.2.5 El diseño 23

Se introduce un breve resumen de este modelo. Supongamos que se tienen tres factores
binarios A, B y C. El número de posibles combinaciones es 8, y con n replicaciones se
tiene un total de 8n observaciones.

Para calcular los efectos se puede usar la siguiente tabla o matriz de diseño:

Efecto Combinación de Factores


Factorial (1) a b ab c ac bc abc
I + + + + + + + +
A - + - + - + - +
B - - + + - - + +
AB + - - + + - - +
C - - - - + + + +
AC + - + - - + - +
BC + + - - - - + +
ABC - + + - + - - +

La primera fila es la identidad y cualquier fila multiplicada por ella permanece


invariante. El resto de filas tiene el mismo número de signos + y signos −. Se pueden
obtener los contrastes y los efectos sustituyendo los signos + por 1 y los − por −1, como se
ve a continuación.

Por otro lado se pueden obtener las distintas filas a partir del producto entre ellas, por
ejemplo:
A ⋅ B = AB

116
( AB) ⋅ ( B) = A ⋅ B 2 = A

( AC ) ⋅ ( BC ) = A ⋅ C 2 ⋅ B = AB

Estimación de los efectos:

Los efectos medios se calculan a partir de los contrastes indicados en la tabla anterior
partidos entre 4n:

1
A= [a − (1) + ab − b + ac − c + abc − bc]
4n
1
B= [b + ab + bc + abc − (1) − a − c − ac]
4n
1
C= [c + ac + bc + abc − (1) − a − b − ab]
4n

1
AB = [(1) + ab + c + abc − a − b − ac − bc]
4n
1
AC = [(1) + b + ac + abc − a − ab − c − bc]
4n
1
BC = [(1) + a + bc + abc − b − ab − c − ac]
4n
1
ABC = [abc + a + b + c − ab − ac − bc − (1)]
4n

Las sumas de los cuadrados son, en cada caso, de manera semejante al diseño 22,

Contraste 2
SC Efec =
8n
Ejemplo: Supongamos la siguiente tabla con n= 2 réplicas

Factor B
0 1
Factor A Factor C Factor C
0 1 0 1
0 4 7 20 10
5 9 14 6
1 4 2 4 14
11 7 6 16

117
Se tiene que:

(1)= 9 c= 16 b= 34 bc= 16
a= 15 ac= 9 ab= 10 abc= 30

1
A= [15 − 9 + 10 − 34 + 9 − 16 + 30 − 16] = − 11 = −1.375
8 8
1 41
B = [34 + 10 + 16 + 30 − (9 + 15 + 16 + 9)] = = 5.125
8 8
1 3
C = [16 + 9 + 16 + 30 − (9 + 15 + 34 + 10)] = = 0.375
8 8
1 9
AB = [9 + 10 + 16 + 30 − (15 + 34 + 9 + 16)] = − = −1.125
8 8
1 25
AC = [9 + 34 + 9 + 30 − (15 + 10 + 16 + 16)] = − = 3.125
8 8
1 1
BC = [9 + 15 + 16 + 30 − (34 + 10 + 16 + 9)] = = 0.125
8 8
1 51
ABC = [30 + 15 + 34 + 16 − (10 + 9 + 16 + 9)] = = 6.375
8 8

Como, en cada caso,

Contraste 2
SC Efec =
8n
se tiene que:

1 2 1 2
SC A = 11 = 7.56 SC B = 41 = 105.06
16 16
1 2 1
SC C = 3 = 0.56 SC AB = 9 2 = 5.06
16 16
1 2 1 2
SC AC = 25 = 39.06 SC BC = 1 = 0.06
16 16
1 2
SC ABC = 51 = 162.56
16
y
1
SCT = (4 2 + 5 2 + .... + 14 2 + 16 2 ) − 139 2 = 389.44
16
SC E = 69.52

118
La tabla de análisis de la varianza es

Fuente de Suma de Grados de Media F


Variación Cuadrados Libertad Cuadrática
Factor A 7.56 1 7.56 0.87
Factor B 105.06 1 105.06 12.09
Interacción 5.06 1 5.06 0.58
AB
Factor C 0.56 1 0.56 0.06
Interacción 39.06 1 39.06 4.49
AC
Interacción 0.06 1 0.06 0.01
BC
Interacción 162.56 1 162.56 18.71*
ABC
Error 69.52 8 8.62
Total 39.06 15

Como el valor de la F de Snedecor F1,8; 0.05 = 5 .32 , entonces los valores marcados con
(*) son significativos a nivel 0.05.

3.2.6 Supuestos del Modelo Estadístico

Se supone que:

a) los factores son fijos


b) los diseños son completamente aleatorios
c) se satisface la suposición usual de normalidad

El diseño 2k es particularmente útil en las primeras fases del trabajo experimental,


cuando es probable que haya muchos factores por investigar.
Conlleva el menor número de corridas con las cuales pueden estudiarse k factores en un
diseño factorial completo. Debido a que sólo hay dos niveles para cada factor, debe
suponerse que la respuesta es aproximadamente lineal en el intervalo de los niveles
elegidos de los factores.

119
3.2.7 Representación de los factores y niveles

Factor Niveles
1
A :
k
1
B :
k

3.2.8 Ejercicios

1) Un ingeniero está interesado en el efecto de la velocidad de corte (A),la dureza del


metal (B) y el ángulo de corte (C) sobre la duración de una herramienta de corte. Para
ello se eligen dos niveles para cada factor y se corren dos réplicas del diseño factorial
23. La tabla siguiente presenta los datos de tiempo de duración (en horas) de la
herramienta.

Combinación Réplica
de I II
tratamientos
(1) 221 311
a 325 435
b 354 348
ab 552 472
c 440 453
ac 406 377
bc 605 500
abc 392 419

a) Calcule los efectos correspondientes a cada uno de los factores.


b) Determine cuáles de estos efectos son importantes usando la tabla de análisis
de varianza. Reporte las conclusiones obtenidas.

2) Usted está recién graduado y acaba de entrar a trabajar en la empresa MPAR, la


cual elabora galletas. La compañía ha presentado algunos problemas económicos
en los últimos tiempos, así que su misión es tratar de incrementar la calidad y la
productividad. Se le pide estudiar la influencia de tres variables sobre la textura de
la galleta:

120
A = tiempo en el horno.
B = porciento de leche.
C = tipo de harina (nacional o importada)

Para ello usted debe:

a) Escribir la matriz de diseño para un experimento 23 (completo).


b) A partir de esa matriz de diseño se tomaron las siguientes medidas:

Nivel Textura
(1) 10.0
a 13.0
b 8.0
ab 15.1
c 11.0
ac 12.9
bc 8.1
abc 15.0

Determine cuáles de los factores son influyentes sobre la textura de la galleta


realizando gráficos cuantil-cuantil. Justifique y explique. ¿Qué conclusiones saca de
allí?

3) En los datos anteriores el factor C no es significativo. ¿Cómo podría


reinterpretarse el diseño anterior en función de un diseño 22, donde sólo estuviesen
involucrados los factores A y B? Generalice esta conclusión a diseños 2k
generales con m factores no significativos.

121
Capítulo 4 Diseño de Parcelas Divididas y jerárquicos.
♦ Diseño de Parcelas Divididas.
♦ Diseños jerárquicos.

4.1 Diseño de Parcelas Divididas

Los diseños de parcelas divididas se usan generalmente para experimentos factoriales e


incorporan en su estructura a los diseños completamente al azar, bloques al azar o
cuadrados latinos.
Su principio radica en que las unidades experimentales o parcelas son subdivididas en
subdivididas en las que los niveles de uno o más factores se les aplican. Es decir existen
unidades y subunidades.

Hemos visto antes que los tratamientos generados aleatoriamente, dependiendo del
diseño utilizado, a las unidades experimentales; esto es, los niveles de ambos factores eran
aleatorizados simultáneamente. Sin embargo, existen casos en los que esta aleatorización
es poco práctica y en los que resulta recomendable aleatorizar primero los niveles de un
factor y luego los niveles del otro. El procedimiento consiste entonces en asignar los
niveles de un factor a las unidades experimentales completas, también llamadas parcelas, y
luego, cada unidad experimental dividirla en subunidades, llamadas subparcelas, a las
cuales se les aplicarán los niveles del otro factor.

Por ejemplo, consideremos un experimento en que se prueba el factor A con 4 niveles en


tus bloques de un diseño de bloques al azar. Un segundo factor, el factor B con 2 niveles
puede introducirse, dividiendo cada unidad de A en dos subunidades y asignando
aleatoriamente los niveles de B en las unidades.
Por ejemplo:

Factor α1 α α α
A 2 3 4

Factor β β2
B 1

Bloques

α4 β2 α1 β2 α2 β1 α3 β2
Bloque
α 4b1 α 1b1 α 2b2 α3 β1
1

122
α2 β1 α1 β2 α4 β1 α3 β1
Bloque α2 β2 α1 β1 α4 β2 α3 β2
2

α1 β1 α2 β2 α4 β2 α3 β1
Bloque α1 β2 α2 β1 α4 β1 α3 β2
3

Esquema de datos.

Factor Factor Réplicas


A B (Bloques)
β1 Y111 … …….Y11q
α1 : : :
βr Y1r1 … …….Y1rq
: : :
β1 Yp11 … …….Yp1q
αp : : :
βr Ypr1 … …….Yprq

Tabla auxiliar

1 2 …. q Yi··
Y1·1 Y1·2 …. Y1·q Y1··
Factor A : : …. : :
Yp·1 Yp·2 …. Yp·q Yp··
Y··k Y··1 Y··2 …. Y··q

A\B β1 β2 …. βr
α1 Y11· Y12· …. Y1r·
: : : …. :
αp Yp1· Yp2· …. Ypr·
Y·j· Y·1· Y·2· …. Y·q·

Debe notarse que la aleatorización se realiza en dos etapas. Primero aleatorizamos los
niveles del factor A sobre las unidades completas, después se aleatorizan los niveles del
factor B sobre las subunidades, dos por cada unidad completa. Cada unidad completa
(parcela) puede ser considerada como un bloque en cuanto al factor B, pero es solamente
un bloque incompleto cuando tomamos en cuenta las combinaciones de tratamientos. Por
este motivo los diseños de parcelas divididas pueden denominarse diseños de bloques
incompletos. En resumen la aleatorización del tratamiento principal se realiza sobre los

123
bloques, mientras que la aleatorización de los subtratamientos se realiza en cada parcela o
unidad constituyendo, por lo tanto las subunidades.

Trataremos el caso del diseño de parcelas divididas con dos factores, un factor en las
unidades completas y un factor en las subunidades, utilizando los diseños completamente
al azar y de bloques completamente al azar para la asignación de los niveles del factor que
va en las unidades completas. Sin embargo, es posible utilizar el diseño de parcelas
divididas con más de un factor, tanto en las unidades completas como en las subunidades.
Aunque este diseño fue desarrollado en agricultura (y de ahí su nombre), puede aplicarse
en muchas otras disciplinas.

Usos.

El diseño de parcelas divididas se usa en las siguientes situaciones:

1) Cuando los tratamientos asociados con los niveles de uno o más de los factores
requieren mayores cantidades de material experimental en una unidad
experimental, que los tratamientos para otros factores. Esta característica es común
en experimentos de campo, de laboratorio, industriales y sociales.
2) Cuando un factor adicional va a ser añadido para incrementar la amplitud del
experimento.
3) A partir de informaciones previas, puede saberse que las mayores diferencias
pueden esperarse entre los niveles de determinados factores en comparación con
los niveles de otros. En este caso, las combinaciones de tratamientos para los
factores donde se esperan grandes diferencias pueden ser asignadas al azar en las
unidades completas, a manera de conveniencia.
4) Este diseño se usa cuando se desea una mayor precisión para las comparaciones
entre determinados factores que para otros. Esto es esencialmente lo mismo que la
situación anterior, pero las razones pueden ser diferentes.

En resumen, puesto que en los experimentos de parcelas divididas, la variación entre


subunidades se espera que sea menor que entre las unidades completas, los factores que
requieren menor cantidad de material experimental o los que son de mayor importancia, o
aquellos en los que se espera que exhiban las menores diferencias y se requiere una mayor
precisión se asignan a las subunidades.

(Sigarroa, A. 1985)

4.1.1 Modelo Aditivo Lineal

Dado que en este diseño la aleatorización se realiza en dos etapas, el modelo aditivo
lineal tendrá dos fuentes de error, una desde las unidades completas y otra desde las
subunidades.
Yijk = µ + α i + γ ij + β k + (αβ ) ik + ε ijk

124
donde:

Yijk es el valor o rendimiento observado con el i-ésimo nivel del factor A, j-ésima
repetición, y k-ésimo nivel del factor B.
µ es el efecto de la media general.
αi es el efecto del i-ésimo nivel del factor A.
γij es el efecto del error experimental en parcelas (Error (α))
βk es el efecto del k-ésimo nivel del factor B.
εijk es el efecto del error experimental en subparcelas (Error (b))
i= 1,…, p (p= número de niveles del factor A)
j= 1,…, r (r= número de repeticiones para los niveles del factor A)
k= 1,…, q (q= número de niveles del factor B)

En el caso que el diseño sea un DBCA, el modelo será:

Yijk = µ + α i + ρ j + γ ij + β k + (αβ )ik + ε ijk


En este caso:

ρj es el efecto del j-ésimo bloque.


j= 1,…, r (r= número de bloques)

Se asume que tanto γij como εijk están normal e independientemente distribuidos con
medias cero y variancias σ γ2 σ ε2 respectivamente.

Ejemplo (Parcela Dividida en DBCA):

Un experimento diseñado para evaluar tres variedades de cebada y cuatro niveles de


abobamiento con nitrógeno (0, 0.01, 0.02 y 0.04 toneladas por parcela) fue conducido en 4
bloques de tres parcelas cada uno. Cada parcela fue dividida en 4 subparcelas. Cada
variedad fue sembrada en una parcela mientras que los cuatro niveles de abonamiento
fueron utilizados en las subparcelas. Los resultados del experimento (en kilogramos por
subparcela) se presentan en la siguiente tabla:

Bloque Variedad b1 b2 b3 b4
I a1(572) 111 130 157 174
(1624) a2(533) 117 114 161 141
a3(519) 105 140 18 156
II a1(349) 61 91 97 100
(1287) a2(453) 70 108 126 149
a3(485) 96 124 121 144

125
Bloque Variedad b1 b2 b3 b4
III a1(366) 74 89 81 122
(1178) a2(432) 64 103 132 133
a3(380) 70 89 104 117
IV a1(368) 62 90 100 116
(1091) a2(382) 80 82 94 126
a3(341) 63 70 109 99

El modelo aditivo lineal para este ejemplo será:

Yijk = µ + α i + ρ j + γ ij + β k + (αβ )ik + ε ijk

donde:

Yijk es el rendimiento observado con la i-ésima variedad, j-ésimo bloque y k-ésimo


nivel de abonamiento.
µ es el efecto de la media general.
αi es el efecto del i-ésima variedad.
ρj es el efecto del j-ésimo bloque.
γij es el efecto del error experimental en parcelas (Error (α))
βk es el efecto del k-ésimo nivel de abonamiento.
(αβ)ik es el efecto de la interacción en la i-ésima variedad y el k-ésimo nivel de
abonamiento.
εijk es el efecto del error experimental en subparcelas (Error (b))

4.1.2 Análisis de Varianza

Las sumas de los cuadrados para un diseño de parcelas divididas en DBCA son
calculadas por:

p
Y•2••
r q
SC (Total parcelas ) = ∑∑∑ Y − 2
ijk
i =1 j =1 k =1 prq
Y•2••
done es el factor de corrección (Fc).
prq

p r Yij2•
SC (Total parcelas) = ∑∑ − Fc
i =1 j =1 q

126
r Y•2j •
SC ( Bloques) = ∑ − Fc
j =1 pq
p q
Yi•2k
SC (Comb. AB) = SC ( A) + SC ( B) + SC ( AB) = ∑∑ − Fc
i =1 k =1 r
p 2
Y Y•2• k
q
SC ( A) = ∑ i ••
− Fc SC ( B) = ∑ − Fc
i =1 rq j =1 pr
SC ( AB ) = SC (Comb . AB ) − SC ( A) − SC ( B )
SC ( Error (b)) = SC (Total subunidade s ) − SC (Total unidades ) − SC ( B ) − SC ( AB )
El cuadro de Análisis de Varianza se presenta a continuación. Generalmente el cuadrado
medio del error para las unidades completas, designado por Ea, es mayor que el cuadrado
medio del error para las subunidades, designado por Eb, ya que las observaciones en las
subunidades tienden a tener resultados más homogéneos dentro de la misma unidad que
entre unidades diferentes.

Cuadro ANOVA

Fuentes de Grados de Sumas de Cuadrados F


Variación Libertad (gl) Cuadrados (SC) Medios (CM)
SC ( Bloques )
Bloques r-1 SC (Bloques) gl ( Bloques )
SC ( A) CM ( A)
A p-1 SC ( A) Ea
gl ( A)
SC ( Error (a ))
Error (a) (r-1)(p-1) SC ( Error (a )) gl ( Error (a ))
Total pr-1 SC(Total Unid.)
Unidades
SC ( B) CM ( B )
B q-1 SC ( B) Eb
gl ( B)
SC ( AB) CM ( AB)
AB (p-1)(q-1) SC ( AB ) Eb
gl ( AB)
SC ( Error (b))
Error(b) p(q-1)(r-1) SC ( Error (b)) gl ( Error (b))

Total
Subunidades pqr-1 SC (Total Subunid .)

127
Hipótesis:
Para el Modelo I (Efectos fijos) las hipótesis son, en términos de los efectos de los
niveles de los factores las siguientes:

Para el efecto principal de A: H0: αi= 0 ∀ i


H1: αi≠ 0 para al menos algún i

Para el efecto principal de B: H0: βi= 0 ∀ k


H1: βi≠ 0 para al menos algún k

Para el efecto de la interacción AB: H0: (αβ)ik= 0 ∀ i, k


H1: (αβ)ik≠ 0 para al menos algún i, k

Estadístico de Prueba:

CM ( A)
Para el efecto principal de A: F= ~ F(gl(A), gl(Error(a))
Ea
CM ( B )
Para el efecto principal de B: F= ~ F(gl(B), gl(Error(b))
Eb
CM ( AB )
Para el efecto principal de AB: F= ~ F(gl(AB), gl(Error(b))
Eb

Regla de Decisión:

Las hipótesis nulas se rechazan con un nivel de significación α si el F resulta mayor que
el valor de tabla F(1- α) con los grados de libertad correspondientes a cada caso.

Al igual que en el análisis de un experimento factorial, se debe primero evaluar la


hipótesis correspondiente a la interacción. De no existir interacción, se procedería a
evaluar los efectos principales de los factores, en caso contrario, sería necesario evaluar
los efectos simples.

Ejemplo (Cont.): A continuación se presenta el análisis de varianza y la prueba de


hipótesis correspondientes para el ejemplo tratado en esta sección:

5180 2
SC (Total subunidades) = (1112 + 130 2 + ...... + 99 2 ) − = 38303.7
(3)(4)(4)
572 2 + 533 2 + ...... + 3412 5180 2
SC (Total unidades ) = ( )− = 17361.2
4 (3)(4)(4)
1624 2 + 1287 2 + 1178 2 + 10912 5180 2
SC ( Bloques ) = − = 13634.2
12 (3)(4)(4)

128
308 2 + 400 2 + ...... + 516 2 5180 2
SC (Comb. AB) = − = 17756.2
4 (3)(4)(4)
16552 + 18002 + 17252 5180 2
SC ( A) = − = 657.3
16 (3)(4)(4)
973 2 + 1230 2 + 1400 2 + 1577 2 5180 2
SC ( B ) = − = 16538.2
12 (3)(4)( 4)
SC ( AB) = 17756.2 − 657.3 − 16538.2 = 560.7
SC ( Error ( a )) = 17361 .2 − 657 .3 − 13634 .2 = 3069 .7
SC ( Error (b)) = 38303.7 − 17361.2 − 16538.2 − 560.7 = 3843.6

Cuadro ANOVA

Fuentes de Grados Sumas de Cuadrados F


Variación de Cuadrados Medios (CM)
Liberta (SC)
d (gl)
Bloques 3 13634.2 4544.7
A 2 657.3 328.6 0.6423
Error (a) 6 3069.7 511.6
Total 11 17361.2
Unidades
B 3 16538.2 5512.7 38.66

AB 6 560.7 93.5 0.6557

Error(b) 27 3843.6 142.6

Total 47 38303.7
Subunidades

Hipótesis:
Para el Modelo I (Efectos fijos) las hipótesis son, en términos de los efectos de los
niveles de los factores las siguientes:

Para el efecto principal de A: H0: αi= 0 ∀ i


H1: αi≠ 0 para al menos algún i

Para el efecto principal de B: H0: βi= 0 ∀ k


H1: βi≠ 0 para al menos algún k

129
Para el efecto de la interacción AB: H0: (αβ)ik= 0 ∀ i, k
H1: (αβ)ik≠ 0 para al menos algún i, k

Para la interacción el estadístico de prueba es F = 0.6557 y el valor de la tabla, con un


nivel de significación del 5% es de F( 0.95, 6, 27 ) = 2.46 . Dado que el estadístico de prueba
resulta menor que el valor de la tabla se acepta H0 y se concluye que no existe suficiente
evidencia estadística para aceptar que exista interacción entre la variedad de cebada y el
nivel de abonamiento. Al aceptar que no existe interacción entre los dos factores se
procede a evaluar los efectos principales. Para el factor A (variedad), el F = 0.6423 es
menor que el valor de la tabla F( 0.95, 2, 6 ) = 5.14 ; para el factor B (nivel de abonamiento),

el F = 38.66 es mayor que el valor de la tabla F( 0.95,3, 27 ) = 2.96 . Luego, se concluye


que:

− No existe suficiente evidencia estadística con un nivel de significación del 5% para


aceptar que con al menos una de las variedades de cebada se obtengan rendimientos
diferentes.
− Existe suficiente evidencia estadística con un nivel de significación del 5% para
aceptar que con al menos uno de los niveles de abonamiento se obtiene un
rendimiento diferente.

En este diseño, se debe calcular un coeficiente de variación para parcelas y otros para
subparcelas:

Ea q Ea
cv( parcelas ) = cv( subparcelas) =
Y ••• Y •••

Con los datos del ejemplo se tiene:

142.6 142.6
cv( parcelas ) = = 10.48% cv( subparcela s ) = = 11.07%
107.9 107.9

4.1.3 Pruebas de comparación de medias

Para comparar las medias de los niveles i y j de factor sobre todos los niveles del otro
(efectos principales) se deben utilizar las siguientes fórmulas para las desviaciones
estándar:

130
Prueba Factor A Factor B
(Parcelas) (Subparcelas)
2Ea 2 Eb
t y DLS Sd = Sd =
qr pr
2Ea 2 Eb
Tukey Sd = Sd =
qr pr

4.1.4 Pruebas de comparación de medias de efectos simples

Para compara las medias de los niveles k y l de un factor en un nivel del otro utilice las
siguientes fórmulas para las desviaciones estándar:

Prueba Factor A en bi Factor B en ai


2[(q − 1) E b + E a ] 2Eb
t y DLS Sd = Sd =
qr r
Eb
Tukey Sd =
r

Al compara dos medias del factor A en un nivel del factor B, se están comparando tanto
parcelas como subparcelas, por lo que es necesario utilizar un promedio ponderado de Ea y
Eb para el cálculo de la desviación estándar como se puede ver en el cuadro presentado
arriba. Las ponderaciones son (q-1) y l para Eb y Ea respectivamente, las cuales suman q,
cantidad que aparece en el divisor. Para estas comparaciones, el valor t calculado no sigue
una distribución t de Student, y por lo tanto se deberá utilizar la siguiente aproximación
para el valor tabular:

(q − 1) E b t b + E a t a
t' =
(q − 1) E b + E a

donde los valores ta y tb son los valores de la tabla t Student con los grados de libertad
de Ea y Eb respectivamente.

131
4.1.5 Ejercicios

1) La siguiente información corresponde a un experimento en tabaco realizado con un


diseño de parcelas divididas en DBCA con 3 bloques, donde los factores están dados
por:

A (en unidades). Tipo riego con 3 niveles (a1, a2 y a3).


B (en subunidades): Tipo de fertilizante con 2 niveles (b1 y b2).
Los resultados del experimento, en Kg. por parcela, se dan a continuación:

Riego b1 b2 Riego b1 b2

Bloque I Bloque II
a1 159 301 a1 207 209
a2 220 409 a2 109 186
a3 303 144 a3 281 153

Riego b1 b2
a1 333 419
Bloque a2 198 254
III
a3 253 228

a) Presente el modelo aditivo lineal e interprete sus componentes en términos


del problema.
b) Realice el ANOVA y presente los coeficientes de variabilidad.
c) Utilice la prueba t para comprar las medias de los niveles del factor
fertilizante en cada uno de los sistemas de riego.

2) Considere un experimento para comparar el efecto de tres diferentes planes de


manejo en el campo para ser cultivado con cuatro diferentes variedades de trigo. Seis
parcelas fueron aleatoriamente asignadas a los planes de manejo (Facto A).
Entonces, cada parcela es dividida en cuatro subparcelas y las cuatro variedades
(Factor B) son aleatoriamente asignadas a ellas (en forma independiente dentro de
cada parcela). A continuación se presentan los resultados obtenidos en
Kg./subparcela.

Plan de Parcela Variedad


Manejo I II III IV
Sin labrar 1 178 154 119 145
2 164 154 107 139
Sin cultivar 1 141 130 81 116
en verano 2 129 112 73 98
Cultivado en 1 151 144 113 132
verano 2 197 176 137 150

132
a) Presente el modelo aditivo lineal e interprete sus componentes en términos
del problema.
b) Realice el ANOVA y presente los coeficientes de variación.
c) Realice la prueba de Tukey para comparar las distintas variedades.

3) Se estudió el comportamiento de 4 épocas de aplicación (A) en parcelas y 3 dosis de


Nitrógeno (B) en subparcelas. El experimento se llevó a cabo en un DBCA con 3
repeticiones, 12 parcelas y 36 subparcelas. Los resultados del experimento en
TM/Ha de arroz se presentan a continuación:

Dosis d Nitrógeno (Subparcelas): 0 Kg/Ha (b1), 50 Kg/Ha (b2), 100 Kg/Ha (b3)

Toda la siembra (a1) Macollo y Floración (a3)


Bloques Bloques
I II III Total I II III Total
b1 6.1 8.1 7.8 22.0 b1 5.1 7.8 5.9 18.8
b2 3.8 7.2 6.0 17.0 b2 5.8 7.1 7.7 20.6
b3 4.0 3.1 4.6 11.7 b3 4.1 5.0 4.5 13.6
Total 13.9 18.4 18.4 50.7 Total 15.0 19.9 18.1 53.0

Toda la siembra (a2) Siembra Macollo y Floración (a4)


Bloques Bloques
I II III Total I II III Total
b1 6.1 6.8 6.0 18.9 b1 4.8 6.2 5.2 16.2
b2 4.2 6.2 4.4 14.8 b2 5.4 6.1 6.8 18.3
b3 4.1 5.2 4.5 13.8 b3 4.6 5.74 5.5 15.5
Total 14.4 18.2 14.9 47.5 Total 14.8 17.7 17.5 50

a) Presente el modelo aditivo lineal e interprete sus componentes en términos


del problema.
b) Realice el ANOVA y presente los coeficientes de variación.
c) Realice la prueba de Tukey para B(a1).

4) Un fabricante de papel está interesado en el efecto de tres diferentes métodos para la


preparación de la pulpa y cuatro temperaturas de cocción de la pulpa en la
resistencia a la tensión del papel resultante. El equipo que es usado en el método de
la preparación de la pulpa trabaja con grandes cantidades de pulpa. El equipo que es
usado para la cocción de la pulpa puede trabajar con pequeñas cantidades. En un

133
día, un lote de pulpa es producido por uno de los tres métodos bajo estudio. El
método es aleatorizado entre los 9 días disponibles para el experimento. En cada
día, el lote es dividido en cuatro sub-lotes y cada sub-lotes es cocido en cada una de
las cuatro temperaturas en (0F). Los resultados obtenidos para la resistencia a la
tensión del papel son los siguientes:

Método 1 2 3 1 2 3 1 2 3
Día 5 1 8 7 6 3 9 4 2
Temperatura
200 30 34 29 28 31 31 31 35 32
225 35 41 31 32 36 35 37 40 39
250 32 38 33 35 42 32 36 39 39
275 36 42 31 41 40 35 40 44 40

a) Presente el modelo aditivo lineal e interprete sus componentes en términos


del problema.
b) Realice el ANOVA y presente los coeficientes de variación.
c) Realice la prueba de Tukey para comparar las distintas temperaturas.

4.2 Diseños Jerárquicos

Hemos visto como en los diseños factoriales que cada uno de los niveles de un factor
presenta correspondencia con los niveles de otros factores. Sin embargo, en ciertas
investigaciones se toman los datos de una forma diferente como en zoología. En estas
investigaciones los diferentes niveles del factor B pueden ser muy diferentes dentro de
cada nivel del factor A.
Tomando muestras en diferentes grupos y de diferente proceder, el factor A puede ser
especies y el factor B proceder, estas no están relacionadas factorialmente y no pueden ser
tratadas como se hace en los experimentos factoriales.
En cierto sentido, el caso de 1 factor, que ya hemos discutido es un caso especial de
estos diseños jerárquicos o anidados, ya que las mismas muestras no son medidas en cada
nivel del factor. El factor y las muestras no están relacionadas factorialmente, sino
jerárquicamente.
El modelo jerárquico puede extenderse a cualquier número de factores sin grandes
complicaciones en el análisis.
(Sigarroa, A. 1985)

134
4.2.1 Representación de los datos

Factor Especies Localidades Subestaciones Fechas Especimenes


i
a ii
1 iii
A b
c
N 2
3
I I 4
B 5
V
6
7
E
C 8
L 9
D
II E
F
G
III H
I

Los factores pueden describirse como:

1) Especies.
2) Localidades dentro de especies.
3) Subestaciones dentro de localidades.
4) Días dentro de subestaciones.
5) Especimenes dentro de días.

Ahora bien, cuales 2 factores adyacentes pueden formar un modelo lineal de un solo
factor con réplicas. Tomando solamente especimenes dentro de días y días dentro de
subestaciones, los especimenes constituyen observaciones repetidas en cada nivel del
factor día. Moviéndonos hacia arriba en la jerarquía: días dentro de subestaciones son
observaciones repetidas en cada nivel del factor subestaciones. Este proceso puede
repetirse hasta que se alcance el tope de la jerarquía, donde el último análisis de 1 factor
es el de localidades dentro de especies, como observaciones repetidas en cada nivel del
factor especie. Hay 4 comparaciones de factores simples, cada una de ellas contenida
dentro de la inmediata superior, en el modelo jerárquico y todas ellas pueden combinarse
en análisis simples.
Los análisis de estos diseños se denominan análisis de varianza anidado, debido a la
clasificación subordinada entre los factores. El diseño también se denomina análisis de
varianza jerárquico. (Sigarroa, A. 1985)

135
4.2.2 Modelos de ANOVA

El nivel subordinado en un ANOVA jerárquico, es siempre un Modelo II. El nivel más


alto de clasificación puede ser Modelo I ó Modelo II. Si es un Modelo II, podemos hablar
entonces de un Modelo II puro. Si el nivel superior es Modelo I, tendremos entonces un
Modelo Mixto.
Hay 2 clases de aplicaciones generales del ANOVA jerárquico. La primera de ellas no
puede servir para asegurar la magnitud del error en los distintos estadios de un
experimento o proceso. (Sigarroa, A. 1985)

4.2.3 Modelo Aditivo Lineal

Para un ANOVA jerárquico con 2 niveles (Modelo II) el modelo aditivo lineal será:

Yijk = µ + Ai + Bij + ε ijk


donde:
Yijk : es el valor de la k-ésima observación dentro del j-ésimo subgrupo del i-ésimo
grupo.
µ : efecto de la media general.
Ai : es la contribución aleatoria del efecto del i-ésimo grupo.
Bij : es la contribución aleatoria del j-ésimo subgrupo dentro del i-ésimo grupo.
ε ijk : efecto de la k-ésima observación dentro del j-ésimo subgrupo del i-ésimo grupo.

De igual forma, debemos asumir que Ai , Bij y ε ijk están normalmente distribuidos con
media cero y componentes de varianza; σ A2 , σ B2∈A y σ ε2 respectivamente. Usamos el
símbolo σ B2∈A , en lugar de σ B2 para denotar que la σ 2 es del nivel B dentro del nivel A.

Cuando el Modelo es Mixto, (es decir, el nivel superior tiene un efecto fijo de
tratamientos) descomponemos la observación como:

Yijk = µ + α i + Bij + ε ijk

Siendo esta expresión igual a la anterior, con la diferencia de que denotamos por α i un
efecto fijo a diferencia de Ai en el modelo anterior que representaba un efecto aleatorio.
(Sigarroa, A. 1985)

136
4.2.4 Calculo de la ANOVA

Definiciones:

a: número de muestras del factor A.


b: número de muestras del factor B.
c: número de elementos en cada muestra.
Y : media de todos los elementos del factor A.
Y i : media del i-ésimo elemento del factor A
Y ij : media de la j-ésima muestra en el i-ésimo elemento del factor A.
Presentamos las fórmulas con que calculamos la Suma de Cuadrados y Cuadrados
Medios.

SC ( grupos) = bc∑ ( y i − y ) 2 SC ( sub.g .) = c ∑ ∑ ( y ij − y i ) 2


i i j

SC ( D ) = ∑∑∑ (Yijk − Y ij ) 2 SC (Total ) = ∑∑∑ (Yijk − Y ) 2


i j k i j k

CM ( grupos) = σ D2 + cσ B2∈A + bcσ A2 CM ( sub. g .) = σ D2 + cσ B2∈A


CM ( D ) = σ D2

La tabla de análisis de varianza (Cuadro ANOVA) es el siguiente:

Fuentes Suma de Grados de Cuadrados F


de Cuadrados Libertad Medios
Variación (SC) (gl) (CM)

Entre CM ( grupos )
grupos SC ( grupos ) a-1 CM ( grupos ) CM ( sub.g .)
Entre
subgrupo SC ( sub.g .) a(b-1) CM ( sub. g .) CM ( sub.g.)
dentro de CM ( D)
grupos
Dentro de
subgrupos SC ( D ) ab(c-1) CM ( D )
(D)
Total SC (Total ) (abc- 1)

El modelo de los CM. Esperados o esperanza matemática de los Cuadrados Medios es


tal que el test F para cualquier factor es la relación de cualesquiera dos cuadrados
medios adyacentes en la tabla. Así, una prueba del efecto de grupos sería F. Si la prueba

137
F es menor que la unidad que se refleja en el estimado negativo de la componente de
varianza σˆ B∈
2
A.

Los estimados de los componentes de varianza para cualquier factor que sea aleatorio,
pueden ser obtenidos sustrayendo el denominador del numerador en el test F
correspondiente y dividiendo esta diferencia por el multiplicador del componente de
varianza (su coeficiente).

1) Dentro de subgrupos.

σˆ D2 = CM ( D )
2) Entre subgrupos dentro de grupos.

CM B∈ A − CM ( D )
σˆ B2∈ A =
c
3) Entre grupos.

CM A − CM B∈A
σ̂ A2 =
cb
Añadimos que la varianza nunca puede ser negativa, en caso de que el test F será No
Solución. Luego en comparaciones de los estimados podemos encontrar donde puede
estar la variabilidad.

4.2.5 Ejemplo para el procedimiento estadístico y conclusiones

En un experimento, se tomaron los datos originales de la mosca Drosophila persimilis


en 3 localidades. Al tomar los especimenes directamente de la naturaleza, no se le
realizaron las mediciones, sino que se colectaron y se les permitió obtener propagaciones
en condiciones de laboratorio. Se tomaron entonces varias muestras de la progenie de
cada localidad y se efectuaron las mediciones que consistieron en el conteo del número
total de cerdas en el cuarto y quinto estermites del adulto. Los datos experimentales se
expresan en la siguiente tabla.

138
Localidades (a= 3)
I II III
1 2 3 4 1 2 3 4 1 2 3 4
27 24 28 29 35 33 32 32 41 41 37 45
31 28 31 25 33 33 36 35 34 40 42 38
Mediciones 30 29 31 28 33 31 33 31 40 43 36 31
(n= 5) 30 31 28 27 35 33 33 34 41 37 41 36
27 29 33 30 38 37 33 33 42 41 37 43
Suma de 145 143 151 139 174 167 167 165 198 202 193 193
Subgrupos
Suma de 578 673 786
grupos

1. Comenzaremos calculando el Gran total (G)

a b c
G = ∑ ∑ ∑ Y = 578 + 673 + 786 = 2037

2. Entonces se calcula el factor de corrección (F.C.)

2
⎛ a b c ⎞
⎜∑ ∑ ∑Y ⎟
2 ⎜ ⎟
G ⎝ ⎠
F .C. = = =
N a⋅b⋅c
(2037) 2
= = 69156.15
5⋅ 4⋅3
3. Calculemos la Suma de Cuadrados Total (SCT)

a b c
SC T = ∑ ∑ ∑ Y 2 − F .C. =

= (27)2 + ... + (43)2 − 69156.15 = 1450.85

139
4. Calculemos la Suma de Cuadrados de grupos (localidades)

2
⎛ b c ⎞
a

∑ ⎜⎜ ∑∑ Y ⎟⎟
⎝ ⎠
SC Loc ( A) = − F .C. =
c⋅b
(578) 2 + ... + (786) 2
= − 69156.15 = 1084.30
20

5. Calculamos la SC subgrupos dentro de grupos (muestras dentro localidades).

2 2
⎛ c ⎞
a ba ⎛ b c ⎞
∑∑ ⎜ ∑ ⎟ ∑ ⎜ ∑∑ ⎟⎟
⎜ Y ⎟ ⎜ Y
SC B∈A = ⎝ ⎠ − ⎝ ⎠
c c ⋅b
(145) 2 + ... + (193) 2
= − 70240 .45
5
= 70276.20 − 70240.45 = 35.75

6. Calculamos la SC subgrupos ( SC Especímenes ), que constituye la SC Error .


2
⎛ c ⎞ a b

a b c
∑∑ ⎜⎜ ∑ Y ⎟⎟
SCesp ( C∈B ) = ∑∑ ∑ Y 2 − ⎝ ⎠
c
= 70607.00 − 70276.20 = 330.80

7. Colocamos los resultados en la tabla de ANOVA (Fórmulas).

Fuente de G.L. S.C. C.M. F E(CM)


Variación
Entre a −1 4 4 CM grup σ ε2 + cσ B2∈A + c ⋅ bσ A2
grupos a −1
CM subg .
Entre 5 CM subg . σ ε2 + cσ B2∈A
subgrupos a (b − 1) 5
dentro de a (b − 1) CM error
grupos
Dentro de ab(c − 1) 6 6 σ ε2
subgrupos ab(c − 1)

140
8. Ahora colocaremos los valores obtenidos en la tabla anterior (que propone las
fórmulas de cálculo)

Fuente de G.L. S.C. C.M. F


Variación
Entre 2 1084.30 542.15 136.56 **
Localidades
Entre
muestras 9 37.75 3.97 <1 N.S.
dentro de
localidades
Dentro de
muestras 48 330.80 6.89
(especímenes)
Total 59 1450.85

** ρ < 0.01

Dentro de las componentes de los Cuadrados Medios esperados E(CM) mostrados en el


ANOVA se presentan fórmulas generales y podemos entonces hacer los estimados de las
componentes de varianza.

1. Dentro de subgrupos (especimenes):

σˆ ε2 = CM ε = 6.89

2. Entre subgrupos dentro de grupos (muestras dentro de localidades):

CM B∈A − CM ε
σˆ B2∈A =
c
3.97 − 6.89
= = −0.58 → ( 0)
5

3. Entre grupos (entre localidades):

CM A − CM B∈A
σˆ A2 =
c ⋅b
542.15 − 3.97
= = 26.91
20

141
Como que generalmente nos interesan solo las magnitudes relativas de las
componentes de varianza, estos pueden expresarse como porcentajes de las varianzas.

σˆ ε2 + σˆ B2∈A + σˆ A2
= 6.89 + 0 + 26.91 = 33.80

de donde:

6.89
σˆ ε2 representa ⋅ 100 = 20.38%
33.80

0
σˆ B2∈A representa ⋅ 100 = 0%
33.80
26.91
σˆ A2 representa ⋅ 100 = 79.62%
33.80

Conclusiones generales:

Como muestra el ANOVA, existe un efecto marcado de la localidad, mientras que no


hay efecto de muestras dentro de localidades puesto que la F es menor que la unidad y
se refleja en el estimado negativo de la componente de varianza σˆ B2∈A .
Por definición, la varianza no puede ser negativa, pero, por supuesto, un estimado de
varianza puede ser y frecuentemente es negativo, especialmente cuando la verdadera
varianza es cercana a cero.

El estimado de σˆ ε es mucho menor que σˆ A y de esta forma la mayor parte de la


2 2

variabilidad es debida a diferencias entre las localidades.

En base a estos resultados puede concluirse que las localidades analizadas son
genéticamente diferentes y de esta forma estamos en presencia de diferentes razas
geográficas.
(Sigarroa, A. 1985)

4.2.6 Ejercicio

1. En un experimento se tomaron 2 mediciones independientes de las alas izquierdas


de 4 moscas (Aedes instrudens) criados en 3 viales diferentes. Cada vial incluía 4
moscas y los datos se presentan en la siguiente tabla expresados en unidades
micrométricas.

142
Vial 1 Vial 2 Vial 3
58.5 77.8 84.0 70.1 69.8 56.0 50.7 63.8 56.6 77.8 69.9 62.1
Mediciones 59.5 80.9 83.6 68.3 69.8 54.5 49.3 65.8 57.5 79.2 69.2 64.5
Suma de 118.0 158.7 167.6 138.4 139.6 110.5 100.0 129.6 114.1 157.0 139.1 126.6
subgrupos
Suma de 582.7 479.7 536.8
grupos

Desarrolle el ANOVA jerárquico, estime los componentes de varianza (Modelo II)


y concluya sus resultados.

143
Capítulo 5 Regresión Lineal y Covarianza.
♦ Regresión lineal simple y múltiple.
♦ Análisis de Covarianza.

5.1 Regresión lineal simple y múltiple

Frecuentemente medimos 2 o más variables en cada individuo y como consecuencia nos


gustaría ser capaces de expresar de una forma más precisa la naturaleza de las relaciones
entre esas variables. Esto nos lleva a los aspectos de regresión y correlación. En la
regresión estimamos la relación de una variable con otra expresando una de ellas en
términos de una función lineal (o más compleja) de la otra. En los análisis de correlación,
que se confunden algunas veces con la regresión, estimamos el grado en que 2 variables
varía simultáneamente.
Las variables involucradas en la regresión y la correlación son continuas o son tratadas
como si ellas lo fueran. Si las variables son cualitativas (atributos) entonces los métodos
de regresión y correlación no pueden ser utilizados.

5.1.1 Regresión Lineal Simple

El análisis de regresión lineal simple trata el problema de predecir o estimar una


variable, llamada respuesta, a partir de otra variable llamada previctoria o explicativa. A
la primera se le conoce también como variable dependiente y se representa generalmente
con la letra Y, mientras que a la segunda se le conoce como variable independiente y se le
representa con la letra X.

Ejemplo 1: Conforme los quesos maduran, ocurren varios procesos químicos que
determinan el sabor del producto final. En un estudio en queso cheddar, 10 muestras de
queso fueron analizadas en su composición química. Además, una medida subjetiva del
sabor fue obtenida combinando los escores asignados por varios sujetos que probaron el
queso. Los datos se dan a continuación:

Muestra 1 2 3 4 5 6 7 8 9 10
Sabor 12.3 47.9 37.3 21 0.7 40.9 18 15.2 16.8 0.7
AA 4.543 5.759 5.892 5.242 4.477 6.365 5.247 5.298 5.366 5.328
H2S 3.135 7.496 8.726 4.174 2.996 9.588 6.174 5.22 3.664 3.912
AL 0.86 1.81 1.29 1.58 1.06 1.74 1.63 1.33 1.31 1.25

Las variables son:


Sabor: Puntaje de sabor sujetivo, obtenido combinando los puntajes de varios sujetos.

144
AA: Logaritmo natural de la concentración de ácido acético.
H2S: Logaritmo natural de la concentración de sulfuro de hidrógeno.
AL: Concentración de ácido láctico.

El objetivo de este estudio es evaluar el efecto de las variables AA, H2S y AL (variables
independientes o predictoras) en el sabor del queso (variable dependiente o respuesta). A
continuación se presenta un gráfico de dispersión entre las variables Sabor y AA:

En este caso la variable respuesta “Y” sería el sabor y la variable predoctora “X” la
concentración de ácido acético. El gráfico muestra una aparente relación de dependencia
entre ambas variables en el sentido de que mayor concentración de ácido mayor será la
calificación del sabor.

Muchos aspectos científicos tienen que ver con la relación entre pares de variables en las
que se plantea la relación causa- efecto.

Una función es una relación que nos permite predecir que valores de una variable (Y)
corresponden a determinados valores de otra variable (X). Tal relación, escrita
generalmente como Y = F(X) nos es familiar, sin embargo, revisemos brevemente las
funciones como una introducción apropiada para la regresión.

El tipo más simple de regresión sigue la ecuación Y = X que se ilustra en la figura.

Y= X

145
En esta función denotaremos (Y) como la VARIABLE DEPENDIENTE, mientras que
(X) se denomina VARIABLE INDEPENDIENTE. La magnitud de Y depende de la
magnitud de X y puede, por consiguiente, ser predicha a partir de la variable
independiente.

Puede notarse que la ecuación Y= a+ bX es la ecuación lineal más general. En Y= bX


asumimos que a= 0, y en Y= X b= 1 y a= 0.

dY
= b nos plantea que la derivada de la función es igual a la pendiente de la recta. Aquí
dX
b es el coeficiente de regresión y la función se denomina ecuación de regresión, que nos
permite relacionar la dependencia de las medias de la variable Y como una función de la
variable X, mediante alguna ecuación matemática. Cuando queremos recalcar que el
coeficiente de regresión es de la variable Y sobre la variable X escribimos bY•X. Si
deseamos hallar la regresión de X en Y, el símbolo apropiado para el coeficiente es bX•Y.

X Y E(Y/X)
n
X1 Y11 … Y1n ∑Y
i =1
1i

n
… … … … …
… n

Xb Ym1 Ymn ∑Y
i =1
mi

n
b n n

Total ∑X
i =1
i ∑Y
i =1
i1 … ∑Y
i =1
in

Usos

- El estudio de la causa.
Si deseamos conocer si la variación en la variable Y es provocada por cambios en
la variable X, manipulamos X en un experimento y vemos si podemos obtener una
regresión significativa de Y en X. La idea acerca de la causa es compleja y
filosófica y no tratamos aquí aspectos. No debe confundirse la variación
concomitante en la causa, las variables pueden variar juntas, entonces esta
covariación puede ser accidental o ambas pueden ser funciones de una causa
común que las afecta. Cuando manipulamos una variable y encontramos que tales
manipulaciones afectan una segunda variable, esta variación de la variable
independiente X, es la causa de la variación de la variable dependiente Y (¡no la
causa de la variable!)
- La descripción de leyes científicas y las predicciones.

146
Es una segunda área general de aplicación del análisis de regresión. La
descripción matemática de relaciones entre variables en la naturaleza y los análisis
de regresión nos permiten estimar relaciones funcionales entre variables, una de
las cuales está sujeta a error. Estas relaciones funcionales no siempre tienen un
significado interpretable.

(Sigarroa, A. 1985)

5.1.2 Modelo Estadístico

El modelo poblacional de regresión lineal simple es el siguiente:

Yi = α + βX i + ε i i= 1, …, n

donde α es el estimador de a y β el estimador de b.

Los parámetros del modelo son estimados por el método de Mínimos Cuadrados. Este
método permite obtener los valores estimados de α y β de modo que la suma de los
errores al cuadrado sea mínima; es decir, de lo que se trata es de calcular a y b de modo
que se minimice la siguiente expresión:

n n

∑ ei2 = ∑ (Yi − a − bX i )2
i =1 i =1

La aplicación de este método da los siguientes resultados para la estimación de los


parámetros:

SP( XY )
∑ (X i − X )(Yi − Y )
βˆ = b = = i =1
n
=
SC ( X )
∑ (X
i =1
i − X )2
n

∑ X Y − n XY ) i i
2

= i =1
n

∑ X i2` − n X
2

i =1
α̂ = a = Y − b X

147
La interpretación de estos valores, es clara. El intercepto α es el valor estimado de la
variable Y cuando la variable X es cero y la pendiente b es el cambio estimado en Y por
cambio unitario en X. Sin embargo, la interpretación de a tendrá sentido solo en el caso
en que un valor de X= 0 sea posible y además, cuando valores cercanos a X= 0 hallan sido
utilizados en la estimación. Para ilustrar estas ideas vea el siguiente caso.

En el gráfico que se presenta a continuación se observa la relación entre las variables


diámetro y el volumen para una muestra de 7 árboles con diámetros de entre 16 y 18
pulgadas.

La ecuación de regresión estimada en este caso es:

Volumen = −79.27 + 7.5 Diámetro


El intercepto estimado es -79.27, lo cual indicaría que a un diámetro de cero el volumen
estimado es de -79.27 pies cúbicos. Obviamente esto no tiene ningún sentido ya que un
diámetro de cero es imposible (no habría árbol).

Aun suponiendo que un diámetro de cero fuera posible, la interpretación del valor
estimado de Y cuando X= 0 no sería válida ya que para la construcción del modelo se
emplearon datos de diámetros comprendidos entre 16 y 18 pulgadas. Para llevar la
discusión a un plano más realista suponga que se desea estimar, a partir del modelo
anterior, el volumen de un árbol con un diámetro de 10 pulgadas. A continuación se
presenta un diagrama de dispersión con la muestra completa de 31 árboles cuyos
diámetros van desde 8.3 hasta 20.4.

148
La curva sólida muestra la relación entre ambas variedades para los datos de los 31
árboles y la línea punteada corresponde a la ecuación estimada con los 7 árboles iniciales.
Como se puede apreciar, la línea recta es bastante buena para describir la relación entre el
diámetro y el volumen para árboles con diámetros de entre 16 y 18 pulgadas, pero su
ajuste ya no es tan bueno conforme los valores de X se alejan de dicho rango. El modelo
lineal simple podría ser aceptable para estimar el volumen de un árbol con un diámetro
de 15 ó inclusive 14 pulgadas pero definitivamente no para uno de 10.

Ejemplo 1 (Cont.): Se va a estimar el modelo de regresión que considera a la variable


AA como variable predictora. Quedan como ejercicios los análisis de los casos de las
variables H2S y AL.

Y = 21.08 X = 5.3517
∑X t
2
= 289.34 ∑Y t
2
= 6789.06 ∑X Y t t = 1193.91

1193.91 − 10(21.08)(5.3517)
b= = 22.44
289.34 − 10(5.3517) 2

a = 21.08 − 22.44(5.3517 ) = −99.03

El modelo estimado es:


)
Y = −99.03 + 22.44 X

149
En este caso el intercepto, -99.03, correspondería al puntaje estimado del sabor de un
queso cuando el logaritmo natural de la concentración de ácido acético es igual a cero.
Dado que en la estimación de este modelo se utilizaron valores de AA de 4.477 hasta
6.365, esta interpretación no tiene validez. La pendiente en cambio, 22.44, es siempre
interpretable y en este caso indica que por cada incremento unitario en el logaritmo
natural de la concentración de ácido acético, se estima un incremento en el puntaje del
sabor de 22.44 puntos.

5.1.3 Análisis de Varianza

El análisis de varianza permite evaluar si el modelo es o no significativo (si X explica o


no a Y).

Hipótesis:

H0: β= 0
H1: β≠ 0

Cuadro de Análisis de Varianza (Cuadro ANOVA):

Las hipótesis anteriores son evaluadas a través del análisis de la varianza de Y. Dado el
modelo Yi = α + β X i + ε i , la varianza de Y es explicada por la regresión ( β X i ) y por
error ( ε i ). El término α no participa del análisis ya que es una constante.

150
El cuadro de análisis de varianza es el siguiente:

Fuente de Gl SC CM F
Variación
Regresión 1 bSP(XY) SC (Re g ) CM (Re g )
gl (Re g ) CM ( Error )
Error n-2 SC(Y)- SC ( Error )
bSP(XY) gl ( Error )
Total n-1 SC(Y)

Estadístico de Prueba:

CM (Re g )
F= ~ F(1, n- 2)
CM ( Error )

Reglas de Decisión:

La hipótesis nula se rechaza con un nivel de significación α si el F resulta mayor que el


valor de la tabla F(1-a, n-2).

Ejemplo 1 (Cont.): Para el caso de las variables Y= sabor y X= AA, se tiene lo


siguiente:

H0: β= 0
H1: β≠ 0

O dicho literalmente:
H0: El sabor del queso no depende de la concentración de ácido acético.
H1: El sabor del queso sí depende de la concentración de ácido acético.

Cuadro ANOVA:

F. V. Gl SC CM F
Regresión 1 1476 1476 13.58
Error 8 869 109
Total 9 2345

El valor de tabla para un nivel de significación del 5% es F( 0.95 ,1,8) = 5.318 . Como el
valor calculado es mayor al valor de tabla se rechaza H0. En conclusión, existe suficiente
evidencia estadística para aceptar que el sabor del queso depende de la concentración de
ácido acético a través de un modelo lineal.

151
5.1.4 Coeficiente de Correlación y de Determinación

El coeficiente de determinación mide el porcentaje de la variabilidad de la respuesta


que es explicado por la variable predictora. Su valor va de 0 a 1 y se calcula mediante la
siguiente expresión:

SC (Re gresión)
r2 =
SC (Total )

El coeficiente de correlación es una medida de la asociación existe entre dos variables


cuantitativas. Este coeficiente toma valores desde -1 hasta 1. Para interpretar un
coeficiente de correlación tenga en cuenta lo siguiente:

- Un valor de -1 significa una perfecta correlación negativa, es decir, todos los puntos
caen sobre una línea con pendiente negativa.
- Un valor de 0 significa no correlación.
- Un valor de 1 significa una perfecta correlación positiva, es decir, todos los puntos
caen sobre una línea con pendiente positiva.

El coeficiente de correlación es la raíz cuadrada del coeficiente de determinación con el


signo de b (pendiente estimada).

Ejemplo 1 (Cont.): Para el ejemplo tratado en esta sección se tiene:

1476
r2 = = 0.63
2345
El 63% de la variabilidad del sabor es explicado por la concentración de ácido acético.

r = 0.63 = 0.79
0.79 indica una elevada correlación positiva.

Es preciso tener en cuenta que asociación estadística no implica la existencia de una


relación casual. Por ejemplo, el siguiente gráfico muestra la relación entre las variables X:
Número de cigüeñas y Y: Número de habitantes (en miles) de la ciudad de Oldenburg
entre los años 1930 y 1936.

152
Note que el ajuste es bastante bueno.

5.1.5 Predicción

El objetivo principal del análisis de regresión es construir una modelo permita predecir
el valor de Y cuando la variable X toma un valor determinado. Una vez que se ha
determinado la validez del modelo de regresión lineal simple, la ecuación de pronóstico
estará dada por:

Yˆi = α + βX i

El valor de Yˆ puede interpretarse de dos maneras; como el valor individual predicho de


Y para un valor dado de X, y como la media estimada de Y para un valor dado de X. Tanto
el pronóstico como la estimación pueden tomar la forma de un intervalo, y al igual que en
el caso puntual, el intervalo puede tomar dos formas (aunque aquí no solo la
interpretación será diferente, sino también el cálculo); un intervalo de predicción para el
valor individual de Y dado un valor de X, y un intervalo de confianza para el valor medio
de Y dado un valor X.

Por ejemplo, si se ha construido un modelo para predecir la precipitación anual en


función de ciertos factores observables en el año anterior, uno podría estar más interesado
en predecir la precipitación del próximo año y evaluar cuánto podría esta variar (intervalo
de predicción) que en estimar la precipitación media en años posteriores a años con las
características del actual. Por otro lado, si se está estudiando la relación entre el volumen

153
de madera y el diámetro del árbol, uno estaría más interesado (por cuestiones de manejo
forestal) en el volumen medio de madera de un conjunto de árboles para determinado
diámetro que en el volumen de madera de un árbol en particular con dicho diámetro. De
hecho, el valor de pronóstico tendrá mayor variabilidad que la media estimada.

El intervalo de predicción de 100(1- α)% para un valor de Y dado X está dado por:

⎡ 1 (X − X )2 ⎤
IP(Y X ) = Yˆ X ± t (1−α CME ⎢1 + + 2 ⎥
⎢⎣ n ∑ ( X − X ) ⎥⎦
,n − 2)
2

El intervalo de confianza de 100(1- α)% para la media de Y dado X está dado por:

⎡ 1 (X − X )2 ⎤
IC ( µ Y X ) = Yˆ X ± t (1−α CME ⎢1 + + 2 ⎥
⎢⎣ n ∑ ( X − X ) ⎥⎦
,n−2)
2

Ejemplo 1 (Cont.): Para el ejemplo tratado en esta sección, se estimará puntualmente y


por intervalo el sabor de un queso en el que la variable AA es igual a 6.

La estimación puntual está dada por:


)
Y = −99.03 + 22.44(6) = 35.63

Este valor es el puntaje de sabor estimado para un queso en el que AA= 6. Por otro
lado, no todos los quesos con AA= 6 tendrán el mismo sabor, pero el puntaje promedio
estimado de estos será también igual a 35.61.

El intervalo de predicción del 95% para el valor individual está dado por:

⎡ 1 ( X − X )2 ⎤
IP(Y X ) = Yˆ X ± t ( 0.975,n − 2 ) CME ⎢1 + + 2 ⎥
⎣⎢ n ∑ ( X − X ) ⎦⎥
⎡ 1 (6 − 5.352) 2 ⎤
= 35.63 ± 2.306 108.7 ⎢1 + + ⎥
⎣ 10 2.93 ⎦

= 35.63 ± 26.81
= [8.82;62.44]

El intervalo de confianza del 95% para la media de Y es:

154
⎡ 1 (X − X )2 ⎤
IC ( µ Y X ) = Yˆ X ± t ( 0.975,n − 2 ) CME ⎢1 + + 2 ⎥
⎣⎢ n ∑ ( X − X ) ⎦⎥

⎡ 1 (6 − 5.352) 2 ⎤
= 35.63 ± 2.306 108.7 ⎢1 + + ⎥
⎣ 10 2.93 ⎦

= 35.63 ± 11.86

= [23.77;47.49]

5.1.6 Ejercicios

En cada uno de los siguientes casos efectúe lo siguiente:

- Estime la línea de regresión lineal simple.


- Interprete los coeficientes de regresión (pendiente e intercepto).
- Efectúe el análisis de varianza.
- Calcule e interprete el coeficiente de determinación y el de correlación.
- Calcule el intervalo de predicción y de confianza para el valor individual y valor
medio de Y dado un valor de X (escogido por conveniencia).

1) Se efectuó un experimento para evaluar el efecto del zinc en el peso de cacatúas. En


el experimento, a 7 grupos de cacatúas adultas se les dio diferentes dosis de zinc y
sus pérdidas de peso tras la primera semana fueron registradas. Los datos de los
pesos medios por grupo al final de la semana están expresados como porcentajes
sobre los pesos iniciales.

Ingesta de zinc 0 2 4 8 12 16 30

Peso Medio % 100 92 95 90 98 85 67

2) Se desea investigar la relación entre el porcentaje de niños que han sido


inmunizados contra la difteria, tos ferina y tétano (DPT) y la mortalidad infantil
(tasa de mortalidad por cada 1000 niños menores de 5 años). Los datos (información
para el 1999) correspondientes a una muestra aleatoria de 20 países son:

155
Nación Inmunización Mortalidad Nación Inmunización Mortalidad
Bolivia 40 165 Italia 85 11
Brasil 54 85 Japón 83 6
Canadá 85 9 México 65 51
China 95 43 Polonia 98 18
Egipto 81 94 Senegal 47 189
Etiopía 26 226 Turquía 74 90
Finlandia 90 7 Reino Unido 75 10
Francia 95 9 USA 97 12
Grecia 83 12 URSS 79 35
India 83 145 Yugoslavia 91 27

3) Los grillos hacen sus chirridos rozando rápidamente una de sus alas sobre la otra.
Mientras más rápido ellos mueven sus alas, mas fuerte es el chirrido que ellos
producen. Los científicos han notado que los grillos mueven sus alas más rápido
cuando hace calor que cuando hace frío. Por lo tanto, escuchando el tono de los
chirridos, es posible estableces la temperatura del aire. A continuación se presentan
registros del tono (en vibraciones por segundo) de los chirridos de grillos en 15
diferentes temperaturas:

Vibraciones 20 16 20 18 17 16 15 17 15 16 15 17 16 17 14
por segundo
Temperatura 89 72 93 84 81 75 70 82 69 83 80 83 81 84 76

4) Se desea investigar el efecto de la temperatura sobre el ritmo cardiaco de una


especie de lagarto. Los lagartos fueron colocados en un recinto cerrado de modo la
temperatura dentro del recinto pudo ser controlada. Los resultados obtenidos son los
siguientes:

Temperatura 22 22 24 24 26 26 28 28 30 30
(0C)
Latidos/minuto 20.8 22.3 24.1 25.6 25.7 27.2 27.3 28.8 29.4 31.9

Temperatura 32 32 34 34 36 36 38 38 40 40
(0C)
Latidos/minuto 32.4 33.8 32.8 34.1 32.4 37.9 38.0 36.5 39.0 41.0

5) Se realiza un estudio para establecer una ecuación mediante la cual se pueda utilizar
la concentración de estrona en saliva (X) para predecir la concentración del
esteroide en plasma libre (Y). Se extrajeron los siguientes datos de 14 varones sanos:

X 1 7 8 9 9 11 13 14 14 16 17 18 20 23
Y 30 25 31 27 39 38 43 49 55 48 51 64 63 68

156
5.1.7 Regresión lineal múltiple

Se trata de predecir el valor de una variable respuesta (y) como función lineal de una
familia de m variables explicativas (x1, x2, ..., xm), a partir de una muestra de tamaño n
cuyas observaciones se ordenan matricialmente:

(( y1 , x11 , x12 ,..., x1m ),


( y 2 , x 21 , x 22 ,..., x 2 m ),
...............................
( y n , x n1 , x n 2 ,..., x nm ))
siendo yi la i-ésima variable respuesta y xi,j la j-ésima variable explicativa asociada a la
observación i.
Así las cosas, se trata de ajustar los datos a un modelo de la forma

y i = β 0 + β 1 xi1 + .... + β m xim + ei

bajo las siguientes hipótesis:

1. Los residuos ei son normales de media 0 y varianza común desconocida ;


además, estos residuos son independientes.
2. El número de variables explicativas (m) es menor que el de observaciones (n);
esta hipótesis se conoce con el nombre de rango completo.
3. No existen relaciones lineales exactas entre las variables explicativas.

El estimador del vector paramétrico es

⎛ βˆ 0 ⎞
⎜ ⎟
⎜ βˆ ⎟
βˆ = ⎜ 1 ⎟ = ( X T X ) −1 X T Y
⎜: ⎟
⎜ βˆ ⎟
⎝ m⎠
siendo

⎛ y1 ⎞ ⎛1 x11 x12 .... x1m ⎞


⎜ ⎟ ⎜ ⎟
⎜y ⎟ ⎜1 x 21 x 22 .... x 2 m ⎟
Y =⎜ 2⎟ Y =⎜ ⎟
: , ⎜ ......................... ⎟
⎜ ⎟
⎜y ⎟ ⎜1 x x .... x ⎟
⎝ n⎠ ⎝ n1 n 2 nm ⎠

157
habiéndose indicado la transposición matricial mediante el superíndice T.
El estimador insesgado de la varianza , conocido con el nombre de varianza
residual, tiene por expresión

n
1
S R2 = ∑
n − m − 1 i =1
( y i − βˆ 0 − βˆ1 xi1 − ..... − βˆ m xim ) 2

El coeficiente de determinación corregido, definido como

⎛ S R2 ⎞
R = 100⎜1 − 2 ⎟
2
⎜ S ⎟
⎝ y ⎠

siendo

1 n
S =
2
y ∑
n − 1 i =1
( yi − y ) 2

mide el ajuste del modelo, se interpreta como el porcentaje de variación de la variable


respuesta explicada por el modelo; así, cuanto más se acerque R2 a 100, con más
confianza se podrá considerar el modelo lineal como válido.
El contraste de regresión es imperativo a la hora de diagnosticar y validar el modelo que
se está ajustando; consiste en decidir si realmente la variable respuesta y es función lineal
de las explicativas x1, x2, ..., xm. Formalmente, el contraste se plantea en los siguientes
términos:
H0: "no existe dependencia lineal: β 1 = β 2 = .... = β m = 0
frente a la alternativa:
H1: "sí existe alguna dependencia lineal: β j ≠ 0 .
El estadístico de contraste es

2
n −1 S y n − m −1
A= 2

m SR m

que se distribuye como una Fm,n-m-1 de Snedecor. El contraste se realiza con un nivel
de significación del 5%.

158
5.2 Análisis de Covarianza

El análisis de covarianza se relaciona con 2 o más variables donde no se ha ejercido un


control exacto sobre las variables medibles denominadas independientes. En él se
combinan los conceptos del análisis de varianza para un diseño experimental y para
regresión. El análisis de covarianza es utilizado en casos en los que la variable respuesta
de un diseño experimental esté relacionada con una o más variables concomitantes.
Trataremos el caso de la covarianza lineal con una sola variable concomitante y se
presentará el análisis para el Diseño de Bloques Completamente al Azar. El estudiante sin
embargo, no tendrá ningún problema en llevar esta técnica a un Diseño Completamente al
Azar.
(Sigarroa, A. 1985)

Usos

El análisis de covarianza presenta los siguientes usos:


a) Ayuda a la interpretación de los datos, especialmente con respecto a la naturaleza
de los efectos de los tratamientos.
Cualquier procedimiento estadístico sirve para la interpretación de los datos. De
esta forma, este uso, incluye los restantes usos del análisis de covarianza. No
obstante, este uso, intenta ser el más específico, en que el análisis de covarianza
casi siempre ayuda al investigador a la comprensión de los principios, subrayando
los resultados de una investigación. Debe tenerse conocimiento de que ciertos
tratamientos producen efectos reales, tanto en las variables dependientes como en
las independientes: en este caso, el análisis de covarianza permite ayudar
determinando la forma mediante la cual esto surgió.

b) Permite dividir la covarianza total, o a la suma de los productos cruzados en partes


componentes.
Al igual que en un ANOVA se subdividen las sumas de cuadrados, en un
ANCOVA se subdividen las sumas de productos.
Una covarianza de un experimento replicado, se divide, cuando se desea
determinar la relación entre dos o más variables, cuando estas no están influidas
por otras fuentes de variación.
c) Hace un control sobre el error e incrementa la precisión.
d) Permite ajustar las medias de los tratamientos de la variable dependiente para
diferencias en grupos de valores de las variables independientes correspondientes.
Los usos c) y d) de la covarianza siempre aparecen juntos. La varianza de una
σ2
media de tratamiento es . Por consiguiente, para disminuir esta varianza solo
n
tenemos 2 vías. Cuando la covarianza es usada como un método de control del
error, es decir, como control de σ 2 esto es un reconocimiento del hecho de que la
variación observada en la variable dependiente Y, es atributable parcialmente a la
variación en la variable independiente X. Esto implica que la variación entre las
y de tratamientos, está afectada por la variación entre las x de tratamientos y que

159
para ser comparables, las y de tratamientos deberán ajustarse, para hacerlas los
mejores estimados que podrían haber sido, si todas las x de tratamientos hubieran
sido las mismas.
De forma similar, si el objetivo principal de la covarianza es ajustar las y de
tratamiento se hace necesaria una regresión que permita un ajuste correspondiente
al error.

e) Permite estimar los datos perdidos.


Las fórmulas para estimar datos perdidos que hemos visto en los diferentes
diseños experimentales que hemos tratado, dan como resultado una Suma de
Cuadrados residual mínima. Sin embargo, la suma de cuadrados de tratamiento
está sesgada positivamente. El uso de la covarianza para estimar los valores de los
datos perdidos da como resultado una Suma de Cuadrados residual mínima y
además una Suma de Cuadrados de tratamientos insesgada. El procedimiento de la
covarianza es fácil de llevar a cabo, aunque más difícil de describir que los
procedimientos previos, los cuales sólo requieren de la aplicación de una fórmula.

(Sigarroa, A. 1985)

5.2.1 Modelo Aditivo Lineal

Los modelos lineales aditivos para cualquiera de los diseños experimentales, resultan
los mismos que para el análisis de varianza, más un término adicional para la variable
independiente o concomitante.

En el modelo de clasificación simple (Diseño completamente aleatorizado) el modelo


típico de análisis de varianza para el valor Yij ( valor o rendimiento observado en el j-
ésima observación, i-ésima clase) es, como hemos visto

Yij = µ + τ i + ε ij (1)

donde:

Yij es el valor o rendimiento observado en el i-ésimo tratamiento, j-ésimo bloque.


µ es el efecto de la media general.
τ i es el efecto del i-ésimo tratamiento.
ε ij es el efecto del error experimental en el i-ésimo tratamiento, j-ésimo bloque, o
residuos.

160
Supongamos ahora que en cada unidad experimental, hemos medido otra variable X ij

que está linealmente relacionada con Yij . El modelo quedaría expresado como:

Yij = µ + τ i + β ( X ij − X •• ) + ε ij (2)

donde:

β es el coeficiente de regresión lineal de Y sobre X.

Este es el modelo típico para el análisis de covarianza, si Y y X están estrechamente


relacionadas, podemos esperar que este modelo se ajuste a los valores Yij mucho mejor
que el modelo originadle análisis de varianza. Es decir, los residuos ε ij , son menores en
(2) que en (1).

En este modelo se extiende fácilmente a situaciones más complejas. En un modelo de


clasificación simple (Diseño de Bloques Completos al Azar) con una observación por
casilla, modelo es el siguiente:

Yij = µ + τ i + γ j + β ( X ij − X •• ) + ε ij (3)
i= 1,…, t j= 1,….,b

donde:

γ j es el efecto del j-ésimo bloque.


X ij es el valor de la variable independiente en el i-ésimo tratamiento, j-ésimo bloque.
X •• es la media de la variable independiente.
β es el coeficiente de regresión lineal de Y sobre X.
t es el número de tratamientos.
b es el número de bloques.

Ejemplo 1: Se desarrolló un experimento cuyo objetivo era determinar si la exposición


en agua calentada artificialmente afectada el crecimiento de las ostras. Cinco bolsas con
diez ostras cada una fueron aleatoriamente asignadas a cinco temperaturas (T1, T2, T3, T4,
T5); cada bolsa constituía una unidad experimental. Se utilizaron cinco estantes, cada uno
calentado a una de las cinco temperaturas. Las otras fueron limpiadas y pesadas al
comienzo y al final del experimento un mes después. El experimento se repitió cuatro
veces para lo cual fueron necesarios 4 meses. Cada repetición constituye un bloque. Los
pesos iniciales y finales se presentan en la siguiente tabla:

161
Bloq. T1 T2 T3 T4 T5 Total
X Y X Y X Y X Y X Y X Y
I 20.4 24.6 27.2 32.6 26.8 31.7 22.4 29.1 21.8 27.0 118.6 145.0

II 19.6 23.4 32.0 36.6 26.5 30.7 23.2 28.9 24.3 30.5 125.6 150.1

III 25.1 30.3 33.0 37.7 26.8 30.4 28.6 35.2 30.3 36.4 143.8 170.0

IV 18.1 21.8 26.8 31.0 28.6 33.8 24.4 30.2 29.3 35.0 127.2 151.8

Total 83.2 100.1 119.0 137.9 108.7 126.6 98.6 123.4 105.7 128.9 515.2 616.9

El modelo aditivo lineal es el siguiente:

Yij = µ + τ i + γ j + β ( X ij − X •• ) + ε ij
i= 1,…, t j= 1,….,b

donde:
Yij es el peso final de una bolsa de ostras tratada con la i-ésima temperatura
(tratamiento), en el j-ésimo mes (bloque).
µ es el efecto de la media general de los pesos.
τ i es el efecto de la i-ésima temperatura del agua.
γ j es el efecto del j-ésimo mes.
β es el coeficiente de regresión lineal de Y, el peso final de las ostras, sobre X, el peso
inicial.
X ij es el peso de una bolsa de ostras tratada con la i-ésima temperatura, en el j-ésimo
mes.
X •• es el peso inicial de las bolsas de ostras.
ε ij es el efecto del error experimental la i-ésima temperatura de agua, en el j-ésimo
mes.
t = 5 (Número de tratamientos).
b= 4 (Número de bloques).

Resulta interesante escribir la expresión (3) en las siguientes formas:

Yij − β ( X ij − X •• ) = µ + τ i + γ j + ε ij (4)

Yij − τ i − γ j = µ + β ( X ij − X •• ) + ε ij (5)

162
La forma en que se ha descrito la ecuación (4) nos permite analizar aspectos
concernientes al diseño experimental.

En la ecuación (5) nos basamos en el uso de la regresión. Deseamos medir la regresión


de Y en X son la interferencia de los efectos de tratamientos y bloques.

Pueden escribirse modelos lineales para un Diseño en Cuadrado Latino, experimentos


factoriales (casos en que la Suma de Cuadrados de tratamientos es subdividido) y además
cuando existe más de una variable independiente, pero ellos no serán discutidos en el
presente texto.

5.2.4 Suposiciones del Modelo Estadístico

Además de los supuestos del diseño al cual le aplicaremos el análisis de la covarianza


de las variables, se deben cumplir los siguientes:

1. Los valores de X son fijos, medidos sin error, y no son afectados por los
tratamientos.
2. Las variables X y Y deben tener varianzas homogéneas entre los tratamientos.
3. La regresión de Y sobre X debe ser lineal.
(Sigarroa, A. 1985)

5.2.5 Análisis de Covarianza

Cuadro ANCOVA
Fuente Gl SCX SPXY SCY SC aj. Gl aj. CM aj.
de
Var.
Bloques b- 1 BXX BXY BYY

Trat. t- 1 TXX TXY TYY


2
E XY SC E
Error (t- 1)(b-1) EXX EXY EYY SC E = EYY − (t-1)(b-1)-1
E XX (t − 1)(b − 1) − 1

Trat. + 2
S XY
Error b(t -1) SXX SXY SYY SCT + E = S YY −
S XX

Sumas de los cuadrados, grados de


libertad y cuadrados medios para SCT + E − SC E t- 1 SCT + E − SC E
evaluar diferencias entre medias
ajustadas de tratamientos t −1

163
Los pasos para la construcción del cuadrado ANCOVA son los siguientes:

1. Calcular los grados de libertad (Columna gl).


2. Calcular las sumas de cuadrados totales en X, Y y la suma de productos total:

t b t b
SC ( X ) = ∑∑ X − TC X 2
ij
SP( XY ) = ∑∑ X ij Yij − TC XY
i =1 j =1 i =1 j =1
t b
SC (Y ) = ∑∑ Yij2 − TC Y
i =1 j =1
donde:

X •2• X Y Y•2•
TC X = TC XY = •• •• TCY =
tb tb tb
3. Calcular las sumas de cuadrados en X, Y y la suma de productos para cada una
de las fuentes de variación (Columnas SCX, SPXY, SCY):
Para bloques:

b X •2j b X • j Y• j b Y•2j
B XX = ∑ − TC X B XY = ∑ − TC XY BYY = ∑ − TcY
j =1 t j =1 t j =1 t
Para tratamientos:

t
X i2• t
X Y t
Yi •2
T XX = ∑ − TC X T XY = ∑ i • i • − TC XY TYY =∑ − TCY
i =1 b i =1 b i =1 b

Para el Error (Por diferencia):

E XX = SC ( X ) − B XX − T XX E XY = SP( XY ) − B XY − T XY
EYY = SC (Y ) − BYY − T yy

4. Calcular las Sumas de Cuadrados y productos para Tratamientos + Error.

S XX = TXX − E XX S XY = T XY − E XY S YY = TYY − EYY

5. Calcular las sumas de cuadrados ajustados (Columna SC aj.):

2 2
E XY S XY
SC E = EYY − SCT + E = S YY −
E XX S XX

164
6. Calcular la suma de cuadrados ajustada para evaluar diferencias entre las medias
ajustadas de los tratamientos:

SCT + E − SC E
7. Calcular los grados de libertad ajustados (Columna gl aj.).
8. Calculas los cuadrados medios ajustados (Columna CM aj.)

Ejemplo 1 (Cont.): A continuación se presentan los cálculos para la construcción del


cuadro ANCOVA para el ejemplo tratado en esta sección:

515.2 2
SC ( X ) = (20.4 2 + 19.6 2 + .... + 29.3 2 ) − = 309.79
(5)(4)

(515.2)(616.9)
SP( XY ) = ((20.4)(24.6) + (19.6)(23.4) + .... + (29.3)(35.0)) − = 325.67
(5)(4)
616.9 2
SC (Y ) = (24.6 2 + 23.4 2 + .... + 35.0 2 ) − = 358.67
(5)(4)

(118.6 2 + 125.6 2 + ... + 127.2 2 ) 515.2 2


B XX = − = 68.37
5 (5)(4)
((118.6)(145.0) + (125.6)(150.1) + ... + (127.2)(151.8)) (515.2)(616.9)
B XY = − = 69.56
5 (5)(4)
(145.0 2 + 150.12 + ... + 151.8 2 ) 616.9 2
BYY = − = 71.37
5 (5)(4)

(83.2 2 + 119.0 2 + ... + 105.7 2 ) 515.2 2


T XX = − = 176.79
4 (5)(4)

((83.2)(100.1) + (119.0)(137.9) + ... + (105.7)(128.9)) (515.2)(616.9)


T XY = − = 181.61
4 (5)(4)

(100.12 + 137.9 2 + ... + 128.9 2 ) 616.9 2


TYY = − = 198.41
4 (5)(4)

E XX = 309.79 − 68.37 − 176.79 = 64.63


E XY = 325.67 − 69.56 − 181.61 = 74.50

EYY = 358.67 − 71.37 − 198.41 = 88.89

165
Con estos resultados, el cuadro ANCOVA es el siguiente:

Cuadro ANCOVA

Fuente de Gl SCX SPXY SCY SC aj. Gl aj. CM aj.


Variación
Bloques 3 68.37 69.56 71.37
Trat. 4 176.79 181.61 198.41
Error 12 64.63 74.50 88.89 3.0175 11 0.2743

Trat. + 16 241.42 256.11 287.30 15.6146


Error
Sumas de los cuadrados, grados de libertad y 12.5971 4 3.1493
cuadrados medios para evaluar diferencias
entre medias ajustadas de tratamientos

5.2.5.1 Prueba de Hipótesis para el Coeficiente de Regresión

El primer paso en un análisis de covarianza es evaluar la significación del coeficiente de


regresión. Si el coeficiente de regresión resulta significativo, entonces se justifica el uso
de la variable concomitante X en el modelo y por lo tanto, los efectos de los tratamientos
deberán evaluarse con los datos corregidos por la regresión. De no resultar significativo
este coeficiente, los efectos de los tratamientos serían evaluados a partir de un Análisis de
Varianza sin considerar el efecto de la variable concomitante X.

El procedimiento de prueba de hipótesis para el coeficiente de regresión es el siguiente:

Hipótesis:

H0: β= 0
H1: β≠ 0

Estadístico de Prueba:

2
E XY
E XX
F = ~ F(1, gl ( Error aj .))
CME aj .

166
Regla de Decisión:

La hipótesis nula se rechaza con un nivel de significación α si el Fc resulta mayor que el


valor de tabla F ( 1 − α ,1 , gl ( Error aj .))

Ejemplo 1 (Cont.):

H0: β= 0
H1: β≠ 0

Estas hipótesis son equivalentes a:

H0: El peso final de las ostras no depende linealmente del peso inicial.
H1: El peso final de las ostras sí depende linealmente del peso inicial.

74 .50 2
F = 64 .63 = 313 .05 ~ F(1,1)
0 .2743

El valor de tabla para un nivel de significación del 5% es F ( 0 . 95 ,1 ,11 ) = 4 . 84 . Como el


valor calculado es mayor que el valor de tabla se rechaza H0 y se concluye que existe
suficiente evidencia estadística para aceptar que el peso final de las ostras depende
linealmente del peso inicial.

5.2.5.2 Prueba de Hipótesis para los efectos de los tratamientos

En el caso que la regresión resulte significativa, las hipótesis para los tratamientos se
plantearán en términos de los efectos (medias) de los tratamientos ajustados por la
regresión.

Hipótesis:

H0: µi aj. = µ aj. ∀ i


H1: µi aj. ≠ µ aj. Para al menos algún i.

Estadístico de Prueba:

CM (Trat aj .)
F = ~ F( gl ( Trat . aj .), gl ( Error aj .))
CME aj .

167
Regla de Decisión:

La hipótesis nula se rechaza con un nivel de significación α si el F resulta mayor que el


valor de tabla F ( 1 − α , gl ( Trat . aj .), gl ( Error aj .))

Ejemplo 1 (Cont.):

H0: µi aj. = µ aj. ∀ i


H1: µi aj. ≠ µ aj. Para al menos algún i.

o linealmente:

H0: Las cinco temperaturas son igualmente efectivas en el crecimiento de las ostras.
H1: Con al menos una de las temperaturas se obtienen resultados diferentes en el
crecimiento de ostras.

3 .1493
F = = 11 .48 ~ F( 4 ,11 )
0 .2743

El valor de tabla para un nivel de significación del 5% es F ( 0 . 95 , 4 ,11 ) = 3 . 36 .


Como el valor calculado es mayor que el valor de tabla se rechaza H0 y se concluye que
existe suficiente evidencia estadística para aceptar que con al menos una temperatura se
obtiene un peso final diferente para las ostras.

5.2.6 Pruebas de Comparación de Medias de Tratamientos

Para aplicar las pruebas de comparación de medias de tratamientos se debe trabajar con
las medias de los tratamientos ajustadas por la regresión. Para efectuar el ajuste, se debe
calcular primero el coeficiente de regresión estimado, el cual es dado por:

E XY
βˆ =
E XX

Las medias de los tratamientos ajustadas por la regresión están dadas por:

Y i• aj . = Y i • − βˆ ( X i • − X •• )

Las desviaciones estándar para las pruebas son:

168
⎡ 1 1 ( X i• − X j • ) 2 ⎤
1) Prueba t y DLS S d = CME aj.⎢ + + ⎥
⎣⎢ ri r j E XX ⎥⎦

CME aj. ⎡ 1 1 ( X i• − X j • ) 2 ⎤
2) Tukey Sd = ⎢ + + ⎥
2 ⎣⎢ ri r j E XX ⎦⎥

⎡ 1 1 ( X T • − X i• ) 2 ⎤
3) Dunnett S d = CME aj.⎢ + + ⎥
⎣ rT ri E XX ⎦

Estas fórmulas se aplican si el diseño es un DCA con ri y rj repeticiones para el par de


tratamientos que se estén comparando (rT es número de repeticiones para el tratamiento
testigo). En el caso de un DBCA, que es el diseño que se está tratando en esta sección, el
número de repeticiones para cada tratamiento es igual a b, por lo que en las fórmulas
1 1 2
anteriores ri = rj = rT = b y + = .
ri r j b

Ejemplo 1 (Cont.): Efectúe la prueba de Tukey.

Las hipótesis son las siguientes:

H0: µi aj. = µ aj. ∀ ij= 1, 2, ...., 5, con i≠ j


H1: µi aj. ≠ µ aj.

El coeficiente de regresión estimado es:

E XY 74.50
βˆ = = = 1.1527
E XX 64.63

Las medias de las variables X y Y sin ajuntar para cada tratamiento son:

X 1• = 20.8 X 2• = 29.75 X 3• = 27.175 X 4• = 24.65 X 5• = 26.425 X •• = 25.76

Y 1• = 25.025 Y 2• = 34.475 Y 3• = 31.65 Y 4• = 30.85 Y 5• = 32.225

Las medias de Y ajustadas para cada tratamiento según la fórmula


Y i• aj . = Y i• − βˆ ( X i• − X •• ) son:

Y 1• aj . = 30.74 Y 2• aj . = 29.88 Y 3• aj . = 30.02 Y 4• aj . = 32.13 Y 5• aj . = 31.46

169
El valor de tabla con α= 5%, p= 5 tratamientos y 11 grados de libertad para el error
ajustado es AES(T)= 4.57. La amplitud límite significativa de Tukey está dada por la
siguiente fórmula:

CME aj. ⎡ 2 ( X i• − X j • ) 2 ⎤
ALS (T ) = AES (T ) = ⎢ + ⎥
2 ⎣b E XX ⎦

donde b= 4, CME aj.= 0.2743 y Exx= 64.63.

A continuación se presentan los resultados para las 10 comparaciones:

Tratamientos Y i• aj. − Y j • aj. Sd ALS(T) Significancia


Comparados
1y2 0.867 0.488 2.232 n.s.
1y3 0.724 0.393 1.798 n.s.
1y4 1.387 0.316 1.445 n.s.
1y5 0.716 0.368 1.684 n.s.
2y3 0.143 0.287 1.314 n.s.
2y4 2.254 0.352 1.608 *
2y5 1.583 0.303 1.386 *
3y4 2.111 0.287 1.310 *
3y5 1.440 0.264 1.207 *
4y5 0.671 0.274 1.254 n.s.

T2 T3 T1 T5 T4
29.88 30.02 30.74 31.46 32.13

5.2.7 Ejercicios

1) En una estación experimental se realizó un experimento en el que se evaluó el efecto


del tiempo de cosecha sobre el rendimiento de grano de maíz. Se diseño un
experimento con cuatro tratamientos usando una distribución de bloques completos al
azar. Los tratamientos fueron 30, 35, 40 y 45 días después de ocurrida la polinización
(para el tiempo de cosecha). El número de plantas por parcela útil fue de 52. La
variedad usada fue “V1” y el cultivo se efectuó con riego. Los valores se presentan en
el siguiente tabla:

Rendimiento de grano seco (Kg./parcela útil) y N0 de plantas de maíz


Cosechadas a diferentes fechas de la polinización.
X: N0 de plantas Y: Producciones de grano seco (Kg./parcela)

170
Días de Bloques
tratamiento I II III IV
X Y X Y X Y X Y
30 41 4.08 24 2.78 31 2.79 46 4.24
35 40 4.26 36 4.23 44 5.60 48 6.36
40 37 4.72 32 4.92 38 4.50 41 5.62
45 32 4.00 38 4.53 40 4.83 40 4.30

a) Presente el Modelo Aditivo Lineal y defina cada uno de sus componentes en


términos del problema.
b) Presente el cuadro ANCOVA y realice las pruebas correspondientes.
c) Realice la prueba de Tukey.

2) La siguiente información corresponde a pesos iniciales (X) y ganancias de peso (Y) en


Kg. de lechones en un ensayo comparativo de 6 raciones en 5 corrales (bloques).

Corral Raciones
1 2 3 4 5 6
1 X 17 22 18 22 22 22
Y 4.32 4.51 3.86 4.54 4.13 4.42
2 X 16 15 17 15 17 13
Y 3.72 4.30 4.51 4.19 3.86 3.43
3 X 19 16 21 19 19 15
Y 4.23 4.23 3.82 4.24 4.04 3.46
4 X 22 21 18 21 19 23
Y 4.79 4.94 4.02 4.39 4.31 4.70
5 X 20 15 18 17 18 14
Y 4.73 4.00 4.17 4.39 3.97 3.89

a) Presente el Modelo Aditivo Lineal y defina cada uno de sus componentes en


términos del problema.
b) Presente el cuadro ANCOVA y realice las pruebas correspondientes.
c) Encuentre las medias de los tratamientos ajustados.

171
Conclusiones.

¾ El material aquí expuesto sirve de apoyo a la docencia para la asignatura optativa


Diseño Estadístico de Experimentos que se imparte en las carreras de Lic. En
Matemáticas y Lic. en Química.

¾ En el trabajo se desarrollan los aspectos teóricos relativos a los diseños siguientes:

• Diseño Completamente al Azar.


• Diseño de Bloques Completamente al Azar.
• Diseño Cuadrado Latino.
• Diseño de Bloques Incompletos.
• Diseño factoriales.
• Diseño 2k.
• Diseño de Parcelas Divididas.
• Diseño jerárquicos.
• Regresión lineal simple y múltiple.
• Análisis de Covarianza.

¾ Se elaboró un folleto que consta de 35 ejercicios propuestos que permiten el trabajo


independiente de los estudiantes.

172
Recomendaciones.

¾ Que se disponga de este material en sus dos formas (soporte magnético y texto
editado) a entera disposición de los estudiantes que cursan la asignatura.

¾ Que se continúe enriqueciendo con otros diseños y ejercicios que siempre serán
útiles para el desarrollo intelectual y profesional de los estudiantes.

173
Bibliografía.

− Miller, I, Freud, J.E y Johnson, R.A. (2004). Probabilidad y Estadística para


ingenieros. Ciudad de México. México. Prentice-Hall Hispanoamericana.
− Sigarroa, A. (1985). Biometría y diseño experimental. La Habana. Cuba. Pueblo y
Educación.
− http://www.virtual.unal.edu.co/cursos/ciencias/2000352/docs/contenido.html.
Bajado (27 Feb 2006)
− http://tarwi.lamolina.edu.pe/%7Euchr/factoriales.htm. Bajado (30 Ene 2006)
− http://www.udc.es/dep/mate/estadistica2/estadistica_2.htm. Bajado (27 Mar 2006)
− http://www.itchihuahua.edu.mx/academic/industrial/ingcalidad/index.html.
Bajado (24 May 2006)
− http://www.telefonica.net/web2/biomates/regr/regr_multilin/regr_multilin.htm.
Bajado (5 Jun 2006)
− http://tarwi.lamolina.edu.pe/~jporras/DCA.doc
− http://tarwi.lamolina.edu.pe/~jporras/DBCA.doc
− http://tarwi.lamolina.edu.pe/~jporras/DCL.doc
− http://tarwi.lamolina.edu.pe/~reyzaguirre/Mei1%20-%20Cap%202.pdf.
Bajado (27 Mar 2006)
− http://tarwi.lamolina.edu.pe/~reyzaguirre/Mei1%20-%20Cap%203.pdf.
Bajado (27 Mar 2006)
− http://tarwi.lamolina.edu.pe/~reyzaguirre/Mei1%20-%20Cap%204.pdf.
Bajado (27 Mar 2006)
− http://tarwi.lamolina.edu.pe/~reyzaguirre/Mei1%20-%20Cap%205.pdf.
Bajado (27 Mar 2006)
− http://tarwi.lamolina.edu.pe/~reyzaguirre/Mei1%20-%20Cap%206.pdf.
Bajado (27 Mar 2006)
− http://tarwi.lamolina.edu.pe/~reyzaguirre/Mei1%20-%20Cap%207.pdf.
Bajado (27 Mar 2006)
− http://tarwi.lamolina.edu.pe/~reyzaguirre/Mei1%20-%20Cap%208.pdf.
Bajado (27 Mar 2006)
− http://tarwi.lamolina.edu.pe/~reyzaguirre/Mei1%20-%20Cap%209.pdf.
Bajado (27 Mar 2006)
− http://www.virtual.unal.edu.co/cursos/ciencias/2000352/lecciones_html/unidad2/lec
cion1/leccion-03-01-02.html. Bajado (13 May 2006)
− http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/Disenno/tema3DE.pdf.

174

También podría gustarte